BR112015019525B1 - Método, aparelho e mídia não transitória que possui um método armazenado na mesma. - Google Patents

Método, aparelho e mídia não transitória que possui um método armazenado na mesma. Download PDF

Info

Publication number
BR112015019525B1
BR112015019525B1 BR112015019525-3A BR112015019525A BR112015019525B1 BR 112015019525 B1 BR112015019525 B1 BR 112015019525B1 BR 112015019525 A BR112015019525 A BR 112015019525A BR 112015019525 B1 BR112015019525 B1 BR 112015019525B1
Authority
BR
Brazil
Prior art keywords
decorrelation
audio data
channel
frequency
transient
Prior art date
Application number
BR112015019525-3A
Other languages
English (en)
Other versions
BR112015019525A2 (pt
Inventor
Matthew Fellers
Vinay Melkote
Kuan-Chieh Yen
Grant A. Davidson
Mark F. Davis
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of BR112015019525A2 publication Critical patent/BR112015019525A2/pt
Publication of BR112015019525B1 publication Critical patent/BR112015019525B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

intensificação de sinal de áudio com o uso de parâmetros espaciais estimados. a presente invenção refere-se aos dados de áudio recebidos que podem incluir um primeiro conjunto de coeficientes de frequência e um segundo conjunto de coeficientes de frequência. os parâmetros espaciais para pelo menos parte do segundo conjunto de coeficientes de frequência podem ser estimados com base pelo menos em parte do primeiro conjunto de coeficientes de frequência. os parâmetros espaciais estimados podem ser aplicados ao segundo conjunto de coeficientes de frequência para gerar um segundo conjunto modificado de coeficientes de frequência. o primeiro conjunto de coeficientes de frequência pode corresponder a uma primeira faixa de frequência (por exemplo, uma faixa de frequência de canal individual) e o segundo conjunto de coeficientes de frequência podem corresponder a uma segunda faixa de frequência (por exemplo, uma faixa de frequência de canal acoplado). os coeficientes de frequência combinados de um canal de acoplamento de composto podem ter como base os coeficientes de frequência dentre dois ou mais canais. os coeficientes de correlação cruzada, entre os coeficientes de frequência de um primeiro canal e os coeficientes de frequência combinados, podem ser computados.

Description

CAMPO DA TÉCNICA
[001] Esta revelação refere-se a processamento de sinal.
ANTECEDENTES
[002] O desenvolvimento de processos de codificação e decodifi- cação digitais para dados de áudio e vídeo continua a ter um efeito significativo na entrega de conteúdo de entretenimento. Apesar da capacidade aumentada de dispositivos de memória e entrega de dados amplamente disponível em larguras de banda crescentemente altas, existe pressão contínua para minimizar a quantidade de dados a serem armazenados e/ou transmitidos. Os dados de áudio e vídeo são frequentemente entregues juntamente e a largura de banda para da-dos de áudio é frequentemente restringida pelas exigências da porção de vídeo.
[003] Consequentemente, dados de áudio são frequentemente codificados em fatores de alta compressão, as vezes em fatores de compressão de 30:1 ou mais altos. Devido ao fato de a distorção de sinal aumentar conforme a quantidade de compressão aplicada, podem ser feitas trocas entre a fidelidade dos dados de áudio decodificados e a eficiência de armazenamento e/ou transmissão de dados codificados.
[004] O documento WO 2007/109338 A1 descreve a geração de informação de cadeia lateral de parâmetro espacial simulado a partir do sinal de áudio discreto de dois canais abaixo da frequência de acoplamento para aproximar um sinal estéreo de dois canais acima da frequência de acoplamento.
[005] Além disso, é desejável reduzir a complexidade dos algo ritmos de codificação e de decodificação. Os dados adicionais de codi- ficação relacionados ao processo de codificação podem simplificar o processo de decodificação, mas ao custo de armazenar e/ou transmitir dados codificados adicionais. Embora métodos existentes de codificação e de decodificação de áudio sejam, em geral, satisfatórios, seriam desejáveis métodos melhorados.
SUMÁRIO
[006] Alguns aspectos da matéria descrita nesta revelação po dem ser implantados em métodos de processamento de áudio. Alguns desses tais métodos podem envolver receber dados de áudio correspondentes a uma pluralidade de canais de áudio. Os dados de áudio podem incluir uma representação de domínio de frequência correspondente aos coeficientes de banco de filtros de um sistema de codificação ou de processamento de áudio. O método pode envolver aplicar um processo de descorrelação a pelo menos alguns dos dados de áudio. Em algumas implantações, o processo de descorrelação pode ser realizado com os mesmos coeficientes de banco de filtros usados pelo sistema de codificação ou de processamento de áudio.
[007] Em algumas implantações, o processo de descorrelação pode ser realizado sem converter os coeficientes da representação de domínio de frequência em outra representação de domínio de frequência ou de domínio de tempo. A representação de domínio de frequência pode ser o resultado da aplicação de um banco de filtros amostrado de modo crítico de reconstrução perfeita. O processo de descorre- lação pode envolver gerar sinais de reverberação ou sinais de descor- relação aplicando-se filtros lineares a pelo menos uma porção da representação de domínio de frequência. A representação de domínio de frequência pode ser um resultado da aplicação de uma transformação de seno discreta modificada, de uma transformação de cosseno discreta modificada ou de uma transformação ortogonal sobreposta aos dados de áudio em um domínio de tempo. O processo de descorrela- ção pode envolver aplicar um algoritmo de descorrelação que opera inteiramente em coeficientes de valores reais.
[008] De acordo com algumas implantações, o processo de des- correlação pode envolver a descorrelação adaptativa a sinal ou seletiva de canais específicos. Alternativa ou adicionalmente, o processo de descorrelação pode envolver a descorrelação adaptativa a sinal ou seletiva de bandas específicas de frequência. O processo de descorrela- ção pode envolver aplicar um filtro de descorrelação a uma porção dos dados de áudio recebidos para produzir dados de áudio filtrados. O processo de descorrelação pode envolver usar um mixador não hierárquico para combinar uma porção direta dos dados de áudio recebidos com os dados de áudio filtrados de acordo com parâmetros espaciais.
[009] Em algumas implantações, podem ser recebidas informa ções de descorrelação, tanto com os dados de áudio como de outro modo. O processo de descorrelação pode envolver a descorrelação de pelo menos alguns dos dados de áudio de acordo com as informações de descorrelação recebidas. As informações de descorrelação recebidas podem incluir coeficientes de correlação entre canais discretos individuais e um canal de acoplamento, coeficientes de correlação entre canais discretos individuais, informações explícitas de tonalidade e/ou informações transitórias.
[0010] O método pode envolver determinar informações de des- correlação com base em dados de áudio recebidos. O processo de descorrelação pode envolver a descorrelação de pelo menos alguns dos dados de áudio de acordo com informações determinadas de des- correlação. O método pode envolver receber informações de descorre- lação codificadas com os dados de áudio. O processo de descorrela- ção pode envolver a descorrelação de pelo menos alguns dos dados de áudio de acordo com pelo menos uma dentre as informações de descorrelação recebidas ou as informações determinadas de descorre- lação.
[0011] De acordo com algumas implantações, o sistema de codifi cação ou de processamento de áudio pode ser um sistema herdado de codificação ou de processamento de áudio. O método pode envolver receber elementos de mecanismo de controle em um fluxo de bits produzido pelo sistema herdado de codificação ou de processamento de áudio. O processo de descorrelação pode ter como base, pelo menos em parte, os elementos de mecanismo de controle.
[0012] Em algumas implantações, um aparelho pode incluir uma interface e um sistema lógico configurado para receber, por meio da interface, dados de áudio correspondentes a uma pluralidade de canais de áudio. Os dados de áudio podem incluir uma representação de domínio de frequência correspondente aos coeficientes de banco de filtros de um sistema de codificação ou de processamento de áudio. O sistema lógico pode ser configurado para aplicar um processo de des- correlação a pelo menos alguns dos dados de áudio. Em algumas implantações, o processo de descorrelação pode ser realizado com os mesmos coeficientes de banco de filtros usados pelo sistema de codificação ou de processamento de áudio. O sistema lógico pode incluir pelo menos um dentre um processador de propósito geral com chip único ou múltiplos chips, um processador de sinal digital (DSP), um circuito integrado de aplicação específica (ASIC), um arranjo de portas programáveis em campo (FPGA) ou outro dispositivo lógico programável, porta discreta ou lógica de transistor, ou componentes discretos de hardware.
[0013] Em algumas implantações, o processo de descorrelação pode ser realizado sem converter os coeficientes da representação de domínio de frequência em em outra representação de domínio de frequência ou de domínio de tempo. A representação de domínio de fre- quência pode ser o resultado da aplicação de um banco de filtros amostrado de modo crítico. O processo de descorrelação pode envolver gerar sinais de reverberação ou sinais de descorrelação aplicando- se filtros lineares a pelo menos uma porção da representação de domínio de frequência. A representação de domínio de frequência pode ser o resultado da aplicação de uma transformação de seno discreta modificada, uma transformação de cosseno discreta modificada ou uma transformação ortogonal sobreposta aos dados de áudio em um domínio de tempo. O processo de descorrelação pode envolver aplicar um algoritmo de descorrelação que opera inteiramente em coeficientes de valores reais.
[0014] O processo de descorrelação pode envolver a descorrela- ção adaptativa a sinal ou seletiva de canais específicos. O processo de descorrelação pode envolver a descorrelação adaptativa a sinal ou seletiva de bandas específicas de frequência. O processo de descorrela- ção pode envolver aplicar um filtro de descorrelação a uma porção dos dados de áudio recebidos para produzir dados de áudio filtrados. Em algumas implantações, o processo de descorrelação pode envolver usar um mixador não hierárquico para combinar a porção dos dados de áudio recebidos com os dados de áudio filtrados de acordo com parâmetros espaciais.
[0015] O aparelho pode incluir um dispositivo de memória. Em al gumas implantações, a interface pode ser uma interface entre o sistema lógico e o dispositivo de memória. De modo alternativo, a interface pode ser uma interface de rede.
[0016] O sistema de codificação ou de processamento de áudio pode ser um sistema herdado de codificação ou de processamento de áudio. Em algumas implantações, o sistema lógico pode ser configurado adicionalmente para receber, por meio da interface, elementos de mecanismo de controle em um fluxo de bits produzido pelo sistema herdado de codificação ou de processamento de áudio. O processo de descorrelação pode ter como base, pelo menos em parte, os elementos de mecanismo de controle.
[0017] Alguns aspectos desta revelação podem ser implantados em um meio não transitório que tenha software armazenado no mesmo. O software pode incluir instruções para controlar um aparelho para receber dados de áudio correspondentes a uma pluralidade de canais de áudio. Os dados de áudio podem incluir uma representação de domínio de frequência correspondente aos coeficientes de banco de filtros de um sistema de codificação ou de processamento de áudio. O software pode incluir instruções para controlar o aparelho para aplicar um processo de descorrelação a pelo menos alguns dos dados de áudio. Em algumas implantações, o processo de descorrelação é realizado com os mesmos coeficientes de banco de filtros usados pelo sistema de codificação ou de processamento de áudio.
[0018] Em algumas implantações, o processo de descorrelação pode ser realizado sem converter os coeficientes da representação de domínio de frequência em outra representação de domínio de frequência ou de domínio de tempo. A representação de domínio de frequência pode ser o resultado da aplicação de um banco de filtros amostrado de modo crítico. O processo de descorrelação pode envolver gerar sinais de reverberação ou sinais de descorrelação aplicando-se filtros lineares a pelo menos uma porção da representação de domínio de frequência. A representação de domínio de frequência pode ser um resultado da aplicação de uma transformação de seno discreta modificada, uma transformação de cosseno discreta modificada ou uma transformação ortogonal sobreposta aos dados de áudio em um domínio de tempo. O processo de descorrelação pode envolver aplicar um algoritmo de descorrelação que opera inteiramente em coeficientes de valores reais.
[0019] Alguns métodos podem envolver receber dados de áudio correspondentes a uma pluralidade de canais de áudio e determinar características de áudio dos dados de áudio. As características de áudio podem incluir informações transitórias. Os métodos podem envolver determinar uma quantidade de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio e no processamento dos dados de áudio de acordo com uma quantidade determinada de descorrelação.
[0020] Em algumas instâncias, nenhuma informação transitória explícita pode ser recebida com os dados de áudio. Em algumas implantações, o processo de determinação de informações transitórias pode envolver a detecção de um evento transitório suave.
[0021] O processo de determinação de informações transitórias pode envolver a avaliação de uma probabilidade e/ou de uma severidade de um evento transitório. O processo de determinação de informações transitórias pode envolver a avaliação de uma variação temporal de potência nos dados de áudio.
[0022] O processo de determinação das características de áudio pode envolver receber informações transitórias explícitas com os dados de áudio. As informações transitórias explícitas podem incluir pelo menos um dentre um valor de controle transitório correspondente a um evento transitório definido, um valor de controle transitório correspondente a um evento não transitório definido ou um valor intermediário de controle transitório. As informações transitórias explícitas podem incluir um valor intermediário de controle transitório ou um valor de controle transitório correspondente a um evento transitório definido. O valor de controle transitório pode estar sujeito a uma função exponencial de decaimento.
[0023] As informações transitórias explícitas podem indicar um evento transitório definido. O processamento dos dados de áudio pode envolver pausar ou diminuir temporariamente um processo de descor- relação. As informações transitórias explícitas podem incluir um valor de controle transitório correspondente a um evento não transitório definido ou um valor transitório intermediário. O processo de determinação de informações transitórias pode envolver a detecção de um evento transitório suave. O processo de detecção de um evento transitório suave pode envolver a avaliação de pelo menos um dentre uma pro-babilidade ou uma severidade de um evento transitório.
[0024] As informações transitórias determinadas podem ser um valor determinado de controle transitório correspondente ao evento transitório suave. O método pode envolver a combinação do valor determinado de controle transitório com o valor de controle transitório recebido para obter um novo valor de controle transitório. O processo de combinação do valor determinado de controle transitório e do valor de controle transitório recebido pode envolver determinar o máximo do valor determinado de controle transitório e do valor de controle transi-tório recebido.
[0025] O processo de detecção de um evento transitório suave pode envolver a detecção de uma variação temporal de potência dos dados de áudio. A detecção da variação temporal de potência pode envolver determinar uma variação em uma média de potência logarítmica. A média de potência logarítmica pode ser uma média de potência logarítmica ponderada por frequência de banda. A determinação da variação na média de potência logarítmica pode envolver determinar um diferencial temporal de potência assimétrica. O diferencial de potência assimétrica pode enfatizar o aumento de potência e pode de- senfatizar a diminuição de potência. O método pode envolver determinar uma medida transitória bruta com base no diferencial de potência assimétrica. A determinação da medida transitória bruta pode envolver o cálculo de uma função de probabilidade de eventos transitórios com base em uma suposição de que o diferencial temporal de potência assimétrica é distribuído de acordo com uma distribuição Gaussiana. O método pode envolver determinar um valor de controle transitório com base na medida transitória bruta. O método pode envolver aplicar uma função exponencial de decaimento ao valor de controle transitório.
[0026] Alguns métodos podem envolver aplicar um filtro de descor- relação a uma porção dos dados de áudio, para produzir dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de determinação da quantidade de descorrelação pode envolver a modificação da razão de mixagem com base, pelo menos em parte, no valor de controle transitório.
[0027] Alguns métodos podem envolver aplicar um filtro de descor- relação a uma porção dos dados de áudio para produzir dados de áudio filtrados. A determinação da quantidade de descorrelação para os dados de áudio pode envolver a atenuação de uma inserção ao filtro de descorrelação com base nas informações transitórias. O processo de determinação de uma quantidade de descorrelação para os dados de áudio pode envolver a redução de uma quantidade de descorrela- ção em resposta à detecção de um evento transitório suave.
[0028] O processamento dos dados de áudio pode envolver uma aplicação de um filtro de descorrelação a uma porção dos dados de áudio, para produzir dados de áudio filtrados, e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de redução da quantidade de descorrelação pode envolver a modificação da razão de mixagem.
[0029] O processamento dos dados de áudio pode envolver aplicar um filtro de descorrelação a uma porção dos dados de áudio para produzir dados de áudio filtrados, estimar um ganho a ser aplicado aos dados de áudio filtrados, aplicar o ganho aos dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos.
[0030] O processo de estimativa pode envolver relacionar uma po tência dos dados de áudio filtrados a uma potência dos dados de áudio recebidos. Em algumas implantações, os processos de estimativa e de aplicação do ganho podem ser realizados por um banco de compressores. O banco de compressores pode incluir armazenamentos temporários. Um atraso fixo pode ser aplicado aos dados de áudio filtrados e o mesmo atraso pode ser aplicado aos armazenamentos temporários.
[0031] Pelo menos um dentro de uma janela de potência de suavi- zação de estimativa para os compressores ou o ganho a ser aplicado aos dados de áudio filtrados podem ter como base, pelo menos em parte, informações transitórias determinadas. Em algumas implantações, uma janela de suavização mais curta pode ser aplicada quando um evento transitório for relativamente mais provável ou um evento transitório relativamente mais forte for detectado, e uma janela de sua- vização mais longa pode ser aplicada quando um evento transitório for relativamente menos provável, um evento transitório relativamente mais fraco for detectado ou nenhum evento transitório for detectado.
[0032] Alguns métodos podem envolver aplicar um filtro de descor- relação a uma porção dos dados de áudio para produzir dados de áudio filtrados, estimar um ganho de compressor a ser aplicado aos dados de áudio filtrados, aplicar o ganho de compressor aos dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de determinação da quantidade de descorrelação pode envolver a modificação da razão de mixagem com base em pelo menos um dentre as informações transitórias ou o ganho de compressor.
[0033] O processo de determinação das características de áudio pode envolver determinar pelo menos um dentre um canal que tem bloco comutado, um canal que está fora de acoplamento ou o acoplamento de canal que não está em uso. A determinação de uma quantidade de descorrelação para os dados de áudio pode envolver determinar que um processo de descorrelação deve ser diminuído ou temporariamente pausado.
[0034] O processamento dos dados de áudio pode envolver um processo de oscilação de filtro de descorrelação. O método pode envolver determinar, com base pelo menos em parte nas informações transitórias, que o processo de oscilação de filtro de descorrelação deve ser modificado ou temporariamente pausado. De acordo com alguns métodos, pode ser determinado que o processo de oscilação de filtro de descorrelação será modificado mudando-se um valor máximo de passo para oscilar os polos do filtro de descorrelação.
[0035] De acordo com algumas implantações, um aparelho pode incluir uma interface e um sistema lógico. O sistema lógico pode ser configurado para receber, a partir da interface, dados de áudio correspondentes a uma pluralidade de canais de áudio e para determinar características de áudio dos dados de áudio. As características de áudio podem incluir informações transitórias. O sistema lógico pode ser configurado para determinar uma quantidade de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio e para processar os dados de áudio de acordo com uma quantidade determinada de descorrelação.
[0036] Em algumas implantações, nenhuma informação transitória explícita pode ser recebida com os dados de áudio. O processo de determinação de informações transitórias pode envolver a detecção de um evento transitório suave. O processo de determinação de informações transitórias pode envolver a avaliação de pelo menos um dentre uma probabilidade ou uma severidade de um evento transitório. O processo de determinação de informações transitórias pode envolver a avaliação de uma variação temporal de potência nos dados de áudio.
[0037] Em algumas implantações, a determinação das caracterís ticas de áudio pode envolver receber informações transitórias explícitas com os dados de áudio. As informações transitórias explícitas podem indicar pelo menos um dentre um valor de controle transitório correspondente a um evento transitório definido, um valor de controle transitório correspondente a um evento não transitório definido ou um valor intermediário de controle transitório. As informações transitórias explícitas podem incluir um valor intermediário de controle transitório ou um valor de controle transitório correspondente a um evento transitório definido. O valor de controle transitório pode estar sujeito a uma função exponencial de decaimento.
[0038] Se as informações transitórias explícitas indicarem um evento transitório definido, o processamento dos dados de áudio pode envolver diminuir ou pausar temporariamente um processo de descor- relação. Se as informações transitórias explícitas incluírem um valor de controle transitório correspondente a um evento não transitório definido ou um valor transitório intermediário, o processo de determinação de informações transitórias pode envolver a detecção de um evento transitório suave. As informações transitórias determinadas podem ser um valor determinado de controle transitório correspondente ao evento transitório suave.
[0039] O sistema lógico pode ser configurado adicionalmente para combinar o valor determinado de controle transitório com o valor de controle transitório recebido para obter um novo valor de controle transitório. Em algumas implantações, o processo de combinação do valor determinado de controle transitório e do valor de controle transitório recebido pode envolver determinar o máximo do valor determinado de controle transitório e do valor de controle transitório recebido.
[0040] O processo de detecção de um evento transitório suave pode envolver a avaliação de pelo menos um dentre uma probabilidade ou uma severidade de um evento transitório. O processo de detecção de um evento transitório suave pode envolver a detecção de uma variação temporal de potência dos dados de áudio.
[0041] Em algumas implantações, o sistema lógico pode ser confi gurado adicionalmente para aplicar um filtro de descorrelação a uma porção dos dados de áudio para produzir dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de determinação da quantidade de descorrelação pode envolver a modificação da razão de mixagem com base, pelo menos em parte, nas informações transitórias.
[0042] O processo de determinação de uma quantidade de descor- relação para os dados de áudio pode envolver a redução de uma quantidade de descorrelação em resposta à detecção do evento transitório suave. O processamento dos dados de áudio pode envolver uma aplicação de um filtro de descorrelação a uma porção dos dados de áudio, para produzir dados de áudio filtrados, e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de redução da quantidade de descorrelação pode envolver a modificação da razão de mixagem.
[0043] O processamento dos dados de áudio pode envolver aplicar um filtro de descorrelação a uma porção dos dados de áudio para produzir dados de áudio filtrados, estimar um ganho a ser aplicado aos dados de áudio filtrados, aplicar o ganho aos dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos. O processo de estimativa pode envolver relacionar uma potência dos dados de áudio filtrados com uma potência dos dados de áudio recebidos. O sistema lógico pode incluir um banco de compressores configurado para realizar os processos de estimativa e aplicação do ganho.
[0044] Alguns aspectos desta revelação podem ser implantados em um meio não transitório que tenha software armazenado no mesmo. O software pode incluir instruções para controlar um aparelho para receber dados de áudio correspondentes a uma pluralidade de canais de áudio e para determinar características de áudio dos dados de áudio. Em algumas implantações, as características de áudio podem incluir informações transitórias. O software pode incluir instruções para controlar um aparelho para determinar uma quantidade de descorrela- ção para os dados de áudio com base, pelo menos em parte, nas ca-racterísticas de áudio e para processar os dados de áudio de acordo com uma quantidade determinada de descorrelação.
[0045] Em algumas instâncias, nenhuma informação transitória explícita pode ser recebida com os dados de áudio. O processo de determinação de informações transitórias pode envolver a detecção de um evento transitório suave. O processo de determinação de informações transitórias pode envolver a avaliação de pelo menos um dentre uma probabilidade ou uma severidade de um evento transitório. O processo de determinação de informações transitórias pode envolver avaliação de uma variação temporal de potência nos dados de áudio.
[0046] Entretanto, em algumas implantações, a determinação das características de áudio pode envolver receber informações transitórias explícitas com os dados de áudio. As informações transitórias explícitas podem incluir um valor de controle transitório correspondente a um evento transitório definido, um valor de controle transitório correspondente a um evento não transitório definido e/ou um valor intermediário de controle transitório. Se as informações transitórias explícitas indicarem um evento transitório, o processamento dos dados de áudio pode envolver temporariamente a pausa ou a diminuição de um processo de descorrelação.
[0047] Se as informações transitórias explícitas incluírem um valor de controle transitório correspondente a um evento não transitório definido ou um valor transitório intermediário, o processo de determinação de informações transitórias pode envolver a detecção de um evento transitório suave. As informações transitórias determinadas podem ser um valor determinado de controle transitório correspondente ao evento transitório suave. O processo de determinação de informações transitórias pode envolver a combinação do valor determinado de controle transitório com o valor de controle transitório recebido para obter um novo valor de controle transitório. O processo de combinação do valor determinado de controle transitório e do valor de controle transitório recebido pode envolver determinar o máximo do valor determinado de controle transitório e do valor de controle transitório recebido.
[0048] O processo de detecção de um evento transitório suave pode envolver a avaliação de pelo menos um dentre uma probabilidade ou uma severidade de um evento transitório. O processo de detecção de um evento transitório suave pode envolver a detecção de uma variação temporal de potência dos dados de áudio.
[0049] O software pode incluir instruções para controlar o aparelho para aplicar um filtro de descorrelação a uma porção dos dados de áudio para produzir dados de áudio filtrados e para mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de determinação da quantidade de descorrelação pode envolver a modificação da razão de mixagem com base, pelo menos em parte, nas informações transitórias. O processo de determinação de uma quantidade de descorrela- ção para os dados de áudio pode envolver a redução de uma quanti-dade de descorrelação em resposta à detecção do evento transitório suave.
[0050] O processamento dos dados de áudio pode envolver uma aplicação de um filtro de descorrelação a uma porção dos dados de áudio, para produzir dados de áudio filtrados, e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. O processo de redução da quantidade de descorrelação pode envolver a modificação da razão de mixagem.
[0051] O processamento dos dados de áudio pode envolver aplicar um filtro de descorrelação a uma porção dos dados de áudio para produzir dados de áudio filtrados, estimar um ganho a ser aplicado aos dados de áudio filtrados, aplicar o ganho aos dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos. O processo de estimativa pode envolver relacionar uma potência dos dados de áudio filtrados a uma potência dos dados de áudio recebidos.
[0052] Alguns métodos podem envolver receber dados de áudio correspondentes a uma pluralidade de canais de áudio e determinar características de áudio dos dados de áudio. As características de áudio podem incluir informações transitórias. As informações transitórias podem incluir um valor intermediário de controle transitório que indica um valor transitório entre um evento transitório definido e um evento não transitório definido. Tais métodos também podem envolver a formação de quadros de dados de áudio codificados que incluem informações transitórias codificadas.
[0053] As informações transitórias codificadas podem incluir uma ou mais sinalizações de controle. O método pode envolver o acoplamento de pelo menos uma porção de dois ou mais canais dos dados de áudio a pelo menos um canal de acoplamento. As sinalizações de controle podem incluir pelo menos uma dentre uma sinalização de comutador de bloco de canal, uma sinalização de canal fora de acoplamento ou uma sinalização de acoplamento em uso. O método pode envolver determinar uma combinação de uma ou mais dentre as sina- lizações de controle para formar informações transitórias codificadas que indicam pelo menos um dentre um evento transitório definido, um evento não transitório definido, uma probabilidade de um evento transitório ou uma severidade de um evento transitório.
[0054] O processo de determinação de informações transitórias pode envolver a avaliação de pelo menos um dentre uma probabilidade ou uma severidade de um evento transitório. As informações transitórias codificadas podem indicar pelo menos um dentre um evento transitório definido, um evento não transitório definido, a probabilidade de um evento transitório ou a severidade de um evento transitório. O processo de determinação de informações transitórias pode envolver a avaliação de uma variação temporal de potência nos dados de áudio.
[0055] As informações transitórias codificadas podem incluir um valor de controle transitório correspondente a um evento transitório. O valor de controle transitório pode estar sujeito a uma função exponencial de decaimento. As informações transitórias podem indicar que um processo de descorrelação deve ser temporariamente diminuído ou pausado.
[0056] As informações transitórias podem indicar que uma razão de mixagem de um processo de descorrelação deve ser modificado. Por exemplo, as informações transitórias podem indicar que uma quantidade de descorrelação em um processo de descorrelação deva ser temporariamente reduzido.
[0057] Alguns métodos podem envolver receber dados de áudio correspondentes a uma pluralidade de canais de áudio e determinar características de áudio dos dados de áudio. As características de áudio podem incluir dados de parâmetro espacial. Os métodos podem envolver determinar pelo menos dois processos de filtragem de des- correlação para os dados de áudio com base, pelo menos em parte, nas características de áudio. Os processos de filtragem de descorrela- ção podem causar uma coerência de sinal entre descorrelações ("IDC") específica entre sinais de descorrelação específicos a canal para pelo menos um par de canais. Os processos de filtragem de des- correlação podem envolver aplicar um filtro de descorrelação a pelo menos uma porção dos dados de áudio para produzir dados de áudio filtrados. Os sinais de descorrelação específicos a canal podem ser produzidos realizando-se operações nos dados de áudio filtrados.
[0058] Os métodos podem envolver aplicar os processos de filtra gem de descorrelação a pelo menos uma porção dos dados de áudio para produzir os sinais de descorrelação específicos a canal, determinar parâmetros de mixagem com base, pelo menos em parte, nas características de áudio e mixar dos sinais de descorrelação específicos a canal com uma porção direta dos dados de áudio de acordo com os parâmetros de mixagem. A porção direta pode corresponder à porção à qual o filtro de descorrelação é aplicado.
[0059] O método também pode envolver receber informações rela cionadas a um número de canais de emissão. O processo de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio podem ter como base, pelo menos em parte, o número de canais de emissão. O processo de recebimento pode envolver receber dados de áudio correspondentes a N canais de áudio de inserção. O método pode envolver determinar que seja realizado downmix ou upmix nos dados de áudio de N canais de áudio de inser-ção para K canais de emissão de áudio e produzir dados de áudio descorrelacionados correspondentes aos K canais de emissão de áudio.
[0060] O método pode envolver realizar downmix ou upmix nos dados de áudio de N canais de áudio de inserção para dados de áudio para M canais de áudio intermediários, produzir dados de áudio des- correlacionados para os M canais de áudio intermediários e realizar downmix ou upmix nos dados de áudio descorrelacionados de M canais de áudio intermediários para dados de áudio descorrelacionados para K canais de emissão de áudio. A determinação dos dois processos de filtragem de descorrelação para os dados de áudio pode ter como base, pelo menos em parte, o número M de canais de áudio intermediários. Os processos de filtragem de descorrelação podem ser determinados com base, pelo menos em parte, em equações de mixa- gem N a K, M a K ou N a M.
[0061] O método também pode envolver o controle de coerência entre canais ("ICC") entre uma pluralidade de pares de canais de áudio. O processo de controle de ICC pode envolver pelo menos um dentre o recebimento de um valor de ICC ou a determinação de um valor de ICC com base, pelo menos em parte, nos dados de parâmetro espacial.
[0062] O processo de controle de ICC pode envolver pelo menos um dentre o recebimento de um conjunto de valores de ICC ou a determinação do conjunto de valores de ICC com base, pelo menos em parte, nos dados de parâmetro espacial. O método também pode envolver determinar um conjunto de valores de IDC com base, pelo menos em parte, no conjunto de valores de ICC e sintetizar um conjunto de sinais de descorrelação específicos a canal que corresponde ao conjunto de valores de IDC realizando-se operações nos dados de áudio filtrados.
[0063] O método também pode envolver um processo de conver são entre uma primeira representação dos dados de parâmetro espacial e uma segunda representação dos dados de parâmetro espacial. A primeira representação dos dados de parâmetro espacial pode incluir uma representação de coerência entre canais discretos individuais e um canal de acoplamento. A segunda representação dos dados de parâmetro espacial pode incluir uma representação de coerência entre os canais discretos individuais.
[0064] O processo de aplicação dos processos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio pode envolver aplicar o mesmo filtro de descorrelação a dados de áudio para uma pluralidade de canais para produzir os dados de áudio filtrados e multiplicar os dados de áudio filtrados correspondentes a um canal esquerdo ou um canal direito por -1. O método também pode envolver a reversão de uma polaridade de dados de áudio filtrados correspondentes a um canal surround esquerdo com referência aos dados de áudio filtrados correspondentes ao canal esquerdo e a reversão de uma polaridade de dados de áudio filtrados correspondentes a um canal surround direito com referência aos dados de áudio filtrados correspondentes ao canal direito.
[0065] O processo de aplicação dos processos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio pode envolver aplicar um primeiro filtro de descorrelação a dados de áudio para um primeiro e um segundo canal para produzir os dados filtrados de primeiro canal e os dados filtrados de segundo canal e a aplicação de um segundo filtro de descorrelação aos dados de áudio para um terceiro e um quarto canal para produzir os dados filtrados de terceiro canal e os dados filtrados de quarto canal. O primeiro canal pode ser um canal esquerdo, o segundo canal pode ser um canal direito, o terceiro canal pode ser um canal surround esquerdo e o quarto canal pode ser um canal surround direito. O método também pode envolver a reversão de uma polaridade dos dados filtrados de primeiro canal relativa aos dados filtrados de segundo canal e a reversão de uma polaridade dos dados filtrados de terceiro canal relativa aos dados filtrados de quarto canal. Os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio podem envolver tanto a determinação de que um filtro diferente de descorrela- ção será aplicado aos dados de áudio para um canal central ou a determinação de que um filtro de descorrelação não será aplicado aos dados de áudio para o canal central.
[0066] O método também pode envolver receber fatores de esca lonamento específicos a canal e um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados. O processo de aplicação pode envolver aplicar pelo menos um dentre os processos de filtragem de descorrelação ao canal de acoplamento para gerar dados de áudio filtrados específicos a canal e aplicar os fatores de escalonamento específicos a canal aos dados de áudio filtrados específicos a canal para produzir os sinais de descorrelação específicos a canal.
[0067] O método também pode envolver determinar parâmetros de sintetização de sinal de descorrelação com base, pelo menos em parte, nos dados de parâmetro espacial. Os parâmetros de sintetização de sinal de descorrelação podem ser parâmetros de sintetização de sinal de descorrelação específico a canal de emissão. O método também pode envolver receber um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados e fatores de escalonamento específicos a canal. Pelo menos um dentre os processos de determinação de pelo menos dois processos de filtragem de descorre- lação para os dados de áudio e de aplicação dos processos de filtragem de descorrelação a uma porção dos dados de áudio pode envolver gerar um conjunto de sinais de descorrelação de semente aplicando-se um conjunto de filtros de descorrelação ao sinal de canal de acoplamento, enviar os sinais de descorrelação de semente a um sin- tetizador, aplicar os parâmetros de sintetização de sinal de descorrela- ção específico a canal de emissão aos sinais de descorrelação de semente recebidos pelo sintetizador para produzir sinais de descorrela- ção sintetizados específicos a canal, multiplicar os sinais de descorre- lação sintetizados específicos a canal com fatores de escalonamento específicos a canal apropriados para que cada canal produza sinais escalonados de descorrelação sintetizados específicos a canal e emitir os sinais escalonados de descorrelação sintetizados específicos a canal para um mixador de sinal de descorrelação e sinal direto.
[0068] O método também pode envolver receber fatores de esca lonamento específicos a canal. Pelo menos um dentre os processos de determinação de pelo menos dois processos de filtragem de des- correlação para os dados de áudio e de aplicação dos processos de filtragem de descorrelação a uma porção dos dados de áudio pode envolver: gerar um conjunto de sinais de descorrelação de semente específicos a canal aplicando-se um conjunto de filtros de descorrelação aos dados de áudio; enviar os sinais de descorrelação de semente específicos a canal a um sintetizador; determinar a determinação de um conjunto de parâmetros de ajuste de nível específicos a par de canal com base, pelo menos em parte, nos fatores de escalonamento específicos a canal; aplicar os parâmetros de sintetização de sinal de des- correlação específico a canal de emissão e os parâmetros de ajuste de nível específicos a par de canal para os sinais de descorrelação de semente específicos a canal recebidos pelo sintetizador para produzir sinais de descorrelação sintetizados específicos a canal; e emitir os sinais de descorrelação sintetizados específicos a canal a um mixador de sinal de descorrelação e sinal direto.
[0069] A determinação dos parâmetros de sintetização de sinal de descorrelação específico a canal de emissão pode envolver determinar um conjunto de valores de IDC com base, pelo menos em parte, nos dados de parâmetro espacial e determinar parâmetros de sintetização de sinal de descorrelação específico a canal de emissão que correspondem ao conjunto de valores de IDC. O conjunto de valores de IDC pode ser determinado, pelo menos em parte, de acordo com uma coe- rência entre canais discretos individuais e um canal de acoplamento e uma coerência entre pares de canais discretos individuais.
[0070] O processo de mixagem pode envolver usar um mixador não hierárquico para combinar os sinais de descorrelação específicos a canal com a porção direta dos dados de áudio. A determinação das características de áudio pode envolver receber informações explícitas de característica de áudio com os dados de áudio. A determinação das características de áudio pode envolver determinar informações de característica de áudio com base em um ou mais atributos dos dados de áudio. Os dados de parâmetro espacial podem incluir uma representação de coerência entre canais discretos individuais e um canal de aco-plamento e/ou uma representação de coerência entre pares de canais discretos individuais. As características de áudio podem incluir pelo menos uma dentre informações de tonalidade ou informações transitórias.
[0071] A determinação dos parâmetros de mixagem pode ter como base, pelo menos em parte, os dados de parâmetro espacial. O método também pode envolver o fornecimento dos parâmetros de mixagem a um mixador de sinal de descorrelação e sinal direto. Os parâmetros de mixagem podem ser parâmetros de mixagem específicos a canal de emissão. O método também pode envolver determinar parâmetros modificados de mixagem específicos a canal de emissão com base, pelo menos em parte, nos parâmetros de mixagem específicos a canal de emissão e informações de controle transitório.
[0072] De acordo com algumas implantações, um aparelho pode incluir uma interface e um sistema lógico configurados receber dados de áudio correspondentes a uma pluralidade de canais de áudio e a determinação de características de áudio dos dados de áudio. As características de áudio podem incluir dados de parâmetro espacial. O sistema lógico pode ser configurado para determinar pelo menos dois processos de filtragem de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio. Os processos de filtragem de descorrelação podem causar uma IDC específica entre sinais de descorrelação específicos a canal para pelo menos um par de canais. Os processos de filtragem de descorrelação podem envolver aplicar um filtro de descorrelação a pelo menos uma porção dos dados de áudio para produzir dados de áudio filtrados. Os sinais de descorrelação específicos a canal podem ser produzidos realizando-se operações nos dados de áudio filtrados.
[0073] O sistema lógico pode ser configurado para: aplicar os pro cessos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio para produzir os sinais de descorrelação específicos a canal; determinar parâmetros de mixagem com base, pelo menos em parte, nas características de áudio; e mixar os sinais de descorrelação específicos a canal com uma porção direta dos dados de áudio de acordo com os parâmetros de mixagem. A porção direta pode corresponder à porção à qual o filtro de descorrelação é aplicado.
[0074] O processo de recebimento pode envolver receber informa ções relacionadas a um número de canais de emissão. O processo de determinação de pelo menos dois processos de filtragem de descorre- lação para os dados de áudio podem ter como base, pelo menos em parte, o número de canais de emissão. Por exemplo, o processo de recebimento pode envolver receber dados de áudio correspondentes a N canais de áudio de inserção e o sistema lógico pode ser configurado para: determinar que seja realizado downmix ou upmix nos dados de áudio de N canais de áudio de inserção para dados de áudio para K canais de emissão de áudio e produzir dados de áudio descorrelacio- nados correspondentes aos K canais de emissão de áudio.
[0075] O sistema lógico pode ser configurado adicionalmente para: realizar downmix ou upmix nos dados de áudio de N canais de áudio de inserção para dados de áudio para M canais de áudio intermediários; produzir dados de áudio descorrelacionados para os M canais de áudio intermediários; e realizar downmix ou upmix nos dados de áudio descorrelacionados de M canais de áudio intermediários para dados de áudio descorrelacionados para K canais de emissão de áudio.
[0076] Os processos de filtragem de descorrelação podem ser de terminados com base, pelo menos em parte, em equações de mixa- gem N a K. A determinação dos dois processos de filtragem de descor- relação para os dados de áudio pode ter como base, pelo menos em parte, o número M de canais de áudio intermediários. Os processos de filtragem de descorrelação podem ser determinados com base, pelo menos em parte, em equações de mixagem M a K ou N a M.
[0077] O sistema lógico pode ser configurado adicionalmente para controlar o ICC entre uma pluralidade de pares de canais de áudio. O processo de controle de ICC pode envolver pelo menos um dentre o recebimento de um valor de ICC ou a determinação de um valor de ICC com base, pelo menos em parte, nos dados de parâmetro espacial. O sistema lógico pode ser configurado adicionalmente para determinar um conjunto de valores de IDC com base, pelo menos em parte, no conjunto de valores de ICC e sintetizar um conjunto de sinais de descorrelação específicos a canal que corresponde ao conjunto de valores de IDC realizando-se operações nos dados de áudio filtrados.
[0078] O sistema lógico pode ser configurado adicionalmente para um processo de conversão entre uma primeira representação dos dados de parâmetro espacial e uma segunda representação dos dados de parâmetro espacial. A primeira representação dos dados de parâmetro espacial pode incluir uma representação de coerência entre canais discretos individuais e um canal de acoplamento. A segunda representação dos dados de parâmetro espacial pode incluir uma representação de coerência entre os canais discretos individuais.
[0079] O processo de aplicação dos processos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio pode envolver aplicar o mesmo filtro de descorrelação a dados de áudio para uma pluralidade de canais para produzir os dados de áudio filtrados e multiplicar os dados de áudio filtrados correspondentes a um canal esquerdo ou um canal direito por -1. O sistema lógico pode ser configurado adicionalmente para reverter uma polaridade de dados de áudio filtrados correspondentes a um canal surround esquerdo com referência aos dados de áudio filtrados correspondentes ao canal do lado es-querdo e reverter uma polaridade de dados de áudio filtrados correspondentes a um canal surround direito com referência aos dados de áudio filtrados correspondentes ao canal do lado direito.
[0080] O processo de aplicação dos processos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio pode envolver aplicar um primeiro filtro de descorrelação a dados de áudio para um primeiro e um segundo canal para produzir dados filtrados de primeiro canal e dados filtrados de segundo canal, e aplicar um segundo filtro de descorrelação a dados de áudio para um terceiro e um quarto canal para produzir dados filtrados de terceiro canal e dados filtrados de quarto canal. O primeiro canal pode ser um canal do lado esquerdo, o segundo canal pode ser um canal do lado direito, o terceiro canal pode ser um canal surround esquerdo e o quarto canal pode ser um canal surround direito.
[0081] O sistema lógico pode ser configurado adicionalmente para reverter uma polaridade dos dados filtrados de primeiro canal relativa aos dados filtrados de segundo canal e reverter uma polaridade dos dados filtrados de terceiro canal relativa aos dados filtrados de quarto canal. Os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio podem envolver tanto a determinação de que um filtro diferente de descorrelação será aplicado aos dados de áudio para um canal central ou a determinação de que um filtro de descorrelação não será aplicado aos dados de áudio para o canal central.
[0082] O sistema lógico pode ser configurado adicionalmente para receber, a partir da interface, fatores de escalonamento específicos a canal e um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados. O processo de aplicação pode envolver aplicar pelo menos um dentre os processos de filtragem de descorre- lação ao canal de acoplamento para gerar dados de áudio filtrados específicos a canal e aplicar os fatores de escalonamento específicos a canal aos dados de áudio filtrados específicos a canal para produzir os sinais de descorrelação específicos a canal.
[0083] O sistema lógico pode ser configurado adicionalmente para determinar parâmetros de sintetização de sinal de descorrelação com base, pelo menos em parte, nos dados de parâmetro espacial. Os parâmetros de sintetização de sinal de descorrelação podem ser parâmetros de sintetização de sinal de descorrelação específico a canal de emissão. O sistema lógico pode ser configurado adicionalmente para receber, a partir da interface, um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados e fatores de escalonamento específicos a canal.
[0084] Pelo menos um dentre os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio e de aplicação dos processos de filtragem de descorrela- ção a uma porção dos dados de áudio pode envolver: gerar um conjunto de sinais de descorrelação de semente aplicando-se um conjunto de filtros de descorrelação ao sinal de canal de acoplamento; enviar os sinais de descorrelação de semente para um sintetizador; aplicar os parâmetros de sintetização de sinal de descorrelação específico a canal de emissão aos sinais de descorrelação de semente recebidos pe- lo sintetizador para produzir sinais de descorrelação sintetizados específicos a canal; multiplicar os sinais de descorrelação sintetizados específicos a canal por fatores de escalonamento específicos a canal apropriados para cada canal para produzir sinais escalonados de des- correlação sintetizados específicos a canal; e emitir os sinais escalonados de descorrelação sintetizados específicos a canal a um mixador de sinal de descorrelação e sinal direto.
[0085] Pelo menos um dentre os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio e de aplicação dos processos de filtragem de descorrela- ção a uma porção dos dados de áudio pode envolver: gerar um conjunto de sinais de descorrelação de semente específicos a canal aplicando-se um conjunto de filtros de descorrelação específicos a canal aos dados de áudio; enviar os sinais de descorrelação de semente específicos a canal a um sintetizador; determinar parâmetros de ajuste de nível específicos a par de canal com base, pelo menos em parte, nos fatores de escalonamento específicos a canal; aplicar os parâmetros de sintetização de sinal de descorrelação específico a canal de emissão e os parâmetros de ajuste de nível específicos a par de canal aos sinais de descorrelação de semente específicos a canal recebidos pelo sintetizador para produzir sinais de descorrelação sintetizados específicos a canal; e emitir os sinais de descorrelação sintetizados específicos a canal a um mixador de sinal de descorrelação e sinal direto.
[0086] A determinação dos parâmetros de sintetização de sinal de descorrelação específico a canal de emissão pode envolver determinar um conjunto de valores de IDC com base, pelo menos em parte, nos dados de parâmetro espacial e determinar parâmetros de sintetização de sinal de descorrelação específico a canal de emissão que correspondem ao conjunto de valores de IDC. O conjunto de valores de IDC pode ser determinado, pelo menos em parte, de acordo com uma coerência entre canais discretos individuais e um canal de acoplamento e uma coerência entre pares de canais discretos individuais.
[0087] O processo de mixagem pode envolver usar um mixador não hierárquico para combinar os sinais de descorrelação específicos a canal com a porção direta dos dados de áudio. A determinação das características de áudio pode envolver receber informações explícitas de característica de áudio com os dados de áudio. A determinação das características de áudio pode envolver determinar informações de característica de áudio com base em um ou mais atributos dos dados de áudio. As características de áudio podem incluir informações de tonalidade e/ou informações transitórias.
[0088] Os dados de parâmetro espacial podem incluir uma repre sentação de coerência entre canais discretos individuais e um canal de acoplamento e/ou uma representação de coerência entre pares de canais discretos individuais. A determinação dos parâmetros de mixagem pode ter como base, pelo menos em parte, os dados de parâmetro espacial.
[0089] O sistema lógico pode ser configurado adicionalmente para fornecer os parâmetros de mixagem a um mixador de sinal de descor- relação e sinal direto. Os parâmetros de mixagem podem ser parâmetros de mixagem específicos a canal de emissão. O sistema lógico pode ser configurado adicionalmente para determinar parâmetros modificados de mixagem específicos a canal de emissão com base, pelo menos em parte, nos parâmetros de mixagem específicos a canal de emissão e informações de controle transitório.
[0090] O aparelho pode incluir um dispositivo de memória. A inter face pode ser uma interface entre o sistema lógico e o dispositivo de memória. Entretanto, a interface pode ser uma interface de rede.
[0091] Alguns aspectos desta revelação podem ser implantados em um meio não transitório que tenha software armazenado no mesmo. O software pode incluir instruções para controlar um aparelho para receber dados de áudio correspondentes a uma pluralidade de canais de áudio e para determinar características de áudio dos dados de áudio. As características de áudio podem incluir dados de parâmetro espacial. O software pode incluir instruções para controlar o aparelho para determinar pelo menos dois processos de filtragem de descorrela- ção para os dados de áudio com base, pelo menos em parte, nas ca-racterísticas de áudio. Os processos de filtragem de descorrelação podem causar uma IDC específica entre sinais de descorrelação específicos a canal para pelo menos um par de canais. Os processos de filtragem de descorrelação podem envolver aplicar um filtro de descorre- lação a pelo menos uma porção dos dados de áudio para produzir dados de áudio filtrados. Os sinais de descorrelação específicos a canal podem ser produzidos realizando-se operações nos dados de áudio filtrados
[0092] O software pode incluir instruções para controlar o aparelho para aplicar os processos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio para produzir os sinais de descorrela- ção específicos a canal; determinar parâmetros de mixagem com base, pelo menos em parte, nas características de áudio; e mixar os sinais de descorrelação específicos a canal com uma porção direta dos dados de áudio de acordo com os parâmetros de mixagem. A porção direta pode corresponder à porção à qual o filtro de descorrelação é aplicado.
[0093] O software pode incluir instruções para controlar o aparelho para receber informações relacionadas a um número de canais de emissão. O processo de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio podem ter como base, pelo menos em parte, o número de canais de emissão. Por exemplo, o processo de recebimento pode envolver receber dados de áudio correspondentes a N canais de áudio de inserção. O software pode incluir instruções para controlar o aparelho para determinar que seja realizado downmix ou upmix nos dados de áudio de N canais de áudio de inserção para dados de áudio para K canais de emissão de áudio e para produzir dados de áudio descorrelacionados correspondentes aos K canais de emissão de áudio.
[0094] O software pode incluir instruções para controlar o aparelho para: realizar downmix ou upmix nos dados de áudio de N canais de áudio de inserção aos dados de áudio para M canais de áudio intermediários; produzir dados de áudio descorrelacionados para os M canais de áudio intermediários; e realizar downmix ou upmix nos dados de áudio descorrelacionados de M canais de áudio intermediários aos dados de áudio descorrelacionados para K canais de emissão de áudio.
[0095] A determinação dos dois processos de filtragem de descor- relação para os dados de áudio pode ter como base, pelo menos em parte, o número M de canais de áudio intermediários. Os processos de filtragem de descorrelação podem ser determinados com base, pelo menos em parte, em equações de mixagem N a K, M a K ou N a M.
[0096] O software pode incluir instruções para controlar o aparelho para realizar um processo de controle de ICC entre uma pluralidade de pares de canais de áudio. O processo de controle de ICC pode envolver receber um valor de ICC e/ou determinar um valor de ICC com base, pelo menos em parte, nos dados de parâmetro espacial. O processo de controle de ICC pode envolver pelo menos um dentre receber um conjunto de valores de ICC ou determinar o conjunto de valores de ICC com base, pelo menos em parte, nos dados de parâmetro espacial. O software pode incluir instruções para controlar o aparelho para realizar processos de determinação de um conjunto de valores de IDC com base, pelo menos em parte, no conjunto de valores de ICC e sintetizar um conjunto de sinais de descorrelação específicos a canal que corresponde ao conjunto de valores de IDC realizando-se operações nos dados de áudio filtrados.
[0097] O processo de aplicação dos processos de filtragem de descorrelação a pelo menos uma porção dos dados de áudio pode envolver aplicar o mesmo filtro de descorrelação a dados de áudio para uma pluralidade de canais para produzir os dados de áudio filtrados e multiplicar os dados de áudio filtrados correspondentes a um canal esquerdo ou um canal direito por -1. O software pode incluir instruções para controlar o aparelho para realizar processos de reversão de uma polaridade de dados de áudio filtrados correspondentes para um canal surround esquerdo com referência aos dados de áudio filtrados cor-respondentes ao canal do lado esquerdo e reverter uma polaridade de dados de áudio filtrados correspondentes a um canal surround direito com referência aos dados de áudio filtrados correspondentes ao canal do lado direito.
[0098] O processo de aplicação do filtro de descorrelação a uma porção dos dados de áudio pode envolver aplicar um primeiro filtro de descorrelação a dados de áudio para um primeiro e um segundo canal para produzir dados filtrados de primeiro canal e dados filtrados de segundo canal e aplicar um segundo filtro de descorrelação a dados de áudio para um terceiro e um quarto canal para produzir dados filtrados de terceiro canal e dados filtrados de quarto canal. O primeiro canal pode ser um canal do lado esquerdo, o segundo canal pode ser um canal do lado direito, o terceiro canal pode ser um canal surround esquerdo e o quarto canal pode ser um canal surround direito.
[0099] O software pode incluir instruções para controlar o aparelho para realizar processos de reversão de uma polaridade dos dados filtrados de primeiro canal relativa aos dados filtrados de segundo canal e reverter uma polaridade dos dados filtrados de terceiro canal relativa aos dados filtrados de quarto canal. Os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio podem envolver tanto a determinação de que um filtro diferente de descorrelação será aplicado aos dados de áudio para um canal central ou a determinação de que um filtro de descorrelação não será aplicado aos dados de áudio para o canal central.
[00100] O software pode incluir instruções para controlar o aparelho para receber fatores de escalonamento específicos a canal e um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados. O processo de aplicação pode envolver aplicar pelo menos um dentre os processos de filtragem de descorrelação ao canal de acoplamento para gerar dados de áudio filtrados específicos a canal e aplicar os fatores de escalonamento específicos a canal aos dados de áudio filtrados específicos a canal para produzir os sinais de descorre- lação específicos a canal.
[00101] O software pode incluir instruções para controlar o aparelho para determinar parâmetros de sintetização de sinal de descorrelação com base, pelo menos em parte, nos dados de parâmetro espacial. Os parâmetros de sintetização de sinal de descorrelação podem ser parâmetros de sintetização de sinal de descorrelação específico a canal de emissão. O software pode incluir instruções para controlar o aparelho para receber um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados e fatores de escalonamento específicos a canal. Pelo menos um dentre os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio e de aplicação dos processos de filtragem de des- correlação a uma porção dos dados de áudio pode envolver: gerar um conjunto de sinais de descorrelação de semente aplicando-se um conjunto de filtros de descorrelação ao sinal de canal de acoplamento; en- viar os sinais de descorrelação de semente para um sintetizador; aplicar os parâmetros de sintetização de sinal de descorrelação específico a canal de emissão aos sinais de descorrelação de semente recebidos pelo sintetizador para produzir sinais de descorrelação sintetizados específicos a canal; multiplicar os sinais de descorrelação sintetizados específicos a canal por fatores de escalonamento específicos a canal apropriados para cada canal para produzir sinais escalonados de des- correlação sintetizados específicos a canal; e emitir os sinais escalonados de descorrelação sintetizados específicos a canal a um mixador de sinal de descorrelação e sinal direto.
[00102] O software pode incluir instruções para controlar o aparelho para receber um sinal de canal de acoplamento correspondente a uma pluralidade de canais acoplados e fatores de escalonamento específicos a canal. Pelo menos um dentre os processos de determinação de pelo menos dois processos de filtragem de descorrelação para os dados de áudio e de aplicação dos processos de filtragem de descorrela- ção a uma porção dos dados de áudio pode envolver: gerar um conjunto de sinais de descorrelação de semente específicos a canal aplicando-se um conjunto de filtros de descorrelação específicos a canal aos dados de áudio; enviar os sinais de descorrelação de semente específicos a canal a um sintetizador; determinar parâmetros de ajuste de nível específicos a par de canal com base, pelo menos em parte, nos fatores de escalonamento específicos a canal; aplicar os parâmetros de sintetização de sinal de descorrelação específico a canal de emissão e os parâmetros de ajuste de nível específicos a par de canal aos sinais de descorrelação de semente específicos a canal recebidos pelo sintetizador para produzir sinais de descorrelação sintetizados específicos a canal; e emitir os sinais de descorrelação sintetizados específicos a canal a um mixador de sinal de descorrelação e sinal direto.
[00103] A determinação dos parâmetros de sintetização de sinal de descorrelação específico a canal de emissão pode envolver determinar um conjunto de valores de IDC com base, pelo menos em parte, nos dados de parâmetro espacial e determinar parâmetros de sintetização de sinal de descorrelação específico a canal de emissão que correspondem ao conjunto de valores de IDC. O conjunto de valores de IDC pode ser determinado, pelo menos em parte, de acordo com uma coerência entre canais discretos individuais e um canal de acoplamento e uma coerência entre pares de canais discretos individuais.
[00104] Em algumas implantações, um método pode envolver: receber dados de áudio que compreendem um primeiro conjunto de coeficientes de frequência e um segundo conjunto de coeficientes de frequência; estimar, com base em pelo menos parte do primeiro conjunto de coeficientes de frequência, parâmetros espaciais para pelo menos parte do segundo conjunto de coeficientes de frequência; e aplicar os parâmetros espaciais estimados ao segundo conjunto de coeficientes de frequência para gerar um segundo conjunto modificado de coefici-entes de frequência. O primeiro conjunto de coeficientes de frequência pode corresponder a uma primeira faixa de frequência e o segundo conjunto de coeficientes de frequência pode corresponder a uma segunda faixa de frequência. A primeira faixa de frequência pode estar abaixo da segunda faixa de frequência.
[00105] Os dados de áudio podem incluir dados correspondentes a canais individuais e um canal acoplado. A primeira faixa de frequência pode corresponder a uma faixa de frequência de canal individual e a segunda faixa de frequência pode corresponder a uma faixa de frequência de canal acoplado. O processo de aplicação pode envolver aplicar os parâmetros espaciais estimados em uma base por canal.
[00106] Os dados de áudio podem incluir coeficientes de frequência na primeira faixa de frequência para dois ou mais canais. O processo de estimativa pode envolver o cálculo de coeficientes de frequência combinados de um canal de acoplamento composto com base em coeficientes de frequência dos dois ou mais canais e a computação, para pelo menos um primeiro canal, de coeficientes de correlação cruzada entre coeficientes de frequência do primeiro canal e os coeficientes de frequência combinados. Os coeficientes de frequência combinados podem corresponder à primeira faixa de frequência.
[00107] Os coeficientes de correlação cruzada podem ser coeficientes normalizados de correlação cruzada. O primeiro conjunto de coeficientes de frequência pode incluir dados de áudio para uma pluralidade de canais. O processo de estimativa pode envolver estimar coeficientes normalizados de correlação cruzada para múltiplos canais dentre a pluralidade de canais. O processo de estimativa pode envolver dividir pelo menos parte da primeira faixa de frequência em primeiras bandas de faixa de frequência e computar um coeficiente normalizado de correlação cruzada para cada primeira banda de faixa de frequência.
[00108] Em algumas implantações, o processo de estimativa pode envolver calcular a média dos coeficientes normalizados de correlação cruzada ao longo de todas as primeiras bandas de faixa de frequência de um canal e aplicar um fator de escalonamento à média dos coeficientes normalizados de correlação cruzada para obter os parâmetros espaciais estimados para o canal. O processo de calcular a média dos coeficientes normalizados de correlação cruzada pode envolver calcular a média ao longo de um segmento de tempo de um canal. O fator de escalonamento pode diminuir com frequência crescente.
[00109] O método pode envolver a adição de ruído para modelar a variação dos parâmetros espaciais estimados. A variação de ruído adicionado pode ter como base, pelo menos em parte, a variação nos coeficientes normalizados de correlação cruzada. A variação de ruído adicionado pode depender, pelo menos em parte, de uma previsão do parâmetro espacial ao longo das bandas, sendo que a dependência da variação na previsão tem base em dados empíricos.
[00110] O método pode envolver receber ou determinar informações de tonalidade em relação ao segundo conjunto de coeficientes de frequência. O ruído aplicado pode variar de acordo com as informações de tonalidade.
[00111] O método pode envolver medir razões de energia por banda entre bandas do primeiro conjunto de coeficientes de frequência e bandas do segundo conjunto de coeficientes de frequência. Os parâmetros espaciais estimados podem variar de acordo com as razões de energia por banda. Em algumas implantações, os parâmetros espaciais estimados podem variar de acordo com mudanças temporais de sinais de áudio de inserção. O processo de estimativa pode envolver operações apenas em coeficientes de frequência com valores reais.
[00112] O processo de aplicação dos parâmetros espaciais estimados ao segundo conjunto de coeficientes de frequência pode ser parte de um processo de descorrelação. Em algumas implantações, o processo de descorrelação pode envolver gerar um sinal de reverberação ou de um sinal de descorrelação e aplicar o mesmo ao segundo conjunto de coeficientes de frequência. O processo de descorrelação pode envolver aplicar um algoritmo de descorrelação que opera inteiramente em coeficientes de valores reais. O processo de descorrelação pode envolver a descorrelação adaptativa a sinal ou seletiva de canais específicos. O processo de descorrelação pode envolver a descorrelação adaptativa a sinal ou seletiva de bandas específicas de frequência. Em algumas implantações, o primeiro e o segundo conjuntos de coeficientes de frequência podem ser resultados da aplicação de uma transformação de seno discreta modificada, uma transformação de cosseno discreta modificada ou uma transformação ortogonal sobreposta a dados de áudio em um domínio de tempo.
[00113] O processo de estimativa pode ter como base, pelo menos em parte, a teoria da estimativa. Por exemplo, o processo de estimativa pode ter como base, pelo menos em parte, pelo menos um dentre um método de probabilidade máxima, um estimador de Bayes, um método de estimador de momentos, um estimador de erro quadrado médio mínimo ou um estimador não tendencioso de variação mínima.
[00114] Em algumas implantações, os dados de áudio podem ser recebidos em um fluxo de bits codificado de acordo com um processo de codificação herdado. O processo de codificação herdado pode, por exemplo, ser um processo do codec de áudio AC-3 ou o codec de áudio AC-3 avançado. A aplicação dos parâmetros espaciais pode produzir uma reprodução de áudio de modo espacial mais apurada que a obtida pela decodificação do fluxo de bits de acordo com um processo de decodificação herdado que corresponde ao processo de codificação herdado.
[00115] Algumas implantações envolvem o aparelho que inclui uma interface e um sistema lógico. O sistema lógico pode ser configurado para: receber dados de áudio que compreendem um primeiro conjunto de coeficientes de frequência e um segundo conjunto de coeficientes de frequência; estimar, com base em pelo menos parte do primeiro conjunto de coeficientes de frequência, parâmetros espaciais para pelo menos parte do segundo conjunto de coeficientes de frequência; e aplicar os parâmetros espaciais estimados ao segundo conjunto de coeficientes de frequência para gerar um segundo conjunto modificado de coeficientes de frequência.
[00116] O aparelho pode incluir um dispositivo de memória. A interface pode ser uma interface entre o sistema lógico e o dispositivo de memória. Entretanto, a interface pode ser uma interface de rede.
[00117] O primeiro conjunto de coeficientes de frequência pode corresponder a uma primeira faixa de frequência e o segundo conjunto de coeficientes de frequência pode corresponder a uma segunda faixa de frequência. A primeira faixa de frequência pode estar abaixo da segunda faixa de frequência. Os dados de áudio podem incluir dados correspondentes a canais individuais e um canal acoplado. A primeira faixa de frequência pode corresponder a uma faixa de frequência de canal individual e a segunda faixa de frequência pode corresponder a uma faixa de frequência de canal acoplado.
[00118] O processo de aplicação pode envolver aplicar os parâmetros espaciais estimados em uma base por canal. Os dados de áudio podem incluir coeficientes de frequência na primeira faixa de frequência para dois ou mais canais. O processo de estimativa pode envolver o cálculo de coeficientes de frequência combinados de um canal de acoplamento composto com base em coeficientes de frequência dos dois ou mais canais e a computação, para pelo menos um primeiro canal, de coeficientes de correlação cruzada entre coeficientes de frequência do primeiro canal e os coeficientes de frequência combinados.
[00119] Os coeficientes de frequência combinados podem corresponder à primeira faixa de frequência. Os coeficientes de correlação cruzada podem ser coeficientes normalizados de correlação cruzada. O primeiro conjunto de coeficientes de frequência pode incluir dados de áudio para uma pluralidade de canais. O processo de estimativa pode envolver a estimativa de canais normalizados de múltiplos coeficientes de correlação cruzada dentre a pluralidade de canais.
[00120] O processo de estimativa pode envolver dividir a segunda faixa de frequência em bandas da segunda faixa de frequência e computar um coeficiente normalizado de correlação cruzada para cada banda da segunda faixa de frequência. O processo de estimativa pode envolver dividir a primeira faixa de frequência em primeiras bandas de faixa de frequência, calcular a média dos coeficientes normalizados de correlação cruzada ao longo de todas dentre as primeiras bandas de faixa de frequência e aplicar um fator de escalonamento à média dos coeficientes normalizados de correlação cruzada para obter os parâmetros espaciais estimados.
[00121] O processo de calcular a média dos coeficientes normalizados de correlação cruzada pode envolver calcular a média ao longo de um segmento de tempo de um canal. O sistema lógico pode ser configurado adicionalmente para a adição de ruído ao segundo conjunto modificado de coeficientes de frequência. A adição de ruído pode ser adicionada para modelar uma variação dos parâmetros espaciais estimados. A variação de ruído adicionado pelo sistema lógico pode ter como base, pelo menos em parte, uma variação nos coeficientes normalizados de correlação cruzada. O sistema lógico pode ser configurado adicionalmente para receber ou determinar informações de tonalidade relacionadas ao segundo conjunto de coeficientes de frequência e variar o ruído aplicado de acordo com as informações de tonalidade.
[00122] Em algumas implantações, os dados de áudio podem ser recebidos em um fluxo de bits codificado de acordo com um processo de codificação herdado. Por exemplo, o processo de codificação herdado pode ser um processo do codec de áudio AC-3 ou do codec de áudio AC-3 avançado.
[00123] Alguns aspectos desta revelação podem ser implantados em um meio não transitório que tenha software armazenado no mesmo. O software pode incluir instruções para controlar um aparelho para: receber dados de áudio que compreendem um primeiro conjunto de coeficientes de frequência e um segundo conjunto de coeficientes de frequência; estimar, com base em pelo menos parte do primeiro conjunto de coeficientes de frequência, parâmetros espaciais para pelo menos parte do segundo conjunto de coeficientes de frequência; e aplicar os parâmetros espaciais estimados ao segundo conjunto de coeficientes de frequência para gerar um segundo conjunto modificado de coeficientes de frequência.
[00124] O primeiro conjunto de coeficientes de frequência pode corresponder a uma primeira faixa de frequência e o segundo conjunto de coeficientes de frequência pode corresponder a uma segunda faixa de frequência. Os dados de áudio podem incluir dados correspondentes a canais individuais e um canal acoplado. A primeira faixa de frequência pode corresponder a uma faixa de frequência de canal individual e a segunda faixa de frequência pode corresponder a uma faixa de frequência de canal acoplado. A primeira faixa de frequência pode estar abaixo da segunda faixa de frequência.
[00125] O processo de aplicação pode envolver aplicar os parâmetros espaciais estimados em uma base por canal. Os dados de áudio podem incluir coeficientes de frequência na primeira faixa de frequência para dois ou mais canais. O processo de estimativa pode envolver o cálculo de coeficientes de frequência combinados de um canal de acoplamento composto com base em coeficientes de frequência dos dois ou mais canais e a computação, para pelo menos um primeiro canal, de coeficientes de correlação cruzada entre coeficientes de frequência do primeiro canal e os coeficientes de frequência combinados.
[00126] Os coeficientes de frequência combinados podem corresponder à primeira faixa de frequência. Os coeficientes de correlação cruzada podem ser coeficientes normalizados de correlação cruzada. O primeiro conjunto de coeficientes de frequência pode incluir dados de áudio para uma pluralidade de canais. O processo de estimativa pode envolver a estimativa de canais normalizados de múltiplos coeficientes de correlação cruzada dentre a pluralidade de canais. O processo de estimativa pode envolver dividir a segunda faixa de frequência em bandas da segunda faixa de frequência e computar um coeficiente normalizado de correlação cruzada para cada banda da segunda faixa de frequência.
[00127] O processo de estimativa pode envolver: dividir a primeira faixa de frequência em primeiras bandas de faixa de frequência; calcular a média dos coeficientes normalizados de correlação cruzada ao longo de todas as primeiras bandas de faixa de frequência; e aplicar um fator de escalonamento à média dos coeficientes normalizados de correlação cruzada para obter os parâmetros espaciais estimados. O processo de calcular a média dos coeficientes normalizados de correlação cruzada pode envolver calcular a média ao longo de um segmento de tempo de um canal.
[00128] O software também pode incluir instruções para controlar o aparelho de decodificação para adicionar ruído ao segundo conjunto modificado de coeficientes de frequência a fim de modelar uma variação dos parâmetros espaciais estimados. A variação de ruído adicionado pode ter como base, pelo menos em parte, uma variação nos coeficientes normalizados de correlação cruzada. O software também pode incluir instruções para controlar o aparelho de decodificação para receber ou determinar informações de tonalidade relacionadas ao segundo conjunto de coeficientes de frequência. O ruído aplicado pode variar de acordo com as informações de tonalidade.
[00129] Em algumas implantações, os dados de áudio podem ser recebidos em um fluxo de bits codificado de acordo com um processo de codificação herdado. Por exemplo, o processo de codificação herdado pode ser um processo do codec de áudio AC-3 ou do codec de áudio AC-3 avançado.
[00130] De acordo com algumas implantações, um método pode envolver: receber dados de áudio correspondentes a uma pluralidade de canais de áudio; determinar características de áudio dos dados de áudio; determinar parâmetros do filtro de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio; formar um filtro de descorrelação de acordo com os parâmetros do filtro de descorrelação; e aplicar o filtro de descorrelação a pelo menos alguns dos dados de áudio. Por exemplo, as características de áudio podem incluir informações de tonalidade e/ou informações transitórias.
[00131] A determinação das características de áudio pode envolver receber informações explícitas de tonalidade ou informações transitórias com os dados de áudio. A determinação das características de áudio pode envolver determinar informações de tonalidade ou informações transitórias com base em um ou mais atributos dos dados de áu-dio.
[00132] Em algumas implantações, o filtro de descorrelação pode incluir um filtro linear com pelo menos um elemento de atraso. O filtro de descorrelação pode incluir um filtro passa-tudo.
[00133] Os parâmetros do filtro de descorrelação podem incluir parâmetros de oscilação ou localizações de polo selecionadas modo aleatório para pelo menos um polo do filtro passa-tudo. Por exemplo, os parâmetros de oscilação ou localizações de polo podem envolver um valor máximo de passo para o movimento de polo. O valor máximo de passo pode ser substancialmente zero para sinais altamente tonais dos dados de áudio. Os parâmetros de oscilação ou localizações de polo podem ser unidos por áreas de restrição dentro das quais os movimentos de polo são restringidos. Em algumas implantações, as áreas de restrição podem ser círculos ou ânulos. Em algumas implantações, as áreas de restrição podem ser fixas. Em algumas implantações, canais diferentes dentre os dados de áudio podem compartilhar as mesmas áreas de restrição.
[00134] De acordo com algumas implantações, os polos podem ser oscilados de modo independente para cada canal. Em algumas implantações, os movimentos dos polos podem não ser unidos por áreas de restrição. Em algumas implantações, os polos podem manter uma relação espacial ou angular substancialmente consistente um em rela- ção ao outro. De acordo com algumas implantações, uma distância de um polo a um centro de um círculo de plano Z pode ser uma função de frequência de dados de áudio.
[00135] Em algumas implantações, um aparelho pode incluir uma interface e um sistema lógico. Em algumas implantações, o sistema lógico pode incluir um processador de propósito geral com chip único ou múltiplos chips, um processador de sinal digital (DSP), um circuito integrado de aplicação específica (ASIC), um arranjo de portas programáveis em campo (FPGA) ou outro dispositivo lógico programável, porta discreta ou lógica de transistor e/ou componentes discretos de hardware.
[00136] O sistema lógico pode ser configurado para receber, a partir da interface, dados de áudio correspondentes a uma pluralidade de canais de áudio e determinar características de áudio dos dados de áudio. Em algumas implantações, as características de áudio podem incluir informações de tonalidade e/ou informações transitórias. O sistema lógico pode ser configurado para determinar parâmetros do filtro de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio; formar um filtro de descorrelação de acordo com os parâmetros do filtro de descorrelação; e aplicar o filtro de descorrelação a pelo menos alguns dos dados de áudio.
[00137] O filtro de descorrelação pode incluir um filtro linear com pelo menos um elemento de atraso. Os parâmetros do filtro de descor- relação podem incluir parâmetros de oscilação ou localizações de polo selecionadas de modo aleatório para pelo menos um polo do filtro de descorrelação. Os parâmetros de oscilação ou localizações de polo podem ser unidos por áreas de restrição dentro das quais os movimentos de polo são restringidos. Os parâmetros de oscilação ou locali-zações de polo podem ser determinados com referência a um valor máximo de passo para o movimento de polo. O valor máximo de passo pode ser substancialmente zero para sinais altamente tonais dos dados de áudio.
[00138] O aparelho pode incluir um dispositivo de memória. A interface pode ser uma interface entre o sistema lógico e o dispositivo de memória. Entretanto, a interface pode ser uma interface de rede.
[00139] Alguns aspectos desta revelação podem ser implantados em um meio não transitório que tenha software armazenado no mesmo. O software pode incluir instruções para controlar um aparelho para: receber dados de áudio correspondentes a uma pluralidade de canais de áudio; determinar características de áudio dos dados de áudio, sendo que as características de áudio compreendem pelo menos uma dentre informações de tonalidade ou informações transitórias; determinar parâmetros do filtro de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio; formar um filtro de descorrelação de acordo com os parâmetros do filtro de des- correlação; e aplicar o filtro de descorrelação a pelo menos alguns dos dados de áudio. O filtro de descorrelação pode incluir um filtro linear com pelo menos um elemento de atraso.
[00140] Os parâmetros do filtro de descorrelação podem incluir parâmetros de oscilação ou localizações de polo selecionados de modo aleatório para pelo menos um polo do filtro de descorrelação. Os parâmetros de oscilação ou localizações de polo podem ser unidos por áreas de restrição dentro das quais os movimentos de polo são restringidos. Os parâmetros de oscilação ou localizações de polo podem ser determinados com referência a um valor máximo de passo para o movimento de polo. O valor máximo de passo pode ser substancialmente zero para sinais altamente tonais dos dados de áudio.
[00141] De acordo com algumas implantações, um método pode envolver: receber dados de áudio correspondentes a uma pluralidade de canais de áudio; determinar informações de controle de filtro de descorrelação correspondentes a um deslocamento de polo máximo de um filtro de descorrelação; determinar parâmetros do filtro de des- correlação para os dados de áudio com base, pelo menos em parte, nas informações de controle de filtro de descorrelação; formar o filtro de descorrelação de acordo com os parâmetros do filtro de descorrela- ção; e aplicar o filtro de descorrelação a pelo menos alguns dos dados de áudio.
[00142] Os dados de áudio podem estar no domínio de tempo ou no domínio de frequência. A determinação das informações de controle de filtro de descorrelação pode envolver receber uma indicação expressa do deslocamento de polo máximo.
[00143] A determinação das informações de controle de filtro de descorrelação pode envolver determinar informações de característica de áudio e determinar o deslocamento de polo máximo com base, pelo menos em parte, nas informações de característica de áudio. Em algumas implantações, as informações de característica de áudio podem incluir pelo menos uma dentre informações de tonalidade ou informações transitórias.
[00144] Detalhes de uma ou mais implantações da matéria descrita nesse relatório descritivo são apresentados nos desenhos anexos e na descrição abaixo. Outras características, aspectos e vantagens se tornarão aparentes a partir da descrição, dos desenhos e das reivindicações. Observe que as dimensões relativas das figuras a seguir podem não estar desenhadas em escala.
BREVE DESCRIÇÃO DOS DESENHOS
[00145] As Figuras 1A e 1B são gráficos que mostram exemplos de acoplamento de canal durante um processo de codificação de áudio.
[00146] A Figura 2A é um diagrama de blocos que ilustra elementos de um sistema de processamento de áudio.
[00147] A Figura 2B fornece uma visão geral das operações que podem ser realizadas pelo sistema de processamento de áudio da Figura 2A.
[00148] A Figura 2C é um diagrama de blocos que mostra elementos de um sistema alternativo de processamento de áudio.
[00149] A Figura 2D é um diagrama de blocos que mostra um exemplo de como um descorrelacionador pode ser usado em um sistema de processamento de áudio.
[00150] A Figura 2E é um diagrama de blocos que ilustra elementos de um sistema alternativo de processamento de áudio.
[00151] A Figura 2F é um diagrama de blocos que mostra exemplos de elementos de descorrelacionador.
[00152] A Figura 3 é um fluxograma que ilustra um exemplo de um processo de descorrelação.
[00153] A Figura 4 é um diagrama de blocos que ilustra exemplos de componentes de descorrelacionador que podem ser configurados para realizar o processo de descorrelação da Figura 3.
[00154] A Figura 5A é um gráfico que mostra um exemplo de movimento dos polos de um filtro passa-tudo.
[00155] As Figuras 5B e 5C são gráficos que mostram exemplos alternativos de movimento dos polos de um filtro passa-tudo.
[00156] As Figuras 5D e 5E são gráficos que mostram exemplos alternativos de áreas de restrição que podem ser aplicadas quando se move os polos de um filtro passa-tudo.
[00157] A Figura 6A é um diagrama de blocos que ilustra uma implantação alternativa de um descorrelacionador.
[00158] A Figura 6B é um diagrama de blocos que ilustra outra implantação de um descorrelacionador.
[00159] A Figura 6C ilustra uma implantação alternativa de um sistema de processamento de áudio.
[00160] As Figuras 7A e 7B são diagramas vetoriais que fornecem uma ilustração simplificada de parâmetros espaciais.
[00161] A Figura 8A é um fluxograma que ilustra blocos de alguns métodos de descorrelação fornecidos no presente documento.
[00162] A Figura 8B é um fluxograma que ilustra blocos de um método de inversão de sinal lateral.
[00163] As Figuras 8C e 8D são diagramas em bloco que ilustram componentes que podem ser usados para implantar alguns métodos de inversão de sinal.
[00164] A Figura 8E é um fluxograma que ilustra blocos de um método de determinação de coeficientes de sintetização e coeficientes de mixagem a partir de dados de parâmetro espacial.
[00165] A Figura 8F é um diagrama de blocos que mostra exemplos de componentes mixadores.
[00166] A Figura 9 é um fluxograma que delineia um processo de sintetização de sinais de descorrelação em casos de multicanal.
[00167] A Figura 10A é um fluxograma que fornece uma visão geral de um método para estimar parâmetros espaciais.
[00168] A Figura 10B é um fluxograma que fornece uma visão geral de um método alternativo para estimar parâmetros espaciais.
[00169] A Figura 10C é um gráfico que indica a relação entre o termo de escalonamento VB e índice de banda l.
[00170] A Figura 10D é um gráfico que indica a relação entre as variáveis VM e q.
[00171] A Figura 11A é um fluxograma que delineia alguns métodos de determinação transitória e controles relacionados a transição.
[00172] A Figura 11B é um diagrama de blocos que inclui exemplos de vários componentes para a determinação transitória e controles relacionados a elemento transitório.
[00173] A Figura 11C é um fluxograma que delineia alguns métodos de determinação de valores de controle transitório com base, pelo me- nos em parte, em variações temporais de potência de dados de áudio.
[00174] A Figura 11D é um gráfico que ilustra um exemplo de mapeamento de valores transitórios brutos para valores transitórios de controle.
[00175] A Figura 11E é um fluxograma que delineia um método de codificação de informações transitórias.
[00176] A Figura 12 é um diagrama de blocos que fornece exemplos de componentes de um aparelho que pode ser configurado para implantar aspectos dos processos descritos no presente documento.
[00177] Números e designações de referência similares nos vários desenhos indicam elementos similares.
DESCRIÇÃO DE MODALIDADES EXEMPLIFICATIVAS
[00178] A descrição a seguir é direcionada a determinadas implantações para fins de descrição de alguns aspectos inovadores desta revelação, assim como exemplos de contextos em que esses aspectos inovadores podem ser implantados. No entanto, os ensinamentos no presente documento podem ser aplicados em vários modos diferentes. Embora os exemplos fornecidos neste pedido sejam principalmente descritos em termos do codec de áudio AC-3 do codec de áudio AC-3 Intensificado (também conhecido como E-AC-3), os conceitos fornecidos no presente documento se aplicam a outros codecs de áudio, inclusive, mas sem limitação, MPEG-2 AAC e MPEG-4 AAC. Além do mais, as implantações descritas podem ser incorporadas em vários dispositivos de processamento de áudio, inclusive, mas sem limitação, codificadores e/ou decodificadores, que podem ser incluídos em telefones móveis, telefones inteligentes, computadores do tipo desktop, computadores de mão ou portáteis, computadores do tipo netbook, computadores do tipo notebook, computadores do tipo smartbook, computadores do tipo tablet, sistemas estéreo, televisões, reprodutores de DVD, dispositivos de gravação digital e uma variedade de ou- tros dispositivos. Dessa maneira, os ensinamentos desta revelação não são destinados a serem limitados às implantações mostradas nas figuras e/ou descritas no presente documento, mas, em vez disso, têm ampla aplicabilidade.
[00179] Alguns codecs de áudio, que incluem os codecs de áudio AC-3 e E-AC-3 (implantações proprietárias das quais são licenciadas como "Dolby Digital" e "Dolby Digital Plus"), empregam alguma forma de acoplamento de canal para explorar redundâncias entre canais, codificar dados de modo mais eficiente e reduzir a taxa de bits de codificação. Por exemplo, com os codecs AC-3 e E-AC-3, em uma faixa de frequência de canal de acoplamento além de uma "frequência de começo de acoplamento" específica, os coeficientes de transformação de cosseno discreto modificado (MDCT) dos canais distintos (também referidos no presente documento como "canais individuais") são submetidos a downmix para um mono canal, que pode ser referido no presente documento como um "canal de composição" ou um "canal de acoplamento". Alguns codecs podem formar dois ou mais canais de acoplamento.
[00180] Os decodificadores AC-3 e E-AC-3 realizam upmix no mo- nossinal do canal de acoplamento nos canais distintos com o uso de fatores de escala com base nas coordenadas de acoplamento enviadas no fluxo de bits. Dessa maneira, o decodificador restaurar um envelope de alta frequência, mas não a fase, dos dados de áudio na faixa de frequência de canal de acoplamento de cada canal.
[00181] As Figuras 1A e 1B são gráficos que mostram exemplos de acoplamento de canal durante um processo de codificação de áudio. O gráfico 102 da Figura 1A indica um sinal de áudio que corresponde a um canal esquerdo antes do acoplamento de canal. O gráfico 104 indica um sinal de áudio que corresponde a um canal direito antes do acoplamento de canal. A Figura 1B mostra os canais esquerdo e direi- to após a codificação, inclusive o acoplamento de canal, e a decodifi- cação. Nesse exemplo simplificado, o gráfico 106 indica que os dados de áudio para o canal esquerdo são substancialmente inalterados, enquanto o gráfico 108 indica que os dados de áudio para o canal direito estão, agora, em fase com os dados de áudio para o canal esquerdo.
[00182] Conforme mostrado nas Figuras 1A e 1B, o sinal decodificado além da frequência de começo de acoplamento pode ser coerente entre os canais. Dessa maneira, o sinal decodificado além da frequência de começo de acoplamento pode soar espacialmente colap- sado, em comparação com o sinal original. Quando os canais decodificados forem submetidos a downmix, por exemplo, na renderização binaural por meio de virtualização de fones de ouvido ou reprodução pelos alto-falantes estéreo, os canais acoplados podem se juntar de modo coerente. Isso pode levar a uma incompatibilidade de timbre quando comparado ao sinal de referência original. Os efeitos negativos do acoplamento de canal podem ser particularmente evidentes quando o sinal decodificado for renderizado de modo binaural pelos fones de ouvido.
[00183] Várias implantações descritas no presente documento podem amenizar esses efeitos, pelo menos em parte. Algumas tais implantações envolvem ferramentas inovadoras de codificação e/ou de- codificação de áudio. Tais implantações podem ser configuradas para restaurar a diversidade de fase dos canais de emissão em regiões de frequência codificadas pelo acoplamento de canal. De acordo com várias implantações, um sinal descorrelacionado pode ser sintetizado a partir de coeficientes espectrais decodificados na faixa de frequência de canal de acoplamento de cada canal de emissão.
[00184] No entanto, muitos outros tipos de dispositivos de processamento de áudio e métodos são descritos no presente documento. A Figura 2A é um diagrama de blocos que ilustra elementos de um sis- tema de processamento de áudio. Nessa implantação, o sistema de processamento de áudio 200 inclui um armazenamento temporário 201, a comutador 203, a descorrelacionador 205 e uma módulo de transformação inversa 255. O comutador 203 pode, por exemplo, ser um comutador de ponto de cruzamento. O armazenamento temporário 201 recebe elementos de dados de áudio 220a a 220n, encaminha elementos de dados de áudio 220a a 220n para o comutador 203 e envia cópias dos elementos de dados de áudio 220a a 220n para o descorrelacionador 205.
[00185] Nesse exemplo, os elementos de dados de áudio 220a a 220n correspondem a uma pluralidade de canais de áudio 1 a N. No presente documento, os elementos de dados de áudio 220a a 220n incluem representações de domínio de frequência que correspondem aos coeficientes de banco de filtros de um sistema de processamento ou de codificação de áudio, que pode ser um sistema de processamento ou de codificação de áudio herdado. No entanto, em implantações alternativas, os elementos de dados de áudio 220a a 220n podem corresponder a uma pluralidade de bandas de frequência 1 a N.
[00186] Nessa implantação, todos os elementos de dados de áudio 220a a 220n são recebidos tanto pelo comutador 203 quanto pelo des- correlacionador 205. No presente documento, todos os elementos de dados de áudio 220a a 220n são processados pelo descorrelacionador 205 para produzir elementos de dados de áudio descorrelacionados 230a a 230n. Além do mais, todos os elementos de dados de áudio descorrelacionados 230a a 230n são recebidos pelo comutador 203.
[00187] No entanto, nem todos os elementos de dados de áudio descorrelacionados 230a a 230n são recebidos pelo módulo de transformação inversa 255 e convertidos em dados de áudio de domínio de tempo 260. Em vez disso, o comutador 203 seleciona quais dentre os elementos de dados de áudio descorrelacionados 230a a 230n serão recebidos pelo módulo de transformação inversa 255. Nesse exemplo, o comutador 203 seleciona, de acordo com o canal, quais dentre os elementos de dados de áudio 230a a 230n serão recebidos pelo módulo de transformação inversa 255. No presente documento, por exemplo, os elementos de dados de áudio 230a são recebidos pelo módulo de transformação inversa 255, enquanto os elementos de dados de áudio 230n não são. Em vez disso, o comutador 203 envia o elemento de dados de áudio 220n, que não foi processado pelo des- correlacionador 205, para o módulo de transformação inversa 255.
[00188] Em algumas implantações, o comutador 203 pode determinar se envia um elemento de dados de áudio direto 220 ou um elemento de dados de áudio descorrelacionados 230 para o módulo de transformação inversa 255 de acordo com definições predeterminadas que correspondem aos canais 1 a N. Alternativa ou adicionalmente, o comutador 203 pode determinar se envia um elemento de dados de áudio 220 ou um elemento de dados de áudio descorrelacionados 230 para o módulo de transformação inversa 255 de acordo com os componentes específicos a canal das informações de seleção 207, que podem ser geradas ou armazenadas localmente ou recebidas com os dados de áudio 220. Dessa maneira, o sistema de processamento de áudio 200 pode fornecer a descorrelação seletiva de canais de áudio específicos.
[00189] Alternativa ou adicionalmente, o comutador 203 pode determinar se envia um elemento de dados de áudio direto 220 ou um elemento de dados de áudio descorrelacionados 230 para o módulo de transformação inversa 255 de acordo com as alterações nos dados de áudio 220. Por exemplo, o comutador 203 pode determinar quais, caso haja, dos elementos de dados de áudio descorrelacionados 230 são enviados para o módulo de transformação inversa 255 de acordo com os componentes adaptativos a sinal das informações de seleção 207, que podem indicar alterações transientes ou de tonalidade nos dados de áudio 220. Em implantações alternativas, o comutador 203 pode receber tais informações adaptativos a sinal do descorrelacionador 205. Em ainda outras implantações, o comutador 203 pode ser configurado para determinar alterações nos dados de áudio, como alterações transitórias ou de tonalidade. Dessa maneira, o sistema de processamento de áudio 200 pode fornecer a descorrelação adaptativa a sinal de canais de áudio específicos.
[00190] Conforme notado acima, em algumas implantações, os elementos de dados de áudio 220a a 220n podem corresponder a uma pluralidade de bandas de frequência 1 a N. Em algumas tais implantações, o comutador 203 pode determinar se envia um elemento de dados de áudio 220 ou um elemento de dados de áudio descorrelaciona- dos 230 para o módulo de transformação inversa 255 de acordo com as definições predeterminadas que correspondem às bandas de frequência e/ou de acordo com as informações de seleção 207 recebidas. Dessa maneira, o sistema de processamento de áudio 200 pode fornecer a descorrelação seletiva de bandas de frequência específicas.
[00191] Alternativa ou adicionalmente, o comutador 203 pode determinar se envia um elemento de dados de áudio direto 220 ou um elemento de dados de áudio descorrelacionados 230 para o módulo de transformação inversa 255 de acordo com as alterações nos dados de áudio 220. Em algumas implantações, o comutador 203 pode ser con-figurado para determinar alterações nos dados de áudio. Portanto, o sistema de processamento de áudio 200 pode fornecer a descorrela- ção adaptativa a sinal de bandas de frequência específicas.
[00192] A Figura 2B fornece uma visão geral das operações que podem ser realizadas através do sistema de processamento de áudio da Figura 2A. Nesse exemplo, o método 270 começa com um processo de recebimento de dados de áudio que corresponde a uma plurali- dade de canais de áudio (bloco 272). Os dados de áudio podem incluir uma representação de domínio de frequência que corresponde aos coeficientes de banco de filtros de um sistema de processamento ou de codificação de áudio. O sistema de processamento ou de codificação de áudio pode, por exemplo, ser um sistema de processamento ou de codificação de áudio herdado como AC-3 ou E-AC-3. Tais implantações podem envolver receber elementos de mecanismo de controle em um fluxo de bits produzido pelo sistema de processamento ou de codificação de áudio herdado, como indicações de comutação de bloco, etc. O processo de descorrelação pode se basear, pelo menos em parte, nos elementos de mecanismo de controle. Os exemplos detalhados são fornecidos abaixo. Nesse exemplo, o método 270 também envolve aplicar um processo de descorrelação a pelo menos alguns dos dados de áudio (bloco 274). O processo de descorrelação pode ser realizado com os mesmos coeficientes de banco de filtros usados pelo sistema de processamento ou de codificação de áudio.
[00193] Com referência, novamente, à Figura 2A, o descorrelacio- nador 205 pode realizar vários tipos de operações de descorrelação, dependendo da implantação em particular. Muitos exemplos são fornecidos no presente documento. Em algumas implantações, o processo de descorrelação é realizado sem converter coeficientes da representação de domínio de frequência dos elementos de dados de áudio 220 em outra representação de domínio de frequência ou de domínio de tempo. O processo de descorrelação pode envolver gerar sinais de reverberação ou sinais de descorrelação aplicando-se filtros lineares a pelo menos uma porção da representação de domínio de frequência. Em algumas implantações, o processo de descorrelação pode envolver aplicar um algoritmo de descorrelação que opera totalmente em coeficientes de valores reais. Conforme usado no presente documento, "de valores reais" significa usar apenas um dentre um banco de fil- tros modulado por cosseno ou por seno.
[00194] O processo de descorrelação pode envolver aplicar um filtro de descorrelação a uma porção dos elementos de dados de áudio recebidos 220a a 220n para produzir elementos de dados de áudio filtrados. O processo de descorrelação pode envolver usar um mixador não hierárquico para combinar uma porção direta nos dados de áudio recebidos (aos quais nenhum filtro de descorrelação foi aplicado) com os dados de áudio filtrados de acordo com parâmetros espaciais. Por exemplo, uma porção direta do elemento de dados de áudio 220a pode ser misturada com uma porção filtrada do elemento de dados de áudio 220a de uma maneira específica a canal de emissão. Algumas implantações podem incluir um combinador específico a canal de emissão (por exemplo, um combinador linear) de sinais de descorrela- ção ou de reverberação. Vários exemplos são descritos abaixo.
[00195] Em algumas implantações, os parâmetros espaciais podem ser determinados pelo sistema de processamento de áudio 200 de acordo com a análise dos dados de áudio recebidos 220. Alternativa ou adicionalmente, os parâmetros espaciais podem ser recebidos em um fluxo de bits, junto com os dados de áudio 220 como parte ou como todas as informações de descorrelação 240. Em algumas implantações, as informações de descorrelação 240 podem incluir coeficientes de correlação entre canais individuais distintos e um canal de acoplamento, coeficientes de correlação entre canais individuais distintos, informações de tonalidade explícitas e/ou informações transitórias. O processo de descorrelação pode envolver descorrelacionar pelo menos uma porção dos dados de áudio 220 com base, pelo menos em parte, nas informações de descorrelação 240. Algumas implantações podem ser configuradas para usar tanto parâmetros espaciais localmente determinados quanto recebidos e/ou outras informações de descorrelação. Vários exemplos são descritos abaixo.
[00196] A Figura 2C é um diagrama de blocos que mostra elementos de um sistema de processamento de áudio alternativo. Nesse exemplo, os elementos de dados de áudio 220a a 220n incluem dados de áudio para N canais de áudio. Os elementos de dados de áudio 220a a 220n incluem representações de domínio de frequência que correspondem aos coeficientes de banco de filtros de um sistema de processamento ou de codificação de áudio. Nessa implantação, as re-presentações de domínio de frequência são o resultado de aplicar um banco de filtros criticamente amostrado, de reconstrução perfeita. Por exemplo, as representações de domínio de frequência podem ser o resultado de aplicar uma transformação de seno discreto modificado, uma transformação de cosseno discreto modificado ou uma transformação ortogonal sobreposta aos dados de áudio em um domínio de tempo.
[00197] O descorrelacionador 205 aplica um processo de descorre- lação a pelo menos uma porção dos elementos de dados de áudio 220a a 220n. Por exemplo, o processo de descorrelação pode envolver gerar sinais de reverberação ou sinais de descorrelação aplicando- se filtros lineares a pelo menos uma porção dos elementos de dados de áudio 220a a 220n. O processo de descorrelação pode ser realizado, pelo menos em parte, de acordo com as informações de descorre- lação 240 recebidas pelo descorrelacionador 205. Por exemplo, as informações de descorrelação 240 podem ser recebidas em um fluxo de bits junto com as representações de domínio de frequência dos elementos de dados de áudio 220a a 220n. Alternativa ou adicionalmente, pelo menos algumas informações de descorrelação podem ser determinadas localmente, por exemplo, através do descorrelacionador 205.
[00198] O módulo de transformação inversa 255 aplica uma transformação inversa para produzir os dados de áudio de domínio de tempo 260. Nesse exemplo, o módulo de transformação inversa 255 aplica uma transformação inversa equivalente a um banco de filtros criticamente amostrado, de reconstrução perfeita. O banco de filtros criticamente amostrado, de reconstrução perfeita pode corresponder àquele aplicado aos dados de áudio no domínio de tempo (por exemplo, através de um dispositivo de codificação) para produzir as representações de domínio de frequência dos elementos de dados de áudio 220a a 220n.
[00199] A Figura 2D é um diagrama de blocos que mostra um exemplo de como um descorrelacionador pode ser usado em um sistema de processamento de áudio. Nesse exemplo, o sistema de processamento de áudio 200 é um decodificador que inclui um descorre- lacionador 205. Em algumas implantações, o decodificador pode ser configurado para funcionar de acordo com o codec de áudio AC-3 ou E-AC-3. No entanto, em algumas implantações, o sistema de processamento de áudio pode ser configurado para processar dados de áudio para outros codecs de áudio. O descorrelacionador 205 pode incluir vários subcomponentes, como aqueles que são descritos em qualquer lugar no presente documento. Nesse exemplo, um upmixer 225 recebe dados de áudio 210, que incluem representações de domínio de frequência de dados de áudio de um canal de acoplamento. As representações de domínio de frequência são coeficientes de MDCT, nesse exemplo.
[00200] O upmixer 225 também recebe coordenadas de acoplamento 212 para cada canal e faixa de frequência de canal de acoplamento. Nessa implantação, as informações de dimensionamento, na forma de coordenadas de acoplamento 212, foram computadas em um codificador Dolby Digital ou Dolby Digital Plus em uma forma exponente-mantissa. O upmixer 225 pode computar coeficientes de frequência para cada canal de emissão multiplicando-se as coordenadas de canal de acoplamento frequência pelas coordenadas de acoplamento para aquele canal.
[00201] Nessa implantação, o upmixer 225 emite coeficientes de MDCT desacoplados de canais individuais na faixa de frequência de canal de acoplamento para o descorrelacionador 205. Dessa maneira, nesse exemplo, os dados de áudio 220 que são inseridos no descorre- lacionador 205 incluem coeficientes de MDCT.
[00202] No exemplo mostrado na Figura 2D, os dados de áudio descorrelacionados 230 emitidos pelo descorrelacionador 205 incluem coeficientes de MDCT descorrelacionados. Nesse exemplo, nem todos os dados de áudio recebidos pelo sistema de processamento de áudio 200 também são descorrelacionados pelo descorrelacionador 205. Por exemplo, as representações de domínio de frequência de dados de áudio 245a, para frequências abaixo da faixa de frequência de canal de acoplamento, assim como as representações de domínio de frequência de dados de áudio 245b, para frequências acima da faixa de frequência de canal de acoplamento, não são descorrelacionados pelo descorrelacionador 205. Esses dados, juntamente com os coeficientes de MDCT descorrelacionados 230 que são emitidos do descorrelacio- nador 205, são inseridos em um processo de MDCT inverso 255. Nesse exemplo, os dados de áudio 245b incluem coeficientes de MDCT determinados pela ferramenta Extensão Espectral, uma ferramenta de extensão da largura de banda de áudio do codec de áudio E-AC-3.
[00203] Nesse exemplo, as informações de descorrelação 240 são recebidas pelo descorrelacionador 205. Os tipos de informações de descorrelação 240 recebidas podem variar de acordo com a implantação. Em algumas implantações, as informações de descorrelação 240 podem incluir informações de controle específicas a descorrelaciona- dor explícitas e/ou informações explícitas que podem formar a base de tais informações de controle. As informações de descorrelação 240 podem, por exemplo, incluir parâmetros espaciais como coeficientes de correlação entre canais individuais distintos e um canal de acoplamento e/ou coeficientes de correlação entre canais individuais distintos. Tais informações de descorrelação explícitas 240 também podem incluir informações de tonalidade explícitas e/ou informações transitórias. Essas informações podem ser usadas para determinar, pelo menos em parte, parâmetros de filtro de descorrelação para o descorrela- cionador 205.
[00204] No entanto, em implantações alternativas, nenhuma tal informação de descorrelação explícita 240 é recebida pelo descorrelaci- onador 205. De acordo com algumas tais implantações, as informações de descorrelação 240 podem incluir informações a partir de um fluxo de bits de um codec de áudio herdado. Por exemplo, as informações de descorrelação 240 podem incluir informações de segmentação de tempo que estão disponíveis em um fluxo de bits codificado de acordo com o codec de áudio AC-3 ou o codec de áudio E-AC-3. As informações de descorrelação 240 podem incluir informações de acoplamento em uso, informações de comutação de bloco, informações de exponente, informações de estratégia de exponente, etc. Tais informações podem ter sido recebidas por um sistema de processamento de áudio em um fluxo de bits junto com os dados de áudio 210.
[00205] Em algumas implantações, o descorrelacionador 205 (ou um outro elemento do sistema de processamento de áudio 200) pode determinar parâmetros espaciais, informações de tonalidade e/ou informações transitórias com base em um ou mais atributos dos dados de áudio. Por exemplo, o sistema de processamento de áudio 200 pode determinar parâmetros espaciais para frequências na faixa de frequência de canal de acoplamento com base nos dados de áudio 245a ou 245b, fora da faixa de frequência de canal de acoplamento. Alternativa ou adicionalmente, o sistema de processamento de áudio 200 pode determinar informações de tonalidade com base nas informações de um fluxo de bits de um codec de áudio herdado. Algumas implantações serão descritas abaixo.
[00206] A Figura 2E é um diagrama de blocos que ilustra elementos de um sistema de processamento de áudio alternativo. Nessa implantação, o sistema de processamento de áudio 200 inclui um upmi- xer/downmixer de N a M 262 e um upmixer/downmixer de M a K 264. No presente documento, os elementos de dados de áudio 220a a 220n, que incluem coeficientes de transformação para canais de áudio N, são recebidos pelo upmixer/downmixer de N a M 262 e pelo descor- relacionador 205.
[00207] Nesse exemplo, o upmixer/downmixer de N a M 262 pode ser configurado para fazer upmix ou downmix dos dados de áudio para canais N para os dados de áudio para canais M, de acordo com as informações de mixagem 266. No entanto, em algumas implantações, o upmixer/downmixer de N a M 262 pode ser um elemento de passagem. Em tais implantações, N=M. As informações de mixagem 266 podem incluir equações de mixagem de N a M. As informações de mi- xagem 266 podem, por exemplo, ser recebidas pelo sistema de processamento de áudio 200 em um fluxo de bits juntamente com as informações de descorrelação 240, representações de domínio de frequência que correspondem a um canal de acoplamento, etc. Nesse exemplo, as informações de descorrelação 240 que são recebidas pelo descorrelacionador 205 indicam que o descorrelacionador 205 deve emitir canais M dos dados de áudio descorrelacionados 230 para o comutador 203.
[00208] O comutador 203 pode determinar, de acordo com as informações de seleção 207, se os dados de áudio direto do upmi- xer/downmixer de N a M 262 ou os dados de áudio descorrelacionados 230 serão encaminhados para o upmixer/downmixer de M a K 264. O upmixer/downmixer de M a K 264 pode ser configurado para fazer upmix ou downmix dos dados de áudio para canais M para os dados de áudio para canais K, de acordo com as informações de mixagem 268. Em tais implantações, as informações de mixagem 268 podem incluir equações de mixagem de M a K. Para as implantações em que N=M, o upmixer/downmixer de M a K 264 pode fazer upmix ou downmix dos dados de áudio para canais N para os dados de áudio para canais K, de acordo com as informações de mixagem 268. Em tais implantações, as informações de mixagem 268 podem incluir equações de mixagem de N a K. As informações de mixagem 268 podem, por exemplo, ser recebidas pelo sistema de processamento de áudio 200 em um fluxo de bits juntamente com as informações de descorrelação 240 e outros dados.
[00209] As equações de mixagem de N a M, de M a K ou de N a K podem ser equações de fazer upmix ou de fazer downmix. As equações de mixagem de N a M, de M a K ou de N a K podem ser um conjunto de coeficientes de combinação linear que mapeia os sinais de áudio de inserção para os sinais de áudio de emissão. De acordo com algumas tais implantações, as equações de mixagem de M a K podem ser equações de fazer downmix estéreo. Por exemplo, o upmi- xer/downmixer de M a K 264 pode ser configurado para fazer downmix de dados de áudio para 4, 5, 6 ou mais canais para dados de áudio para 2 canais, de acordo com as equações de mixagem de M a K nas informações de mixagem 268. Em algumas tais implantações, os dados de áudio para um canal esquerdo ("L"), um canal central ('C") e um canal surround esquerdo ("Ls") podem ser combinados, de acordo com as equações de mixagem de M a K, em um canal de emissão estéreo esquerdo Lo. Os dados de áudio para um canal esquerdo ("L"), um canal central ('C") e um canal surround direito ("Rs") podem ser combinados, de acordo com as equações de mixagem de M a K, em um canal de emissão estéreo direito Ro. Por exemplo, as equações de mixagem de M a K podem ser conforme segue: Lo = L + 0,707C + 0,707Ls Ro = R + 0,707C + 0,707Rs
[00210] Alternativamente, as equações de mixagem de M a K podem ser conforme segue: Lo = L + -3dB*C + att*Ls Ro = R + -3dB*C + att*Rs, em que att pode, por exemplo, representar um valor como -3dB, -6dB, -9dB ou zero. Para as implantações em que N=M, as equações anteriores podem ser consideradas equações de mixagem de N a K.
[00211] Nesse exemplo, as informações de descorrelação 240 que são recebidas pelo descorrelacionador 205 indicam que os dados de áudio para canais M serão subsequentemente submetidos a upmix ou a downmix para os canais K. O descorrelacionador 205 pode ser configurado para usar um processo de descorrelação diferente, dependendo do fato de os dados para canais M serão subsequentemente submetidos a upmix ou a downmix dos dados de áudio para canais K. Dessa maneira, o descorrelacionador 205 pode ser configurado para determinar processos de filtragem de descorrelação com base, pelo menos em parte, nas equações de mixagem de M a K. Por exemplo, se os canais M forem subsequentemente submetidos a downmix para os canais K, diferentes filtros de descorrelação podem ser usados para canais que serão combinados no downmix subsequente. De acordo com um tal exemplo, se as informações de descorrelação 240 indicarem que os dados de áudio para canais L, R, Ls e Rs serão submetidos a downmix para 2 canais, um filtro de descorrelação pode ser usado tanto para os canais L quanto para os canais R e outro filtro de descorrelação pode ser usado tanto para os canais Ls quanto para os canais Rs.
[00212] Em algumas implantações, M = K. Em tais implantações, o upmixer/downmixer de M a K 264 pode ser um elemento de passagem.
[00213] No entanto, em outras implantações, M > K. Em tais implantações, o upmixer/downmixer de M a K 264 pode ser uma função como um downmixer. De acordo com algumas tais implantações, um método menos intensivo em termos de computação para gerar o downmix descorrelacionado pode ser usado. Por exemplo, o descorrelacionador 205 pode ser configurado para gerar os dados de áudio descorrelacio- nados 230 apenas para canais que o comutador 203 enviará para o módulo de transformação inversa 255. Por exemplo, se N = 6 e M = 2, o descorrelacionador 205 pode ser configurado para gerar os dados de áudio descorrelacionados 230 para apenas 2 canais submetidos a downmix. No processo, o descorrelacionador 205 pode usar filtros de descorrelação para apenas 2 canais em vez de 6, reduzindo a complexidade. As informações de mixagem correspondentes podem ser incluídas nas informações de descorrelação 240, nas informações de mixagem 266 e nas informações de mixagem 268. Dessa maneira, o descorrelacionador 205 pode ser configurado para determinar proces-sos de filtragem de descorrelação com base, pelo menos em parte, nas equações de mixagem de N a M, de N a K ou de M a K.
[00214] A Figura 2F é um diagrama de blocos que mostra exemplos de elementos de descorrelacionador. Os elementos mostrados na Figura 2F podem, por exemplo, ser implantados em um sistema lógico de um aparelho de decodificação, como o aparelho descrito abaixo com referência à Figura 12. A Figura 2F retrata um descorrelacionador 205 que inclui um gerador de sinal de descorrelação 218 e um mixador 215. Em algumas modalidades, o descorrelacionador 205 pode incluir outros elementos. Os exemplos de outros elementos do descorrelacio- nador 205 e como os mesmos podem funcionar são estabelecidos em qualquer lugar no presente documento.
[00215] Nesse exemplo, os dados de áudio 220 são inseridos no gerador de sinal de descorrelação 218 e no mixador 215. Os dados de áudio 220 podem corresponder a uma pluralidade de canais de áudio. Por exemplo, os dados de áudio 220 podem incluir dados que resultam do acoplamento de canal durante um processo de codificação de áudio que foi submetido a upmix antes de ser recebido pelo descorrelaci- onador 205. Em algumas modalidades, os dados de áudio 220 podem estar no domínio de tempo, enquanto em outras modalidades, os dados de áudio 220 podem estar no domínio de frequência. Por exemplo, os dados de áudio 220 podem incluir sequências de tempo de coeficientes de transformação.
[00216] O gerador de sinal de descorrelação 218 pode formar um ou mais filtros de descorrelação, aplicar os filtros de descorrelação aos dados de áudio 220 e fornecer os sinais de descorrelação 227 resultantes para o mixador 215. Nesse exemplo, o mixador combina os dados de áudio 220 com os sinais de descorrelação 227 para produzir dados de áudio descorrelacionados 230.
[00217] Em algumas modalidades, o gerador de sinal de descorre- lação 218 pode determinar informações de controle de filtro de descor- relação para um filtro de descorrelação. De acordo com algumas modalidades, as informações de controle de filtro de descorrelação podem corresponder a um deslocamento de polo máximo do filtro de descorrelação. O gerador de sinal de descorrelação 218 pode determinar parâmetros de filtro de descorrelação para os dados de áudio 220 com base, pelo menos em parte, nas informações de controle de filtro de descorrelação.
[00218] Em algumas implantações, a determinação das informações de controle de filtro de descorrelação pode envolver receber uma indicação expressa das informações de controle de filtro de descorre- lação (por exemplo, uma indicação expressa de um deslocamento de polo máximo) com os dados de áudio 220. Em implantações alternativas, a determinação das informações de controle de filtro de descorre- lação pode envolver determinar informações características de áudio e determinar parâmetros de filtro de descorrelação (como um deslocamento de polo máximo) com base, pelo menos em parte, nas informações características de áudio. Em algumas implantações, as informações características de áudio podem incluir informações espaciais, informações de tonalidade e/ou informações transitórias.
[00219] Algumas implantações do descorrelacionador 205 serão descritos agora em mais detalhes com referência às Figuras 3 a 5E. A Figura 3 é um fluxograma que ilustra um exemplo de um processo de descorrelação. A Figura 4 é um diagrama de blocos que ilustra exemplos de componentes de descorrelacionador que podem ser configurados para realizar o processo de descorrelação da Figura 3. O processo de descorrelação 300 da Figura 3 pode ser realizado, pelo menos em parte, em um aparelho de decodificação como aquele descrito abaixo com referência na Figura 12.
[00220] Nesse exemplo, o processo 300 começa quando um des- correlacionador recebe dados de áudio (bloco 305). Conforme descrito acima com referência à Figura 2F, os dados de áudio podem ser recebidos pelo gerador de sinal de descorrelação 218 e pelo mixador 215 do descorrelacionador 205. No presente documento, pelo menos alguns dos dados de áudio são recebidos de um upmixer, como o upmi- xer 225 da Figura 2D. Como tal, os dados de áudio podem corresponder a uma pluralidade de canais de áudio. Em algumas implantações, os dados de áudio recebidos pelo descorrelacionador podem incluir uma sequência de tempo das representações de domínio de frequência de dados de áudio (como coeficientes de MDCT) na faixa de frequência de canal de acoplamento de cada canal. Em implantações alternativas, os dados de áudio podem estar no domínio de tempo.
[00221] No bloco 310, as informações de controle de filtro de des- correlação são determinadas. As informações de controle de filtro de descorrelação podem, por exemplo, ser determinadas de acordo com as características de áudio dos dados de áudio. Em algumas implantações, como o exemplo mostrado na Figura 4, como as características de áudio podem incluir informações espaciais explícitas, informações de tonalidade e/ou informações transitórias codificadas com os dados de áudio.
[00222] Na modalidade mostrada na Figura 4, o filtro de descorrela- ção 410 inclui um atraso fixo 415 e porção variável quanto ao tempo 420. Nesse exemplo, o gerador de sinal de descorrelação 218 inclui um módulo de controle de filtro de descorrelação 405 para controlar a porção variável quanto ao tempo 420 do filtro de descorrelação 410. Nesse exemplo, o módulo de controle de filtro de descorrelação 405 recebe informações de tonalidade explícitas 425 na forma de um sinalizador de tonalidade. Nessa implantação, o módulo de controle de filtro de descorrelação 405 também recebe informações transitórias explícitas 430. Em algumas implantações, as informações de tonalidade explícitas 425 e/ou as informações transitórias explícitas 430 podem ser recebidas com os dados de áudio, por exemplo, como parte das informações de descorrelação 240. Em algumas implantações, as informações de tonalidade explícitas 425 e/ou as informações transitórias explícitas 430 podem ser geradas de modo local.
[00223] Em algumas implantações, nenhuma dentre as informações espaciais explícitas, informações de tonalidade ou informações transitórias é recebida pelo descorrelacionador 205. Em algumas tais implantações, um módulo de controle transitório do descorrelacionador 205 (ou um outro elemento do sistema de processamento de áudio) pode ser configurado para determinar informações transitórias com base em um ou mais atributos dos dados de áudio. Um módulo de pa- râmetro espacial do descorrelacionador 205 pode ser configurado para determinar parâmetros espaciais com base em um ou mais atributos dos dados de áudio. Alguns exemplos são descritos em qualquer lugar no presente documento.
[00224] No bloco 315 da Figura 3, os parâmetros de filtro de des- correlação para os dados de áudio são determinados, pelo menos em parte, com base nas informações de controle de filtro de descorrelação determinadas no bloco 310. Um filtro de descorrelação pode, então, ser formado de acordo com os parâmetros de filtro de descorrelação, conforme mostrado no bloco 320. O filtro pode, por exemplo, ser um filtro linear com pelo menos um elemento de atraso. Em algumas implantações, o filtro pode se basear, pelo menos em parte, em uma função meromórfica. Por exemplo, o filtro pode incluir um filtro passa- tudo.
[00225] Na implantação mostrada na Figura 4, o módulo de controle de filtro de descorrelação 405 pode controlar a porção variável quanto ao tempo 420 do filtro de descorrelação 410 com base, pelo menos em parte, nos sinalizadores de tonalidade 425 e/ou informações transitórias explícitas 430 recebidas pelo descorrelacionador 205 no fluxo de bits. Alguns exemplos são descritos abaixo. Nesse exemplo, o filtro de descorrelação 410 é aplicado apenas aos dados de áudio na faixa de frequência de canal de acoplamento.
[00226] Nessa modalidade, o filtro de descorrelação 410 inclui um atraso fixo 415 seguido pela porção variável quanto ao tempo 420, que é um filtro passa-tudo, nesse exemplo. Em algumas modalidades, o gerador de sinal de descorrelação 218 pode incluir um banco de filtros passa-tudo. Por exemplo, em algumas modalidades em que os dados de áudio 220 estão no domínio de frequência, o gerador de sinal de descorrelação 218 pode incluir um filtro passa-tudo para cada um dentre uma pluralidade de intervalos de frequência. No entanto, em im- plantações alternativas, o mesmo filtro pode ser aplicado a cada intervalo de frequência. Alternativamente, os intervalos de frequência podem ser agrupados e o mesmo filtro pode ser aplicado a cada grupo. Por exemplo, os intervalos de frequência podem ser agrupados em bandas de frequência, podem ser agrupados por canal e/ou agrupados por banda de frequência e por canal.
[00227] A quantidade do atraso fixo pode ser selecionável, por exemplo, através de um dispositivo lógico e/ou de acordo com a inserção de usuário. A fim de introduzir o caos controlado nos sinais de descorrelação 227, o controle de filtro de descorrelação 405 pode aplicar parâmetros de filtro de descorrelação para controlar os polos do(s) filtro(s) passa-tudo de modo que um ou mais polos se movam de modo aleatório ou pseudoaleatório em uma região de restrição.
[00228] Dessa maneira, os parâmetros de filtro de descorrelação podem incluir parâmetros para mover pelo menos um polo do filtro passa-tudo. Tais parâmetros podem incluir parâmetros para oscilação de um ou mais polos do filtro passa-tudo. Alternativamente, os parâmetros de filtro de descorrelação podem incluir parâmetros para selecionar um local de polo dentre uma pluralidade de locais de polo predeterminados para cada polo do filtro passa-tudo. Em um intervalo de tempo predeterminado (por exemplo, uma vez a cada bloco de Dolby Digital Plus), um novo local para cada polo do filtro passa-tudo pode ser escolhido de modo aleatório ou pseudoaleatório.
[00229] Algumas tais implantações serão descritas agora com referência às Figuras 5A a 5E. A Figura 5A é um gráfico que mostra um exemplo de mover os polos de um filtro passa-tudo. O gráfico 500 é uma plotagem de polo de um filtro passa-tudo de 3a ordem. Nesse exemplo, o filtro tem dois polos complexos (polos 505a e 505c) e um polo real (polo 505b). O círculo grande é o círculo unitário 515. No decorrer do tempo, os locais de polo podem ser oscilados (ou de outro modo alterados) de tal modo que os mesmos se movam dentro de áreas de restrição 510a, 510b e 510c, que contêm os percursos possíveis dos polos 505a, 505b e 505c, respectivamente.
[00230] Nesse exemplo, as áreas de restrição 510a, 510b e 510c são circulares. Os locais iniciais (ou "semente") dos polos 505a, 505b e 505c são indicados pelos círculos nos centros das áreas de restrição 510a, 510b e 510c. No exemplo da Figura 5A, as áreas de restrição 510a, 510b e 510c são círculos com raio 0,2 centralizado nos locais de polo iniciais. Os polos 505a e 505c correspondem a um par de conjugado complexo, enquanto o polo 505b é um polo real.
[00231] No entanto, outras implantações podem incluir mais ou menos polos. As implantações alternativas também podem incluir áreas de restrição de diferentes tamanhos ou formatos. Alguns exemplos são mostrados nas Figuras 5D e 5E e são descritos abaixo.
[00232] Em algumas implantações, diferentes canais dos dados de áudio compartilham as mesmas áreas de restrição. No entanto, em implantações alternativas, os canais dos dados de áudio não compartilham as mesmas áreas de restrição. Independente do fato de os canais dos dados de áudio compartilharem ou não as mesmas áreas de restrição, os polos podem ser oscilados (ou de outro modo movidos) independentemente de cada canal de áudio.
[00233] Uma trajetória de amostra do polo 505a é indicada pelas setas na área de restrição 510a. Cada seta representa um movimento ou "passo" 520 do polo 505a. Embora não mostrado na Figura 5A, os dois polos do par conjugado complexo, os polos 505a e 505c, se movem em tandem, de modo que os polos mantenham sua relação conjugada.
[00234] Em algumas implantações, o movimento de um polo pode ser controlado alterando-se um valor de passo máximo. O valor de passo máximo pode corresponder a um deslocamento de polo máximo a partir do local de polo mais recente. O valor de passo máximo pode definir um círculo que tem um raio igual ao valor de passo máximo.
[00235] Um tal exemplo é mostrado na Figura 5A. O polo 505a é deslocado de seu local inicial pelo passo 520a para o local 505a'. O passo 520a pode ter sido restrito de acordo com um valor de passo máximo anterior, por exemplo, um valor de passo máximo inicial. Após o polo 505a mover de seu local inicial para o local 505a', um novo valor de passo máximo é determinado. O valor de passo máximo define o círculo de passo máximo 525, que tem um raio igual ao valor de passo máximo. No exemplo mostrado na Figura 5A, o próximo passo (o passo 520b) acaba sendo igual ao valor de passo máximo. Portanto, o passo 520b move o polo para o local 505a'', na circunferência do círculo de passo máximo 525. No entanto, o passo 520 pode, em geral, ser menor do que o valor de passo máximo.
[00236] Em algumas implantações, o valor de passo máximo pode ser redefinido após cada passo. Em outras implantações, o valor de passo máximo pode ser redefinido após múltiplos passos e/ou de acordo com as alterações nos dados de áudio.
[00237] O valor de passo máximo pode ser determinado e/ou controlado de vários modos. Em algumas implantações, o valor de passo máximo pode se basear, pelo menos em parte, em um ou mais atributos dos dados de áudio aos quais o filtro de descorrelação será aplicado.
[00238] Por exemplo, o valor de passo máximo pode se basear, pelo menos em parte, em informações de tonalidade e/ou informações transitórias. De acordo com algumas tais implantações, o valor de passo máximo pode estar em zero ou perto de zero para sinais altamente tonais dos dados de áudio (como dados de áudio para um afinador, uma harpa, etc.), que ocasiona pouca ou nenhuma variação nos polos. Em algumas implantações, o valor de passo máximo pode estar em zero ou perto de zero no instante de um ataque em um sinal transitório (como dados de áudio para uma explosão, uma batida de porta, etc.). Subsequentemente (por exemplo, no decorrer de um período de tempo de uns novos blocos), o valor de passo máximo pode ser elevado até um valor maior.
[00239] Em algumas implantações, as informações de tonalidade e/ou transitórias podem ser detectadas no decodificador, com base em um ou mais atributos dos dados de áudio. Por exemplo, as informações de tonalidade e/ou transitórias podem ser determinadas de acordo com um ou mais atributos dos dados de áudio por um módulo como o receptor/gerador de informações de controle 640, que é descrito abaixo com referência às Figuras 6B e 6C. Alternativamente, as infor-mações de tonalidade e/ou transitórias explícitas podem ser transmitidas a partir do codificador e recebidas em um fluxo de bits recebido por um decodificador, por exemplo, por meio de sinalizadores de tonalidade e/ou transitórios.
[00240] Nessa implantação, o movimento de um polo pode ser controlado de acordo com os parâmetros de oscilação. Dessa maneira, embora o movimento de um polo possa ser restrito de acordo com um valor de passo máximo, a direção e/ou a extensão do movimento do polo pode incluir um componente aleatório ou quase aleatório. Por exemplo, o movimento de um polo pode se basear, pelo menos em parte, na emissão de um algoritmo gerador de número aleatório ou ge-rador de número pseudoaleatório implantado em software. Tal software pode ser armazenado em um meio não transitório e executado por um sistema lógico.
[00241] No entanto, em implantações alternativas, os parâmetros de filtro de descorrelação podem não envolver parâmetros de oscilação. Em vez disso, o movimento de polo pode ser restrito aos locais de polo predeterminados. Por exemplo, inúmeros locais de polo prede- terminados podem se estender em um raio definido por um valor de passo máximo. Um sistema lógico pode selecionar de modo aleatório ou pseudoaleatório um desses locais de polo predeterminados como o próximo local de polo.
[00242] Vários outros métodos podem ser empregados para controlar o movimento de polo. Em algumas implantações, se um polo se aproximar da margem de uma área de restrição, a seleção dos movimentos de polo pode ser inclinada no sentido de novos locais de polo que estão mais próximos do centro da área de restrição. Por exemplo, se o polo 505a se mover em direção à margem da área de restrição 510a, o centro do círculo de passo máximo 525 pode ser movido para dentro em direção ao centro da área de restrição 510a, de modo que o círculo de passo máximo 525 sempre se estenda na margem da área de restrição 510a.
[00243] Em algumas tais implantações, uma função de peso pode ser aplicada a fim de criar uma inclinação que tenda a mover um local de polo em direção oposta a uma margem de área de restrição. Por exemplo, os locais de polo predeterminados no círculo de passo máximo 525 podem não ser atribuídos com probabilidades iguais de serem selecionados como o próximo local de polo. Em vez disso, os locais de polo predeterminados que estão mais próximos do centro da área de restrição podem ser atribuídos com uma probabilidade maior do que os locais de polo predeterminados que são relativamente mais distantes do centro da área de restrição. De acordo com algumas tais implantações, quando o polo 505a estiver perto da margem da área de restrição 510a, é mais provável que o próximo movimento de polo seja em direção ao centro da área de restrição 510a.
[00244] Nesse exemplo, os locais do polo 505b também mudam, mas são controlados de tal modo que o polo 505b continue a permanecer real. Dessa maneira, os locais do polo 505b são restritos para se estenderem ao longo do diâmetro 530 da área de restrição 510b. Em implantações alternativas, no entanto, o polo 505b pode ser movido para locais que têm um componente imaginário.
[00245] Em ainda outras implantações, os locais de todos os polos podem ser restritos para se moverem apenas ao longo dos raios. Em algumas tais implantações, as alterações no local de polo apenas aumentam ou diminuem os polos (em termos de grandeza), mas não afetam sua fase Tais implantações podem ser úteis, por exemplo, para conferir uma constante de tempo de reverberação selecionada.
[00246] Os polos para os coeficientes de frequência que correspondem às frequências mais altas podem estar relativamente mais próximos do centro do círculo unitário 515 do que os polos para os coeficientes de frequência que correspondem às frequências inferiores correspondentes. A Figura 5B será usada, uma variação da Figura 5A, para ilustrar uma implantação exemplificativa. No presente documento, em um dado instante de tempo, os triângulos 505a''', 505b''' e 505c''' indicam os locais de polo na frequência f0 obtidos após a excitação ou algum outro processo que descreva sua variação de tempo. Permite- se que o polo em 505a''' seja indicado por z1 e o polo em 505b''' seja indicado por z2. O polo em 505c''' é o conjugado complexo do polo em 505a'" e é, por isso, representado por ∑: em que o asterisco indica a conjugação complexa.
[00247] Os polos para o filtro usado em qualquer outra frequência f é obtida, nesse exemplo, modificando-se os polos ZI, Z2 e ∑: por um fator a(f)/a(f0), em que a(f) é uma função que diminui com a frequência de dados de áudio f. Quando f = f0 o fator de escala é igual a 1 e os polos estão nos locais esperados. De acordo com algumas tais implantações, os atrasos de grupo menor podem ser aplicados aos coeficientes de frequência que correspondem às frequências mais altas do que os coeficientes de frequência que correspondem às frequências mais baixas. Na modalidade descrita no presente documento, os polos são oscilados em uma frequência e modificados para obter locais de polo para outas frequências. A frequência f0 poderia ser, por exemplo, a frequência de começo de acoplamento. Em implantações alternativas, os polos poderiam ser separadamente oscilados em cada frequência e as áreas de restrição (510a, 510b, e 510c) podem estar substancialmente mais próximas da origem em frequências mais altas em comparação com as frequências mais baixas.
[00248] De acordo com várias implantações descritas no presente documento, os polos 505 podem ser móveis, mas podem manter uma relação espacial ou angular substancialmente consistente um em relação ao outro. Em algumas tais implantações, os movimentos dos polos 505 podem não ser limitados de acordo com as áreas de restrição.
[00249] A Figura 5C mostra um tal exemplo. Nesse exemplo, os polos conjugados complexos 505a e 505c podem ser móveis em uma direção no sentido horário ou anti-horário no círculo unitário 515. Quando os polos 505a e 505c forem movidos (por exemplo, em um intervalo de tempo predeterminado), ambos os polos podem ser girados por um ângulo θ que é selecionado de modo aleatório ou quase aleatório. Em algumas modalidades, esse movimento angular pode ser restrito de acordo com um valor de passo angular máximo. No exemplo mostrado na Figura 5C, o polo 505a foi movido por um ângulo θ em uma direção no sentido horário. Dessa maneira, o polo 505c foi movido por um ângulo θ em uma direção no sentido anti-horário, a fim de manter a relação de conjugado complexo entre o polo 505a e o polo 505c.
[00250] Nesse exemplo, o polo 505b é restrito para se mover ao longo do eixo geométrico real. Em algumas tais implantações, os polos 505a e 505c também pode ser móvel em direção ao centro do círculo unitário 515 ou em direção oposta ao mesmo, por exemplo, conforme descrito acima com referência à Figura 5B. Em implantações alternativas, o polo 505b pode não ser movido. Em ainda outras implantações, o polo 505b pode ser movido a partir do eixo geométrico real.
[00251] Nos exemplos mostrados nas Figuras 5A e 5B, as áreas de restrição 510a, 510b e 510c são circulares. No entanto, vários outros formatos de área de restrição são contemplados pelos inventores. Por exemplo, a área de restrição 510d da Figura 5D é substancialmente oval em formato. O polo 505d pode ser posicionado em vários locais na área de restrição oval 510d. No exemplo da Figura 5E, a área de restrição 510e é um espaço anular. O polo 505e pode ser posicionado em vários locais no espaço anular da área de restrição 510d.
[00252] Voltando-se, agora, para a Figura 3, no bloco 325 um filtro de descorrelação é aplicado a pelo menos alguns dos dados de áudio. Por exemplo, o gerador de sinal de descorrelação 218 da Figura 4 pode aplicar um filtro de descorrelação a pelo menos alguns dos dados de áudio de inserção 220. A emissão do filtro de descorrelação 227 pode ser não correlacionada com os dados de áudio de inserção 220. Além do mais, a emissão do filtro de descorrelação pode ter, substancialmente, a mesma densidade espectral de potência que o sinal de inserção. Portanto, a emissão do filtro de descorrelação 227 pode soar natural. No bloco 330, a emissão do filtro de descorrelação é mixada com os dados de áudio de inserção. No bloco 335, os dados de áudio descorrelacionados são emitidos. No exemplo da Figura 4, no bloco 330 o mixador 215 combina a emissão do filtro de descorrelação 227 (que pode ser referido no presente documento como "dados de áudio filtrados") com os dados de áudio de inserção 220 (que podem ser referidos no presente documento como "dados de áudio diretos"). No bloco 335, o mixador 215 emite os dados de áudio descorrelacionados 230. Se for determinado no bloco 340 que mais dados de áudio serão processados, o processo de descorrelação 300 inverte para o bloco 305. De outro modo, o processo de descorrelação 300 acaba. (Bloco 345.)
[00253] A Figura 6A é um diagrama de blocos que ilustra uma implantação alternativa de um descorrelacionador. Nesse exemplo, o mi- xador 215 e o gerador de sinal de descorrelação 218 recebem elementos de dados de áudio 220 que correspondem a uma pluralidade de canais. Pelo menos alguns dos elementos de dados de áudio 220 pode, por exemplo, ser emitidos a partir de um upmixer, como o upmixer 225 da Figura 2D.
[00254] No presente documento, o mixador 215 e o gerador de sinal de descorrelação 218 também recebem vários tipos de informações de descorrelação. Em algumas implantações, pelo menos algumas das informações de descorrelação podem ser recebidas em um fluxo de bits juntamente com os elementos de dados de áudio 220. Alternativa ou adicionalmente, pelo menos algumas das informações de descorre- lação podem ser determinadas localmente, por exemplo, através de outros componentes do descorrelacionador 205 ou através de um ou mais outros componentes do sistema de processamento de áudio 200.
[00255] Nesse exemplo, as informações de descorrelação recebidas incluem informações de controle de gerador de sinal de descorre- lação 625. As informações de controle de gerador de sinal de descor- relação 625 podem incluir informações de filtro de descorrelação, informações de ganho, informações de controle de inserção, etc. O gerador de sinal de descorrelação produz os sinais de descorrelação 227 com base, pelo menos em parte, nas informações de controle de gerador de sinal de descorrelação 625.
[00256] No presente documento, as informações de descorrelação recebidas também incluem informações de controle transitórias 430. Vários exemplos de como o descorrelacionador 205 pode usar e/ou gerar as informações de controle transitórias 430 são fornecidos nesta revelação.
[00257] Nessa implantação, o mixador 215 inclui o sintetizador 605 e o mixador de sinal direito e de sinal de descorrelação 610. Nesse exemplo, o sintetizador 605 é um combinador específico a canal de emissão de descorrelação ou sinais de reverberação, como os sinais de descorrelação 227 recebidos do gerador de sinal de descorrelação 218. De acordo com algumas tais implantações, o sintetizador 605 pode ser um combinador linear dos sinais de descorrelação ou de rever-beração. Nesse exemplo, os sinais de descorrelação 227 correspondem aos elementos de dados de áudio 220 para uma pluralidade de canais, aos quais um ou mais filtros de descorrelação foram aplicados pelo gerador de sinal de descorrelação. Dessa maneira, os sinais de descorrelação 227 também podem ser referidos no presente documento como "dados de áudio filtrados" ou "elementos de dados de áudio filtrados".
[00258] No presente documento, o mixador de sinal direito e de sinal de descorrelação 610 é um combinador específico a canal de emissão dos elementos de dados de áudio filtrados com os elementos de dados de áudio "diretos" 220 que correspondem a uma pluralidade de canais, para produzir os dados de áudio descorrelacionados 230. Dessa maneira, o descorrelacionador 205 pode fornecer descorrelação específica a canal e não hierárquica de dados de áudio.
[00259] Nesse exemplo, o sintetizador 605 combina os sinais de descorrelação 227 de acordo com os parâmetros de sintetização de sinal de descorrelação 615, que também podem ser referidos no presente documento como "coeficientes de sintetização de sinal de des- correlação". De modo similar, o mixador de sinal direito e de sinal de descorrelação 610 combina os elementos de dados de áudio diretos e filtrados de acordo com os coeficientes de mixagem 620. Os parâmetros de sintetização de sinal de descorrelação 615 e os coeficientes de mixagem 620 podem se basear, pelo menos em parte, nas informações de descorrelação recebidas.
[00260] No presente documento, as informações de descorrelação recebidas incluem informações de parâmetros espaciais 630, que é específico a canal, nesse exemplo. Em algumas implantações, o mi- xador 215 pode ser configurado para determinar os parâmetros de sintetização de sinal de descorrelação 615 e/ou os coeficientes de mixa- gem 620 com base, pelo menos em parte, nas informações de parâmetros espaciais 630. Nesse exemplo, as informações de descorrela- ção recebidas também incluem informações de downmix/upmix 635. Por exemplo, as informações de downmix/upmix 635 podem indicar como muitos canais de dados de áudio foram combinados para produzir dados de áudio submetidos a downmix, que podem corresponder a um ou mais canais de acoplamento em uma faixa de frequência de canal de acoplamento. As informações de downmix/upmix 635 também podem inclui inúmeros canais de emissão e/ou características dos canais de emissão desejados. Conforme descrito acima com referência à Figura 2E, em algumas implantações, as informações de downmix/upmix 635 podem incluir informações que correspondem às informações de mixagem 266 recebidas pelo upmixer/downmixer de N a M 262 e/ou as informações de mixagem 268 recebidas pelo upmi- xer/downmixer de M a K 264.
[00261] A Figura 6B é um diagrama de blocos que ilustra uma outra implantação de um descorrelacionador. Nesse exemplo, o descorrela- cionador 205 inclui um receptor/gerador de informações de controle 640. No presente documento, o receptor/gerador de informações de controle 640 recebe os elementos de dados de áudio 220 e 245. Nesse exemplo, os elementos de dados de áudio 220 correspondentes também são recebidos pelo mixador 215 e pelo gerador de sinal de descorrelação 218. Em algumas implantações, os elementos de dados de áudio 220 podem corresponder aos dados de áudio em uma faixa de frequência de canal de acoplamento, enquanto os elementos de dados de áudio 245 podem corresponder aos dados de áudio que estão em uma ou mais faixas de frequência fora da faixa de frequência de canal de acoplamento.
[00262] Nessa implantação, o receptor/gerador de informações de controle 640 determina as informações de controle de gerador de sinal de descorrelação 625 e as informações de controle de mixador 645 de acordo com as informações de descorrelação 240 e/ou os elementos de dados de áudio 220 e/ou 245. Alguns exemplos do receptor/gerador de informações de controle 640 e sua funcionalidade são descritos abaixo.
[00263] A Figura 6C ilustra uma implantação alternativa de um sistema de processamento de áudio. Nesse exemplo, o sistema de processamento de áudio 200 inclui um descorrelacionador 205, um comutador 203 e um módulo de transformação inversa 255. Em algumas implantações, o comutador 203 e o módulo de transformação inversa 255 podem ser substancialmente conforme descritos acima com referência à Figura 2A. De modo similar, o mixador 215 e o gerador de sinal de descorrelação podem ser substancialmente conforme descritos em qualquer lugar no presente documento.
[00264] O receptor/gerador de informações de controle 640 pode ter funcionalidade diferente, de acordo com a implantação específica. Nessa implantação, o receptor/gerador de informações de controle 640 inclui um módulo de controle de filtro 650, um módulo de controle transitório 655, um módulo de controle de mixador 660 e um módulo de parâmetro espacial 665. Como com outros componentes do sistema de processamento de áudio 200, os elementos do receptor/gerador de informações de controle 640 podem ser implantados por meio de hardware, firmware, software armazenados em um meio não transitó- rio e/ou combinações dos mesmos. Em algumas implantações, esses componentes podem ser implantados por um sistema lógico conforme descrito em qualquer lugar nesta revelação.
[00265] O módulo de controle de filtro 650 pode, por exemplo, ser configurado para controlar o gerador de sinal de descorrelação conforme descrito acima com referência às Figuras 2E a 5E e/ou conforme descrito abaixo com referência à Figura 11B. Vários exemplos da funcionalidade do módulo de controle transitório 655 e do módulo de controle de mixador 660 são fornecidos abaixo.
[00266] Nesse exemplo, o receptor/gerador de informações de controle 640 recebe os elementos de dados de áudio 220 e 245, que pode incluir pelo menos uma porção dos dados de áudio recebidos pelo comutador 203 e/ou pelo descorrelacionador 205. Os elementos de dados de áudio 220 correspondentes são recebidos pelo mixador 215 e pelo gerador de sinal de descorrelação 218. Em algumas implantações, os elementos de dados de áudio 220 podem corresponder aos dados de áudio em uma faixa de frequência de canal de acoplamento, enquanto os elementos de dados de áudio 245 podem corresponder aos dados de áudio que estão em uma faixa de frequência fora da faixa de frequência de canal de acoplamento. Por exemplo, os elementos de dados de áudio 245 podem corresponder aos dados de áudio que estão em uma faixa de frequências acima e/ou abaixo daquela da faixa de frequência de canal de acoplamento.
[00267] Nessa implantação, o receptor/gerador de informações de controle 640 determina as informações de controle de gerador de sinal de descorrelação 625 e as informações de controle de mixador 645 de acordo com as informações de descorrelação 240, os elementos de dados de áudio 220 e/ou elementos de dados de áudio 245. O recep- tor/gerador de informações de controle 640 fornece as informações de controle de gerador de sinal de descorrelação 625 e as informações de controle de mixador 645 para o gerador de sinal de descorrelação 218 e o mixador 215, respectivamente.
[00268] Em algumas implantações, o receptor/gerador de informações de controle 640 pode ser configurado para determinar informações de tonalidade e para determinar as informações de controle de gerador de sinal de descorrelação 625 e/ou as informações de controle de mixador 645 com base, pelo menos em parte, nas informações de tonalidade. Por exemplo, o receptor/gerador de informações de controle 640 pode ser configurado para receber informações de tonalidade explícitas por meio de informações de tonalidade explícitas, como sinalizadores de tonalidade, como parte das informações de descorrela- ção 240. O receptor/gerador de informações de controle 640 pode ser configurado para processar as informações de tonalidade explícitas recebidas e para determinar as informações de controle de tonalidade.
[00269] Por exemplo, se o receptor/gerador de informações de controle 640 determinar que os dados de áudio na faixa de frequência de canal de acoplamento forem altamente tonais, o receptor/gerador de informações de controle 640 pode ser configurado para fornecer informações de controle de gerador de sinal de descorrelação 625 que indicam que o valor de passo máximo deve ser definido em zero ou quase zero, o que causa pouca ou nenhuma variação nos polos. Subsequentemente (por exemplo, no decorrer de um período de tempo de uns novos blocos), o valor de passo máximo pode ser elevado até um valor maior. Em algumas implantações, se o receptor/gerador de informações de controle 640 determinar que os dados de áudio na faixa de frequência de canal de acoplamento são altamente tonais, o recep- tor/gerador de informações de controle 640 pode ser configurado para indicar ao módulo de parâmetro espacial 665 que um grau relativamente mais alto de suavização pode ser aplicado no cálculo de várias quantidades, como as energias usadas na estimativa de parâmetros espaciais. Outros exemplos de respostas para a determinação de dados de áudio altamente tonais são fornecidos em qualquer lugar no presente documento.
[00270] Em algumas implantações, o receptor/gerador de informações de controle 640 pode ser configurado para determinar informações de tonalidade de acordo com um ou mais atributos dos dados de áudio 220 e/ou de acordo com as informações de um fluxo de bits de um código de áudio herdado que é recebido por meio das informações de descorrelação 240, como informações de exponente e/ou informações de estratégia de exponente.
[00271] Por exemplo, no fluxo de bits dos dados de áudio codificados de acordo com o codec de áudio E-AC-3, os expoentes para os coeficientes de transformação são codificados de modo diferente. A soma das diferenças de expoente absolutas em uma faixa de frequências é uma medida de distância percorrida ao longo do envelope espectral do sinal em um domínio de grandeza de log. Os sinais como afinador e harpa têm um espectro do tipo cerca e, por isso, o percurso ao longo do qual essa distância é medida é caracterizada por muitos picos e vales. Assim, para tais sinais a distância percorrida ao longo do envelope espectral na mesma faixa de frequência é maior do que para os sinais para os dados de áudio que correspondem, por exemplo, o aplauso ou chuva, que têm um espectro relativamente plano.
[00272] Portanto, em algumas implantações, o receptor/gerador de informações de controle 640 pode ser configurado para determinar uma métrica de tonalidade baseada, pelo menos em parte, de acordo com as diferenças de exponente na faixa de frequência de canal de acoplamento. Por exemplo, o receptor/gerador de informações de controle 640 pode ser configurado para determinar uma métrica de tonalidade baseada, na diferença de exponente absoluta média na faixa de frequência de canal de acoplamento. De acordo com algumas tais im- plantações, a métrica de tonalidade só é calculada quando a estratégia de exponente de acoplamento for compartilhada para todos os blocos em um quadro e não indicar o compartilhamento de frequência de exponente, em cujo caso é significativo definir a diferença de exponente a partir de um intervalo de frequência para o próximo. De acordo com algumas implantações, a métrica de tonalidade só é calculada se o sinalizador de transformação híbrida adaptativa E-AC-3 ("AHT") for definido para o canal de acoplamento.
[00273] Se a métrica de tonalidade for determinada como a diferença de exponente absoluta de dados de áudio E-AC-3, em algumas implantações, a métrica de tonalidade pode assumir um valor entre 0 e 2, devido ao fato de que -2, -1, 0, 1 e 2 são a única diferença de exponente permitida de acordo com E-AC-3. Um ou mais limiares de tonalidade podem ser definidos a fim de diferenciar os sinais tonais e os não tonais. Por exemplo, algumas implantações envolvem definir um limitar para entrar em um estado de tonalidade e outro limiar para sair do estado de tonalidade. O limiar para sair do estado de tonalidade pode ser menor do que o limiar para entrar no estado de tonalidade. Tais implantações fornecem um grau de histerese, de tal modo que os valores de tonalidade ligeiramente abaixo do limiar superior não ocasionem, inadvertidamente, alteração no estado de tonalidade. Em um exemplo, o limiar para sair do estado de tonalidade é 0,40, enquanto o limiar para entrar no estado de tonalidade é 0,45. No entanto, outras implantações podem incluir mais ou menos limiares e os limiares podem ter diferentes valores.
[00274] Em algumas implantações, o cálculo de métrica de tonalidade pode ser pesado de acordo com a energia presente no sinal. Essa energia pode ser derivada diretamente dos exponentes. A métrica de energia de log pode ser inversamente proporcional aos exponentes, devido ao fato de que os exponentes são representados como potên- cias negativas de dois em E-AC-3. De acordo com tais implantações, aquelas partes do espectro que são baixas em energia irão contribuir menos para a métrica de tonalidade geral do que aquelas partes de espectro que são altas em energia. Em algumas implantações, o cálculo de métrica de tonalidade também pode ser realizado no bloco zero de um quadro.
[00275] No exemplo mostrado na Figura 6C, os dados de áudio descorrelacionados 230 do mixador 215 são fornecidos para o comutador 203. Em algumas implantações, o comutador 203 pode determinar quais componentes dos dados de áudio diretos 220 e dos dados de áudio descorrelacionados 230 serão enviados para o módulo de transformação inversa 255. Dessa maneira, em algumas implantações, o sistema de processamento de áudio 200 pode fornecer a descorrela- ção seletiva ou adaptativa a sinal de componentes de dados de áudio. Por exemplo, em algumas implantações, o sistema de processamento de áudio 200 pode fornecer a descorrelação seletiva ou adaptativa a sinal de componentes de dados de áudio. Alternativa ou adicionalmente, em algumas implantações, o sistema de processamento de áudio 200 pode fornecer a descorrelação seletiva ou adaptativa a sinal de bandas de frequência específica de dados de áudio.
[00276] Em várias implantações do sistema de processamento de áudio 200, o receptor/gerador de informações de controle 640 pode ser configurado para determinar um ou mais tipos de parâmetros espaciais dos dados de áudio 220. Em algumas implantações, pelo menos algumas de tais funcionalidades podem ser fornecidas pelo módulo de parâmetro espacial 665 mostrado na Figura 6C. Alguns tais parâmetros espaciais podem ser coeficientes de correlação entre canais individuais distintos e um canal de acoplamento, que também pode ser referido no presente documento como "alfas". Por exemplo, se o canal de acoplamento incluir dados de áudio para quatro canais, pode haver quatro alfas, um alfa para cada canal. Em algumas tais implantações, os quatro canais podem ser o canal esquerdo ("L"), o canal direito ("R"), o canal surround esquerdo ("Ls") e o canal surround direito ("Rs"). Em algumas implantações, o canal de acoplamento pode incluir dados de áudio para os canais descritos acima e um canal central. Um alfa pode ser ou não calculado para o canal central, dependendo do fato de se o canal central será descorrelacionado. Outras implantações podem envolver um número maior ou menor de canais.
[00277] Outros parâmetros espaciais podem ser coeficientes de correlação entre canais que indicam uma correlação entre pares de canais individuais distintos. Tais parâmetros podem, às vezes, ser referidos no presente documento como "coerência entre canais" ou "ICC" de reflexão. No exemplo de quatro canais referido acima, pode haver seis valores de ICC, para o par L-R, o par L-Ls, o L-Rs par, o R- Ls par, o par R-Rs e o par Ls-Rs.
[00278] Em algumas implantações, a determinação de parâmetros espaciais pelo receptor/gerador de informações de controle 640 pode envolver receber parâmetros espaciais explícitos em um fluxo de bits, por exemplo, por meio das informações de descorrelação 240. Alternativa ou adicionalmente, o receptor/gerador de informações de controle 640 pode ser configurado para estimar pelo menos alguns parâmetros espaciais. O receptor/gerador de informações de controle 640 pode ser configurado para determinar parâmetros de mixagem com base, pelo menos em parte, nos parâmetros espaciais. Dessa maneira, em algumas implantações, as funções relacionadas à determinação e ao processamento de parâmetros espaciais podem ser realizadas, pelo menos em parte, pelo módulo de controle de mixador 660.
[00279] As Figuras 7A e 7B são diagramas de vetor que fornecem uma ilustração simplificada de parâmetros espaciais. As Figuras 7A e 7B podem ser consideradas uma representação conceitual em 3-D de sinais em um espaço de vetor N-dimensional. Cada vetor N- dimensional pode representar uma variável aleatória com valor real ou complexo cujas coordenadas N correspondem a quaisquer N tentativas independentes. Por exemplo, as coordenadas N podem corresponder a uma coleção de coeficientes de domínio de frequência N de um sinal em uma faixa de frequência e/ou em um intervalo de tempo (por exemplo, durante alguns blocos de áudio).
[00280] Com referência, primeiro, ao painel esquerdo da Figura 7A, esse diagrama de vetor representa as relações espaciais entre um canal de inserção esquerdo lin, um canal de inserção direito rin e a canal de acoplamento xmono, um mono downmix formado somando-se lin e rin . A Figura 7A é um exemplo simplificado de formar um canal de acoplamento, que pode ser realizado através de um aparelho de codificação. O coeficiente de correlação entre o canal de inserção esquerdo lin e o canal de acoplamento xmono é αL, e o coeficiente de correlação entre o canal de inserção direito rin e o canal de acoplamento é αR. Dessa maneira, o ângulo θL entre os vetores que representam o canal de inserção esquerdo lin e o canal de acoplamento xmono é igual a arccos(αL) e o ângulo θR entre os vetores que representam o canal de inserção direito rin e o canal de acoplamento xmono é igual a arccos(αR).
[00281] O painel direito da Figura 7A mostra um exemplo simplificado de descorrelacionar um canal de emissão individual a partir de um canal de acoplamento. Um processo de descorrelação desse tipo pode ser realizado, por exemplo, por um aparelho de decodificação. Gerando-se um sinal de descorrelação yL que é não correlacionado (perpendicular) com o canal de acoplamento xmono e que mixa com o canal de acoplamento xmono com o uso de pesos adequados, a amplitude do canal de emissão individual (lout, nesse exemplo) e sua separação angular a partir do canal de acoplamento xmono pode refletir, com precisão, a amplitude do canal de inserção individual e sua relação espacial com o canal de acoplamento. O sinal de descorrelação yL deve ter a mesma distribuição de potência (representada pelo comprimento de vetor) como o canal de acoplamento xmono. Nesse exemplo,
Figure img0001
[00282] No entanto, restaurar a relação espacial entre canais individuais distintos e um canal de acoplamento não garante a restauração das relações espaciais entre os canais distintos (representados pelos ICCs). Esse fato é ilustrado na Figura 7B. Os dois painéis na Figura 7B mostram dois casos extremos. A separação entre lout e rout é maximizada quando os sinais de descorrelação yL e yR forem separados por 180°, conforme mostrado no painel esquerdo da Figura 7B. Nesse caso, o ICC entre os canais esquerdo e direito são minimizados e a di-versidade de fase entre lout e rout é maximizado. Contrariamente, conforme mostrado no painel direito da Figura 7B, a separação entre lout e rout é minimizada quando os sinais de descorrelação yL e yR forem separados por 0°. Nesse caso, o ICC entre os canais esquerdo e direito são maximizados e a diversidade de fase entre lout e rout é minimizado.
[00283] Nos exemplos mostrados na Figura 7B, todos os vetores ilustrados estão no mesmo plano. Em outros exemplos, yL e yR podem ser posicionados em outros ângulos um em relação ao outro. No entanto, é preferencial que yL e yR sejam perpendiculares ou pelo menos substancialmente perpendiculares ao canal de acoplamento xmono. Em alguns exemplos, qualquer um dentre yL e yR pode se estender, pelo menos parcialmente, em um plano que é ortogonal ao plano da Figura 7B.
[00284] Devido ao fato de que os canais distintos serem, por fim, reproduzidos e apresentados aos ouvintes, a restauração apropriada das relações espaciais entre canais distintos (os ICCs) pode melhorar, significativamente, a restauração das características espaciais dos da- dos de áudio. Conforme pode ser visto pelos exemplos da Figura 7B, uma restauração apropriada dos ICCs depende da criação de sinais de descorrelação (no presente, yL e yR) que têm relações espaciais adequadas entre si. Essa correlação entre sinais de descorrelação pode ser referida no presente documento como a coerência de sinal entre descorrelações ou "IDC".
[00285] No painel esquerdo da Figura 7B, a IDC entre yL e yR é -1. Conforme notado acima, essa IDC corresponde a uma ICC mínima entre os canais esquerdo e direito. Comparando-se o painel esquerdo da Figura 7B com o painel esquerdo da Figura 7A, pode-se observar que, nesse exemplo, com dois canais acoplados, a relação espacial entre lout e rout reflete precisamente a relação espacial entre lin e rin. No painel direito da Figura 7B, a IDC entre yL e yR é 1 (correlação comple- ta)0. Comparando-se o painel direito da Figura 7B com o painel esquerdo da Figura 7A, pode-se observar que, nesse exemplo a relação espacial entre lout e rout não reflete precisamente a relação espacial entre lin e rin.
[00286] Dessa maneira, definindo-se a IDC entre canais individuais espacialmente adjacentes em -1, a ICC entre esses canais pode ser minimizada e a relação espacial entre os canais pode ser restaurada de maneira aproximada quando esses canais forem dominantes. Isso resulta em uma imagem sonora geral que é aproximada, de modo per- ceptivo, à imagem sonora do sinal de áudio original. Tais métodos podem ser referidos no presente documento como métodos de "inversão de sinal". Em tais métodos, nenhum conhecimento das ICCs reais é exigido.
[00287] A Figura 8A é um diagrama de fluxo que ilustra blocos de alguns métodos de descorrelação fornecidos no presente documento. Conforme com outro método descrito no presente documento, os blocos do método 800 não são necessariamente fornecidos na ordem in- dicada. Além do mais, algumas implantações do método 800 e outros métodos podem incluir mais ou menos blocos do que indicado ou descrito. O método 800 começa com o bloco 802, em que os dados de áudio que correspondem a uma pluralidade de canais de áudio são recebidos. Os dados de áudio podem, por exemplo, ser recebidos por um componente de um sistema de decodificação de áudio. Em algumas implantações, os dados de áudio podem ser recebidos por um descorrelacionador de um sistema de decodificação de áudio, como um dentre as implantações do descorrelacionador 205 revelado no presente documento. Os dados de áudio podem incluir elementos de dados de áudio para uma pluralidade de canais de áudio produzidos realizando-se upmix de dados de áudio que correspondem a um canal de acoplamento. De acordo com algumas implantações, os dados de áudio podem ter sido submetidos a upmix aplicando-se fatores de escala específicos a canal, variantes em relação ao tempo para os dados de áudio que correspondem ao canal de acoplamento. Alguns exemplos são fornecidos abaixo.
[00288] Nesse exemplo, o bloco 804 envolve determinar características de áudio dos dados de áudio. No presente documento, as características de áudio incluem dados de parâmetro espacial. Os dados de parâmetro espacial podem incluir alfas, os coeficientes de correlação entre canais de áudio individuais e o canal de acoplamento. O bloco 804 pode envolver receber dados de parâmetro espacial, por exemplo, por meio das informações de descorrelação 240 descritas acima com referência às Figuras 2A et seq. Alternativa ou adicionalmente, o bloco 804 pode envolver estimar parâmetros espaciais localmente, por exemplo, através do receptor/gerador de informações de controle 640 (consulte, por exemplo, Figura 6B ou 6C). Em algumas implantações, o bloco 804 pode envolver determinar outras características de áudio, como características transitórias ou características de tonalidade.
[00289] No presente documento, o bloco 806 envolve determinar pelo menos dois processos de filtragem de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio. Os processos de filtragem de descorrelação podem ser processos de filtragem de descorrelação específicos a canal. De acordo com algumas implantações, cada um dos processos de filtragem de descor- relação determinado no bloco 806 inclui uma sequência de operações relacionadas à descorrelação.
[00290] A aplicação de pelo menos dois processos de filtragem de descorrelação determinados no bloco 806 pode produzir sinais de descorrelação específicos a canal. Por exemplo, a aplicação dos processos de filtragem de descorrelação determinados no bloco 806 pode causar uma coerência de sinal entre descorrelações específica ("IDC") entre sinais de descorrelação específicos a canal para pelo menos um par de canais. Alguns tais processos de filtragem de descorrelação podem envolver aplicar pelo menos um filtro de descorrelação a pelo menos uma porção dos dados de áudio (por exemplo, conforme descrito abaixo com referência a um bloco 820 da Figura 8B ou Figura 8E) para produzir dados de áudio filtrados, também referidos no presente documento como sinais de descorrelação. As operações adicionais podem ser realizadas nos dados de áudio filtrados para produzir os sinais de descorrelação específicos a canal. Alguns tais processos de filtragem de descorrelação podem envolver um processo de inversão de sinal lateral, como um dentre os processos de inversão de sinal lateral descritos abaixo com referência às Figuras 8B a 8D.
[00291] Em algumas implantações, pode-se determinar, no bloco 806, que o mesmo filtro de descorrelação será usado para produzir dados de áudio filtrados que correspondem a todos os canais quer serão descorrelacionados, enquanto em outras implantações, pode-se determinar no bloco 806 que um filtro de descorrelação diferente será usado para produzir dados de áudio filtrados para pelo menos alguns canais que serão descorrelacionados. Em algumas implantações, pode-se determinar no bloco 806 que os dados de áudio que correspondem a um canal central não serão descorrelacionados, enquanto em outras implantações o bloco 806 pode envolver determinar um filtro de descorrelação diferente para dados de áudio de um canal central. Além do mais, embora em algumas implantações cada um dos processos de filtragem de descorrelação determinados no bloco 806 inclua uma sequência de operações relacionadas à descorrelação, em implantações alternativas cada um dos processos de filtragem de des- correlação determinados no bloco 806 pode corresponder a um estágio em particular de um processo de descorrelação geral. Por exemplo, em implantações alternativas, cada um dos processos de filtragem de descorrelação determinados no bloco 806 pode corresponder a uma operação em particular (ou um grupo de operações relacionadas) em uma sequência de operações relacionadas à geração de um sinal de descorrelação para pelo menos dois canais.
[00292] No bloco 808, os processos de filtragem de descorrelação determinados no bloco 806 serão implantados. Por exemplo, o bloco 808 pode envolver aplicar um filtro de descorrelação ou filtros para pelo menos uma porção dos dados de áudio recebidos, para produzir dados de áudio filtrados. Os dados de áudio filtrados podem, por exemplo, corresponder aos sinais de descorrelação 227 produzidos pelo gerador de sinal de descorrelação 218, conforme descrito acima com referência às Figuras 2F, 4 e/ou 6A a 6C. O bloco 808 também pode envolver várias outras operações, cujos exemplos serão fornecidos abaixo.
[00293] No presente documento, o bloco 810 envolve determinar parâmetros de mixagem com base, pelo menos em parte, nas características de áudio. O bloco 810 pode ser realizado, pelo menos em par te, pelo módulo de controle de mixador 660 do receptor/gerador de informações de controle 640 (consulte, a Figura 6C). Em algumas implantações, os parâmetros de mixagem podem ser parâmetros de mi- xagem específicos a canal de emissão. Por exemplo, o bloco 810 pode envolver receber ou estimar valores alfa para cada um dos canais de áudio que serão descorrelacionados e determinar parâmetros de mi- xagem com base, pelo menos em parte, nos alfas. Em algumas implantações, os alfas podem ser modificados de acordo com as informações de controle transitórias, que podem ser determinadas pelo módulo de controle transitório 655 (consulte Figura 6C). No bloco 812, os dados de áudio filtrados podem ser mixados com uma porção direta dos dados de áudio de acordo com os parâmetros de mixagem.
[00294] A Figura 8B é um diagrama de fluxo que ilustra blocos de um método de inversão de sinal lateral. Em algumas implantações, os blocos mostrados na Figura 8B são exemplos do bloco de "determinação" 806 e o bloco de "aplicação" 808 da Figura 8A. Dessa maneira, esses blocos são identificados como "806a" e "808a" na Figura 8B. Nesse exemplo, o bloco 806a envolve determinar filtros de descorrela- ção e a polaridade para sinais de descorrelação para pelo menos dois canais adjacentes para ocasionar uma IDC específica entre sinais de descorrelação para o par de canais. Nessa implantação, o bloco 820 pode envolver aplicar um ou mais filtros de descorrelação determinados no bloco 806a para pelo menos uma porção dos dados de áudio recebidos, para produzir dados de áudio filtrados. Os dados de áudio filtrados podem, por exemplo, corresponder aos sinais de descorrela- ção 227 produzidos pelo gerador de sinal de descorrelação 218, conforme descrito acima com referência às Figuras 2E e 4.
[00295] Em alguns exemplos de quatro canais, o bloco 820 pode envolver aplicar um primeiro filtro de descorrelação aos dados de áudio para um primeiro e um segundo canais para produzir os dados fil- trados de primeiro canal e dados filtrados de segundo canal e aplicar um segundo filtro de descorrelação aos dados de áudio para um terceiro e quarto canais para produzir dados filtrados de terceiro canal e dados filtrados de quarto canal. Por exemplo, o primeiro canal pode ser um canal esquerdo, o segundo canal pode ser um canal direito, o terceiro canal pode ser um canal surround esquerdo e o quarto canal pode ser um canal surround direito.
[00296] Os filtros de descorrelação podem ser aplicados ou antes ou depois de os dados de áudio serem submetidos a upmix, dependendo da implantação específica. Em algumas implantações, por exemplo, um filtro de descorrelação pode ser aplicado a um canal de acoplamento dos dados de áudio. Subsequentemente, um fator de escala apropriado para cada canal pode ser aplicado. Alguns exemplos são descritos a abaixo com referência à Figura 8C.
[00297] As Figuras 8C e 8D são diagramas de blocos que ilustram componentes que podem ser usados para implantar alguns métodos de troca de sinal. Com referência, primeiro, à Figura 8B, nessa implantação, um filtro de descorrelação é aplicado a um canal de acoplamento de dados de áudio de inserção no bloco 820. No exemplo mostrado na Figura 8C, as informações de controle de gerador de sinal de des- correlação 625 e os dados de áudio 210, que incluem representações de domínio de frequência que correspondem ao canal de acoplamento, são recebidos pelo gerador de sinal de descorrelação 218. Nesse exemplo, o gerador de sinal de descorrelação 218 emite sinais de des- correlação 227 que são os mesmos para todos os canais que serão descorrelacionados.
[00298] O processo 808a da Figura 8B pode envolver realizar operações nos dados de áudio filtrados para produzir sinais de descorre- lação que têm uma coerência de sinal entre descorrelações específica IDC entre sinais de descorrelação para pelo menos um par de canais. Nessa implantação, o bloco 825 envolve aplicar uma polaridade aos dados de áudio filtrados produzidos no bloco 820. Nesse exemplo, a polaridade aplicada no bloco 820 foi determinada no bloco 806a. Em algumas implantações, o bloco 825 envolve inverter uma polaridade entre aos dados de áudio filtrados para canais adjacentes. Por exemplo, o bloco 825 pode envolver multiplicar dados de áudio filtrados que correspondem a um canal lateral esquerdo ou um canal lateral direito por -1. O bloco 825 pode envolver inverter uma polaridade de dados de áudio filtrados que correspondem a um canal surround esquerdo com referência aos dados de áudio filtrados que correspondem ao canal lateral esquerdo. O bloco 825 também pode envolver inverter uma polaridade de dados de áudio filtrados que correspondem a um canal surround direito com referência aos dados de áudio filtrados que correspondem ao canal lateral direito. No exemplo de quatro canais descritos acima, o bloco 825 pode envolver inverter uma polaridade dos dados filtrados de primeiro canal em relação aos dados filtrados de segundo canal e inverter uma polaridade dos dados filtrados de terceiro canal em relação aos dados filtrados de quarto canal.
[00299] No exemplo mostrado na Figura 8C, os sinais de descorre- lação 227, que também são denotados como y, são recebidos pelo módulo de inversão de polaridade 840. O módulo de inversão de polaridade 840 é configurado para inverter a polaridade de sinais de des- correlação para canais adjacentes. Nesse exemplo, o módulo de inversão de polaridade 840 é configurado para inverter a polaridade dos sinais de descorrelação para o canal direito e o canal surround es-querdo. No entanto, em outras implantações, o módulo de inversão de polaridade 840 pode ser configurado para inverter a polaridade de sinais de descorrelação para outros canais. Por exemplo, o módulo de inversão de polaridade 840 pode ser configurado para inverter a polaridade dos sinais de descorrelação para o canal esquerdo e o canal surround direito. Outras implantações podem envolver inverter a polaridade de sinais de descorrelação para ainda outros canais, dependendo do número de canais envolvido e suas relações espaciais.
[00300] O módulo de inversão de polaridade 840 fornece os sinais de descorrelação 227, que inclui os sinais de descorrelação com inversão de canal 227, para os mixadores específicos a canal 215a a 215d. Os mixadores específicos a canal 215a a 215d também recebem dados de áudio não filtrados diretos 210 do canal de acoplamento e informações de parâmetros espaciais específicas a canal de emissão 630a a 630d. Alternativa ou adicionalmente, em algumas implantações, os mixadores específicos a canal 215a a 215d podem receber os coeficientes de mixagem modificados 890 que são descritos abaixo com referência à Figura 8F. Nesse exemplo, as informações de parâmetros espaciais específicas a canal de emissão 630a a 630d foi modificado de acordo com dados transitórios, por exemplo, de acordo com a inserção a partir de um módulo de controle transitório como aquele retratado na Figura 6C. Os exemplos de modificação de parâmetros espaciais de acordo com os dados transitórios são fornecidos abaixo.
[00301] Nessa implantação, os mixadores específicos a canal 215a a 215d misturam os sinais de descorrelação 227 com os dados de áudio diretos 210 do canal de acoplamento de acordo com as informações de parâmetros espaciais específicas a canal de emissão 630a a 630d e emitem os dados de áudio mixados específicos a canal de emissão resultantes 845a a 845d para os módulos de controle de ganho 850a a 850d. Nesse exemplo, os módulos de controle de ganho 850a a 850d são configurados para aplicar ganhos específicos a canal de emissão, também referidos no presente documento como fatores de escala, aos dados de áudio mixados específicos a canal de emissão 845a a 845d.
[00302] Um método de troca de sinal alternativo será descrito, agora, com referência à Figura 8D. Nesse exemplo, os filtros de descorre- lação específicos a canal, com base, pelo menos em parte, nas informações de controle de descorrelação específicas a canal 847a a 847d, são aplicados pelos geradores de sinal de descorrelação 218a a 218d aos dados de áudio 210a a 210d. Em algumas implantações, as informações de controle de gerador de sinal de descorrelação 847a a 847d podem ser recebidas em um fluxo de bits juntamente com os dados de áudio, enquanto em outras implantações, as informações de controle de gerador de sinal de descorrelação 847a a 847d podem ser geradas localmente (pelo menos em parte), por exemplo, pelo módulo de controle de filtro de descorrelação 405. No presente documento, os geradores de sinal de descorrelação 218a a 218d também podem gerar os filtros de descorrelação específicos a canal de acordo com as informações de coeficiente de filtro de descorrelação recebidas do módulo de controle de filtro de descorrelação 405. Em algumas implantações, uma descrição de um único filtro pode ser gerada pelo módulo de controle de filtro de descorrelação 405, que é compartilhado por todos os canais.
[00303] Nesse exemplo, um ganho/fator de escala específico a canal foi aplicado aos dados de áudio 210a a 210d antes de os dados de áudio 210a a 210d serem recebidos pelos geradores de sinal de des- correlação 218a a 218d. Por exemplo, se os dados de áudio tiverem sido codificados de acordo com os codecs de áudio AC-3 ou E-AC-3, os fatores de escala podem ser coordenadas de acoplamento ou "cpl- coords" que são codificadas com o resto dos dados de áudio e recebidas em um fluxo de bits por um sistema de processamento de áudio como um dispositivo de codificação. Em algumas implantações, as cplcoords também podem ser a base para os fatores de escala específicos a canal de emissão aplicados pelos módulos de controle de ga- nho 850a a 850d aos dados de áudio mixados específicos a canal de emissão 845a a 845d (consulte Figura 8C).
[00304] Dessa maneira, os geradores de sinal de descorrelação 218a a 218d emitem sinais de descorrelação específicos a canal 227a a 227d para todos os canais que serão descorrelacionados. Os sinais de descorrelação 227a a 227d também são referidos como yL, yR, yLS e yRS, respectivamente, na Figura 8D.
[00305] Os sinais de descorrelação 227a a 227d são recebidos pelo módulo de inversão de polaridade 840. O módulo de inversão de polaridade 840 é configurado para inverter a polaridade de sinais de des- correlação para canais adjacentes. Nesse exemplo, o módulo de inversão de polaridade 840 é configurado para inverter a polaridade dos sinais de descorrelação para o canal direito e o canal surround esquerdo. No entanto, em outras implantações, o módulo de inversão de polaridade 840 pode ser configurado para inverter a polaridade de sinais de descorrelação para outros canais. Por exemplo, o módulo de inversão de polaridade 840 pode ser configurado para inverter a polaridade dos sinais de descorrelação para os canais surround esquerdo e direito. Outras implantações podem envolver inverter a polaridade de sinais de descorrelação para ainda outros canais, dependendo do número de canais envolvido e suas relações espaciais.
[00306] O módulo de inversão de polaridade 840 fornece os sinais de descorrelação 227a a 227d, que inclui os sinais de descorrelação com inversão de canal 227b e 227c, para os mixadores específicos a canal 215a a 215d. No presente documento, os mixadores específicos a canal 215a a 215d também recebem dados de áudio diretos 210a a 210d e informações de parâmetros espaciais específicas a canal de emissão 630a a 630d. Nesse exemplo, as informações de parâmetros espaciais específicas a canal de emissão 630a a 630d foram modificadas de acordo com os dados transitórios.
[00307] Nessa implantação, os mixadores específicos a canal 215a a 215d mixam os sinais de descorrelação 227 com os dados de áudio diretos 210a a 210d de acordo com as informações de parâmetros espaciais específicas a canal de emissão 630a a 630d e emitem os dados de áudio mixados específicos a canal de emissão 845a a 845d.
[00308] Os métodos alternativos para restaurar a relação espacial entre os canais de inserção discretos são fornecidos no presente documento. Os métodos podem envolver determinar sistematicamente coeficientes de sintetização para determinar como os sinais de descor- relação ou de reverberação serão sintetizados. De acordo com alguns métodos, as IDCs ideais são determinadas a partir de alfas e ICCs alvo. Tais métodos podem envolver sintetizar sistematicamente um conjunto de sinais de descorrelação específicos a canal de acordo com as IDCs que são determinadas para serem ideais.
[00309] Uma visão geral de alguns tais métodos sistemáticos será descrita agora com referência às Figuras 8E e 8F. Mais detalhes, que incluem as fórmulas matemáticas fundamentais de alguns exemplos, serão descritos doravante.
[00310] A Figura 8E é um diagrama de fluxo que ilustra blocos de um método de determinação de coeficientes de sintetização e coeficientes de mixagem a partir de dados de parâmetro espacial. A Figura 8F é um diagrama de blocos que mostra exemplos de componentes de mixador. Nesse exemplo, o método 851 começa após os blocos 802 e 804 da Figura 8A. Dessa maneira, os blocos mostrados na Figura 8E podem ser considerados exemplos adicionais do bloco de "determina-ção" 806 e do bloco de "aplicação" 808 da Figura 8A. Portanto, os blocos 855 a 865 da Figura 8E são identificados como "806b" e os blocos 820 e 870 são identificados como "808b".
[00311] No entanto, nesse exemplo, os processos de descorrelação determinados no bloco 806 podem envolver realizar operações nos dados de áudio filtrados de acordo com os coeficientes de sintetização. Alguns exemplos são fornecidos abaixo.
[00312] O bloco opcional 855 pode envolver converter a partir de uma forma de parâmetros espaciais em uma representação equivalente. Com referência à Figura 8F, por exemplo, o módulo de geração de coeficiente de mixagem e de sintetização 880 pode receber informações de parâmetros espaciais 630b, que incluem relações espaciais de descrição entre canais de inserção N ou um subconjunto dessas relações espaciais. O módulo 880 pode ser configurado para converter pelo menos algumas das informações de parâmetros espaciais 630b de uma forma de parâmetros espaciais em uma representação equivalente. Por exemplo, os alfas podem ser convertidos em ICCs ou vice- versa.
[00313] Nas implantações alternativas de sistema de processamento de áudio, pelo menos alguma funcionalidade do módulo de geração de coeficiente de mixagem e de sintetização 880 pode ser realizada pelos elementos além do mixador 215. Por exemplo, em algumas implantações alternativas, pelo menos alguma funcionalidade do módulo de geração de coeficiente de mixagem e de sintetização 880 pode ser realizada por um receptor/gerador de informações de controle 640 tal como mostrado na Figura 6C e descrito acima.
[00314] Nessa implantação, o bloco 860 envolve determinar uma relação espacial desejada entre canais de emissão em termos de uma representação de parâmetros espaciais. Conforme mostrado na Figura 8F, em algumas implantações, o módulo de geração de coeficiente de mixagem e de sintetização 880 pode receber as informações de downmix/upmix 635, que podem incluir informações que correspondem às informações de mixagem 266 recebidas pelo upmi- xer/downmixer de N a M 262 e/ou às informações de mixagem 268 recebidas pelo upmixer/downmixer de M a K 264 da Figura 2E. O mó- dulo de geração de coeficiente de mixagem e de sintetização 880 também pode receber informações de parâmetros espaciais 630a, que incluem relações espaciais de descrição entre canais de emissão K ou um subconjunto dessas relações espaciais. Conforme descrito acima com referência à Figura 2E, o número de canais de inserção pode ser ou não igual ao número de canais de emissão. O módulo 880 pode ser configurado para calcular uma relação espacial desejado (por exemplo, uma ICC) entre pelo menos alguns pares dos canais de emissão K.
[00315] Nesse exemplo, o bloco 865 envolve determinar coeficientes de sintetização com base nas relações espaciais. Os coeficientes de mixagem também podem ser determinados com base, pelo menos em parte, nas relações espaciais desejadas. Com referência à Figura 8F, no bloco 865 o módulo de geração de coeficiente de mixagem e de sintetização 880 pode determinar os parâmetros de sintetização de sinal de descorrelação 615 de acordo com as relações espaciais desejadas entre canais de emissão. O módulo de geração de coeficiente de mixagem e de sintetização 880 também pode determinar os coeficientes de mixagem 620 de acordo com as relações espaciais desejadas entre canais de emissão.
[00316] O módulo de geração de coeficiente de mixagem e de sintetização 880 pode fornecer os parâmetros de sintetização de sinal de descorrelação 615 para o sintetizador 605. Em algumas implantações, os parâmetros de sintetização de sinal de descorrelação 615 podem ser específicos a canal de emissão. Nesse exemplo, o sintetizador 605 também recebe os sinais de descorrelação 227, que podem ser produzidos por um gerador de sinal de descorrelação 218 como aqueles mostrados na Figura 6A.
[00317] Nesse exemplo, o bloco 820 pode aplicar um ou mais filtros de descorrelação a pelo menos uma porção dos dados de áudio rece- bidos, para produzir dados de áudio filtrados. Os dados de áudio filtrados podem, por exemplo, corresponder aos sinais de descorrelação 227 produzidos pelo gerador de sinal de descorrelação 218, conforme descrito acima com referência às Figuras 2E e 4.
[00318] O bloco 870 pode envolver sintetizar sinais de descorrela- ção de acordo com os coeficientes de sintetização. Em algumas implantações, o bloco 870 pode envolver sintetizar sinais de descorrela- ção desempenhando-se operações nos dados de áudio filtrados produzidos no bloco 820. Como tal, os sinais de descorrelação sintetizados podem ser considerados uma versão modificada dos dados de áudio filtrados. No exemplo mostrado na Figura 8F, o sintetizador 605 pode ser configurado para realizar operações nos sinais de descorre- lação 227 de acordo com os parâmetros de sintetização de sinal de descorrelação 615 e para emitir os sinais de descorrelação sintetizados 886 para o mixador de sinal direito e de sinal de descorrelação 610. No presente documento, os sinais de descorrelação sintetizados 886 são sinais de descorrelação sintetizados específicos a canal. Em algumas tais implantações, o bloco 870 pode envolver multiplicar os sinais de descorrelação sintetizados específicos a canal com fatores de escala adequados para cada canal para produzir os sinais de des- correlação sintetizados específicos a canal 886 em escala. Nesse exemplo, o sintetizador 605 faz combinações lineares dos sinais de descorrelação 227 de acordo com os parâmetros de sintetização de sinal de descorrelação 615.
[00319] O módulo de geração de coeficiente de mixagem e de sintetização 880 pode fornecer os coeficientes de mixagem 620 para um módulo de controle transitório de mixador 888. Nessa implantação, os coeficientes de mixagem 620 são coeficientes de mixagem específicos a canal de emissão. O mixador módulo de controle transitório 888 pode receber informações de controle transitórias 430. As informações de controle transitórias 430 podem ser recebidas juntamente com os dados de áudio ou podem ser determinadas localmente, por exemplo, por um módulo de controle transitório como o módulo de controle transitório 655 mostrado na Figura 6C. O mixador módulo de controle transitório 888 pode produzir coeficientes de mixagem modificados 890, com base pelo menos em parte nas informações de controle transitórias 430 e pode fornecer os coeficientes de mixagem modificados 890 para o mixador de sinal direito e de sinal de descorrelação 610.
[00320] O mixador de sinal direito e de sinal de descorrelação 610 pode mixar os sinais de descorrelação sintetizados 886 com os dados de áudio não filtrados diretos 220. Nesse exemplo, os dados de áudio 220 incluem elementos de dados de áudio que correspondem aos canais de inserção N. O mixador de sinal direito e de sinal de descorrela- ção 610 mixa os elementos de dados de áudio e os sinais de descorre- lação sintetizados específicos a canal 886 em uma base específica a canal de emissão e emite dados de áudio descorrelacionados 230 para canais de emissão N ou M, dependendo da implantação específica (consulte, por exemplo, a Figura 2E e a descrição correspondente).
[00321] A seguir estão os exemplos detalhados de alguns dos processos do método 851. Embora esses métodos sejam descritos, pelo menos em parte, com referência aos recursos do codecs de áudio AC- 3 e E-AC-3, os métodos têm ampla aplicabilidade aos muitos outros codecs de áudio.
[00322] O objetivo de alguns tais métodos é reproduzir todas as ICCs (ou um conjunto selecionado de ICCs) com precisão, a fim de restaurar as características espaciais da fonte de dados de áudio que pode ter sido perdida devido ao acoplamento de canal. A funcionalidade de um mixador pode ser formulada conforme:
Figure img0002
[00323] Na Equação 1, x representa um sinal de canal de acopla- mento, αi representa os parâmetros espaciais alfa para o canal I, gi representa o "cplcoord" (que corresponde a um fator de escala) para o canal I, yi representa o sinal descorrelacionado e Di(x) representa o sinal de descorrelação gerado a partir do filtro de descorrelação Di. É desejável que a emissão do filtro de descorrelação tenha a mesma distribuição de potência espectral que os dados de áudio de inserção, mas seja não correlacionado aos dados de áudio de inserção. De acordo com os codecs de áudio AC-3 e E-AC-3, os cplcoords e alfas são para cada banda de frequência de canal de acoplamento, enquanto os sinais e os filtro são para cada intervalo de frequência. Também, as amostras dos sinais correspondem aos blocos dos coeficientes de banco de filtros. Esses índices de tempo e de frequência são omitidos no presente documento por questão de simplicidade.
[00324] Os valores alfas representam a correlação entre canais distintos dos dados de áudio fonte e o canal de acoplamento, que podem ser expressos conforme segue:
Figure img0003
[00325] Na Equação 2, E representa o valor de expectativa do(s) termo(s) nas chaves, x* representa o conjugado complexo de x e si representa um sinal discreto para o canal I.
[00326] A coerência entre canais ou ICC entre um par de sinais descorrelacionados pode ser derivada conforme segue:
Figure img0004
[00327] Na Equação 3, IDCi1,i2 representa a coerência de sinal entre descorrelações ("IDC") entre Di1(x) e Di2(x). Com alfas fixos, a ICC é maximizada quando IDC é +1 e minimizada quando IDC é -1. Quando a ICC dos dados de áudio de fonte é conhecida, a IDC ideal necessária para replicar os mesmos pode ser solucionada da seguinte forma:
Figure img0005
[00328] A ICC entre os sinais descorrelacionados pode ser controlada selecionando-se sinais de descorrelação que satisfaçam as condições de IDC ideais da Equação 4. Alguns métodos para gerar tais sinais de descorrelação serão discutidos abaixo. Antes dessa discussão, pode ser útil descrever as relações entre alguns desses parâmetros espaciais, particularmente aquela entre ICCs e alfas.
[00329] Conforme observado acima com referência ao bloco 855 opcional do método 851, algumas implantações fornecidas no presente documento podem envolver converter a partir de um tipo de parâmetros espaciais em uma representação equivalente. Em algumas de tais implantações, o bloco 855 opcional pode envolver converter a partir de alfas em ICCs ou vice-versa. Por exemplo, alfas podem ser determinados de modo inequívoco se tanto as cplcoords (ou fatores de escalonamento comparáveis) quanto as ICCs forem conhecidas.
[00330] Um canal de acoplamento pode ser gerado da seguinte forma:
Figure img0006
[00331] Na Equação 5, si representa o sinal discreto para o canal i envolvido no acoplamento, e gx representa um ajuste de ganho arbitrário aplicado em x. Substituindo-se o termo x da Equação 2 pela ex- pressão equivalente da Equação 5, um alfa para o canal i pode ser ex- pressado da seguinte forma:
Figure img0007
[00332] A potência de cada canal discreto pode ser representada pela potência do canal de acoplamento e pela potência da cplcoord correspondente da seguinte forma:
Figure img0008
[00333] Os termos de correlação cruzada podem ser substituídos da seguinte forma:
Figure img0009
[00334] Portanto, os alfas podem ser expressados desta maneira:
Figure img0010
[00335] Com base na Equação 5, a potência de x pode ser expres- sada da seguinte forma:
Figure img0011
[00336] Portanto, o ajuste de ganho gx pode ser expressado da seguinte forma:
Figure img0012
[00337] Consequentemente, se todas as cplcoords e ICCs forem conhecidas, os alfas podem ser computados de acordo com a seguinte expressão:
Figure img0013
[00338] Conforme observado acima, a ICC entre sinais descorrela- cionados pode ser controlada selecionando-se sinais de descorrelação que satisfaçam a Equação 4. No caso de estéreo, pode ser formado um único filtro de descorrelação que gere sinais de descorrelação não correlacionados ao sinal de canal de acoplamento. A IDC ideal de -1 pode ser alcançada realizando-se simplesmente inversão de sinal, por exemplo, de acordo com um dos métodos de inversão de sinal descritos acima.
[00339] No entanto, a tarefa de controlar as ICCs para casos de multicanal é mais complexa. Além de garantir que todos sinais de des- correlação sejam substancialmente não correlacionados ao canal de acoplamento, as IDCs dentre os sinais de descorrelação também devem satisfazer a Equação 4.
[00340] De forma a gerar sinais de descorrelação com as IDCs desejadas, pode ser primeiro gerado um conjunto de sinais de descorre- lação de "semente" mutuamente não correlacionados. Por exemplo, os sinais de descorrelação 227 podem ser gerados de acordo com os métodos descritos em outra parte do presente documento. Subsequentemente, os sinais de descorrelação desejados podem ser sintetizados combinando-se de forma linear essas sementes com pesos adequados. Uma visão geral de alguns exemplos é descrita acima com referência às Figuras 8E e 8F.
[00341] Pode ser desafiador gerar muitos sinais de descorrelação de alta qualidade e mutuamente não correlacionados (por exemplo, ortogonais) a partir de uma downmix. Ademais, calcular os pesos de combinação adequados pode envolver inversão de matriz, o que pode representar desafios em termos de complexidade e estabilidade.
[00342] Consequentemente, em alguns exemplos fornecidos no presente documento, um processo de "ancoragem e expansão" pode ser implantado. Em algumas implantações, algumas IDCs (e ICCs) podem ser mais significativas do que outras. Por exemplo, ICCs laterais podem ser perceptivelmente mais importantes do que ICCs diagonais. Em um exemplo de canal Dolby 5.1, as ICCs para os pares de canais L-R, L-Ls, R-Rs e Ls-Rs podem ser perceptivelmente mais importantes do que as ICCs para os pares de canais L-Rs e R-Ls. Os canais frontais podem ser perceptivelmente mais importantes do que os canais posterior ou surround.
[00343] Em alguma de tais implantações, os termos da Equação 4 para a IDC mais importante podem ser primeiro satisfeitos combinando-se dois sinais de descorrelação ortogonais (semente) para sintetizar os sinais de descorrelação para os dois canais envolvidos. Então, usando esses sinais de descorrelação sintetizados como âncoras e adicionando novas sementes, os termos da Equação 4 para as IDCs secundárias podem ser satisfeitos, e os sinais de descorrelação correspondentes podem ser sintetizados. Esse processo pode ser repetido até que os termos da Equação 4 sejam satisfeitos para todas as IDCs. Tais implantações permitem o uso de sinais de descorrelação de qualidade mais alta para controlar ICCs relativamente mais críticas.
[00344] A Figura 9 é um fluxograma que delineia um processo para sintetizar sinais de descorrelação em casos de multicanal. Os blocos do método 900 podem ser considerados como exemplos adicionais do processo de "determinação" do bloco 806 da Figura 8A e do processo de "aplicação" do bloco 808 da Figura 8A. Consequentemente, na Figura 9, os blocos 905 a 915 são identificados como "806c", e os blocos 920 e 925 do método 900 são identificados como "808c". O método 900 fornece um exemplo em um contexto de canal 5.1. No entanto, o método 900 tem uma ampla aplicabilidade a outros contextos.
[00345] Nesse exemplo, os blocos 905 a 915 envolvem calcular parâmetros de síntese a serem aplicados a um conjunto de sinais de descorrelação de semente mutuamente não correlacionados, Dni(x), que são gerados no bloco 920. Em algumas implantações de canal 5.1, i ={1, 2, 3, 4}. Se o canal central for descorrelacionado, um quinto sinal de descorrelação de semente pode ser envolvido. Em algumas implantações, sinais de descorrelação não correlacionados (ortogonais), Dni(x), podem ser gerados inserindo-se o sinal de mono downmix em vários filtros de descorrelação diferentes. Alternativamente, os si- nais com upmix iniciais podem, cada um, ser inseridos em um filtro de descorrelação exclusivo. Vários exemplos são fornecidos abaixo.
[00346] Conforme observado acima, os canais frontais podem ser perceptivelmente mais importantes do que os canais posterior ou surround. Portanto, no método 900, os sinais de descorrelação para os canais L e R são ancorados conjuntamente nas primeiras duas sementes, então os sinais de descorrelação para os canais Ls e Rs são sintetizados com o uso dessas âncoras e das sementes remanescentes.
[00347] Nesse exemplo, o bloco 905 envolve calcular parâmetros de síntese p e pr para os canais frontais L e R. Aqui, p e pr são derivados a partir da IDC de L-R como:
Figure img0014
[00348] Portanto, o bloco 905 também envolve calcular a IDC de LR da Equação 4. Consequentemente, nesse exemplo, informações de ICC são usadas para calcular a IDC de L-R. Outros processos do método também podem usar valores de ICC como inserção. Os valores de ICC podem ser obtidos a partir do fluxo de bits codificado ou por estimativa no lado do decodificador, por exemplo, com base em bandas desacopladas de frequência mais baixa ou de frequência mais alta, cplcoords, alfas, etc.
[00349] Os parâmetros de síntese p e pr podem ser usados para sintetizar os sinais de descorrelação para os canais L e R no bloco 925. Os sinais de descorrelação para os canais Ls e Rs podem ser sintetizados usando os sinais de descorrelação para os canais L e R como âncoras.
[00350] Em algumas implantações, pode ser desejável controlar a ICC de Ls-Rs. De acordo com método 900, sintetizar os sinais de des- correlação intermediários D'Ls(x) e D'Rs(x) com dois dos sinais de des- correlação de semente envolve calcular os parâmetros de síntese o e Or. Portanto, o bloco 910 opcional envolve calcular os parâmetros de síntese o e or para os canais surround. Pode-se derivar que o coeficiente de correlação exigido entre os sinais de descorrelação intermediários D'Ls(x) e D'Rs(x) pode ser expressado da seguinte forma:
Figure img0015
[00351] As variáveis o e or podem ser derivadas a partir de seu coe- ficiente de correlação:
Figure img0016
[00352] Portanto, D'Ls(x) e D'Rs(x) podem ser definidos como:
Figure img0017
[00353] No entanto, se a ICC de Ls-Rs não for uma preocupação, o coeficiente de correlação entre D'Ls(x) e D'Rs(x) pode ser estabelecido como -1. Consequentemente, os dois sinais podem simplesmente ser versões de sinal invertido um do outro construídas pelos sinais de descorrelação de semente remanescentes.
[00354] O canal central pode ou não ser descorrelacionado, dependendo da implantação específica. Consequentemente, o processo do bloco 915 para calcular parâmetros de síntese t1 e t2 para o canal central é opcional. Os parâmetros de síntese para o canal central podem ser calculados, por exemplo, se controlar as ICCs de L-C e R-C for desejável. Se for esse o caso, uma quinta semente, Dn5(x) pode ser adicionada, e o sinal de descorrelação para o canal C pode ser expressado da seguinte forma:
Figure img0018
[00355] De forma a alcançar as ICCs de L-C e R-C desejadas, a Equação 4 deve ser satisfeita para as IDCs de L-C e R-C:
Figure img0019
[00356] Os asteriscos indicam conjugados complexos. Consequentemente, os parâmetros de síntese t1 e t2 para o canal central podem ser expressados da seguinte forma:
Figure img0020
[00357] No bloco 920, um conjunto de sinais de descorrelação de semente mutuamente não correlacionados, Dni(x), i ={1, 2, 3, 4}, pode ser gerado. Se o canal central for descorrelacionado, um quinto sinal de descorrelação de semente pode ser gerado no bloco 920. Esses sinais de descorrelação não correlacionados (ortogonais), Dni(x) podem ser gerados inserindo-se o sinal de mono downmix em vários filtros de descorrelação diferentes.
[00358] Nesse exemplo, o bloco 925 envolve aplicar os termos acima derivados para sintetizar sinais de descorrelação, da seguinte forma:
Figure img0021
[00359] Nesse exemplo, as equações para sintetizar sinais de des- correlação para os canais Ls e Rs (DLs(x) e DRs(x)) são dependentes das equações para sintetizar os sinais de descorrelação para os canais L e R (DL(x) e DR(x)). No método 900, os sinais de descorrelação para os canais L e R são ancorados conjuntamente para mitigar potencial viés de esquerda-direita devido a sinais de descorrelação imperfeitos.
[00360] No exemplo acima, os sinais de descorrelação de semente são gerados a partir do sinal de mono downmix x no bloco 920. Alternativamente, os sinais de descorrelação de semente podem ser gerados inserindo-se cada sinal com upmix inicial em um filtro de descorre- lação exclusivo. Nesse caso, os sinais de descorrelação de semente gerados seriam específicos a canal: Dni(gix), i ={L, R, Ls, Rs, C}. Esses sinais específicos a canal de descorrelação de semente teriam, em geral, diferentes níveis de potência devido ao processo de upmix. Consequentemente, é desejável alinhar o nível de potência dentre essas sementes ao combinar as mesmas. Para alcançar isso, as equações de síntese para o bloco 925 podem ser modificadas da seguinte forma:
Figure img0022
[00361] Nas equações de síntese modificadas, todos os parâmetros de síntese permanecem iguais. No entanto, os parâmetros de ajuste de nível Á, são exigidos para alinhar o nível de potência durante o uso de um sinal de descorrelação de semente gerado a partir do canal j para sintetizar o sinal de descorrelação para o canal i. Esses parâmetros de ajuste de nível específicos a par de canais podem ser computados com base nas diferenças de nível de canal estimadas, tais como:
Figure img0023
[00362] Ademais, visto que os fatores de escalonamento específicos a canal já estão incorporados aos sinais de descorrelação sintetizados nesse caso, a equação de mixador do bloco 812 (Figura 8A) deve ser modificada a partir da Equação 1 como:
Figure img0024
[00363] Conforme observado em outra parte do presente documento, em algumas implantações, parâmetros espaciais podem ser recebidos juntamente com dados de áudio. Os parâmetros espaciais podem, por exemplo, ter sido codificados com os dados de áudio. Os parâmetros espaciais e dados de áudio codificados podem ser recebidos em um fluxo de bits por um sistema de processamento de áudio, tal como um decodificador, por exemplo, conforme descrito acima com referência à Figura 2D. Nesse exemplo, os parâmetros espaciais são recebidos pelo descorrelacionador 205 através de informações de descorre- lação explícitas 240.
[00364] No entanto, em implantações alternativas, nenhum parâmetro espacial (ou um conjunto de parâmetros espaciais incompleto) é recebido pelo descorrelacionador 205. De acordo com algumas de tais implantações, o receptor/gerador de informações de controle 640, descrito acima com referência às Figuras 6B e 6C (ou outro elemento de um sistema de processamento de áudio 200), pode ser configurado para estimar os parâmetros espaciais com base em um ou mais atributos dos dados de áudio. Em algumas implantações, o receptor/gerador de informações de controle 640 pode incluir um módulo de parâmetro espacial 665 que é configurado para a estimativa de parâmetro espacial e a funcionalidade relacionada descritas no presente documento. Por exemplo, o módulo de parâmetro espacial 665 pode estimar parâmetros espaciais para frequências em uma faixa de frequência de canal de acoplamento com base em características de dados de áudio fora da faixa de frequência de canal de acoplamento. Algumas de tais implantações serão agora descritas com referência às Figuras 10A em seguida.
[00365] A Figura 10A é um fluxograma que fornece uma visão geral de um método para estimar parâmetros espaciais. No bloco 1005, dados de áudio que incluem um primeiro conjunto de coeficientes de frequência e um segundo conjunto de coeficientes de frequência são recebidos por um sistema de processamento de áudio. Por exemplo, o primeiro e o segundo conjuntos de coeficientes de frequência podem ser resultados de aplicação de uma transformação de seno discreto modificado, uma transformação de cosseno discreto modificado ou uma transformação ortogonal sobreposta a dados de áudio em um domínio de tempo. Em algumas implantações, os dados de áudio podem ter sido codificados de acordo com um processo de codificação herdada. Por exemplo, o processo de codificação herdada pode ser um processo do codec de áudio AC-3 ou do codec de áudio AC-3 avançado. Consequentemente, em algumas implantações, o primeiro e o segundo conjuntos de coeficientes de frequência podem ser coeficientes de frequência de valor real. No entanto, o método 1000 não é limitado em sua aplicação a esses codecs, mas é amplamente aplicável a muitos codecs de áudio.
[00366] O primeiro conjunto de coeficientes de frequência pode cor-responder a uma primeira faixa de frequência, e o segundo conjunto de coeficientes de frequência pode corresponder a uma segunda faixa de frequência. Por exemplo, a primeira faixa de frequência pode corresponder a uma faixa de frequência de canal individual, e a segunda faixa de frequência pode corresponder a uma faixa de frequência de canal de acoplamento recebida. Em algumas implantações, a primeira faixa de frequência pode ficar abaixo da segunda faixa de frequência. No entanto, em implantações alternativas, a primeira faixa de frequência pode ficar acima da segunda faixa de frequência.
[00367] Em referência à Figura 2D, em algumas implantações, o primeiro conjunto de coeficientes de frequência pode corresponder aos dados de áudio 245a ou 245b, que incluem representações de domínio de frequência de dados de áudio fora de uma faixa de frequência de canal de acoplamento. Os dados de áudio 245a e 245b não são des- correlacionados nesse exemplo, mas podem, ainda assim, ser usados como inserção para estimativas de parâmetro espacial realizadas pelo descorrelacionador 205. O segundo conjunto de coeficientes de frequência pode corresponder aos dados de áudio 210 ou 220, que incluem representações de domínio de frequência correspondentes a um canal de acoplamento. No entanto, diferentemente do exemplo da Figura 2D, o método 1000 pode não envolver a recepção de dados de parâmetro espacial juntamente com os coeficientes de frequência do canal de acoplamento.
[00368] No bloco 1010, os parâmetros espaciais para pelo menos parte do segundo conjunto de coeficientes de frequência são estimados. Em algumas implantações, a estimativa baseia-se em um ou mais aspectos da teoria de estimativa. Por exemplo, o processo de estimativa pode se basear, pelo menos em parte, em um método de máxima verossimilhança, em um estimador de Bayes, em um estimador de método de momentos, em um estimador de erro quadrado médio mínimo e/ou em um estimador não tendencioso de variância mínima.
[00369] Algumas de tais implantações podem envolver estimar as funções de densidade de probabilidade ("PDFs") conjuntas dos parâmetros espaciais das frequências mais baixas e das frequências mais altas. Por exemplo, digamos que existem dois canais L e R e que, em cada canal, tem-se uma banda baixa na faixa de frequência de canal individual e uma banda alta na faixa de frequência de canal de acoplamento. Teremos, então, uma ICC_lo que representa a coerência entre canais entre os canais L e R na faixa de frequência de canal in dividual, e uma ICC_hi que existe na faixa de frequência de canal de acoplamento.
[00370] Se tiver um grande conjunto de treinamento de sinais de áudio, pode-se segmentar os mesmos e, em cada segmento, ICC_lo e ICC_hi podem ser calculadas. Assim, pode-se ter um grande conjunto de treinamento de pares de ICC (ICC_lo, ICC_hi). Uma PDF conjunta desse par de parâmetros pode ser calculada como histogramas e/ou modelada através de modelos de parâmetro (por exemplo, Modelos de Misturas de Gaussianas). Esse modelo pode ser um modelo invariante no tempo que é conhecido no decodificador. Alternativamente, os parâmetros do modelo podem ser regularmente enviados ao decodifica- dor através do fluxo de bits.
[00371] No decodificador, a ICC_lo de um segmento particular dos dados de áudio recebidos pode ser calculada, por exemplo, de acordo com como os coeficientes de correlação cruzada entre canais individuais e o canal de acoplamento composto são calculados conforme descrito no presente documento. Considerando esse valor da ICC_lo e o modelo da PDF conjunta dos parâmetros, o decodificador pode tentar estimar o que a ICC_hi é. Tal estimativa é a estimativa de Máxima verossimilhança ("ML"), em que o decodificador pode calcular a PDF condicional da ICC_hi considerando o valor da ICC_lo. Essa PDF condicional é agora essencialmente uma função de valor real positivo que pode ser representada em um eixo geométrico x-y, sendo que o eixo geométrico x representa o contínuo dos valores de ICC-hi, e o eixo geométrico y representa a probabilidade condicional de cada tal valor. A estimativa de ML pode envolver escolher como a estimativa de ICC_hi o valor em que essa função chega ao pico. Por outro lado, a estimativa do erro quadrado médio mínimo ("MMSE") é a média dessa PDF condicional, que é outra válida estimativa de ICC_hi. A teoria de estimativa fornece muitas de tais ferramentas para se chegar a uma estimativa de ICC_hi.
[00372] O exemplo de dois parâmetros acima é um caso bem simples. Em algumas implantações, pode haver um número maior de canais assim como de bandas. Os parâmetros espaciais podem ser alfas ou ICCs. Ademais, o modelo de PDF pode ser condicionado ao tipo de sinal. Por exemplo, pode haver um modelo diferente para elementos transitórios, um modelo diferente para sinais tonais, etc.
[00373] Nesse exemplo, a estimativa do bloco 1010 se baseia pelo menos em parte no primeiro conjunto de coeficientes de frequência. Por exemplo, o primeiro conjunto de coeficientes de frequência pode incluir dados de áudio para dois ou mais canais individuais em uma primeira faixa de frequência que está fora de uma faixa de frequência de canal de acoplamento recebida. O processo de estimativa pode envolver calcular coeficientes de frequência combinados de um canal de acoplamento composto dentro da primeira faixa de frequência, com base nos coeficientes de frequência dos dois ou mais canais. O processo de estimativa também pode envolver coeficientes de correlação cruzada de computação entre os coeficientes de frequência combinados e os coeficientes de frequência dos canais individuais dentro da primeira faixa de frequência. Os resultados do processo de estimativa podem variar de acordo com as mudanças temporais de sinais de áudio de inserção.
[00374] No bloco 1015, os parâmetros espaciais estimados podem ser aplicados ao segundo conjunto de coeficientes de frequência, para gerar um segundo conjunto de coeficientes de frequência modificado. Em algumas implantações, o processo para aplicar os parâmetros espaciais estimados ao segundo conjunto de coeficientes de frequência pode ser parte de um processo de descorrelação. O processo de des- correlação pode envolver gerar um sinal de reverberação ou um sinal de descorrelação e aplicar o mesmo ao segundo conjunto de coefici- entes de frequência. Em algumas implantações, o processo de descor- relação pode envolver aplicar um algoritmo de descorrelação que opere inteiramente sobre coeficientes de valor real. O processo de descor- relação pode envolver descorrelação adaptativa a sinal ou seletiva de canais específicos e/ou bandas de frequência específicas.
[00375] Um exemplo mais detalhado será agora descrito com referência à Figura 10B. A Figura 10B é um fluxograma que fornece uma visão geral de um método alternativo para estimar parâmetros espaciais. O método 1020 pode ser realizado por um sistema de processamento de áudio, tal como um decodificador. Por exemplo, o método 1020 pode ser realizado, pelo menos em parte, por um recep- tor/gerador de informações de controle 640, tal como o ilustrado na Figura 6C.
[00376] Nesse exemplo, o primeiro conjunto de coeficientes de frequência está em uma faixa de frequência de canal individual. O segundo conjunto de coeficientes de frequência corresponde a um canal de acoplamento que é recebido por um sistema de processamento de áudio. O segundo conjunto de coeficientes de frequência está em uma faixa de frequência de canal de acoplamento recebida, que fica acima da faixa de frequência de canal individual nesse exemplo.
[00377] Consequentemente, o bloco 1022 envolve receber dados de áudio dos canais individuais e do canal de acoplamento recebido. Em algumas implantações, os dados de áudio podem ter sido codificados de acordo com um processo de codificação herdada. Aplicar parâmetros espaciais que são estimados de acordo com o método 1000 ou o método 1020 a dados de áudio do canal de acoplamento recebido pode render uma reprodução de áudio mais espacialmente precisa do que aquela obtida decodificando-se os dados de áudio recebidos de acordo com um processo de decodificação herdado que corresponde ao processo de codificação herdada. Em algumas implantações, o processo de codificação herdada pode ser um processo do codec de áudio AC-3 ou do codec de áudio AC-3 avançado. Consequentemente, em algumas implantações, o bloco 1022 pode envolver receber coeficientes de frequência de valor real, mas não coeficientes de frequência que tenham valores imaginários. No entanto, o método 1020 não é limitado a esses codecs, mas é amplamente aplicável a muitos codecs de áudio.
[00378] No bloco 1025 do método 1020, pelo menos uma porção da faixa de frequência de canal individual é dividida em uma pluralidade de bandas de frequência. Por exemplo, a faixa de frequência de canal individual pode ser dividida em 2, 3, 4 ou mais bandas de frequência. Em algumas implantações, cada uma dentre as bandas de frequência pode incluir um número predeterminado de coeficientes de frequência consecutivos, por exemplo, 6, 8, 10, 12 ou mais coeficientes de frequência consecutivos. Em algumas implantações, somente parte da faixa de frequência de canal individual pode ser dividida em bandas de frequência. Por exemplo, algumas implantações podem envolver dividir somente uma porção de frequência mais alta da faixa de frequência de canal individual (relativamente mais perto da faixa de frequência de canal acoplado recebida) em bandas de frequência. De acordo com alguns exemplos baseados em E-AC-3, uma porção de frequência mais alta da faixa de frequência de canal individual pode ser dividida em 2 ou 3 bandas, sendo que cada uma das quais inclui 12 coeficientes de MDCT. De acordo com algumas de tais implantações, somente aquela porção da faixa de frequência de canal individual que estiver acima de 1 kHz, acima de 1,5 kHz, etc. pode ser dividida em bandas de frequência.
[00379] Nesse exemplo, o bloco 1030 envolve computar a energia nas bandas de frequência de canal individual. Nesse exemplo, se um canal individual tiver sido excluído do acoplamento, então a energia de banda do canal excluído não será computada no bloco 1030. Em algumas implantações, os valores de energia computados no bloco 1030 podem ser suavizados.
[00380] Nessa implantação, um canal de acoplamento composto, com base nos dados de áudio dos canais individuais na faixa de frequência de canal individual, é criado no bloco 1035. O bloco 1035 pode envolver calcular coeficientes de frequência para o canal de acoplamento composto, que podem ser referidos no presente documento como "coeficientes de frequência combinados". Os coeficientes de frequência combinados podem ser criados com o uso de coeficientes de frequência de dois ou mais canais na faixa de frequência de canal individual. Por exemplo, se os dados de áudio tiverem sido codificados de acordo com o codec E-AC-3, o bloco 1035 pode envolver computar um downmix local de coeficientes de MDCT abaixo da "frequência de começo de acoplamento", que é a frequência mais baixa na faixa de frequência de canal de acoplamento recebida.
[00381] A energia do canal de acoplamento composto, dentro de cada banda de frequência da faixa de frequência de canal individual, pode ser determinada no bloco 1040. Em algumas implantações, os valores de energia computados no bloco 1040 podem ser suavizados.
[00382] Nesse exemplo, o bloco 1045 envolve determinar coeficientes de correlação cruzada, que correspondem à correlação entre as bandas de frequência dos canais individuais e as bandas de frequência correspondentes do canal de acoplamento composto. Aqui, computar coeficientes de correlação cruzada no bloco 1045 também envolve computar a energia nas bandas de frequência de cada um dentre os canais individuais e a energia nas bandas de frequência correspondentes do canal de acoplamento composto. Os coeficientes de correlação cruzada podem ser normalizados. De acordo com algumas implantações, se um canal individual tiver sido excluído do acoplamento, então os coeficientes de frequência do canal excluído não serão usados na computação dos coeficientes de correlação cruzada.
[00383] O bloco 1050 envolve estimar parâmetros espaciais para cada canal que tiver sido acoplado no canal de acoplamento recebido. Nessa implantação, o bloco 1050 envolve estimar os parâmetros espaciais com base nos coeficientes de correlação cruzada. O processo de estimativa pode envolver calcular a média dos coeficientes de correlação cruzada normalizados por todas as bandas de frequência de canal individual. O processo de estimativa também pode envolver aplicar um fator de escalonamento à média dos coeficientes de correlação cruzada normalizados para obter os parâmetros espaciais estimados para os canais individuais que tenham sido acoplados no canal de acoplamento recebido. Em algumas implantações, o fator de escalonamento pode diminuir com frequência crescente.
[00384] Nesse exemplo, o bloco 1055 envolve adicionar ruído aos parâmetros espaciais estimados. O ruído pode ser adicionado para modelar a variância dos parâmetros espaciais estimados. O ruído pode ser adicionado de acordo com um conjunto de regras correspondente a uma previsão esperada do parâmetro espacial por todas as bandas de frequência. As regras podem se basear em dados empíricos. Os dados empíricos podem corresponder a observações e/ou medições derivadas de um grande conjunto de amostras de dados de áudio. Em algumas implantações, a variância do ruído adicionado pode se basear no parâmetro espacial estimado para uma banda de frequência, para um índice de banda de frequência e/ou para uma variância dos coeficientes de correlação cruzada normalizados.
[00385] Algumas implantações podem envolver receber ou determinar informações de tonalidade referentes ao primeiro ou ao segundo conjunto de coeficientes de frequência. De acordo com algumas de tais implantações, o processo do bloco 1050 e/ou 1055 pode ser varia- do de acordo com as informações de tonalidade. Por exemplo, se o receptor/gerador de informações de controle 640 da Figura 6B ou da Figura 6C determinar que os dados de áudio na faixa de frequência de canal de acoplamento são altamente tonais, o receptor/gerador de informações de controle 640 pode ser configurado para temporariamente reduzir a quantidade de ruído adicionado no bloco 1055.
[00386] Em algumas implantações, os parâmetros espaciais estimados podem ser alfas estimados para as bandas de frequência de canal de acoplamento recebido. Algumas de tais implantações podem envolver aplicar os alfas a dados de áudio correspondentes ao canal de acoplamento, por exemplo, como parte de um processo de descor- relação.
[00387] Exemplos mais detalhados do método 1020 serão agora descritos. Esses exemplos são fornecidos no contexto do codec de áudio E-AC-3. No entanto, os conceitos ilustrados por esses exemplos não são limitados ao contexto do codec de áudio E-AC-3, e são, pelo contrário, amplamente aplicáveis a muitos codecs de áudio.
[00388] Nesse exemplo, o canal de acoplamento composto é computado como uma mistura de fontes discretas:
Figure img0025
[00389] Na Equação 8, em que SDi representa o vetor linha de uma transformação MDCT decodificada de uma faixa de frequência específica (kinício..kfim) do canal i, com kfim = KCPL, sendo que o índice de intervalo corresponde à frequência de começo de acoplamento E-AC-3, a frequência mais baixa da faixa de frequência de canal de acoplamento recebida. Aqui, gx representa um termo de normalização que não impacta o processo de estimativa. Em algumas implantações, gx pode ser definido como 1.
[00390] A decisão referente ao número de intervalos analisados entre kinício e kfim pode se basear em uma troca entre restrições de com- plexidade e na precisão desejada do alfa de estimativa. Em algumas implantações, kinício pode corresponder a uma frequência em um limiar particular ou acima do mesmo (por exemplo, 1 kHz), de modo que da- dos de áudio em uma faixa de frequência que esteja relativamente mais perto da faixa de frequência de canal de acoplamento recebida sejam usados, de forma a melhorar a estimativa de valores alfa. A região de frequência (kinício ..kfim) pode ser dividida em bandas de frequência. Em algumas implantações, os coeficientes de correlação cruzada para essas bandas de frequência podem ser computados da seguinte forma:
Figure img0026
[00391] Na Equação 9, sDi (l) representa o segmento de sDi que cor- responde à banda l da faixa de frequência mais baixa, e xD (l) repre- senta o segmento correspondente de xD . Em algumas implantações, a expectativa E{} pode ser aproximada com o uso de um simples filtro de resposta a impulso de duração infinita ("IIR") de polo-zero, por exemplo, da seguinte forma:
Figure img0027
[00392] Na Equação 10, E{y}(n) representa a estimativa de E{y} com o uso de amostras até o bloco n . Nesse exemplo, cci (l) somente é computado para os canais que estão em acoplamento no bloco atual. Com o objetivo de suavizar a estimativa de potência considerando- se somente coeficientes de MDCT com base real, constatou-se que um valor de a = 0,2 era suficiente. Para transformaçãos além da MDCT, e especificamente para transformaçãos complexas, um valor maior de a pode ser usado. Em tais casos, um valor de a na faixa de 0,2<a<0,5 seria razoável. Algumas implantações de menor complexi- dade podem envolver suavização de tempo do coeficiente de correlação computado cci (l) em vez das potências e dos coeficientes de correlação cruzada. Embora não seja matematicamente equivalente a estimar o numerador e o denominador separadamente, constatou-se que tal suavização de menor complexidade fornece uma estimativa suficientemente precisa dos coeficientes de correlação cruzada. A implantação particular da função de estimativa como um filtro IIR de primeira ordem não impossibilita a implantação através de outros esquemas, tais como um baseado em um armazenamento temporário do tipo pri- meiro-a-entrar-último-a-sair ("FILO"). Em tais implantações, a amostra mais antiga no armazenamento temporário pode ser subtraída da estimativa atual E{}, enquanto a amostra mais recente pode ser adicionada à estimativa atual E{}.
[00393] Em algumas implantações, o processo de suavização leva em consideração se, no bloco anterior, os coeficientes SDi estavam em acoplamento. Por exemplo, se, no bloco anterior, o canal i não estava em acoplamento, então, no bloco atual, a pode ser definido como 1,0, visto que os coeficientes de MDCT do bloco anterior não teriam sido incluídos no canal de acoplamento. Além disso, a transformação MDCT anterior poderia ter sido codificada com o uso do modo de bloco curto E-AC-3, que valida ainda mais a definição de a como 1,0 nesse caso.
[00394] Nesse estágio, os coeficientes de correlação cruzada entre os canais individuais e um canal de acoplamento composto foram determinados. No exemplo da Figura 10B, os processos correspondentes aos blocos 1022 a 1045 foram realizados. Os processos a seguir são exemplos de estimativa de parâmetros espaciais com base nos coeficientes de correlação cruzada. Esses processos são exemplos do bloco 1050 do método 1020.
[00395] Em um exemplo, com o uso dos coeficientes de correlação cruzada para as bandas de frequência abaixo de KCPL (a frequência mais baixa da faixa de frequência de canal de acoplamento recebida), uma estimativa dos alfas a serem usados para a descorrelação dos coeficientes de MDCT acima de KCPL pode ser gerada. O pseudocódigo para computar os alfas estimados a partir dos cci(l) valores de acordo com tal implantação é da seguinte forma: para (reg = 0; reg < numRegions; reg ++) { para (chan = 0; chan < numChans; chan ++) { Compute a média de ICC e a variância para a região atual: CCm = MeanRegion(chan, iCCs, blockStart[reg], blockEnd[reg]) CCv = VarRegion(chan, iCCs, blockStart[reg], blockEnd[reg]) para (block = blockStart[reg]; block < blockEnd[reg]; block ++) { Se o canal não estiver em acoplamento, então, pule o bloco: se (chanNotInCpl[block][chan]) continue: fAlphaRho = CCm * MAPPED_VAR_RHO; fAlphaRho = (fAlphaRho > -1.0f) ? fAlphaRho : -1,0f; fAlphaRho = (fAlphaRho > 1.0f) ? fAlphaRho : 0,99999f; para(band = cplStartBand[blockStart]; band < iBandEnd[blockStart]; band ++) { iAlphaRho=floor(fAlphaRho*128)+128; fEstimatedValue = fAlphaRho + w[iNoiseIndex++] * Vb[band] * Vm[iAlphaRho] * sqrt(CCv); fAlphaRho = fAlphaRho * MAPPED_VAR_RHO; EstAlphaArray[block][chan][band] = Smooth(fEstimatedValue); } } laço de canal final } laço de região final
[00396] Uma inserção principal ao processo de extrapolação acima que gera alfas é CCm, o que representa a média dos coeficientes de correlação (cci(l)) sobre a região atual. Uma "região" pode ser um agrupamento arbitrário de blocos E-AC-3 consecutivos. Um quadro E- AC-3 pode ser composto de mais de uma região. No entanto, em algumas implantações, regiões não transpõem as margens do quadro. CCm pode ser computado da seguinte forma (indicado como a função MeanRegion() no pseudocódigo acima):
Figure img0028
[00397] Na Equação 11, i representa o índice de canal, L representa o número de bandas de baixa frequência (abaixo de KCPL) usadas para a estimativa, e N representa o número de blocos dentro da região atual. Aqui se estende a notação cci(l) para incluir o índice de bloco n. O coeficiente de correlação cruzada médio pode, em seguida, ser extrapolado à faixa de frequência de canal de acoplamento recebida através da aplicação repetida da operação de escalonamento a seguir para gerar um valor alfa previsto para cada banda de frequência de canal de acoplamento: fAlphaRho = fAlphaRho * MAPPED_VAR_RHO (Equação 12)
[00398] Ao aplicar a Equação 12, o fAlphaRho para a primeira banda de frequência de canal de acoplamento pode ser CCm(i) * MAPPED _ VAR _ RHO . No exemplo de pseudocódigo, a variável MAPPED_VAR_RHO foi derivada heuristicamente observando-se que os valores alfa médios tendem a diminuir com índice de banda crescente. Dessa forma, MAPPED_VAR_RHO é definido para ser menor do que 1,0. Em algumas implantações, MAPPED_VAR_RHO é definido como 0,98.
[00399] Nesse estágio, os parâmetros espaciais (alfas, nesse exemplo) foram estimados. No exemplo da Figura 10B, os processos correspondentes aos blocos 1022 a 1050 foram realizados. Os processos a seguir são exemplos de adição de ruído aos parâmetros espaciais estimados ou de "oscilação" dos mesmos. Esses processos são exemplos do bloco 1055 do método 1020.
[00400] Com base em uma análise de como o erro de previsão varia com frequência para um grande corpus de diferentes tipos de sinais de inserção de multicanal, os inventores formularam regras heurísticas que controlam o grau de randomização que é imposto aos valores alfa estimados. Os parâmetros espaciais estimados na faixa de frequência de canal de acoplamento (obtidos pelo cálculo de correlação a partir de frequências mais baixas seguido de extrapolação) podem finalmente ter a mesma estatística que teriam se esses parâmetros tivessem sido calculados diretamente na faixa de frequência de canal de acoplamento do sinal original, quando todos os canais individuais estavam disponíveis sem serem acoplados. A finalidade de adicionar ruído é conferir uma variação estatística similar àquela que foi empiricamente observada. No pseudocódigo acima, VB representa um termo de escalonamento derivado empiricamente que dita como a variância muda como uma função do índice de banda. VM representa um recurso derivado empiricamente que se baseia na previsão para alfa antes da variância sintetizada ser aplicada. A isso se deve o fato de que a variância do erro de previsão é, na verdade, uma função da previsão. Por exemplo, quando a previsão linear do alfa para uma banda está perto de 1,0, a variância é bem baixa. O termo CCv representa um controle com base na variância local dos valores cci computados para a região de bloco compartilhada atual. CCv pode ser computado da seguinte forma (indicado por VarRegion() no pseudocódigo acima):
Figure img0029
[00401] Nesse exemplo, VB controla a variância de oscilação de acordo com o índice de banda. VB foi derivado empiricamente examinando-se a variância por todas as bandas do erro de previsão de alfa calculado a partir da fonte. Os inventores constataram que a relação entre a variância normalizada e o índice de banda l pode ser modelada de acordo com a seguinte equação:
Figure img0030
[00402] A Figura 10C é um gráfico que indica a relação entre o termo de escalonamento VB e o índice de banda l. A Figura 10C mostra que a incorporação do recurso VB levará a um alfa estimado que terá uma variância progressivamente maior como uma função do índice de banda. Na Equação 13, um índice de banda l > 3 corresponde à região abaixo de 3,42 kHz, a frequência de começo de acoplamento mais baixa do codec de áudio E-AC-3. Portanto, os valores de VB para esses índices de banda são imateriais.
[00403] O parâmetro VM foi derivado examinando-se o comportamento do erro de previsão de alfa como uma função da própria previsão. Em particular, os inventores constataram através de análise de um grande corpus de conteúdo de multicanal que, quando o valor alfa previsto é negativo, a variância de erro de previsão aumenta, com um pico em alfa = -0,59375. Isso sugere que, quando o canal atual sob análise é negativamente correlacionado ao downmix xD, o alfa estimado pode geralmente ser mais caótico. A Equação 14, abaixo, modela o comportamento desejado:
Figure img0031
[00404] Na Equação 14, q representa a versão quantificada da pre- visão (denotada por fAlphaRho no pseudocódigo) e pode ser computado de acordo com: q =floor(fAlphaRho*128)
[00405] A Figura 10D é um gráfico que indica a relação entre as variáveis VM e q. Observe-se que VM é normalizado pelo valor em q = 0, de forma que VM modifique os outros fatores que contribuem à variância de erro de previsão. Assim, o termo VM somente afeta a variância de erro de previsão total para valores diferentes de q = 0. No pseudocódigo, o símbolo iAlphaRho é definido como q+128. Esse mapeamento evita a necessidade de valores negativos de iAlphaRho e permite a leitura de valores de VM (q) diretamente a partir de uma estrutura de dados, tal como uma tabela.
[00406] Nessa implantação, a próxima etapa é escalar a variável aleatória w pelos três fatores VM, Vb e CCv. A média geométrica entre VM e CCv pode ser computada e aplicada como o fator de escalonamento à variável aleatória. Em algumas implantações, w pode ser implantado como uma tabela bem grande de números aleatórios com uma distribuição gaussiana de variância unitária de média zero.
[00407] Após o processo de escalonamento, um processo de suavi- zação pode ser aplicado. Por exemplo, os parâmetros espaciais estimados oscilados podem ser suavizados ao longo do tempo, por exemplo, usando-se um suavizador polo-zero ou FILO simples. O coeficiente de suavização pode ser definido como 1,0 se o bloco anterior não tiver estado em acoplamento ou se o bloco atual for o primeiro bloco em uma região de blocos. Consequentemente, o número aleatório escalado proveniente do registro de ruído w pode ser filtrado por filtro passa baixa, o que constatou-se corresponder melhor a variância dos valores alfa estimados à variância dos alfas na fonte. Em algumas implantações, esse processo de suavização pode ser menos agressivo (isto é, IIR com uma resposta a impulso mais curta) do que a suaviza- ção usada nos cci (l) s.
[00408] Conforme observado acima, os processos envolvidos na estimativa de alfas e/ou outros parâmetros espaciais podem ser realizados, pelo menos em parte, por um receptor/gerador de informações de controle 640, tal como o ilustrado na Figura 6C. Em algumas implantações, o módulo de controle transitório 655 do receptor/gerador de informações de controle 640 (ou um ou mais outros componentes de um sistema de processamento de áudio) pode ser configurado para fornecer funcionalidade relacionada a elemento transitório. Alguns exemplos de detecção transitória e de controle de um processo de descorrelação da mesma forma serão agora descritos com referência às Figuras 11A et seq.
[00409] A Figura 11A é um fluxograma que delineia alguns métodos de determinação transitória e controles relacionados a elemento transitório. No bloco 1105, dados de áudio correspondentes a uma pluralidade de canais de áudio são recebidos, por exemplo, por um dispositivo de decodificação ou outro sistema de processamento de áudio. Conforme descrito abaixo, em algumas implantações, processos similares podem ser realizados por um dispositivo de codificação.
[00410] A Figura 11B é um diagrama de blocos que inclui exemplos de vários componentes de determinação transitória e de controles relacionados a elemento transitório. Em algumas implantações, o bloco 1105 pode envolver receber dados de áudio 220 e dados de áudio 245 por um sistema de processamento de áudio que inclui o módulo de controle transitório 655. Os dados de áudio 220 e 245 podem incluir representações de domínio de frequência de sinais de áudio. Os dados de áudio 220 podem incluir elementos de dados de áudio em uma faixa de frequência de canal de acoplamento, ao passo que os elementos de dados de áudio 245 podem incluir dados de áudio fora da faixa de frequência de canal de acoplamento. Os elementos de dados de áudio 220 e/ou 245 podem ser roteados a um descorrelacionador que inclui o módulo de controle transitório 655.
[00411] Além dos elementos de dados de áudio 245 e 220, o módulo de controle transitório 655 pode receber outras informações de áudio associadas, tais como as informações de descorrelação 240a e 240b, no bloco 1105. Nesse exemplo, as informações de descorrela- ção 240a podem incluir informações de controle específicas a descor- relacionador explícitas. Por exemplo, as informações de descorrelação 240a podem incluir informações transitórias explícitas, tais como as descritas abaixo. As informações de descorrelação 240b podem incluir informações provenientes de um fluxo de bits de um codec de áudio herdado. Por exemplo, as informações de descorrelação 240b podem incluir informações de segmentação do tempo que estão disponíveis em um fluxo de bits codificado de acordo com o codec de áudio AC-3 ou o codec de áudio E-AC-3. Por exemplo, as informações de descor- relação 240b podem incluir informações de acoplamento-em-uso, informações de comutação de bloco, informações de expoente, informações de estratégia de expoente, etc. Tais informações podem ter sido recebidas por um sistema de processamento de áudio em um fluxo de bits juntamente com os dados de áudio 220.
[00412] O bloco 1110 envolve determinar as características de áudio dos dados de áudio. Em várias implantações, o bloco 1110 envolve determinar as informações transitórias, por exemplo, por meio do mó- dulo de controle transitório 655. O bloco 1115 envolve determinar uma quantidade de descorrelação para os dados de áudio com base, pelo menos em parte, nas características de áudio. Por exemplo, o bloco 1115 pode envolver determinar informações de controle de descorrela- ção com base, pelo menos em parte, nas informações transitórias.
[00413] No bloco 1115, o módulo de controle transitório 655 da Figura 11B pode fornecer as informações de controle do gerador de sinal de descorrelação 625 a um gerador de sinal de descorrelação, tal como o gerador de sinal de descorrelação 218 descrito em outra parte do presente documento. No bloco 1115, o módulo de controle transitório 655 também pode fornecer as informações de controle de mixador 645 a um mixador, tal como o mixador 215. No bloco 1120, os dados de áudio podem ser processados de acordo com as determinações feitas no bloco 1115. Por exemplo, as operações do gerador de sinal de des- correlação 218 e do mixador 215 podem ser realizadas, pelo menos em parte, de acordo com as informações de controle de descorrelação fornecidas pelo módulo de controle transitório 655.
[00414] Em algumas implantações, o bloco 1110 da Figura 11A pode envolver receber informações transitórias explícitas com os dados de áudio e determinar as informações transitórias, pelo menos em parte, de acordo com as informações transitórias explícitas.
[00415] Em algumas implantações, as informações transitórias explícitas podem indicar um valor transitório correspondente a um evento transitório definido. Tal valor transitório pode ser um valor transitório relativamente alto (ou máximo). Um valor transitório alto pode corresponder a uma alta verossimilhança e/ou uma severidade alta de um evento transitório. Por exemplo, se possíveis valores transitórios variarem entre 0 e 1, uma faixa de valores transitórios entre ,9 e 1 pode corresponder a um evento transitório severo e/ou definido. No entanto, qualquer faixa de valores transitórios apropriada pode ser usada, por exemplo, 0 a 9, 1 a 100, etc.
[00416] As informações transitórias explícitas podem indicar um valor transitório correspondente a um evento não transitório definido. Por exemplo, se possíveis valores transitórios variarem entre 1 e 100, um valor na faixa de 1 a 5 pode corresponder a um evento não transitório definido ou a um evento levemente transitório.
[00417] Em algumas implantações, as informações transitórias explícitas podem ter uma representação binária, por exemplo, de tanto 0 quanto 1. Por exemplo, um valor de 1 pode corresponder a um evento transitório definido. No entanto, um valor de 0 pode não indicar um evento não transitório definido. Em vez disso, em algumas de tais implantações, um valor de 0 pode simplesmente indicar a falta de um evento transitório definido e/ou severo.
[00418] No entanto, em algumas implantações, as informações transitórias explícitas podem incluir valores transitórios intermediários entre um valor transitório mínimo (por exemplo, 0) e um valor transitório máximo (por exemplo, 1). Um valor transitório intermediário pode corresponder a uma verossimilhança intermediária e/ou uma severidade intermediária de um evento transitório.
[00419] O módulo de controle de inserção de filtro de descorrelação 1125 da Figura 11B pode determinar as informações transitórias no bloco 1110 de acordo com as informações transitórias explícitas recebidas através das informações de descorrelação 240a. Alternativamente, ou adicionalmente, o módulo de controle de inserção de filtro de descorrelação 1125 pode determinar as informações transitórias no bloco 1110 de acordo com as informações provenientes de um fluxo de bits de um codec de áudio herdado. Por exemplo, com base nas informações de descorrelação 240b, o módulo de controle de inserção de filtro de descorrelação 1125 pode determinar que o acoplamento de canal não está em uso no bloco atual, que o canal está fora de aco- plamento no bloco atual e/ou que o canal está com comutação de bloco no bloco atual.
[00420] Com base nas informações de descorrelação 240a e/ou 240b, o módulo de controle de inserção de filtro de descorrelação 1125 pode, às vezes, determinar um valor transitório correspondente a um evento transitório definido no bloco 1110. Se for esse o caso, em algumas implantações, o módulo de controle de inserção de filtro de descorrelação 1125 pode determinar no bloco 1115 que um processo de descorrelação (e/ou um processo de oscilação de filtro de descorre- lação) deve ser temporariamente pausado. Consequentemente, no bloco 1120, o módulo de controle de inserção de filtro de descorrela- ção 1125 pode gerar informações de controle do gerador de sinal de descorrelação 625e que indiquem que um processo de descorrelação (e/ou um processo de oscilação de filtro de descorrelação) deve ser temporariamente pausado. Alternativa ou adicionalmente, no bloco 1120, o calculador transitório suave 1130 pode gerar informações de controle do gerador de sinal de descorrelação 625f, indicando que um processo de oscilação de filtro de descorrelação deve ser temporariamente pausado ou desacelerado.
[00421] Em implantações alternativas, o bloco 1110 pode envolver não receber quaisquer informações transitórias explícitas com os dados de áudio. No entanto, quer as informações transitórias explícitas sejam recebidas ou não, algumas implantações do método 1100 podem envolver detectar um evento transitório de acordo com uma análise dos dados de áudio 220. Por exemplo, em algumas implantações, um evento transitório pode ser detectado no bloco 1110 mesmo quando as informações transitórias explícitas não indicarem um evento transitório. Um evento transitório que seja determinado ou detectado por um decodificador, ou um sistema de processamento de áudio similar, de acordo com uma análise dos dados de áudio 220 pode ser refe- rido no presente documento como um "evento transitório suave".
[00422] Em algumas implantações, quer um valor transitório seja fornecido como um valor transitório explícito ou determinado como um valor transitório suave, o valor transitório pode ser sujeito a uma função exponencial de decaimento. Por exemplo, a função exponencial de decaimento pode fazer com que o valor transitório decaia de modo suave de um valor inicial a zero ao longo de um período. Sujeitar um valor transitório a uma função exponencial de decaimento pode prevenir contra artefatos associados a comutação abrupta.
[00423] Em algumas implantações, detectar um evento transitório suave pode envolver avaliar a verossimilhança e/ou a severidade de um evento transitório. Tais avaliações podem envolver calcular uma variação temporal de potência nos dados de áudio 220.
[00424] A Figura 11C é um fluxograma que delineia alguns métodos para determinar valores de controle transitório com base, pelo menos em parte, em variações temporais de potência de dados de áudio. Em algumas implantações, o método 1150 pode ser realizado, pelo menos em parte, pelo calculador transitório suave 1130 do módulo de controle transitório 655. No entanto, em algumas implantações, o método 1150 pode ser realizado por um dispositivo de codificação. Em algumas de tais implantações, as informações transitórias explícitas podem ser determinadas pelo dispositivo de codificação de acordo com o método 1150 e incluídas em um fluxo de bits juntamente com outros dados de áudio.
[00425] O método 1150 começa com o bloco 1152, em que dados de áudio com upmix em uma faixa de frequência de canal de acoplamento são recebidos. Na Figura 11B, por exemplo, elementos de dados de áudio com upmix 220 podem ser recebidos pelo calculador transitório suave 1130 no bloco 1152. No bloco 1154, a faixa de frequência de canal de acoplamento recebida é dividida em uma ou mais bandas de frequência, que também podem ser referidas no presente documento como "bandas de potência".
[00426] O bloco 1156 envolve computar a potência logarítmica pesada por frequência de banda ("WLP") de cada canal e bloco dos dados de áudio com upmix. Para computar a WLP, a potência de cada banda de potência pode ser determinada. Essas potências podem ser convertidas em valores logarítmicos e, então, terem sua média calculada por todas as bandas de potência. Em algumas implantações, o bloco 1156 pode ser realizado de acordo com a seguinte expressão:
Figure img0032
[00427] Na Equação 15, WLP[ch][blk] representa a potência logarítmica pesada de um canal e um bloco, [pwr _ bnd] representa uma banda de frequência ou "banda de potência" em que a faixa de frequência de canal de acoplamento recebida tenha sido dividida, e
Figure img0033
representa uma média dos logaritmos de potência por todas as bandas de potência do canal e do bloco.
[00428] Reunir bandas pode pré-enfatizar a variação de potência em frequências mais altas, pelos seguintes motivos. Se toda a faixa de frequência de canal de acoplamento fosse uma (1) banda, então P[ch][blk][pwr_bnd] seria a média aritmética da potência em cada frequência na faixa de frequência de canal de acoplamento, e as frequências mais baixas que tipicamente têm uma potência mais alta tenderiam a afundar o valor de P[ch][blk][pwr_bnd] e, portanto, o valor do log(P[ch][blk][pwr_bnd]). (Nesse caso, o log(P[ch][blk][pwr_bnd]) teria o mesmo valor do log(P[ch][blk][pwr_bnd]) médio, porque haveria somente uma banda.) Consequentemente, a detecção transitória seria baseada em grande parte na variação temporal nas frequências mais baixas. Dividir a faixa de frequência de canal de acoplamento em, por exemplo, uma banda de frequência mais baixa e uma banda de frequência mais alta e, então, calcular a média da potência das duas bandas no domínio de log é de certa forma equivalente a calcular a média geométrica da potência das frequências mais baixas e da potência das frequências mais altas. Tal média geométrica estaria mais perto da potência das frequências mais altas do que uma média aritmética estaria. Portanto, reunir bandas, determinar o log (potência) e, então, determinar a média tenderia a resultar em uma quantidade que é mais sensível à variação temporal nas frequências mais altas.
[00429] Nessa implantação, o bloco 1158 envolve determinar um diferencial de potência assimétrica ("APD") com base na WLP. Por exemplo, o APD pode ser determinado da seguinte forma: dWLP[ch][blk]
Figure img0034
[00430] Na Equação 16, dWLP[ch][blk] representa a potência logarítmica pesada por diferencial de um canal e um bloco, e WLP[ch][blk][blk-2] representa a potência logarítmica pesada do canal do penúltimo bloco. O exemplo da Equação 16 é útil para processar dados de áudio codificados através de codecs de áudio, tais como E- AC-3 e AC-3, em que há uma sobreposição de 50% entre blocos consecutivos. Consequentemente, a WLP do bloco atual é comparada à WLP do penúltimo bloco. Se não houver sobreposição entre os blocos consecutivos, a WLP do bloco atual pode ser comparada à WLP do bloco anterior.
[00431] Esse exemplo tira vantagem do possível efeito de masca- ramento temporal dos blocos anteriores. Consequentemente, se a WLP do bloco atual for maior ou igual à do bloco anterior (nesse exemplo, a WLP do penúltimo bloco), o APD é definido como o diferencial de WLP real. No entanto, se a WLP do bloco atual for menor do que a do bloco anterior, o APD é definido como metade do diferencial de WLP real. Consequentemente, o APD dá ênfase à potência crescente e retira a ênfase da potência decrescente. Em outras implantações, uma fração diferente do diferencial de WLP real pode ser usada, por exemplo, % do diferencial de WLP real.
[00432] O bloco 1160 pode envolver determinar uma medida transitória bruta ("RTM") com base no APD. Nessa implantação, determinar a medida transitória bruta envolve calcular uma função de verossimilhança de eventos transitórios com base em uma suposição de que o diferencial de potência assimétrica temporal é distribuído de acordo com uma distribuição gaussiana:
Figure img0035
[00433] Na Equação 17, RTM[ch][blk] representa uma medida transitória bruta de um canal e um bloco, e SAPD representa um parâmetro de sintonização. Nesse exemplo, quando SAPD é aumentado, um diferencial de potência relativamente maior será necessário para produzir o mesmo valor de RTM.
[00434] Um valor de controle transitório, que pode também ser referido no presente documento como uma "medida transitória", pode ser determinado a partir da RTM no bloco 1162. Nesse exemplo, o valor de controle transitório é determinado de acordo com a Equação 18:
Figure img0036
[00435] Na Equação 18, TM[ch][blk] representa a medida transitória de um canal e um bloco, TH representa um limiar superior, e TL representa um limiar inferior. A Figura 11D fornece um exemplo de aplicação da Equação 18 e de como os limiares TH e TL podem ser usados. Outras implantações podem envolver outros tipos de mapeamento linear ou não linear da RTM à TM. De acordo com algumas de tais implanta- ções, a TM é uma função de RTM não decrescente.
[00436] A Figura 11D é um gráfico que ilustra um exemplo de mapeamento de valores transitórios brutos a valores de controle transitório. Aqui, tanto os valores transitórios brutos quanto os valores de controle transitório variam entre 0,0 e 1,0, mas outras implantações podem envolver outras faixas de valores. Conforme mostrado na Equação 18 e na Figura 11D, se um valor transitório bruto for maior ou igual ao limiar superior TH, o valor de controle transitório é definido como seu valor máximo, que é 1,0 nesse exemplo. Em algumas implantações, um valor máximo de controle transitório pode corresponder a um evento transitório definido.
[00437] Se um valor transitório bruto for menor ou igual ao limiar inferior TL, o valor de controle transitório é definido como seu valor mínimo, que é 0,0 nesse exemplo. Em algumas implantações, um valor mínimo de controle transitório pode corresponder a um evento não transitório definido.
[00438] No entanto, se um valor transitório bruto estiver dentro da faixa 1166 entre o limiar inferior TL e o limiar superior TH, o valor de controle transitório pode ser escalonado para um valor de controle transitório intermediário, que está entre 0,0 e 1,0 nesse exemplo. O valor de controle transitório intermediário pode corresponder a uma probabilidade relativa e/ou uma severidade relativa de um evento transitório.
[00439] Novamente, em referência à Figura 11C, no bloco 1164 uma função exponencial de decaimento pode ser aplicada ao valor de controle transitório que é determinado no bloco 1162. Por exemplo, a função exponencial de decaimento pode fazer com que o valor de controle transitório pode decair suavemente de um valor inicial para durante um período de tempo. Submeter um valor de controle transitório a uma função exponencial de decaimento pode impedir que artefatos associados à comutação abrupta. Em algumas implantações, um valor de controle transitório de cada bloco atual pode ser calculado e comparado à versão de decaimento exponencial do valor de controle transitório do bloco anterior. O valor de controle transitório final para o bloco atual pode ser definido como o máximo dos dois valores de controle transitório.
[00440] As informações transitórias, se recebidas juntamente com outros dados de áudio ou determinadas por um decodificador, podem ser usadas para controlar os processos de descorrelação. As informações transitórias podem incluir valores de controle transitório como aqueles descritos acima. Em algumas implantações, uma quantidade de descorrelação para os dados de áudio pode ser modificada (por exemplo, reduzida), com base, pelo menos em parte, em tais informações transitórias.
[00441] Conforme descrito acima, tais processos de descorrelação podem envolver aplicar um filtro de descorrelação a uma porção dos dados de áudio para produzir dados de áudio filtrados e mixar os dados de áudio filtrados com uma porção dos dados de áudio recebidos de acordo com uma razão de mixagem. Algumas implantações podem envolver controlar o mixador 215 de acordo com as informações transitórias. Por exemplo, tais implantações podem envolver modificar a razão de mixagem com base, pelo menos em parte, nas informações transitórias. Tais informações transitórias podem, por exemplo, ser incluídas nas informações de controle de mixador 645 pelo modelo de controle transitório de mixador 1145. (Consulte a Figura 11B.)
[00442] De acordo com algumas tais implantações, os valores de controle transitório podem ser usados pelo mixador 215 para modificar alfas a fim de suspender ou reduzir a descorrelação durante eventos transitórios. Por exemplo, os alfas podem ser modificados de acordo com o pseudocódigo a seguir: se (alpha[ch][bnd] >=0) alpha[ch][bnd] = alpha[ch][bnd] + (1-alpha[ch][bnd]) decorrelationDecayArray[ch]; else alpha[ch][bnd] = alpha[ch][bnd] + (-1-alpha[ch][bnd]) decorrelationDecayArray[ch];
[00443] No pseudocódigo anterior, alpha[ch][bnd] representa um valor alfa de uma banda de frequência para um canal. O termo decor- relationDecayArray[ch] representa uma variável exponencial de decaimento que assume um valor que está na faixa de 0 a 1. Em alguns exemplos, os alfas podem ser modificados para +/-1 durante eventos transitórios. A extensão de modificação pode ser proporcional a decor- relationDecayArray[ch], que reduziria os pesos de mixagem para os sinais de descorrelação para 0 e, desse modo, suspende ou reduz a descorrelação. O decaimento exponencial de decorrelationDecayAr- ray[ch] reestabelece suavemente o processo de descorrelação normal.
[00444] Em algumas implantações, o calculador transitório suave 1130 pode fornecer informações transitórias suaves ao módulo de parâmetro espacial 665. Com base, pelo menos em parte, nas informações transitórias suaves, o módulo de parâmetro espacial 665 pode selecionar um mais suave tanto para parâmetros especiais de suavi- zação recebidos no fluxo de bits quanto para energia de suavização e outras quantidades envolvidas em estimativa de parâmetro espacial.
[00445] Algumas implantações podem envolver controlar o gerador de sinal de descorrelação 218 de acordo com as informações transitórias. Por exemplo, tais implantações podem envolver modificar ou interromper temporariamente um processo de oscilação de filtro de des- correlação com base, pelo menos em parte, nas informações transitórias. Isso pode ser vantajoso devido ao fato de que oscilar os polos dos filtros passa-tudo durante eventos transitórios pode ocasionar arte- fatos com zumbido indesejado. Em algumas tais implantações, o valor de passo máximo para polos de oscilação de um filtro de descorrela- ção pode ser modificado com base, pelo menos em parte, nas informações transitórias.
[00446] Por exemplo, o calculador transitório suave 1130 pode fornecer o gerador de informações de controle de sinal de descorrelação 625f ao módulo de controle de filtro de descorrelação 405 do gerador de sinal de descorrelação 218 (consulte também a Figura 4). O módulo de controle de filtro de descorrelação 405 pode gerar filtros variantes no tempo 1127 em resposta ao gerador de informações de controle de sinal de descorrelação 625f. De acordo com algumas implantações, o gerador de informações de controle de sinal de descorrelação 625f pode incluir informações para controlar o valor de passo máximo de acordo com o valor máximo de uma variável exponencial de decaimento, como:
Figure img0037
[00447] Por exemplo, o valor de passo máximo pode ser multiplicado pela expressão anterior quando eventos transitórios são detectados em qualquer canal. O processo de oscilação pode ser interrompido ou reduzido, em conformidade.
[00448] Em algumas implantações, um ganho pode ser aplicado aos dados de áudio filtrados com base, pelo menos em parte, nas informações transitórias. Por exemplo, a potência dos dados de áudio filtrados pode ser correlacionada com a potência dos dados de áudio diretos. Em algumas implantações, tal funcionalidade pode ser fornecida pelo módulo de compressor 1135 da Figura 11B.
[00449] O módulo de compressor 1135 pode receber informações transitórias, como valores de controle transitório, do calculador transitório suave 1130. O módulo de compressor 1135 pode determinar o gerador de informações de controle de sinal de descorrelação 625h de acordo com os valores de controle transitório. O módulo de compressor 1135 pode fornecer o gerador de informações de controle de sinal de descorrelação 625h ao gerador de sinal de descorrelação 218. Por exemplo, o gerador de informações de controle de sinal de descorrela- ção 625h inclui um valor de ganho que o gerador de sinal de descorre- lação 218 pode aplicar aos sinais de descorrelação 227 a fim de manter a potência dos dados de áudio filtrados em um nível que é menor que ou igual à potência dos dados de áudio diretos. O módulo de compressor 1135 pode determinar o gerador de informações de controle de sinal de descorrelação 625h calculando-se, para cada canal recebido no acoplamento, a energia por banda de frequência na faixa de frequência de canal de acoplamento.
[00450] O módulo de compressor 1135 pode, por exemplo, incluir um banco de compressores. Em algumas tais implantações, os compressores podem incluir armazenamentos temporários para armazenar temporariamente a energia por banda de frequência na faixa de frequência de canal de acoplamento determinada pelo módulo de compressor 1135. Um atraso fixo pode ser aplicado aos dados de áudio filtrados e o mesmo atraso pode ser aplicado aos armazenamentos temporários.
[00451] O módulo de compressor 1135 também pode determinar informações relacionadas ao mixador e pode fornecer as informações relacionadas ao mixador ao modelo de controle transitório de mixador 1145. Em algumas implantações, o módulo de compressor 1135 pode fornecer informações para controlar o mixador 215 para modificar a razão de mixagem com base em um ganho a ser aplicado aos dados de áudio filtrados. De acordo com algumas tais implantações, o módulo de compressor 1135 pode fornecer informações para controlar o mi- xador 215 para suspender ou reduzir a descorrelação durante eventos transitórios. Por exemplo, o módulo de compressor 1135 pode fornecer as informações relacionadas ao mixador a seguir: TransCtrlFlag = max(decorrelationDecayArray[ch], 1- DecorrGain[ch][bnd]); se (alpha[ch][bnd] >=0) alpha[ch][bnd] = alpha[ch][bnd] + (1-alpha[ch][bnd]) TransCtrlFlag; else alpha[ch][bnd] = alpha[ch][bnd] + (-1-alpha[ch][bnd]) TransCtrlFlag;
[00452] No pseudocódigo anterior, TransCtrlFlag representa um valor de controle transitório e DecorrGain[ch][bnd] representa o ganho para aplicar a uma banda de um canal de dados de áudio filtrados.
[00453] Em algumas implantações, uma janela de potência de sua- vização de estimativa para os compressores pode ter como base, pelo menos em parte, as informações transitórias. Por exemplo, uma janela de suavização menor pode ser aplicada quando um evento transitório é relativamente mais provável ou quando um evento transitório relativamente mais forte é detectado. Uma janela de suavização maior pode ser aplicada quando um evento transitório é relativamente menos provável, quando um evento transitório relativamente mais fraco é detectado ou quando nenhum evento transitório é detectado. Por exemplo, o comprimento de janela de suavização pode ser ajustado de modo dinâmico com base nos valores de controle transitório para que o comprimento de janela seja mais curto quando o valor de sinalizador estiver próximo a um valor máximo (por exemplo, 1,0) e mais longo quando o valor de sinalizador estiver próximo a um valor mínimo (por exemplo, 0.0). Tais implantações podem ajudar a evitar perda de tempo durante eventos transitórios enquanto resulta em fatores de ganho suaves durante situações não transitórias.
[00454] Conforme verificado acima, em algumas implantações, as informações transitórias podem ser determinadas por um dispositivo de codificação. A Figura 11E é um fluxograma que descreve um método de codificar informações transitórias. No bloco 1172, os dados de áudio que correspondem a uma pluralidade de canais de áudio são recebidos. Nesse exemplo, os dados de áudio são recebidos por um dispositivo de codificação. Em algumas implantações, os dados de áudio podem ser transformados do domínio de tempo para o domínio de frequência (bloco opcional 1174).
[00455] No bloco 1176, as características de áudio, incluindo informações transitórias, são determinadas. Por exemplo, as informações transitórias podem ser determinadas conforme descrito acima em referência às Figuras 11A a 11D. Por exemplo, o bloco 1176 pode envolver avaliar uma variação de potência temporal nos dados de áudio. O bloco 1176 pode envolver determinar valores de controle transitório de acordo com a variação de potência temporal nos dados de áudio. Tais valores de controle transitório podem indicar um evento transitório definitivo, um evento não transitório definitivo, a probabilidade de um evento transitório e/ou a severidade de um evento transitório. O bloco 1176 pode envolver aplicar uma função exponencial de decaimento aos valores de controle transitório.
[00456] Em algumas implantações, as características de áudio determinadas no bloco 1176 podem incluir parâmetros espaciais, que podem ser determinados substancialmente conforme descrito em outro lugar no presente documento. No entanto, em vez de calcular correlações fora da faixa de frequência de canal de acoplamento, os parâmetros espaciais podem ser determinados calculando-se correlações dentro da faixa de frequência de canal de acoplamento. Por exemplo, alfas para um canal individual que será codificado com acoplamento podem ser determinados calculando-se as correlações entre coeficientes de transformação daquele canal e o canal de acoplamento em uma base de banda de frequência. Em algumas implantações, o codificador pode determinar os parâmetros espaciais usando-se representações de frequência complexa dos dados de áudio.
[00457] O bloco 1178 envolve acoplamento pelo menos uma porção de dois ou mais canais dos dados de áudio em um canal acoplado. Por exemplo, as representações de domínio de frequência dos dados de áudio para o canal acoplado, que estão dentro de uma faixa de frequência de canal de acoplamento, podem ser combinadas no bloco 1178. Em algumas implantações, mais de um canal acoplado pode ser formado no bloco 1178.
[00458] No bloco 1180, os quadros de dados de áudio codificados são formados. Nesse exemplo, os quadros de dados de áudio codificados incluem dados que correspondem ao(s) canal(is) acoplado(s) e informações transitórias codificadas determinadas no bloco 1176. Por exemplo, as informações transitórias codificadas podem incluir um ou mais sinalizadores de controle. Os sinalizadores de controle podem incluir um sinalizador de comutador de bloco de canal, um sinalizador fora do acoplamento de canal e/ou um sinalizador de acoplamento em uso. O bloco 1180 pode envolver determinar uma combinação de um ou mais sinalizadores de controle para formar informações transitórias codificadas que indicam um evento transitório definitivo, um evento não transitório definitivo, a probabilidade de um evento transitório ou a severidade de um evento transitório.
[00459] Se ou não formadas combinando-se os sinalizadores de controle, as informações transitórias codificadas podem incluir informações para controlar um processo de descorrelação. Por exemplo, as informações transitórias podem indicar que um processo de descor- relação deve ser temporariamente interrompido. As informações transitórias podem indicar que uma quantidade de descorrelação em um processo de descorrelação deve ser temporariamente reduzida. As informações transitórias podem indicar que uma razão de mixagem de um processo de descorrelação deve ser modificada.
[00460] Os quadros de dados de áudio codificados também podem incluir diversos outros tipos de dados de áudio, incluindo os dados de áudio para canais individuais fora da faixa de frequência de canal de acoplamento, dados de áudio para canais não no acoplamento, etc. Em algumas implantações, os quadros de dados de áudio codificados também podem incluir parâmetros espaciais, coordenadas de acoplamento e/ou outros tipos de informações laterais como aquelas descritas em outro lugar no presente documento.
[00461] A Figura 12 é um diagrama de blocos que fornece exemplos de componentes de um aparelho que pode ser configurado para implantar aspectos dos processos descritos no presente documento. O dispositivo 1200 pode ser um telefone móvel, um telefone inteligente, um computador do tipo desktop, um computador de mão ou portátil, um computador do tipo netbook, um computador do tipo notebook, um smartbook, um computador do tipo tablet, um sistema de estéreo, uma televisão, um reprodutor de DVD, um dispositivo de gravação digital ou qualquer uma variedade de outros dispositivos. O dispositivo 1200 pode incluir uma ferramenta de codificação e/ou uma ferramenta de de- codificação. No entanto, os componentes ilustrados na Figura 12 são meramente exemplos. Um dispositivo particular pode ser configurado para implantar diversas modalidades descritas no presente documento, mas pode ou não incluir todos os componentes. Por exemplo, algumas implantações podem não incluir um alto-falante ou um microfone.
[00462] Nesse exemplo, o dispositivo inclui um sistema de interface 1205. O sistema de interface 1205 pode incluir uma interface de rede, como uma interface de rede sem fio. De modo alternativo ou adicionalmente, o sistema de interface 1205 pode incluir uma interface de barramento em série universal (USB) ou outra tal interface.
[00463] O dispositivo 1200 inclui um sistema lógico 1210. O sistema lógico 1210 pode incluir um processador, como um processador de único ou múltiplos chips de propósito geral. O sistema lógico 1210 pode incluir um processador de sinal digital (DSP), um circuito integrado específico de aplicação (ASIC), um arranjo de porta programável de campo (FPGA) ou outros dispositivos lógicos programáveis, porta discreta ou lógica de transistor ou componentes de hardware discretos ou combinações dos mesmos. O sistema lógico 1210 pode ser configurado para controlar os outros componentes do dispositivo 1200. Embora nenhuma interface entre os componentes do dispositivo 1200 seja mostrada na Figura 12, o sistema lógico 1210 pode ser configurado para comunicação com os outros componentes. Os outros componentes podem ou não ser configurados para comunicação entre si, conforme apropriado.
[00464] O sistema lógico 1210 pode ser configurado para realizar diversos tipos de funcionalidade de processamento de áudio, como funcionalidade de codificador e/ou decodificador. Tal funcionalidade de codificador e/ou decodificador pode incluir, porém, sem limitação, os tipos de funcionalidade de codificador e/ou decodificador descritos no presente documento. Por exemplo, o sistema lógico 1210 pode ser configurado para fornecer a funcionalidade relacionada ao decorrelator descrita no presente documento. Em algumas tais implantações, o sistema lógico 1210 pode ser configurado para operar (pelo menos em parte) de acordo com software armazenado em um ou mais meios não transitórios. Os meios não transitórios podem incluir memória associada ao sistema lógico 1210, como memória de acesso aleatório (RAM) e/ou memória de apenas leitura (ROM). Os meios não transitórios podem incluir memória do sistema de memória 1215. O sistema de memória 1215 pode incluir um ou mais tipos adequados de meio de ar- mazenamento não transitório, como memória flash, um disco rígido, etc.
[00465] Por exemplo, o sistema lógico 1210 pode ser configurado para receber quadros de dados de áudio codificados através do sistema de interface 1205 e para decodificar os dados de áudio codificados de acordo com os métodos descritos no presente documento. De modo alternativo ou adicionalmente, o sistema lógico 1210 pode ser configurado para receber quadros de dados de áudio codificados através de uma interface entre o sistema de memória 1215 e o sistema lógico 1210. O sistema lógico 1210 pode ser configurado para controlar o(s) alto-falante(s) 1220 de acordo com dados de áudio decodificados. Em algumas implantações, o sistema lógico 1210 pode ser configurado para codificar os dados de áudio de acordo com métodos de codificação convencionais e/ou de acordo com métodos de codificação descritos no presente documento. O sistema lógico 1210 pode ser configurado para receber tais dados de áudio através do microfone 1225, através do sistema de interface 1205, etc.
[00466] O sistema de exibição 1230 pode incluir um ou mais tipos adequados de visor, dependendo da manifestação do dispositivo 1200. Por exemplo, o sistema de exibição 1230 pode incluir um visor de cristal líquido, um visor de plasma, um visor biestável, etc.
[00467] O sistema de inserção de usuário 1235 pode incluir um ou mais dispositivos configurados para aceitar inserção de um usuário. Em algumas implantações, o sistema de inserção de usuário 1235 pode incluir uma tela sensível ao toque que sobrepõe um visor do sistema de exibição 1230. O sistema de inserção de usuário 1235 pode incluir botões, um teclado, comutadores, etc. Em algumas implantações, o sistema de inserção de usuário 1235 pode incluir o microfone 1225: um usuário pode fornecer comandos de voz para o dispositivo 1200 através do microfone 1225. O sistema lógico pode ser configurado pa ra reconhecimento de fala e para controlar pelo menos algumas operações do dispositivo 1200 de acordo com tais comandos de voz.
[00468] O sistema de potência 1240 pode incluir um ou mais dispositivos de armazenamento de energia adequados, como uma bateria de níquel-cádmio ou uma bateria de lítio-íon. O sistema de potência 1240 pode ser configurado para receber potência de uma emissão elétrica.
[00469] Diversas modificações às implantações descritas nesta revelação podem ser prontamente evidentes para aqueles que têm habilidade comum na técnica. Os princípios gerais definidos no presente documento podem ser aplicados a outras implantações sem se afastar do escopo descrito em termos de Dolby Digital e Dolby Digital Plus, os métodos descritos no presente documento, e as reivindicações.

Claims (15)

1. Método caracterizado pelo fato de que compreende as etapas de: receber dados de áudio que compreendem um primeiro conjunto de coeficientes de frequência e um segundo conjunto de coeficientes de frequência; estimar, com base em pelo menos parte do primeiro conjunto de coeficientes de frequência, parâmetros espaciais para pelo menos parte do segundo conjunto de coeficientes de frequência; e aplicar os parâmetros espaciais estimados para o segundo conjunto de coeficientes de frequência para gerar um segundo conjunto modificado de coeficientes de frequência, em que o primeiro conjunto de coeficientes de frequência corresponde a uma primeira faixa de frequência e o segundo conjunto de coeficientes de frequência corresponde a uma segunda faixa de frequência; em que os dados de áudio compreendem os dados que correspondem aos canais individuais e a um canal acoplado, e em que a primeira faixa de frequência corresponde a uma faixa de frequência de canal individual e a segunda faixa de frequência corresponde a uma faixa de frequência de canal acoplado; em que os dados de áudio compreendem os coeficientes de frequência na primeira faixa de frequência para dois ou mais canais; e em que o processo de estimativa envolve: criar um canal de acoplamento composto com base em dados de áudio dos canais individuais na primeira faixa de frequência, o que envolve calcular os coeficientes de frequência combinados de um canal de acoplamento composto com base nos coeficientes de frequência dentre os dois ou mais canais na primeira faixa de frequência; e computar, para pelo menos um primeiro canal, os coeficientes de correlação cruzada entre os coeficientes de frequência do primeiro canal e os coeficientes de frequência combinados.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o processo de aplicação envolve aplicar os parâmetros espaciais estimados em uma base por canal.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os coeficientes de correlação cruzada são coeficientes de correlação cruzada normalizados.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o processo de estimativa envolve dividir pelo menos parte da primeira faixa de frequência nas primeiras bandas de faixa de frequência e computar um coeficiente de correlação cruzada normalizado para cada primeira banda de faixa de frequência.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o processo de estimativa compreende: obter a média dos coeficientes de correlação cruzada nor-malizados por todas as primeiras bandas de faixa de frequência do canal; e aplicar um fator de escalonamento para a média dos coefi-cientes de correlação cruzada normalizados para obter os parâmetros espaciais estimados para o canal, em que opcionalmente o fator de escalonamento diminui com a frequência de aumento.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que ainda compreende adicionar ruído para modelar a variância dos parâmetros espaciais estimados, em que, opcionalmente, a variância do ruído adicionado tem como base, pelo menos em parte, a variância nos coeficientes de correlação cruzada normalizados.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que ainda compreende ponderar as razões de energia por banda entre as bandas do primeiro conjunto de coeficientes de frequência e as bandas do segundo conjunto de coeficientes de frequência, em que os parâmetros espaciais estimados variam de acordo com as razões de energia por banda.
8. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que os parâmetros espaciais estimados variam de acordo com as alterações temporais dos sinais de áudio de entrada.
9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o processo de aplicação dos parâmetros espaciais estimados para o segundo conjunto de coeficientes de frequência é parte de um processo de descorrelação.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o processo de descorrelação envolve a geração de um sinal de reverberação ou um sinal de descorrelação e a ampliação do mesmo para o segundo conjunto dos coeficientes de frequência.
11. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o processo de descorrelação envolve descorrela- ção seletiva ou adaptável por sinal de bandas de frequência específicas e/ou bandas de frequência específicas.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que os dados de áudio são recebidos em um fluxo de bits codificados de acordo com um processo de codificação herdado.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que aplicar parâmetros espaciais produz uma re- produção de áudio mais espacialmente precisa que a obtida pela de- codificação do fluxo de bits de acordo com a processo de decodifica- ção herdado que se corresponde com o processo de codificação herdado.
14. Aparelho caracterizado pelo fato de que compreende: uma interface; e um sistema lógico configurado para executar todas as etapas do método conforme definido em qualquer uma das reivindicações 1 a 13.
15. Mídia não transitória que possui um método armazenado na mesma, caracterizada pelo fato de que o método é para controlar um aparelho para executar todas as etapas do método conforme definido em qualquer uma das reivindicações 1 a 13.
BR112015019525-3A 2013-02-14 2014-01-22 Método, aparelho e mídia não transitória que possui um método armazenado na mesma. BR112015019525B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361764869P 2013-02-14 2013-02-14
US61/764,869 2013-02-14
PCT/US2014/012457 WO2014126683A1 (en) 2013-02-14 2014-01-22 Audio signal enhancement using estimated spatial parameters

Publications (2)

Publication Number Publication Date
BR112015019525A2 BR112015019525A2 (pt) 2017-07-18
BR112015019525B1 true BR112015019525B1 (pt) 2021-12-14

Family

ID=50069321

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015019525-3A BR112015019525B1 (pt) 2013-02-14 2014-01-22 Método, aparelho e mídia não transitória que possui um método armazenado na mesma.

Country Status (22)

Country Link
US (1) US9489956B2 (pt)
EP (1) EP2956934B1 (pt)
JP (1) JP6138279B2 (pt)
KR (1) KR101724319B1 (pt)
CN (1) CN105900168B (pt)
AR (1) AR094775A1 (pt)
AU (1) AU2014216732B2 (pt)
BR (1) BR112015019525B1 (pt)
CA (1) CA2898271C (pt)
CL (1) CL2015002277A1 (pt)
DK (1) DK2956934T3 (pt)
HK (1) HK1218674A1 (pt)
HU (1) HUE032018T2 (pt)
IL (1) IL239945B (pt)
IN (1) IN2015MN01955A (pt)
MX (1) MX344170B (pt)
PL (1) PL2956934T3 (pt)
RU (1) RU2620714C2 (pt)
SG (1) SG11201506129PA (pt)
TW (1) TWI618051B (pt)
UA (1) UA113682C2 (pt)
WO (1) WO2014126683A1 (pt)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9564144B2 (en) * 2014-07-24 2017-02-07 Conexant Systems, Inc. System and method for multichannel on-line unsupervised bayesian spectral filtering of real-world acoustic noise
TWI628454B (zh) 2014-09-30 2018-07-01 財團法人工業技術研究院 基於聲波的空間狀態偵測裝置、系統與方法
WO2016082875A1 (en) * 2014-11-26 2016-06-02 Kone Corporation Local navigation system
TWI573133B (zh) * 2015-04-15 2017-03-01 國立中央大學 音訊處理系統及方法
CN105931648B (zh) * 2016-06-24 2019-05-03 百度在线网络技术(北京)有限公司 音频信号解混响方法和装置
US9913061B1 (en) 2016-08-29 2018-03-06 The Directv Group, Inc. Methods and systems for rendering binaural audio content
US10254121B2 (en) * 2017-01-23 2019-04-09 Uber Technologies, Inc. Dynamic routing for self-driving vehicles
CN108268695B (zh) * 2017-12-13 2021-06-29 杨娇丽 一种放大电路的设计方法及放大电路
PL3724876T3 (pl) 2018-02-01 2022-11-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enkoder sceny audio, dekoder sceny audio i powiązane sposoby wykorzystujące analizę przestrzenną hybrydowego enkodera/dekodera
TWI691955B (zh) * 2018-03-05 2020-04-21 國立中央大學 多通道之多重音頻串流方法以及使用該方法之系統
GB2576769A (en) * 2018-08-31 2020-03-04 Nokia Technologies Oy Spatial parameter signalling
CN110047503B (zh) * 2018-09-25 2021-04-16 上海无线通信研究中心 一种声波的多径效应抑制方法
JP7416816B2 (ja) * 2019-03-06 2024-01-17 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミキサ及びダウンミックス方法
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH572650A5 (pt) * 1972-12-21 1976-02-13 Gretag Ag
GB8308843D0 (en) 1983-03-30 1983-05-11 Clark A P Apparatus for adjusting receivers of data transmission channels
CA2174413C (en) * 1993-11-18 2009-06-09 Geoffrey B. Rhoads Steganographic methods and apparatuses
US6134521A (en) * 1994-02-17 2000-10-17 Motorola, Inc. Method and apparatus for mitigating audio degradation in a communication system
KR20010006291A (ko) 1998-02-13 2001-01-26 요트.게.아. 롤페즈 서라운드 음향 재생 시스템, 음향/시각 재생 시스템, 서라운드 신호 처리 유닛 및 입력 서라운드 신호 처리 방법
US6175631B1 (en) 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
US7218665B2 (en) 2003-04-25 2007-05-15 Bae Systems Information And Electronic Systems Integration Inc. Deferred decorrelating decision-feedback detector for supersaturated communications
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
KR101079066B1 (ko) * 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
WO2006008697A1 (en) 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
EP1803115A2 (en) 2004-10-15 2007-07-04 Koninklijke Philips Electronics N.V. A system and a method of processing audio data to generate reverberation
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
KR101251426B1 (ko) 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
US8081764B2 (en) 2005-07-15 2011-12-20 Panasonic Corporation Audio decoder
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
RU2383942C2 (ru) * 2005-08-30 2010-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
TWI469133B (zh) 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
CN101406073B (zh) 2006-03-28 2013-01-09 弗劳恩霍夫应用研究促进协会 用于多声道音频重构中的信号成形的增强的方法
DE602006010323D1 (de) 2006-04-13 2009-12-24 Fraunhofer Ges Forschung Audiosignaldekorrelator
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP1883067A1 (en) 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
CN101518103B (zh) 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
RU2406165C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
DE102007018032B4 (de) 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
BRPI0809760B1 (pt) 2007-04-26 2020-12-01 Dolby International Ab aparelho e método para sintetizar um sinal de saída
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US20100040243A1 (en) 2008-08-14 2010-02-18 Johnston James D Sound Field Widening and Phase Decorrelation System and Method
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
EP2144229A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
JP5326465B2 (ja) 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
EP2234103B1 (en) 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
US8497467B2 (en) 2009-04-13 2013-07-30 Telcordia Technologies, Inc. Optical filter control
DE102009035230A1 (de) 2009-07-29 2011-02-17 Wagner & Co. Solartechnik Gmbh Solaranlage zur Warmwasseraufbereitung
UA100353C2 (uk) * 2009-12-07 2012-12-10 Долбі Лабораторіс Лайсензін Корпорейшн Декодування цифрових потоків кодованого багатоканального аудіосигналу з використанням адаптивного гібридного перетворення
TWI444989B (zh) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
EP3144932B1 (en) 2010-08-25 2018-11-07 Fraunhofer Gesellschaft zur Förderung der Angewand An apparatus for encoding an audio signal having a plurality of channels
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
TWI480860B (zh) 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術
US8527264B2 (en) 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
EP2704142B1 (en) 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal

Also Published As

Publication number Publication date
HUE032018T2 (en) 2017-08-28
BR112015019525A2 (pt) 2017-07-18
DK2956934T3 (en) 2017-02-27
MX2015010166A (es) 2015-12-09
TW201447867A (zh) 2014-12-16
WO2014126683A1 (en) 2014-08-21
UA113682C2 (xx) 2017-02-27
CA2898271C (en) 2019-02-19
US9489956B2 (en) 2016-11-08
IN2015MN01955A (pt) 2015-08-28
US20160005413A1 (en) 2016-01-07
AU2014216732A1 (en) 2015-07-30
CA2898271A1 (en) 2014-08-21
CL2015002277A1 (es) 2016-02-05
JP6138279B2 (ja) 2017-05-31
AR094775A1 (es) 2015-08-26
MX344170B (es) 2016-12-07
TWI618051B (zh) 2018-03-11
RU2015133584A (ru) 2017-02-21
IL239945B (en) 2019-02-28
EP2956934A1 (en) 2015-12-23
SG11201506129PA (en) 2015-09-29
HK1218674A1 (zh) 2017-03-03
KR20150109400A (ko) 2015-10-01
PL2956934T3 (pl) 2017-05-31
AU2014216732B2 (en) 2017-04-20
KR101724319B1 (ko) 2017-04-07
CN105900168A (zh) 2016-08-24
CN105900168B (zh) 2019-12-06
JP2016510569A (ja) 2016-04-07
IL239945A0 (en) 2015-08-31
EP2956934B1 (en) 2017-01-04
RU2620714C2 (ru) 2017-05-29

Similar Documents

Publication Publication Date Title
BR112015019525B1 (pt) Método, aparelho e mídia não transitória que possui um método armazenado na mesma.
BR112015018522B1 (pt) Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
BR112015018981B1 (pt) Método, aparelho e mídia não transitória para descorrelação de sinal em um sistema de processamento de áudio
US9830917B2 (en) Methods for audio signal transient detection and decorrelation control
US20150371646A1 (en) Time-Varying Filters for Generating Decorrelation Signals

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 22/01/2014, OBSERVADAS AS CONDICOES LEGAIS.