BR112013004362B1 - aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida - Google Patents

aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida Download PDF

Info

Publication number
BR112013004362B1
BR112013004362B1 BR112013004362-8A BR112013004362A BR112013004362B1 BR 112013004362 B1 BR112013004362 B1 BR 112013004362B1 BR 112013004362 A BR112013004362 A BR 112013004362A BR 112013004362 B1 BR112013004362 B1 BR 112013004362B1
Authority
BR
Brazil
Prior art keywords
signal
transient
signal component
phase
correlator
Prior art date
Application number
BR112013004362-8A
Other languages
English (en)
Other versions
BR112013004362A2 (pt
Inventor
Achim Kuntz
Sascha Disch
Jürgen Herre
Fabian Kuech
Johannes Hilpert
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44509236&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BR112013004362(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of BR112013004362A2 publication Critical patent/BR112013004362A2/pt
Publication of BR112013004362B1 publication Critical patent/BR112013004362B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Error Detection And Correction (AREA)
  • Optical Communication System (AREA)

Abstract

APARELHO PARA A GERAÇÃO DE UM SINAL DESCORRELACIONADO UTILIZANDO INFORMAÇÃO DE FASE TRANSMITIDA. Um aparelho para gerar um sinal descorrelacionado que compreende uma unidade de recepção (650) para receber informação de fase, um separador de transientes (310; 410; 510; 610; 710; 910), um descorrelacionador de transientes (320;420;520;620;720;920), um segundo descorrelacionador (330; 430; 530; 630; 730; 930) e uma unidade de combinação (340; 440; 540; 640; 740; 940), em que o separador de transientes (310; 410; 510; 610; 710; 910) está adaptada para separar um sinal de entrada. O descorrelacionador de transientes (320, 420, 520, 620, 720, 920) está adaptada para aplicar a informação de fase recebida por uma unidade de recepção (650) em um componente de sinal transiente.

Description

APARELHO PARA A GERAÇÃO DE UM SINAL DESCORRELACIONADO UTILIZANDO INFORMAÇÃO DE FASE TRANSMITIDA
A presente invenção refere-se ao campo de processamento de áudio e de decodificação de áudio, em particular, para a decodificação de um sinal que compreende transientes.
O processamento de áudio e / ou decodificação tem avançado de muitas maneiras. Em particular, as aplicações de áudio espacial têm se tornado cada vez mais importantes. O processamento de sinal de áudio é usado freqüentemente para descorrelacionar ou reproduzir sinais. Além disso, a descorrelação e reprodução de sinais são utilizadas no processo de conversão mono para estéreo, conversão mono para estéreo multi-canal, reverberação artificial, ampliação de estéreo ou mistura / reprodução interativa do usuário.
Vários sistemas de processamento de sinal de áudio empregam dispositivos de descorrelação. Um exemplo importante é a aplicação de sistemas de descorrelacionamento em decodificadores paramétricos de áudio espacial para restabelecer as propriedades específicas de descorrelacionamento entre dois ou mais sinais que são reconstruídos a partir de um ou vários sinais de mistura. A aplicação de dispositivos de descorrelação melhora significativamente a qualidade percebida do sinal de saída, por exemplo, quando comparada a intensidade do estéreo. Especificamente, o uso de dispositivos de descorrelação permite a síntese adequada de som espacial com uma imagem larga de som, vários objetos sonoros simultâneos ou ambiente. No entanto, sabe-se que os dispositivos de descorrelação também introduzem erros como mudanças na estrutura do sinal temporal, timbre, etc.
Outros exemplos de aplicação de dispositivos de descorrelação em processamento de áudio são, por exemplo, a geração de reverberação artificial para mudar a impressão espacial ou a utilização de dispositivos de descorrelação em sistemas de cancelamento de eco acústico multi-canal para melhorar o comportamento de convergência.
Uma aplicação típica do estado da arte de um dispositivo de descorrelação num conversor mono para estéreo, usada por exemplo no Estéreo Paramétrico (PS), encontra-se ilustrada na Fig. 1, onde um sinal de entrada mono M (um sinal "seco") é fornecido para um dispositivo de descorrelação 110. O dispositivo de descorrelação 110 descorrelaciona o sinal de entrada M de acordo com um método de descorrelação para oferecer um sinal descorrelacionado D (um sinal "úmido") na sua saída. O sinal descorrelacionado D é alimentado para um misturador 120, como um primeiro sinal de entrada do misturador, juntamente com o sinal mono M seco como um segundo sinal de entrada do misturador. Além disso, uma unidade de controle de mistura 130 alimenta os parâmetros de controle de conversão na entrada do misturador 120. O misturador 120 gera então dois canais de saída L e R (L = canal esquerdo de saída estéreo; R = canal direito de saída estéreo) de acordo com uma matriz de mistura H. Os coeficientes da matriz de mistura pode ser corrigidos com dependência no sinal ou com controle de um usuário.
Alternativamente, a matriz de mistura é controlada pela informação adicional que é transmitida juntamente com a mistura contendo uma descrição paramétrica de como converter os sinais da mistura para formar a desejada saída multi-canal. Esta informação espacial normalmente é gerada durante o processo de mistura mono em um codificador de sinal concordante.
Este princípio é amplamente aplicado em codificação de áudio espacial como Estéreo Paramétrico, ver como exemplo, J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bit Rates” ("Codificação de Áudio Espacial Paramétrico de Alta Qualidade em taxas de transferência baixas") em Anais da Convenção 116 da AES, Berlim, Preprint 6072, maio de 2004.
Um estado da arte típico da estrutura de um decodificador estéreo paramétrico é ilustrado na Fig. 2, onde um processo de descorrelação é realizado num domínio de transformação. Um conjunto de filtros de análise 210 transforma um sinal de entrada mono para um domínio de transformação, por exemplo, num domínio de freqüência. A descorrelação do sinal de entrada mono M transformado é então realizada pelo dispositivo de descorrelação 220 que gera um sinal descorrelacionado D. Tanto o sinal de entrada mono M transformado quanto o sinal descorrelacionado D são alimentados na matriz de mistura 230. A matriz de mistura 230 em seguida gera dois sinais de saída L e R usando parâmetros de conversão, os quais são fornecidos pela unidade de modificação de parâmetros 240, que possui parâmetros espaciais e que está conectada à unidade de controle de parâmetros 250. Na Fig. 2, os parâmetros espaciais podem ser modificados por um usuário ou com ferramentas adicionais, por exemplo, de pós-processamento para processamento/apresentação para uma percepção de som em ambos os ouvidos. Neste exemplo, os parâmetros de conversão são combinados com os parâmetros dos filtros binaurais para formar os parâmetros de entrada para a matriz de conversão. Finalmente, os sinais de saída gerados pela matriz de mistura 230 são alimentados em um conjunto de filtros de síntese 260, que determinam o sinal de saída estéreo.
A saída L (esquerda) / R (direita) da matriz de mistura 230 é calculada a partir do sinal de entrada mono Meo sinal descorrelacionado D de acordo com a regra de mistura, por exemplo, através da aplicação da seguinte fórmula:
Figure img0001
Na matriz de mistura, a quantidade de som descorrelacionado alimentado para a saída é controlada em função de parâmetros de transmissão, por exemplo, a Correlação/Coerência entre Canais (ICC) e / ou configurações fixas ou definidas pelo usuário.
Por conceito, o sinal de saída do descorrelacionador de saída D substitui um sinal residual que idealmente permitiria uma perfeita descodificação dos sinais originais L (esquerdo) / R (direito). O uso do descorrelacionador de saída D no lugar de um sinal residual nos resultados do conversor resulta em economia da taxa de transferência de bits que seriam exigidos para transmitir o sinal residual. O objetivo do descorrelacionador é portanto gerar um sinal D a partir do sinal mono M, que exibe propriedades semelhantes, como o sinal residual, que é substituído por D.
De forma correspondente, no aspecto do codificador, dois tipos de parâmetros espaciais são extraídos: um primeiro grupo de parâmetros contém parâmetros de correlação/coerência (por exemplo, ICCs = parâmetros de Correlação/Coerência entre Canais) que representam a coerência ou a correlação cruzada entre os dois canais de entrada que devem ser codificados. Um segundo grupo de parâmetros inclui parâmetros de diferença de nível (por exemplo, ILDs = parâmetros de Diferença de Nível entre Canais) que representam a diferença de nível entre os dois canais de entrada.
Além disso, um sinal de mistura é gerado pela mistura dos dois canais de entrada. Além disso, um sinal residual é gerado. Sinais residuais são sinais que podem ser usados para regenerar os sinais originais pelo emprego adicional do sinal de mistura e uma matriz de mistura. Quando, por exemplo, N sinais são misturados formando um sinal, a mistura é tipicamente de um dos N componentes que resultam a partir do mapeamento dos sinais de N entradas. Os componentes restantes resultantes do mapeamento (por exemplo, componentes N-1) são os sinais residuais e permitem reconstruir os sinais originais N através de um mapeamento inverso. Esse mapeamento pode, por exemplo, ser uma rotação. O mapeamento deve ser realizado de tal modo que o sinal de mistura é maximizado e os sinais residuais são minimizados, por exemplo, semelhante a uma transformação do eixo principal. Por exemplo, a energia do sinal de mistura deve ser maximizada e as energias dos sinais residuais devem ser minimizadas. Quando a mistura de dois sinais gera um sinal, a mistura é normalmente um dos dois componentes que resultam a partir do mapeamento dos dois sinais de entrada. O restante do componente resultante do mapeamento é o sinal residual e permite reconstruir os 2 sinais originais por meio de um mapeamento inverso.
Em alguns casos, o sinal residual pode representar um erro associado com a representação dos dois sinais pela mistura destes e os parâmetros associados. Por exemplo, o sinal residual pode ser um sinal de erro, que representa o erro entre os canais originais L, R e canais L ', R', resultantes da conversão do sinal de mistura que foi gerado com base nos canais L e R. originais.
Em outras palavras, um sinal residual pode ser considerado como um sinal no domínio do tempo ou no domínio da frequência de um ou de um domínio de sub-banda, que em conjunto com o sinal de mistura unicamente ou com a combinação entre o sinal de mistura e as informações paramétricas permite uma reconstrução correta ou quase correta de um canal original. A definição do termo "quase correto" tem de ser entendida de forma que a reconstrução com o sinal residual com uma energia maior do que zero é algo mais próximo do canal original em comparação com uma reconstrução utilizando uma mistura sem o sinal residual ou usando a mistura e as informações paramétricas sem o sinal residual.
Considerando o formato MPEG Surround (MPS), estruturas semelhantes a PS denominadas caixas um para dois (caixas OTT) são empregadas nas árvores de decodificação de áudio espacial. Isto pode ser visto como uma generalização do conceito de esquemas de conversão mono para estéreo para esquemas de codificação/decodificação de áudio espacial. No formato MPS, os sistemas conversão de dois para três (caixas TTT), também podem aplicar descorrelacionadores, dependendo do modo de operação TTT. Os pormenores são descritos no documento J. Herre, K. Kjörling, J. Breebaart, et al., “MPEG surround--the ISO/MPEG standard for efficient and compatible multi-channel audio coding,” ("Formato MPEG surround - o padrão ISO/MPEG para codificação de áudio multi-canal compatível e eficiente", em Anais da AES 122th Convenção de Viena, Áustria, maio de 2007.
Quanto a Codificação de Áudio Direcional (DirAC), DirAC diz respeito a um esquema de codificação de campo de som paramétrico que não está vinculado a um número fixo de canais de saída de áudio com posições fixas dos alto-falantes. Dirac aplica descorrelacionadores no processador de Dirac, ou seja, no decodificador de áudio espacial para sintetizar componentes não coerentes de campos acústicos. Mais informações relativas a codificação de áudio direcional podem ser encontradas em Pulkki, Ville: “Spatial Sound Reproduction with Directional Audio Coding” ("Reprodução de Som Espacial com Codificação de Áudio Direcional"), em J. Audio Eng.. Soe., Vol. 55, n ° 6, de 2007.
Em relação aos descorrelacionadores estado da arte em decodificadores de áudio espacial, é feita referência ao Padrão Internacional ISO / IEC “Information Technology-MPEG audio technologies - Part1: MPEG Surround” ("Tecnologia da Informação -Tecnologia de áudio MPEG - Parte 1: MPEG Surround"), ISO / IEC 23003-1:2007 e também para J. Engdegard, H . Purnhagen, J. Roden, L.Liljeryd “Synthetic Ambience in Parametric Stereo Coding” ("Ambiência Sintética na Codificação de Estéreo Paramétrico") nos procedimentos da Convenção 116 da AES, Berlim, pré-impressão, maio de 2004. Estruturas de filtro de resposta de tempo infinito (IIR) que passam todas freqüências igualmente são usadas como descorrelacionadores em decodificadores de áudio espacial como o formato MPS, conforme descrito em J. Herre, K. Kjörling, J. Breebaart, et ai. “MPEG surround—the ISO/MPEG Standard for efficient and compatible multi-channel audio coding,” ("Formato MPEG Surround - o padrão ISO/MPEG para codificação de áudio multi-canal compatível e eficiente"), em Anais da AES, Convenção 122 em Viena, Áustria, maio de 2007, e conforme descrito na norma internacional ISO / IEC“ Information Technology- MPEG audio technologies - Part 1: MPEG Surround” ("Tecnologia da Informação - tecnologias de áudio MPEG - Parte 1 : MPEG Surround") ISO / IEC 23003-1:2007. Outros descorrelacionadores com este estado da arte aplicam (potencialmente dependentes da freqüência) atrasos aos sinais descorrelacionados ou promovem convolução dos sinais de entrada, por exemplo, com picos de ruído de decomposição exponencial. Para uma visão geral dos descorrelacionadores com este estado da arte para sistemas de conversão de áudio espacial, consulte “Synthetic Ambience in Parametric Stereo Coding” ("Ambiência Sintética em Codificação em Estéreo Paramétrico"), em Anais da Convenção 116 da AES, Berlim, pré-impressão, maio de 2004.
Uma outra técnica de processamento de sinais é o "processamento de conversão semântica". O processamento de conversão semântica é uma técnica para decompor os sinais em componentes com diferentes propriedades semânticas (isto é, classes de sinal) e para aplicar estratégias de conversão diferentes para os diversos componentes de sinal. Os algoritmos diferentes de conversão podem ser otimizados de acordo com as diferentes propriedades semânticas, a fim de melhorar o esquema geral de processamento de sinal. Este conceito está descrito na Patente WO/2010/017967, "An apparatus for determining a spatial output multichannel-channel audio signal" (Um aparelho para determinar um sinal de saída de áudio espacial multicanal), pedido de patente Internacional, PCT/EP2009/005828, 11.8.2009, 2010/11/06 (FH090802PCT).
Um esquema adicional de codificação de áudio espacial é o "método de permutação temporal", tal como descrito por Hotho, G., van de Par, S., e Breebaart, J.: “Multichannel coding of applause signals" ("A codificação multi-canal dos sinais de aplauso"), EURASIP Journal on Advances in Signal Processing, janeiro de 2008, art.10. DOI = http://dx.doi.org/10.1155/2008/. Neste documento, um esquema de codificação de áudio espacial é proposto, adaptado para a codificação / decodificação de sinais como aplausos.
Esse esquema baseia-se na semelhança perceptual de segmentos de um sinal de áudio monofônico, especificamente um sinal de mistura de um codificador de áudio espacial. O sinal de áudio monofônico é segmentado em segmentos de tempo sobrepostos. Estes segmentos são temporariamente pseudo permutados aleatoriamente (mutuamente independentes para canais de n saídas) dentro de um "super"-bloco, para formar os canais de saída descorrelacionados.
Uma técnica adicional de codificação de áudio espacial é o "atraso temporal e o método de troca". Na Patente DE 10 2007 0180 32 A: 20070417, Erzeugungng dekorrelierter Signale, 2007/04/17, 2008/10/23 (FH070414PDE), um esquema é proposto que também é adaptado para a codificação / decodificação de sinais como de aplausos, para apresentação binaural. Este esquema também depende da similaridade de percepção de segmentos de um sinal de áudio monofônico e atrasos nos canais de saída em relação ao outro sinal. De modo a evitar um desvio de localização para o canal principal, canais de guia e de atraso são trocados periodicamente.
Em geral, sinais multicanal ou estéreo, similares a aplauso, codificados/decodificados em codificadores de áudio espacial são responsáveis por reduzir a qualidade de sinal (ver, por exemplo, Hotho, G., van de Par, S., e Breebaart, J.: “Multichannel coding of applause signals” ("Codificação Multicanal de Sinais de Aplauso"), EURASIP Journal on Advances in Signal Processing (Jornal sobre Avanços em Processamento de Sinais), janeiro 2008, art.10. DOI = http://dx.doi.org/10.1155/2008/531693, ver também DE 10 2007 0180 32 A). Sinais semelhantes a aplausos são caracterizados por conteúdos de misturas temporariamente densas de transientes de diferentes direções. Exemplos de tais sinais são aplausos, o som da chuva, cavalos a galope, etc. Sinais semelhantes a aplausos muitas vezes também contêm componentes de som a partir de fontes sonoras distantes, que estão perceptivelmente fundidas num campo de som de fundo semelhante a um ruído suave.
As técnicas de descorrelação do estado da arte empregadas nos decodificadores de áudio espacial como MPEG Surround contêm estruturas de passagem de freqüência. Estas agem como geradores de reverberação artificiais e são, consequentemente, bem adequadas para gerar sons de imersão como ruídos suaves, homogêneos (como caudas de reverberação de quarto). No entanto, há exemplos de campos acústicos com uma estrutura espaço temporal não homogênea que ainda estão envolvendo o ouvinte: um exemplo de destaque são campos sonoros semelhantes a aplausos que criam um envoltório no ouvinte, não só por campos de ruído homogêneo, mas também por sequências bastante densas de palmas individuais de diferentes direções. Assim, o componente não homogêneo do som de aplauso pode ser caracterizado por uma mistura distribuída espacialmente de transientes. Obviamente, esses aplausos distintos não são, de forma alguma, homogêneos ou suaves.
Devido ao comportamento de reverberação, os dispositivos de descorrelação de passagem de freqüências são incapazes de gerar um campo imersivo de som com as características, por exemplo, de aplausos. Em vez disso, quando aplicados a sinais semelhantes a aplausos, tendem a espalhar os transientes temporariamente nos sinais. O resultado indesejável é um campo de som envolvente sem a estrutura espaço temporal distintiva de campos de som semelhante a aplausos. Outros eventos transientes, como uma única palma poderiam despertar erro de som dos filtros de descorrelação.
Um sistema de acordo com Hotho, G., van de Par, S., e Breebaart, J.: “Multichannel coding of applause signals” ("Codificação Multi-canal de sinais de aplauso", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art.10. DOI http://dx.doi.org/10-1155/2008/531693, vai expor a degradação perceptível do som de saída, devido a uma certa qualidade repetitiva no sinal de áudio de saída. Isto é devido ao fato de um e do mesmo segmento do sinal de entrada parecer inalterado em cada canal de saída (embora em um ponto diferente no tempo). Além disso, para evitar a densidade aumentada de aplausos, alguns canais originais têm de ser derrubados na conversão e, assim, algum evento auditivo importante pode ser perdido na conversão resultante. O método só é aplicável se for possível encontrar segmentos de sinal que compartilhem as mesmas propriedades perceptivas, ou seja: segmentos de sinal que parecem similares. O método, em geral, altera bastante a estrutura temporal dos sinais, o que pode ser aceitável apenas para pouquíssimos sinais. No caso da aplicação do esquema para sinais semelhantes a aplausos (por exemplo, devido a erro de classificação de sinal), a permutação temporal conduzirá na maioria das vezes a resultados inaceitáveis. A permutação temporal limita ainda mais a aplicabilidade aos casos em que vários segmentos do sinal podem ser misturados sem erro como ecos ou filtro pente. Inconvenientes semelhantes aplicam-se ao método descrito na Patente DE 10 2007 0180 32 A.
O processamento da conversão semântica descrito na Patente WO/2010/017967 separa os componentes de transientes de sinais antes da aplicação dos descorrelacionadores. O sinal restante (isento de transientes) é alimentado para a descorrelação convencional e para oprocessador de conversão, ao passo que os sinais transientes são tratados de maneira diferente: os últimos são (por exemplo, de forma aleatória) distribuídos para diferentes canais de estéreo para sinal de saída multi-canal pela aplicação de técnicas de balanço de amplitude. O balanço de amplitude mostra várias desvantagens:
O balanço de amplitude não produz necessariamente um sinal de saída que é semelhante ao original. O sinal de saída pode ser apenas próximo do original se a distribuição dos transientes no sinal original puder ser descrito por leis de balanço de amplitude. Ou seja: o balanço de amplitude só pode reproduzir puramente os eventos de amplitude balanceada corretamente, mas não as diferenças de fase ou de tempo entre os componentes de transientes em canais de saída diferentes.
Além disso, a aplicação da abordagem de balanço de amplitude em MPS exigiria um desvio não somente do descorrelacionador mas também da matriz de conversão. Uma vez que a matriz de conversão reflete os parâmetros espaciais (Correlações entre canais: ICCs, Diferenças de nível entre canais: ILDs) que são necessários para sintetizar uma saída de conversão que mostra as propriedades espaciais corretas, o sistema de balanço em si tem que aplicar alguma regra para sintetizar os sinais de saída com as propriedades espaciais corretas. Uma regra genérica para fazer isso não é conhecida. Além disso, esta estrutura aumenta a complexidade uma vez que os parâmetros espaciais têm que ser verificados em dois momentos: primeiro para a parte não transiente do sinal e, em segundo, para a parte de transiente balanceada da amplitude do sinal.
É, portanto, um objeto da presente invenção oferecer um conceito melhorado para gerar um sinal descorrelacionado. O objeto da presente invenção é resolvido por um dispositivo para gerar um sinal descorrelacionado de acordo com a reivindicação 1, através de um aparelho para a codificação de um sinal áudio de acordo com a reivindicação 11 e por um método para gerar um sinal descorrelacionado de acordo com a reivindicação 13 e por um programa de computador de acord com a reivindicação 15.
Um aparelho de acordo com uma caracterização compreendendo um separador de transientes para separar um sinal de entrada para um primeiro componente de sinal e para um segundo componente de sinal de tal modo que o primeiro componente de sinal compreende porções de sinal transiente do sinal de entrada e de tal modo que o componente do segundo sinal compreende porções de sinal não transiente do sinal de entrada. O separador de transientes pode separar os componentes de sinal diferentes um do outro para permitir que os componentes de sinal que compreendem os transientes possam ser processados de forma diferente que os componentes de sinal que não contêm transientes.
O aparelho compreende ainda um descorrelacionador de transiente para descorrelacionar componentes de sinal contendo os transientes de acordo com um método de descorrelação, que é particularmente adequado para descorrelacionar os componentes de sinal compreendendo transientes. Além disso, o aparelho compreende um segundo descorrelacionador para descorrelacionar componentes de sinal que não compreendem transientes.
Assim, o aparelho é capaz de processar tanto componentes de sinal utilizando um descorrelacionador padrão ou, como alternativa, processar os componentes de sinal usando o descorrelacionador de transiente particularmente adequado para o processamento de componentes de sinal transiente. Numa caracterização, o separador de transientes decide se um componente de sinal é alimentado para um descorrelacionador padrão ou para um descorrelacionador de transiente.
Além disso, o aparelho pode ser adaptado para separar um componente de sinal de tal modo que o componente de sinal é parcialmente alimentado para um descorrelacionador de transiente e parcialmente alimentado para um segundo descorrelacionador.
Além disso, o aparelho compreende uma unidade de combinação para combinar os componentes de sinal de saída pelo descorrelacionador padrão e o descorrelacionador de transiente para gerar um sinal de combinação descorrelacionado.
Numa forma de realização, o aparelho compreende uma unidade de recepção para receber informação de fase, sendo que o descorrelacionador de transientes está adaptador para aplicar a informação de fase para o primeiro compoente de sinal. A informação de fase poderá ser gerada por um codificador adequado.
Numa outra caracterização, o misturador é adaptado para receber dados de parâmetros de correlação/coerência indicando uma correlação ou coerência entre os dois sinais e está adaptado para gerar os sinais de saída com base nos dados de parâmetros de correlação/coerência. Numa outra concretização, o misturador é adaptado para receber dados de parâmetros de diferença de nível indicando uma diferença de energia entre os dois sinais e está adaptado para gerar os sinais de saída com base nos dados dos parâmetros de diferença de nível. Numa tal caracterização, o descorrelacionador de transiente, o segundo descorrelacionador e a unidade de combinação não têm que ser adaptados para processar tais dados de parâmetros, pois o misturador irá processar os dados correspondentes. Por outro aspecto, um misturador convencional com correlação/coerência convencional e processamento de parâmetro de diferença de nível pode ser empregado em tal caracterização.
Numa caracterização, o separador de transientes é adaptado para alimentar uma porção de sinal considerada de um sinal de entrada do aparelho para o descorrelacionador de transientes ou para alimentar a porção do sinal considerado no segundo descorrelacionador, dependendo da informação de separação de transientes, que indica que a porção de sinal considerado compreende um transiente ou indica que a porção de sinal considerado não compreende um transiente. Esta caracterização permite um fácil processamento de informação de separação de transiente.
Numa outra caracterização, o separador de transientes é adaptado para alimentar parcialmente uma porção de sinal considerado de um sinal de entrada do aparelho para um descorrelacionador de transientes e para parcialmente alimentar a porção do sinal considerado no segundo descorrelacionador. A quantidade da porção do sinal considerada que é alimentada para dentro do separador de transientes e a quantidade da porção de sinal considerada que é alimentada para o segundo descorrelacionador depende da informação de separação de transiente. Por isso, a força de um transiente pode ser levada em consideração.
Numa outra caracterização, o separador de transientes é adaptado para separar um sinal de entrada de um aparelho que é representado em um domínio de freqüência. Isto permite o processamento transiente dependente de freqüência (separação e descorrelação). Assim, certos componentes do sinal de uma primeira banda de freqüência podem ser processados de acordo com um método de descorrelação transiente, enquanto que os componentes de sinal de outra banda de freqüência podem ser processados de acordo com um outro método, por exemplo, um método de descorrelação convencional. Deste modo, numa caracterização, o separador de transientes é adaptado para separar um sinal de entrada de um aparelho com base na informação de separação de transiente dependente da freqüência. No entanto, numa caracterização alternativa, o separador de transientes é adaptado para separar um sinal de entrada de aparelho com base na informação de separação independente da freqüência. Isto permite um processamento mais eficiente de sinal de transiente.
Numa outra caracterização, o separador de transientes pode ser adaptado para separar um sinal de entrada de um aparelho que é representado em um domínio de freqüência, de tal forma que todas as partes do sinal de entrada do aparelho dentro de uma primeira gama de freqüências são alimentadas para um segundo descorrelacionador. Um aparelho correspondente é, por conseguinte, adaptado para restringir o processamento de sinal transiente para os componentes de sinal com freqüências do sinal em uma segunda gama de freqüências, enquantoque nenhum componente do sinal com freqüências de sinal na primeira gama de freqüências é alimentado no descorrelacionador de transiente (mas em vez disso para o segundo descorrelacionador).
Numa caracterização adicional, o descorrelacionador de transiente pode ser adaptado para descorrelacionar o primeiro componente de sinal através da aplicação de informação de fase que representa a diferença de fase entre um sinal residual e um sinal de mistura. No aspecto do codificador, uma matriz "reversa" de mistura pode ser utilizada para criar um sinal de mistura e um sinal residual, por exemplo, a partir dos dois canais de um sinal estéreo, tal como foi explicado acima. Enquanto o sinal de mistura pode ser transmitido para o descodificador, o sinal residual pode ser descartado. De acordo com uma caracterização, a diferença de fase empregada pelo descorrelacionador de transiente pode ser a diferença de fase entre o sinal residual e o sinal de mistura. Pode assim ser possível reconstruir um sinal residual "artificial", através da aplicação da fase inicial do residual na mistura. Numa caracterização, a diferença de fase pode estar relacionada com uma certa banda de freqüência, ou seja, pode ser dependente da frequência. Alternativamente, uma diferença de fase não se refere a certas bandas de freqüência, mas pode ser aplicada como um parâmetro de banda larga independente de freqüência.
Numa caracterização adicional, uma condição de fase pode ser aplicada ao primeiro componente de sinal através da multiplicação da condição de fase com o primeiro componente de sinal.
Numa caracterização adicional, o segundo descorrelacionador pode ser um descorrelacionador convencional, por exemplo, um descorrelacionador com estruturas de filtro de resposta de tempo infinito (IIR).
Numa caracterização, o aparelho compreende um misturador adaptado para receber sinais de entrada e, para além disso, adaptado para gerar sinais de saída e numa base de mistura. Um sinal de entrada do aparelho é alimentado num separador de transientes, e posteriormente, descorrelacionado por um separador de transientes e/ou um segundo descorrelacionador, conforme descrito acima. A unidade de combinação e o misturador podem estar dispostos de modo que o sinal de combinação descorrelacionado seja alimentado para o misturador como primeiro sinal de entrada no misturador. Um segundo sinal de entrada no misturador pode ser o sinal de entrada do aparelho ou um sinal derivado do sinal de entrada do aparelho. Uma vez que o processo de descorrelação está concluído quando o sinal de combinação descorrelacionado é alimentado para o misturador, a descorrelação de transientes não foi considerado pelo misturador. Assim sendo, pode ser empregue um misturador convencional.
Numa outra caracterização, o misturador está adaptado para receber dados de parâmetro de correlação/coerência indicando uma correlação ou coerência entre dois sinais e está adaptado para gerar os sinais de saída com base nos dados de parâmetro de correlação/coerência. Numa outra caracterização, o misturador está adaptado para receber dados de parâmetro de diferente nível indicando uma diferença de energia entre dois sinais e está adaptado para gerar sinais de saída com base nos dados de parâmetro de diferente nível. Numa caracterização desse tipo, o descorrelacionador de transientes, o segundo descorrelacionador e a unidade de combinação não têm de ser adaptados para processar esses dados de parâmetro, já que o misturador irá tratar de processar os dados correspondentes. Por outro lado, um misturador convencional com correlação/coerência convencional e processamento de parâmetros de diferente nível poder ser empregue numa caracterização desse tipo.
As caracterizações são agora explicadas em mais pormenores com referência às figuras, em que:
Fig. 1 ilustra uma aplicação do estado da arte de um descorrelacionador num conversor mono para estéreo.
Fig. 2 ilustra outra aplicação do estado da arte de um descorrelacionador em uma unidade de mistura mono para estéreo.
Fig. 3 ilustra um aparelho para gerar um sinal descorrelacionado de acordo com uma caracterização.
Fig. 4 ilustra um aparelho para a descodificação de um sinal de acordo com uma caracterização;
Fig. 5 é uma vista geral do sistema de um-para-dois (OTT) de acordo com uma caracterização.
Fig. 6 ilustra um aparelho para gerar um sinal descorrelacionado compreendendo uma unidade de recepção de acordo com uma outra caracterização;
Fig. 7 é uma vista geral do sistema de um-para-dois de acordo com uma outra forma caracterização;
Fig. 8 ilustra exemplos de mapeamentos de medidas de consistência de fase para uma resistência de separação de transiente;
Fig. 9 é uma vista geral do sistema de um-para-dois de acordo com uma outra caracterização adicional;
Fig. 10 ilustra um aparelho para a codificação de um sinal de áudio que tem uma pluralidade de canais.
Fig. 3 ilustra um aparelho para gerar um sinal descorrelacionado de acordo com uma caracterização. O aparelho compreende um separador de transientes 310, um descorrelacionador de transiente 320, um descorrelacionador convencional 330 e uma unidade de combinação 340. A abordagem de tratamento de transiente desta caracterização destina-se a gerar sinais de aplauso descorrelacionados de sinais de áudio semelhantes a aplausos, por exemplo, para a aplicação no processo de conversão de decodificadores de áudio espacial.
Na Fig. 3, um sinal de entrada é fornecido a um separador de transientes 310. O sinal de entrada pode ter sido transformado em um domínio de freqüência, por exemplo, aplicando um conjunto de filtros híbridos QMF. O separador de transientes 310 pode decidir para cada componente de sinal considerado do sinal de entrada se este contém um transiente. Além disso, o separador de transientes 310 pode ser disposto para alimentar a porção do sinal considerado tanto para o descorrelacionador de transiente 320, se a parte do sinal considerado contiver um transiente (componente de sinal s1), ou pode alimentar a porção do sinal considerado no descorrelacionador convencional 330, se a porção de sinal considerado não contiver um transiente (componente do sinal s2). O separador de transientes 310 pode também ser disposto de modo a dividir a parte do sinal considerado em função da existência de um transiente na porção de sinal considerada e fornecê-los parcialmente para o descorrelacionador 320 e parcialmente para o descorrelacionador convencional 330.
Numa caracterização, o descorrelacionador de transiente 320 descorrelaciona o componente de sinal s1 de acordo com um método de descorrelação de transiente que é particularmente adequado para descorrelacionar os componentes de sinal de transientes. Por exemplo, a descorrelação dos componentes do sinal transiente pode ser realizada através da aplicação de informação de fase, por exemplo, através da aplicação de condições de fase. Um método onde as condições de descorrelação de fase são aplicadas sobre os componentes de sinal transiente é explicado a seguir em relação à caracterização da Fig. 5. Tal método de descorrelação pode também ser empregado como método de descorrelação de transiente do descorrelacionador de transiente 320 da caracterização da Fig. 3.
O componente de sinal s2, o qual compreende porções de sinal não transientes, é alimentado para o descorrelacionador convencional 330. O descorrelacionador convencional 330 pode então descorrelacionar o componente de sinal s2 de acordo com um método convencional de descorrelação, por exemplo, através da aplicação de estruturas de passagem de freqüências, por exemplo, um filtro IIR (resposta de impulso infinito).
Depois de ter sido descorrelacionado pelo descorrelacionador convencional 330, o componente de sinal descorrelacionado a partir do descorrelacionador convencional 330 é alimentado para a unidade de combinação 340. O componente de sinal de transiente descorrelacionado do descorrelacionador de transiente 320 é também alimentado na unidade de combinação 340. A unidade de combinação 340, em seguida, combina ambas os componentes de sinal descorrelacionado, por exemplo, pela adição de ambos os componentes de sinal, para obter um sinal de combinação descorrelacionado.
Em geral, um método que descorrelaciona um sinal contendo transientes de acordo com uma caracterização pode ser realizado como se segue:
Em um passo de separação, o sinal de entrada é separado em dois componentes: um componente s1 contendo os transientes do sinal de entrada, outro componente s2 contendo a parte restante (não transiente) do sinal de entrada. O componente não transiente s2 do sinal pode ser processado como em sistemas sem a aplicação do método da descorrelação do descorrelacionador de transiente desta caracterização. Ou seja: o sinal s2 isento de transientes pode ser alimentado a uma ou várias estruturas de processamento de sinal de descorrelação convencionais como estruturas semelhantes a estruturas de passagem de freqüências IIR (resposta de impulso infinito).
Além disso, o componente de sinal contendo as transientes (o fluxo de transiente s1) é alimentado a uma estrutura de "descorrelacionador de transientes" que descorrelaciona o fluxo de transientes, mantendo as propriedades especiais de sinal melhores do que as estruturas convencionais de descorrelação. A descorrelação do fluxo de transientes é realizada mediante a aplicação de informações numa alta resolução temporal. De preferência, a informação da fase compreende as condições da fase. Além disso, é preferível que a informação da fase seja fornecida por um codificador.
Além disso, os sinais de saída de ambos o descorrelacionador convencional e o descorrelacionador de transientes são combinados para formar o sinal descorrelacionado que possa ser utilizado no processo de conversão dos codificadores de áudio espacial. Os elementos (h11, h12, h21, h22) da matriz de mistura (Mmix) do decodificador de áudio espacial podem permanecer inalterados.
A Fig. 4 ilustra um aparelho para decodificar um sinal de entrada de aparelho de acordo com uma caracterização, onde o sinal de entrada de aparelho é alimentado para o separador de transientes 410. O aparelho compreende o separador de transientes 410, um descorrelacionador de transientes 420, um descorrelacionador convencional 430, uma unidade de combinação 440 e um misturador 450. O separador de transientes 410, o descorrelacionador de transiente 420, o descorrelacionador convencional 430 e a unidade de combinação 440 desta caracterização podem ser semelhantes ao separador de transientes 310, ao descorrelacionador de transiente 320, ao descorrelacionador convencional 330 e à unidade de combinação 340 da caracterização da Fig. 3, respectivamente. Um sinal de combinação descorrelacionado gerado pela unidade de combinação 440 é alimentado para um misturador 450 como um primeiro sinal de entrada do misturador. Além disso, o sinal de entrada de um aparelho, que foi alimentado para o separador de transientes 410, é também alimentado para o misturador 450, como um segundo sinal de entrada do misturador. Como alternativa, o sinal de entrada de aparelho não é diretamente alimentado para o misturador 450, mas um sinal derivado do sinal de entrada de aparelho é alimentado para o misturador 450. Um sinal pode ser derivado a partir do sinal de entrada de aparelhos, por exemplo, através da aplicação de um método convencional de processamento de sinal para o sinal de entrada do aparelho, por exemplo, aplicando um filtro. O misturador 450 da caracterização da FIG. 4 é adaptado para gerar sinais de saída com base nos sinais de entrada e em uma regra de mistura. Tal regra de mistura pode ser, por exemplo, para multiplicar os sinais de entrada e uma matriz de mistura, por exemplo, através da aplicação da fórmula:
Figure img0002
O misturador 450 pode gerar os canais de saída L, R, com base nos dados de parâmetros de correlação/coerência, por exemplo, a Correlação/Coerência entre Canais (ICC), e/ou dos dados de parâmetros de diferença de nível, por exemplo, uma Diferença de Nível entre Canais (ILD). Por exemplo, os coeficientes de uma matriz de mistura podem depender dos dados de parâmetros de correlação/coerência e/ou dos dados de parâmetros de diferença de nível. Na caracterização da Fig. 4, o misturador 450 gera dois canais de saída L e R. No entanto, em caracterizações alternativas, o misturador pode gerar uma pluralidade de sinais de saída, por exemplo, 3, 4, 5 ou 9 sinais de saída, que podem ser sinais sonoros envolventes.
A Fig. 5 mostra uma vista geral do sistema da abordagem do tratamento de transientes num sistema de conversão 1 para 2 (OTT) de uma caracterização, por exemplo, uma caixa de 1-para-2 de um decodificador de áudio espacial MPS (MPEG Surround). A via de sinal paralelo para os transientes separados de acordo com uma caracterização é constituída na caixa em forma de U de manuseamento de transientes. Um sinal de entrada do aparelho DMX é fornecido a um separador de transientes 510. O sinal de entrada do aparelho pode ser representado de um domínio de freqüências. Por exemplo, um sinal de entrada de domínio de tempo pode ter sido transformado em domínio de freqüência através da aplicação de um conjunto de filtros QMF, como usado no formato MPEG Surround. O separador de transientes 510 pode então alimentar os componentes do sinal de entrada do aparelho DMX para um descorrelacionador de transiente 520 e/ou um descorrelacionador de passagem de freqüências IIR (resposta de tempo infinito). Os componentes do sinal de entrada do aparelho são então descorrelacionados pelo descorrelacionador transiente 520 e/ou pelo descorrelacionador IIR (resposta de tempo infinito) 530. Em seguida, os componentes de sinal descorrelacionado D1 e D2 são combinados por uma unidade de combinação 540, por exemplo, pela adição de ambos os componentes de sinal, para obter um sinal de combinação descorrelacionado D. O sinal de combinação descorrelacionado é alimentado a um misturador 552, como um primeiro sinal de entrada do misturador D. Além disso, o sinal de entrada do aparelho DMX (ou, em alternativa: um sinal derivado do sinal de entrada do aparelho DMX) também é alimentado para dentro do misturador 552, como um segundo sinal de entrada do misturador. O misturador 552 gera então um primeiro e um segundo sinal "seco", dependendo do sinal de entrada do aparelho DMX. O misturador 552 também gera um primeiro e segundo sinal de "úmido", dependendo da combinação do sinal descorrelacionado D. Os sinais, gerados pelo misturador 552, podem também ser gerados com base nos parâmetros transmitidos, por exemplo, os dados dos parâmetros de correlação/coerência, por exemplo, Correlação/Coerência entre Canais (ICC), e/ou os dados dos parâmetros de diferença de nível, por exemplo, Diferença de Nível entre Canais (ILD). Em umauma caracterização, os sinais gerados pelo misturador 552 podem ser fornecidos a uma unidade de modelamento 554, que modela os sinais fornecidos com base em dados de modelamento temporal fornecidos. Em outras caracterizações, nenhum modelamento de sinal é realizado. Os sinais gerados são então fornecidos a uma primeira 556 ou segunda 558 unidade de adição que combinam os sinais fornecidos para gerar um primeiro sinal de saída L e um segundo sinal de saída R, respectivamente.
Os princípios de processamento, representados na Fig. 5, podem ser aplicados em sistemas de conversão mono-para-estéreo (por exemplo, codificadores de áudio estéreo), bem como em configurações de múltiplos canais (por exemplo, formato MPEG Surround). Em caracterizações, o esquema de tratamento de transientes proposto pode ser aplicado como um melhoramento para sistemas existentes de conversão sem grandes modificações conceituais do sistema de conversão, uma vez que apenas um percurso de sinal paralelo de descorrelacionador é introduzido, sem alterar o processo de conversão em si.
A separação de sinal no componente de transientes e não transientes é controlada pelos parâmetros que podem ser gerados num codificador e/ou no decodificador de áudio espacial. O descorrelacionador de transientes 520 utiliza a informação da fase, por exemplo, as condições da fase que podem ser obtidas no codificador ou no decodificador de áudio espacial. Variantes possíveis para a obtenção de parâmetros de manuseio de transientes (ou seja: parâmetros da separação de transientes como posições de transientes ou a força da separação e parâmetros da descorrelação de transientes como informação da fase) são descritos abaixo.
O sinal de entrada pode ser representado em um domínio da freqüência. Por exemplo, um sinal pode ter sido transformado em um domínio da freqüência através da utilização de um conjunto de filtros de análise. Um conjunto de filtros QMF pode ser aplicado para se obter uma pluralidade de sinais de sub-banda a partir de um sinal no domínio do tempo.
Para melhor qualidade de percepção, o processamento de sinal transiente pode ser de preferência restrito para freqüências de sinal na faixa de freqüência limitada. Um exemplo seria o de limitar o intervalo de processamento da banda de freqüência para os índices k = 8 de um conjunto de filtros híbridos QMF, tal como utilizado no formato MPS, semelhante à limitação da banda de freqüência do modelamento de envelope guiado (GES) no formato MPS.
A seguir, caracterizações de um separador 520 transiente são explicadas com mais detalhes. O separador de transientes 510 divide o sinal de entrada DMX em componentes transientes e não transientes S1 e S2, respectivamente. O separador de transientes 510 pode empregar informação da separação de transiente para dividir o sinal de entrada DMX, por exemplo um parâmetro da separação de transientes β [n], A divisão do sinal de entrada DMX pode ser feita de uma maneira tal que a soma do componente, s1 + s2, é igual ao sinal de entrada DMX:
s1[n]=DMX[n]·β[n]
s2[n]=DMX[n].(l- β[n])
em que n é o índice de tempo dos sinais da sub-banda com redução de tamanho de dados e os valores válidos para o parâmetro β [n] da separação de transientes com variante de tempo estão no intervalo [0, 1]. β [n] pode ser um parâmetro independente de freqüência.Um separador transiente 510 que está adaptado para separar um sinal de entrada de aparelho com base em um parâmetro de separação independente de freqüência pode alimentar todas as porções de sinal sub-banda com o índice de tempo n, quer para o descorrelacionador de transiente 520 ou para o segundo descorrelacionador dependendo do valor de β [n].
Alternativamente, β [n] pode ser um parâmetro dependente da freqüência.Um separador de transientes 510,que está adaptado para separar um sinal de entrada de aparelho I baseado em uma informação da separação de transientes dependente da freqüência, pode processar porções de sinal de sub-banda com o mesmo índice de tempo mas de forma diferente, se as correspondentes informações da separação de transientes diferirem.
Além disso, a dependência da freqüência pode, por exemplo, ser usada para limitar a gama de freqüência do processamento de transientes como mencionado na secção anterior.
Em uma caracterização, a informação ae separação de transientes pode ser um parâmetro que indica que a porção de sinal considerada de um sinal de entrada DMX contém um transiente ou que indica que a porção de sinal considerada não contém um transiente. O separador de transientes 510 alimenta a porção de sinal considerado para o descorrelacionador de transientes 520, se a informação da separação de transientes indicar que a porção de sinal considerado contém um transiente. Em alternativa, o separador de transientes 510 alimenta a porção de sinal considerado no segundo descorrelacionador, por exemplo, no descorrelacionador IIR (resposta de tempo infinito) 530, se a informação da separação de transientes indicar que a porção de sinal considerado contém um transiente.
Por exemplo, um parâmetro β [n] da separação de transientes pode ser utilizado como informação da separação de transientes que pode ser um parâmetro binário, n é o índice de tempo de uma porção de sinal de entrada considerada do sinal de entrada DMX. β [n] pode ser 1 (indicando que a parte de sinal considerado deve ser alimentado no descorrelacionador de transiente) ou 0 (indicando que a parte de sinal considerado deve ser alimentado no segundo descorrelacionador). Restringindo β [n] para β ε {0, 1} resulta em decisões difíceis entre transientes / não transientes, isto é: componentes que são tratados como transientes são completamente separados da entrada (β = 1).
Noutra caracterização, o separador de transientes 510 está adaptado para alimentar parcialmente uma porção de sinal considerada do sinal de entrada do aparelho para o descorrelacionador de transientes 520 e para alimentar parcialmente a porção do sinal considerada no segundo descorrelacionador 530. O valor da parte do sinal considerada que é alimentada para dentro do separador de transientes 520 e a quantidade da parte do sinal considerada que é alimentada para o segundo descorrelacionador 530 depende da informação da separação de transientes. Numa caracterização, β[η] tem de estar no intervalo [0, 1], Numa outra caracterização, β[η] pode ser limitada a β [n] [0, max β], em que max β <1 resulta numa separação parcial dos transientes, conduzindo a um efeito menos pronunciado do esquema de tratamento de transientes. Portanto, a alteração de βmax permite fazer a transição entre a saída do processamento convencional de conversão sem manipulação de transientes e o processamento de conversão incluindo o tratamento de transientes.
No que se segue, um descorrelacionador de transientes 520 de acordo com uma caracterização é explicado em mais detalhes.
Um descorrelacionador de transientes 520, de acordo com uma caracterização, cria um sinal de saída que é suficientemente descorrelacionado na entrada. Este não altera a estrutura temporal de aplausos individuais/transientes (sem espalhamento temporal, sem atraso). Em vez disso, este conduz a uma distribuição espacial dos componentes de sinal de transientes (após o processo de conversão), que é semelhante à distribuição espacial no sinal original (não codificado). O descorrelacionador de transientes 520 pode permitir trocas entre a taxa de bits e a qualidade (por exemplo, uma distribuição de transientes espacial totalmente aleatória se houver baixa transferência de bits ↔ próximo ao original (quase transparente) com alta taxa de transferência de bits). Além disso, isto é conseguido com uma baixa complexidade computacional.
Como foi explicado acima, no aspecto do codificador, uma matriz "reversa" de mistura pode ser utilizada para criar um sinal de mistura e um sinal residual, por exemplo, a partir dos dois canais de um sinal estéreo. Enquanto o sinal de mistura pode ser transmitido para o decodificador, o sinal residual pode ser descartado. De acordo com uma caracterização, a diferença de fase entre o sinal residual e o sinal de mistura pode ser determinado, por exemplo, por um codificador, e pode ser empregado por um decodificador quando realizando a descorrelação de um sinal. Por isso, pode ser então possível reconstruir um sinal residual "artificial" através da aplicação da fase original do residual na mistura.
Um método correspondente de descorrelação de transientes 520 de acordo com uma caracterização será explicado a seguir:
De acordo com um método de descorrelação de transientes, uma condição da fase pode ser empregada. A descorrelação é conseguida através da simples multiplicação da corrente transiente de condições da fase em alta resolução temporal, por exemplo, da resolução de tempo do sinal de sub-banda no domínio da transformação, como os sistemas de MPS:
D1[n]=s1[n] · ej.Δφ[n]
Nesta equação, n é o índice de tempo dos sinais da sub-banda com redução de tamanho de dados. Δφ idealmente reflete a diferença de fase entre a mistura e o residual. Portanto, os resíduos de transientes são substituídos por uma cópia dos transientes da mistura, modificados de tal modo que eles exibem a fase original.
Aplicando a informação da fase inerentemente resulta num balanço dos transientes para o processo de mistura. Como um exemplo ilustrativo, considerar o caso ICC = 0, ILD = 0: a parte transiente dos sinais de saída então é lida como :
L[n] = c · (s[n]+ D1[n]) = c . s[n]·(1 + ej.Δφ[n])
R[n] = c . (s[n]- D1[n]) = c · s[n]·(1 - ej.Δφ[n])
Para Δφ = 0, isso resulta em L = 2c * s, R = 0, enquanto que Δφ = π , leva a L = 0, R = 2-C * s. Outros valores de Δφ, ICC, e ILD levam a diferentes níveis e relações de fase entre os transientes reproduzidos.
Os valores Δφ [n] podem ser aplicados como parâmetros da freqüência de banda larga independente, ou como os parâmetros dependentes da freqüência. Em caso de sinais similares a aplausos sem componentes tonais, os valores de banda larga Δφ [n] podem ser vantajosos devido à menor exigência da taxa de dados e manipulação consistente dos transientes de banda larga (consistência ao longo da freqüência).
A estrutura de manuseamento de transientes da Fig. 5 é disposta de tal modo que apenas o descorrelacionador 530 convencional é desviado em relação aos componentes de sinal transiente enquanto que a matriz de mistura se mantém inalterada. Assim, os parâmetros espaciais (ICC, ILD) são inerentemente também levados em consideração para os sinais transientes, por exemplo: o ICC controla automaticamente a largura da distribuição de transientes reproduzida.
Considerando o aspecto de como obter informação da fase, numa caracterização, a informação da fase pode ser recebida a partir de um codificador.
A Fig. 6 ilustra uma caracterização de um aparelho para gerar um sinal descorrelacionado. O aparelho compreende um separador de transientes 610, um descorrelacionador de transiente 620, um descorrelacionador convencional 630, uma unidade de combinação 640 e uma unidade de recepção 650. O separador de transientes 610, o descorrelacionador convencional 630 e a unidade de combinação 640 são semelhantes ao separador de transientes 310, ao descorrelacionador convencional 330 e a unidade de combinação 340 da caracterização representada na Fig. 3. No entanto, a Fig. 6 ilustra, além disso, uma unidade de recepção 650, que está adaptada para receber informação de fase. A informação da fase pode ter sido transmitida por um codificador (não mostrado). Por exemplo, um codificador pode ter calculado a diferença da fase entre os sinais residuais e de mistura (fase relativa do sinal residual com respeito a uma mistura). A diferença de fase pode ter sido calculada para certas bandas de freqüência ou de banda larga (por exemplo, num domínio de tempo). O codificador pode apropriadamente codificar os valores da fase de quantificação uniforme ou não uniforme, e, potencialmente codificar sem perdas. Em seguida, o codificador pode transmitir os valores da fase codificados para o sistema de decodificação de áudio espacial. A obtenção da informação da fase a partir de um codificador é vantajosa pois a informação da fase original é então possível em um decodificador (exceto para o erro de quantificação).
A unidade de recepção 650 alimenta a informação d fase para o descorrelacionador de transienteS 620 que utiliza a informação dA fase quando se descorrelaciona um componente de sinal. Por exemplo, a informação da fase pode ser uma condição da fase e o descorrelacionador de transientes 620 pode multiplicar um componente de sinal transiente recebido pela condição da fase.
No caso da transmissão de informação da fase Δφ [n] a partir do codificador para o decodificador, a taxa de dados necessária pode ser reduzida como se segue:
A informação de fase Δφ [n] pode ser aplicada somente aos componentes de sinal de transientes no decodificador. Portanto, a informação da fase precisa apenas estar disponível no decodificador enquanto há componentes de transientes no sinal a ser descorrelacionado. A transmissão da informação da fase pode assim ser limitada pelo codificador tal que apenas a informação necessária é transmitida para o decodificador. Isto pode ser feito através da aplicação de uma detecção de transientes no codificador, conforme descrito abaixo. A informação da fase Δφ [n] é transmitida apenas para pontos no tempo n, para o qual os transientes foram detectados no codificador.
Considerando o aspecto da separação de transientes, numa caracterização, a separação de transientes pode ser acionada por um codificador.
De acordo com uma caracterização, a informação da separação de transientes (também referida como "a informação de transientes") pode ser obtida a partir de um codificador. O codificador pode aplicar métodos de detecção de transientes, conforme descrito por Andreas Walther, Christian Uhle, Sascha Disch “Using Transient Suppression in Blind Multi-channel Up-mix Algorithms” ("Usando Supressão de Transientes em Algoritmos de Conversão de Multi-Canal Cego") em Proc. 122 AES Convenção de Viena, Áustria, maio de 2007, seja para os sinais de entrada do codificador ou para os sinais de mistura. A informação de transientes é então transmitida para o decodificador e preferencialmente obtida, por exemplo, na resolução de tempo dos sinais de sub-banda com redução do tamanho de dados.
A informação de transientes pode preferencialmente compreender uma decisão binária simples (transiente/não transiente) para cada amostra de sinal no tempo. Esta informação pode, preferencialmente, ser também representada pelas posições dos transientes no tempo e pelas durações dos transientes.
A informação de transientes pode ser codificada sem perda (por exemplo, com codificação com compressão de sequência de dados, compressão independente de características) para reduzir a taxa de dados que é necessária para transmitir a informação de transientes do codificador para o decodificador.
A informação de transientes pode ser transmitida como informação de banda larga, ou como informação dependente de frequência em uma determinada resolução de freqüência. A transmissão da informação de transientes como parâmetros da banda larga reduz a taxa de dados de informação de transientes e potencialmente melhora a qualidade de áudio devido ao manuseio consistente dos transientes de banda larga.
Em vez da decisão binária (transiente/não transiente), a força dos transientes pode ser transmitida, isto é, quantificada em duas ou quatro etapas. A força de transientes pode então controlar a separação dos transientes no decodificador de áudio espacial da seguinte forma: os transientes fortes são completamente separados da entrada do descorrelacionador IIR, ao passo que os transientes mais fracos são apenas parcialmente separados.
A informação de transientes só pode ser transmitida se o codificador detectar sinais semelhantes a aplausos,por exemplo, usando sistemas de detecção de aplausos, como descrito por Christian Uhle, “Applause Sound Detection with Low Latency” (Detecção de Som de Aplauso com Baixa Latência"), Convenção 127 da "Audio Engineering Society", Nova Iorque, 2009.
O resultado da detecção para a semelhança entre o sinal de entrada para sinais de aplauso pode também ser transmitido com uma resolução de tempo inferior (por exemplo, à taxa de atualização de parâmetros espaciais em MPS) para o decodificador para controlar a força de separação de transiente. O resultado da detecção de aplausos pode ser transmitido como um parâmetro binário (isto é, como uma decisão difícil), ou como um parâmetro não binário (isto é, como uma decisão fácil). Este parâmetro controla a força de separação no decodificador de áudio espacial. Por conseguinte, permite (dificilmente ou gradualmente) ligar/desligar o manuseio de transientes no decodificador. Isto permite evitar erros que possam ocorrer, por exemplo, quando se aplica um esquema de manuseio de transientes para sinais que contêm componentes tonais.
A Fig. 7 ilustra um aparelho para a decodificação de um sinal de acordo com uma caracterização. O aparelho compreende um separador de transientes 710, um descorrelacionador de transiente 720, um descorrelacionador IIR 730, uma unidade de combinação 740, um misturador 752, uma unidade de modelamento opcional 754, uma primeira unidade de adição 756 e uma segunda unidade de adição 758, que correspondem ao separador transiente 510, ao descorrelacionador de transiente 520, ao descorrelacionador IIR 530, a unidade de combinação 540, ao misturador 552, a unidade de modelamento opcional 554, a primeira unidade de adição 556 e a segunda unidade de adição 558 da caracterização da fig. 5, respectivamente. Na caracterização da Fig. 7, um codificador obtém as informações da fase e a informação sobre a posição dos transientes e transmite a informação para um aparelho de decodificação. Nenhum sinal residual é transmitido. A Fig. 7 ilustra uma configuração de conversão de 1-para-2 como uma caixa OTT em formato MPS. Pode ser aplicado em um sistema codec (codificador decodificador) estéreo para conversão a partir de uma mistura mono para uma saída estéreo de acordo com uma caracterização. Na caracterização da Fig. 7, três parâmetros de manuseio de transientes são transmitidos como parâmetros independentes de frequência a partir do codificador para o decodificador, como pode ser visto na Fig. 7:
Um primeiro parâmetro de manuseio de transientes a ser transmitido é a decisão binária transiente/não transiente de um detector de transientes operando no codificador. Ele é utilizado para controlar a separação de transientes no decodificador. Num esquema simples, a decisão binária transiente/não transiente pode ser transmitida como um sinalizador binário por amostra de tempo de sub-banda sem codificação adicional.
Um parâmetro de manuseio adicional de transientes a ser transmitido é o valor de fase (ou os valores de fase) Δφ [n] necessário para o descorrelacionador de transiente. Δφ é transmitido apenas para tempos n, para os quais os transientes forem detectados no codificador. Os valores Δφ são transmitidos como índices de um quantificador com uma resolução de, por exemplo, 3 bits por amostra.
Outro parâmetro de manuseio de transientes a ser transmitido é a força de separação (isto é, a intensidade do efeito do regime de manuseio de transientes). Esta informação é transmitida com a mesma resolução temporal espacial como os parâmetros espaciais ILD, ICC.
A taxa de bits necessária para a transmissão de decisões de separação de transientes e de informação da fase de banda larga a partir do codificador para o decodificador pode ser estimada para sistemas do tipo MPS como:
BR = BRsin alizadoresdeseparaçãodetransientes + BRΔφ ≈ (fs / 64) + σ · Q · fs / 64 = (1 + σ · Q) · fs / 64
em que σ é a densidade de transientes (fração de intervalos de tempo (= amostras de tempo de sub-bandas) que são marcados como transientes), Q é o número de bits por valor de fase transmitido, e fs é a freqüência da amostragem. Note-se que (fs/64) é a taxa de amostragem dos sinais de sub-banda com redução do tamanho de dados.
E {σ} <0,25 foi medido por um conjunto de vários itens representativos de aplausos, em que E{.} indica a média ao longo da duração do item. Um compromisso razoável entre a exatidão dos valores de fase e ataxa de bits dos parâmetros é Q = 3. Para reduzir a taxa de dados dos parâmetros, os ICCs e ILDs podem ser transmitidos como sinais de banda larga. A transmissão dos ICCs e ILDs como pistas de banda larga é especialmente aplicável para sinais não tonais como aplausos.
Além disso, os parâmetros que sinalizam a força de separação são transmitidos à taxa de atualização dos ICCs/ ILDs. Para longos quadros espaciais em MPS (32 vezes 64 amostras) e forças de separação quantificadas em 4 etapas, isso resulta em uma taxa de bits adicional de:
BR forçadeseparaçãodetransientes = (fs /(64 · 32)) · 2
Ο parâmetro de força de separação pode ser derivado de um codificador a partir dos resultados dos algoritmos de análise de sinal que avaliam a semelhança de sinais de aplauso, como a tonalidade, ou outras características de sinal que indicam benefícios potenciais ou problemas quando se aplica a descorrelação de transientes da caracterização.
Os parâmetros de transmissão para o manuseio de transientes podem estar sujeitos a codificação sem perdas para reduzir a redundância, resultando num parâmetro de menor taxa de bits (por exemplo, com codificação com compressão de sequência de dados, compressão independente de características).
Voltando ao aspecto de obtenção de informação da fase, numa caracterização, a informação da fase poderá ser obtida em um decodificador.
Numa tal caracterização, o aparelho para a decodificação não recebe a informação da fase a partir de um codificador, mas pode determinar sozinho a informação da fase. Portanto, não é necessário transmitir informação da fase, o que resulta em uma taxa de transmissão geral reduzida.
Em uma caracterização, a informação da fase é obtida em um decodificador MPS com base nos dados GES ("Modelamento de Envelope Guiado"). Isso só é aplicável se os dados GES são transmitidos, ou seja, se o recurso GES é ativado em um codificador. A função GES é disponível por exemplo, em sistemas de MPS. A razão dos valores de envelope GES entre os canais de saída reflete posições de balanço para os transientes em alta resolução. A razão de envelope GES (GESR) pode ser mapeada para a informação da fase necessária para o manuseio de transientes. Em GES, o mapeamento pode ser realizado de acordo com uma regra de mapeamento obtida empiricamente a partir de estatísticas da fase relativa a distribuição GESR para um conjunto representativo de sinais de teste apropriados. Determinar a regra de mapeamento é um passo para a concepção do sistema de manuseio de transientes, e não um processo de execução de tempo aquando da aplicação do sistema de manuseio de transientes. Portanto, é vantajoso que não exista a necessidade de os custos de transmissão adicionais para os dados da fase, se os dados GES forem necessários para a aplicação da função GES de qualquer maneira. A compatibilidade com versões anteriores de fluxo de bit é conseguida com decodificadores de fluxo de bit MPS. No entanto, a informação de fase extraída dos dados GES não é tão exata (por exemplo: o sinal da fase estimada é desconhecido) como a informação da fase que pode ser obtida no codificador.
Numa outra caracterização, a informação da fase pode também ser obtida de um decodificador, mas a partir de resíduos transmitidos de banda não total. Este é o caso, por exemplo, se os sinais residuais de banda limitada forem transmitidos (normalmente cobrindo uma gama de freqüências acima de uma freqüência de transição) em um regime de codificação MPS. Numa tal caracterização, a relação da fase entre a mistura e o sinal residual transmitido na banda residual é calculada, isto é, para freqüências para as quais são transmitidos os sinais residuais. Além disso, a informação da fase de banda residual para a banda não residual é extrapolada (e/ou, eventualmente, interpolada). Uma possibilidade é a mapear a relação da fase obtida na banda residual para uma relação dafase de freqüência independente global que é em seguida utilizada para o descorrelacionador de transientes. Isto resulta na vantagem de que não há custos adicionais de transmissão para os dados da fase, se os resíduos de banda não completa forem transmitidos de qualquer maneira. No entanto, tem de ser considerado que a exatidão da estimativa da fase depende da largura de banda de freqüência em que os sinais residuais são transmitidos. A exatidão da fase calculada também depende da consistência da relação de fase entre a mistura e o sinal residual ao longo do eixo de freqüência. Para sinais claramente transientes, alta consistência é normalmente encontrada.
Numa outra forma de caracterização, a informação da fase é obtida com um decodificador empregando informação da correção adicional transmitida a partir do codificador. Esta caracterização é semelhante às duas caracterizações anteriores (fase de GES, fase a partir de residuais), mas, adicionalmente, é necessário gerar dados de correção no codificador transmitidos para o decodificador. Os dados de correção permitem reduzir o erro de estimativa de fase que pode ocorrer nas duas variantes descritas antes (fase de GES, fase a partir de residuais). Além disso, os dados de correção podem ser derivados a partir de estimativas do erro estimado da fase do decodificador no codificador. Os dados de correção podem ser este erro de estimação estimado (potencialmente codificado). Além disso, no que diz respeito à abordagem de estimativa da fase dos dados GES, os dados de correção podem ser simplesmente o sinal correto dos valores de fase gerados pelo codificador. Isto permite a geração de condições da fase com o sinal correto no decodificador. O benefício desta abordagem é que, devido aos dados de correção, a exatidão da informação da fase recuperável no decodificador é muito mais próxima do que a informação da fase gerada pelo codificador. No entanto, a compressão independente dos dados da informação de correção é inferior à compressão independente dos dados da informação da fase correta em si. Assim, o parâmetro de taxa de bits é reduzido quando comparado com a transmissão direta da informação dafase obtida no codificador.
Noutra forma de caracterização, a informação/condições da fase são obtidas a partir de um processo (pseudo) aleatório em um decodificador. O benefício desta abordagem é o de que não há necessidade de transmitir qualquer informação de fase com alta resolução temporal. Isso resulta em uma taxa de dados reduzida. Numa caracterização, um método simples para gerar valores de fase com uma distribuição aleatória uniforme no intervalo [-180 °, 180 °].
Numa caracterização adicional, as propriedades estatísticas da distribuição de fases no codificador são medidas. Estas propriedades são codificadas e transmitidas (numa resolução baixa de tempo) para o decodificador. Os valores de fase aleatórios são gerados no decodificador e estão sujeitos às propriedades estatísticas de transmissão. Estas propriedades podem ser a média, variantes, ou outras medidas estatísticas da distribuição de fase estatística.
Quando mais de um descorrelacionador está sendo executado em paralelo (por exemplo, para uma conversão multi-canal), cuidado deve ser tomado para garantir saídas do descorrelacionador mutuamente descorrelacionadas. Numa caracterização, em que múltiplos vetores de valores de fase (pseudo) aleatórios (em vez de um único vetor) são gerados para todos a não ser para o primeiro descorrelacionador, um conjunto de vetores é selecionado que resulta na menor correlação do valor de fase em todos os descorrelacionadores.
No caso da transmissão de informação de correção de fase a partir do codificador para o decodificador, a taxa de dados necessária pode ser reduzida como se segue:
A informação de correção de fase somente precisa estar disponível no decodificador enquanto há componentes de transientes no sinal a ser descorrelacionado. A transmissão da informação de correção de fase pode assim ser limitada pelo codificador de tal forma que apenas a informação necessária é transmitida para o decodificador. Isto pode ser feito através da aplicação de uma detecção de transientes no codificador como foi descrito acima. A informação da correção de fase só é transmitida para pontos no tempo n, para o qual os transientes foram detectados no codificador.
Voltando ao aspecto de separação de transientes, numa caracterização, a separação de transientes pode ser conduzida pelo decodificador.
Em tal caracterização, as informações de separação de transientes pode também ser obtidas no decodificador, por exemplo, através da aplicação de um método de detecção transitória, como descrito por Andreas Walther, Christian Uhle, Sascha Disch “Using Transient Suppression in Blind Multi-channel Up-mix Algorithms” ("Usando Supressão de Transiente em Algoritmos de conversão multi-canal cegos") em Procedimentos da Convenção 122 AES de Viena, Áustria, maio de 2007 para o sinal de mistura que está disponível no decodificador de áudio espacial antes da conversão para um sinal de saída multicanal estéreo. Neste caso, nenhuma informação de transiente tem de ser transmitida, o que poupa a taxa de dados de transmissão.
No entanto, realizar a detecção de transientes na decodificação pode causar problemas quando, por exemplo, se realiza a padronização do esquema de manuseio de transientes: por exemplo, pode ser difícil encontrar um algoritmo de detecção de transientes que resulte nos mesmos resultados exatos de detecção de transientes quando se implementa em diferentes arquiteturas/plataformas que envolvem diferentes precisões numéricas, esquemas de arredondamento, etc. Tal comportamento previsível de decodificador é muitas vezes obrigatório para a padronização. Além disso, o algoritmo padronizado de detecção de transientes pode falhar para alguns sinais de entrada, causando distorções intoleráveis nos sinais de saída. Pode então ser difícil de corrigir o algoritmo com falha após padronização sem a construção de um decodificador que não está em conformidade com o padrão. Este problema pode ser menos severo se pelo menos um parâmetro de controle da força de separação de transientes é transmitido com resolução de tempo menor (por exemplo, a uma taxa de atualização de parâmetro espacial MPS) a partir do codificador para o decodificador.
Numa caracterização adicional, a separação de transientes é também acionada pelo decodificador e residuais de banda não cheia são transmitidos. Nesta caracterização, a separação de transiente acionado por decodificador pode ser refinada utilizando estimativas de fase obtidos a partir de residuais transmitidos de banda não cheia (ver acima). Note-se que este aperfeiçoamento pode ser aplicado no decodificador sem a transmissão de dados adicionais a partir do codificador para o decodificador.
Nesta caracterização, as condições da fase que são aplicadas num descorrelacionador de transiente são obtidas por extrapolação dos valores da fase de correção para as bandas residuais para freqüências onde não há resíduos disponíveis. Um método consiste em calcular o valor da fase ponderado (por exemplo um sinal de energia) a partir dos valores de fase que podem ser calculados para essas freqüências onde os sinais residuais estão disponíveis. O valor médio da fase pode ser então aplicado como um parâmetro independente de freqüência no descorrelacionador de transientes.
Contanto que a relação de fase correta entre a mistura e o residual é independente de freqüência, o valor médio de fase representa uma boa estimativa do valor de fase correta. No entanto, no caso de uma relação de fase que não é consistente ao longo do eixo da freqüência, o valor médio da fase pode ser uma estimativa menos correta, o que pode conduzir a valores de fase incorretos e erros audíveis.
A consistência da relação de fase entre a mistura e o residual transmitido ao longo do eixo de freqüência pode assim ser utilizada como uma medida confiável de estimativa de fase extrapolada que é aplicada no descorrelacionador de transiente. Para diminuir o risco de erros audíveis, a medida de consistência obtida no decodificador pode ser usada para controlar a força de separação de transientes no decodificador, por exemplo, como se segue:
Os transientes, para os quais a informação da fase correspondente (isto é, a informação da fase para o mesmo tempo do índice n) é consistente ao longo da freqüência, estão completamente separados da entrada do descorrelacionador convencional e são totalmente alimentados no descorrelacionador de transientes. Uma vez que grandes erros de estimativa de fase são improváveis, todo o potencial do tratamento de transientes é utilizado.
Os transientes, para os quais a informação da fase correspondente é menos consistente ao longo da freqüência, são apenas parcialmente separados, levando a um efeito menos proeminente do regime de tratamento de transientes.
Os transientes, para os quais a informação da fase correspondente está muito inconsistente ao longo da freqüência, não são separados, levando a um comportamento normal de um sistema de conversão convencional, sem o tratamento de transientes proposto. Assim, nenhum erro ocorre devido a grandes erros de estimativa da fase.
As medidas para a consistência da informação da fase podem ser deduzidas, por exemplo, a partir da variância (potencialmente um sinal de potência) do desvio padrão da informação de fase ao longo da freqüência.
Uma vez que apenas poucas freqüências podem estar disponíveis para as quais os sinais residuais são transmitidos, a medida de consistência pode ter que ser estimada a partir de apenas poucas amostras ao longo da freqüência, conduzindo a uma medida de consistência que só raramente atinge valores extremos ("perfeitamente compatível", ou "perfeitamente inconsistente "). Assim, a medida de consistência pode possuir distorção linear ou não linear antes de ser utilizada para controlar a força de separação de transientes. Numa caracterização, a característica limiar é implementada como ilustrado na Fig. 8, exemplo da direita.
A Fig. 8 mostra diferentes exemplos de mapeamentos de medidas de consistência da fase de separação de forças de transientes, que ilustra o impacto das variantes para a obtenção de parâmetros de manuseio de transientes na robustez a erros de classificação de transiente. As variantes para a obtenção da informação de separação de transientes e as informações da fase listadas acima diferem na taxa de dados de parâmetros e, portanto, representam pontos de funcionamento diferentes em termos de taxa de bits total ou de um codec (codificador decodificador) de aplicação da técnica proposta para tratamento de transientes. Além disto, a escolha da fonte para a obtenção da informação da fase também afeta aspectos como a robustez contra falsas classificações de transientes: o tratamento de um sinal não transiente resulta em umtransiente com muito menos distorções audíveis se a informação da fase correta é aplicada no tratamento de transientes. Assim, um erro de classificação de sinal provoca erros menos graves no cenário de valores da fase transmitidos quando comparado com o cenário de geração aleatória de fase no decodificador.
A Fig. 9 é uma visão geral do sistema um-para-dois, com tratamento de transientes de acordo com uma caracterização adicional, em que os sinais residuais de banda estreita são transmitidos. A fase de dados Δφ é estimada a partir da relação da fase entre a mistura (DMX) e o sinal residual na faixa de freqüências do sinal residual. Opcionalmente, os dados de correção da fase são transmitidos para reduzir o erro de estimativa da fase.
A Fig. 9 ilustra um separador de transientes 910, um descorrelacionador 920, um descorrelacionador IIR 930, uma unidade de combinação 940, um misturador 952, uma unidade opcional de modelamento 954, uma primeira unidade de adição 956 e uma segunda unidade de adição 958, que correspondem ao separador de transientes 510, ao descorrelacionador de transiente 520, ao descorrelacionador IIR 530, à unidade de combinação 540, ao misturador 552 da unidade de modelamento opcional 554, à primeira unidade de adição 556 e à segunda unidade de adição 558 na caracterização da Fig. 5, respectivamente. A forma de caracterização da Fig. 8 também contém uma unidade de estimativa de fase 960. A unidade de estimativa da fase 960 recebe um sinal de entrada DMX, um residual de sinal residual e, opcionalmente, dados de correção da fase. Com base na informação recebida, a unidade da informação da fase calcula os dados da fase Δφ. Opcionalmente, a unidade de estimativa da fase determina também a informação de consistência da fase e passa a informação de consistência da fase para o separador de transientes 910. Por exemplo, a informação da coerência da fase pode ser usada pelo separador de transientes para controlar a força de separação de transientes.
A caracterização da Fig. 9 aplica a conclusão de que, se os resíduos são transmitidos dentro do esquema de codificação de uma forma com banda não cheia, a diferença da fase média do sinal de potência entre o residual e a mistura (Δφ bandas_residuais) pode ser aplicada à informação da fase de banda larga para os transientes separados ( Δφ = Δφ bandas_residuais) Neste caso, nenhuma informação adicional de fase tem de ser transmitida, reduzindo a demanda por taxa de bits para o tratamento de transientes. Na caracterização da Fig. 9, a estimativa da fase a partir das bandas residuais pode desviar-se consideravelmente da estimativa mais precisa da fase de banda larga que está disponível no codificador. Portanto, uma opção é transmitir os dados de correção da fase (por exemplo, Δφ correção Δφ-Δφ bandas_residuais) de modo que a Δφ correta esteja disponível no decodificador. No entanto, uma vez que a Δφ correção pode mostrar uma compressão mais baixa de dados do que Δφ, o parâmetro da taxa de dados necessário pode ser mais baixo do que a taxa que seria necessária para a transmissão de Δφ. (Este conceito é similar à utilização de uso geral de previsão na codificação: em vez de codificar os dados diretamente, um erro de previsão com menor compressão de dados é codificado. Na caracterização da Fig. 9, a etapa de previsão é a extrapolação da fase a partir das bandas de freqüência residual para bandas não residuais). A consistência da diferença de fase em bandas de freqüência residual (Δφ bandas_residuais) ao longo do eixo de freqüência pode ser utilizada para controlar a força de separação de transientes.
Em caracterizações, um decodificador pode receber informação da fase a partir de um codificador, ou o decodificador pode ele próprio determinar a informação da fase. Além disso, o decodificador pode receber informação da separação de transientes de um codificador, ou o decodificador pode, ele próprio, determinar a informação da separação de transientes.
Em caracterizações, um aspecto do tratamento de transientes é a aplicação da "descorrelação semântica", um conceito descrito na Patente WO/2010/017967, juntamente com o "descorrelacionador de transientes" que se baseia na multiplicação da entrada pelas condições da fase. A qualidade de percepção dos sinais semelhantes a aplausos reproduzidos melhora já que ambas as etapas de processamento evitam a alteração da estrutura temporal dos sinais transitórios. Além disso, a distribuição espacial dos transientes, bem como as relações da fase entre os transientes são reconstruídas nos canais de saída. Além disso, caracterizações são também eficientes por computador, e podem ser facilmente integradas em sistemas de conversão PS ou MPS. Em caracterizações, o tratamento de transientes não afeta o processo de matriz da mistura, de modo que todas as propriedades de reprodução espacial que são definidas pela matriz de mistura são também utilizadas para o sinal transiente.
Em caracterizações, um sistema de descorrelação novo é aplicado, o qual é particularmente adequado para a aplicação em sistemas de conversão, o que é particularmente adequado para a aplicação de sistemas de codificação de áudio espacial como PS ou MPS e que melhora a qualidade de percepção do sinal de saída no caso de sinais como aplausos, ou seja, sinais que contêm misturas densas de transientes espacialmente distribuídos e/ou pode ser visto como uma aplicação partícularmente melhorada da estrutura genérica de "descorrelação semântica". Além disso, um esquema de descorrelação novo compreende a reconstrução da distribuição espacial/temporal dos transientes semelhante à distribuição do sinal original, preservando a estrutura temporal dos sinais transientes e permitindo variar a velocidade de transmissão enquanto existe uma troca com o parâmetro de qualidade e/ou é adequado para uma combinação de funções MPS como residuais de banda não cheia ou GES. As combinações são complementares, ou seja: a informação de características padrão MPS é reutilizada para o tratamento de transientes.
A Fig. 10 ilustra um aparelho para a codificação de um sinal de áudio com uma pluralidade de canais. Dois canais de entrada L, R alimentam um misturador 1010 e uma calculadora de sinal residual 1020. Noutras caracterizações, uma pluralidade de canais é alimentada no misturador 1010 e a calculadora de sinal residual 1020, por exemplo, 3, 5 ou 9 canais surround. O misturador 1010 então mistura os dois canais L, R, para obter um sinal de mistura. Por exemplo, o misturador 1010 pode empregar uma matriz de mistura e realizar uma multiplicação de matrizes da matriz de mistura e os dois canais de entrada L, R, para se obter o sinal de mistura. O sinal de mistura pode ser transmitido para um decodificador.
Além disso, o gerador de sinal residual 1020 está adaptado para calcular um sinal adicional, que é conhecido como o sinal residual. Sinais residuais são sinais que podem ser usados para regenerar os sinais originais pelo emprego do sinal de mistura e de uma matriz de mistura. Quando, por exemplo, os sinais N são misturados em um sinal, a mistura é tipicamente um dos componentes N que resultam a partir do mapeamento dos sinais de entrada N. Os componentes restantes resultantes do mapeamento (por exemplo, componentes N-1) são os sinais residuais e permitem reconstruir o sinal original N por um mapeamento inverso. Esse mapeamento pode, por exemplo, ser uma rotação. O mapeamento deve ser realizado de tal modo que o sinal de mistura é maximizado e os sinais residuais são minimizados, por exemplo, de forma semelhante a uma transformação do eixo principal. Por exemplo, a energia do sinal de mistura deve ser maximizada e as energias dos sinais residuais devem ser minimizadas. Ao converter dois sinais em um sinal, a mistura é normalmente de um dos dois componentes que resultam a partir do mapeamento dos dois sinais de entrada. O restante do componente resultante do mapeamento é o sinal residual e permite reconstruir os 2 sinais originais por um mapeamento inverso.
Em alguns casos, o sinal residual pode representar um erro associado com a representação de dois sinais pelas suas misturas e os parâmetros associados. Por exemplo, o sinal residual pode ser um sinal de erro, que representa o erro entre os canais originais L, R e os canais L ', R', resultantes da mistura do sinal de mistura que foi gerado com base na origem de canais L e R.
Em outras palavras, um sinal residual pode ser considerado como um sinal no domínio do tempo ou no domínio da freqüência ou no domínio de sub-banda, que em conjunto com o sinal de mistura, sozinho ou com o sinal de mistura e informações paramétricas permite uma reconstrução correta ou quase correta de um canal original. Para o termo "quase correto" tem de ser entendido que a reconstrução do sinal residual com uma energia maior do que zero é mais próxima do canal original em comparação com uma reconstrução utilizando a mistura sem o sinal residual ou usando a mistura e as informações paramétricas, sem o sinal residual.
Além disso, o codificador compreende uma calculadora de informação de fase 1030. O sinal de mistura e o sinal residual são alimentados para a calculadora de informação da fase 1030. A calculadora de informação da fase então calcula a informação sobre a diferença de fase entre a mistura e o sinal residual para se obter a informação de fase. Por exemplo, a calculadora de informação da fase pode aplicar funções que calculam a correlação cruzada da mistura e do sinal residual.
Além disto, o codificador compreende um gerador de saída 1040. A informação da fase gerada pela calculadora de informação da fase 1030 é alimentada para o gerador de saída 1040. O gerador de saída 1040 então gera a informação de fase.
Numa caracterização, o aparelho compreende ainda um quantificador de informação da fase para quantificar a informação da fase. A informação da fase gerada pela calculadora de informação da fase pode ser alimentada para o quantificador de informação d fase. O quantificador de informação da fase então quantifica a informação da fase. Por exemplo, a informação da fase pode ser mapeada para oito valores diferentes, por exemplo, um dos valores 0, 1, 2, 3, 4, 5, 6 ou 7. Os valores podem representar as diferenças de fase 0, π / 4, π / 2, 3π / 4, π, 5π / 4, 3π / 2 e 7π / 4, respectivamente. A informação da fase quantificada pode então ser alimentada para o gerador de saída 1040.
Numa outra caracterização, o aparelho compreende ainda um codificador sem perdas. A informação da fase da calculadora de informação da fase 1040 ou a informação da fase quantificada do quantificador de informação da fase pode ser alimentada para o codificador sem perdas. O codificador sem perdas é adaptado para codificar a informação da fase através da aplicação de codificação sem perdas. Qualquer tipo de esquema de codificação sem perdas pode ser empregado. Por exemplo, o codificador poderá empregar codificação aritmética. O codificador sem perdas, em seguida, alimenta a informação da fase codificada sem perdas no gerador de saída 1040.
No que diz respeito ao decodificador e codificador e aos métodos das caracterizações descritas, é mencionado o seguinte:
Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos representam também uma descrição do método correspondente, em que um bloco ou um dispositivo corresponde a uma etapa do método ou uma característica de uma etapa do método. De forma análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco correspondente ou item ou característica de um aparelho correspondente.
Dependendo dos requisitos de certas aplicações, as caracterizações da invenção podem ser implementadas em hardware ou em software. A aplicação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, um ROM, um PROM, um EPROM, um EEPROM ou uma memória FLASH, possuindo sinais eletrônicos legíveis de controle armazenado que cooperam (ou são capazes de cooperar) com um sistema de computador programável de modo que o método correspondente seja realizado.
Algumas caracterizações de acordo com a invenção compreendem um carregador de dados com os sinais de controle legíveis eletronicamente, os quais são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos é realizado.
Geralmente, as caracterizações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para a realização de um dos métodos em que o produto de programa de computador opera em um computador. O código de programa, por exemplo, pode ser armazenado em um carregador de leitura ótica.
Outras caracterizações incluem o programa de computador para a execução de um dos métodos descritos no presente documento, armazenado em um carregador de leitura óptica ou um meio de armazenamento não transitório.
Em outras palavras, uma forma de caracterização do método da invenção é, portanto, um programa de computador com um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador é executado em um computador.
Uma outra forma de caracterização dos métodos da invenção é, portanto, um carregador de dados (ou um meio de armazenamento digital, ou de um meio legível por computador), contendo o programa de computador para a realização de um dos métodos aqui descritos.
Uma outra caracterização do método da invenção é, portanto, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para a realização de um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais podem, por exemplo, ser configurados para serem transferidos através de uma ligação de comunicação de dados, por exemplo através da Internet.
Uma caracterização compreende além disso um meio de processamento, por exemplo um computador ou um dispositivo lógico programável, configurado para ou adaptado para executar um dos métodos aqui descritos.
Uma outra caracterização compreende um computador, tendo nele instalado um programa de computador para a execução de um dos métodos aqui descritos.
Em algumas caracterizações, um dispositivo lógico programável (por exemplo, um infinidade de portas que são programáveis em campo) que pode ser usado para executar uma parte ou todas as funcionalidades dos métodos aqui descritos. Em algumas caracterizações, uma infinidade de portas programáveis em campo pode cooperar com um microprocessador de modo a executar um dos métodos aqui descritos. Geralmente, os métodos são de preferência realizados por qualquer dispositivo de hardware.
As caracterizações acima descritas são meramente ilustrativas dos princípios da presente invenção. Entende-se que modificações e variações dos arranjos e detalhes aqui descritos serão evidentes para outros especialistas no assunto. É intenção, portanto, uma limitação apenas ao escopo das reivindicações de patente pendentes e não pelos pormenores específicos apresentados a título de descrição e explicação das caracterizações da presente invenção.

Claims (11)

  1. Aparelho para a geração de um sinal descorrelacionado caracterizado por compreender
    uma unidade de recepção (650) para receber informação de fase,
    um separador de transientes (310; 410; 510; 610; 710; 910) para a separação de um sinal de entrada em um primeiro componente de sinal e em um segundo componente de sinal, de tal modo que o primeiro componente de sinal compreende porções de sinal transiente do sinal de entrada, e de tal modo que o segundo componente de sinal compreende porções não transientes de sinal do sinal de entrada,
    um descorrelacionador de transientes (320; 420; 520; 620, 720, 920) para descorrelacionar o primeiro componente de sinal de acordo com um primeiro método de descorrelação para obter um primeiro componente de sinal descorrelacionado,
    um segundo descorrelacionador (330; 430; 530; 630; 730; 930) para descorrelacionar o segundo componente de sinal de acordo com um segundo método de descorrelação para obter um segundo componente de sinal descorrelacionado, em que o segundo método de descorrelação é diferente do primeiro método de descorrelação, e
    uma unidade de combinação (340, 440; 540; 640; 740; 940) para combinar o primeiro componente de sinal descorrelacionado e o segundo componente de sinal descorrelacionado para obter um sinal de saída descorrelacionado,
    em que o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) está adaptado para aplicar a informação de fase ao primeiro componente de sinal.
  2. Aparelho, de acordo com a reivindicação 1, caracterizado por a unidade de recepção (650) estar adaptada para receber a informação de fase de um codificador, e o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) estar adaptado para aplicar a informação de fase ao primeiro componente de sinal.
  3. Aparelho, de acordo com a reivindicação 1 ou 2, caracterizado por o separador de transientes (310; 410; 510; 610; 710; 910) estar adaptado para separar um sinal de entrada que está representado num domínio de freqüência.
  4. Aparelho, de acordo com qualquer uma das reivindicações anteriores, caracterizado por a informação de fase indicar uma diferença de fase entre o sinal residual e o sinal de mistura, e em que o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) está adaptado para descorrelacionar o primeiro componente de sinal aplicando a informação de fase ao primeiro componente de sinal.
  5. Aparelho, de acordo com a reivindicação 4, caracterizado por a informação de fase indicar uma diferença de fase entre o sinal residual e o sinal de mistura relativamente a uma determinada banda de freqüência, e em que o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) está adaptado para descorrelacionar o primeiro componente de sinal aplicando a informação de fase ao primeiro componente de sinal.
  6. Aparelho, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por a informação de fase indicar uma diferença de fase entre o sinal residual e o sinal de mistura, em que a diferença de fase é um parâmetro de banda larga independente de frequência, e em que o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) está adaptado para descorrelacionar o primeiro componente de sinal aplicando a informação de fase ao primeiro componente de sinal.
  7. Aparelho, de acordo com qualquer uma das reivindicações anteriores, caracterizado por o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) estar adaptado para derivar uma condição de fase da informação de fase, e em que o descorrelacionador de fase (320; 420; 520; 620; 720; 920) está ainda adaptado para aplicar a condição de fase ao primeiro componente de sinal.
  8. Aparelho, de acordo com a reivindicação 7, caracterizado por o descorrelacionador de transientes (320; 420; 520; 620; 720; 920) estar adaptado para aplicar a condição de fase ao primeiro componente de sinal, multiplicando a condição de fase ao primeiro componente de sinal.
  9. Aparelho, de acordo com qualquer uma das reivindicações anteriores, caracterizado por o aparelho estar ainda adaptado para receber informação da separação de transientes indicando se a porção de sinal do sinal de entrada compreende um transiente, em que o separador de transientes (310; 410; 510; 610; 710; 910) separa o sinal de entrada no primeiro componente de sinal e no segundo componente de sinal com base na informação de separação de transientes.
  10. Aparelho, de acordo com qualquer uma das reivindicações anteriores, caracterizado por a unidade de combinação (340, 440; 540; 640; 740; 940) estar adaptada para combinar o primeiro componente de sinal descorrelacionado e o segundo componente de sinal descorrelacionado, adicionando o primeiro componente de sinal descorrelacionado e o segundo componente de sinal descorrelacionado.
  11. Método para gerar um sinal descorrelacionado, caracterizado por compreender
    a recepção de informação de fase,
    a separação de um sinal de entrada em um primeiro componente de sinal e em um segundo componente de sinal, de tal modo que o primeiro componente de sinal compreende porções de sinal transiente do sinal de entrada, e de tal modo que o segundo componente de sinal compreende porções de sinal não transiente do sinal de entrada,
    descorrelação do primeiro componente de sinal por um descorrelacionador de transiente de acordo com um primeiro método de descorrelação para obter um primeiro componente de sinal descorrelacionado,
    descorrelação do segundo componente de sinal por um segundo descorrelacionador de acordo com um segundo método de descorrelação para obter um segundo componente de sinal descorrelacionado, em que o segundo método de descorrelação é diferente do primeiro método de descorrelação, e
    combinação do primeiro componente de sinal descorrelacionado e do segundo componente de sinal descorrelacionado para obter um sinal de saída descorrelacionado,
    em que a informação de fase recebida é aplicada ao primeiro componente de sinal.
BR112013004362-8A 2010-08-25 2011-07-06 aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida BR112013004362B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37698010P 2010-08-25 2010-08-25
US61/376,980 2010-08-25
PCT/EP2011/061361 WO2012025283A1 (en) 2010-08-25 2011-07-06 Apparatus for generating a decorrelated signal using transmitted phase information

Publications (2)

Publication Number Publication Date
BR112013004362A2 BR112013004362A2 (pt) 2017-09-19
BR112013004362B1 true BR112013004362B1 (pt) 2020-12-01

Family

ID=44509236

Family Applications (2)

Application Number Title Priority Date Filing Date
BR112013004365-2A BR112013004365B1 (pt) 2010-08-25 2011-07-06 aparelho e método para decodificar um sinal
BR112013004362-8A BR112013004362B1 (pt) 2010-08-25 2011-07-06 aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR112013004365-2A BR112013004365B1 (pt) 2010-08-25 2011-07-06 aparelho e método para decodificar um sinal

Country Status (21)

Country Link
US (3) US8831931B2 (pt)
EP (5) EP2924687B1 (pt)
JP (3) JP5775583B2 (pt)
KR (2) KR101445291B1 (pt)
CN (2) CN103180898B (pt)
AR (3) AR082542A1 (pt)
AU (2) AU2011295367B2 (pt)
BR (2) BR112013004365B1 (pt)
CA (3) CA2809404C (pt)
ES (3) ES2544077T3 (pt)
HK (2) HK1186833A1 (pt)
MX (2) MX2013002188A (pt)
MY (3) MY180970A (pt)
PL (3) PL2609590T3 (pt)
PT (2) PT3144932T (pt)
RU (3) RU2640650C2 (pt)
SG (3) SG187950A1 (pt)
TR (1) TR201900417T4 (pt)
TW (2) TWI459380B (pt)
WO (2) WO2012025283A1 (pt)
ZA (1) ZA201302050B (pt)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2609590T3 (pl) 2010-08-25 2015-10-30 Fraunhofer Ges Forschung Urządzenie do dekodowania sygnału zawierającego transjenty z użyciem jednostki łączenia i miksera
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
BR112015018522B1 (pt) * 2013-02-14 2021-12-14 Dolby Laboratories Licensing Corporation Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP3022949B1 (en) 2013-07-22 2017-10-18 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
JP6242489B2 (ja) 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
EP3044783B1 (en) * 2013-09-12 2017-07-19 Dolby International AB Audio coding
CA2926243C (en) * 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
KR102231755B1 (ko) * 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP2980789A1 (en) 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
TWI616095B (zh) * 2016-08-26 2018-02-21 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式
CN116741185A (zh) 2016-11-08 2023-09-12 弗劳恩霍夫应用研究促进协会 用于下混频至少两声道的下混频器和方法以及多声道编码器和多声道解码器
CN117676451A (zh) 2016-11-08 2024-03-08 弗劳恩霍夫应用研究促进协会 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
EP3382704A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
PL3659140T3 (pl) * 2017-07-28 2024-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do enkodowania lub dekodowania enkodowanego sygnału wielokanałowego za pomocą sygnału wypełnienia generowanego przez filtr szerokopasmowy
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
EP3550561A1 (en) 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
WO2020126120A1 (en) * 2018-12-20 2020-06-25 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling multichannel audio frame loss concealment
FR3136099A1 (fr) * 2022-05-30 2023-12-01 Orange Codage audio spatialisé avec adaptation d’un traitement de décorrélation

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999041947A1 (en) * 1998-02-13 1999-08-19 Koninklijke Philips Electronics N.V. Surround sound reproduction system, sound/visual reproduction system, surround signal processing unit and method for processing an input surround signal
CN100508026C (zh) 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
CN1307612C (zh) * 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
EP1595247B1 (en) * 2003-02-11 2006-09-13 Koninklijke Philips Electronics N.V. Audio coding
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
JP4867914B2 (ja) * 2004-03-01 2012-02-01 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャンネルオーディオコーディング
JP4521633B2 (ja) 2004-03-12 2010-08-11 直樹 末広 符号分割多重信号の相関分離識別方式
PL1735774T3 (pl) 2004-04-05 2008-11-28 Koninl Philips Electronics Nv Koder wielokanałowy
CN1938760B (zh) * 2004-04-05 2012-05-23 皇家飞利浦电子股份有限公司 多通道编码器
JP4934427B2 (ja) * 2004-07-02 2012-05-16 パナソニック株式会社 音声信号復号化装置及び音声信号符号化装置
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
WO2006132857A2 (en) 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
TW200742275A (en) * 2006-03-21 2007-11-01 Dolby Lab Licensing Corp Low bit rate audio encoding and decoding in which multiple channels are represented by fewer channels and auxiliary information
WO2007110101A1 (en) * 2006-03-28 2007-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enhanced method for signal shaping in multi-channel audio reconstruction
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
WO2009046223A2 (en) * 2007-10-03 2009-04-09 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
JP5266332B2 (ja) 2008-01-01 2013-08-21 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
ES2404563T3 (es) * 2008-02-14 2013-05-28 Dolby Laboratories Licensing Corporation Ampliación estereofónica
WO2009116280A1 (ja) 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
PL2609590T3 (pl) * 2010-08-25 2015-10-30 Fraunhofer Ges Forschung Urządzenie do dekodowania sygnału zawierającego transjenty z użyciem jednostki łączenia i miksera

Also Published As

Publication number Publication date
CA2809437C (en) 2016-06-21
PL3144932T3 (pl) 2019-04-30
KR101445291B1 (ko) 2014-09-29
CA2887939A1 (en) 2012-03-01
AU2011295368B2 (en) 2015-05-07
MX2013002188A (es) 2013-03-18
JP5775582B2 (ja) 2015-09-09
EP2924687A1 (en) 2015-09-30
TW201214414A (en) 2012-04-01
CN103180898B (zh) 2015-04-08
CN103180898A (zh) 2013-06-26
US9431019B2 (en) 2016-08-30
RU2640650C2 (ru) 2018-01-10
EP3144932B1 (en) 2018-11-07
RU2573774C2 (ru) 2016-01-27
MY156770A (en) 2016-03-31
WO2012025283A1 (en) 2012-03-01
JP2013539553A (ja) 2013-10-24
ES2706490T3 (es) 2019-03-29
BR112013004362A2 (pt) 2017-09-19
JP6196249B2 (ja) 2017-09-13
EP2609591B1 (en) 2016-06-01
RU2013112903A (ru) 2014-09-27
TWI457912B (zh) 2014-10-21
EP2609591A1 (en) 2013-07-03
AR098078A2 (es) 2016-04-27
JP2013539554A (ja) 2013-10-24
HK1187144A1 (zh) 2014-03-28
AR082542A1 (es) 2012-12-12
PT3144932T (pt) 2019-02-04
PL2609591T3 (pl) 2016-11-30
MY180970A (en) 2020-12-14
AU2011295367B2 (en) 2014-07-31
TW201214417A (en) 2012-04-01
PL2609590T3 (pl) 2015-10-30
AU2011295368A1 (en) 2013-03-28
TR201900417T4 (tr) 2019-02-21
AU2011295367A1 (en) 2013-04-11
US20130173274A1 (en) 2013-07-04
EP2924687B1 (en) 2016-11-02
CN103460282B (zh) 2015-08-19
CA2887939C (en) 2017-11-07
US9368122B2 (en) 2016-06-14
ES2585402T3 (es) 2016-10-05
US20140222441A1 (en) 2014-08-07
RU2015102326A (ru) 2015-06-10
EP3144932A1 (en) 2017-03-22
RU2013112853A (ru) 2014-09-27
WO2012025282A1 (en) 2012-03-01
CA2809404C (en) 2016-06-21
ES2544077T3 (es) 2015-08-27
MY178197A (en) 2020-10-06
US8831931B2 (en) 2014-09-09
ZA201302050B (en) 2013-12-23
KR20130069770A (ko) 2013-06-26
EP2609590B1 (en) 2015-05-20
EP3471091A1 (en) 2019-04-17
AR082543A1 (es) 2012-12-12
JP2015129953A (ja) 2015-07-16
KR101445293B1 (ko) 2014-09-29
CA2809437A1 (en) 2012-03-01
PT2609591T (pt) 2016-07-12
KR20130079507A (ko) 2013-07-10
SG188254A1 (en) 2013-04-30
RU2580084C2 (ru) 2016-04-10
EP2609590A1 (en) 2013-07-03
JP5775583B2 (ja) 2015-09-09
MX2013002187A (es) 2013-03-18
CA2809404A1 (en) 2012-03-01
BR112013004365A2 (pt) 2020-06-02
CN103460282A (zh) 2013-12-18
US20130173273A1 (en) 2013-07-04
HK1186833A1 (en) 2014-03-21
SG187950A1 (en) 2013-03-28
BR112013004365B1 (pt) 2021-01-12
SG2014006738A (en) 2014-03-28
TWI459380B (zh) 2014-11-01

Similar Documents

Publication Publication Date Title
BR112013004362B1 (pt) aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 06/07/2011, OBSERVADAS AS CONDICOES LEGAIS.