BR112014021054A2 - controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais - Google Patents

controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais Download PDF

Info

Publication number
BR112014021054A2
BR112014021054A2 BR112014021054-3A BR112014021054A BR112014021054A2 BR 112014021054 A2 BR112014021054 A2 BR 112014021054A2 BR 112014021054 A BR112014021054 A BR 112014021054A BR 112014021054 A2 BR112014021054 A2 BR 112014021054A2
Authority
BR
Brazil
Prior art keywords
audio signal
control information
phase
vpc
signal
Prior art date
Application number
BR112014021054-3A
Other languages
English (en)
Other versions
BR112014021054B1 (pt
Inventor
Sascha Disch
Juergen Herre
Bernd Edler
Frederik Nagel
Original Assignee
Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. filed Critical Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.
Publication of BR112014021054A2 publication Critical patent/BR112014021054A2/pt
Publication of BR112014021054B1 publication Critical patent/BR112014021054B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

CONTROLE DE COERÊNCIA DE FASE PARA. SINAIS HARMÔNICOS NOS CODECS DE ÁUDIO PERCEPTUAIS. Um decodificador para decodificar um sina de áudio codificado para obter um sinal de áudio de ajuste de ase é fornecido. O decodificador compreende uma unidade de decodificação (110) e uma unidade de ajuste de fase (120). A unidade de decodificação (110) é adaptada para decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado. A unidade de ajuste de fase (120) é adaptada para ajustar o sinal de áudio decodificado para obter o sinal de áudio ajustado por fase. A unidade de ajuste de fase (120) é configurada para receber a informação de controle, dependendo de uma coerência de fase vertical do sinal de áudio codificado. Além disso, a unidade de ajuste de fase (120) é adaptada para ajustar o sinal de áudio decodificado com base na informação de controle. Figura 1a.

Description

"CONTROLE DE COERÊNCIA DE FASE PARA SINAIS HARMÔNICOS NOS CODECS DE ÁUDIO PERCEPTUAIS". DESCRIÇÃO:
[0001] A presente invenção refere-se a um aparelho e método para gerar um sinal de emissão de áudio e, em particular, a um aparelho e método para implementar o controle de coerência de fase para os sinais harmônicos nos codecs de áudio perceptuais.
[0002] O processamento do sinal de áudio torna-se cada vez mais importante. Em particular, a codificação de áudio perceptual proliferou como uma corrente principal, possibilitando a tecnologia digital para todos os tipos de aplicações que fornecem áudio e multimídia aos consumidores utilizando canais de transmissão ou armazenamento com capacidade limitada. Codecs de áudio perceptuais modernos devem entregar uma qualidade de áudio satisfatória em taxas de bit cada vez mais baixas. Por sua vez, deve-se conformar certas perturbações de codificação que são mais toleráveis pela maioria dos ouvintes.
[ 0003] Uma destas perturbações é a perda da coerência de fase sobre a frequência (coerência de fase "vertical") , vide [ 8] . Para mui tos sinais estacionários, a deficiência resultante na qualidade do sinal de áudio subjetivo é geralmente mui to pequena. Entretanto, nos sons tonais harmônicos que consistem em muitos componentes espectrais que são percebidos pelo sistema auditivo humano como um único composto, a distorção perceptual resultante é condenável.
[0004] Sinais típicos, onde a preservação da coerência de fase vertical (VPC I vertical phase coherence) é importante, são o discurso sonoro, instrumentos de sopro ou cordas curvadas, por exemplo, 'instrumentos' que, pela natureza de sua produção de som físico, produzem um som que é rico em seu conteúdo harmônico e bloqueado por fase entre os harmônicos. Especialmente em taxas de bit muito baixas, onde a quantidade de bit é extremamente limitada, o uso dos codecs do estado da técnica geralmente enfraquece substancialmente a VPC dos componentes espectrais. Entretanto, nos sinais mencionados previamente, a VPC é um importante sinal perceptual auditivo e uma alta VPC do sinal deve ser preservada.
[ 0005] A seguir, a codificação de áudio perceptual, de acordo com o estado da técnica, é considerada. No estado da técnica, a codificação de áudio perceptual segue vários temas comuns, incluindo o uso do processamento de domínio de tempo/frequência, redução de redundância (codificação por entropia), e remoção de irrelevância através da exploração pronunciada dos efeitos perceptuais (vide [1]). Tipicamente, o sinal de entrada é analisado por um banco de filtro de análise que converte o sinal do domínio de tempo sinal em uma representação espectral, por exemplo, uma representação de tempo/frequência. A conversão em coeficientes espectrais permite processar seletivamente os componentes do sinal dependendo do seu conteúdo de frequência, por exemplo, instrumentos diferentes com suas estruturas harmônicas individuais.
[0006] Em paralelo, o sinal de entrada é analisado com relação a suas propriedades perceptuais. Por exemplo, um limite de mascaramento dependente de tempo e frequência pode ser computado. O limite de mascaramento dependente de tempo e frequência pode ser administrado em uma unidade de quantização através de um limite de codificação alvo na forma de um valor de energia absoluto ou uma Taxa de Mascaramento para Sinal (MSR I Mask-to-Signal-Ratio) para cada faixa de frequência e estrutura do tempo de codificação.
[0007] Os coeficientes espectrais administrados pelo banco de filtro de análise são quantizados para reduzir a taxa de dados necessária para representar o sinal. Esta etapa implica em uma perda de informação e introduz uma distorção da codificação (erro, ruído) no sinal. A fim de reduzir o impacto sonoro deste ruído de codificação, os tamanhos da etapa do quantizador são controlados de acordo com os limites de codificação alvo para cada estrutura e faixa de frequência. Idealmente, o ruído de codificação injetado em cada faixa de frequência é menor do que o limite (mascaramento) de codificação e assim nenhuma degradação no áudio subjetivo é perceptível (remoção de irrelevância). Este controle do ruído de quantização sobre a frequência e tempo de acordo com as exigências psicoacústicas leva a um efeito de formação de ruído sofisticado e é o que torna o codificador um codificador de áudio perceptual.
[0008] Subsequentemente, codificadores de áudio modernos realizam a codificação por entropia, por exemplo, codificação de Huffman ou codificação aritmética nos dados espectrais quantizados. A codificação por entropia é uma etapa de codificação sem perdas que ainda salva a taxa de bit.
[0009] Finalmente, todos os dados espectrais codificados e parâmetros adicionais relevantes, por exemplo, informação lateral, como, por exemplo, os ajustes do quantizador para cada faixa de frequência, são empacotados juntos em fluxo de bit, que é a representação codificada final direcionada para a transmissão ou armazenamento de arquivo.
[00010] Agora, a extensão da largura de f~ixa de acordo com o estado da técnica é considerada. Na codificação de áudio perceptual com base nos bancos de filtro, a parte principal da taxa de bit consumida é geralmente gasta nos coeficientes espectrais quantizados. Assim, em taxas de bit muito baixas, bits insuficientes podem estar disponíveis para representar todos os coeficientes na precisão necessária para obter a reprodução perceptualmente não prejudicada. Assim, as exigências da baixa taxa de bit efetivamente definem um limite na largura de banda de áudio que pode ser obtiaa pela codificação de áudio perceptual.
[00_011] A extensão da largura de banda (vide [2]) remove esta limitação fundamental duradoura. A ideia central da extensão da largura de faixa é complementar um codec perceptual de faixa limitada por um processador de alta- frequência adicional que transmite e recupera o conteúdo de alta frequência ausente em uma forma paramétrica compacta. O conteúdo de alta frequência pode ser gerado com base na única modulação da faixa lateral do sinal da faixa de base, vide, por exemplo, [3], ou na aplicação das técnicas de mudança de tom como, por exemplo, o vocoder em [4].
[ 00012] Especialmente para baixas taxas de bit, os esquemas de codificação paramétrica foram projetados, codificando os componentes sinusoidais (sinusoides) por uma representação paramétrica compacta (vide, por exemplo, [9], [ 1 O] , [ 11] e [ 12] ) . Dependendo do codificador indi victual, o residual remanescente é submetido ainda à codificação paramétrica ou é a forma de onda codificada.
[00013] A seguir, a codificação de áudio espacial paramétrica de acordo com o estado da técnica é considerada.
Como a extensão da largura de faixa de sinais de áudio, a Codificação de Áudio Espacial (SAC I Spatial Audio Coding) deixa o domínio da codificação da forma de onda e foca, em vez disso, na administração de uma réplica perceptualmente satisfatória da imagem de som espacial original. Uma cena de som percebida por um ouvinte humano é determinada essencialmente pelas diferenças entre os sinais do ouvido do ouvinte (as assim chamadas diferenças interaurais) independente se a cena consiste de fontes de áudio reais ou se é reproduzida através de dois ou mais al to-falante que projetam o som fantasma. Em vez de codificar discretamente os sinais do canal de entrada de áudio individuais, um sistema com base no SAC captura a imagem espacial de um sinal de áudio multi canal em um ajuste compacto de parâmetros que podem ser utilizados para sintetizar uma representação multicanal de alta qualidade de um sinal de downmix transmitido (vide, por exemplo, [5], [6] e [7]).
[00014] Devido à sua natureza pararnétr~ca, a codificação espacial de áudio não preserva a forma de onda.
Corno urna consequência, é difícil obter qualidade completamente não prejudicada para todos os tipos de sinais de áudio. Todavia, a codificação de áudio espacial é urna abordagem extremamente poderosa que fornece ganho substancial em taxas de bit baixa e intermediária.
[00015] Efeitos de áudio digital corno efeitos de mudança de torn e extensão de tempo são geralmente obtidos aplicando as técnicas de domínio de tempo como· adição sobreposta sincronizada (SOLA I synchronized overlap-add), ou aplicando as técnicas de domínio de frequência, por exemplo, empregando um vocoder. Além disso, sistemas híbridos foram propostos no estado da técnica aplicando um processamento de SOLA em subfaixas. Vocoders e sistemas híbridos geralmente sofrem de uma perturbação chamada estado de fase (phasiness) que pode ser atribuído à perda da coerência de fase vertical.
Algumas publicações se referem às melhorias na qualidade do som dos algoritmos de extensão de tempo preservando a coerência de fase vertical onde ela é importante (vide, por exemplo, [14] e [15]).
[00016] O uso dos codecs de áudio perceptuais do estado da técnica geralmente enfraquece a coerência de fase vertical (VPC) dos componentes espectrais de um sinal de áudio, especialmente em baixas taxas de bit, onde as técnicas de codificação paramétricas são aplicadas. Entretanto, em determinados sinais, a VPC é urn sinal perceptual irnpo!tante.
Como um resultado, a qualidade perceptual destes sons é prejudicada.
[00017] Codificadores de áudio do estado da técnica geralmente comprometem a qualidade perceptual dos sinais de áudio negligenciando as propriedades importantes de fase do sinal a ser codificado (vide, por exemplo, [ 1] ) . A quantização bruta dos coeficientes espectrais transmitida em um codificador de áudio pode já alterar a VPC do sinal decodificado. Além disso, especialmente devido à aplicação das técnicas de codificação paramétrica, como extensão da largura de faixa (vide [2], [3] e [4] ) ' codificação multicanal paramétrica (vide, por exemplo, [ 5], [6] e [7]), ou codificação paramétrica de componentes sinusoidais (vide [ 9] ' [ 1 O] , [11] e [12]), a coerência de fase sobre a frequência é geralmente prejudicada.
[00018] O re sultado é um som abafado que parece vir de uma distância longe e assim evoca pouco engajamento do ouvinte [ 13] . Mui tos tipos de componente do sinal existem, onde a coerência de fase vertical é importante. Sinais típicos onde a VPC é importante são, por exemplo, tons com rico conteúdo harmônico, como discurso sonoro, instrumentos de sopro ou cordas curvadas.
[ 00019] O objetivo da presente invenção é fornecer conceitos melhorados para o processamento do sinal de áudio e, em particular, fornecer conceitos melhorados para o controle de coerência de fase para sinais harmônicos em codecs de áudio perceptuais. O objetivo da presente invenção é solucionado por um decodificador, de acordo com a reivindicação 1, por um codificador, de acordo com a rei vindicação 8, por um aparelho, de acordo com a reivindicação 14, por um sistema, de acordo com a reivindicação 15, por um método para decodificação, de acordo com a rei vindicação 16, por um método para codificação, de acordo com a reivindicação 17, por um método para processar um sinal de áudio, de acordo com a reivindicação 18 e por um programa de computador, de acordo com a reivindicação 19.
[00020) Um decodificador para decodificar um sinal de áudio codificado para obter um sinal de áudio ajusti?-do por fase é fornecido. O decodificador compreende uma unidade de decodificação e uma unidade de ajuste de fase. A unidade de decodificação é adaptada para decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado. A unidade de ajuste de fase é adaptada para ajustar o sinal de áudio decodificado para obter o sinal de áudio ajustado por fase. A unidade de ajuste de fase é configurada para receber a informação de controle dependendo de uma coerência de fase vertical do sinal de áudio codificado. Além disso, a unidade de ajuste de fase é adaptada para ajustar o sinal de áudio decodificado com base na informação de controle.
[00021) Em uma aplicação, a unidade de ajuste de fase pode ser configurada para ajustar o sinal de áudio decodificado quando a informação de controle indica que o ajuste de fase está ativado. A unidade de ajuste de fase pode ser configurada para não ajustar o sinal de áudio decodificado quando a informação de controle indica que o ajuste de fase está desativado.
[00022] Em outra aplicação, a unidade de ajuste de fase pode ser configurada para receber a informação de controle, caracterizado pela informação de controle compreender um valor de resistência indicando uma resistência de um ajuste de fase. Além disso, a unidade de ajuste de fase pode ser configurada para ajustar o sinal de áudio decodificado com base no valor de resistência.
[00023] De acordo com outra aplicação, o decodificador pode ainda compreender um banco de filtro de análise para decompor o sinal de áudio decodificado em uma pluralidade de sinais de subfaixa de uma pluralidade de subfaixas. A unidade de ajuste de fase pode ser configurada para determinar uma pluralidade de primeiros valores de fase da pluralidade de sinais de subfaixa. Além disso, a µnidade de ajuste de fase pode ser adaptada para ajustar o sinal de áudio codificado modificando pelo menos alguns da pluralidade dos primeiros valores de fase para obter segundos valores de fase do sinal de áudio ajustado por fase.
[00024] Em outra aplicação, a unidade de ajuste de fase pode ser configurada para ajustar pelo menos alguns dos valores de fase aplicando as fórmulas:
[00025] px' ( f) = px ( f) - dp ( f) , e
[00026] dp(f) =a* (pO(f) + const),
[00027] caracterizado por f ser uma frequência indicando uma das subfaixas que tem a frequência f como uma frequência central, em que px(f) é um dos primeiros valores de fase de um dos sinais de subfaixa de uma das subfaixas tendo a frequência f como a frequência central, em que px' (f)
é um dos segundos valores de fase de um dos sinais de subfaixa de uma das subfaixas tendo a frequência f como a frequência central, em que const é um primeiro ângulo na faixa -rr ~ const ~ rr, em que a é um número real na faixa O~ a~ l; e em que pO(f) é um segundo ângulo na faixa -rr ~ pO(f) ~ rr, em que o segundo ângulo pO ( f) é atribuído a uma das subfaixas tendo a frequência f como a frequência central. De modo al terna ti vo, o ajuste de fase acima também pode ser realizado pela multiplicação de um sinal de subfaixa complexo (por exemplo, os coeficientes espectrais complexos de uma Transformada de Fourier Discreta) por um termo de fase exponencial e-jctp(fl onde j é o número y imaginário da unidade.
[00028] De acordo com outra aplicação, o decodificador pode ainda compreender um banco do filtro de síntese. O sinal de áudio ajustado por fase pode ser um sinal de áudio de domínio espectral ajustado por fase sendo representado em um domínio espectral. O banco do filtro de síntese pode ser configurado para transformar o sinal de áudio de domínio espectral ajustado por fase a partir do domínio espectral em um domínio de tempo para obter um sinal de áudio de domínio de tempo ajustado por fase.
[00029] Em uma aplicação, o decodificador pode ser configurado para decodificar a informação de controle da VPC.
[00030] Além disso, de acordo com outra aplicação, o decodificador pode ser configurado para aplicar a informação de controle para obter um sinal decodificado com uma VPC melhor preservada do que nos sistemas convencionais.
[00031] Além disso, o decodificador pode ser configurado para manipular a VPC direcionado pelas medições no decodificador e/ou informação de ativação contida no fluxo de bit.
[00032] Além disso, urn codificador para codificar a inforrnação de controle corn base em urn sinal de entrada de áudio é fornecido. O codificador compreende urna unidade de transformação, urn gerador de informação de controle e urna unidade de codificação. A unidade de transformação é adaptada para transformar o sinal de entrada de áudio a partir de urn domínio de tempo em urn domínio espectral para obter urn sinal de áudio transformado compreendendo urna pluralidade de sinais de subfaixa sendo atribuída a urna pluralidade de subfaixas. O gerador de inforrnação de controle é adaptado para gerar a informação de controle de modo que a informação de controle indique urna coerência de fase vertical do sinal de áudio transformado. A unidade de codificação é adaptada para codificar o sinal de áudio transformado e a informação de controle.
[00033] Em urna aplicação, a unidade de transformação do codificador compreende urn banco de filtro coclear para transformar o sinal de entrada de áudio a partir do domínio de tempo em domínio espectral para obter o sinal de áudio transformado compreendendo a pluralidade de sinais de subfaixa.
[ 00034] De acordo corn outra aplicação, o gerador de informação de controle pode ser configurado para determinar urn envelope da subfaixa para cada urn da pluralidade de sinais de subfaixa para obter uma pluralidade de envelopes do sinal de subfaixa. Além disso, o gerador de informação de controle pode ser configurado para gerar um envelope combinado com base na pluralidade de envelopes do sinal de subfaixa. Além disso, o gerador de informação de controle pode ser configurado para gerar a informação de controle com base no envelope combinado.
[00035] Em outra aplicação, o gerador de informação de controle pode ser configurado para gerar um número caracterizante com base no envelope combinado. Além disso, o gerador de informação de controle pode ser configurado para gerar a informação de controle de modo que a informação de controle indique que o ajuste de fase está ativado quando o número caracterizante for maior do que um valor limite. Além disso, o gerador de informação de controle pode ser configurado para gerar a informação de controle de modo que a informação de controle indique que o ajuste de fase é desativado quando o número caracterizante for menor do que ou igual ao valor limite.
[00036] De acordo com outra aplicação, o gerador de informação de controle pode ser configurado para gerar a informação de controle calculando uma taxa de uma média geométrica do envelope combinado para uma média aritmética do envelope combinado.
(00037] De modo alternativo, o valor máximo do envelope combinado pode ser comparado com um valor médio do envelope combinado. Por exemplo, uma taxa máx./médio pode ser formado, por exemplo, uma taxa do valor máximo do envelope combinado com o valor médio do envelope combinado.
[00038] Em uma aplicação, o gerador de informação de controle pode ser configurado para gerar a informação de controle de modo que a informação de controle compre~nda um valor de resistência indicando um grau de coerência de fase vertical dos sinais de subfaixa.
[00039] Um codificador de acordo com uma aplicação pode ser configurado para conduzir uma medição de VPC no lado do codificador através, por exemplo, de fase e/ou das medições derivadas de fase sobre a frequência.
[00040] Além disso, um codificador de acordo com uma aplicação pode ser configurado para conduzir uma medição da saliência perceptual da coerência de fase vertical.
[00041] Além disso, um codificador de acordo com uma aplicação pode ser configurado para conduzir uma derivação da informação de ativação da saliência da coerência de fase e/ou medições da VPC.
[00042] Além disso, um codificador de acordo com uma aplicação pode ser configurado para extrair sinais de VPC adaptativos de tempo-frequência ou informação de controle.
[00043] Além disso, um codificador de acordo com uma aplicação pode ser configurado para determinar uma representação compacta da informação de controle da VPC.
[ 0004 4] Nas aplicações, a informação de controle da VPC pode ser transmitida em um fluxo de bit.
[00045] Além disso, um aparelho para processar um primeiro sinal de áudio para obter um segundo sinal de áudio é fornecido. O aparelho compreende um gerador de informação de controle, e uma unidade de ajuste de fase. O gerador de informação de controle é adaptado para gerar a informação de controle de modo que a inf armação de controle indique uma coerência de fase vertical do primeiro sinal de áudio. A unidade de ajuste de fase é adaptada para ajustar o primeiro sinal de áudio para obter o segundo sinal de áudio. Além disso, a unidade de ajuste de fase é adaptada para ajustar o primeiro sinal de áudio com base na informação de controle.
[00046] Além disso, um sistema é fornecido. O sistema compreende um codificador de acordo com uma das aplicações descritas acima e pelo menos um decodificador de acordo com uma das aplicações descri tas acima. O codificador é configurado para transformar um sinal de entrada de áudio para obter um sinal de áudio transformado. Além disso, o codificador é configurado para codificar o sinal de áudio transformado para obter um sinal de áudio codificado. Além disso, o codificador é configurado para codificar a informação de controle indicando uma coerência de fase vertical do sinal de áudio transformado. Além disso, o codificador é disposto para inserir o sinal de áudio codificado e a infarmação de controle em, pelo menos, um decodificador. Pelo menos um decodificador é configurado para decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado. Além disso, pelo menos um decodificador é configurado para ajustar o sinal de áudio decodificado com base na informação de controle codificada para obter um sinal de áudio ajustado por fase.
[00047] Nas aplicações, a VPC pode ser medida no lado do codificador, transmitido como informação lateral compacta apropriada com o sinal de áudio codificado e a VPC do sinal é recuperada no decodificador. De acordo com as aplicações alternativas, a VPC é manipulada no decodificador direcionado pela informação de controle gerada pelo decodificador e/ou guiado pela informação de ativação transmitida do codificador na informação lateral. O processamento da VPC pode ser seletivo no tempo-frequência de modo que a VPC seja recuperada apenas onde é perceptualmente útil.
[00048] Além disso, um método para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase é fornecido. O método para decodificar compreende:
[00049] Receber a informação de controle, caracterizado pela informação de controle indicar uma coerência de fase vertical do sinal de áudio codificado.
[00050] Decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado, e
[00051] - Ajustar o sinal de áudio decodificado para obter o sinal de áudio ajustado por fase com base na informação de controle.
[00052] Além disso, um método para codificar a informação de controle com base em um sinal de entrada de áudio é fornecido. O método para codificar compreende:
[00053] Transformar o sinal de entrada de áudio de um domínio de tempo em um domínio espectral para obter um sinal de áudio transformado compreendendo uma pluralidade de sinais de subfaixa sendo atribuída a uma pluralidade de subfaixas,
[00054] Gerar a informação de controle de modo que a informação de controle indique uma coerência de fase vertical do sinal de áudio transformado, e
[00055] Codificar o sinal de áudio transformado e a informação de controle.
(00056] Além disso, um método para processar um primeiro sinal de áudio para obter um segundo sinal de áudio é fornecido. O método para processar compreende:
[00057] Gerar a informação de controle de modo que a informação de controle indique uma coerência de fase vertical do primeiro sinal de áudio, e [ 00058] - Ajustar o primeiro sinal de áudio com base na informação de controle para obter o segundo sinal de áudio.
[00059] Além disso, um programa de computad'?r para implementar um dos métodos descritos acima quando o programa de computador é executado em um computador ou processador de sinal é fornecido.
[00060] Nas aplicações, meios são fornecidos para preservar a coerência de fase vertical (VPC) dos sinais quando a VPC foi comprometida por um processamento de sinal, codificação ou processo de transmissão.
[00061] Em algumas aplicações, o sistema inventivo mede a VPC do sinal de entrada antes da sua codif·icação, transmite a informação lateral compacta apropriada com o sinal de áudio codificado e recupera a VPC do sinal no decodificador com base na informação lateral compacta transmitida. De modo alternativo, o método inventivo manipula a VPC no decodificador direcionado pela informação de controle gerada no decodificador e/ou guiado pela informação de ativação transmitida do codificador na informação lateral.
[00062] Em outras aplicações, a VPC de um sinal prejudicado pode ser processada para recuperar sua VPC original utilizando-se o processo de ajuste da VPC que é controlado pela análise do próprio sinal prejudicado.
[00063] Em ambos os casos, o referido processamento pode ser seletivo no tempo-frequência de modo que a VPC seja recuperada apenas onde é perceptualmente útil.
[00064] A qualidade melhorada do som dos codificadores de áudio perceptuais é fornecida a custos moderados da informação lateral. Além dos codificadores de áudio perceptuais, a medição e recuperação da VPC também é útil para os efeitos do áudio digital com base nos vocoders de fase, como extensão do tempo ou mudança de tom.
[00065] Aplicações são fornecidas nas reivindicações dependentes.
[00066] A seguir, as aplicações são descritas com relação às figuras, nas quais:
[00067] A Fig. la ilustra um decodificador para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase de acordo com uma aplicação,
[00068] A Fig. lb ilustra um decodificador para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase de acordo com outra aplicação, [ 00069] A Fig. 2 ilustra um codificador para codificar a informação de controle com base em um sinal de entrada de áudio de acordo com uma aplicação,
[00070] A Fig. 3 ilustra um sistema de acordo com uma aplicação compreendendo um codificador e pelo menos um decodificador,
[00071] A Fig. 4 ilustra um sistema de processamento de áudio com processamento de VPC de acordo cbm uma aplicação,
[00072] A Fig. 5 descreve um codificador e decodificador de áudio perceptual de acordo com uma aplicação,
[00073] A Fig. 6 ilustra um gerador de controle da VPC de acordo com uma aplicação, e
[00074] A Fig. 7 ilustra um aparelho para processar um sinal de áudio para obter um segundo sinal de áudio de acordo com uma aplicação, [ 00075] A Fig. 8 ilustra um sistema de processamento de áudio VPC de acordo com outra aplicação.
[00076] A Figura la ilustra um decodificador para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase de acordo com uma aplicação. O decodificador compreende uma unidade de decodificação 110 e uma unidade de ajuste de fase 120. A unidade de decodificação 110 é adaptada para decodificar o sinal de áudio cod.ificado para obter um sinal de áudio decodificado. A unidade de ajuste de fase 120 é adaptada para ajustar o sinal de áudio decodificado para obter o sinal de áudio ajustado por fase.
Além disso, a unidade de ajuste de fase 120 é configurada para receber a informação de controle dependendo de uma coerência de fase vertical (VPC) do sinal de áudio codificado. Além disso, a unidade de ajuste de fase 120 é adaptada para ajustar o sinal de áudio decodificado com base na informação de controle.
[ 00077] A aplicação da Figura la considera que para determinados sinais de áudio é importante recuperar a coerência de fase vertical do sinal codificado. Por exemplo, quando a parte do sinal de áudio compreende discurso sonoro, instrumentos de sopro ou cordas curvadas, a preservação da coerência de fase vertical é importante. Pará esta finalidade, a unidade de ajuste de fase 120 é adaptada para receber a informação de controle que depende da VPC do sinal de áudio codificado.
[00078] Por exemplo, quando as partes do sinal codificado compreendem discurso sonoro, instrumentos de sopro ou cordas curvadas, então, a VPC do sinal codificado é alta.
Nestes casos, a informação de controle pode indicar que o ajuste de fase é ativado.
[ 0007 9] Outras partes do sinal não podem compreender sinais ou transientes tonais do tipo pulso, e a VPC destas partes do sinal pode ser baixa. Nestes casos, a informação de controle pode indicar que o ajuste de fase está desativado.
(00080] Em outras aplicações, a informação de controle pode compreender um valor de resistência. Este valor de resistência pode indicar uma resistência do ajuste de fase que deve ser realizada. Por exemplo, o valor de resistência pode ser um valor a com O~ a~ 1. Se a= 1 ou próximo a 1 isso pode indicar um alto valor de resistência. A ajustes de fase significativos serão conduzidos pela unidade de ajuste de fase 120. Se a estiver próximo a O, apenas pequenos ajustes de fase serão conduzidos pela unidade de ajuste de fase 120. Se a= O, nenhum ajuste de fase será conduzido.
[00081] A Figura lb ilustra um decodificador para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase de acordo com outra aplicação.
Além da unidade de decodificação 110 e da unidade de ajuste de fase 120, o decodificador da Figura lb compreende um banco de filtro de análise 115 e um banco do filtro de síntese 125.
[00082] O banco de filtro de análise 115 é configurado para decompor o sinal de áudio decodificado em uma pluralidade de sinais de subfaixa de uma pluralidade de subfaixas. A unidade de ajuste de fase 120 da Figura lb pode ser configurada para determinar uma pluralidade de primeiros valores de fase da pluralidade de sinais de subf aixa. Além disso, a unidade de ajuste de fase 120 pode ser adaptada para ajustar o sinal de áudio codificado modificando pelo menos alguns da pluralidade de primeiros valores de fase para obter segundos valores de fase do sinal de áudio ajustado por fase.
[00083] O sinal de áudio ajustado por fase pode ser um sinal de áudio de domínio espectral ajustado por fase sendo representado em um domínio espectral. O banco do' filtro de síntese 125 da Figura lb pode ser configurado para transformar o sinal de áudio de domínio espectral ajustado por fase a partir do domínio espectral em um domínio de tempo para obter um sinal de áudio de domínio de tempo ajustado por fase.
[00084] A Figura 2 descreve um codi"f icador correspondente para codificar a informação de controle com base em um sinal de entrada de áudio de acordo com uma aplicação. O codificador compreende uma unidade de transformação 210, urn gerador de informação de controle 220 e urna unidade de codificação 230. A unidade de transformação 210 é adaptada para transformar o sinal de entrada de áudio de urn domínio de tempo em urn domínio espectral para obter urn sinal de áudio transformado compreendendo urna pluralidade de sinais de subfaixa sendo atribuída a urna pluralidade de subfaixas. O gerador de informação de controle 220 é adaptado para gerar a informação de controle de modo que a informação de controle indica urna coerência de fase vertical (VPC) do sinal de áudio transformado. A unidade de codificação 230 é adaptada para codificar o sinal de áudio transformado e a informação de controle.
[00085] O codificador da Figura 2 é adaptado para codificar a informação de controle que depende da co.erência de fase vertical do sinal de áudio a ser codificado. Para gerar a informação de controle, a unidade de transformação 210 do codificador transforma o sinal de entrada de áudio em urn domínio espectral de modo que o sinal de áudio transformado resultante compreenda urna pluralidade de sinais de subfaixa de uma pluralidade de subfaixas.
[00086] Depois disso, o gerador de informação de controle 220 então determina a informação que depende da coerência de fase vertical do sinal de áudio transformado.
[00087) Por exemplo, o gerador de informação de controle 220 pode classificar uma parte particular do sinal de áudio como uma parte do sinal onde a VPC é al ta e, por exemplo, definir um valor ~=l. Para outras partes do sinal, o gerador de informação de controle 220 pode classificar uma parte particular do sinal de áudio como uma parte dô sinal onde a VPC é baixa e, por exemplo, definir um valor ~=O.
[00088) Em outras aplicações, o gerador de informação de controle 220 pode determinar um valor de resistência que depende da VPC do sinal de áudio transformado. Por exemplo, o gerador de informação de controle pode atribuir um valor de resistência referente a uma parte do sinal examinada, caracterizado pelo valor de resistência depender da VPC da parte do sinal. Em um lado do decodif icador, o valor de resistência pode então ser empregado para determinar se apenas pequenos ajustes de fases devem ser conduzidos ou se fortes ajustes de fase devem ser conduzidos com relação aos valores de fase da subfaixa de um sinal de áudio decodificado para recuperar a VPC original do sinal de áudio.
[00089) A Figura 3 ilustra outra aplicação. Na Figura 3, um sistema é fornecido. o sistema compreende um codificador 310 e pelo menos um decodif icador. Enquanto a Figura 3 ilustra apenas um único decodif icador 320, . outras aplicações podem compreender mais do que um decodificador. O codificador 310 da Figura 3 pode ser um codificador da aplicação da Figura 2. O decodificador 320 da Figura 3 pode ser o decodificador da aplicação da Figura la ou da aplicação da Figura lb. O codificador 310 da Figura 3 é configurado para transformar um sinal de entrada de áudio para obter um sinal de áudio transformado (não mostrado). Além disso, o codificador 310 é configurado para codificar o sinal de áudio transformado para obter um sinal de áudio codificado. Além disso, o codificador é configurado para codificar a informação de controle indicando uma coerência de fase vertical do sinal de áudio transformado. O codificador é disposto para inserir o sinal de áudio codificado e a informação de controle em, pelo menos, um decodificador.
[00090] O decodificador 320 da Figura 3 é conflgurado para decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado (não mostrado). Além disso, o decodificador 320 é configurado para ajustar o sinal de áudio de codificado com base na informação de controle codificada para obter um sinal de áudio ajustado por fase.
[ 00091] Resumindo o supracitado, as aplicações descritas acima objetivam preservar a coerência de fase vertical dos sinais especialmente nas partes do sinal com um alto grau de coerência de fase vertical.
[00092] Os conceitos propostos melhoram a qualidade perceptual que é administrada por um sistema de processamento de áudio, a seguir também refe rido como "sistema de áudio", medindo as características da VPC do sinal de entrada ao sistema de processamento de áudio e ajudando a VPC do sinal de saída produzido pelo sistema de áudio com base nas características da VPC medidas para formar um sinal de saída final, de modo que a VPC direcionada do sinal de saída final seja obtida.
[00093] A Figura 4 exibe um sistema de processamento de áudio geral que é melhorado pela aplicação descrita acima.
Em particular, a Figura 4 descreve um sistema para o processamento da VPC. Do sinal de entrada de um sistema de áudio 410, um Gerador de Controle da VPC 420 mede a VPC e/ou sua saliência perceptual, e gera a informação de controle da VPC. A emissão do sistema de áudio 410 é inserida em uma Unidade de Ajuste de VPC 430, e a informação de controle da VPC é utilizada na unidade de ajuste da VPC 430 para reestabelecer a VPC.
[00094] Como um caso prático importante, este conceito pode ser aplicado, por exemplo, aos codecs de áudio convencionais medindo a VPC e/ou a saliência perceptual da coerência de fase no lado do codificador, transmitindo a informação lateral compacta apropriada com o sinal de áudio codificado e recuperando a VPC do sinal no decodificador, com base na informação lateral compacta transmitida.
[00095] A Figura 5 ilustra um codificador e decodificador de áudio perceptual de acordo com uma aplicação. Em particular, a Figura 5 descreve um codec de áudio perceptual que implementa um processamento da VPC bilateral.
[00096] Em um lado do codificador, uma unidade de codificação 510, um gerador de controle da VPC 520 e uma unidade de multiplexação do fluxo de bit 530 são ilustrados.
Em um lado do decodificador, uma unidade de demultiplexação do fluxo de bit 540, uma unidade de decodificação 550 e uma unidade de ajuste da VPC 560 são descritas.
[00097] No lado do codificador, a informação de controle da VPC é gerada pelo gerador de controle da VPC 520 e codificada como uma informação lateral compacta que é multiplexada pela unidade de multiplexação 530 ao fluxo de bit com o sinal de áudio codificado. A geração da informação de controle da VPC pode ser seletiva no tempo-frequência de modo que a VPC seja apenas medida e a informação de controle seja codificada apenas onde é perceptualmente útil.
[00098] No lado do decodificador, a informação de controle da VPC é extraída pela unidade de demultiplexação do fluxo de bit 540 do fluxo de bit e é aplicada na unidade de ajuste da VPC 560 a fim de reestabelecer a VPC correta.
[00099] A Figura 6 ilustra alguns detalhes de uma possível implementação de um gerador de controle da VPC 600.
No sinal de áudio de entrada, a VPC é medida por uma unidade de medição de VPC 610 e a saliência perceptual da VPC é medida por uma unidade de medição da saliência da VPC 620. A . partir destas, a informação de controle da VPC é derivada por uma unidade de derivação da informação de controle da VPC
630. A entrada de áudio pode compreender mais do que um sinal de áudio, por exemplo, além da primeira entrada de áudio, uma segunda entrada de áudio compreendendo uma versão processada do primeiro sinal de entrada (vide Figura 5) pode ser aplicada ao gerador de controle da VPC.
[000100] Nas aplicações, o lado do codificador pode compreender um gerador de controle da VPC para medir a VPC do sinal de entrada e/ou medição da saliência perceptual da VPC do sinal de entrada. O gerador de controle da VPC pode fornecer a informação de controle da VPC para controlar o ajuste da VPC em um lado do decodif icador. Por exemplo, a informação de controle pode sinalizar habilitando ou desabilitando o ajuste da VPC do lado do decodificador ou, a informação de controle pode determinar a resistência do ajuste da VPC do lado do decodificador.
[000101) Como a coerência de fase vertical é importante para a qualidade subjetiva do sinal de áudio, se o sinal for tonal e/ou harmônico, e se seu tom não mudar muito rapidamente, uma implementação típica de uma unidade de controle de VPC pode incluir um detector de tom ou um detector de harmonia ou, pelo menos um detector de variação de tom, fornecendo uma medição da resistência do tom . . [ 000102J Além disso, a informação de controle gerada pelo gerador de controle da VPC pode sinalizar a resistência da VPC do sinal original. Ou, a informação de controle pode sinalizar um parâmetro de modificação que aciona o ajuste da VPC do decodificador de modo que, após o ajuste da VPC do lado do decodif icador, a VPC percebida do sinal original é aproximadamente recuperada. De modo alternativo ou adicional, um ou vários valores de VPC alvo que devem ser instalados podem ser sinalizados.
[000103) A informação de controle da VPC pode ser transmitida de forma compacta do codificador ao lado do decodificador, por exemplo, incorporando ao fluxo de bit como informação lateral adicional.
[000104) Nas aplicações, o decodificador pode ser configurado para ler a informação de controle da VPC fornecida pelo gerador de controle da VPC do lado do codificador. Para esta finalidade, o decodificador pode ler a informação de controle da VPC do fluxo de bit. Além disso, o decodificador pode ser configurado para processar a saída do decodificador de áudio regular dependendo da informação de controle da VPC empregando uma unidade de ajuste da VPC. Além disso, o decodificador pode ser configurado para administrar o sinal de áudio processado como o sinal de saída
[000105] A seguir, um gerador de controle da VPC do lado do codificador de acordo com uma aplicação é fornecido.
[000106] Sinais periódicos quase estacionários que exibem uma al ta VPC podem ser identificados pelo uso de um detector de tom ( como são bem conhecidos de, por exemplo, codificação de fala ou análise do sinal de música) que administra uma medição de resistência do tom e/ou grau de periodicidade. A VPC real pode ser medida pela aplicação de um banco de filtro coclear, uma detecção do envelope da subfaixa subsequente seguida por uma soma dos envelopes coclear pela frequência. Se, por exemplo, o envelope da subfaixas for coerente, a soma administra um sinal temporariamente não plano, enquanto que os envelopes da subfaixa não coerentes somam um sinal temporariamente mais plano. A partir da avaliação combinada (por exemplo, comparando com limites predefinidos, respectivamente) da resistência do tom e/ou grau de periodicidade e medição da VPC, a informação do Controle de VPC pode ser de~ivada, consistindo, por exemplo, de um indicador do sinal denotando 'ajuste da VPC ligado' ou outro 'ajuste da VPC desligado'.
[000107) Eventos do tipo impulso em um domínio de tempo exibem uma forte coerência de fase referente às suas representações espectrais. Por exemplo, um impulso Dirac por transformada de Fourier tem um espectro plano com fases linearmente crescentes. O mesmo mantém-se verdadeiro para uma série de pulsos periódicos tendo uma frequência base def O. Aqui, o espectro é um espectro linear. Estas únicas linhas que têm uma distância da frequência de f O são ainda coerência de fase. Quando sua coerência de fase é perturbada (magnitudes permanecem sem modificações), o sinal do domínio de tempo re sultan te não é mais longo de que uma série de pulsos Dirac, mas em vez disso, os pulsos foram significativamente estendidos no tempo. Esta modificação é audível e é particularmente relevante para sons que são semelhantes a uma série de pulsos, por exemplo, discurso sonoro, instrumentos de corda ou cordas curvadas.
[000108) Assim, a VPC pode ser medida indiretamente determinando o não nivelamento local de um envelope de um sinal de áudio no tempo (os valores absolutos do envelope podem ser considerados).
[000109) Pela soma dos envelopes da subfaixa pela frequência, pode ser determinado se os envelopes somam em um envelope combinado plano (baixa VPC) ou em um envelope combinado não plano (alta VPC). O conceito proposto é parcialmente vantajoso, se os envelopes somados se referirem às faixas de frequência auditivamente precisas e perceptualmente adaptadas.
[000110) A informação de controle pode, então, por exemplo, ser gerada calculando um índice de uma média geométrica do envelope combinada com uma média aritmética do envelope combinado.
[000111) De modo alternativo, o valor máximo do envelope combinado pode ser comparado com um valor médio do envelope combinado. Por exemplo, uma taxa máx./médio pode ser formado, por exemplo, uma taxa do valor máximo do envelope combinado com o valor médio do envelope combinado.
[000112) Em vez de formar um envelope combinado, por exemplo, uma soma de envelopes, os valores de fase do espectro do sinal de áudio que deve ser codificado podem ser examinados para previsão. Uma alta previsão indica uma alta VPC. Uma baixa previsão indica uma baixa VPC.
[000113) Empregar um banco de filtro coclear é particularmente vantajoso com relação aos sinais de áudio, se a VPC ou a saliência da VPC deve ser def in ida como uma medição psicoacústica. Visto que a escolha de uma largura de faixa do filtro particular define, cujos tons parciais do espectro se referem a uma subfaixa comum, e assim juntas contribuem para formar um determinado envelope da subfaixa, filtros perceptualmente adaptados podem modelar o processamento interno do sistema auditivo humano mais precisamente.
[000114) A diferença na percepção auditiva entre um sinal incoerente por fase e um coerente por fase t~ndo os mesmos espectros de magnitude é além disso dependente da dominância de componentes espectrais harmônicos no sinal (ou na pluralidade de sinais). Uma frequência de base baixa, por exemplo, 100 Hz destes componentes harmônicos aumenta a diferença que uma frequência de base alta reduz a diferença, pois uma frequência de base baixa resulta em mais har~ônicos sendo atribuídos à mesma subfaixa. Estes harmônicos na mesma subfaixa somam-se novamente e seu envelope da subfaixa pode ser examinado.
[000115] Além disso, a amplitude dos harmônicos é relevante. Se a amplitude dos harmônicos for alta, o aumento do envelope do domínio de tempo se torna mais acentuado, o sinal se torna mais do tipo pulso e assim, a VPC se torna muito importante, por exemplo, a VPC fica mais alta.
[000116] A seguir, uma unidade de ajuste da VPC do lado do decodificador de acordo com uma aplicação é fornecida. Esta unidade de ajuste da VPC pode compreender a informação de controle compreendendo um indicador da informação de Controle da VPC.
[000117] Se o Controle da VPC nos indicadores denotar 'ajuste da VPC desligado', nenhum processamento da VPC dedicado é aplicado ("submetido", ou, de modo alternativo, um simples atraso). Se o indicador ler "ajuste da VPC ligado", o segmento do sinal é decomposto por um banco de filtro de análise e uma medição de fase pO(f) de cada linha espectral na frequência fé iniciada. A partir disso, os Deslocamentos do ajuste de fase dp(f) =a* (pO(f) + const) são calculados onde 'const' denota um ângulo em radianos entre -n en. Para o referido segmento do sinal e os seguintes segmentos consecutivos, onde "ajuste da VPC ligado" é sinalizado, as fases px ( f) das linhas espectrais x ( f) são então ajustadas para ser px'(f) = px(f) - dp(f). O sinal ajustado da VPC é finalmente convertido ao domínio de tempo por um banco do filtro de síntese.
[000118] O conceito existe com base na ideia de conduzir uma medição inicial para determinar um desvio de uma resposta de fase ideal. Este desvio é compensado posteriormente. a pode ser um ângulo na faixa O~ a~;, a= O significa nenhuma compensação, a= 1 significa compensação total referente à resposta de fase ideal. A resposta de fase ideal pode, por exemplo, ser a resposta da fase resultante em uma resposta de fase com nivelamento máximo. "const" é um ângulo aditivo fixado que não muda a coerência de fase, mas que permite direcionar as fases absolutas al terna tivas, e assim gerar sinais correspondentes, por exemplo, a transformada de Hilbert do sinal quando const é 90º.
[000119] A Figura 7 ilustra um aparelho para processar um primeiro sinal de áudio para obter um segundo sinal de áudio de acordo com outra aplicação. O aparelho compreende um gerador de informação de controle 710, e uma unidade de ajuste de fase 720. O gerador de informação de controle 710 é adaptado para gerar a informação de controle de modo que a informação de controle indique uma coerência de fase vertical do primeiro sinal de áudio. A unidade de ajuste de fase 720 é adaptada para ajustar o primeiro sinal de áudio para obter o segundo sinal de áudio. Além disso, a unidade de ajuste de fase 720 é adaptada para ajustar o primeiro sinal de áudio com base na informação de controle.
[000120] A Figura 7 é uma aplicação unilateral. A determinação da informação de controle e dos ajustes de fase conduzidos não são divididos entre um codificador (geração da informação de controle) e um decodificador (ajuste de· fase).
Em vez disso, a geração da informação de controle e o ajuste de fase são conduzidos por um único aparelho ou sistema.
[000121] Na Figura 8, a VPC é manipulada no decodif icador conduzido pela informação de controle gerada também no lado do decodificador ("sistema unilateral"), caracterizado pela informação de controle ser gerada pela análise do sinal de áudio decodificado. Na Figura 8, um codec de áudio perceptual com um processamento da VPC unilateral de acordo com uma aplicação é ilustrado.
[000122] Um sistema unilateral de acordo com as aplicações como, por exemplo, ilustrado pela Figura 7 e Figura 8, pode ter as seguintes características:
[000123] A saída de qualquer processo de processamento de sinal existente ou de um sistema de áudio, por exemplo, o sinal de saída de um decodificador de áudio, é processada sem ter acesso à informação de controle da VPC que é gerada com acesso a um sinal não prejudicado/original (por exemplo, em um lado do codificador). Em vez disso, a informação de controle da VPC pode ser gerada diretamente do sinal dado, por exemplo, da saída de urn sistema de áudio, por exemplo, um decodificador, (a informação de controle da VPC pode ser "cegamente" gerada).
[000124] A informação de controle da VPC para controlar o ajuste da VPC pode compreender, por exemplo, sinais para habilitar/desabilitar a unidade de ajuste da VPC ou para determinar a resistência do ajuste da VPC, ou a informação de controle da VPC pode compreender um ou vários valores de VPC alvo a ser instalados.
[000125] Além disso, o processamento pode ser realizado em um estágio de ajuste da VPC, (uma unidade de ajuste da VPC) que utiliza a informação de controle da VPC gerada cegamente e leva sua saída como a saída do sistema.
[000126] A seguir, urna aplicação de um gerador de controle da VPC do lado do decodificador é fornecida. O gerador de controle do lado do decodif icador pode ser bem pequeno comparado ao gerador de controle do lado do codificador. Pode, por exemplo, compreender urn detector de torn que administra urna medição da resistência do tom e/ou o grau de periodicidade e urna comparação com urn limite predefinido. Entretanto, o lirni te pode ser diferente de urn utilizado no gerador de controle do lado do codificador visto que o gerador de VPC do lado do decodificador opera no sinal de VPC já distorcido. Se a distorção da VPC for leve, a VPC remanescente também pode ser medida e comparada com um limite dado para gerar a informação de controle da VPC.
[ 000127] De acordo corn urna aplicação pref e rida, se a medida VPC for alta, a modificação de VPC é aplicada a fim de aumentar ainda a VPC do sinal de saída, e, se a medida VPC for baixa, nenhuma modificação de VPC é aplicada. Vistp que a preservação da VPC é mais importante para sinais tonais e harmônicos, para processamento da VPC de acordo com a aplicação preferida, urn detector de torn ou, pelo menos uma variação de torn pode ser empregada, fornecendo uma medição da resistência do tom dominante.
[000128] Finalmente, a abordagem bilateral e a abordagem unilateral podem ser combinadas, caracterizado pelo processo de ajuste da VPC ser controlado tanto pela informação de controle da VPC derivada transmitida de um sinal original/ou não prejudicado e a informação extraída dos processos (por exemplo, decodificada) do sinal de áudio. Por exemplo, um sistema combinado resulta desta combinação.
[000129] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos também representam uma descrição do método correspohdente, onde um bloco ou dispositivo corresponde a uma etapa do método ou a uma característica de uma etapa do método. De forma análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente.
[000130] Dependendo de determinadas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legíveis armazenados neles, que cooperam (ou podem cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado.
[000131] Algumas aplicações de acordo com a ip.venção compreendem um transportador de dados tendo sinais de controle legíveis eletronicamente, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
[000132) Geralmente, as aplicações da presente invenção podem ser implementadas como um produto do programa de computador com um código do programa, o código do programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código do programa pode, por exemplo, ser armazenado em um transportador legível em máquina.
[ 000133] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenado em um transportador legível em máquina ou um meio de armazenamento não transitório.
[000134) Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador tendo um código do programa para realizar um dos métodos descritos aqui, quando o programa de computador é executado em um computador.
[000135) Outra aplicação dos métodos inventivos é, portanto, um transportador de dados (ou um meio de armazenamento digital, ou um meio legível em computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos descritos aqui.
[000136) Outra aplicação do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos descri tos aqui. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurada para ser transferida através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[000137] Outra aplicação compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos aqui.
[000138] Outra aplicação compreende um computador tendo instalado nele o programa de computador para r.ealizar um dos métodos descritos aqui.
[000139] Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de porta programável de campo) pode ser utilizada para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas aplicações, um arranjo de porta programável de campo pode cooperar com um microprocessador a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[000140] As aplicações descri tas acima são meramente ilustrativas para os princípios da presente invenção.
Entende-se que as modificações e variações das disposições e os detalhes descritos aqui serão evidentes para outros especialistas na técnica. Portanto, a invenção destina-se a ser limitada apenas pelo escopo das reivindicações de patente anexas e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações neste documento.
REFERÊNCIAS
[000141] [ 1] Painter, T. ; Spanias, A. Perceptual coding of digital audio, Proceedings of the IEEE, 88(4), 2000; pp. 451-513.
[000142] [2] Larsen, E.; Aarts, R. Audio Bandwidth Extension: Application of psychoacoustics, signal processing and loudspeaker design, John Wiley e Sons Ltd, 2004, Capítulos 5, 6.
[000143] [ 3] Dietz, M.; Liljeryd, L.; Kjorling, K.; Kunz, O . Spectral Band Replication, a Novel Approach in Audio Coding, 112ª Convenção AES, abril 2002, Preprint 5553.
[000144] [ 4] Nagel, F.; Disch, S. Rettelbach, N. A Phase Vocoder Oriven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs, 12 6 ª Convenção AES, 2009.
[000145] [5] Faller, C.; Baumgarte, F. Binaural Cue Coding- Part II: Schemes and applications, IEEE Trans. On Speech and Audio Processing, Vol. 11, No. 6, Nov. 2003.
[000146] [6] Schuijers, E.; Breebaart, J.; Purnhagen, H.; Engdegard, J. Low complexity parametric stereo coding, 116ª Convenção AES, Berlin, Alemanha, 2004; Preprint
6073.
[000147] [7] Herre, J.; Kjorling, K.; Breebaart, J. et al. MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding, Journal of the AES, Vol. 56, No. 11, novembro 2008; pp. 932-955.
[000148] [ 8] Laroche, J.; Dolson, M., "Phase- vocoder: about this phasiness business," Applications of Signal Processing to Audio and Acoustics, 1997. 1997 IEEE
ASSP Workshop on, vol., no., pp.4 pp., 19-22, Out 1997 [000149) [ 9] Purnhagen, H.; Meine, N.;, "HILN-the MPEG-4 parametric audio coding tools," Circuits and Systems,
2000. Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium on, vol.3, no., pp.201-204 vol.3, 2000 [000150) [10) Oomen, Werner; Schuij ers, Erik; den Brinker, Bert; Breebaart, Jeroen:," Advances in Parametric Coding for High-Quality Audio," Audio Engineering Society Convention 114, preprint, Amsterdam/NL, março 2003 [000151) [ 11] van Schijndel, N.H.; van de Par, s. ; ' "Rate-distortion optimized hybrid sound coding," Applications of Signal Processing to Audio and Acoustics,
2005. IEEE Workshop on, vol., no., pp. 235-238, 16-19 outubro 2005 [000152) [12) http://people.xiph.org/- xiphmont/demo/ghost/demo.html [000153) [13) D. Griesinger 'The Relationship between Audience Engagement and the ability to Perceive Pitch, Timbre, Azimuth and Envelopment of Multiple Sources' Tonmeister Tagung 2010.
[000154) [14) D. Dorran and R. Lawlor, "Time-scale modification of music using a synchronized subband/timedomain approach," IEEE International Conference on Acoustics, Speech and Signal Processing, pp. IV 225- IV 228, Montreal, maio
2004.
[000155) [15) J. Laroche, "Frequency.-domain techniques for high quality voice modification," Proceedings of the International Conference on Digital Audio Effects, pp.
328-322, 2003.

Claims (19)

REIVINDICAÇÕES
1. Um decodificador para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase, compreendendo: uma unidade de decodificação (110); para decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado, e uma unidade de ajuste de fase (120; 430; 560) para ajustar o sinal de áudio decodificado para obter o sinal de áudio ajustado por fase, caracterizado pela unidade de ajuste de fase (120; 430; 560) ser configurada para receber a informação de controle dependendo de uma coerência de fase vertical do sinal de áudio codificado, e em que a unidade de ajuste de fase (120; 430; 560) seja adaptada para ajustar o sinal de áudio decodificado com base na informação de controle.
2. Um decodificador de acordo .com a reivindicação 1, caracterizado pela unidade de ajuste de fase (120; 430; 560) ser configurada para ajustar o sinal de áudio decodificado quando a informação de controle indicar que o ajuste de fase está ativado, e em que a unidade de ajuste de fase (120; 430; 560) é configurada para não ajustar o sinal de áudio decodificado quando a informação de controle indicar que o ajuste de fase está desativado.
3. Um decodificador de acordo com a reivindicação 1, caracterizado pela unidade de ajuste de fase (120; 430; 560) ser configurada para receber a informação de controle, em que a informação de controle compreende um valor de resistência indicando uma resistência de um ajuste de fase, e em que a unidade de ajuste de fase (120; 430; 560) é configurada para ajustar o sinal de áudio decodificado com base no valor de resistência.
4. Um decodif icador de acordo com qualquer uma das reivindicações de 1 a 3, caracterizado pelo decodificador compreender, ainda, um banco de filtro de análise para decompor o sinal de áudio decodificado em uma pluralidade de sinais de subfaixa de uma pluralidade de subfaixas, em que a unidade de ajuste de fase (120; 430; 560) é configurada para determinar uma pluralidade de primeiros valores de fase da pluralidade de sinais de subfaixa, e em que a unidade de ajuste de fase (120; 430; 560) é adaptada para ajustar o sinal de áudio codificado modificando pelo menos alguns da pluralidade de pr.imeiros valores de fase para obter os segundos valores de fase do sinal de áudio ajustado por fase.
5. Um decodificador de acordo com a reivindicação 4, caracterizado pela unidade de ajuste de fase (120; 430; 560) ser configurada para ajustar pelo menos alguns dos valores de fase aplicando as fórmulas: px' ( f) = px ( f) - dp ( f) , e dp(f) =a* (pO(f) + const), em que fé uma frequência que indica uma das subfaixas que tem a frequência f como uma frequência central, em que px (f) é um dos primeiros valores de fase de um dos sinais de subfaixa de uma das subfaixas tendo a frequência f como a frequência central, em que px' ( f) é um dos segundos valÓres de fase de um dos sinais de subfaixa de uma das subfaixas tendo a frequência f como a frequência central, em que const é um primeiro ângulo na faixa -rr ~ const ~ rr, em que a é um número real na faixa O~ a~ 1; e em que pO(f) é um segundo ângulo na faixa -rr ~ pO(f) ~ rr, em que o segundo ângulo pO(f) é atribuído a uma das subfaixas tendo a frequência f como a frequência central.
6. Um decodificador de acordo com a reivindicação 4, caracterizado pela unidade de ajuste de fase (120; 430; 560) ser configurada para ajustar pelo menos alguns dos valores de fase multiplicando pelo menos alguns da pluralidade de sinais de subfaixa por um termo de fase exponencial, em que o termo de fase exponencial é definido pela fórmula e-jdp(f), em que a pluralidade de sinais de subfaixa são sinais de subfaixa complexos, e em que j é um número y imaginário da unidade.
7. Um decodificador de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo decodif icador compreender ainda um banco do filtro de síntese (125), em que o sinal de áudio ajustado por fase é um sinal de áudio de domínio espectral ajustado por fase sendo representado em um domínio espectral, e em que o banco do filtro de síntese ( 125) é configurado para transformar o sinal de áudio de domínio espectral ajustado por fase a partir do domínio espectral em um domínio de tempo para obter um sinal de áudio de domínio de tempo ajustado por fase.
8. Um codificador para codificar a informação de controle com base em um sinal de entrada de áudio, compreendendo: uma unidade de transformação (210) para transformar o sinal de entrada de áudio de um domínio de tempo em um domínio espectral para obter um sinal de áudio transformado compreendendo uma pluralidade de sinais de subfaixa sendo atribuídos a uma pluralidade de subfaixas, um gerador de informação de controle ( 220; 420; 520; 600) para gerar a informação de controle de modo que a informação de controle indica uma coerência de fase vertical do sinal de áudio transformado, e uma unidade de codificação (230) para codificar o sinal de áudio transformado e a informação de controle.
9. Um codificador de acordo com a reivindicação 8, caracterizado pela unidade de transformação (210) compreender um banco de filtro coclear para transformar o sinal de entrada de áudio a partir do domínio de tempo ao domínio espectral para obter o sinal de áudio transformado compreendendo a pluralidade de sinais de subfaixa.
10. Um codificador de acordo com a reivindicação 8 ou 9, caracterizado pelo gerador de informação de controle (220; 420; 520; 600) ser configurado para determinar um envelope da subfaixa para cada um da pluralidade de sinais de subfaixa para obter uma pluralidade de envelopes do sinal de subfaixa, em que o gerador de informação de controle (220; 420; 520; 600) é configurado para gerar um envelope combinado com base na pluralidade de envelopes do sinal de subfaixa, e em que o gerador de informação de controle (220; 420; 520; 600) é configurado para gerar a informação de controle com base no envelope combinado.
11. Um codificador de acordo com a reivindicação 10, caracterizado pelo gerador de informação de controle (220; 420; 520; 600) ser configurado para gerar um número caracterizante com base no envelope combinado, e em que o gerador de informação de controle
(220; 420; 520; 600) é configurado para gerar a informação de controle de modo que a informação de controle indique que o ajuste de fase é ativado quando o número caracterizante é maior do que um valor limite, e em que o gerador de informação de controle (220; 420; 520; 600) é configurado para gerar a informação de controle de modo que a informação de controle indique que o ajuste de fase está desativado quando o número caracterizante é menor do que ou igual ao valor limite.
12. Um codificador de acordo com a reivindicação 10 ou 11, caracterizado pelo gerador de informação de controle ( 22 O; 42 O; 52 O; 600) ser configurado para gerar a informação de controle calculando uma taxa de uma média geométrica do envelope combinado para uma média aritmética do envelope combinado.
13. Um codificador de acordo com qualquer uma das reivindicações de 8 a 12, caracterizado pelo gerador de informação de controle (220; 420; 520; 600) ser configurado para gerar a informação de controle de modo que a informação de controle compreende um valor de resistência indicando um grau de coerência de fase vertical dos sinais de subfaixa.
14. Um aparelho para processar um primeiro sinal de áudio para obter um segundo sinal de áudio, compreendendo: um gerador de informação de controle ( 710; 820) para gerar a informação de controle de modo que a
• 7/9 informação de controle indica uma coerência de fase vertical do primeiro sinal de áudio, e uma unidade de ajuste de fase (720; 830) para ajustar o primeiro sinal de áudio para obter o segundo sinal de áudio, caracterizado pela unidade de ajuste de fase (720; 830) ser adaptada para ajustar o primeiro sinal de áudio com base na informação de controle.
15. Um sistema, compreendendo, um codificador (310), de acordo com qualquer uma das reivindicações 8 a 13, e pelo menos, um decodificador (320) de acordo com qualquer uma das reivindicações de 1 a 7, caracterizado pelo codificador (310) ser configurado para transformar um sinal de entrada de áudio para obter um sinal de áudio transformado, em que o codificador (310) é configurado para codificar o sinal de áudio transformado para obter um sinal de áudio codificado, em que o codificador (310) é configurado para codificar a informação de controle indicando uma coerência de fase vertical do sinal de áudio transformado, em que o codificador (310) é disposto para inserir o sinal de áudio codificado e a informação de controle em, pelo menos, um decodificador, em que, pelo menos, um decodificador (320) é configurado para decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado, e
I • ' t 8/9 em que, pelo menos, um decodificador (320) é configurado para ajustar o sinal de áudio decodificado com base na informação de controle codificada para obter urn sinal de áudio ajustado por fase.
16. Um método para decodificar um sinal de áudio codificado para obter um sinal de áudio ajustado por fase, compreendendo: receber a informação de controle, caracterizado pela informação de controle indicar uma coerência de fase vertical do sinal de áudio codificado, decodificar o sinal de áudio codificado para obter um sinal de áudio decodificado, e ajustar o sinal de áudio decodificado para obter o sinal de áudio ajustado por fase com base na informação de controle.
17. Um método para codificar a informação de controle com base em um sinal de entrada de áudio, compreendendo: transformar o sinal de entrada de áudio de um domínio de tempo em um domínio espectral para obter u~ sinal de áudio transformado compreendendo uma pluralidade de sinais de subfaixa sendo atribuída a uma pluralidade de subfaixas, gerar a informação de controle de modo que a informação de controle indique uma coerência de fase vertical do sinal de áudio transformado, e codificar o sinal de áudio transformado e a informação de controle.
18. Um método para processar um primeiro
. ... 9/9 sinal de áudio para obter um segundo sinal de áudio, compreendendo: gerar a informação de controle de modo que a informação de controle indique uma coerência de fase vertical do primeiro sinal de áudio, e ajustar o primeiro sinal de áudio com base na informação de controle para obter o segundo sinal de áudio.
19. Um programa de computador para implementar um método, de acordo com qualquer uma das reivindicações de 16 a 18, ao ser executado por um computador ou processador de sinal.
BR112014021054-3A 2012-02-27 2013-02-26 Controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais BR112014021054B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261603773P 2012-02-27 2012-02-27
EP12178265.0A EP2631906A1 (en) 2012-02-27 2012-07-27 Phase coherence control for harmonic signals in perceptual audio codecs
EP12178265.0 2012-07-27
PCT/EP2013/053831 WO2013127801A1 (en) 2012-02-27 2013-02-26 Phase coherence control for harmonic signals in perceptual audio codecs

Publications (2)

Publication Number Publication Date
BR112014021054A2 true BR112014021054A2 (pt) 2021-05-25
BR112014021054B1 BR112014021054B1 (pt) 2022-04-26

Family

ID=47076051

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112014021054-3A BR112014021054B1 (pt) 2012-02-27 2013-02-26 Controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais

Country Status (14)

Country Link
US (1) US10818304B2 (pt)
EP (2) EP2631906A1 (pt)
JP (1) JP5873936B2 (pt)
KR (1) KR101680953B1 (pt)
CN (1) CN104170009B (pt)
AU (1) AU2013225076B2 (pt)
BR (1) BR112014021054B1 (pt)
CA (1) CA2865651C (pt)
ES (1) ES2673319T3 (pt)
IN (1) IN2014KN01766A (pt)
MX (1) MX338526B (pt)
RU (1) RU2612584C2 (pt)
TR (1) TR201808452T4 (pt)
WO (1) WO2013127801A1 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101016224B1 (ko) 2006-12-12 2011-02-25 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법
CN105765655A (zh) * 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
JP6668372B2 (ja) * 2015-02-26 2020-03-18 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3039678B1 (en) * 2015-11-19 2018-01-10 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for voiced speech detection
CN106653004B (zh) * 2016-12-26 2019-07-26 苏州大学 感知语谱规整耳蜗滤波系数的说话人识别特征提取方法
KR102474146B1 (ko) 2018-04-25 2022-12-06 돌비 인터네셔널 에이비 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
BR112020021832A2 (pt) 2018-04-25 2021-02-23 Dolby International Ab integração de técnicas de reconstrução de alta frequência
CN110728970B (zh) * 2019-09-29 2022-02-25 东莞市中光通信科技有限公司 一种数字辅助隔音处理的方法及装置
EP4276824A1 (en) 2022-05-13 2023-11-15 Alta Voce Method for modifying an audio signal without phasiness

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
RU2009585C1 (ru) * 1991-06-19 1994-03-15 Евгений Николаевич Пестов Способ ударного возбуждения фазовой когерентности одновременно по крайней мере в двух квантовых системах
FR2692091B1 (fr) * 1992-06-03 1995-04-14 France Telecom Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle.
US6766300B1 (en) * 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
JPH11251918A (ja) * 1998-03-03 1999-09-17 Takayoshi Hirata 音声信号波形符号化伝送方式
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
KR100348790B1 (ko) * 1999-12-21 2002-08-17 엘지전자주식회사 큐에이엠 수신기
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
CN1231889C (zh) * 2002-11-19 2005-12-14 华为技术有限公司 多通道声码器的语音处理方法
SE0303498D0 (sv) * 2003-12-19 2003-12-19 Ericsson Telefon Ab L M Spectral loss conccalment in transform codecs
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
JP4513556B2 (ja) * 2003-12-25 2010-07-28 カシオ計算機株式会社 音声分析合成装置、及びプログラム
JP2008504566A (ja) * 2004-06-28 2008-02-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響送信装置、音響受信装置、周波数範囲適応装置、音響信号送信方法
JP4734961B2 (ja) * 2005-02-28 2011-07-27 カシオ計算機株式会社 音響効果付与装置、及びプログラム
US7856355B2 (en) * 2005-07-05 2010-12-21 Alcatel-Lucent Usa Inc. Speech quality assessment method and system
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
JP5336522B2 (ja) * 2008-03-10 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
EP2237266A1 (en) * 2009-04-03 2010-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
WO2011039668A1 (en) * 2009-09-29 2011-04-07 Koninklijke Philips Electronics N.V. Apparatus for mixing a digital audio
EP2704143B1 (en) * 2009-10-21 2015-01-07 Panasonic Intellectual Property Corporation of America Apparatus, method and computer program for audio signal processing
CA2792449C (en) * 2010-03-09 2017-12-05 Dolby International Ab Device and method for improved magnitude response and temporal alignment in a phase vocoder based bandwidth extension method for audio signals
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences

Also Published As

Publication number Publication date
AU2013225076A1 (en) 2014-09-04
EP2820647B1 (en) 2018-03-21
EP2820647A1 (en) 2015-01-07
US10818304B2 (en) 2020-10-27
RU2014138820A (ru) 2016-04-20
RU2612584C2 (ru) 2017-03-09
CN104170009A (zh) 2014-11-26
CN104170009B (zh) 2017-02-22
MX338526B (es) 2016-04-20
ES2673319T3 (es) 2018-06-21
JP5873936B2 (ja) 2016-03-01
US20140372131A1 (en) 2014-12-18
CA2865651A1 (en) 2013-09-06
TR201808452T4 (tr) 2018-07-23
KR20140130225A (ko) 2014-11-07
KR101680953B1 (ko) 2016-12-12
CA2865651C (en) 2017-05-02
MX2014010098A (es) 2014-09-16
WO2013127801A1 (en) 2013-09-06
BR112014021054B1 (pt) 2022-04-26
EP2631906A1 (en) 2013-08-28
JP2015508911A (ja) 2015-03-23
AU2013225076B2 (en) 2016-04-21
IN2014KN01766A (pt) 2015-10-23

Similar Documents

Publication Publication Date Title
BR112014021054A2 (pt) controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais
US9812136B2 (en) Audio processing system
KR102025164B1 (ko) 수직 위상 보정을 사용하여 오디오 신호를 처리하기 위한 오디오 프로세서 및 방법
TWI415115B (zh) 用以產生帶寬擴展輸出資料之裝置與方法
JP5400059B2 (ja) オーディオ信号処理方法及び装置
JP5426680B2 (ja) 信号処理方法及び装置
JP5752134B2 (ja) 最適化された低スループットパラメトリック符号化/復号化
JP6368029B2 (ja) 雑音信号処理方法、雑音信号生成方法、符号化器、復号化器、並びに符号化および復号化システム
KR20140004086A (ko) 반대 위상의 채널들에 대한 개선된 스테레오 파라메트릭 인코딩/디코딩
Griffin et al. Single-channel and multi-channel sinusoidal audio coding using compressed sensing
BRPI1007050B1 (pt) Sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequênciaalta

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B15I Others concerning applications: loss of priority

Free format text: PERDA DA PRIORIDADE US 61/603,773 REIVINDICADA NO PCT/EP2013/053831, CONFORME AS DISPOSICOES PREVISTAS NA LEI 9.279 DE 14/05/1996 (LPI) ART. 16 7O E ART 2O DA RESOLUCAO INPI 179 DE 21/02/2017. ESTA PERDA SE DEU PELO FATO DE O DEPOSITANTE CONSTANTE DA PETICAO DE REQUERIMENTO DO PEDIDO PCT SER DISTINTO DAQUELES QUE DEPOSITARAM A PRIORIDADE REIVINDICADA E NAO APRESENTOU DOCUMENTO COMPROBATORIO DE CESSAO DENTRO DO PRAZO DE 60 DIAS A CONTAR DA DATA DA ENTRADA DA FASE NACIONAL, CONFORME AS DISPOSICOES PREVISTAS NA LEI 9.279 DE 14/05/1996 (LPI) ART. 16 6O, E NO ART. 28 DA RESOLUCAO INPI-PR 77/2013.

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 26/02/2013, OBSERVADAS AS CONDICOES LEGAIS.