BR122021014312B1 - Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch - Google Patents

Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch Download PDF

Info

Publication number
BR122021014312B1
BR122021014312B1 BR122021014312-9A BR122021014312A BR122021014312B1 BR 122021014312 B1 BR122021014312 B1 BR 122021014312B1 BR 122021014312 A BR122021014312 A BR 122021014312A BR 122021014312 B1 BR122021014312 B1 BR 122021014312B1
Authority
BR
Brazil
Prior art keywords
patch
edge
frequency
signal
band
Prior art date
Application number
BR122021014312-9A
Other languages
English (en)
Inventor
Lars Villemoes
Per Ekstrand
Sascha Disch
Frederik Nagel
Stephan Wilde
Original Assignee
Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V., Dolby International Ab filed Critical Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Publication of BR122021014312B1 publication Critical patent/BR122021014312B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Networks Using Active Elements (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

Aparelho para processar um sinal de áudio para gerar um sinal de largura de banda estendida possuindo uma parte de alta freqüência e uma parte de baixa freqüência utilizando dados paramétricos para a parte de alta freqüência, os dados paramétricos relacionados às bandas de freqüência da parte de alta freqüência compreende uma calculadora de borda de patch (2302) para calcular uma borda de patch de maneira que a borda de patch coincida com uma borda de faixa de freqüência das faixas de freqüência. O aparelho adicionalmente compreende um patcher (2312) para gerar um sinal com patch utilizando o sinal de áudio (2300) e a borda de patch.

Description

CAMPO DA INVENÇÃO
[0001] A presente invenção está relacionada a sistemas de codificação de fonte de áudio que fazem uso de um método de transposição harmônica para reconstrução de alta freqüência (HFR - High Frequency Reconstruction) e a processadores de efeito digital, por exemplo, chamados de excitadores, onde a geração de distorção harmônica adiciona brilho ao sinal processado e a esticadores de tempo, onde a duração de um sinal é estendida enquanto mantendo o conteúdo espectral do original.
HISTÓRICO DA INVENÇÃO
[0002] No documento PCT WO 98/57436, o conceito de transposição foi estabelecido como um método para recriar uma faixa de alta freqüência a partir de uma faixa de freqüência mais baixa de um sinal de áudio. Uma economia substancial na taxa de bits pode ser obtida ao utilizar este conceito na codificação de áudio. Em um sistema de codificação com base em HFR, um sinal de largura de banda baixa é processado por um codificador de forma de onda de núcleo e as freqüências mais altas são regeneradas utilizando transposição e informações secundárias adicionais de taxa de bits muito baixa descrevendo a forma espectral alvo no lado do decodificador. Para taxas de bits baixas, onde a largura de banda do sinal codificado de núcleo é baixa, se torna cada vez mais importante recriar uma faixa alta com características perceptivamente agradáveis. A transposição harmônica definida no documento PCT WO 98/57436 funciona muito bem para material musical complexo em uma situação com baixa freqüência de cruzamento. O princípio de uma transposição harmônica é que uma senoide com freqüência é mapeada a uma senoide com freqüência Tm, onde T >1 é um número inteiro definindo a ordem de transposição. Em contraste a isto, uma modulação de faixa lateral única (SSB) com base no método HFR mapeia uma senoide com freqüência ® a uma senoide com freqüência ® +Δ ®, onde Δ ® é um desvio de freqüência fixo. Dado um sinal de núcleo com baixa largura de banda, um artefato de zumbido dissonante pode ocorrer a partir da transposição de SSB.
[0003] Para atingir a melhor qualidade de áudio possível, métodos HFR harmônicos de alta qualidade técnica anterior empregam bancos de filtros modulados complexos, por exemplo, uma transformada de Fourier para tempo curto (STFT - Short Time Fourier Transform) , com alta resolução de freqüência e alto grau de sobreamostragem para atingir a qualidade de áudio exigida. A resolução fina é necessária para evitar que distorções de intermodulação indesejadas surjam a partir do processamento não linear de somas de senoides. Com resolução de freqüência suficientemente alta, isto é, sub-bandas estreitas, os métodos de alta qualidade visam ter um máximo de uma senoide em cada subbanda. Um alto grau de sobreamostragem no tempo é necessário para evitar distorção de aliasing, e um certo grau de sobreamostragem na freqüência é necessário para evitar pré-ecos para sinais transientes. A desvantagem óbvia é que a complexidade computacional pode se tornar alta.
[0004] A transposição harmônica com base em bloco de sub-banda é outro método de HFR utilizado para suprimir produtos de intermodulação, caso em que um banco de filtro com uma resolução de freqüência mais grosseira e um grau mais baixo de sobreamostragem é empregado, por exemplo, um banco QMF multicanal. Neste método, um bloco temporal de amostras de sub-banda complexas é processado por um modificador de fase comum, enquanto a sobreposição de diversas amostras modificadas forma uma amostra de sub-banda de saída. Isto possui o efeito líquido de suprimir produtos de intermodulação que iriam, de outra forma, ocorrer quando o sinal de sub-banda de entrada consistir em diversas senoides. A transposição com base em processamento de sub-banda com base em bloco possui muito menos complexidade computacional do que transpositores e atinge quase a mesma qualidade para muitos sinais. Entretanto, a complexidade ainda é muito mais alta do que para os métodos de HFR com base em SSB triviais, uma vez que uma pluralidade de bancos de filtros de análises, cada um processando sinais de diferentes ordens de transposição T, é exigida em uma aplicação HFR típica para sintetizar a largura de banda exigida. Adicionalmente, uma abordagem comum é adaptar a taxa de amostragem dos sinais de entrada para caber em bancos de filtro de análise de tamanho constante, embora os bancos de filtro processem sinais de diferentes ordens de transposição. Também é comum aplicar filtros passa-faixa aos sinais de entrada para se obter sinais de saída, processados a partir de diferentes ordens de transposição, com densidades espectrais não sobrepostas.
[0005] O armazenamento ou a transmissão de sinais de áudio estão geralmente sujeitos a limitações de taxa de bits rigorosas. No passado, codificadores eram forçados a reduzir drasticamente a largura de banda de áudio transmitida quando somente uma taxa de bits muito baixa estava disponível. Codecs de áudio modernos são, hoje em dia, capazes de codificar sinais de banda larga utilizando métodos de extensão de largura de banda (BWE - “Bandwidth Extension”) [1 a 12] . Estes algoritmos dependem de uma representação paramétrica do conteúdo de alta freqüência (HF) que é gerada a partir da parte de baixa freqüência (LF) do sinal decodificado por meio de transposição na região espectral de HF (uso de “patch”) e aplicação de um pós-processamento por parâmetro. A parte de LF é codificada com qualquer codificador de áudio ou fala. Por exemplo, os métodos de extensão de largura de banda descritos em [1 a 4] dependem de modulação de banda lateral única (SSB), geralmente denominado método “copy-up”, para gerar os múltiplos patches de HF.
[0006] Ultimamente, um novo algoritmo, o qual emprega um banco de vocoders de fase [15 a 17] para a geração dos diferentes patches, tem sido apresentado [13] (ver Figura 20) . Este método foi desenvolvido para evitar a irregularidade auditiva que é freqüentemente observada em sinais sujeitos à extensão de largura de banda SSB. Embora seja benéfico para diversos sinais tonais, este método chamado “extensão de largura de banda harmônica” (HBE) está sujeito a degradações de qualidade de transientes contidos no sinal de áudio [14], uma vez que não é garantida a preservação da coerência vertical ao longo das sub-bandas no algoritmo de vocoder de fase padrão e, além disso, o recálculo das fases deve ser realizado em blocos de tempo de uma transformada ou, alternativamente, de um banco de filtro. Portanto, surge uma necessidade de tratamento especial para partes de sinais contendo transientes.
[0007] Entretanto, uma vez que o algoritmo BWE é realizado no lado decodificador de uma cadeia de codec, a complexidade computacional é um problema sério. Métodos da técnica anterior, especialmente a HBE com base em vocoder, vêm com o preço de uma complexidade computacional amplamente aumentada, comparados com métodos com base em SSB.
[0008] Conforme delineado acima, esquemas de extensão de largura de banda existentes aplicam somente um método de uso de patch em um dado bloco de sinal por vez, seja uso de patch com base em SSB [1 a 4] ou uso de patch com base em vocoder HBE [15 a 17] . Adicionalmente, codificadores de áudio modernos [19 a 20] oferecem a possibilidade de trocar o método de uso de patch globalmente em uma base de bloco de tempo entre esquemas de uso de patch alternativos.
[0009] O uso de patch copy-up SSB introduz imperfeições indesejadas no sinal de áudio, mas é computacionalmente simples e preserva o envelope de tempo de transientes. Em codecs de áudio que empregam uso de patch HBE, a qualidade de reprodução de transientes está freqüentemente abaixo da ideal. Além disso, a complexidade computacional é aumentada significativamente sobre o método computacional copy-up SSB muito simples.
[0010] Quando se trata de redução de complexidade, taxas de amostragem são de particular importância. Isto se dá devido ao fato de que uma alta taxa de amostragem significa uma alta complexidade e uma baixa taxa de amostragem geralmente significa baixa complexidade devido ao número reduzido de operações exigidas. Por outro lado, entretanto, a situação em aplicações de extensão de largura de banda se dá particularmente de maneira que a taxa de amostragem do sinal de saída do codificador de núcleo será tipicamente tão baixa que esta taxa de amostragem é muito baixa para um sinal de largura de banda completa. Em outras palavras, quando a taxa de amostragem do sinal de saída do decodificador é, por exemplo, 2 ou 2,5 vezes a freqüência máxima do sinal de saída do codificador de núcleo, então uma extensão de largura de banda de, por exemplo, um fator de 2, significa que uma operação de aumento de amostragem é exigida de maneira que a taxa de amostragem do sinal de largura de banda estendido é tão alta que a amostragem pode “cobrir” as componentes de alta freqüência adicionalmente geradas.
[0011] Adicionalmente, bancos de filtro, tais como bancos de filtro de análise e bancos de filtro de síntese são responsáveis por uma quantidade considerável de operações de processamento. Assim, o tamanho dos bancos de filtro, isto é, o fato de que o banco de filtro é um banco de filtro de 32 canais, um banco de filtro de 6 4 canais, ou mesmo um banco de filtro com um número de canais mais alto influenciará significativamente a complexidade do algoritmo de processamento de áudio. Em geral, pode-se dizer que um número alto de canais de banco de filtro requer mais operações de processamento e, portanto, maior complexidade que um número pequeno de canais de banco de filtro. Face a isto, em aplicações de extensão de largura de banda e também em outras aplicações de processamento de áudio, onde diferentes taxas de amostragem são um problema, tal como em aplicações do tipo vocoder ou quaisquer outras aplicações de efeito de áudio, há uma interdependência específica entre complexidade e taxa de amostragem ou largura de banda de áudio, o que significa que operações para aumento de amostragem ou filtragem de sub-banda podem aumentar drasticamente a complexidade sem influenciar especificamente a qualidade de áudio em um bom sentido quando as ferramentas ou algoritmos errados são escolhidos para as operações específicas.
[0012] No contexto de extensão de largura de banda, conjuntos de dados paramétricos são utilizados para realizar um ajuste de envelope espectral e para realizar outras manipulações a um sinal gerado por uma operação de uso de patch, isto é, por uma operação que obtém alguns da faixa fonte, isto é, da porção de banda baixa do sinal de largura de banda estendida que está disponível na entrada do processador de extensão de largura de banda e então mapeia estes dados a uma faixa de alta frequência. O ajuste de envelope espectral pode ocorrer antes de realmente mapear o sinal de baixa banda à faixa de alta frequência ou subseqüentemente a ter mapeado a faixa fonte à faixa de alta freqüência.
[0013] Tipicamente, os conjuntos de dados paramétricos são providos de uma certa resolução de freqüência, isto é, dados paramétricos se referem a bandas de freqüência da parte de alta freqüência. Por outro lado, o uso de patch da banda baixa à banda alta, isto é, quais faixas fonte são utilizadas para obter quais alvos ou faixas de freqüência, é uma operação independente da resolução, na qual os conjuntos de dados paramétricos são dados em relação à freqüência. O fato de que os dados paramétricos transmitidos são, em um sentido, independentes do que é realmente utilizado como o algoritmo de uso de patch é uma característica importante, uma vez que isto permite grande flexibilidade no lado do decodificador, isto é, quando se trata da implementação do processador de extensão de largura de banda. Aqui, diferentes algoritmos de uso de patch podem ser utilizados, porém, somente o mesmo ajuste de envelope espectral pode ser utilizado. Em outras palavras, o processador de reconstrução de alta freqüência ou processador de ajuste de envelope espectral em uma aplicação de extensão de largura de banda não precisa possuir informações sobre o algoritmo de uso de patch aplicado para realizar o ajuste de envelope espectral.
[0014] Uma desvantagem deste procedimento, entretanto, é que um mau alinhamento entre as faixas de freqüência, para as quais os conjuntos de dados paramétricos são providos em um lado e as bordas espectrais de um patch no outro lado, pode ocorrer. Particularmente em situações onde a energia espectral se altera fortemente na vizinhança de uma borda de patch, artefatos podem surgir especificamente nesta região, o que degrada a qualidade do sinal de largura de banda estendida.
SUMÁRIO DA INVENÇÃO
[0015] É um objeto da presente invenção prover um conceito de processamento de áudio melhorado que permite boa qualidade de áudio.
[0016] Este objeto é atingido por um aparelho para processar um sinal de áudio de acordo com a reivindicação 1, um método de processar um sinal de áudio de acordo com a reivindicação 15, ou um programa de computador de acordo com a reivindicação 16 .
[0017] Realizações da presente invenção estão relacionadas a um aparelho para processar um sinal de áudio para gerar um sinal de largura de banda estendida possuindo uma porção de alta freqüência e uma porção de baixa freqüência, onde dados paramétricos para a porção de alta freqüência são utilizados, e onde os dados paramétricos estão relacionados a faixas de freqüência da parte de alta freqüência. O aparelho compreende uma calculadora de borda de patch para calcular uma borda de patch de maneira que a borda de patch coincida com uma borda de faixa de freqüência das faixas de freqüência. O aparelho adicionalmente compreende um patcher para gerar um sinal com patch utilizando o sinal de áudio e a borda de patch calculada. Em uma realização, a calculadora de borda de patch é configurada para calcular a borda de patch como uma borda de freqüência em uma faixa de freqüência de síntese correspondente à parte de alta freqüência. Neste contexto, patcher é configurado para selecionar uma porção de freqüência da parte de baixa banda utilizando um fator de transposição e a borda de patch. Em uma realização adicional, a calculadora de borda de patch é configurada para calcular a borda de patch utilizando uma borda de patch alvo não coincidente com uma borda de faixa de freqüência da faixa de freqüência. Então, a calculadora de borda de patch é configurada para definir a borda de patch diferente da borda de patch alvo para se obter o alinhamento. Particularmente no contexto de uma pluralidade de patches utilizando diferentes fatores de transposição, a calculadora de borda de patch é configurada para calcular bordas de patch, por exemplo, para três fatores de transposição diferentes, de maneira que cada borda de patch coincida com uma borda de faixa de freqüência das faixas de freqüência da parte de alta freqüência. O patcher é, então, configurado para gerar o sinal de patch utilizando os três fatores de transposição diferentes, de maneira que a borda entre dois patches adjacentes coincida com uma borda entre duas faixas de freqüência adjacentes à qual os dados paramétricos estão relacionados.
[0018] A presente invenção é particularmente útil em que os artefatos que surgem de bordas de patch mal alinhadas por um lado, e faixas de freqüência para dados paramétricos por outro lado, são evitados. Em vez disso, devido ao alinhamento perfeito, até mesmo sinais que fortemente se alteram ou sinais que possuam porções que fortemente se alteram na região da borda do patch são sujeitos a extensão de largura de banda com boa qualidade.
[0019] Além disso, a presente invenção é vantajosa em que ela, não obstante, permite alta flexibilidade devido ao fato de que o codificador não precisa lidar com um algoritmo de uso de patch a ser aplicado no lado do decodificador. A independência entre o uso de patch, por um lado, e o ajuste de envelope espectral, isto é, uso de dados paramétricos gerados por um codificador de extensão de largura de banda, por outro lado, são mantidos e permitem a aplicação de diferentes algoritmos de uso de patch ou até mesmo uma combinação de diferentes algoritmos de uso de patch. Isto é possível, uma vez que o alinhamento de borda de patch garante que, no final, os dados de patch por um lado e os conjuntos de dados paramétricos por outro lado se correspondam entre si em relação às faixas de freqüência, as quais são também chamadas faixas de fator de escala.
[0020] Dependendo das bordas de patch calculadas, as quais podem, por exemplo, se relacionar à faixa alvo, isto é, a parte de alta freqüência do sinal de largura de banda estendida finalmente obtido, as faixas fonte correspondentes para determinar os dados de fonte do patch a partir da porção de baixa banda do sinal de áudio são determinadas. Ocorre que somente uma certa (pequena) largura de banda da porção de baixa banda do sinal de áudio é exigida, devido ao fato de que, em algumas realizações, fatores de transposição harmônica são aplicados. Portanto, para extrair de maneira eficiente esta porção do sinal de áudio de baixa banda, uma estrutura de banco de filtro de análise específica dependente de bancos de filtro individuais em cascata é utilizada.
[0021] Tais realizações dependem de um posicionamento em cascata específico de bancos de filtro de análise e/ou de síntese para se obter uma reamostragem de baixa complexidade sem sacrificar a qualidade de áudio. Em uma realização, um aparelho para processar um sinal de áudio de entrada compreende um banco de filtro de síntese para sintetizar um sinal de áudio intermediário a partir do sinal de áudio de entrada, onde o sinal de áudio de entrada é representado por uma pluralidade de primeiros sinais de sub-banda gerados por um banco de filtro de análise posicionado em uma direção de processamento antes do banco de filtro de síntese, em que um número de canais de banco de filtro do banco de filtro de síntese é menor que um número de canais do banco de filtro de análise. O sinal intermediário é, além disso, processado por um banco de filtro de análise adicional para gerar uma pluralidade de segundos sinais de sub-banda a partir do sinal de áudio intermediário, em que o banco de filtro de análise adicional possui um número de canais que é diferente do número de canais do banco de filtro de síntese, de maneira que uma taxa de amostragem de um sinal de sub-banda da pluralidade de sinais de sub-banda é diferente de uma taxa de amostragem de um primeiro sinal de subbanda da pluralidade de primeiros sinais de sub-banda gerados pelo banco de filtro de análise.
[0022] A cascata de um banco de filtro de síntese e um banco de filtro de análise adicional conectado subseqüentemente provê uma conversão de taxa de amostragem e adicionalmente uma modulação da porção de largura de banda do sinal de entrada de áudio original que foi enviado para o banco de filtro de síntese a uma banda de base. Este sinal intermediário temporal. que foi agora extraído do sinal de áudio de entrada original que pode, por exemplo, ser o sinal de saída de um decodificador de núcleo de um esquema de extensão de largura de banda, é agora representado preferivelmente como um sinal criticamente amostrado modulado à banda de base, e foi descoberto que esta representação, isto é, o sinal de saída reamostrado, quando processado por um banco de filtro de análise adicional para obter uma representação de subbanda permite um processamento de baixa complexidade de operações de processamento adicionais que podem ou não ocorrer e que podem, por exemplo, ser operações de processamento relacionadas à extensão de largura de banda, tal como operações de sub-banda não lineares seguidas de processamento de reconstrução de alta freqüência e de uma mesclagem das sub-bandas no banco de filtro de síntese final.
[0023] O presente pedido de patente provê diferentes aspectos de aparelhos, métodos ou programas de computador para processar sinais de áudio no contexto de extensão de largura de banda e no contexto de outras aplicações de áudio, as quais não são relacionadas à extensão de largura de banda. As características dos aspectos individuais subseqüentemente descritos e reivindicados podem ser parcialmente ou completamente combinadas, porém podem também ser utilizados separadamente um do outro, uma vez que os aspectos individuais já provêm vantagens em relação a qualidade de percepção, complexidade computacional e recursos de processador/memória quando implementados em um sistema computador ou microprocessador.
[0024] Realizações provêm um método para reduzir a complexidade computacional de um método HFR com base em bloco de sub-banda por meio de uma filtragem e conversão de taxa de amostragem eficientes, dos sinais de entrada aos estágios de análise de banco de filtro HFR. Além disso, os filtros passa-faixa aplicados aos sinais de entrada podem demonstrar serem obsoletos em um transpositor com base em bloco de sub-banda.
[0025] As presentes realizações auxiliam a reduzir a complexidade computacional da transposição harmônica com base em bloco de sub-banda ao implementar de maneira eficiente diversas ordens de transposição com base em bloco de sub-banda no âmbito de um único par de bancos de filtro de análise e síntese. Dependendo da relação de compromisso da qualidade perceptual versus complexidade computacional, somente um subconjunto adequado de ordens ou todas as ordens de transposição podem ser realizadas em conjunto dentro de um par de bancos de filtro. Além disso, um esquema de transposição combinado, onde somente certas ordens de transposição são calculadas diretamente enquanto que a largura de banda restante é preenchida pela replicação de ordens de transposição disponíveis, isto é, previamente calculadas (por exemplo, segunda ordem), e/ou pela largura de banda codificada de núcleo. Neste caso, o uso de patch pode ser realizado utilizando cada combinação possível de faixas fonte disponíveis para replicação.
[0026] Adicionalmente, realizações provêm um método para aprimorar tanto métodos de HFR harmônicos de alta qualidade quanto métodos de HFR harmônicos com base em bloco de sub-banda por meio do alinhamento espectral das ferramentas HFR. Em particular, um maior desempenho é atingido ao alinhar as bordas espectrais dos sinais gerados por HFR às bordas espectrais da tabela de freqüência de ajuste de envelope. Além disso, as bordas espectrais da ferramenta limitadora são, pelo mesmo princípio, alinhadas às bordas espectrais dos sinais gerados por HFR.
[0027] Realizações adicionais são configuradas para melhorar a qualidade de percepção de transientes e ao mesmo tempo reduzir a complexidade computacional, por exemplo, através da aplicação de um esquema de uso de patch que aplique um uso de patch misto consistindo em uso de patch harmônico e uso de patch copy-up.
[0028] Em realizações específicas, os bancos de filtro individuais da estrutura de banco de filtro em cascata são bancos de filtro espelho em quadratura (QMF - “Quadrature Mirror Filter”), os quais dependem de um filtro protótipo passa-baixa ou modulado em janela utilizando um conjunto de frequências de modulação definindo as frequências centrais dos canais de banco de filtro. Preferivelmente, todas as funções em janela ou todos os filtros protótipos dependem um do outro, de maneira que os filtros dos bancos de filtro com tamanhos diferentes (canais de banco de filtro) dependem um do outro também. Preferivelmente, o maior banco de filtro em uma estrutura em cascata de bancos de filtro compreendendo, em realizações, um primeiro banco de filtro de análise, um banco de filtro subsequentemente conectado, um banco de filtro de análise adicional, e, em algum estágio posterior de processamento, um banco de filtro de síntese final, possui uma função em janela ou resposta de filtro protótipo possuindo um certo número de coeficientes de função em janela ou de filtro protótipo. Os bancos de filtro de tamanho menor são todos versões sub-amostradas desta função em janela, o que significa que as funções em janela para os outros bancos de filtro são versões sub- amostradas da função em janela “maior”. Por exemplo, se um banco de filtro possui metade do tamanho do banco de filtro maior, então, a função em janela possui metade do número de coeficientes, e os coeficientes de bancos de filtro de menor tamanho são derivados por sub-amostragem. Nesta situação, a sub-amostragem significa que, por exemplo, cada segundo coeficiente de filtro é tomado para o banco de filtro menor possuindo metade do tamanho. Entretanto, quando há outras relações entre os tamanhos de banco de filtro que não possuem valor inteiro, então, um certo tipo de interpolação dos coeficientes de janela é realizado, de maneira que, no final da janela do banco de filtro menor está, novamente, uma versão sub-amostrada da janela do banco de filtro maior.
[0029] Realizações da presente invenção são particularmente úteis em situações onde somente uma porção do sinal de áudio de entrada é exigida para processamento adicional, e esta situação particularmente ocorre no contexto de extensão de largura de banda harmônica. Neste contexto, operações de processamento semelhantes a vocoder são particularmente preferidas.
[0030] É uma vantagem de realizações que as realizações provêm uma complexidade menor para um transpositor QMF pelas operações em domínio do tempo e freqüência eficientes e uma qualidade de áudio melhorada para replicação de banda espectral harmônica com base em QMF e DFT utilizando alinhamento espectral.
[0031] Realizações estão relacionadas a sistemas de codificação de fonte de áudio empregando, por exemplo, um método de transposição harmônica com base em bloco de sub-banda para reconstrução de alta freqüência (HFR), e a processadores de efeito digital, por exemplo, os chamados excitadores, onde a geração de distorção harmônica adiciona brilho ao sinal processado, e a esticadores de tempo, onde a duração de um sinal é estendida enquanto se mantém o conteúdo espectral do original. Realizações provêm um método para reduzir a complexidade computacional de um método HFR com base em bloco de sub-banda por meio de uma filtragem e conversão de taxa de amostragem eficientes, dos sinais de entrada antes dos estágios de análise de banco de filtro HFR. Além disso, realizações demonstram que os filtros passa-faixa convencionais aplicados aos sinais de entrada são obsoletos em um sistema de HFR com base em bloco de sub-banda. Adicionalmente, realizações provêm um método para aprimorar tanto métodos HFR harmônicos de alta qualidade quanto métodos de HFR harmônicos com base em bloco de sub-banda por meio do alinhamento espectral das ferramentas de HFR. Em particular, realizações ensinam como um maior desempenho é atingido ao alinhar as bordas espectrais dos sinais gerados por HFR às bordas espectrais da tabela de freqüência de ajuste de envelope. Além disso, as bordas espectrais da ferramenta limitadora são, pelo mesmo princípio, alinhadas às bordas espectrais dos sinais gerados por HFR.
BREVE DESCRIÇÃO DOS DESENHOS
[0032] A presente invenção será agora descrita por meio de exemplos ilustrativos, não limitando o escopo da invenção, com referência aos desenhos apensos, em que:
[0033] A Figura 1 ilustra a operação de um transpositor com base em bloco utilizando ordens de transposição de 2, 3 e 4 em uma estrutura de decodificador aprimorada por HFR;
[0034] A Figura 2 ilustra a operação das unidades de esticamento de sub-banda não lineares na Figura 1;
[0035] A Figura 3 ilustra uma implementação eficiente do transpositor com base em bloco da Figura 1, onde os reamostradores e filtros passa-faixa que precedem os bancos de filtro de análise de HFR são implementados utilizando reamostradores no domínio do tempo de taxa múltipla e filtros passa-faixa com base em QMF;
[0036] A Figura 4 ilustra um exemplo de blocos de construção para uma implementação eficiente de um reamostrador no domínio do tempo de taxa múltipla da Figura 3;
[0037] A Figura 5 ilustra o efeito em um sinal de exemplo processado por diferentes blocos da Figura 4 para uma ordem de transposição de 2;
[0038] A Figura 6 ilustra uma implementação eficiente do transpositor com base em bloco da Figura 1, onde os reamostradores e os filtros passa-faixa que precedem os bancos de filtro de análise de HFR são substituídos por pequenos bancos de filtro de síntese sub-amostrados operando em sub-bandas selecionadas a partir de um banco de filtro de análise de 32 bandas;
[0039] A Figura 7 ilustra o efeito em um sinal de exemplo processado por um banco de filtro de síntese sub-amostrado da Figura 6 para uma ordem de transposição de 2;
[0040] A Figura 8 ilustra os blocos de implementação de um redutor de amostragem no domínio do tempo de taxa múltipla de um fator de 2;
[0041] A Figura 9 ilustra os blocos de implementação de um redutor de amostragem no domínio do tempo de taxa múltipla de um fator de 3/2;
[0042] A Figura 10 ilustra o alinhamento das bordas espectrais dos sinais de transpositor de HFR às bordas das faixas de freqüência de ajuste de envelope em um codificador aprimorado de HFR;
[0043] A Figura 11 ilustra uma situação onde artefatos emergem devido às bordas espectrais desalinhadas dos sinais de transpositor de HFR;
[0044] A Figura 12 ilustra uma situação onde os artefatos da Figura 11 são evitados como resultado de bordas espectrais alinhadas dos sinais de transpositor de HFR;
[0045] A Figura 13 ilustra a adaptação de bordas espectrais na ferramenta limitadora dos sinais de transpositor de HFR;
[0046] A Figura 14 ilustra o princípio de transposição harmônica com base em bloco de sub-banda;
[0047] A Figura 15 ilustra uma situação de exemplo para a aplicação de transposição com base em bloco de sub-banda utilizando diversas ordens de transposição em um codec de áudio aprimorado por HFR;
[0048] A Figura 16 ilustra uma situação exemplar da técnica anterior para a operação de uma transposição com base em bloco de sub-banda de ordem múltipla aplicando um banco de filtro de análise separado por ordem de transposição;
[0049] A Figura 17 ilustra uma situação exemplar inventiva para a operação eficiente de uma transposição com base em bloco de sub-banda de ordem múltipla aplicando um banco de filtro de análise QMF de 64 bandas;
[0050] A Figura 18 ilustra outro exemplo para formar um processamento direcionado ao sinal de sub-banda;
[0051] A Figura 19 ilustra um uso de patch de modulação de banda lateral única (SSB);
[0052] A Figura 20 ilustra um uso de patch de extensão de largura de banda harmônica (HBE);
[0053] A Figura 21 ilustra um uso de patch misto, onde o primeiro uso de patch é gerado por espalhamento de freqüência e o segundo patch é gerado por um copy-up de SSB de uma porção de baixa freqüência;
[0054] A Figura 22 ilustra um uso de patch misto alternativo utilizando o primeiro patch de HBE para uma operação de copy-up de SSB para gerar um segundo patch;
[0055] A Figura 23 ilustra uma visão geral de um aparelho para processar um sinal de áudio utilizando alinhamento de banda espectral de acordo com uma realização;
[0056] A Figura 24a ilustra uma implementação preferida da calculadora de borda de patch da Figura 23;
[0057] A Figura 24b ilustra uma visão geral adicional de uma seqüência de etapas realizadas pelas realizações da invenção;
[0058] A Figura 25a ilustra um diagrama de blocos ilustrando mais detalhes da calculadora de borda de patch e mais detalhes sobre o ajuste de envelope espectral no contexto do alinhamento de bordas de patch;
[0059] A Figura 25b ilustra um fluxograma para o procedimento indicado na Figura 24a como um pseudocódigo;
[0060] A Figura 26 ilustra uma visão geral da estrutura no contexto de processamento de extensão de largura de banda; e
[0061] A Figura 27 ilustra uma implementação preferida de um processamento de sinais de sub-banda emitidos pelo banco de filtro de análise adicional da Figura 23. DESCRIÇÃO DETALHADA DE REALIZAÇÕES PREFERIDAS
[0062] As realizações descritas abaixo são meramente ilustrativas e podem prover uma complexidade mais baixa de um transpositor de QMF através de operações no domínio do tempo e freqüência eficientes, e qualidade de áudio melhorada de SBR harmônico com base em tanto QMF quanto em DFT por alinhamento espectral. É entendido que modificações e variações das disposições e os detalhes descritos neste documento se tornarão aparentes a outros técnicos no assunto. É a intenção, portanto, ser limitada somente pelo escopo das iminentes reivindicações da patente, e não pelos detalhes específicos apresentados por meio da descrição e explicação das realizações neste documento.
[0063] A Figura 23 ilustra uma realização de um aparelho para processar um sinal de áudio 2300 para gerar um sinal de largura de banda estendida possuindo uma parte de alta freqüência e uma parte de baixa freqüência utilizando dados paramétricos para a parte de alta freqüência, onde os dados paramétricos são relacionados a faixas de freqüência da parte de alta freqüência. O aparelho compreende uma calculadora de borda de patch 2302 para calcular uma borda de patch preferivelmente utilizando uma borda de patch alvo 23 0 4 que não coincida com uma borda de faixa de freqüência da faixa de freqüência. A informação 2306 sobre as faixas de freqüência da parte de alta freqüência pode, por exemplo, ser tomada a partir de um fluxo de dados codificado adequado para extensão de largura de banda. Em uma realização adicional, a calculadora de borda de patch não somente calcula uma única borda de patch para um único patch, mas sim calcula diversas bordas de patch para diversos patches diferentes que pertencem a diferentes fatores de transposição, onde a informação sobre os fatores de transposição são providas à calculadora de borda de patch 2302 conforme indicado em 2308. A calculadora de borda de patch é configurada para calcular bordas de patch de maneira que a borda de patch coincida com uma borda de faixa de freqüência das faixas de freqüência. Preferivelmente, quando a calculadora de borda de patch recebe a informação 230 4 sobre uma borda de patch alvo, então a calculadora de borda de patch é configurada para definir a borda de patch diferente da borda de patch alvo para obter o alinhamento. A calculadora de borda de patch emite as bordas de patch calculadas, as quais são diferentes das bordas de patch alvo, na linha 2310 a um patcher 2312. O patcher 2312 gera um sinal com patch ou diversos sinais com patch na saída 2314 utilizando o sinal de áudio de baixa banda 2300 e as bordas de patch em 2310, e em realizações onde múltiplas transposições são realizadas, utilizando os fatores de transposição na linha 2308.
[0064] A tabela na Figura 23 ilustra um exemplo numérico para ilustrar o conceito básico. Por exemplo, quando é suposto que o sinal de áudio de baixa banda possui uma porção de baixa freqüência se estendendo de 0 a 4 kHz (é claro que a faixa fonte não se inicia realmente em 0 Hz, mas próximo de 0, tal como 20 Hz) . Além disso, é a intenção do usuário realizar uma extensão de largura de banda do sinal de 4 kHz a um sinal de largura de banda estendida de 16 kHz. Adicionalmente, o usuário indicou que o usuário deseja realizar uma extensão de largura de banda utilizando três patches harmônicos com fatores de transposição de 2, 3, e 4. Em seguida, as bordas alvo dos patches podem ser definidas a um primeiro patch se estendendo de 4 a 8 kHz, um segundo patch se estendendo de 8 a 12 kHz, e um terceiro patch se estendendo de 12 a 16 kHz. Assim, as bordas de patch são 8, 12 e 16 quando é suposto que a primeira borda de patch coincidindo com a freqüência de cruzamento ou freqüência máxima do sinal de faixa de freqüência baixa não é alterada. Entretanto, alterar esta borda do primeiro patch está também dentro das realizações da presente invenção se for exigido. As bordas alvo corresponderiam a uma faixa fonte de 2 a 4 kHz para o fator de transposição de 2, 2.66 a 4 kHz para o fator de transposição de 3, e 3 a 4 kHz para o fator de transposição de 4. Especificamente, a faixa fonte é calculada dividindo as bordas alvo pelo fator de transposição realmente utilizado.
[0065] Para o exemplo na Figura 23 é suposto que as bordas 8, 12, 16 não coincidem com as bordas de faixa de freqüência das faixas de freqüência para as quais os dados de entrada paramétricos são relacionados. Assim, a calculadora de borda de patch calcula bordas de patch alinhadas e não aplica imediatamente as bordas alvo. Isto pode resultar em uma borda de patch superior de 7,7 kHz para o primeiro patch, uma borda superior de 11,9 kHz para o segundo patch e 15,8 kHz como a borda superior para o terceiro patch. Então, utilizando o fator de transposição novamente para o patch individual, certas faixas fonte “ajustadas” são calculadas e utilizadas para uso de patch, as quais são exemplarmente indicadas na Figura 23.
[0066] Embora tenha sido delineado que as faixas fonte são alteradas com as faixas alvo, para outras implementações, pode-se manipular o fator de transposição e, para manter a faixa fonte das bordas alvo ou para outras aplicações, pode-se até mesmo alterar a faixa fonte e o fator de transposição para finalmente chegar a bordas de patch ajustadas que coincidam com bordas de faixa de freqüência de faixas de freqüência às quais os dados de extensão de largura de banda paramétrica descrevendo o envelope espectral da porção de baixa alta do sinal original são relacionados.
[0067] A Figura 14 ilustra o princípio de transposição com base em bloco de sub-banda. O sinal de entrada no domínio do tempo é alimentado a um banco de filtro de análise 1401 que provê uma multitude de sinais de sub-banda de valores complexos. Estes são alimentados à unidade de processamento de sub-banda 1402. A multitude de sub-bandas de saída de valores complexos é alimentada ao banco de filtro de síntese 1403, o que, por sua vez, emite o sinal no domínio do tempo modificado. A unidade de processamento de sub-banda 1402 realiza operações de processamento de sub-banda com base em bloco não linear de maneira que o sinal no domínio do tempo é uma versão transposta do sinal de entrada correspondente a uma ordem de transposição T >1 . A noção de um processamento de sub-banda com base em bloco é definida por compreender operações não lineares em blocos de mais de uma amostra de sub-banda por vez, onde blocos subseqüentes estão em janela e sobreposição adicionada para gerar os sinais de sub-banda de saída.
[0068] Os bancos de filtro 1401 e 1403 podem ser de qualquer tipo modulado exponencial complexo tal como QMF ou um DFT em janela. Eles podem ser empilhados uniformemente ou de maneira irregular na modulação e podem ser definidos a partir de uma ampla gama de filtros protótipos ou janelas. É importante saber o ΔfS /Δf4 dos seguintes dois parâmetros de banco de filtro, medidos em unidades físicas.
[0069] Δf4 : o espaçamento da freqüência de sub-banda do banco de filtro de análise 1401;
[0070] ΔfS : o espaçamento da freqüência de sub-banda do banco de filtro de síntese 1403.
[0071] Para a configuração do processamento de sub-banda 1402, é necessário encontrar a correspondência entre índices de sub-banda fonte e alvo. É observado que uma senoide de entrada de freqüência física ^ resultará em uma contribuição principal correndo em sub-bandas de entrada em índice n ~^/Δf4 . Uma senoide de saída da freqüência física transposta desejada T ’^ se resultará a partir da alimentação da sub-banda de síntese com índice m ~ T ^ /ΔfS . Assim, os valores de índice de sub-banda fonte apropriados do processamento de sub-banda para um dado índice de sub-banda alvo m deve obedecer
Figure img0001
[0072] A Figura 15 ilustra uma situação de exemplo para a aplicação de transposição com base em bloco de sub-banda utilizando diversas ordens de transposição em um codec de áudio aprimorado por HFR. Um fluxo de bits transmitido é recebido no decodificador de núcleo 1501, o que provê um sinal de núcleo decodificado de baixa largura de banda em uma freqüência de amostragem fs. A baixa freqüência é reamostrada à freqüência de amostragem de saída 2fs por meio de um banco de análise de QMF de 32 bandas modulado complexo 1502 seguido de um banco de síntese de QMF de 64 bandas (QMF Inverso) 1505. Os dois bancos de filtro 1502 e 1505 possuem os mesmos parâmetros de a unidade de processamento de HFR 1504 simplesmente deixa passar as sub-bandas baixas sem modificações correspondentes ao sinal de núcleo de baixa largura de banda. O conteúdo de alta freqüência do sinal de saída é obtido ao alimentar as sub-bandas mais altas do banco de síntese de QMF de 64 bandas 1505 com as bandas de saída da unidade de transpositor múltiplo 1503, sujeito a modelagem espectral e modificações realizadas pela unidade de processamento de HFR 1504. O transpositor múltiplo 1503 obtém como entrada o sinal de núcleo decodificado e emite uma multitude de sinais de sub-banda que representam a análise de banda de 6 4 QMF de uma sobreposição ou combinação de diversas componentes de sinal transpostas. O objetivo é que o processamento de HFR é ignorado, cada componente corresponde a uma transposição física inteira do sinal de núcleo, ( T = 2,3,K ).
[0073] A Figura 16 ilustra uma situação exemplar da técnica anterior para a operação de uma transposição com base em bloco de sub-banda de ordem múltipla 1603 aplicando um banco de filtro de análise separado por ordem de transposição. Assim, três ordens de transposição T =2,3,4 devem ser produzidas e entregues no domínio de um QMF de 6 4 bandas operando na taxa de amostragem de saída 2 fs. A unidade de mesclagem 1604 simplesmente seleciona e combina as sub-bandas relevantes para cada ramo de fator de transposição em uma única multitude de sub-bandas de QMF a ser alimentada à unidade de processamento de HFR.
[0074] Considere primeiramente o caso T =2. O objetivo é especificamente que a cadeia de processamento de uma análise de QMF de 64 bandas 1602-2, uma unidade de processamento de sub-banda 1603-2, e uma síntese de QMF de 64 bandas 1505 resulta em uma transposição física de T =2 . Identificando estes três blocos com 1401, 1402, e 1403 da Figura 14, descobre-se que ΔfS /Δf4 =2 de maneira que (1) resulta na especificação para 1603-2 que a correspondência entre sub-bandas fonte n e alvo m é dada por n = m
[0075] Para o caso T =3, o sistema exemplar inclui um conversor de taxa de amostragem 1601-3 que converte a taxa de amostragem de entrada por um fator de 3/2 de fs a 2 fs/3. O objetivo é especificamente que a cadeia de processamento da análise de QMF de 64 bandas 1602-3, a unidade de processamento de sub-banda 1603-3, e uma síntese de QMF de 64 bandas 1505 resultem em uma transposição física de T =3 . Identificando estes três blocos com 1401, 1402, e 1403 na Figura 14, descobre-se, devido à Δf, / Δf. = 3 reamostragem, que •'S JA , de maneira que (1) provê a especificação para 1603-3, onde a correspondência entre sub-bandas
[0076] Para o caso T = 4 , o sistema exemplar inclui um conversor de taxa de amostragem 1601-4 que converte a taxa de amostragem de entrada por um fator de dois, de fs a fs/2. O objetivo é especificamente que a cadeia de processamento da análise de QMF de 64 bandas 1602-4, a unidade de processamento de sub-banda 1603-4, e uma síntese de QMF de 64 bandas 1505 resultem em uma transposição física de T = 4 . Identificando estes três blocos com 1401, 1402, e 1403 na Figura 14, descobre-se, devido à reamostragem, que ∆ ∆ = f f S A / 4 , de maneira que (1) provê a especificação para 1603-3, onde a correspondência entre sub-bandas fonte n e alvo m é também dada por n m = .
[0077] A Figura 17 ilustra uma situação exemplar inventiva para a operação eficiente de uma transposição com base em bloco de sub-banda de ordem múltipla aplicando um banco de filtro de análise de QMF de 64 bandas. Com efeito, o uso de três bancos de análise de QMF separados e dois conversores de taxa de amostragem na Figura 16 resulta em uma complexidade computacional bastante alta, bem como algumas desvantagens de implementação para processamento com base em quadro, devido à conversão de taxa de amostragem 1601-3. As realizações atuais ensinam substituir os dois ramos 1601-3 → 1602-3 → 1603-3 e 1601-4 → 1602-4 → 1603-4 pelo processamento de sub-banda 1703-3 e 1703-4, respectivamente, enquanto que o ramo 1602 → 1603-2 é mantido inalterado comparado com a Figura 16. Todas as três ordens de transposição terão agora de ser realizadas em um domínio de banco de filtro em referência à Figura 14, onde ∆ ∆ = f f S A / 2 . Para o caso T = 3, a especificação para 1703-3 dada por (1) é que a correspondência entre sub-bandas fonte n e alvo m é dada por n m ≈ 2 / 3. Para o caso T = 4 , as especificações para 1703-3 dadas por (1) são que a correspondência entre sub-bandas fonte n e alvo m é dada por n m ≈ 2 . Para reduzir ainda mais a complexidade, algumas ordens de transposição podem ser geradas ao copiar ordens de transposição já calculadas a saída do decodificador de núcleo.
[0078] A Figura 1 ilustra a operação de um transpositor com base em bloco de sub-banda utilizando ordens de transposição de 2, 3, e 4 em uma estrutura de decodificador aprimorada por HFR, tal como SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audio-visual objects” - Part 3: Audio] . O fluxo de bits é decodificado para o domínio do tempo pelo decodificador de núcleo 101 e passado para o módulo de HFR 103, o qual gera um sinal de alta freqüência a partir do sinal de núcleo de banda de base. Após a geração, o sinal gerado por HFR é dinamicamente ajustado para corresponder ao sinal original o mais próximo possível, por meio da informação auxiliar transmitida. Este ajuste é realizado pelo processador de HFR 105 em sinais de sub-banda, obtidos a partir de um ou diversos bancos de QMF de análise. Uma situação típica é quando o decodificador de núcleo opera em um sinal de domínio do tempo amostrado na metade da freqüência dos sinais de entrada e saída, isto é, o módulo decodificador de HFR reamostrará de maneira eficaz o sinal de núcleo para duas vezes a freqüência de amostragem. Esta conversão de taxa de amostragem é geralmente obtida pela primeira etapa de filtragem do sinal de codificador de núcleo por meio de um banco de QMF de análise de 32 bandas 102. As sub-bandas abaixo da chamada freqüência de cruzamento, isto é, o subconjunto mais baixo das 32 sub-bandas que contém toda a energia de sinal de codificador, são combinadas com o conjunto de sub-bandas que carrega o sinal gerado por HFR. Geralmente, o número das sub-bandas combinadas desta maneira é 64, o que, após filtragem através do banco de QMF de síntese 106, resulta em um sinal de codificador de núcleo com taxa de amostragem convertida combinado com a saída do módulo de HFR.
[0079] No transpositor com base em bloco de sub-banda do módulo de HFR 103, três ordens de transposição T = 2, 3 e 4 devem ser produzidas e entregues no domínio de um QMF de 6 4 bandas operando na taxa de amostragem de saída de 2fs. O sinal no domínio do tempo de entrada é filtrado por filtro passa-faixa nos blocos 103-12, 103-13 e 103-14. Isto é feito para fazer com que os sinais de saída, processados pelas diferentes ordens de transposição, possuam conteúdos espectrais não sobrepostos. Os sinais sofrem adicionalmente redução de amostragem (103-23, 103-24) para se adaptar à taxa de amostragem dos sinais de entrada para encaixar nos bancos de filtro de análise de tamanho constante (neste caso, 64). Pode ser observado que o aumento da taxa de amostragem, do fs a 2fs, pode ser explicado pelo fato de que os conversores de taxa de amostragem utilizam fatores de redução de amostragem de T/2 em vez de T, em que o último resultaria em sinais de sub-banda transpostos possuindo taxa de amostragem igual à do sinal de entrada. Os sinais com redução de amostragem são alimentados a bancos de filtro de análise de HFR separados (103-32, 103-33 e 103-34), um para cada ordem de transposição, o que provê uma multitude de sinais de sub-banda com valor complexo. Estes são alimentados às unidades esticadoras de sub-banda não lineares (103-42, 103-43 e 103-44) . A multitude de sub-bandas de saída de valor complexo é alimentada ao módulo de Mesclar/Combinar 104 com a saída do banco de análise sub-amostrado 102. A unidade de Mesclar/Combinar simplesmente mescla as sub-bandas a partir do banco de filtro de análise 102 e cada ramo de fator de esticamento em uma única multitude de sub-bandas QMF a ser alimentada à unidade de processamento de HFR 105.
[0080] Quando os espectros de sinal de diferentes ordens de transposição são definidos como não sobrepostos, isto é, o espectro do T -ésimo sinal de ordem de transposição deve se iniciar onde o espectro do sinal de ordem T-1 termina, os sinais transpostos precisam ser de caráter passa-faixa. Por isso os filtros passa-faixa tradicionais 103-12 a 103-14 na Figura 1. Entretanto, através de uma única seleção exclusiva dentre as subbandas disponíveis pela unidade de Mesclar/Combinar 104, os filtros passa-faixa separados são redundantes e podem ser evitados. Em vez disso, a característica de passa-faixa inerente provida pelo banco QMF é explorada ao alimentar as diferentes contribuições a partir dos ramos de transpositor independentemente a diferentes canais de sub-banda em 104. Basta também aplicar o esticamento de tempo somente a bandas que são combinadas em 104.
[0081] A Figura 2 ilustra a operação de uma unidade esticadora de sub-banda não linear. O extrator de bloco 201 amostra um quadro finito de amostras a partir do sinal de entrada de valor complexo. O quadro é definido por uma posição de apontador de entrada. Este quadro sofre processamento linear em 202 e é subseqüentemente colocado em janela por uma janela de comprimento finito em 203. As amostras resultantes são adicionadas a amostras previamente emitidas na unidade de sobreposição e adição 20 4 onde a posição do quadro de saída é definida por uma posição de apontador de saída. O apontador de entrada é incrementado por uma quantidade fixa e o apontador de saída é incrementado pelo fator de esticamento de sub-banda vezes a mesma quantidade. Uma iteração desta cadeia de operações produzirá um sinal de saída com duração sendo o fator de esticamento de subbanda vezes a duração do sinal de sub-banda de entrada, até o comprimento da janela de síntese.
[0082] Embora o transpositor de SSB empregado pelo SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audiovisual objects” - Part 3: Audio] tipicamente explore toda a banda de base, excluindo a primeira sub-banda, para gerar um sinal de banda alta, um transpositor harmônico geralmente utiliza uma parte menor do espectro de codificador de núcleo. A quantidade utilizada, a chamada faixa fonte, depende da ordem de transposição, do fator de extensão de largura de banda e das regras aplicadas para o resultado combinado, por exemplo, se os sinais gerados a partir de diferentes ordens de transposição são permitidos a se sobreporem no espectro ou não. Como conseqüência, somente uma parte limitada do espectro de saída do transpositor harmônico para uma dada ordem de transposição realmente será utilizada pelo módulo processador de HFR 105.
[0083] A Figura 18 ilustra outra realização de uma implementação de processamento exemplar para processar um sinal de sub-banda única. O sinal de sub-banda única foi sujeito a qualquer tipo de dizimação antes ou depois de ser filtrado por um banco de filtro de análise não exibido na Figura 18. Portanto, a duração de tempo de um sinal de sub-banda única é mais curta que a duração de tempo antes de formar a dizimação. O sinal de sub-banda única é inserido em um extrator de blocos 1800, o qual pode ser idêntico ao extrator de blocos 201, mas que também pode ser implementado em uma maneira diferente. O extrator de blocos 1800 na Figura 18 opera utilizando um valor de avanço de amostra/bloco exemplarmente chamado e. O valor de avanço de amostra/bloco pode ser variável ou pode ser definido fixamente e é ilustrado na Figura 18 como uma seta em direção à caixa de extrator de blocos 1800. Na saída do extrator de blocos 1800, há uma pluralidade de blocos extraídos. Estes blocos estão altamente sobrepostos, uma vez que o valor de avanço de amostra/bloco e é significativamente menor que o comprimento de bloco do extrator de blocos. Um exemplo é que o extrator de blocos extrai blocos de 12 amostras. O primeiro bloco compreende amostras de 0 a 11, o segundo bloco compreende amostras de 1 a 12, o terceiro bloco compreende amostras de 2 a 13, e assim por diante. Nesta realização, o valor de avanço de amostra/bloco é igual a 1, e há uma sobreposição de 11 vezes.
[0084] Os blocos individuais são inseridos em um janelador 1802 para janelar os blocos utilizando uma função de janela para cada bloco. Adicionalmente, uma calculadora de fase 1804 é provida, a qual calcula uma fase para cada bloco. A calculadora de fase 1804 pode utilizar o bloco individual antes do janelamento ou subseqüente ao janelamento. Em seguida, um valor de ajuste de fase p x k é calculado e inserido em um ajustador de fase 1806. O ajustador de fase aplica o valor de ajuste para cada amostra no bloco. Além disso, o fator k é igual ao fator de extensão de largura de banda. Quando, por exemplo, a extensão de largura de banda por um fator 2 deve ser obtida, então a fase p calculada para um bloco extraído pelo extrator de blocos 1800 é multiplicada pelo fator 2 e o valor de ajuste aplicado a cada amostra do bloco no ajustador de fase 1906 é p multiplicado por 2. Este(a) é um(a) valor/regra exemplar. Alternativamente, a fase corrigida para a síntese é k * p, p + (k-1) *p. Então, neste exemplo, o fator de correção é 2 se multiplicado, ou 1*p se somado. Outros(as) valores/regras podem ser aplicados(as) para calcular o valor de correção de fase.
[0085] Em uma realização, o sinal de sub-banda única é um sinal de sub-banda complexa, e a fase de um bloco pode ser calculada por uma pluralidade de diferentes maneiras. Uma maneira é obter a amostra no meio ou ao redor do meio do bloco e calcular a fase desta amostra complexa. Também é possível calcular a fase para cada amostra.
[0086] Embora ilustrado na Figura 18 na maneira que um ajustador de fase opera subseqüente ao janelador, estes dois blocos podem também ser intercambiados, de maneira que o ajuste de fase é realizado aos blocos extraídos pelo extrator de blocos e uma operação de janelamento subseqüente é realizada. Uma vez que ambas as operações, isto é, janelamento e ajuste de fase, são multiplicações de valores reais ou valores complexos, estas duas operações podem ser resumidas em uma única operação utilizando um fator de multiplicação complexa, o qual, o próprio, é o produto de um fator de multiplicação de ajuste de fase e um fator de j anelamento.
[0087] Os blocos com fase ajustada são inseridos em um bloco de correção de sobreposição/soma e amplitude 1808, onde os blocos em janela e com fase ajustada são somados com sobreposição. É importante ressaltar, porém, que o valor de avanço de amostra/bloco no bloco 1808 é diferente do valor utilizado no extrator de blocos 1800. Particularmente, o valor de avanço de amostra/bloco no bloco 1808 é maior que o valor utilizado no bloco 1800, de modo que um esticamento de tempo do sinal emitido pelo bloco 1808 é obtido. Assim, o sinal de sub-banda processado enviado pelo bloco 1808 possui um comprimento que é maior que o sinal de sub-banda inserido no bloco 1800. Quando a extensão de largura de banda de dois deve ser obtida, então o valor de avanço de amostra/bloco é utilizado, o qual é duas vezes o valor correspondente no bloco 1800. Isto resulta em um esticamento de tempo por um fator de dois. Quando, entretanto, outros fatores de esticamento de tempo são necessários, então outros valores de avanço de amostra/bloco podem ser utilizados, de modo que a saída do bloco 1808 possua um comprimento de tempo exigido.
[0088] Para tratar da questão da sobreposição, uma correção de amplitude é preferivelmente realizada para tratar da questão de diferentes sobreposições no bloco 1800 e 1808. Esta correção de amplitude poderia, porém, ser também introduzida ao fator de multiplicação do ajustador de fase/janelador, porém a correção de amplitude pode também ser realizada subseqüente ao processamento ou à sobreposição.
[0089] No exemplo acima com um comprimento de bloco de 12 e um valor de avanço de amostra/bloco no extrator de blocos de um, o valor de avanço de amostra/bloco para o bloco de sobreposição/adição 1808 seria igual a dois, quando uma extensão de largura de banda por um fator de dois for realizada. Isto ainda resultaria em uma sobreposição de cinco blocos. Quando uma extensão de largura de banda por um fator de três deve ser realizada, então o valor de avanço de amostra/bloco utilizado pelo bloco 1808 seria igual a três, e a sobreposição iria cair para uma sobreposição de três. Quando uma extensão de largura de banda de quatro vezes deve ser realizada, então o bloco de sobreposição/adição 1808 teria de utilizar um valor de avanço de amostra/bloco de quatro, o que ainda resultaria em uma sobreposição de mais de dois blocos.
[0090] Grandes economias computacionais podem ser atingidas ao restringir os sinais de entrada aos ramos de transpositor para somente conter a faixa fonte, e isto em uma taxa de amostragem adaptada para cada ordem de transposição. O esquema de blocos básico de tal sistema para um gerador de HFR com base em bloco de sub-banda é ilustrado na Figura 3. O sinal de codificador de núcleo de entrada é processado por redutores de amostragem dedicados anteriores aos bancos de filtro de análise de HFR.
[0091] O efeito essencial de cada redutor de amostragem é filtrar o sinal de faixa fonte e entregá-lo ao banco de filtro de análise na menor taxa de amostragem possível. Aqui, menor possível se refere à menor taxa de amostragem que é ainda adequada para o processamento de redução de amostragem, não necessariamente a menor taxa de amostragem que evita aliasing após dizimação. A conversão de taxa de amostragem pode ser obtida em diversas maneiras. Sem limitar o escopo da invenção, dois exemplos serão dados: o primeiro mostra a reamostragem realizada pelo processamento no domínio do tempo de taxa múltipla, e o segundo ilustra a reamostragem atingida por meio de processamento de subbanda QMF.
[0092] A Figura 4 mostra um exemplo dos blocos em um redutor de amostragem no domínio do tempo de taxa múltipla para uma ordem de transposição de 2. O sinal de entrada, possuindo uma largura de banda B Hz, e uma freqüência de amostragem fs, é modulado por um exponencial complexo (401) para deslocar a freqüência do início da faixa fonte para freqüência DC como
[0093]
Figure img0002
[0094] Exemplos de um sinal de entrada e o espectro após modulação são ilustrados nas Figuras 5(a) e (b) . O sinal modulado é interpolado (402) e filtrado por um filtro passa-baixa de valor complexo com limite de passa-faixa 0 e B/2 Hz (403) . Os espectros após as respectivas etapas são mostrados nas Figuras 5(c) e (d). O sinal filtrado é subseqüentemente dizimado (404) e a parte real do sinal é computada ( 405) . Os resultados após estas etapas são mostrados nas Figuras 5(e) e (f) . Neste exemplo em particular, quando T=2, B=0,6 (em uma escala normalizada, isto é, fs=2), P 2 é escolhido como 24, para cobrir de maneira segura a faixa fonte. O fator de redução de amostragem se torna
[0095]
Figure img0003
[0096] onde a fração foi reduzida pelo fator comum 8. Assim, o fator de interpolação é 3 (conforme visto pela Figura 5(c)) e o fator de dizimação é 8. Ao utilizar as Noble Identities [“ Multirate Systems And Filter Banks,” P.P. Vaidyanathan, 1993, Prentice Hall, Englewood Cliffs], o dizimador pode ser movido totalmente para a esquerda, e o interpolador totalmente para a direita na Figura 4. Desta maneira, a modulação e a filtragem são feitas na menor taxa de amostragem possível e a complexidade computacional é ainda mais reduzida.
[0097] Outra abordagem é utilizar as saídas de sub-banda do banco QMF de análise de 32 bandas sub-amostrado 102 já presente no método de HFR SBR. As sub-bandas cobrindo as faixas fonte para os diferentes ramos de transpositor são sintetizadas ao domínio do tempo por pequenos bancos QMF sub-amostrados precedendo os bancos de filtro de análise de HFR. Este tipo de sistema de HFR é ilustrado na Figura 6. Os pequenos bancos QMF são obtidos pela sub-amostragem do banco QMF de 64 bandas original, onde os coeficientes de filtro protótipo são descobertos pela interpolação linear do filtro protótipo original. Seguindo as notações na Figura 6, o banco QMF de síntese precedendo o ramo de transpositor de segunda ordem possui Q 2=12 bandas (as sub-bandas com índices de base zero de 8 a 19 no QMF de 32 bandas) . Para evitar aliasing no processo de síntese, a primeira (índice 8) e a última (índice 19) bandas são definidas como zero. A saída espectral resultante é mostrada na Figura 7. Observe que o banco de filtro de análise de transpositor com base em bloco possui 2 Q 2=24 bandas, isto é, o mesmo número de bandas que no exemplo com base em redutor de amostragem em domínio do tempo de taxa múltipla (Figura 3).
[0098] O sistema delineado na Figura 1 pode ser visto como um caso especial simplificado da reamostragem delineada nas Figuras 3 e 4. Para simplificar a disposição, os moduladores foram omitidos. Além disso, todas as filtragens de análise de HFR são obtidas utilizando bancos de filtro de análise de 64 bandas. Assim, P 2 = P 3 = P 4 = 64 da Figura 3, e os fatores de redução de amostragem são, 1, 1,5 e 2 para os transpositores de segunda, terceira e quarta ordem, respectivamente.
[0099] Um diagrama de blocos de um redutor de amostragem de fator 2 é mostrado na figura 8(a). O filtro passa-baixa, agora de valor real, pode ser escrito H(z) B(z)/A(z) , onde B(z) é a (FIR) e A(z) é a parte recursiva (IIR) . Entretanto, para uma implementação eficiente, utilizando as Noble Identities para reduzir a complexidade computacional, é benéfico projetar um filtro onde todos os polos possuem multiplicidade 2 (polos duplos) como A(z2). Assim, o filtro pode ser fatorado conforme mostrado na Figura 8(b). Ao utilizar a Noble Identity 1, a parte recursiva pode ser movida além do dizimador, como na Figura 8(c). O filtro não recursivo B z ( ) pode ser implementado utilizando decomposição polifásica de 2 componentes padrão, como
[0100]
Figure img0004
[0101] Assim, o redutor de amostragem pode ser estruturado como na Figura 8(d). Após utilizar a Noble Identity 1, a parte FIR é computada na menor taxa de amostragem possível conforme mostrado na Figura 8(e). A partir da Figura 8(e), é fácil ver que a operação FIR (atraso, dizimadores e componentes polifásicos) pode ser vista como uma operação de adição de janela utilizando um passo de entrada de duas amostras. Para duas amostras de entrada, uma nova amostra de saída será produzida, eficazmente resultando em uma redução de amostragem de um fator de 2 .
[0102] Um diagrama de blocos do redutor de amostragem de fator 1,5=3/2 é mostrado na Figura 9(a) . O filtro passa-baixa de valor real pode novamente ser escrito H(z) = B(z)/A(z) , onde B(z) é (FIR) e A( z) é a parte recursiva (IIR) . Como
[0103]
Figure img0005
[0104] Assim, o redutor de amostragem pode ser estruturado como na Figura 9(d). Após utilizar tanto a Noble Identity 1 quanto 2, a parte FIR é computada na menor taxa de amostragem possível conforme mostrado na Figura 9(e). A partir da Figura 9(e) é fácil observar que as amostras de saída de índice par são computadas utilizando o grupo mais baixo de três filtros polifásicos ( E z E z E z 0 2 4 ( ), ( ), ( ) ) enquanto as amostras de índice ímpar são computadas a partir do grupo mais alto ( E z E z E z 1 3 5 ( ), ( ), ( ) ). A operação de cada grupo (cadeia de atraso, dizimadores e componentes polifásicos) pode ser vista como uma operação de soma de janela utilizando um passo de entrada de três amostras. Os coeficientes de janela utilizados no grupo superior são os coeficientes de índice ímpar, enquanto o grupo mais baixo utiliza os coeficientes de índice par do filtro original B z ( ) . Assim, para um grupo de três amostras de entrada, duas novas amostras de saída serão produzidas, resultando eficazmente em uma redução de amostragem de fator 1,5.
[0105] O sinal no domínio do tempo do decodificador de núcleo (101 na Figura 1) pode também ser sub-amostrado ao utilizar uma transformada de síntese sub-amostrada menor no decodificador de núcleo. O uso de uma transformada de síntese menor oferece complexidade computacional ainda menor. Dependendo da freqüência de cruzamento, isto é, a largura de banda do sinal de codificador de núcleo, a relação de tamanho de transformada de síntese e o tamanho nominal Q (Q < 1), resulta em um sinal de saída de codificador de núcleo possuindo uma taxa de amostragem Qfs. Para processar o sinal de codificador de núcleo sub-amostrado nos exemplos delineados no pedido de patente atual, todos os bancos de filtro de análise da Figura 1 (102, 103-32, 103-33 e 103-34) precisam ser dimensionados pelo fator Q, bem como todos os redutores de amostragem (301-2, 301-3 e 301-T) da Figura 3, o dizimador 404 da Figura 4, e o banco de filtro de análise 601 da Figura 6. Aparentemente, Q deve ser escolhido de modo que todos os tamanhos de bancos de filtro sejam números inteiros.
[0106] A Figura 10 ilustra o alinhamento das bordas espectrais dos sinais de transpositor de HFR às bordas espectrais da tabela de freqüência de ajuste de envelope em um codificador aprimorado por HFR, tal como um SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audio-visual objects - Part 3: Audio]. A Figura 10(a) mostra um gráfico estilístico das faixas de freqüência compreendendo a tabela de ajuste de envelope, as chamadas bandas de fator de escala, cobrindo a faixa de freqüência a partir da freqüência de cruzamento kx à freqüência de parada ks. As bandas de fator de escala constituem a rede de freqüência utilizada em um codificador aprimorado por HFR quando ajustar o nível de energia da banda alta regenerada sobre a freqüência, isto é, o envelope de freqüência. Para ajustar o envelope, é tirada a média da energia do sinal ao longo de um bloco de tempo/freqüência restringido pelas bordas de banda de escala-fator e pelas bordas de tempo selecionadas.
[0107] Especificamente, a Figura 10 ilustra na porção superior, uma divisão em faixas de freqüência 100, e se torna claro a partir da Figura 10 que as faixas de freqüência aumentam com a freqüência, onde o eixo horizontal corresponde à freqüência e possui na notação na Figura 10, os canais de banco de filtro k, onde o banco de filtro pode ser implementado como um banco de filtro QMF tal como um banco de filtro de 6 4 canais, ou pode ser implementado através de uma transformada de Fourier digital, onde k corresponde a uma certa posição de freqüência da aplicação de DFT. Assim, uma posição de freqüência de uma aplicação de DFT e um canal de banco de filtro de uma aplicação de QMF indicam o mesmo no contexto da descrição. Assim, os dados paramétricos são dados para a parte de alta freqüência 102 nas posições de freqüência 100 ou faixas de freqüência. A parte de baixa freqüência do sinal de largura de banda finalmente estendido é indicada em 104. A ilustração intermediária na Figura 10 ilustra as faixas de patch para um primeiro patch 1001, um segundo patch 1002 e um terceiro patch 1003. Cada patch se estende entre duas bordas de patch, onde há uma borda de patch mais baixa 1001a e uma borda de patch mais alta 1001b para o primeiro patch. A borda mais alta do primeiro patch indicada 1001b corresponde à borda inferior do segundo patch, a qual é indicada em 1002a. Assim, os numerais de referência 1001b e 1002a na verdade se referem à mesma freqüência. Uma borda de patch mais alta 1002b do segundo patch novamente corresponde a uma borda de patch mais baixa 1003a do terceiro patch, e o terceiro patch também possui uma borda de patch alta 1003b. É preferido que não existam buracos entre patches individuais, mas isto não é uma exigência derradeira. É visível na Figura 10 que as bordas de patch 1001b, 1002b não coincidem com as bordas correspondentes das faixas de freqüência 100, mas estão dentro de certas faixas de freqüência 101. A linha inferior na Figura 10 ilustra diferentes patches com bordas alinhadas 1001c, onde o alinhamento da borda superior 1001c do primeiro patch automaticamente significa o alinhamento da borda inferior 1002c do segundo patch e vice versa. Adicionalmente, é indicado que a borda superior do segundo patch 1002d está agora alinhada com a borda de freqüência inferior da faixa de freqüência 101 na primeira linha da Figura 10 e que, portanto, automaticamente a borda inferior do terceiro patch indicado em 1003c está alinhada também.
[0108] Na realização da Figura 10, é mostrado que as bordas alinhadas estão alinhadas à borda de freqüência inferior da faixa de freqüência correspondente 101, porém o alinhamento poderia também ser feito em uma direção diferente, isto é, que a borda de patch 1001c, 1002c esteja alinhada à borda de freqüência superior da banda 101 em vez de à borda de freqüência inferior da mesma. Dependendo da implementação real, uma dessas possibilidades pode ser aplicada e pode até haver uma mistura de ambas as possibilidades para diferentes patches.
[0109] Se os sinais gerados por diferentes ordens de transposição estiverem desalinhados às bandas de escala-fator, conforme ilustrado na Figura 10(b), artefatos podem surgir se a energia espectral drasticamente se alterar na vizinhança de uma borda de banda de transposição, uma vez que o processo de ajuste de envelope manterá a estrutura espectral dentro de uma banda de escala-fator. Assim, a invenção adapta as bordas de freqüência dos sinais transpostos às bordas das bandas de escala-fator conforme mostrado na Figura 10(c). Na figura, as bordas superiores dos sinais gerados pelas ordens de transposição de 2 e 3 (T=2, 3) são abaixadas em um valor pequeno, comparado com a Figura 10(b), para alinhar as bordas de freqüência das bandas de transposição às bordas de banda de escala-fator existentes.
[0110] Uma situação realística mostrando os artefatos em potencial quando se utiliza bordas desalinhadas é ilustrada na Figura 11. A Figura 11(a) mostra novamente as bordas de banda de escala-fator. A Figura 11(b) mostra os sinais gerados por HFR não ajustados de ordens de transposição T=2, 3 e 4 com o sinal de banda de base decodificado de núcleo. A Figura 11(c) mostra o sinal com envelope ajustado quando um envelope alvo plano é presumido. Os blocos com áreas em xadrez representam bandas de escala-fator com altas variações de energia intra-banda, o que pode causar anomalias no sinal de saída.
[0111] A Figura 12 ilustra a situação da Figura 11, mas desta vez utilizando bordas alinhadas. A Figura 12(a) mostra as bordas de banda de escala-fator, a Figura 12(b) ilustra os sinais gerados por HFR não ajustados de ordens de transposição T=2, 3 e 4 com o sinal de banda de base decodificado de núcleo e, em conformidade com a Figura 11(c), a Figura 12(c) mostra o sinal com envelope ajustado quando um envelope alvo plano é presumido. Conforme visto a partir desta figura, não há bandas de escala- fator com altas variações de energia intra-banda devido ao desalinhamento das bandas de sinal transpostas e as bandas de escala-fator, e, assim, artefatos em potencial são reduzidos.
[0112] A Figura 25a ilustra uma visão geral de uma implementação da calculadora de borda de patch 2302 e do patcher e a localização destes elementos dentro de uma situação de extensão de largura de banda de acordo com uma realização preferida. Especificamente, é provida uma interface de entrada 2500, a qual recebe os dados de banda baixa 2300 e os dados paramétricos 2302. Os dados paramétricos podem ser dados de extensão de largura de banda como, por exemplo, os conhecidos a partir do ISO/IEC 144963: 2009, o qual é incorporado a este documento por referência em sua totalidade, e particularmente em relação à seção relacionada à extensão de largura de banda, a qual é a seção 4.6.18 “SBR tool”. De particular relevância na seção 4.6.18 é a seção 4.6.18.3.2 “Frequency band tables ”, e particularmente o cálculo de algumas Particularmente, a seção 4.6.18.3.2.1 do Standard define o cálculo das tabelas de faixa de freqüência mestre, e a seção 4.6.18.3.2.2 define o cálculo das tabelas de faixa de freqüência derivadas a partir da tabela de faixa de freqüência mestre, e particularmente emite como fTableHigh, fTableLow β fTableNoise são calculados. A seção 4.6.18.3.2.3 define o cálculo da tabela de faixa de freqüência limitadora.
[0113] A tabela de freqüência de baixa resolução fTableLow é para dados paramétricos de baixa resolução e a tabela de freqüência de alta resolução fTableHigh é para dados paramétricos de alta resolução, os quais são ambos possíveis no contexto da ferramenta SBR MPEG-4, conforme discutido no Standard mencionado e o fato de que os dados paramétricos são dados paramétricos de baixa resolução ou dados paramétricos de alta resolução depende da implementação do codificador. A interface de entrada 2500 determina se os dados paramétricos são dados de alta ou baixa resolução e provê estas informações à calculadora de tabela de freqüência 2501. A calculadora de tabela de freqüência, então, calcula a tabela mestre ou deriva de maneira geral uma tabela de alta resolução 2502 e uma tabela de baixa resolução 2503 e provê o mesmo ao núcleo de calculadora de borda de patch 2504, o qual adicionalmente compreende ou coopera com uma calculadora de banda limitadora 2505. Os elementos 2504 e 2505 geram bordas de patch de síntese alinhadas 2506 e bordas de banda limitadoras relacionadas à faixa de síntese. Esta informação 2506 é provida a uma calculadora de banda fonte 2507, a qual calcula a faixa fonte do sinal de áudio de baixa banda para um certo patch de maneira que, com “os fatores de transposição correspondentes, as bordas de patch de síntese alinhadas 2506 são obtidas após o uso de patch utilizando, por exemplo, um transpositor harmônico 2508 como um patcher.
[0114] Particularmente, o transpositor 2508 pode realizar diferentes algoritmos de uso de patch, tal como um algoritmo com base em DFT ou um algoritmo com base em QMF. O transpositor harmônico 2508 pode ser implementado para realizar um processamento semelhante a vocoder, o qual é descrito no contexto das Figuras 26 e 27 para a realização de transpositor harmônico com base em QMF, porém outras operações de transpositor, tais como um transpositor com base em DFT para o propósito de gerar uma porção de alta freqüência em uma estrutura semelhante a vocoder podem também ser utilizadas. Para o transpositor com base em DFT, a calculadora de banda fonte calcula janelas de freqüência para a faixa de freqüência baixa. Para a implementação com base em QMF, a calculadora de banda fonte 2507 calcula as bandas QMF exigidas da faixa fonte para cada patch. A faixa fonte é definida pelos dados de áudio de baixa banda 2300, os quais são tipicamente providos em uma forma codificada e são encaminhados pela interface de entrada 2500 a um decodificador de núcleo 2509. O decodificador de núcleo 2509 alimenta seus dados de saída em um banco de filtro 2510, o qual pode ser uma implementação de QMF ou uma implementação de DFT. Na implementação de QMF, o banco de filtro de análise 2510 pode possuir 32 canais de banco de filtro, e estes 32 canais de banco de filtro definem a faixa fonte “máxima”, e o transpositor harmônico 2508 então seleciona, a partir destas 32 bandas, as bandas reais que compõem a faixa fonte ajustada conforme definido pela calculadora de banda fonte 2507 para, por exemplo, para cumprir os dados de faixa fonte ajustados na tabela da Figura 23, contanto que os valores de freqüência na tabela na Figura 23 sejam convertidos a índices de sub-banda de banco de filtro de síntese. Um procedimento similar pode ser realizado para o transpositor com base em DFT, o qual recebe para cada patch uma certa janela para a faixa de freqüência baixa e esta janela é, então encaminhada para o bloco DFT 2510 para selecionar a faixa fonte de acordo com as bordas de patch de síntese ajustadas ou alinhadas calculadas pelo bloco 2504.
[0115] O sinal transposto 2509 emitido pelo transpositor 2508 é encaminhado a um ajustador de envelope e limitador de ganho 2510, o qual recebe como uma entrada a tabela de alta resolução 2502 e a tabela de baixa resolução 2503, as bandas limitadoras ajustadas 2511 e, naturalmente, os dados paramétricos 2302. A banda alta com envelope ajustado na linha 2512 é, então, inserida em um banco de filtro de síntese 2514, o qual adicionalmente recebe a banda baixa tipicamente na forma enviada pelo decodificador de núcleo 2509. Ambas as contribuições são mescladas pelo banco de filtro de síntese 2514 para finalmente obter o sinal reconstruído de alta freqüência na linha 2515.
[0116] Está claro que a mesclagem da banda alta e da banda baixa pode ser feita de maneira diferente, tal como ao realizar uma mesclagem no domínio do tempo em vez de no domínio da freqüência. Além disso, está claro que a ordem de mesclagem, independente da implementação da mesclagem e do ajuste de envelope pode ser alterada, isto é, de maneira que o ajuste de envelope de uma certa faixa de freqüência pode ser realizado após a mesclagem ou, alternativamente, antes da mesclagem, onde o último caso é ilustrado na Figura 25a. É, além disso, delineado que o ajuste de envelope pode ser ainda realizado antes da transposição no transpositor 2508, de maneira que a ordem do transpositor 2508 e do ajustador de envelope 2510 pode também ser diferente do que está ilustrado na Figura 25a como uma realização.
[0117] Conforme já delineado no contexto do bloco 2508, um transpositor harmônico com base em DFT ou um transpositor harmônico com base em QMF pode ser aplicado nas realizações. Ambos os algoritmos dependem de um espalhamento de freqüência de fase- vocoder. O sinal no domínio do tempo do codificador de núcleo tem sua largura de banda estendida utilizando uma estrutura de vocoder de fase modificada. A extensão de largura de banda é realizada pelo esticamento de tempo seguido por dizimação, isto é, transposição, utilizando diversos fatores de transposição (t = 2, 3, 4) em um estágio de transformada de análise/síntese comum. O sinal de saída do transpositor possuirá uma taxa de amostragem duas vezes a do sinal de entrada, o que significa que, para um fator de transposição de dois, o sinal será esticado no tempo porém não dizimado, eficientemente produzindo um sinal de igual duração de tempo que a do sinal de entrada porém possuindo duas vezes a freqüência de amostragem. O sistema combinado pode ser interpretado como três transpositores paralelos utilizando fatores de transposição de 2, 3 e 4, respectivamente, onde os fatores de dizimação são 1, 1,5 e 2. Para reduzir a complexidade, os transpositores de fator 3 ou 4 (transpositores de terceira e quarta ordem) são integrados ao transpositor de fator 2 (transpositor de segunda ordem) por meio de interpolação, conforme é subseqüentemente discutido no contexto da Figura 27.
[0118] Para cada quadro, um tamanho de transformada de “tamanho completo” nominal de um transpositor é determinado dependendo de uma sobreamostragem no domínio da freqüência adaptativa ao sinal, a qual pode ser aplicada para melhorar a resposta a transientes ou que pode ser desligada. Este valor é indicado na Figura 24a como FFTSizeSyn. Em seguida, blocos de amostras de entrada em janela são transformados, onde, para a extração de blocos, um valor de avanço de bloco ou valor de passo de análise de um número de amostras muito menor é realizado para possuir uma sobreposição de blocos significativa. Os blocos extraídos são transformados ao domínio da freqüência por meio de uma DFT dependendo do sinal de controle da sobreamostragem no domínio da freqüência adaptativa ao sinal. As fases dos coeficientes de DFT de valor complexo são modificadas de acordo com três fatores de transposição utilizados. Para a transposição de segunda ordem, as fases são dobradas, para as transposições de terceira e quarta ordem, as fases são triplicadas, quadruplicadas ou interpoladas a partir de dois coeficientes de DFT consecutivos. Os coeficientes modificados são subseqüentemente transformados de volta ao domínio do tempo por meio de uma DFT, em janela e combinados por meio de soma de sobreposição utilizando um passe de saída diferente do passo de entrada. Em seguida, utilizando o algoritmo ilustrado na Figura 24a, as bordas de patch são calculadas e escritas na matriz xOverBin. Então, as bordas de patch são utilizadas para calcular as janelas de transformada no domínio do tempo para a aplicação do transpositor DFT. Pra o transpositor QMF, números de canal de faixas fonte são calculados com base nas bordas de patch calculadas na faixa de síntese. Preferivelmente, isto está, na verdade, ocorrendo antes da transposição, uma vez que isto é necessário como informações de controle para gerar o espectro transposto.
[0119] subseqüentemente, o pseudocódigo indicado na Figura 24a é discutido em conexão com o fluxograma na Figura 25b ilustrando uma implementação preferida da calculadora de borda de patch. Na etapa 2520, uma tabela de freqüência é calculada com base nos dados de entrada, tal como uma tabela de alta ou baixa resolução. Assim, o bloco 2520 corresponde ao bloco 2501 da Figura 25a. Em seguida, na etapa 2522, uma borda de patch de síntese alvo é determinada com base no fator de transposição. Particularmente, a borda de patch de síntese alvo corresponde ao resultado da multiplicação do valor de patch da Figura 2 4a e fTableLow (0), onde fTableLow(0) indica o primeiro canal ou posição da faixa de extensão de largura de banda, isto é, a primeira banda acima da freqüência de cruzamento, abaixo da qual os dados de áudio de entrada 2300 são dados com alta resolução. Na etapa 2524, é checado se a borda de patch de síntese alvo corresponde a uma entrada na tabela de baixa resolução dentro de uma faixa de alinhamento. Particularmente, uma faixa de alinhamento de 3 é preferida, como, por exemplo, indicado em 2525 na Figura 24a. Entretanto, outras faixas são úteis também, tais como faixas menores que ou iguais a 5. Quando for determinado na etapa 2 52 4 que o alvo corresponde a uma entrada na tabela de baixa resolução, então, esta entrada correspondente é utilizada como a nova borda de patch em vez da borda de patch alvo. Entretanto, quando for determinado que não existe entrada dentro da faixa de alinhamento, a etapa 2526 é aplicada, na qual o mesmo exame é feito com a tabela de alta resolução conforme também indicado em 2527 na Figura 24a. Quando for determinado na etapa 2526 que uma entrada de tabela dentro da faixa de alinhamento existe, então, esta entrada correspondente é utilizada como a nova borda de patch em vez da borda de patch de síntese alvo. Entretanto, quando for determinado na etapa 2526 que mesmo na tabela de alta resolução não existe valor dentro da faixa de alinhamento, então, a etapa 2528 é aplicada, na qual a borda de síntese alvo é utilizada sem nenhum alinhamento. Isto também é indicado na Figura 24a em 2529. Assim, a etapa 2528 pode ser vista como uma posição de recuo, de modo que esteja garantida caso o decodificador de extensão de largura de banda não permaneça em um laço, mas chegue a uma solução de qualquer maneira, mesmo quando há uma seleção muito específica e problemática das tabelas de freqüência e das faixas alvo.
[0120] Em relação ao pseudocódigo na Figura 24a, é delineado que as linhas de código em 2531 realizam um certo processamento para se certificar que todas as variáveis estão em uma faixa útil. Além disso, a verificação de que o alvo corresponde a uma entrada na tabela de baixa resolução dentro de uma faixa de alinhamento é realizada como o cálculo de uma diferença (linhas 2525, 2527) entre a borda de patch de síntese alvo calculada pelo produto indicado próximo ao bloco 2522 na Figura 25b e indicada nas linhas 2525, 2527 e uma entrada de tabela real definida pelo parâmetro sfbL para a linha 2525 ou sfbH para a linha 2527 (sfb = faixa de fator de escala) . Naturalmente, outras operações de verificação podem ser também realizadas.
[0121] Além disso, não é necessariamente o caso que uma correspondência dentro de uma faixa de alinhamento seja buscada onde a faixa de alinhamento seja pré-determinada. Em vez disso, uma busca na tabela pode ser realizada para encontrar a entrada de tabela com melhor correspondência, isto é, a entrada de tabela que é mais próxima do valor de freqüência alvo independente da diferença entre estes dois ser pequena ou grande.
[0122] Outras implementações estão relacionadas a uma busca na tabela, tal como fTableLow ou fTableHigh pela borda mais alta que não exceda os limites de largura de banda (fundamentais) do sinal gerado por HFR para um fator de transposição T. Em seguida, esta borda mais alta encontrada é utilizada como o limite de freqüência do sinal gerado por HFR de fator de transposição T. Nesta implementação, o cálculo do alvo indicado próximo à caixa 2522 na Figura 25b não é necessário.
[0123] A Figura 13 ilustra a adaptação das bordas de banda limitadoras de HFR, conforme descrito, por exemplo, em SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audiovisual objects - Part 3: Audio ] aos patches harmônicos em um codificador aprimorado por HFR. O limitador opera em faixas de freqüência possuindo uma resolução muito mais grosseira que as bandas de escala-fator, mas o princípio de operação é muito similar. No limitador, um valor-ganho médio para cada uma das bandas limitadoras é calculado. Os valores de ganho individuais, isto é, os valores de ganho de envelope calculados para cada uma das bandas de escala-fator, não são permitidos a exceder o valor de ganho médio de limitador por mais do que um certo fator multiplicador. O objetivo do limitador é suprimir grandes variações dos ganhos de banda de escala-fator dentro de cada uma das bandas limitadoras. Enquanto a adaptação das bandas geradas por transpositor às bandas de escala-fator garante pequenas variações da energia de intra-banda dentro de uma banda de escala- fator, a adaptação das bordas de banda limitadoras às bordas de banda de transpositor, de acordo com a presente invenção, controla as diferenças de energia de escala maior entre as bandas processadas por transpositor. A Figura 13(a) mostra os limites de freqüência dos sinais gerados por HFR de ordens de transposição T=2, 3 e 4. Os níveis de energia dos diferentes sinais transpostos podem ser substancialmente diferentes. A Figura 13(b) mostra as faixas de freqüência do limitador, as quais são tipicamente de largura constante em uma escala de freqüência logarítmica. As bordas de faixa de freqüência de transpositor são adicionadas como bordas limitadoras constantes e as bordas limitadoras restantes são recalculadas para manter as relações logarítmicas o mais próximo possível, conforme, por exemplo, ilustrado na Figura 13(c).
[0124] Realizações adicionais empregam um esquema de uso de patch misto, o qual é mostrado na Figura 21, onde o método de uso de patch misto dentro de um bloco de tempo é realizado. Para cobertura completa das diferentes regiões do espectro de HF, uma BWE compreende diversos patches. Na HBE, os patches mais altos requerem fatores de transposição altos dentro dos vocoders de fase, o que particularmente deteriora a qualidade perceptiva dos transientes.
[0125] Realizações assim geram os patches de ordem mais alta que ocupam as regiões espectrais superiores preferivelmente através do uso de patch por copy-up de SSB computacionalmente eficiente e os patches de ordem mais baixa cobrindo as regiões espectrais do meio, para os quais a preservação da estrutura harmônica é desejável, preferivelmente através do uso de patch de HBE. A mistura individual de métodos de uso de patch pode ser estática ao longo do tempo ou, preferivelmente, ser sinalizada no fluxo de bits.
[0126] Para a operação copy-up, as informações de baixa freqüência podem ser utilizadas conforme exibido na Figura 21. Alternativamente, os dados dos patches que foram gerados utilizando os métodos HBE podem ser utilizados conforme ilustrado na Figura 21. O último leva a uma estrutura tonal menos densa para patches mais altos. Além destes dois exemplos, cada combinação de copy-up e HBE é desejável.
[0127] As vantagens dos conceitos propostos são • Qualidade perceptiva de transientes melhorada • Complexidade computacional reduzida
[0128] A Figura 26 ilustra uma cadeia de processamento preferida para o propósito de extensão de largura de banda, onde diferentes operações de processamento podem ser realizadas dentro do processamento de sub-banda não-linear indicado nos blocos 1020a, 1020b. Em uma implementação, o processamento seletivo de banda do sinal processado no domínio do tempo, tal como o sinal de largura de banda estendida, é realizado no domínio do tempo em vez de no domínio de sub-banda, o qual existe antes do banco de filtro de síntese 2311.
[0129] A Figura 26 ilustra um aparelho para gerar um sinal de áudio de largura de banda estendida a partir de um sinal de entrada de baixa banda 1000 de acordo com uma realização adicional. O aparelho compreende um banco de filtro de análise 1010, um processador de sub-banda não linear voltado a sub-banda 1020a, 1020b, um ajustador de envelope subseqüentemente conectado 1030 ou, de uma forma mais geral, um processador de reconstrução de alta freqüência operando em parâmetros de reconstrução de alta freqüência como, por exemplo, a entrada na linha de parâmetro 1040. O ajustador de envelope, ou, de maneira geral, o processador de reconstrução de alta freqüência, processa sinais de sub-banda individuais para cada canal de sub-banda e insere os sinais de sub-banda processados para cada canal de sub-banda em um banco de filtro de síntese 1050. O banco de filtro de síntese 1050 recebe, em seus sinais de entrada de canal mais baixo, uma representação de sub-banda do sinal de decodificador de núcleo de baixa banda. Dependendo da implementação, a baixa banda pode também ser derivada a partir das saídas do banco de filtro de análise 1010 na Figura 26. Os sinais de sub-banda transpostos são alimentados a canais de banco de filtro mais altos do banco de filtro de síntese para realizar reconstrução de alta freqüência.
[0130] O banco de filtro 1050 finalmente emite um sinal de saída de transpositor que compreende extensões de largura de banda por fatores de transposição 2, 3, e 4, e o sinal emitido pelo bloco 1050 não é mais limitado por largura de banda à freqüência de cruzamento, isto é, à freqüência mais alta do sinal de codificador de núcleo correspondente à freqüência mais baixa das componentes de sinal geradas por SBR ou HFR. O banco de filtro de análise 1010 na Figura 26 corresponde ao banco de filtro de análise 2510 e o banco de filtro de síntese 1050 pode corresponder ao banco de filtro de síntese 2514 na Figura 25a. Particularmente, conforme discutido no contexto da Figura 27, o cálculo de banda fonte ilustrado no bloco 2507 na Figura 25a é realizado dentro de um processamento de sub-banda não linear 1020a, 1020b, utilizando as bordas de patch de síntese alinhadas e as bordas de banda limitadoras calculadas pelos blocos 2504 e 2505.
[0131] Em relação às tabelas de faixa de freqüência limitadoras, deve ser observado que as tabelas de faixa de freqüência limitadoras podem ser construídas para possuírem uma banda limitadora ao longo de toda a faixa de reconstrução ou aproximadamente 1,2, 2 ou 3 bandas por oitava, sinalizada por um elemento de fluxo de bits bs_limi-ter_bands conforme definido em ISO/IEC 14496-3: 2009, 4.6.18.3.2.3. A tabela de banda pode compreender bandas adicionais correspondentes aos patches geradores de alta freqüência. A tabela pode conter índices das sub-bandas de banco de filtro de síntese, onde o número do elemento é igual ao número de bandas mais um. Quando a transposição harmônica estiver ativa, é garantido que a calculadora de banda limitadora introduza bordas de banda limitadoras coincidindo com as bordas de patch definidas pela calculadora de borda de patch 2504. Adicionalmente, as bordas de banda limitadoras restantes são, então, calculadas entre estas bordas de banda limitadoras definidas de maneira “fixa” para as bordas de patch.
[0132] Na realização da Figura 26, o banco de filtro de análise realiza uma sobreamostragem em duas vezes e possui um certo espaçamento de sub-banda de análise 1060. O banco de filtro de síntese 1050 possui um espaçamento de sub-banda de síntese 1070 que é, nesta realização o dobro do tamanho do espaçamento de subbanda de análise, o que resulta em uma contribuição de transposição, conforme será discutido depois no contexto da Figura 27.
[0133] A Figura 27 ilustra uma implementação detalhada de uma realização preferida de um processador de sub-banda 1020a na Figura 26. O circuito ilustrado na Figura 27 recebe como entrada um sinal de sub-banda única 1080, o qual é processado em três “ramos”: O ramo superior 110a é para uma transposição por um fator de transposição de 2. O ramo no meio da Figura 27, indicado em 110b, é para uma transposição por um fator de transposição de 3, e o ramo mais baixo na Figura 27 é para uma transposição por um fator de transposição de 4 e é indicado pelo numeral de referência 110c. Entretanto, a transposição real obtida por cada elemento de processamento na Figura 27 é somente 1 (isto é, nenhuma transposição) para o ramo 110a. A transposição real obtida pelo elemento de processamento ilustrado na Figura 27 para o ramo médio 110b é igual a 1,5 e a transposição real para o ramo mais baixo 110c é igual a 2. Isto é indicado pelos números em colchetes à esquerda da Figura 27, onde os fatores de transposição T são indicados. As transposições de 1,5 e 2 representam uma primeira contribuição de transposição obtida ao possuir operações de dizimação nos ramos 110b, 110c e um esticamento de tempo pelo processador de soma de sobreposição. A segunda contribuição, isto é, a duplicação da transposição, é obtida pelo banco de filtro de síntese 105, o qual possui um espaçamento de sub-banda de síntese 1070 que é duas vezes o espaçamento de sub-banda de banco de filtro de análise. Portanto, uma vez que o banco de filtro de síntese possui duas vezes o espaçamento de sub-banda de síntese, quaisquer funcionalidades de dizimações não ocorrem no ramo 110a.
[0134] O ramo 110b, entretanto, possui uma funcionalidade de dizimação para se obter uma transposição de 1,5. Devido ao fato de que o banco de filtro de síntese possui duas vezes o espaçamento de sub-banda físico do banco de filtro de análise, um fator de transposição de 3 é obtido conforme indicado na Figura 27 à esquerda do extrator de blocos para o segundo ramo 110b.
[0135] Analogamente, o terceiro ramo possui uma funcionalidade de dizimação correspondente a um fator de transposição de 2, e a contribuição final do espaçamento de subbanda diferente no banco de filtro de análise e no banco de filtro de síntese finalmente corresponde a um fator de transposição de 4 do terceiro banco 110c.
[0136] Particularmente, cada ramo possui um extrator de blocos 120a, 120b, 120c e cada um destes extratores de bloco pode ser similar ao extrator de blocos 1800 da Figura 18. Além disso, cada ramo possui uma calculadora de fase 122a, 122b e 122c e a calculadora de fase pode ser similar à calculadora de fase 1804 da Figura 18. Além disso, cada ramo possui um ajustador de fase 124a, 124b, 124c e o ajustador de fase pode ser similar ao ajustador de fase 1806 da Figura 18. Além disso, cada ramo possui um janelador 126a, 126b, 126c, onde cada um destes janeladores pode ser similar ao janelador 1802 da Figura 18. Não obstante, os janeladores 126a, 126b, 126c podem também ser configurados para aplicar uma janela retangular com algum “preenchimento zero”. A transposição ou os sinais de patch de cada ramo 110a, 110b, 110c na realização da Figura 11, é inserida no somador 128, o qual soma a contribuição de cada ramo para o sinal de sub-banda atual para finalmente obter os chamados blocos de transposição na saída do somador 128. Em seguida, um procedimento de soma de sobreposição no somador de sobreposição 130 é realizado, e o somador de sobreposição 130 pode ser similar ao bloco de soma/sobreposição 1808 da Figura 18. O somador de sobreposição aplica um valor de avanço de soma de sobreposição de 2*e, onde e é o valor de avanço de sobreposição ou “valor de passo” dos extratores de bloco 120a, 120b, 120c, e o somador de sobreposição 130 emite o sinal transposto, o qual é, na realização da Figura 27, uma saída de sub-banda única para o canal k, isto é, para o canal de sub-banda atualmente observado. O processamento ilustrado na Figura 27 é realizado para cada subbanda de análise ou para um certo grupo de sub-bandas de análise e, conforme ilustrado na Figura 26, sinais de sub-banda transpostos são enviados ao banco de filtro de síntese 105 após serem processados pelo bloco 103 para finalmente obter o sinal de saída de transpositor ilustrado na Figura 26 na saída do bloco 105.
[0137] Em uma realização, o extrator de blocos 120a do primeiro ramo de transpositor 110a extrai 10 amostras de sub-banda e, subseqüentemente, uma conversão destas 10 amostras de QMF a coordenadas polares é realizada. Esta saída, gerada pelo ajustador de fase 124a, é, então, encaminhada ao janelador 126a, o qual estende a saída em zeros para o primeiro e o último valor do bloco, onde esta operação é equivalente a um janelamento (síntese) com uma janela retangular de comprimento 10. O extrator de blocos 120a no ramo 110a não realiza uma dizimação. Portanto, as amostras extraídas pelo extrator de blocos são mapeadas em um bloco extraído no mesmo espaçamento de amostra no qual foram extraídas.
[0138] Entretanto, isto é diferente para os ramos 110b e 110c. O extrator de blocos 120b preferivelmente extrai um bloco de 8 amostras de sub-banda e distribui estas 8 amostras de sub-banda no bloco extraído em um espaçamento de amostra de sub-banda diferente. As entradas de amostra de sub-banda não inteiras para o bloco extraído são obtidas por uma interpolação, e as amostras QMF assim obtidas, com “as amostras interpoladas, são convertidas a coordenadas polares e são processadas pelo ajustador de fase. Em seguida, novamente, o janelamento no janelador 126b é realizado para estender a saída de bloco pelo ajustador de fase 124b por zeros para as primeiras duas amostras e as últimas duas amostras, cuja operação é equivalente a um janelamento (síntese) com uma janela retangular de comprimento 8.
[0139] O extrator de blocos 120c é configurado para extrair um bloco com uma extensão de tempo de 6 amostras de subbanda e realiza uma dizimação de um fator de dizimação de 2, realiza um conversão das amostras QMF em coordenadas polares e novamente realiza uma operação no ajustador de fase 124b, e a saída é novamente estendida por zeros, porém, agora para as três primeiras amostras de sub-banda e as três últimas amostras de subbanda. Esta operação é equivalente a um janelamento (síntese) com uma janela retangular de comprimento 6.
[0140] As saídas de transposição de cada ramo são, então, somadas para formar a saída QMF combinada pelo somador 128, e as saídas QMF combinadas são finalmente sobrepostas utilizando soma de sobreposição no bloco 130, onde o valor de avanço ou de passo de soma de sobreposição é duas vezes o valor de passo dos extratores de bloco 120a, 120b, 120c conforme discutido anteriormente.
[0141] A Figura 27 adicionalmente ilustra a funcionalidade realizada pela calculadora de banda fonte 2507 da Figura 25a, quando é considerado que o numeral de referência 108 ilustra os sinais de sub-banda de análise disponíveis para um uso de patch, isto é, os sinais indicados em 1080 na Figura 26, os quais são emitidos pelo banco de filtro de análise 1010 da Figura 26. Uma seleção da sub-banda correta pelos sinais de sub-banda de análise ou, na outra realização relacionada ao transpositor DFT, a aplicação da janela de freqüência de análise correta é realizada pelos extratores de bloco 120a, 120b, 120c. Para esta finalidade, as bordas de patch indicando o primeiro sinal de sub-banda, o último sinal de sub-banda e os sinais de sub-banda no meio para cada patch são providas ao extrator de blocos para cada ramo de transposição. O primeiro ramo finalmente resulta em um fator de transposição de T=2 recebe, com seu extrator de blocos 120a, todos os índices de sub-banda entre xOverQmf(0) e xOverOmf(1), e o extrator de blocos 120a, então, extrai um bloco a partir da subbanda de análise assim selecionada. Deve ser observado que as bordas de patch são dadas como um índice de canal da faixa de síntese indicada por k, e as bandas de análise são indicadas por n em relação a seus canais de sub-banda. Assim, uma vez que n é calculado ao dividir 2k por T, os números de canal da banda de análise n, portanto, são iguais aos números de canais da faixa de síntese devido ao duplo espaçamento de freqüência do banco de filtro de síntese conforme discutido no contexto da Figura 26. Isto é indicado acima do bloco 120a para o primeiro extrator de blocos 120a ou, de maneira geral, para o primeiro ramo transpositor 110a. Em seguida, para o segundo ramo de uso de patch 110b, o extrator de blocos recebe todos os índices de canal de faixa de síntese entre xOverQmf(1) e xOverQmf(2). Particularmente, os índices de canal de faixa fonte, a partir dos quais o extrator de blocos deve extrair os blocos para processamento adicional, são calculados a partir dos índices de canal de faixa de síntese dados pelas bordas de patch determinadas multiplicando k pelo fator 2/3. Em seguida, a parte inteira deste cálculo é tomada como o canal de análise número n, a partir do qual o extrator de blocos, então, extrai o bloco a ser adicionalmente processado pelos elementos 124b, 126b.
[0142] Para o terceiro ramo 110c, o extrator de blocos 120c novamente recebe as bordas de patch e realiza uma extração de bloco a partir das sub-bandas correspondentes às bandas de síntese definidas por xOverQmf(2) até xOverQmf(3). Os números de análise n são calculados por 2 multiplicado por k, e esta é a regra de cálculo para calcular os números de canal de análise a partir dos números de canal de síntese. Neste contexto, deve ser delineado que xOverQmf corresponde ao xOverBin da Figura 24a, embora a Figura 24a corresponda ao patcher com base em DFT, enquanto que xOverQmf corresponde ao patcher com base em QMF. As regras de cálculo para determinar xOverQmf(i) são determinadas da mesma maneira que o ilustrado na Figura 24a, porém o fator fftSizeSyn/128 não é exigido para calcular xOverQmf.
[0143] O procedimento para determinar as bordas de patch para calcular as faixas de análise para a realização da Figura 27 é também ilustrado na Figura 24b. Na etapa 2600, as bordas de patch para os patches correspondentes aos fatores de transposição 2, 3, 4 e, opcionalmente, ainda mais, são calculadas no contexto da Figura 24a ou da Figura 25a. Então, a janela no domínio da freqüência da faixa fonte para o patcher DFT ou as sub-bandas de faixa fonte para o patcher QMF são calculadas pelas equações discutidas no contexto dos blocos 120a, 120b, 120c, os quais são também ilustrados à direita do bloco 2602. Em seguida, um uso de patch é realizado ao calcular o sinal transposto e mapear o sinal transposto às altas freqüências conforme indicado no bloco 2604, e o cálculo do sinal transposto é particularmente ilustrado no procedimento da Figura 27, onde o sinal transposto emitido pelo bloco de soma de sobreposição 130 corresponde ao resultado do uso de patch gerado pelo procedimento no bloco 2604 da Figura 24b.
[0144] Uma realização compreende um método para decodificar um sinal de áudio utilizando uma transposição harmônica com base em bloco de sub-banda, compreendendo a filtragem de um sinal decodificado de núcleo através de um banco de filtro de análise de banda M para obter um conjunto de sinais de sub-banda; sintetizar um subconjunto dos ditos sinais de subbanda por meio dos bancos de filtro de síntese sub-amostrados possuindo um número menor de sub-bandas, para obter sinais de faixa fonte sub-amostrados.
[0145] Uma realização está relacionada a um método para alinhar as bordas de banda espectrais dos sinais gerados por HFR a bordas espectrais utilizadas em um processo paramétrico.
[0146] Uma realização está relacionada a um método para alinhar as bordas espectrais dos sinais gerados por HFR às bordas espectrais da tabela de freqüência de ajuste de envelope compreendendo: a busca pela borda mais alta na tabela de freqüência de ajuste de envelope que não exceda os limites de largura de banda fundamentais do sinal gerado por HFR de fator de transposição T; e o uso da borda mais alta encontrada como o limite de freqüência do sinal gerado por HFR de fator de transposição T.
[0147] Uma realização está relacionada a um método para alinhar as bordas espectrais da ferramenta às bordas espectrais dos sinais grados por HFR compreendendo: somar as bordas de freqüência dos sinais gerados por HFR às bordas de tabela utilizadas ao criar as bordas de faixa de freqüência utilizadas pela ferramenta limitadora; e forçar o limitador a utilizar as bordas de freqüência como bordas constantes e ajustar as bordas restantes apropriadamente.
[0148] Uma realização está relacionada a uma transposição combinada de um sinal de áudio compreendendo diversas ordens de transposição inteiras em um domínio de banco de filtro de baixa resolução onde a operação de transposição é realizada em blocos de tempo de sinais de sub-banda.
[0149] Uma realização adicional está relacionada a uma transposição combinada, onde ordens de transposição maiores que 2 são incorporadas em um ambiente de transposição de ordem 2.
[0150] Uma realização adicional está relacionada a uma transposição combinada, onde ordens de transposição maiores que 3 são incorporadas em um ambiente de transposição de ordem 3, enquanto que ordens de transposição menores que 4 são realizadas separadamente.
[0151] Uma realização adicional está relacionada a uma transposição combinada, onde as ordens de transposição (por exemplo, ordens de transposição maiores que 2) são criadas pela replicação de ordens de transposição previamente calculadas (isto é, ordens especialmente menores) incluindo a largura de banda codificada de núcleo. Cada combinação possível de ordens de transposição disponíveis e largura de banda de núcleo é possível sem restrições.
[0152] Uma realização está relacionada à redução de complexidade computacional devido ao número reduzido de bancos de filtro de análise que são exigidos para transposição.
[0153] Uma realização está relacionada a um aparelho para gerar um sinal de largura de banda estendida a partir de um sinal de áudio de entrada, compreendendo: um patcher para uso de patch de um sinal de áudio de entrada para obter um primeiro sinal com patch e um segundo sinal com patch, o segundo sinal com patch possuindo uma diferente freqüência de patch comparado com o primeiro sinal com patch, em que o primeiro sinal com patch é gerado utilizando um primeiro algoritmo de uso de patch, e o segundo sinal com patch é gerado utilizando um segundo algoritmo de uso de patch; e um combinador para combinar o primeiro sinal com patch e o segundo sinal com patch para obter o sinal de largura de banda estendida.
[0154] Uma realização adicional está relacionada a este aparelho, em que o primeiro algoritmo de uso de patch é um algoritmo de uso de patch harmônico, e o segundo algoritmo de uso de patch é um algoritmo de uso de patch não harmônico.
[0155] Uma realização adicional está relacionada a um aparelho anterior, no qual a primeira freqüência de uso de patch é menor que a segunda freqüência de uso de patch ou vice versa.
[0156] Uma realização adicional está relacionada a um aparelho anterior, em que o sinal de entrada compreende uma informação de uso de patch; e em que o patcher é configurado para ser controlado pela informação de uso de patch extraída a partir do sinal de entrada para variar o primeiro algoritmo de uso de patch ou o segundo algoritmo de uso de patch de acordo com a informação de uso de patch.
[0157] Uma realização adicional está relacionada a um aparelho anterior, em que o patcher é operativo para realizar patch em subseqüentes blocos de amostras de sinal de áudio, e em que o patcher é configurado para aplicar o primeiro algoritmo de uso de patch e o segundo algoritmo de uso de patch ao mesmo bloco de amostras de áudio.
[0158] Uma realização adicional está relacionada a um aparelho anterior, em que um patcher compreende, em ordens arbitrárias, um dizimador controlado por um fator de extensão de largura de banda, um banco de filtro, e um esticador para um sinal de sub-banda de banco de filtro.
[0159] Uma realização adicional está relacionada a um aparelho anterior, em que um esticador compreende um extrator de blocos para extrair um número de blocos sobrepostos de acordo com um valor de avanço de extração; um ajustador de fase ou janelador para ajustar valores de amostragem de sub-banda em cada bloco com base em uma função janela ou em uma correção de fase; e um somador de sobreposição para realizar um processamento de soma de sobreposição dos blocos em janela e de fase ajustada utilizando um valor de avanço de sobreposição maior que o valor de avanço de extração.
[0160] Uma realização adicional está relacionada a um aparelho para estender a largura de banda de um sinal de áudio compreendendo: um banco de filtro para filtrar o sinal de áudio para obter sinais de sub-banda de amostragem reduzida; uma pluralidade de diferentes processadores de sub-banda para processar diferentes sinais de sub-banda em maneiras diferentes, os processadores de sub-banda realizando diferentes operações de esticamento de tempo de sinal de sub-banda utilizando diferentes fatores de esticamento; e um mesclador para mesclar sub-bandas processadas emitidas pela pluralidade de diferentes processadores de sub-banda para obter um sinal de áudio de largura de banda estendida.
[0161] Uma realização adicional está relacionada a um aparelho para reduzir a amostragem de um sinal de áudio, compreendo: um modulador; um interpolador utilizando um fator de interpolação; um filtro passa-baixa complexo; e um dizimador utilizando um fator de dizimação, em que o fator de dizimação é maior que o fator de interpolação.
[0162] Uma realização está relacionada a um aparelho para reduzir a amostragem de um sinal de áudio, compreendendo: um primeiro banco de filtro para gerar uma pluralidade de sinais de sub-banda a partir de sinal de áudio, em que uma taxa de amostragem do sinal de sub-banda é menor que uma taxa de amostragem do sinal de áudio; pelo menos um banco de filtro de síntese seguido de um banco de filtro de análise para realizar uma conversão de taxa de amostragem, o banco de filtro de síntese possuindo um número de canais diferente de um número de canais do banco de filtro de análise; um processador de esticamento de tempo para processar o sinal com taxa de amostragem convertida; e um combinador para combinar o sinal com tempo esticado e um sinal de baixa banda ou um diferente sinal com tempo esticado.
[0163] Uma realização adicional está relacionada a um aparelho para reduzir a amostragem de um sinal de áudio por um fator de redução não inteiro, compreendendo: um filtro digital; um interpolador possuindo um fator de interpolação; um elemento polifásico possuindo taps pares e ímpares; e um dizimador possuindo um fator de dizimação maior que o fator de interpolação, o fator de dizimação e o fator de interpolação sendo selecionados de maneira que uma relação entre o fator de interpolação e o fator de dizimação seja não inteira.
[0164] Uma realização está relacionada a um aparelho para processar um sinal de áudio, compreendendo: um decodificador de núcleo possuindo um tamanho de transformada de síntese sendo menor que um tamanho de transformada nominal por um fator, de maneira que um sinal de saída seja gerado pelo decodificador de núcleo possuindo uma taxa de amostragem menor que uma taxa de amostragem correspondente ao tamanho de transformada nominal; e um pós-processador possuindo um ou mais bancos de filtro, um ou mais esticadores de tempo e um mesclador, em que um número de canais de banco de filtro dos um ou mais bancos de filtro é reduzido comparado com um número conforme determinado pelo tamanho de transformada nominal.
[0165] Uma realização adicional está relacionada a um aparelho para processar um sinal de baixa banda, compreendendo: um gerador de patch para gerar múltiplos patches utilizando o sinal de áudio de baixa banda; um ajustador de envelope para ajustar um envelope do sinal utilizando fatores de escala dados para faixas de fator de escala adjacentes possuindo bordas de faixa de fator de escala, em que o gerador de patch é configurado para realizar os múltiplos patches, de modo que uma borda entre os patches adjacentes coincida com uma borda entre faixas de fator de escala na escala de freqüência.
[0166] Uma realização está relacionada a um aparelho para processar um sinal de áudio de baixa banda, compreendendo: um gerador de patch para gerar múltiplos patches utilizando o sinal de áudio de baixa banda; e um limitador de ajuste de envelope para limitar valores de ajuste de envelope para um sinal limitando em bandas adjacentes possuindo bordas de banda limitadoras, em que o gerador de patch é configurado para realizar os múltiplos patches de modo que uma borda entre patches adjacentes coincida com uma borda entre bandas limitadoras adjacentes em uma escala de freqüência.
[0167] O processamento inventivo é útil para aprimorar codecs de áudio que dependam de um esquema de extensão de largura de banda. Especialmente, se uma qualidade perceptiva ideal em qualquer dada taxa de dados for altamente importante e, ao mesmo tempo, o poder de processamento for um recurso limitado.
[0168] A maioria das aplicações proeminentes são decodificadores de áudio, os quais são freqüentemente implementados em dispositivos portáteis e, assim, operam em uma fonte de alimentação a bateria.
[0169] O sinal de áudio codificado inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão, tal como um meio de transmissão sem fio ou um meio de transmissão com fio, tal como a Internet.
[0170] Dependendo de certas exigências de implementação, realizações da invenção podem ser implementadas em hardware ou software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma memória ROM, uma memória PROM, uma memória EPROM, uma memória EEPROM ou uma memória FLASH, possuindo sinais de controle legíveis eletronicamente armazenados no mesmo, os quais cooperem (ou sejam capazes de cooperar) com um sistema de computador programável de maneira que o respectivo método seja realizado.
[0171] Algumas realizações de acordo com a invenção compreendem uma portadora de dados possuindo sinais de controle legíveis eletronicamente, os quais são capazes de cooperar com um sistema computador programável, de maneira que um dos métodos descritos neste documento seja realizado.
[0172] De modo geral, as realizações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto de programa de computador for executado em um computador. O código de programa pode, por exemplo, ser armazenado em uma portadora legível em máquina.
[0173] Outras realizações compreendem o programa de computador para realizar um dos métodos descritos neste documento, armazenado em uma portadora legível em máquina.
[0174] Em outras palavras, uma realização do método inventivo é, portanto, um programa de computador possuindo um código de programa para realizar um dos métodos descritos neste documento, quando o programa de computador for executado em um computador.
[0175] Uma realização adicional dos métodos inventivos é, portanto, uma portadora de dados (ou um meio de armazenamento digital, ou um meio legível por computador) compreendendo, gravado na mesma, o programa de computador para realizar um dos métodos descritos neste documento.
[0176] Uma realização adicional do método inventivo é, portanto, um fluxo de dados ou uma seqüência de sinais representando o programa de computador para realizar um dos métodos descritos neste documento. O fluxo de dados ou a seqüência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[0177] Uma realização adicional compreende meios de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos neste documento.
[0178] Uma realização adicional compreende um computador possuindo instalado no mesmo o programa de computador para realizar um dos métodos descritos neste documento.
[0179] Em algumas realizações, um dispositivo lógico programável (por exemplo, um field programmable gate array - FPGA) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos neste documento. Em algumas realizações, um FPGA pode cooperar com um microprocessador para realizar um dos métodos descritos neste documento. De maneira geral, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[0180] As realizações descritas acima são meramente ilustrativas para os princípios da presente invenção. É entendido que modificações e variações das disposições e os detalhes descritos neste documento se tornarão aparentes a outros técnicos no assunto. É a intenção, portanto, ser limitada somente pelo escopo das iminentes reivindicações da patente, e não pelos detalhes específicos apresentados por meio da descrição e explicação das realizações neste documento.
[0181] LITERATURA
[0182] M. Dietz, L. Liljeryd, K. Kjorling and O. Kunz, “Spectral Band Replication, a novel approach in audio coding, ” in 112th AES Convention, Munich, May 2002.
[0183] S. Meltzer, R. Bohm and F. Henn, “ SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DM)),” in 112th AES Convention, Munich, May 2002.
[0184] T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, “ Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,” in 112th AES Convention, Munich, May 2002.
[0185] International Standard ISO/IEC 14496-3:2001/FPDAM 1, “Bandwidth Extension,” ISO/IEC, 2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al
[0186] E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002.
[0187] R. M. Aarts, E. Larsen, and O. Ouweltjes. A unified approach to low- and high frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003.
[0188] K. Kãyhko. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001.
[0189] E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004.
[0190] E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, Maio de 2002.
[0191] J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU- 21(3), June 1973.
[0192] Pedido de patente Americano US 08/951,029, Ohmori , et al. Audio band width extending system and method
[0193] Patente Americana US 6895375, Malah, de & Cox, R. V.: System for bandwidth extension of Narrow-band speech
[0194] Frederik Nagel, Sascha Disch, “ A harmonic bandwidth extension method for audio codecs,” ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009
[0195] Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, “ A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs, ” 126th AES Convention , Munich, Germany, May 2009
[0196] M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995.”, Robel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html
[0197] Laroche L., Dolson M.: “Improved phase vocoder timescale modification of audio”, IEEE Trans. Speech and Audio Processing, vol. 7, n° 3, PP. 323--332,
[0198] United States Patent 6549884 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting
[0199] Herre, J.; Faller, C.; Ertel, C.; Hilpert, J.; Holzer, A.; Spenger, C, “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio,” 116th Conv. Aud. Eng. Soc., May 2004
[0200] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jérémie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates, ICASSP 2009, April 19-24, 2009, Taipei, Taiwan
[0201] Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jérémie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126th AES Convention, May 7, 2009, München

Claims (10)

1. APARELHO PARA PROCESSAR UM SINAL DE ÁUDIO para gerar um sinal de largura de banda estendido possuindo uma parte de alta frequência (102) e uma parte de baixa frequência (104) utilizando dados paramétricos (2302) para a parte de alta frequência (102), os dados paramétricos relacionados às faixas de frequência (100, 101) da parte de alta frequência (102), caracterizado por compreender: uma calculadora de borda de patch (2302) para calcular uma borda de patch (1001c, 1002c, 1002d, 1003c, 1003b) de uma pluralidade de bordas de patch de maneira que uma borda de patch coincida com uma borda de faixa de frequência das faixas de frequência (101, 100) da parte de alta frequência (102); e um patcher (2312) para gerar um sinal com patch utilizando o sinal de áudio (2300) e a borda de patch (1001c, 1002c, 1002b, 1003c, 1003b), em que as bordas de patch são relacionadas à parte de alta frequência (102) do sinal de largura de banda estendido. em que a calculadora de borda de patch (2302) é configurada para: o cálculo (2520) de uma tabela de frequência definindo as faixas de frequência da parte de alta frequência (102) utilizando os dados paramétricos ou dados de entrada de configuração adicionais; determinar (2522) uma borda de patch de síntese alvo diferente da borda de patch utilizando pelo menos um fator de transposição; buscar (2524) , na tabela de frequência, por uma faixa de frequência correspondente possuindo uma borda correspondente coincidindo com a borda de patch de síntese alvo dentro de uma faixa de correspondência pré-determinada, onde a faixa de correspondência pré-determinada é definida a um valor menor que ou igual a cinco faixas QMF (“Quadrature Mirror Filterbank ”) ou 40 posições de frequência da parte de alta frequência (102), ou buscar por uma faixa de frequência possuindo uma borda de faixa de frequência que esteja mais próxima da borda de patch de síntese alvo; e selecionar (2525, 2527) como a borda do patch, a borda correspondente coincidindo com a borda de patch de síntese alvo dentro da faixa de correspondência predeterminada ou a borda da banda de frequência sendo mais próxima da borda de patch de síntese alvo encontrada na busca (2524).
2. APARELHO, de acordo com a reivindicação 1, caracterizado por a calculadora de borda de patch (2302) ser configurada para calcular bordas de patch para três diferentes fatores de transposição, de maneira que uma borda de patch coincida com uma borda de faixa de frequência (100, 101) das faixas de frequência da parte de alta frequência, e em que o patcher (2312) é configurado para gerar o sinal com patch utilizando os três fatores de transposição diferentes (2308) de maneira que uma borda entre patches adjacentes coincida com uma borda entre duas bandas de frequência adjacentes (100, 101) .
3. APARELHO, de acordo com qualquer uma das reivindicações anteriores, em que os dados paramétricos são caracterizados por compreender um valor de dados de envelope espectral, em que, para cada faixa de frequência, um valor de dados de envelope espectral separado é dado, em que o aparelho adicionalmente compreende um reconstrutor de alta frequência (2510, 1030) para ajustar o envelope espectral de cada banda do sinal com patch utilizando o valor de dados de envelope espectral para esta banda.
4. APARELHO, de acordo com qualquer uma das reivindicações anteriores, caracterizado por a calculadora de borda de patch (2302) ser configurada para buscar pela borda mais alta na tabela de frequência que não exceda um limite de largura de banda de um sinal regenerado de alta frequência para um fator de transposição, e utilizar a borda mais alta encontrada como a borda de patch.
5. APARELHO, de acordo com a reivindicação 4, caracterizado por a calculadora de borda de patch (2302) ser configurada para receber, para cada fator de transposição da pluralidade de diferentes fatores de transposição, uma borda de patch alvo diferente.
6. APARELHO, de acordo com qualquer uma das reivindicações anteriores, adicionalmente caracterizado por compreender uma ferramenta limitadora (2505, 2510) para calcular bandas limitadoras utilizadas para limitar valores de ganho para ajustar os sinais com patch, o aparelho adicionalmente compreendendo uma calculadora de banda limitadora configurada para definir uma borda limitadora de modo que pelo menos uma borda de patch determinada pela calculadora de borda de patch (2302) seja definida como uma borda limitadora também.
7. APARELHO, de acordo com a reivindicação 6, caracterizado por uma calculadora de banda limitadora (2505) ser configurada para calcular bordas limitadoras adicionais de maneira que as bordas limitadoras adicionais coincidam com bordas de banda de frequência das bandas de frequência da parte de alta frequência (102).
8. APARELHO, de acordo com uma das reivindicações anteriores, em que o patcher (2312) é configurado para gerar múltiplos patches utilizando diferentes fatores de transposição (2308), em que a calculadora de borda de patch (2302) é configurada para calcular as bordas de patch de cada patch dos múltiplos patches de maneira que as bordas de patch coincidam com diferentes bordas de faixa de frequência das faixas de frequência da parte de alta frequência (102), em que o aparelho adicionalmente é caracterizado por compreender um ajustador de envelope (2510) para ajustar um envelope da parte de alta frequência (102) após o uso de patch ou para ajustar a parte de alta frequência antes do uso de patch utilizando fatores de escala incluídos nos dados paramétricos dados para bandas de fator de escala.
9. MÉTODO DE PROCESSAR UM SINAL DE ÁUDIO PARA GERAR UM SINAL DE LARGURA DE BANDA ESTENDIDO POSSUINDO UMA PARTE DE ALTA FREQUÊNCIA (102) E UMA PARTE DE BAIXA FREQUÊNCIA (104) UTILIZANDO DADOS PARAMÉTRICOS (2302) PARA A PARTE DE ALTA FREQUÊNCIA (102), OS DADOS PARAMÉTRICOS RELACIONADOS ÀS FAIXAS DE FREQUÊNCIA (100, 101) DA PARTE DE ALTA FREQUÊNCIA (102), caracterizado por compreender: cálculo (2302) de uma borda de patch (1001c, 1002c, 1002d, 1003c, 1003b), de maneira que uma borda de patch de uma pluralidade de bordas de patch coincida com uma borda de faixa de frequência das faixas de frequência (101, 100) da parte de alta frequência (102); e geração (2312) de um sinal com patch utilizando o sinal de áudio (2300) e a borda de patch (1001c, 1002c, 1002b, 1003c, 1003b) , em que as bordas de patch são relacionadas à parte de alta frequência (102) do sinal de largura de banda estendido, em que a etapa de calcular (2302) uma borda de patch compreende: cálculo (2520) de uma tabela de frequência definindo as faixas de frequência da parte de alta frequência (102) utilizando os dados paramétricos ou dados de entrada de configuração adicionais; determinar (2522) uma borda de patch de síntese alvo diferente da borda de patch usando pelo menos um fator de transposição;; busca (2524), na tabela de frequência, por uma faixa de frequência correspondente possuindo uma borda correspondente coincidindo com a borda de patch de síntese alvo dentro de uma faixa de correspondência pré-determinada, onde a faixa de correspondência pré-determinada é definida a um valor menor que ou igual a cinco faixas QMF (“Quadrature Mirror Filterbank ”) ou 40 posições de frequência da parte de alta frequência (102),ou procurando por uma faixa de frequência possuindo uma borda de faixa de frequência que esteja mais próxima da borda de patch de síntese alvo; e selecionar (2525, 2527), como a borda de patch, a borda correspondente coincidindo com a borda de patch de síntese alvo dentro da faixa de correspondência predeterminada ou a borda da banda de frequência sendo mais próxima da borda de patch de síntese alvo encontrada na busca (2524).
10. MEIO DE ARMAZENAMENTO DIGITAL, caracterizado por conter um conjunto de instruções que, quando executadas, efetuam o método definido na reivindicação 9.
BR122021014312-9A 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch BR122021014312B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US31212710P 2010-03-09 2010-03-09
US61/312,127 2010-03-09
PCT/EP2011/053313 WO2011110499A1 (en) 2010-03-09 2011-03-04 Apparatus and method for processing an audio signal using patch border alignment

Publications (1)

Publication Number Publication Date
BR122021014312B1 true BR122021014312B1 (pt) 2022-08-16

Family

ID=43987731

Family Applications (5)

Application Number Title Priority Date Filing Date
BR122021014312-9A BR122021014312B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
BR122021014305-6A BR122021014305B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
BR122021019082-8A BR122021019082B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata
BR112012022740-8A BR112012022740B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
BR112012022574-0A BR112012022574B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Family Applications After (4)

Application Number Title Priority Date Filing Date
BR122021014305-6A BR122021014305B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
BR122021019082-8A BR122021019082B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata
BR112012022740-8A BR112012022740B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
BR112012022574-0A BR112012022574B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Country Status (18)

Country Link
US (7) US9305557B2 (pt)
EP (4) EP2545553B1 (pt)
JP (2) JP5588025B2 (pt)
KR (2) KR101414736B1 (pt)
CN (2) CN103038819B (pt)
AR (2) AR080477A1 (pt)
AU (2) AU2011226211B2 (pt)
BR (5) BR122021014312B1 (pt)
CA (2) CA2792452C (pt)
ES (2) ES2935637T3 (pt)
HK (1) HK1181180A1 (pt)
MX (2) MX2012010416A (pt)
MY (1) MY154204A (pt)
PL (2) PL3570278T3 (pt)
RU (1) RU2586846C2 (pt)
SG (1) SG183967A1 (pt)
TW (2) TWI446337B (pt)
WO (2) WO2011110499A1 (pt)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9026236B2 (en) * 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
CA2792452C (en) * 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
EP2581905B1 (en) 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CA3220202A1 (en) 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
TWI478548B (zh) * 2012-05-09 2015-03-21 Univ Nat Pingtung Sci & Tech 對等網路串流傳輸方法
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103915104B (zh) * 2012-12-31 2017-07-21 华为技术有限公司 信号带宽扩展方法和用户设备
WO2014129233A1 (ja) * 2013-02-22 2014-08-28 三菱電機株式会社 音声強調装置
WO2014142576A1 (ko) * 2013-03-14 2014-09-18 엘지전자 주식회사 무선 통신 시스템에서 단말 간 직접 통신을 이용한 신호 수신 방법
CN105393456B (zh) * 2013-03-26 2018-06-22 拉克伦·保罗·巴拉特 虚拟采样率增加的音频滤波
US9305031B2 (en) 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
TWI548190B (zh) * 2013-08-12 2016-09-01 中心微電子德累斯頓股份公司 根據控制法則來控制功率轉換器的功率級之控制器及方法
WO2015027327A1 (en) * 2013-08-28 2015-03-05 Mixgenius Inc. System and method for performing automatic audio production using semantic data
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
WO2015041477A1 (ko) 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10204630B2 (en) 2013-10-22 2019-02-12 Electronics And Telecommunications Research Instit Ute Method for generating filter for audio signal and parameterizing device therefor
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
BR112016014892B1 (pt) 2013-12-23 2022-05-03 Gcoa Co., Ltd. Método e aparelho para processamento de sinal de áudio
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
EP4294055A1 (en) 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
CN108966111B (zh) 2014-04-02 2021-10-26 韦勒斯标准与技术协会公司 音频信号处理方法和装置
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
KR101523559B1 (ko) * 2014-11-24 2015-05-28 가락전자 주식회사 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법
TWI732403B (zh) * 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
KR101661713B1 (ko) * 2015-05-28 2016-10-04 제주대학교 산학협력단 파라메트릭 어레이 응용을 위한 변조 방법 및 장치
US9514766B1 (en) * 2015-07-08 2016-12-06 Continental Automotive Systems, Inc. Computationally efficient data rate mismatch compensation for telephony clocks
JP6797187B2 (ja) * 2015-08-25 2020-12-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・デコーダおよびデコード方法
BR112018005391B1 (pt) * 2015-09-22 2023-11-21 Koninklijke Philips N.V Aparelho para processamento de sinais de áudio, método de processamento de sinais de áudio, e dispositivo
CN109074813B (zh) 2015-09-25 2020-04-03 杜比实验室特许公司 处理高清晰度音频数据
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10848363B2 (en) 2017-11-09 2020-11-24 Qualcomm Incorporated Frequency division multiplexing for mixed numerology
BR112020012654A2 (pt) * 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
WO2019207036A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4152192B2 (ja) 2001-04-13 2008-09-17 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の高品質タイムスケーリング及びピッチスケーリング
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7372907B2 (en) * 2003-06-09 2008-05-13 Northrop Grumman Corporation Efficient and flexible oversampled filterbank with near perfect reconstruction constraint
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
US7949057B2 (en) * 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
JP4254479B2 (ja) 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
ES2791001T3 (es) * 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
CN1668058B (zh) * 2005-02-21 2011-06-15 南望信息产业集团有限公司 基于递归最小平方差的子带回声抵消器
WO2006108543A1 (en) 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
WO2007069150A1 (en) 2005-12-13 2007-06-21 Nxp B.V. Device for and method of processing an audio data stream
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
FR2910743B1 (fr) * 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
AU2008339211B2 (en) * 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2296145B1 (en) 2008-03-10 2019-05-22 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
US9147902B2 (en) 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
RU2443028C2 (ru) 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
CA2730200C (en) 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
EP2169665B1 (en) 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
US8831958B2 (en) 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
PL4231291T3 (pl) * 2008-12-15 2024-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
EP3723090B1 (en) * 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
CA2792452C (en) * 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio

Also Published As

Publication number Publication date
US20180366130A1 (en) 2018-12-20
US20170194011A1 (en) 2017-07-06
CA2792450C (en) 2016-05-31
CA2792452A1 (en) 2011-09-15
AU2011226211A1 (en) 2012-10-18
BR112012022740A2 (pt) 2020-10-13
JP2013525824A (ja) 2013-06-20
US20200279571A1 (en) 2020-09-03
PL3570278T3 (pl) 2023-03-20
MX2012010416A (es) 2012-11-23
MY154204A (en) 2015-05-15
KR20120131206A (ko) 2012-12-04
EP2545553A1 (en) 2013-01-16
TWI446337B (zh) 2014-07-21
TW201207841A (en) 2012-02-16
CN103038819A (zh) 2013-04-10
SG183967A1 (en) 2012-10-30
RU2586846C2 (ru) 2016-06-10
AU2011226212A1 (en) 2012-10-18
US9792915B2 (en) 2017-10-17
BR122021019082B1 (pt) 2022-07-26
US11495236B2 (en) 2022-11-08
AU2011226211B2 (en) 2014-01-09
EP2545548A1 (en) 2013-01-16
BR122021014305B1 (pt) 2022-07-05
HK1181180A1 (en) 2013-11-01
US20130051571A1 (en) 2013-02-28
KR20120139784A (ko) 2012-12-27
US10032458B2 (en) 2018-07-24
BR112012022574A2 (pt) 2021-09-21
KR101414736B1 (ko) 2014-08-06
CN102939628B (zh) 2015-05-13
US11894002B2 (en) 2024-02-06
JP2013521538A (ja) 2013-06-10
AR080477A1 (es) 2012-04-11
US9305557B2 (en) 2016-04-05
BR112012022740B1 (pt) 2021-12-21
CN103038819B (zh) 2015-02-18
JP5523589B2 (ja) 2014-06-18
AU2011226212B2 (en) 2014-03-27
EP2545553B1 (en) 2014-07-30
EP4148729A1 (en) 2023-03-15
US20130090933A1 (en) 2013-04-11
US20240135939A1 (en) 2024-04-25
KR101425154B1 (ko) 2014-08-13
EP3570278A1 (en) 2019-11-20
CN102939628A (zh) 2013-02-20
RU2012142732A (ru) 2014-05-27
CA2792450A1 (en) 2011-09-15
TW201207842A (en) 2012-02-16
US20230074883A1 (en) 2023-03-09
BR112012022574B1 (pt) 2022-05-17
MX2012010415A (es) 2012-10-03
ES2522171T3 (es) 2014-11-13
EP3570278B1 (en) 2022-10-26
US10770079B2 (en) 2020-09-08
ES2935637T3 (es) 2023-03-08
CA2792452C (en) 2018-01-16
WO2011110500A1 (en) 2011-09-15
JP5588025B2 (ja) 2014-09-10
PL2545553T3 (pl) 2015-01-30
AR080476A1 (es) 2012-04-11
WO2011110499A1 (en) 2011-09-15
TWI444991B (zh) 2014-07-11

Similar Documents

Publication Publication Date Title
US11894002B2 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
TWI515721B (zh) 用於音頻信號帶寬擴展的設備和方法
AU2011263191B2 (en) Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus
SG183966A1 (en) Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 04/03/2011, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.