BR122021003884B1 - Reamostrar sinais de saída de codecs de áudio com base em qmf - Google Patents

Reamostrar sinais de saída de codecs de áudio com base em qmf Download PDF

Info

Publication number
BR122021003884B1
BR122021003884B1 BR122021003884-8A BR122021003884A BR122021003884B1 BR 122021003884 B1 BR122021003884 B1 BR 122021003884B1 BR 122021003884 A BR122021003884 A BR 122021003884A BR 122021003884 B1 BR122021003884 B1 BR 122021003884B1
Authority
BR
Brazil
Prior art keywords
audio signal
synthesis
signal
analysis
filter bank
Prior art date
Application number
BR122021003884-8A
Other languages
English (en)
Inventor
Markus Lohwasser
Manuel Jander
Max Neuendorf
Ralf Geiger
Markus Schnell
Matthias Hildenbrand
Tobias Chalupka
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44630032&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BR122021003884(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Publication of BR122021003884B1 publication Critical patent/BR122021003884B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0211Frequency selective networks using specific transformation algorithms, e.g. WALSH functions, Fermat transforms, Mersenne transforms, polynomial transforms, Hilbert transforms
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0272Quadrature mirror filters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • H03H17/0621Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0294Variable filters; Programmable filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

um aparelho para processar um sinal de áudio é provido. o aparelho compreende (110) para processar o sinal de áudio (s0) de acordo com diferentes definições de configurações (conf) para obter um sinal de áudio processado (s1), em que o aparelho é adaptado de modo que diferentes taxas de amostragem (sr1) do sinal de áudio processado (s1). o aparelho adicionalmente compreende um banco de filtros de análise (120) possuindo um primeiro número (c1) de canais de banco de filtros de análise, um banco de filtros de síntese, um segundo processador de áudio (140) sendo adaptado para receber e processar um sinal de áudio (s2) possuindo uma taxa de amostragem predeterminada (sr2), e um controlador (150) para controlar o primeiro número (c1) de canais de banco de filtros de análise ou segundo número (c2) de canais de banco de filtros de síntese de acordo com uma definição de configurações (conf).

Description

[0001] CAMPO DA INVENÇÃO
[0002] A presente invenção está relacionada ao processamento de áudio e, em particular, a um aparelho e método para reamostrar sinais de saída de codecs de áudio com base em QMF.
[0003] A maioria dos eletrônicos de consumidor de áudio de nível inferior utiliza conversores digital para analógico com taxas de amostragem fixas, por motivos de custos. Porém, quando é exigido que dispositivos com capacidades multimídia suportem diferentes tipos de fontes de áudio, o processo de reamostragem é inevitável, porque arquivos de mídia podem ser codificados utilizando diferentes taxas de amostragem, e, além disso, codecs de comunicação utilizam diferentes taxas de amostragem. A escolha de diferentes taxas de amostragem é um assunto importante em relação aos pontos de operação de diferentes codecs de áudio e métodos de processamento. Quanto mais taxas de amostragem diferentes for necessário que sejam suportadas, mais complexa é a adaptação de taxa de amostragem e a tarefa de reamostragem.
[0004] Por exemplo, no modelo de referência atual MPEG-D USAC (USAC = Unified Speech and Audio Coding), algumas taxas de amostragem incomuns (múltiplas não inteiras de 16000Hz ou 22050Hz) podem ser empregadas. Estas taxas são o resultado de um compromisso entre dois aspectos: Primeiro, uma taxa de amostragem nominal da ferramenta de codificação ACELP integrada para a qual ela for especificamente projetada e a qual, de certa forma, dita a taxa de amostragem geral do sistema, e segundo, o desejo de aumentar a taxa de amostragem com “a taxa de bits para ser capaz de codificar uma maior largura de banda de áudio e/ou para realizar escalabilidade.
[0005] Parcialmente, as taxas de amostragem incomuns são também um legado do sistema AMR-WB+, do qual partes do modelo de referência foram retiradas. Além disso, como é comum na prática de codificação de áudio de baixa taxa de bits, a taxa de amostragem e, assim, a largura de banda de áudio estão sendo muito reduzidas em pontos de operação USAC de taxa de bits baixa.
[0006] Em taxas de bits USAC baixas, em particular, as taxas de amostragem empregadas atualmente exibem ambos os problemas acima mencionados. Elas não são compatíveis com conversores D/A de hardware barato, e necessitariam de uma etapa de pós-reamostragem adicional. A largura de banda de áudio é limitada à frequência de Nyquist, a qual está bem abaixo do limite superior da faixa audível humana.
[0007] Para adaptar a taxa de amostragem de saída de uma unidade de processamento de áudio, módulos funcionais de reamostragem estão sendo utilizados para este propósito, exigindo uma quantidade significativa de recursos computacionais adicionais. A tecnologia utilizada para este propósito não se alterou em grande parte do tempo, consistindo basicamente em um interpolador e módulos sobreamostrador e subamostrador opcionais.
[0008] É um objeto da presente invenção a provisão de um conceito melhorado para a reamostragem de sinais de áudio. O objeto da presente invenção é resolvido através de um aparelho de acordo com a reivindicação 1, um método de acordo com a reivindicação 14 e um programa de computador de acordo com a reivindicação 15.
[0009] De acordo com a presente invenção, um aparelho para processar um sinal de áudio é provido. O aparelho compreende um primeiro processador de sinais de áudio configurável para processar o sinal de áudio de acordo com diferentes configurações para obter um sinal de áudio processado, em que o aparelho é adaptado de modo que diferentes definições de configuração resultem em diferentes taxas de amostragem do sinal de áudio processado. O aparelho, além disso, compreende um banco de filtros de análise possuindo um primeiro número de canais de banco de filtros de análise, um banco de filtros de síntese possuindo um segundo número de canais de banco de filtros de síntese e um segundo processador de áudio sendo adaptado para receber e processar um sinal de áudio possuindo uma taxa de amostragem predeterminada.
[00010] Além disso, o aparelho compreende um controlador para controlar o primeiro número de canais de banco de filtros de análise ou o segundo número canais de banco de filtros de síntese, de acordo com uma definição de configurações provida ao primeiro processador de sinal de áudio configurável, de modo que uma saída de sinal de áudio do banco de filtros de síntese tem a taxa de amostragem predeterminada ou uma a taxa de amostragem diferente da taxa de amostragem previamente estabelecida e sendo mais próxima da taxa de amostragem predeterminada do que uma taxa de amostragem de um sinal de entrada do banco de filtros de análise.
[00011] A presente invenção é baseada na descoberta de que, ao variar a largura de banda de sinal em representação no domínio da frequência, o sinal no domínio do tempo resultante equivalente possuirá uma taxa de amostragem diferentes, conforme no caso em que nenhuma alteração na largura de banda teria sido feita no domínio da frequência. A operação de alteração de largura de banda é barata, uma vez que pode ser realizada ao excluir ou adicional dados no domínio da frequência.
[00012] A etapa de conversão do domínio da frequência de volta para o domínio do tempo deve ser modificada para ser capaz de lidar com as diferentes larguras de banda no domínio da frequência (comprimento de transformação).
[00013] A representação do sinal no domínio da frequência da largura de banda modificada pode também ser estendida para todo o método de processamento de sinal em vez de ser limitada ao banco de filtros, permitindo, assim, que o processo inteiro tire vantagem das características de sinal de saída alvo reais.
[00014] Mesmo que nem todas as fontes de sinal de áudio possam ser trazidas a uma única taxa de amostragem de saída, a redução da quantidade de diferentes taxas de amostragem já economiza muitos recursos computacionais em um dado dispositivo.
[00015] A complexidade de um banco de filtros está diretamente relacionada ao seu comprimento. Se uma transformada de síntese de sinal no domínio do tempo de banco de filtros for modificada para subamostragem ao reduzir o comprimento da transformada, sua complexidade reduzirá. Se for utilizada para sobreamostragem ao aumentar seu comprimento de transformada, sua complexidade aumentará, porém ainda muito abaixo da complexidade necessária para um reamostrador adicional com características de distorção de sinal equivalentes. Além disso, a distorção de sinal, ao todo, será menor, uma vez que qualquer distorção de sinal causada por um reamostrador adicional será eliminada.
[00016] De acordo com uma realização, o banco de filtros de análise é adaptado para transformar o sinal de entrada do banco de filtros de análise sendo representado em um domínio do tempo em um primeiro sinal de áudio no domínio tempo-frequência possuindo uma pluralidade de primeiros sinais de sub-banda, em que o número de primeiros sinais de sub-banda é igual ao primeiro número de canais de banco de filtros de análise. De acordo com esta realização, o aparelho adicionalmente compreende um ajustador de sinal sendo adaptado para gerar um sinal de áudio no domínio tempo-frequência possuindo uma pluralidade de segundos sinais de sub-banda a partir do primeiro sinal de áudio no domínio tempo- frequência com base na definição de configurações (conf), de modo que o número de segundos sinais de sub-banda do sinal de áudio no domínio tempo-frequência é igual ao número de canais do banco de filtros de síntese. O número de segundos sinais de sub-banda do segundo sinal de áudio no domínio tempo-frequência é diferente do número de sinais de sub-banda do primeiro sinal de áudio no domínio tempo-frequência. Além disso, o banco de filtros de síntese é adaptado para transformar o segundo sinal de áudio no domínio tempo-frequência em um sinal de áudio no domínio do tempo como a saída de sinal de áudio do banco de filtros de síntese.
[00017] Em outra realização, o ajustador de sinais pode ser adaptado para gerar o segundo sinal de áudio no domínio tempo- frequência ao gerar pelo menos um sinal de sub-banda adicional. Em uma realização adicional, o ajustador de sinais é adaptado para gerar pelo menos um sinal de sub-banda adicional ao conduzir a replicação de banda espectral para gerar pelo menos um sinal de sub-banda adicional. Em outra realização, o ajustador de sinais é adaptado para gerar um sinal zero como um sinal de sub-banda adicional.
[00018] De acordo com uma realização, o banco de filtros de análise é um banco de filtros de análise QMF (Quadrature Mirror Filter / “filtros em espelho de quadratura”) e o banco de filtros de síntese é um banco de filtros de síntese QMF. Em uma realização alternativa, o banco de filtros de análise é um banco de filtros de análise MDCT (Modified Discrete Cosine Transform / “transformada de cosseno discreta modificada”) e o banco de filtros de síntese é um banco de filtros de síntese MDCT.
[00019] Em uma realização, o aparelho pode compreender um reamostrador adicional sendo adaptado para receber um sinal de saída de banco de filtros de síntese possuindo uma primeira taxa de amostragem de síntese. O reamostrador adicional pode reamostrar o sinal de saída do banco de filtros de síntese para receber um sinal de saída reamostrado possuindo uma segunda taxa de amostragem de síntese. Ao combinar o aparelho de acordo com uma realização e um reamostrador adicional, é possível reduzir a complexidade do reamostrador empregado. Em vez de empregar um reamostrador de alta complexidade, dois reamostradores de baixa complexidade podem ser utilizados.
[00020] Em outra realização, o aparelho pode ser adaptado para inserir um sinal de saída de banco de filtros de síntese possuindo uma primeira taxa de amostragem de síntese no banco de filtros de análise como um sinal de entrada de banco de filtros de análise. Por isto, novamente, a complexidade do aparelho de acordo com uma realização pode ser reduzida. Em vez de empregar um banco de filtros de análise e um banco de filtros de síntese possuindo um enorme número de canais de bancos de filtros de análise e síntese, o número de canais de bancos de filtros será significativamente reduzido. Isto é atingido ao repetir as transformações de análise e síntese uma ou mais vezes. De acordo com uma realização, os bancos de filtros de análise e síntese podem ser adaptados de maneira que o número de canais de banco de filtros de análise e síntese possa ser alterável para cada ciclo de transformação (um ciclo de transformação compreende uma etapa de análise e uma etapa de síntese).
[00021] O controlador pode ser adaptado para receber uma definição de configurações compreendendo um número de índice. Além disso, o controlador pode ser, então, adaptado para determinar a taxa de amostragem do sinal de áudio processado ou a taxa de amostragem predeterminada com base no número de índice e em uma tabela de consulta. De acordo com estas realizações, não é necessário transmitir os números explícitos de canais de bancos de filtros de análise e síntese em cada definição de configurações, mas sim um único número de índice identificando que a configuração específica é transmitida. Isto reduz a taxa de bits necessária para transmitir uma definição de configurações.
[00022] De acordo com uma realização, o controlador é adaptado para determinar o primeiro número de canais de banco de filtros de análise ou o segundo número de canais de banco de filtros de síntese com base em um erro tolerável. Em uma realização, o controlador pode compreender um comparador de erro para comparar o erro real com um erro tolerável. Além disso, o aparelho pode ser adaptado para obter o erro tolerável a partir da definição de configurações. De acordo com estas realizações, pode ser possível especificar o grau de precisão da reamostragem. Pode ser apreciado que em certas situações, a precisão da reamostragem pode ser reduzida para também reduzir, por outro lado, a complexidade dos bancos de filtros de análise e síntese e, assim, reduzir a complexidade do cálculo.
[00023] De acordo com outra invenção, um aparelho para realizar upmixing de um sinal surround é provido. O aparelho compreende um banco de filtros de análise para transformar um sinal no domínio do tempo com downmix em um domínio de tempo- frequência para gerar uma pluralidade de sinais de sub-banda com downmix. Além disso, o aparelho compreende pelo menos duas unidades de upmix para realizar upmix da pluralidade de sinais de sub-banda para obter uma pluralidade de sinais de sub-banda surround. Além disso, o aparelho compreende pelo menos suas unidades de ajustador de sinais para ajustar o número de sinais de sub-banda surround. As pelo menos duas unidades de ajustador de sinais são adaptadas para receber uma primeira pluralidade de sinais de sub-banda surround de entrada. As pelo menos duas unidades de ajustador de sinais são adaptadas para emitir uma segunda pluralidade de sinais de sub-banda surround de saída, e em que o número da primeira pluralidade de sinais de sub-banda surround de entrada e o número da segunda pluralidade de sinais de sub-banda surround de saída são diferentes. Além disso, o aparelho compreende uma pluralidade de unidades de banco de filtros de síntese para transformar uma pluralidade de sinais de sub-banda surround de saída de um domínio tempo-frequência para um domínio do tempo para obter sinais de saída surround no domínio do tempo. Além disso, o aparelho compreende um controlador que é adaptado para receber uma definição de configurações. O controlador é, além disso, adaptado para controlar o número de canais do banco de filtros de análise, controlar o número de canais das unidades de banco de filtros de síntese, controlar o número da primeira pluralidade de sinais de sub-banda surround de entrada das unidades de ajustador de sinais, e controlar o número da segunda pluralidade de sinais de sub-banda surround de saída das unidades de ajustador de sinais com base na definição de configurações recebida.
[00024] Realizações preferidas da presente invenção são subsequentemente discutidas em relação às figuras apensas, em que:
[00025] A Figura 1 ilustra um aparelho para processar um sinal de áudio de acordo com uma realização,
[00026] As Figuras 2a a 2c ilustram a transformação de amostras no domínio do tempo em amostras no domínio tempo- frequência,
[00027] As Figuras 3a a 2c ilustram a transformação de amostras no domínio tempo-frequência em amostras no domínio do tempo,
[00028] A Figura 4 ilustra, em uma ilustração adicional, a transformação de amostras no domínio tempo-frequência em amostras no domínio do tempo,
[00029] A Figura 5 ilustra dois diagramas ilustrando um conceito básico de uma realização,
[00030] A Figura 6 ilustra um aparelho de acordo com uma realização adicional,
[00031] As Figuras 7a e 7b mostram tabela de consulta de acordo com uma realização,
[00032] A Figura 8 ilustra um aparelho de acordo com uma realização que emprega processamento SBR,
[00033] A Figura 9 ilustra um aparelho de acordo com outra realização que emprega análise QMF e bancos de filtros de síntese para realizar upmix de um sinal MPEG Surround com uma taxa de amostragem reamostrada de acordo com uma realização,
[00034] A Figura 10 ilustra um aparelho de acordo com outra realização empregando processamento SBR,
[00035] A Figura 11 ilustra um aparelho de acordo com outra realização compreendendo um reamostrador adicional,
[00036] A Figura 12 ilustra um aparelho que emprega QMF como um reamostrador de acordo com uma realização,
[00037] A Figura 13 mostra um aparelho que emprega um amostrador adicional de acordo com uma realização,
[00038] A Figura 14 ilustra um aparelho que emprega QMF como reamostrador de acordo com outra realização,
[00039] A Figura 15 ilustra um aparelho de acordo com uma realização adicional, em que o aparelho é adaptado para inserir a saída do banco de filtros de síntese no banco de filtros de análise para conduzir outro ciclo de transformação,
[00040] A Figura 16 ilustra um controlador de acordo com outra realização compreendendo um comparador de erro,
[00041] A Figura 17 mostra um fluxograma ilustrando um método para determinar o número de canais de bancos de filtros de análise e síntese, respectivamente, e
[00042] A Figura 18 ilustra um controlador de acordo com uma realização adicional, compreendendo um comparador de erro.
[00043] A Figura 1 ilustra um aparelho para processar um sinal de áudio de acordo com uma realização. Um sinal de áudio s0 é introduzido no aparelho. Em outra realização, s0 pode ser um fluxo de bits, em particular um fluxo de bits de dados de áudio. Além disso, o aparelho recebe uma definição de configurações conf. O aparelho compreende um primeiro processador de sinal de áudio configurável 110 para processamento do sinal de áudio s0 de acordo com a definição de configurações conf para obter um sinal de áudio processado s1. Além disso, o aparelho para processar um sinal de áudio é adaptado de modo que diferentes definições de configurações conf resultem em diferentes taxas de amostragem do sinal de áudio processado. O aparelho também compreende um banco de filtros de análise 120 tendo um primeiro número de canais de banco de filtros de análise c1 e um banco de filtros de síntese 130 tendo um segundo número de canais de banco de filtros de síntese c2. Além disso, o aparelho compreende um segundo processador de áudio 140 sendo adaptado para receber e processar um sinal de áudio s2 tendo uma taxa de amostragem predeterminada. Além disso, o aparelho compreende um controlador 150 para controlar o primeiro número de canais de banco de filtros de análise c1 ou o segundo número de canais de banco de filtros de síntese c2 de acordo com uma definição de configurações conf provida ao primeiro processador de sinais de áudio configurável 110, de modo que um sinal de áudio s2 emitido pelo banco de filtros de síntese 130 possua a taxa de amostragem predeterminada ou uma taxa de amostragem diferente da taxa de amostragem predeterminada, porém que é mais próxima da taxa de amostragem predeterminada do que a taxa de amostragem de um sinal de entrada s1 no banco de filtros de análise 120.
[00044] O banco de filtros de análise e o banco de filtros de síntese podem ser adaptados de modo que o número de canais de análise e o número de canais de síntese sejam configuráveis, e que seus números possam ser determinados por parâmetros configuráveis.
[00045] Nas Figuras 2a a 2c, a transformação de amostras no domínio do tempo em amostras no domínio tempo frequência é ilustrada. O lado esquerdo da Figura 2a ilustra uma pluralidade de amostras de um sinal de áudio (processado) em um domínio de tempo. No lado esquerdo da Figura 2a, 640 amostras de tempo são ilustradas (as últimas 64 amostras de tempo são chamadas de “novas amostras de tempo”, enquanto que as 576 amostras de tempo restantes são chamadas de amostras de tempo antigas. Na realização ilustrada pela Figura 2a, uma primeira etapa de uma transformada de Fourier de curto termo (STFT) é conduzida. As 576 amostras de tempo antigas e as 64 novas amostras de tempo são transformadas em 64 valores de frequência, isto é, 64 valores de amostras de subbanda são gerados.
[00046] Em uma etapa subsequente ilustrada na Figura 2b, as 64 amostras de tempo mais antigas dentre as 640 amostras de tempo consideradas são descartadas. Em vez disso, 64 novas amostras de tempo são consideradas com “as 576 amostras de tempo já consideradas restantes disponíveis na etapa de processamento ilustrada pela Figura 2a. Isto poderia ser considerado como deslocar uma janela deslizante possuindo um comprimento de 640 amostras de tempo por 64 amostras de tempo em cada etapa de processamento. Novamente, também na etapa de processamento ilustrada na Figura 2b, 64 amostras de sub-banda adicionais são geradas a partir das 640 amostras de tempo consideradas (576 amostras de tempo antigas e 64 novas amostras de tempo consideradas pela primeira vez). Por meio disto, um segundo conjunto de 64 valores de sub-banda é gerado. Poder-se-ia dizer que 64 novas amostras de sub-banda são geradas ao levar em consideração 64 novas amostras de tempo.
[00047] Na etapa subsequente ilustrada na Figura 2c, novamente, a janela deslizante é deslocada por 64 amostras de tempo, isto é, os 64 valores de tempo mais antigos são descartados, e 64 novas amostras de tempo são levadas em consideração. 64 novas amostras de sub-banda são geradas com base nas 576 amostras de tempo antigas e 64 novas amostras de tempo. Conforme pode ser visto na Figura 2c, lado direito, um novo conjunto de 64 novos valores de sub-banda foi gerado ao conduzir a STFT.
[00048] O processo ilustrado nas Figuras 2a a 2c é conduzido repetidamente para gerar amostras de sub-banda adicionais a partir de amostras de tempo adicionais.
[00049] Explicando em termos gerais, 64 novas amostras de tempo são necessárias para gerar 64 novas amostras de sub-banda.
[00050] Na realização ilustrada pelas Figuras 2a a 2c, cada conjunto das amostras de sub-banda geradas representa as amostras de sub-banda em um índice de tempo específico em um domínio tempo-frequência. Isto é, a 32a amostra de sub-banda do índice de tempo j representa uma amostra de sinal S[32,j] em um domínio tempo-frequência. Em relação a um certo índice de tempo no domínio tempo-frequência, 64 valores de sub-banda existem para aquele índice de tempo, enquanto que, para cada ponto no tempo no domínio do tempo, no máximo um único valor de sinal existe. Por outro lado, a taxa de amostragem de cada uma das 64 bandas de frequência é somente 1/64 do sinal no domínio do tempo.
[00051] É entendido por um técnico no assunto que o número de sinais de sub-banda, os quais são gerados por um banco de filtros de análise, depende do número de canais do banco de filtros de análise. Por exemplo, o banco de filtros de análise pode compreender 16, 32, 96 ou 128 canais, tal que 16, 32, 96 ou 128 sinais de sub-banda em um domínio tempo-frequência possam ser gerados a partir de, por exemplo, 16, 32, 96 ou 128 amostras de tempo, respectivamente.
[00052] As Figuras 3a e 3b ilustram a transformação de amostras no domínio tempo-frequência em amostras no domínio do tempo:
[00053] O lado esquerdo da Figura 3a ilustra uma pluralidade de conjuntos de amostras de sub-banda em um domínio tempo-frequência. Em maiores detalhes, cada caixa longitudinal na Figura 3a representa uma pluralidade de 64 amostras de sub-banda em um domínio tempo-frequência. Uma janela deslizante no domínio tempo-frequência cobre 10 índices de tempo, cada um compreendendo 64 amostras de sub-banda no domínio tempo-frequência. Ao conduzir uma transformada de Fourier de curto termo inversa (ISTFT), 64 amostras de tempo são geradas a partir das amostras de sub-banda (10 vezes 64) consideradas, conforme ilustrado na Figura 3a, lado direito.
[00054] Em uma etapa de processamento subsequente ilustrada na Figura 3b, o conjunto mais antigo de 64 valores de sub-banda é descartado. Em vez disto, a janela deslizante agora cobre um novo conjunto de 64 valores de sub-banda possuindo um diferente índice de tempo no domínio tempo-frequência. 64 novas amostras de tempo são geradas no domínio do tempo a partir das 640 amostras de sub-banda (576 amostras de sub-banda antigas e 64 novas amostras de sub-banda consideradas pela primeira vez). A Figura 3b, lado direito, ilustra a situação no domínio do tempo. A Figura 3b ilustra 64 amostras de tempo antigas geradas ao conduzir a ISTFT conforme ilustrado na Figura 3a são ilustradas com “as 64 novas amostras de tempo geradas na etapa de processamento da Figura 3b.
[00055] O processo ilustrado nas Figuras 3a e 3b é conduzido repetidamente para gerar amostras de tempo adicionais a partir das amostras de sub-banda adicionais.
[00056] Para explicar o conceito do banco de filtros de síntese 130 em termos gerais, 64 novas amostras de sub-banda em um domínio tempo-frequência são necessárias para gerar 64 novas amostras de tempo em um domínio do tempo.
[00057] É entendido por um técnico no assunto que o número de amostras de tempo, as quais são geradas por um banco de filtros de análise, depende do número de canais do banco de filtros de síntese. Por exemplo, o banco de filtros de síntese pode compreender 16, 32, 96 ou 128 canais, tal que 16, 32, 96 ou 128 amostras de tempo em um domínio do tempo possam ser geradas a partir de, por exemplo, 16, 32, 96 ou 128 amostras de sub-bandas em um domínio tempo-frequência, respectivamente.
[00058] A Figura 4 apresenta outra ilustração ilustrando a transformação de amostras no domínio tempo-frequência em amostras no domínio do tempo. Em cada etapa de processamento, 64 amostras de sub-bandas adicionais são consideradas (isto é, as 64 amostras de sub-banda do próximo índice de tempo em um domínio tempo-frequência). Ao levar as últimas 64 amostras de sub-banda em consideração, 64 novas amostras de tempo podem ser geradas. A taxa de amostragem do sinal no domínio do tempo é 64 vezes a taxa de amostragem de cada um dos 64 sinais de sub-banda.
[00059] A Figura 5 ilustra dois diagramas ilustrando um conceito básico de uma realização. A parte superior da Figura 5 ilustra uma pluralidade de amostras de sub-banda de um sinal em um domínio tempo-frequência. O eixo das abcissas representa o tempo. O eixo das ordenadas representa a frequência. A Figura 5 difere da Figura 4 em que, para cada índice de tempo, o sinal no domínio tempo-frequência contém três amostras de sub-banda adicionais (marcadas com “x”). Isto é, as três sub-bandas adicionais foram adicionadas, de modo que o sinal no domínio tempo-frequência não possua somente 64 sinais de sub-banda, mas sim agora possua 67 sinais de sub-banda. O diagrama ilustrado na parte inferior da Figura 5 ilustra amostras de tempo do mesmo sinal no domínio do tempo após conduzir uma transformada de Fourier de curto termo inversa (ISTFT). Uma vez que 3 sub-bandas foram adicionadas no domínio tempo-frequência, as 67 amostras de sub-banda adicionais de um índice de tempo específico no domínio tempo-frequência podem ser utilizadas para gerar 67 novas amostras de tempo do sinal de áudio no domínio do tempo. Uma vez que 67 amostras de tempo foram geradas no domínio do tempo utilizando 67 amostras de sub-banda adicionais de um único índice de tempo no domínio tempo- frequência, a taxa de amostragem do sinal de áudio s2 no domínio do tempo emitido pelo banco de filtros de síntese 130 é 67 vezes a taxa de amostragem de cada um dos sinais de sub-banda. Conforme pode ser visto acima, o emprego de 64 canais no banco de filtros de análise 120 resulta em uma taxa de amostragem de cada sinal de sub-banda de 1/64 da taxa de amostragem do sinal de áudio processado s1 conforme inserido no banco de filtros de análise 120. Em relação ao banco de filtros de análise 120 e ao banco de filtros de síntese 130 juntos, o banco de filtros de análise 120 possuindo 64 canais e o banco de filtros de síntese 130 possuindo 67 canais resulta em uma taxa de amostragem do sinal s2 emitido pelo banco de filtros de síntese de 67/64 vezes a taxa de amostragem do sinal de áudio s1 sendo inserido no banco de filtros de análise 120.
[00060] O seguinte conceito pode ser derivado: Considere um sinal de áudio (processado) s1 que é inserido no banco de filtros de análise 120. Supondo que o banco de filtros possui c1 canais e, supondo ainda que a taxa de amostragem do sinal de áudio processado é sr1, então a taxa de amostragem de cada sinal de subbanda é sr1/c1. Supondo ainda que o banco de filtros de síntese possui c2 canais, e supondo que a taxa de amostragem de cada sinal de sub-banda é srsubband, então a taxa de amostragem do sinal de áudio s2 sendo emitido pelo banco de filtros de síntese 130 é c2 • srsubband. Isto significa que a taxa de amostragem do sinal de áudio sendo emitido pelo banco de filtros de síntese 130 é c2/ c1 • sr1. A seleção de c2 diferente de c1 significa que a taxa de amostragem do sinal de áudio s2 sendo emitido pelo banco de filtros de síntese 130 pode ser definida diferentemente da taxa de amostragem do sinal de áudio sendo inserido no banco de filtros de análise 120.
[00061] A escolha de c2 diferente de c1 não somente significa que o número de canais de banco de filtros de análise difere do número de canais de banco de filtros de síntese. Além disso, o número de sinais de sub-banda sendo gerados pelo banco de filtros de análise 120 pela STFT difere do número de sinais de sub-banda que são necessários ao conduzir a ISTFT pelo banco de filtros de síntese 130.
[00062] Três situações diferentes podem ser distinguidas:
[00063] Se c1 for igual a c2, o número de sinais de subbanda que são gerados pelo banco de filtros de análise 120 é igual ao número de sinais de sub-banda necessários pelo banco de filtros de síntese 130 para a ISTFT. Não é necessário ajuste de sub-banda.
[00064] Se c2 for menor que c1, o número de sinais de sub banda gerados pelo banco de filtros de análise 120 é maior que o número de sinais de sub-banda necessários pelo banco de filtros de síntese 130 para síntese. De acordo com uma realização, os sinais de sub-banda de maior frequência podem ser excluídos. Por exemplo, se o banco de filtros de análise 120 gerar 64 sinais de sub-banda, e se o banco de filtros de síntese 130 somente precisar de 61 sinais de sub-banda, os três sinais de sub-banda com a maior frequência podem ser descartados.
[00065] Se c2 for maior que c1, então, o número de sinais de sub-banda gerados pelo banco de filtros de análise 120 é menor que o número de sinais de sub-banda necessários pelo banco de filtros de síntese 130 para a síntese.
[00066] De acordo com uma realização, sinais de sub-banda adicionais podem ser gerados ao adicionar sinais zero como sinais de sub-banda adicionais. Um sinal zero é um sinal onde os valores de amplitude de cada amostra de sub-banda são iguais a zero.
[00067] De acordo com outra realização, sinais de subbanda adicionais podem ser gerados ao adicionar sinais de subbanda pseudoaleatórios como sinais de sub-banda adicionais. Um sinal de sub-banda pseudoaleatório é um sinal onde os valores de cada amostra de sub-banda compreendem dados pseudoaleatórios, em que os dados pseudoaleatórios devem ser determinados pseudoaleatoriamente a partir de uma faixa de valores permitida. Por exemplo, os valores de amplitude escolhidos pseudoaleatoriamente de uma amostra devem ser menores que um valor de amplitude máximo, e os valores de fase de uma amostra devem estar na faixa entre 0 e 2π (inclusiva).
[00068] Em outra realização, sinais de sub-banda adicionais podem ser gerados ao copiar os valores de amostra do sinal de sub-banda mais alta e utilizá-los como valores de amostra dos sinais de sub-banda adicionais. Em outra realização, os valores de fase da sub-banda mais alta são copiados e utilizados como valores de amostra para uma sub-banda adicional, enquanto que os valores de amplitude do sinal de sub-banda mais alto são multiplicados com um fator de peso, por exemplo, para reduzir seu peso, e são, em seguida, utilizados como valores de amplitude das amostras de sub-banda do sinal de sub-banda adicional. Por exemplo, todos os valores de amplitude em um sinal de sub-banda adicional podem ser multiplicados com o fator de peso 0,9. Se dois sinais de sub-banda adicionais forem necessários, os valores de amplitude do sinal de sub-banda mais alto podem ser multiplicados com um fator de peso 0,9 para gerar um primeiro sinal de sub-banda adicional, enquanto que todos os valores de amplitude podem ser multiplicados com um fator de peso 0,8 para gerar um segundo sinal de sub-banda adicional.
[00069] Codecs de áudio mais altamente eficientes utilizam melhorias de sinal paramétricas, as quais, por sua vez, utilizam um QMF (Quadrature Mirror Filter) (isto é, MPEG-4 HE- AAC), onde os conceitos propostos nas reivindicações acima descritas podem também ser empregados. Codecs com base em QMF utilizam tipicamente uma estrutura de filtro polifásica de Nnominal=64 bandas para converter sub-bandas em um sinal de saída no domínio do tempo de uma frequência de amostragem nominal fs,nominal. Ao alterar a quantidade de bandas de saída, ao adicionar subbandas contendo um sinal zero, ou remover algumas das bandas mais altas (as quais podem estar vazias de qualquer maneira), a taxa de amostragem fs de saída pode ser alterada em passos de Δfs conforme mostrado abaixo. f s,nominal
[00070]
Figure img0001
[00071] o que resulta em saída geral fs de:
[00072]
Figure img0002
[00073] Em vez de adicionar um conversor de taxa de amostragem extra, esta funcionalidade pode ser embutida no filtro de síntese QMF já existente.
[00074] O aumento da carga de trabalho é inferior ao de um conversor de taxa de amostragem com precisão comparável, porém, a relação de taxas de amostragem não pode ser arbitrária. Essencialmente, ela é determinada pela relação do número de bandas utilizadas na análise QMF e no banco de filtros de síntese QMF. Geralmente, é preferido utilizar um número de bandas de saída que permita uma computação rápida da QMF de síntese, por exemplo, 60, 72, 80, 48, ...
[00075] Da mesma forma que a taxa de amostragem de saída pode ser alterada ao empregar QMF, do mesmo modo a taxa de amostragem de um codec de sinal de áudio pode ser ajustada, o que utiliza outro tipo de banco de filtros, por exemplo, um MDCT (Modified Discrete Cosine Transform).
[00076] A Figura 6 ilustra um aparelho de acordo com uma realização. O aparelho compreende um ajustador de sinal 125. Um banco de filtros de análise 120 é adaptado para transformar o sinal de entrada do banco de filtros de análise s1 sendo representado em um domínio do tempo em um primeiro sinal de áudio no domínio tempo-frequência possuindo uma pluralidade de, por exemplo, 3 primeiros sinais de sub-banda s11, s12, s13. O número de primeiros sinais de sub-banda é igual ao primeiro número c1 de canais do banco de filtros de análise,
[00077] O ajustador de sinais 125 é adaptado para gerar um segundo sinal de áudio no domínio tempo-frequência a partir do primeiro sinal de áudio no domínio tempo-frequência com base na definição de configurações conf. O segundo sinal de áudio no domínio tempo-frequência possui uma pluralidade de, por exemplo, 4 segundos sinais de sub-banda s21, s22, s23, s24. O segundo sinal de áudio no domínio tempo-frequência é gerado de modo que o número de segundos sinais de sub-banda seja igual ao número c2 de canais do banco de filtros de síntese. O número de segundos sinais de sub-banda do segundo sinal de áudio no domínio tempo-frequência pode ser diferente do número de sinais de sub-banda do primeiro sinal de áudio no domínio tempo-frequência. Portanto, o número de sinais de sub-banda pode ter de ser ajustado, por exemplo, de acordo com um dos conceitos acima descritos.
[00078] O banco de filtros de síntese 130 é adaptado para transformar o segundo sinal de áudio no domínio tempo-frequência em um sinal de áudio no domínio do tempo como a saída de sinal de áudio s2 do banco de filtros de síntese 130.
[00079] Entretanto, em outras realizações, um ajustador de sinais 125 pode não estar compreendido. Se o banco de filtros de análise 120 prover mais canais que o necessário pelo banco de filtros de síntese 130, o banco de filtros de síntese pode, ele mesmo, descartar canais que não forem necessários. Além disso, o banco de filtros de síntese 130 pode ser configurado para utilizar, ele mesmo, um sinal de sub-banda zero ou um sinal compreendendo dados pseudoaleatórios, se o número de sinais de sub-banda providos pelo banco de filtros de análise 120 for menor que o número de canais de banco de filtros de síntese.
[00080] O aparelho de acordo com as realizações é particularmente adequado para se adaptar a diferentes situações. Por exemplo, o primeiro processador de sinais 110 pode precisar processar o sinal de áudio s0, de modo que o sinal de áudio processado s1 possua uma primeira taxa de amostragem sr1 em uma situação, e de modo que o sinal de áudio processado s1 possua uma segunda taxa de amostragem sr1’ sendo diferente da primeira taxa de amostragem em uma segunda situação. Por exemplo, o primeiro processador de sinais 110 pode empregar uma ferramenta de decodificação ACELP (Algebraic Code Excited Linear Prediction) trabalhando com uma primeira taxa de amostragem de, por exemplo, 16000 Hz, enquanto que, em uma situação diferente, o primeiro processador de sinais de áudio pode empregar um decodificador AAC (Advanced Audio Coding), por exemplo, possuindo uma taxa de amostragem de, por exemplo, 48000 Hz. Além disso, pode surgir uma situação onde o primeiro processador de sinais de áudio empregue um decodificador AAC que comute entre diferentes taxas de amostragem. Ou, o primeiro processador de sinais 110 pode ser adaptado para comutar entre um primeiro sinal de áudio estéreo s1 possuindo uma primeira taxa de amostragem sr1 e um segundo sinal de áudio s1’ sendo um sinal MPEG Surround possuindo uma segunda taxa de amostragem sr1’.
[00081] Além disso, pode ser necessário prover um sinal de áudio para o segundo processador de sinais de áudio 140 possuindo uma certa taxa de amostragem predeterminada sr2. Por exemplo, um conversor digital para analógico empregado pode exigir uma certa taxa de amostragem. Neste caso, o segundo processador de sinais 140 pode sempre trabalhar com uma segunda taxa de amostragem sr2. Entretanto, em outros casos, as taxas de amostragem do sinal de áudio s2 no segundo processador de áudio 140 podem mudar no tempo de execução. Por exemplo, em um primeiro caso, o segundo processador de sinais de áudio 140 pode comutar entre uma primeiro conversor D/A (digital para analógico) de baixa qualidade de áudio que suporte uma taxa de amostragem relativamente baixa de, por exemplo, 24000 Hz, enquanto que, em outras situações, o segundo processador de sinais de áudio 140 pode empregar um segundo conversor D/A possuindo uma taxa de amostragem de, por exemplo, 96000 Hz. Por exemplo, em situações onde a taxa de amostragem original do sinal de áudio processado sr2 tendo sido processado pelo primeiro processador de sinais de áudio 110 possua uma taxa de amostragem relativamente baixa de, por exemplo, 4000 Hz, pode não ser necessário empregar o segundo conversor D/A de alta qualidade possuindo uma taxa de amostragem de 96000 Hz, mas sim é suficiente empregar o primeiro conversor D/A que requer menos recursos computacionais. É, portanto, apreciada a provisão de um aparelho com taxas de amostragem ajustáveis.
[00082] De acordo com uma realização, um aparelho é provido, o qual compreende um controlador 150 que controla o primeiro número de canais de banco de filtros de análise c1 e/ou o segundo número de canais de banco de filtros de síntese c2, de acordo com uma definição de configurações conf provida ao primeiro processador de sinais de áudio configurável 110, de modo que um sinal de áudio emitido pelo banco de filtros de síntese 130 possua a taxa de amostragem predeterminada sr2 ou uma taxa de amostragem sr2 sendo diferente da taxa de amostragem predeterminada sr2, porém sendo mais próxima da taxa de amostragem predeterminada sr2 do que a taxa de amostragem sr1 de um sinal de entrada processado s1 inserido no banco de filtros de análise 120.
[00083] Em uma realização, a definição de configurações pode conter uma informação explícita sobre a primeira taxa de amostragem sr1 e/ou a segunda taxa de amostragem sr2. Por exemplo, a definição de configurações pode explicitamente definir que uma primeira taxa de amostragem sr1 é definida em 9000 Hz e que uma segunda taxa de amostragem sr2 é definida em 24000 Hz.
[00084] Entretanto, em outra realização, a definição de configurações conf pode não especificar explicitamente uma taxa de amostragem. Em vez disso, um número de índice pode ser especificado, o qual o controlador possa utilizar para determinar a primeira sr1 e/ou a segunda taxa de amostragem sr2.
[00085] Em uma realização, a definição de configurações conf pode ser provida por uma unidade adicional (não mostrada) ao controlador no tempo de execução. Por exemplo, a unidade adicional pode especificar, na definição de configurações conf, se um decodificador ACELP ou um decodificador AAC é empregado.
[00086] Em uma realização alternativa, a definição de configurações conf não é provida no tempo de execução por uma unidade adicional, mas sim a definição de configurações conf é armazenada uma vez, de modo que seja permanentemente disponibilizada para um controlador 150. A definição de configurações conf, então, permanece inalterada durante um período de tempo mais longo.
[00087] Dependendo desta determinação, a unidade adicional pode enviar as taxas de amostragem explícitas ao controlador, sendo compreendidas na definição de configurações conf.
[00088] Em uma realização alternativa, a unidade adicional envia uma definição de configurações conf que indica se uma primeira situação existe (ao transmitir um valor de índice “0”: indicando “decodificador ACELP utilizado”, ou ao transmitir um valor de índice “1”: indicando “decodificador AAC utilizado”). Isto é explicado com referência à Figura 7a e 7b:
[00089] As Figuras 7a e 7b ilustram tabela de consulta de acordo com uma realização, sendo disponíveis a um controlador. Por exemplo, a tabela de consulta pode ser uma tabela de consulta predefinida armazenada como uma tabela fixa no controlador. Em outra realização, a tabela de consulta pode ser provida como meta informações a partir de uma unidade adicional. Enquanto, por exemplo, as informações da tabela de consulta são enviadas somente uma vez durante um longo período de tempo, um valor de índice especificando a configuração de taxa de amostragem atual é atualizado mais frequentemente.
[00090] A Figura 7a ilustra uma tabela de consulta simples permitindo a resolução de uma única taxa de amostragem, na realização da Figura 7a, uma taxa de amostragem do primeiro processador de sinais de áudio 110 é especificada. Ao receber um valor de índice sendo compreendido na primeira definição de configurações conf, o controlador 150 é capaz de determinar a taxa de amostragem do sinal de áudio processado s1 sendo processado pelo primeiro processador de sinais de áudio 110. Na tabela de consulta da Figura 7a, nenhuma informação sobre a segunda taxa de amostragem sr2 está disponível. Em uma realização, a segunda taxa de amostragem é uma taxa de amostragem fixa e é conhecida pelo controlador 150. Em outra realização, a segunda taxa de amostragem é determinada ao empregar outra tabela de consulta sendo similar à tabela de consulta ilustrada na Figura 7a.
[00091] A Figura 7b ilustra outra tabela de consulta que compreende informações sobre a primeira taxa de amostragem sr1 do sinal de áudio processado s1, bem como a segunda taxa de amostragem sr2 do sinal de áudio s2 sendo emitido pelo banco de filtros de síntese. Uma unidade adicional transmite uma definição de configurações conf compreendendo um valor de índice ao controlador 150. O controlador 150 consulta o valor de índice na tabela de consulta da Figura 7b, e, assim, determina a primeira taxa de amostragem desejada do sinal de áudio processado s1 e a segunda taxa de amostragem desejada sr2 do sinal de áudio s2 sendo gerado pelo banco de filtros de síntese 140.
[00092] A Figura 8 ilustra uma combinação dos conceitos acima descritos com o processamento SBR. Se a banda de síntese QMF fizer parte de um módulo SBR, a funcionalidade de reamostragem pode ser integrada ao sistema. Em particular, é, então, possível transmitir parâmetros SBR para estender a faixa SBR além da relação de reamostragem comum 2:1 ou 4:1, com o mérito adicional de que é possível realizar a maior parte de relações de reamostragem arbitrárias ao escolher adequadamente M e N dos bancos de filtro QMF, aumentando, assim, os graus de liberdade para a característica de reamostragem geral (ver Figura 8).
[00093] Por exemplo, se o número de bandas de síntese for maior que 64, elas não precisam necessariamente ser preenchidas com zeros. Em vez disso, a faixa para o patching SBR poderia também ser estendida para fazer uso desta faixa de frequência mais alta.
[00094] Na Figura 8, a frequência de amostragem de saída QMF resultante é:
[00095]
Figure img0003
[00096] Por exemplo, no caso do ponto de teste de operação USAC 8kbps, a frequência de amostragem interna fs,Core é tipicamente escolhida como sendo 9,6kHz. Embora mantendo o banco de filtros de análise QMF de M=32 bandas, a síntese poderia ser substituída por um banco QMF de N=80 bandas. Isto resultaria em uma frequência de amostragem de saída de
[00097]
Figure img0004
[00098] Ao realizar isto, a largura de banda de áudio potencial que pode ser coberta pelo SBR pode ser aumentada para 12kHz. Ao mesmo tempo, uma etapa de pós-reamostragem potencial a um conveniente 48kHz pode ser implementada de maneira barata, porque a relação de reamostragem restante é uma relação simples 1:2.
[00099] Muito mais combinações são imagináveis, as quais cobririam uma faixa SBR (mais) ampla, enquanto se mantém a possibilidade de permitir que o codificador de núcleo execute em frequências de amostragem um tanto anormais ou incomuns.
[000100] A Figura 9 ilustra um aparelho de acordo com outra realização, empregando análise QMF e bancos de filtros de síntese para realizar upmix de um sinal MPEG Surround com uma taxa de amostragem reamostrada de acordo com uma realização. Por motivos ilustrativos, o banco de filtros de análise é ilustrado para gerar somente 3 sinais de sub-banda a partir do sinal inserido, e cada um dos bancos de filtros de síntese é ilustrado para transformar um sinal no domínio tempo-frequência compreendendo somente quatro sinais de sub-banda de volta ao domínio do tempo. Entretanto, é entendido que, em outras realizações, o banco de filtros de análise pode, por exemplo, compreender 45 canais, e o banco de filtros de síntese pode, por exemplo, compreender 60 canais, respectivamente.
[000101] Na Figura 9, um sinal de áudio com downmix s1 é inserido em um banco de filtros de análise QMF 910. O banco de filtros de análise QMF 910 transforma o sinal de áudio no domínio do tempo com downmix em um domínio tempo-frequência para obter três sinais de sub-banda (com downmix) s11, s12, s13. O três sinais de sub-banda com downmix s11, s12, s13 são então inseridos em três unidades de upmix 921, 922, 923, respectivamente. Cada uma das unidades de upmix 921, 922, 923 gera cinco sinais de sub-banda surround como sinais de sub-banda esquerdo, direito, central, esquerdo surround e direito surround, respectivamente. Os três sinais de sub-banda esquerdos gerados são, então, inseridos em um ajustador de sinais 931 para os sinais de sub-banda esquerdos. O ajustador de sinais 931 gera quatro sinais de sub-banda a partir dos três sinais de sub-banda surround esquerdos, e os insere em um banco de filtros de síntese esquerdo 941, o qual transforma os sinais de sub-banda do domínio tempo-frequência para o domínio do tempo para gerar um canal esquerdo s21 do sinal surround em um domínio do tempo. Da mesma maneira, um ajustador de sinais direito 932 e um banco de síntese direito 942 são empregados para gerar um canal direito s22, um ajustador de sinais central 933 e um banco de filtro de síntese 943 são empregados para gerar um canal central s23, um ajustador de sinais surround esquerdo 934 e um banco de filtros de síntese surround esquerdo 944 é empregado para gerar um canal surround esquerdo s24, e um ajustador de sinais surround direito 935 e um banco de filtros de síntese surround esquerdo 945 são empregados para gerar um canal surround direito s25 do sinal surround no domínio do tempo.
[000102] Um controlador (950) recebe uma definição de configurações conf e é adaptado para controlar o número de canais do banco de filtros de análise 910 com base na definição de configurações conf. O controlador é adicionalmente adaptado para controlar o número de canais das unidades de banco de filtros de síntese 941, 942, 943, 944, 945, o número da primeira pluralidade de sinais de sub-banda surround de entrada das unidades de ajustador de sinais 931, 932, 933, 934, 935 e o número da segunda pluralidade de sinais de sub-banda surround de saída das unidades de ajustador de sinais 931, 932, 933, 934, 935 com base na definição de configurações conf recebida.
[000103] A Figura 10 ilustra um aparelho de acordo com outra realização. A realização da Figura 10 difere da realização da Figura 8 em que o ajustador de sinais 125 adicionalmente compreende um replicador de banda espectral 128 para conduzir uma replicação de banda espectral (SBR) dos sinais de sub-banda derivados do banco de filtros de análise 120 para obter sinais de sub-banda adicionais.
[000104] Convencionalmente, ao conduzir replicação de banda espectral, uma pluralidade de sinais de sub-banda é “replicada”, de modo que o número de sinais de sub-banda derivados da replicação de banda espectral seja duas vezes ou quatro vezes o número de sinais de sub-banda disponíveis para serem replicados espectralmente. Em uma replicação de banda espectral (SBR) convencional, o número de sinais de sub-banda disponíveis é replicado, de modo que, por exemplo, 32 sinais de sub-banda (resultantes de uma transformação de banco de filtros de análise) sejam replicados, e de modo que 64 sinais de sub-banda estejam disponíveis para a etapa de síntese. Os sinais de sub-banda são replicados, de modo que os sinais de sub-banda disponíveis formem os sinais de sub-banda mais baixa, enquanto que os sinais de sub banda replicados espectralmente a partir dos sinais de sub-banda mais alta sendo localizados em faixas de frequência mais altas que as dos sinais de sub-banda já disponíveis.
[000105] De acordo com a realização ilustrada na Figura 10, os sinais de sub-banda disponíveis são replicados, de modo que o número de sinais de sub-banda resultantes da SBR não tenham de ser um múltiplo inteiro de (ou o mesmo número que) os sinais de sub-banda replicados. Por exemplo, 32 sinais de sub-banda podem ser replicados, de modo que 32 sinais de sub-banda sejam derivados, porém, por exemplo, 36 sinais de sub-banda adicionais sejam derivados e que, no total, por exemplo, 68 no lugar de 64 sinais de sub-banda estejam disponíveis a partir da síntese. O banco de filtros de síntese 130 da realização da Figura 10 é ajustado para processar 68 canais em vez de 64.
[000106] De acordo com a realização ilustrada na Figura 10, o número de canais que são replicados pela replicação de banda espectral e o número de canais que podem ser replicados é ajustável, de modo que o número de canais replicados não precise ser um múltiplo inteiro de (ou o mesmo número que) os canais utilizados nas replicações de banda espectral. Na realização da Figura 10, o controlador não somente controla o número de canais do banco de filtros de síntese 140, mas também controla o número de canais a serem replicados pela replicação de banda espectral. Por exemplo, se o controlador determinou que o banco de filtros de análise 120 possui c1 canais, e o banco de filtros de síntese possui c2 canais (c2 > c1), então o número de canais adicionais que devem ser derivados pela replicação de banda espectral é c2 - c1.
[000107] Se c2 > 2 • c1, surge a questão de como gerar sinais de sub-banda adicionais no contexto de uma replicação de banda espectral. De acordo com uma realização, um sinal de subbanda zero (os valores de amplitude de todas as amostras de subbanda são zero) pode ser adicionado para cada sinal de sub-banda adicionalmente exigido. Em outra realização, dados pseudoaleatórios são utilizados como valores de amostra dos sinais de sub-banda adicionais a serem gerados. Em outra realização, o sinal de sub-banda mais alta resultante da replicação de banda espectral é, ele mesmo, replicado: Por exemplo, os valores de amplitude dos sinais de sub-banda mais alta são duplicados para formar os valores de amplitude do um ou mais sinais de sub-banda adicional. Os valores de amplitude podem ser multiplicados por um fator de peso. Por exemplo, cada um dos valores de amplitude do primeiro sinal de sub-banda adicional pode ser multiplicado por 0,95. Por exemplo, cada um dos valores de amplitude do segundo sinal de sub-banda adicional pode ser multiplicado por 0,90, etc.
[000108] Em uma realização adicional, a replicação de banda espectral é estendida para gerar sinais de sub-banda adicionais. Informações de envelope espectral podem ser utilizadas para gerar sinais de sub-banda adicionais a partir dos sinais de sub-banda mais baixa. As informações de envelope espectral podem ser utilizadas para derivar fatores de peso utilizados para serem multiplicados pelos valores de amplitude dos sinais de sub-banda mais baixa considerados na replicação de banda espectral para gerar sinais de sub-banda adicionais.
[000109] A Figura 11 ilustra um aparelho de acordo com outra realização. O aparelho difere do aparelho ilustrado na Figura 1 em que o aparelho da Figura 11 adicionalmente compreende um reamostrador adicional 170. O reamostrador adicional 170 é utilizado para conduzir uma etapa de reamostragem adicional. O reamostrador pode ser um reamostrador convencional ou pode alternativamente ser um aparelho para processar um sinal de áudio que conduza reamostragem e acordo com a invenção. Se, por exemplo, um aparelho de acordo com a invenção for utilizado como um reamostrador adicional, o primeiro aparelho de acordo com a invenção reamostra um sinal de áudio possuindo uma primeira taxa de amostragem sr1 para uma taxa de amostragem sr2 = c2/ c1 • sr1. Então, o reamostrador adicional reamostra o sinal de áudio de uma taxa de amostragem sr2 para uma taxa de amostragem sr2’ = c4/c3 • sr2 = c4/ c3 • c2/ c1 • sr1. Ao empregar dois reamostradores, evita- se que um reamostrador de acordo com uma das realizações acima descritas tenha c1 • c3 canais de análise e c4 • c2 canais de síntese. Por exemplo, se um fator de reamostragem de 998000/996003 for desejado (o fator de reamostragem é a relação da taxa de amostragem do sinal de áudio após a síntese para a taxa de amostragem do sinal de áudio antes da análise), então, um aparato compreendendo dois reamostradores evita que 996003 canais de banco de filtros de análise e 998000 canais de banco de filtros de síntese sejam necessários. Em vez disso, uma primeira reamostragem pode ser conduzida por um filtro de análise possuindo 999 canais de bancos de filtros e um banco de filtros de síntese possuindo 1000 canais e uma segunda reamostragem pode ser conduzida por um banco de filtros de análise possuindo 997 canais e um banco de filtros de síntese possuindo 998 canais.
[000110] Na realização, o controlador 150 pode ser adaptado para orientar como dividir o fator de reamostragem em valores de canais de banco de filtros de análise e síntese adequados.
[000111] A Figura 12 ilustra o QMF como um reamostrador de acordo com uma realização. Um exemplo de um estágio de síntese de QMF com um pós-amostrador para ajustar a taxa de amostragem de saída do QMF é ilustrado.
[000112] Se a taxa de amostragem após a síntese do QMF não obedecer a uma taxa de amostragem “padrão”, uma combinação de reamostrador com base em QMF e um reamostrador adicional podem ainda ser utilizados para atingir melhores condições de operação para um reamostrador, caso isto seja necessário (por exemplo, taxa de amostragem inteira pequena benigna (ou interpolar entre taxas de amostragem próximas, por exemplo, empregando um interpolador Lagrange).
[000113] Na Figura 13, um reamostrador é ilustrado, compreendendo uma unidade de análise e uma unidade de síntese. Porém, uma vez que tais blocos de construções já estão presentes na maioria dos codecs de áudio atuais, estes blocos de construções já existentes podem ser levemente alterados, por meio de uma entidade de controle, para realizar a tarefa de reamostragem, sem exigir estágios de análise / síntese adicionais apensos ao sistema decodificador. Esta abordagem é mostrada na Figura 14. Em alguns sistemas, pode ser possível alterar levemente fs para atingir pontos de operação mais convenientes e superar restrições de implementação em relação aos fatores de dizimação e sobreamostragem gerais.
[000114] O bloco “Controle de bancos de filtros” mostrado na Figura 13 manipulará os fatores M e N do decodificador para obter a frequência de amostragem de saída desejada fs,final. Ele toma, como entradas, a frequência de amostragem de saída desejada fs,final, a frequência de amostragem de saída do decodificador de núcleo, e outros conhecimentos sobre o decodificador. Pode ser desejado que a frequência de amostragem fs,final seja constante, e corresponda ao hardware do dispositivo de saída, enquanto que, da perspectiva do codec, pode ser desejável alterar devido aos aspectos de eficiência de codificação. Ao juntar o reamostrador ao decodificador, ambos os requisitos, uma taxa de amostragem de saída fixa na saída e melhor taxa de amostragem de operação do codec de áudio, podem ser cumpridos praticamente sem complexidade adicional e sem sinais de degradação devido ao processamento de reamostrador adicional.
[000115] O protótipo do QMF para os diferentes comprimentos pode ser criado a partir de uma dos QMF de 64 bandas por interpolação.
[000116] A complexidade de um banco de filtros está diretamente relacionada ao seu comprimento. Se uma transformada de síntese de sinal no domínio do tempo de banco de filtros for modificada para subamostragem ao reduzir o comprimento da transformada, sua complexidade diminuirá. Se for utilizado para sobreamostragem ao aumentar seu comprimento de transformada, sua complexidade aumentará, porém ainda muito abaixo da complexidade necessária para um reamostrador adicional com características de distorção de sinal equivalentes.
[000117] A Figura 15 ilustra um aparelho de acordo com uma realização adicional, em que o aparelho é adaptado para inserir uma saída do banco de filtros de síntese no banco de filtros de análise para conduzir outro ciclo de transformação. Conforme na realização da Figura 1, um sinal de áudio processado s1 é inserido em um banco de filtros de análise 120, onde o sinal de áudio é transferido de um domínio do tempo para um domínio tempo- frequência. O banco de filtros de síntese, então, transforma o sinal de áudio no domínio tempo-frequência de volta ao domínio do tempo, em que o número de canais de banco de filtros de síntese c2 é diferente do número de canais de banco de filtros de análise c1, para gerar um sinal de saída s2, com uma taxa de amostragem diferente do que a do sinal de entrada. Ao contrário da realização da Figura 1, entretanto, o sinal de saída pode não ser inserido no segundo processador de sinais de áudio 140, mas sim, pode ser inserido novamente em um banco de filtros de análise para conduzir uma reamostragem adicional do sinal de áudio por um banco de filtros de análise e um banco de filtros de síntese. Diferentes bancos de filtros de análise e bancos de filtros de síntese (por exemplo, instâncias de banco de filtros de análise e instâncias de banco de filtros de síntese) podem ser empregados em etapas de análise/síntese subsequentes. O controlador 150 pode controlar o número de canais de banco de filtros de análise e síntese c1, c2, de modo que os números sejam diferentes na segunda etapa de análise/síntese do que na primeira etapa de análise/síntese. Através disto, a taxa de amostragem total pode ser qualquer uma escolhida arbitrariamente, de modo que ela resulte em (c2 • c4 • c6 • c8 • ...) / (c1 • c3 • c5 • c7 • ...) , em que c1, c2, c3, ... são valores inteiros.
[000118] A reamostragem de um sinal de áudio possuindo uma primeira taxa de amostragem sr1, de modo que ele possua uma segunda taxa de amostragem sr2 após a reamostragem, pode não ser fácil de se realizar. Por exemplo, no caso em que uma frequência de amostragem de 22050 Hz deva ser reamostrada em uma frequência de 23983 Hz, deve ser computacionalmente caro realizar um banco de filtros de análise possuindo 22050 canais e um banco de filtros de síntese possuindo 23983 canais. Entretanto, embora seja desejável realizar exatamente a frequência de amostragem de saída de 23983 Hz, o usuário (ou outro aplicativo) pode tolerar um erro contanto que esteja dentro de limites aceitáveis.
[000119] A Figura 16 ilustra um controlador de acordo com outra realização. Uma primeira taxa de amostragem sr1 e uma segunda taxa de amostragem desejada sr2 são inseridas no controlador. A primeira taxa de amostragem especifica a taxa de amostragem de um sinal de áudio (processado) s1 que é inserido em um banco de filtros de análise. A segunda taxa de amostragem desejada sr2 especifica uma taxa de amostragem desejada que o sinal de áudio s2 deve exibir ao ser emitido por um banco de filtros de síntese. Além disso, um erro tolerável e também é inserido no controlador. O erro tolerável e especifica a que grau uma taxa de amostragem real sr2 de um sinal emitido por um banco de filtros de síntese pode desviar da taxa de amostragem desejada sr2.
[000120] A primeira taxa de amostragem sr1 e a segunda taxa de amostragem desejada sr2 são inseridas em um selecionador de número de canais de síntese 1010. O selecionador de número de canais de síntese 1010 seleciona um número de canais adequado c2 do banco de filtros de síntese. Alguns dos números dos canais de banco de filtros de síntese c2 podem ser particularmente adequados para permitir computação rápida, da transformação do sinal de um domínio tempo-frequência para um domínio do tempo, por exemplo, 60, 72, 80 ou 48 canais. O selecionador de número de canais de síntese 1010 pode selecionar o número de canais c2 dependendo da primeira e da segunda taxas de amostragem sr1, sr2. Por exemplo, se a taxa de reamostragem for um número inteiro, por exemplo 3 (resultando, por exemplo, das taxas de amostragem sr1 = 16000 Hz e sr2=48000 Hz), pode ser suficiente que o número de canais de síntese seja um número pequeno, por exemplo, 30. Em outras situações, pode ser mais útil selecionar um maior número de canais de síntese, por exemplo, se as taxas de amostragem forem altas e se a relação de taxas de amostragem não for um número inteiro (por exemplo, se sr1 = 22050 Hz e sr2 for 24000 Hz): Em tal caso, o número de canais de síntese pode, por exemplo, ser selecionado como c2 = 2000).
[000121] Em realizações alternativas, somente a primeira taxa de amostragem sr1 ou a segunda taxa de amostragem sr2 é inserida no selecionador de número de canais de síntese 1010. Em outras realizações adicionais, nem a primeira sr1 nem a segunda sr2 taxas de amostragem são inseridas no selecionador de número de canais de síntese 1010, e o selecionador de número de canais de síntese 1010, então, seleciona um número de canais de síntese c2 independente das taxas de amostragem sr1, sr2.
[000122] O selecionador de número de canais de síntese 1010 insere o número de canais de síntese selecionado c2 em uma calculadora de número de canais de análise 1020. Além disso, a primeira e a segunda taxas de amostragem sr1 e sr2 são também inseridas na calculadora de número de canais de análise 1020. A calculadora de número de canais de análise calcula o número de canais de banco de filtros de análise c1 dependendo da primeira e da segunda taxa de amostragem sr1 e sr2, e o número de canais de síntese c2 de acordo com a fórmula:
[000123] c1 = c2 • sr1/ sr2.
[000124] Frequentemente, pode surgir a situação em que o número calculado c1 não é um número inteiro, mas um valor diferente de um número inteiro. Entretanto, o número de canais de banco de filtros de análise (bem como o número de canais de banco de filtros de síntese) deve ser um número inteiro. Por exemplo, se uma primeira taxa de amostragem sr1 for sr1 = 22050 Hz, a segunda taxa de amostragem desejada sr2 for sr2 = 24000 Hz e o número de canais de banco de filtros de síntese c2 for selecionado de modo que c2 = 2000, então, o número de canais de análise calculado c1 é c1 = c2 • sr1/ sr2 = 2000 • 22050/24000 = 1837,5 canais de análise. Portanto, deve ser tomada uma decisão entre o banco de filtros de análise compreender 1837 ou 1838 canais.
[000125] Diferentes estratégias de arredondamento podem ser aplicadas:
[000126] De acordo com uma realização, uma primeira estratégia de arredondamento é aplicada, de acordo com a qual o próximo menor valor inteiro é selecionado como um número de canais de análise, se o valor calculado não for um número inteiro. Por exemplo, um valor calculado de 1837,4 ou 1837,6 seria arredondado para 1837.
[000127] De acordo com outra realização, uma segunda estratégia de arredondamento é aplicada, de acordo com a qual o próximo maior valor inteiro é selecionado como um número de canais de análise, se o valor calculado não for um número inteiro. Por exemplo, um valor calculado de 1837,4 ou 1837,6 seria arredondado para 1838.
[000128] De acordo com uma realização adicional, é aplicado arredondamento aritmético. Por exemplo, um valor calculado de 1837,5 seria arredondado para 1838, e um valor calculado de 1837,4 seria arredondado para 1837.
[000129] Entretanto, como não é possível aplicar no exemplo “1837,5” o valor exato do cálculo como o número de canais de banco de filtros de análise, não a segunda taxa de amostragem desejada sr2, mas sim uma segunda taxa de amostragem real desviada sr2’, será obtida.
[000130] O controlador da realização da Figura 16 compreende uma calculadora da taxa de amostragem dois 1030, a qual calcula a segunda taxa de amostragem real sr2’ com base na primeira taxa de amostragem sr1, o número de canais de banco de filtros de síntese escolhido c2 e o número de canais de banco de filtros de análise calculado c1, de acordo com a fórmula:
[000131] sr2‘ = c2/ c1 • sr1.
[000132] Por exemplo, no exemplo descrito acima, supondo que a primeira taxa de amostragem sr1 é sr1 =22050 Hz, que o número de canais de banco de filtros de síntese for c2 = 2000 e selecionando o número de canais de banco de filtros de análise c1 como 1838, isto resulta em uma segunda taxa de amostragem real de:
[000133] sr2’ = c2/ c1 • sr1 = 2000/1838 • 22050 Hz = 23993,47 Hz em vez dos desejados 24000 Hz.
[000134] A aplicação de um banco de filtros de análise possuindo 1837 canais resultaria em uma segunda taxa de amostragem real de:
[000135] sr2’ = c2/ c1 • sr1 = 2000/1837 • 22050 Hz = 24006,53 Hz em vez dos desejados 24000 Hz.
[000136] A segunda taxa de amostragem real sr2’ do sinal de áudio sendo emitido0 pelo banco de filtros de síntese e a taxa de amostragem desejada sr2 são inseridos em uma calculadora de erro 1040. A calculadora de erro calcula um erro real e’ representando a diferença entre a taxa de amostragem desejada sr2 e a taxa de amostragem real sr2’ de acordo com a definição de canais de banco de filtros de análise e síntese selecionada.
[000137] Em uma realização, o erro real e’ pode ser um valor absoluto da diferença entre a taxa de amostragem desejada sr2 e a taxa de amostragem real, de acordo com a fórmula:
[000138] e’ = | sr2 - sr2’ |.
[000139] Em outra realização, o erro real e’ pode ser um valor relativo, por exemplo, calculado de acordo com a fórmula:
[000140] e’ = | (sr2 - sr2’) / sr2 |.
[000141] A calculadora de erro, então, passa o erro real e’ para um comparador de erro 1050. O comparador de erro, então, compara o erro real e’ com o erro tolerável e. Se o erro real e’ estiver dentro dos limites definidos pelo erro tolerável, por exemplo, se | e’ | < |e|, então, o compandor de erro 1050 instrui um passador de número de canais 1060 a passar o número calculado real de canais de banco de filtros de análise para o banco de filtros de análise, e o número determinado de canais de banco de filtros de síntese ao banco de filtros de síntese, respectivamente.
[000142] Entretanto, se o erro real e’ estiver dentro dos limites definidos pelo erro tolerável, por exemplo, se | e’ | > |e|, então, o comparador de erro 1060 inicia o processo de determinação do início, e instrui o selecionador de número de canais de síntese 1010 a selecionar um número de canais de síntese diferente como o número de canais de banco de filtros de síntese.
[000143] Diferentes realizações podem realizar diferentes estratégias para selecionar um novo número de canais de síntese. Por exemplo, em uma realização, um número de canais de síntese pode ser selecionado aleatoriamente. Em outra realização, um número de canais mais alto é selecionado, por exemplo, um número de canais sendo duas vezes o tamanho do número de canais de síntese que foi selecionado pelo selecionador de número de canais de síntese 1010, antes. Por exemplo, sr2 := 2 • sr2. Por exemplo, no exemplo acima mencionado, o número de canais sr2=2000 é substituído por sr2 := 2 • sr2 = 2 • 2000 = 4000.
[000144] O processo continua até que um número de canais de síntese com um erro real aceitável e’ tenha sido encontrado.
[000145] A Figura 17 ilustra um fluxograma ilustrando um método correspondente. Na etapa 1110, um número de canais de síntese c2 é selecionado. Na etapa 1120, o número de canais de análise c1 é calculado com base no número de canais de síntese c2, na primeira taxa de amostragem sr1 e na taxa de amostragem desejada sr2. Se necessário, é realizado arredondamento para determinar o número de canais de análise c1. Na etapa 1130, a segunda taxa de amostragem real é calculada com base na primeira taxa de amostragem sr1, no número selecionado de canais de banco de filtros de síntese c2, e no número calculado de canais de banco de filtros de síntese c1. Além disso, na etapa 1140, um erro real e’ representando uma diferença entre a segunda taxa de amostragem real sr2’ e a segunda taxa de amostragem desejada sr2 é calculado. Na etapa 1150, o erro real e’ é comparado com um erro tolerável definido e. No caso do erro ser tolerável, o processo continua com a etapa 1160: O número de canais de síntese escolhido é passado para o banco de filtros de síntese, e o número calculado de números de canais de análise é passado ao banco de filtros de análise, respectivamente. Se o erro não for tolerável, o processo continua com a etapa 1110, um novo número de canais de síntese é selecionado, e o processo é repetido até que um número de canais de banco de filtros de análise e síntese adequado foi determinado.
[000146] A Figura 18 ilustra um controlador de acordo com uma realização adicional. A realização da Figura 18 difere da realização da Figura 16 em que o selecionador de número de canais de síntese 1010 é substituído por um selecionador de número de canais de análise 1210, e que a calculadora de número de canais de análise 1020 é substituída por uma calculadora de número de canais de síntese 1220. Em vez de selecionar um número de canais de síntese c2, o selecionador de número de canais de análise 1210 seleciona um número de canais de análise c1. Então, a calculadora de número de canais de síntese 1220 calcula um número de canais de síntese c2 de acordo com a fórmula c2 = c1 • sr2/ sr1. O número de canais de síntese calculado c2 é passado para a calculadora de taxa de amostragem dois 1230, a qual recebe o número de canais de análise c1, a primeira taxa de amostragem sr1 e a segunda taxa de amostragem desejada sr2. Tirando isso, a calculadora de taxa de amostragem dois 1230, a calculadora de erro 1240, o comparador de erro 1250 e o passador de número de canais 1260 correspondem à calculadora de taxa de amostragem dois 1030, à calculadora de erro 1040, ao comparador de erro 1050, e ao passador de número de canais 1060 da realização da Figura 16, respectivamente.
[000147] Embora alguns aspectos foram descritos no contexto de um aparelho, está claro que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa de método ou característica de uma etapa de método. Analogamente, aspectos descritos no contexto de uma etapa de método também representam uma descrição de um bloco ou item ou característica de um aparelho correspondente.
[000148] O sinal decomposto inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão como um meio de transmissão sem fio ou um meio de transmissão com fio, tal como a Internet.
[000149] Dependendo de certas exigências de implementação, as realizações da invenção podem ser implementadas em hardware ou software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, CD, uma memória ROM, uma memória PROM, uma memória EPROM, uma memória EEPROM, ou uma memória FLASH, possuindo sinais de controle legíveis eletronicamente armazenados no(a) mesmo(a), os quais cooperam (ou são capazes de cooperar) com um sistema computador programável, tal que o respectivo método seja realizado.
[000150] Algumas realizações de acordo com a invenção compreendem um portador de dados não transitório possuindo sinais de controle legíveis eletronicamente, os quais são capazes de cooperar com um sistema computador programável, tal que um dos métodos descritos neste documento seja realizado.
[000151] Em geral, as realizações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto de programa de computador for executado em um computador. O código de programa pode, por exemplo, ser armazenado em um portador legível em máquina.
[000152] Outras realizações compreendem o programa de computador para realizar um dos métodos descritos neste documento, armazenado em um portador legível em máquina.
[000153] Em outras palavras, uma realização do método inventivo é, portanto, um programa de computador possuindo um código de programa para realizar um dos métodos descritos neste documento, quando o programa de computador for executado em um computador.
[000154] Uma realização adicional do método inventivo é, por exemplo, um portador de dados (ou um meio de armazenamento digital, ou um meio legível por computador) compreendendo, gravado no mesmo, o programa de computador para realizar um dos métodos descritos neste documento.
[000155] Uma realização adicional do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar um dos métodos descritos neste documento. O fluxo de dados ou sequência de sinais pode, por exemplo, ser configurado(a) para ser transferido(a) através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[000156] Uma realização adicional compreende meios de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado para, ou adaptado para realizar um dos métodos descritos neste documento.
[000157] Uma realização adicional compreende um computador possuindo, instalado no mesmo, o programa de computador para realizar um dos métodos descritos neste documento.
[000158] Em algumas realizações, um dispositivo lógico programável (por exemplo, um FPGA) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos neste documento. Em algumas realizações, um FPGA pode cooperar com um microprocessador para realizar um dos métodos descritos neste documento. Em geral, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[000159] As realizações acima descritas são meramente ilustrativas para os princípios da presente invenção. É entendido que modificações e variações das disposições e detalhes descritos neste documento se tornarão aparentes para outros técnicos no assunto. É a intenção, portanto, ser limitado ao escopo das reivindicações de patente específicos apresentados por realizações neste documento.

Claims (12)

1. APARELHO PARA PROCESSAR UM SINAL DE ÁUDIO, caracterizado por compreender: um primeiro processador de sinais de áudio (110) para processar um sinal de áudio de entrada de acordo com diferentes definições de configurações para adquirir um sinal de áudio processado, em que o aparelho é adaptado de modo que diferentes definições de configurações resultem em diferentes taxas de amostragem do sinal de áudio processado, um banco de filtros de análise (120) adaptado para receber o sinal de áudio processado como um sinal de entrada de banco de filtros de análise, o banco de filtros de análise compreendendo um primeiro número de canais de banco de filtros de análise, em que, o banco de filtros de análise (120) é adaptado para transformar o sinal de entrada do banco de filtros de análise de um domínio de tempo para um domínio de frequência de tempo, um banco de filtros de síntese (130) adaptado para receber saída do banco de filtros de análise, o banco de filtros de síntese compreendendo um segundo número de canais de banco de filtros de síntese para produzir um sinal de áudio resultante, em que o banco de filtros de síntese (130) é adaptado para transformar o saída do banco de filtros de análise do domínio da frequência do tempo para o domínio do tempo para produzir o sinal de áudio resultante, um segundo processador de áudio (140) sendo adaptado para receber e processar o sinal de áudio resultante compreendendo uma taxa de amostragem predeterminada para produzir um sinal de saída digital resultante, e um controlador (150) para controlar o primeiro número de canais de banco de filtros de análise de acordo com uma definição de configuração fornecida ao primeiro processador de sinal de áudio configurável (110), de modo que a saída de sinal de áudio resultante do banco de filtros de síntese (130) compreenda o taxa de amostragem predeterminada ou uma taxa de amostragem sendo diferente da taxa de amostragem predeterminada e estando mais próxima da taxa de amostragem predeterminada do que uma taxa de amostragem do sinal de entrada do banco de filtro de análise (110).
2. Um aparelho de acordo com a reivindicação 1, caracterizado pelo fato do banco de filtros de análise (120) é adaptado para transformar o sinal de entrada do banco de filtros de análise (s1) sendo representado no domínio do tempo em um primeiro sinal de áudio no domínio tempo- frequência possuindo uma pluralidade de primeiros sinais de sub-banda, em que o número de primeiros sinais de sub-banda é igual ao primeiro número (c1) de canais de banco de filtros de análise, em que o aparelho adicionalmente compreende um ajustador de sinais (125) sendo adaptado para gerar um segundo sinal de áudio no domínio tempo-frequência possuindo uma pluralidade de segundos sinais de sub-banda do primeiro sinal de áudio no domínio tempo-frequência com base na definição de configurações (conf), de modo que o número de segundos sinais de sub-banda do segundo sinal de áudio no domínio tempo-frequência é igual ao número (c2) de canais de banco de filtros de síntese, e em que o número de segundos sinais de sub-banda do segundo sinal de áudio no domínio tempo-frequência é diferente do número de sinais de sub-banda do primeiro sinal de áudio no domínio tempo-frequência, e em que o banco de filtros de síntese (130) é adaptado para transformar o segundo sinal de áudio no domínio tempo- frequência em um sinal de áudio no domínio do tempo como a saída de áudio (s2) do banco de filtros de síntese (130).
3. APARELHO, de acordo com a reivindicação 2, caracterizado por o ajustador de sinais (125) ser adaptado para gerar o segundo sinal de áudio no domínio tempo- frequência ao gerar pelo menos um sinal de sub-banda adicional.
4. APARELHO, de acordo com a reivindicação 3, caracterizado por o ajustador de sinais (125) ser adaptado para gerar pelo menos um sinal de sub-banda adicional ao conduzir a replicação de banda espectral para gerar pelo menos um sinal de sub-banda adicional.
5. APARELHO, de acordo com a reivindicação 3, caracterizado por o ajustador de sinais (125) ser adaptado para gerar um sinal zero como sinal de sub-banda adicional.
6. APARELHO, de acordo com a reivindicação 1, caracterizado por o banco de filtros de análise ser um banco de filtros de análise QMF, e em que o banco de filtros de síntese é um banco de filtros de síntese QMF.
7. APARELHO, de acordo com a reivindicação 1, caracterizado por o banco de filtros de análise ser um banco de filtros de análise MDCT, e em que o banco de filtros de síntese é um banco de filtros de síntese MDCT.
8. APARELHO, de acordo com a reivindicação 1, em que o aparelho adicionalmente é caracterizado por compreender um reamostrador adicional (170) sendo adaptado para reamostrar um sinal de saída de banco de filtros de síntese (s2) possuindo uma primeira taxa de amostragem de síntese, para sair um sinal de saída reamostrado possuindo uma segunda taxa de amostragem de síntese.
9. APARELHO, de acordo com a reivindicação 1, caracterizado por o aparelho ser adaptado para inserir um sinal de saída de banco de filtros de síntese possuindo uma primeira taxa de amostragem de síntese em um banco de filtros de análise como um sinal de entrada de banco de filtros de análise.
10. APARELHO, de acordo com a reivindicação 1, caracterizado por o controlador ser adaptado para determinar o primeiro número (c1) de canais de banco de filtros de análise ou o segundo número (c2) de canais de banco de filtros de síntese com base em um erro tolerável (e).
11. APARELHO, de acordo com a reivindicação 10, em que o controlador é caracterizado por compreender um comparador de erro (1050) para comparar o erro real (e') com um erro tolerável (e).
12. Método para processar um sinal de áudio surround, caracterizado por compreender: entrada de um sinal de áudio de acordo com diferentes definições de configurações para adquirir um primeiro sinal de áudio processado, de modo que diferentes definições de configurações resultem em diferentes taxas de amostragem do primeiro sinal de áudio, inserir o primeiro sinal de áudio processado em um banco de filtros de análise e transformar o sinal de entrada do banco de filtros de análise de um domínio de tempo para um domínio de frequência de tempo, receber saída do banco de filtros de análise em um banco de filtros de síntese, para adquirir um sinal de áudio resultante, em que a saída do banco de filtros de análise é transformada do domínio da frequência do tempo para o domínio do tempo para produzir o sinal de áudio resultante, controlar um primeiro número de canais de banco de filtros de análise do banco de filtros de análise de acordo com uma definição de configuração, de modo que a saída do sinal de áudio resultante pelo banco de filtros de síntese compreenda a taxa de amostragem predeterminada ou uma taxa de amostragem sendo diferente da taxa de amostragem predeterminada e estando mais perto da taxa de amostragem predeterminada do que a taxa de amostragem do primeiro sinal de áudio processado, e processar a saída de sinal de áudio resultante compreendendo a taxa de amostragem predeterminada para produzir um sinal de saída digital resultante.
BR122021003884-8A 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf BR122021003884B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US37312610P 2010-08-12 2010-08-12
US61/373,126 2010-08-12
BR112013003303-7A BR112013003303B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
PCT/EP2011/063848 WO2012020090A1 (en) 2010-08-12 2011-08-11 Resampling output signals of qmf based audio codecs

Publications (1)

Publication Number Publication Date
BR122021003884B1 true BR122021003884B1 (pt) 2021-11-30

Family

ID=44630032

Family Applications (5)

Application Number Title Priority Date Filing Date
BR122021003688-8A BR122021003688B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
BR112013003303-7A BR112013003303B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
BR122021003884-8A BR122021003884B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
BR122021003887-2A BR122021003887B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
BR122021003886-4A BR122021003886B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR122021003688-8A BR122021003688B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
BR112013003303-7A BR112013003303B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122021003887-2A BR122021003887B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf
BR122021003886-4A BR122021003886B1 (pt) 2010-08-12 2011-08-11 Reamostrar sinais de saída de codecs de áudio com base em qmf

Country Status (18)

Country Link
US (11) US9595265B2 (pt)
EP (1) EP2603913B1 (pt)
JP (1) JP5665987B2 (pt)
KR (1) KR101517446B1 (pt)
CN (1) CN103270553B (pt)
AR (1) AR082671A1 (pt)
AU (1) AU2011288406B2 (pt)
BR (5) BR122021003688B1 (pt)
CA (1) CA2807889C (pt)
ES (1) ES2501493T3 (pt)
HK (1) HK1186832A1 (pt)
MX (1) MX2013001650A (pt)
MY (1) MY156027A (pt)
PL (1) PL2603913T3 (pt)
RU (1) RU2562434C2 (pt)
SG (1) SG187743A1 (pt)
TW (1) TWI460719B (pt)
WO (1) WO2012020090A1 (pt)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9905236B2 (en) 2012-03-23 2018-02-27 Dolby Laboratories Licensing Corporation Enabling sampling rate diversity in a voice communication system
EP2862165B1 (en) 2012-06-14 2017-03-08 Dolby International AB Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
EP3244406B1 (en) 2013-01-21 2020-12-09 Dolby Laboratories Licensing Corporation Decoding of encoded audio bitstream with metadata container located in reserved data space
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
MX362490B (es) 2014-04-17 2019-01-18 Voiceage Corp Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo.
FR3023646A1 (fr) * 2014-07-11 2016-01-15 Orange Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
ES2727462T3 (es) * 2016-01-22 2019-10-16 Fraunhofer Ges Forschung Aparatos y procedimientos para la codificación o decodificación de una señal multicanal de audio mediante el uso de repetición de muestreo de dominio espectral
EP3475944B1 (en) 2016-06-22 2020-07-15 Dolby International AB Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
EP3276620A1 (en) 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
CN111986685B (zh) * 2020-08-31 2024-06-21 北京百瑞互联技术股份有限公司 一种实现高采样率的音频编解码方法及系统
CN116778950B (zh) * 2023-08-18 2023-11-17 玖益(深圳)医疗科技有限公司 用于音频数据传输的采样率匹配方法、系统及存储介质

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6252909B1 (en) * 1992-09-21 2001-06-26 Aware, Inc. Multi-carrier transmission system utilizing channels of different bandwidth
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6940973B1 (en) * 1999-06-07 2005-09-06 Bell Canada Method and apparatus for cancelling common mode noise occurring in communications channels
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
EP1503371B1 (en) * 2000-06-14 2006-08-16 Kabushiki Kaisha Kenwood Frequency interpolating device and frequency interpolating method
CA2354808A1 (en) * 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
EP1701340B1 (en) 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
CN100492492C (zh) * 2002-09-19 2009-05-27 松下电器产业株式会社 音频解码设备和方法
WO2004093495A1 (en) 2003-04-17 2004-10-28 Koninklijke Philips Electronics N.V. Audio signal synthesis
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP2007503026A (ja) * 2003-05-28 2007-02-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ サブバンドフィルタ処理を用いた透かし埋め込みの装置と方法
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7451091B2 (en) * 2003-10-07 2008-11-11 Matsushita Electric Industrial Co., Ltd. Method for determining time borders and frequency resolutions for spectral envelope coding
JP4966013B2 (ja) * 2003-10-30 2012-07-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号のエンコードまたはデコード
JP4396233B2 (ja) * 2003-11-13 2010-01-13 パナソニック株式会社 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体
WO2005073959A1 (en) * 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
WO2006048814A1 (en) 2004-11-02 2006-05-11 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8180631B2 (en) * 2005-07-11 2012-05-15 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing a unique offset associated with each coded-coefficient
US8295362B2 (en) 2006-01-05 2012-10-23 Broadcom Corporation Method and system for redundancy-based decoding of video content
US7917561B2 (en) 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
US8700387B2 (en) * 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8280731B2 (en) 2007-03-19 2012-10-02 Dolby Laboratories Licensing Corporation Noise variance estimator for speech enhancement
CN100522920C (zh) 2007-05-11 2009-08-05 上海康鹏化学有限公司 4-溴-2,6-二氟苯甲酸的制备方法
US7536249B2 (en) 2007-07-12 2009-05-19 Delphi Technologies, Inc. System and method for a pumping torque estimation model for all air induction configurations
US8548815B2 (en) * 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
EP2045801B1 (en) * 2007-10-01 2010-08-11 Harman Becker Automotive Systems GmbH Efficient audio signal processing in the sub-band regime, method, system and associated computer program
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
DE102008024490B4 (de) 2008-05-21 2011-09-22 Siemens Medical Instruments Pte. Ltd. Filterbanksystem für Hörgeräte
EP2304723B1 (en) * 2008-07-11 2012-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for decoding an encoded audio signal
ES2639716T3 (es) 2009-01-28 2017-10-30 Dolby International Ab Transposición armónica mejorada
TWI597939B (zh) * 2009-02-18 2017-09-01 杜比國際公司 具相位偏移之複數值合成濾波器組
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
TWI591625B (zh) * 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
DE102009036610B4 (de) * 2009-07-09 2017-11-16 Sivantos Pte. Ltd. Filterbankanordnung für eine Hörvorrichtung
CN105017600A (zh) 2014-12-10 2015-11-04 淄博龙沙高分子材料科技有限公司 增粘母料生产工艺

Also Published As

Publication number Publication date
CN103270553B (zh) 2015-08-12
US11961531B2 (en) 2024-04-16
CN103270553A (zh) 2013-08-28
KR101517446B1 (ko) 2015-05-04
US20210174816A1 (en) 2021-06-10
US11361779B2 (en) 2022-06-14
US20220262382A1 (en) 2022-08-18
PL2603913T3 (pl) 2014-11-28
US11804232B2 (en) 2023-10-31
EP2603913B1 (en) 2014-06-11
BR112013003303B1 (pt) 2021-09-28
US11676615B2 (en) 2023-06-13
JP5665987B2 (ja) 2015-02-04
US11790928B2 (en) 2023-10-17
US20190259405A1 (en) 2019-08-22
US11475906B2 (en) 2022-10-18
AU2011288406A1 (en) 2013-03-28
US20220262383A1 (en) 2022-08-18
RU2013110507A (ru) 2014-09-20
CA2807889A1 (en) 2012-02-16
CA2807889C (en) 2016-07-19
RU2562434C2 (ru) 2015-09-10
BR112013003303A2 (pt) 2020-11-17
HK1186832A1 (en) 2014-07-11
US11810584B2 (en) 2023-11-07
SG187743A1 (en) 2013-03-28
BR122021003688B1 (pt) 2021-08-24
AR082671A1 (es) 2012-12-26
BR122021003886B1 (pt) 2021-08-17
BR122021003887B1 (pt) 2021-08-24
AU2011288406B2 (en) 2014-07-31
US20170148462A1 (en) 2017-05-25
WO2012020090A1 (en) 2012-02-16
US20210166710A1 (en) 2021-06-03
JP2013538367A (ja) 2013-10-10
US9595265B2 (en) 2017-03-14
TW201230010A (en) 2012-07-16
TWI460719B (zh) 2014-11-11
MY156027A (en) 2015-12-31
MX2013001650A (es) 2013-03-20
US20130151262A1 (en) 2013-06-13
US20240046942A1 (en) 2024-02-08
US20220262380A1 (en) 2022-08-18
US20210166709A1 (en) 2021-06-03
EP2603913A1 (en) 2013-06-19
ES2501493T3 (es) 2014-10-02
KR20130055657A (ko) 2013-05-28
US20220262381A1 (en) 2022-08-18
US10311886B2 (en) 2019-06-04
US11475905B2 (en) 2022-10-18

Similar Documents

Publication Publication Date Title
BR122021003884B1 (pt) Reamostrar sinais de saída de codecs de áudio com base em qmf
BR112015025092B1 (pt) Sistema de processamento de áudio e método para processar um fluxo de bits de áudio
BR112013008463B1 (pt) Aparelho e método para processar um sinal de áudio e para prover uma granularidade temporal maior para um codec de fala e áudio unificado combinado (usac)
BR112016022466B1 (pt) método para codificar um sinal sonoro, método para decodificar um sinal sonoro, dispositivo para codificar um sinal sonoro e dispositivo para decodificar um sinal sonoro
KR102083768B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
TWI691954B (zh) 控制編碼器及/或解碼器中頻寬之技術

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 11/08/2011, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.