BR112012029132B1 - Representação de sinal de informações utilizando transformada sobreposta - Google Patents

Representação de sinal de informações utilizando transformada sobreposta Download PDF

Info

Publication number
BR112012029132B1
BR112012029132B1 BR112012029132-7A BR112012029132A BR112012029132B1 BR 112012029132 B1 BR112012029132 B1 BR 112012029132B1 BR 112012029132 A BR112012029132 A BR 112012029132A BR 112012029132 B1 BR112012029132 B1 BR 112012029132B1
Authority
BR
Brazil
Prior art keywords
information signal
transform
region
regions
sample rate
Prior art date
Application number
BR112012029132-7A
Other languages
English (en)
Other versions
BR112012029132A2 (pt
Inventor
Markus Schnell
Ralf Geiger
Emmanuel RAVELLI
Eleni FOTOPOULOU
Original Assignee
Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V filed Critical Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V
Publication of BR112012029132A2 publication Critical patent/BR112012029132A2/pt
Publication of BR112012029132B1 publication Critical patent/BR112012029132B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

representação de sinal de informações utilizando transformada sobreposta. um reconstrutor de sinal de informações é configurado para reconstruir, utilizando cancelamento de aliasing, um sinal de informações de uma representação de transformada sobreposta do sinal de informações compreendendo, para cada uma das regiões consecutivas que se sobrepõem do sinal de informações, uma transformada de uma versão janelada da respectiva região, em que o reconstrutor de sinal de informações é configurado para reconstruir o sinal de informações em uma taxa de amostra que altera em um limite 82 entre uma região anterior 84 e uma região posterior 86 do sinal de informações.

Description

RELATÓRIO DESCRITIVO
O presente pedido se refere à representação de sinal de informações utilizando transformadas sobrepostas e, em particular, a representação de um sinal de informações utilizando uma representação de transformada sobreposta do sinal de informações que precisa de cancelamento de aliasing, conforme utilizado, por exemplo, em técnicas de compressão de áudio.
A maioria das técnicas de compressão é designada para um tipo especifico de sinal de informações e condições de transmissão especificas do fluxo de dados comprimido, como atraso máximo permitido e taxa de bits de transmissão disponivel. Por exemplo, na compressão de áudio, os codecs com base em transformada, como AAC, tendem a superar os codecs de dominio de tempo com base em previsão linear, como ACELP, no caso de taxa de bits disponivel maior e no caso de codificação de música ao invés de fala. O codec de USAC, por exemplo, visa abranger uma variedade • maior de cenários de aplicação ao unificar diferentes princípios de codificação de áudio dentro de um codec. Entretanto, seria favorável aumentar mais a adaptatividade para diferentes condições de codificação, como taxa de bits de transmissão disponivel variante, a fim de ser capaz de tirar vantagem disso, de modo’ a alcançar, por exemplo, uma eficiência de codificação maior ou 25 similar.
Da mesma forma, é um objetivo da presente invenção prover esse conceito ao prover um esquema de representação de sinal de informações de transformada sobreposta que permite representar um sinal de informações por uma representação de transformada sobreposta que precisa de cancelamento de aliasing, de modo que seja possivel adaptar a representação de transformada sobreposta à necessidade real, 5 provendo, com isso, a possibilidade de alcançar eficiência de codificação maior.
Esse objetivo é alcançado pelo assunto das reivindicações independentes pendentes.
Os principais pensamentos que levam à presente invenção são os seguintes. Representações de transformada sobreposta de sinais de informações são geralmente utilizadas a fim de formar um pré-estado na codificação eficiente do sinal de informações em termos de, por exemplo, taxa/senso de proporção distorção. Exemplos desses codecs são AAC ou TCX ou similares Representações de transformada sobreposta podem, entretanto, também ser utilizadas para realizar a reamostragem ao concatenar a transformada e retransformada com diferentes resoluções espectrais. De modo geral, as representações de transformada sobreposta que causam aliasing nas partes de sobreposição das retransformadas individuais das transformadas das versões janeladas de regiões de tempo consecutivas do sinal de informações tem uma vantagem em termos do número menor de niveis de coeficiente de transformada a ser codificado, de modo a representar a representação de transformada sobreposta. Em uma forma extrema, as transformadas sobrepostas são "criteriosamente amostradas". Isto é, não aumenta o número de coeficientes na representação de transformada sobreposta comparado ao número de amostra de tempo do sinal de informações. Um exemplo de uma representação de transformada sobreposta é um banco de filtros de MDCT (Transformada Discreta de Cosseno Modificada) ou QMF (Filtros em Espelho de Quadratura). Da mesma forma, é geralmente favorável utilizar essas representações de transformada sobreposta como um pré-estado na codificação eficiente de sinais de informações. Entretanto, também seria favorável ser capaz de permitir que a taxa de amostra na qual o sinal de informações é representado utilizando a representação de transformada sobreposta mude no tempo, de modo a ser adaptada, por exemplo, à taxa de bits de transmissão disponível ou outras condições ambientais. Imagine uma taxa de bits de transmissão disponível variante. Sempre que a taxa de bits de transmissão disponível cair abaixo de algum limite predeterminado, por exemplo, pode ser favorável reduzir a taxa de amostra e, quando a taxa de transmissão disponível crescer novamente, seria favorável ser capaz de aumentar a taxa de amostra na qual a representação de transformada sobreposta representa o sinal de informações. Infelizmente, as partes aliasing que se sobrepõem das retransformadas da representação de transformada sobreposta parecem formar uma barreira em relação a essa alteração da taxa de amostras, essa barreira visa ser superada somente ao interromper completamente a representação de transformada sobreposta em casos de alteração da taxa de amostras. Os inventores da presente invenção, entretanto, perceberam uma solução ao problema delineado acima, permitindo, com isso, o uso eficiente de representações de transformada sobreposta que envolvem aliasing e a variação da taxa de amostra em questão. Em particular, por interpolação, a região anterior e/ou posterior do sinal de informações é reamostrada na parte de cancelamento de aliasing, de acordo com a alteração da taxa de amostra no limite entre ambas as regiões. Um combinador é, então, capaz de realizar o cancelamento de aliasing no limite entre as retransformadas para as regiões anterior e posterior, conforme obtidas pela reamostragem na parte de cancelamento de aliasing. Por essa medida, as alterações de taxa de amostragem são transversas de maneira eficiente evitando qualquer descontinuidade da representação de transformada sobreposta nas alterações/transições da taxa de amostra. Medidas semelhantes também são viáveis no lado da transformada, de modo a gerar adequadamente uma transformada sobreposta.
Utilizando a ideia delineada agora, é possivel prover técnicas de compressão de sinal de informações, como técnicas de compressão de áudio, que têm alta eficiência de codificação sobre uma ampla variação de condições ambientais de codificação, como amplitude de faixa de transmissão disponível, ao adaptar a taxa de amostra transmitida para essas condições, sem penalidade pelos casos de alteração da taxa de amostra em si.
Os aspectos vantajosos da presente invenção são o assunto das reivindicações dependentes do conjunto de reivindicação pendente. Ademais, as realizações preferidas da presente invenção são descritas abaixo em relação às figuras, entre as quais: A Figura la apresenta um diagrama de blocos de um codificador de informações no qual as realizações da presente invenção poderiam ser implementadas; Figura 1b apresenta um diagrama de blocos de um decodificador de sinal de informações, no qual as realizações da presente invenção poderiam ser implementadas; A Figura 2a apresenta um diagrama de blocos de uma possivel estrutura interna do codificador central da Figura la; A Figura 2b apresenta a diagrama de blocos de uma possivel estrutura interna do decodificador central da Figura 1b; A Figura 3a apresenta um diagrama de blocos de uma possivel implementação do reamostrador da Figura la; A Figura 3b apresenta um diagrama de blocos de uma possivel estrutura interna do reamostrador da Figura 1b; A Figura 4a apresenta um diagrama de blocos de um codificador de sinal de informações no qual as realizações da presente invenção poderiam ser implementadas; A Figura 4b apresenta um diagrama de blocos de um decodificador de sinal de informações no qual as realizações da presente invenção poderiam ser implementadas; A Figura 5 apresenta um diagrama de blocos de um reconstrutor de sinal de informações de acordo com uma realização; A Figura 6 apresenta um diagrama de blocos de um transformador de sinal de informações, de acordo com uma realização; A Figura 7a apresenta um diagrama de blocos de um codificador de sinal de informações de acordo com uma realização adicional na qual um reconstrutor de sinal de informações, de acordo com a Figura 5, poderia ser utilizado; A Figura 7b apresenta um diagrama de blocos de um decodificador de sinal de informações, de acordo com uma realização adicional, na qual o reconstrutor de sinal de informações, de acordo com a Figura 5, poderia ser utilizado; A Figura 8 apresenta um esquema que apresenta os cenários de troca de taxa de amostra que ocorrem no codificador e decodif icador de sinal de informações das Figuras 6a e 6b, de acordo com uma realização.
A fim de motivar as realizações da presente invenção adicionalmente descritas abaixo, preliminarmente, as realizações são discutidas dentro dessas realizações do presente pedido podem ser utilizadas e que interpretam a intenção e as vantagens das realizações do presente pedido, descritas mais abaixo claras.
As Figuras la e 1b apresentam, por exemplo, um par de um codificador e um decodificador no qual as realizações subsequentemente explicadas podem ser vantajosamente utilizadas. A Figura la apresenta o codificador, enquanto a Figura 1b apresenta o decodificador. O codificador de sinal de informações 10 da Figura la compreende uma entrada 12 na qual o sinal de informações entra, um reamostrador 14 e um codificador central 16, em que o reamostrador 14 e o codificador central 16 são conectados em série entre a entrada 12 e uma saida 18 do codificador 10. Na saida 18, o codificador 10 produz o fluxo de dados que representa o sinal de informações da entrada 12. Da mesma forma, o decodificador apresentado na Figura 1b com o sinal de referência 20 compreende um decodificador central 22 e um reamostrador 24 que são conectados em série entre uma entrada 26 e uma saida 28 do decodificador 20 da maneira apresentada na Figura lb.
Se a taxa de bits de transmissão disponível para transmitir a saida de fluxo de dados na saida 18 para a entrada 26 do decodificador 20 for alta, ela pode, em termos de codificação de eficiência, ser favorável para representar o sinal de informações 12 dentro do fluxo de dados em uma alta taxa de amostra, abrangendo, com isso, uma ampla faixa espectral do espectro do sinal de informações. Isso é, uma medida de eficiência de codificação, como uma taxa/medida de proporção de distorção pode revelar que uma eficiência de codificação é maior se o codificador central 16 comprime o sinal de entrada 12 em uma taxa de amostra maior quando comparada a uma compressão de uma versão de taxa de amostra menor do sinal de informações 12. Por outro lado, em taxas de bits de transmissão disponíveis menores, pode ocorrer que a medida de eficiência de codificação seja maior ao codificar o sinal de informações 12 em uma taxa de amostra menor. Nesse aspecto, deve ser observado que a distorção pode ser medida de maneira psicoacusticamente motivada, isto é, levando em conta distorções dentro de regiões de frequência perceptualmente mais relevantes de maneira mais intensiva do que dentro de regiões de frequência perceptualmente menos relevantes, isto é, regiões de frequência nas quais o ouvido humano é, por exemplo, menos sensivel. De modo geral, regiões de frequência baixa tendem a ser mais relevantes que regiões de frequência maiores e, da mesma forma, a codificação de taxa de amostra menor exclui componentes de frequência do sinal na entrada 12, que se situa acima de frequência Nyquist de ser codificada, mas, por outro lado, a economia de taxa de bits que resulta disso pode, no sentido de taxa/taxa de distorção, resultar nessa codificação de taxa de amostra menor a ser preferida sobre a codificação de taxa de amostra maior. Discrepâncias semelhantes na significância de distorções entre partes de frequência menor e maior também existem em outros sinais de informações, como sinais de medição ou similares.
Da mesma forma, o reamostrador 14 é para variar a taxa de amostra na qual o sinal de informações 12 é amostrado. Ao controlar adequadamente a taxa de amostra em dependência das condições de transmissão externas, conforme definidas, inter alia, pela taxa de bits de transmissão disponivel entre a saida 18 e entrada 26, o codificador 10 é capaz de alcançar uma eficiência de codificação aumentada apesar da alteração da condição de transmissão externa ao longo do tempo. O decodificador 20, por sua vez, compreende o decodificador central 22 que descomprime o fluxo de dados, em que o reamostrador 24 cuida para que o sinal de informações reconstruído de saida na saida 28 tenha uma taxa de amostra constante novamente.
Entretanto, problemas resultam sempre que uma representação de transformada sobreposta for utilizada no par de codificador/decodificador das Figuras la e 1b. Uma representação de transformada sobreposta que envolve aliasing nas regiões de sobreposição das retransformadas forma uma ferramenta eficiente para codificar, mas devido ao cancelamento de aliasing de tempo necessário, ocorrem problemas se as taxas de amostra alterarem. Vide, por exemplo, as Figuras 2a e 2b. As Figuras 2a e 2b apresentam possíveis implementações para o codificador central 16 e o decodificador central 22 presumindo que ambos são do tipo de codificação de transformada. Da mesma forma, o codificador central 16 compreende um transformador 30 seguido por um compressor 32 e o decodificador central apresentado na Figura 2b compreende um des compres sor 34 seguido, por sua vez, por um retransf ormador 36. As Figuras 2a e 2b não devem ser interpretadas na medida em que não poderiam estar presentes em outros módulos dentro do codificador central 16 e decodificador central 22. Por exemplo, um filtro poderia preceder o transformador 30, de modo que o último transformaria o sinal de informações reamostrado obtido pelo reamostrador 14 não diretamente, mas em uma forma pré-filtrada. Semelhantemente, um filtro tendo uma função de transferência inversa poderia suceder o retransformador 36, de modo que o sinal retransformado poderia ser inversamente filtrado subsequentemente.
O compressor 32 comprimiria a representação de transformada sobreposta resultante produzida pelo transformador 30, como pelo uso de codificação sem perda, como codificação por entropia, incluindo exemplos como a codificação de Huffman ou aritmética, e o descompressor 34 poderia fazer o processo inverso, isto é, descompressão, por exemplo, pela decodificação por entropia, como decodificação de Huffman ou aritmética para obter a representação de transformada sobreposta que é, então, alimentada ao retransformador 36.
No ambiente de codificação da transformada, apresentado nas Figuras 2a e 2b, ocorrem problemas sempre que o reamostrador 14 muda a taxa de amostragem. O problema é menos grave no lado de codificação conforme o sinal de informações 12 é apresentado de qualquer forma, da mesma forma, o transformador 30 poderia ser provido de regiões continuamente amostradas para as transformações individuais, utilizando uma versão janelada das respectivas regiões, mesmo em casos de uma alteração de taxa de amostragem. Umapossivel realização paraimplementar o transformador 30 da mesma forma, é descrita a seguir em relação à Figura 6. De modo geral, o transformador 30 poderia ser provido de uma versão janelada de uma região anterior do sinal de informações em uma taxa de amostragem atual, então, com alimentação do transformador 30 pelo reamostrador 14 com uma próxima região que se sobrepõe parcialmente do sinal de informações, cuja transformada da versão janelada é, então, gerada pelo transformador 30. Não ocorrem problemas adicionais, uma vez que o cancelamento de aliasing de tempo necessário precisa ser feito no retransformador 36 ao invés do transformador 30. No retransformador 36, entretanto, a alteração na taxa de amostragem causa problemas em que o retransformador 36 não é capaz de realizar o cancelamento de aliasing de tempo, uma vez que as retransformadas das regiões seguintes imediatamente mencionadas acima se referem a diferentes taxas de amostragem. As realizações descritas adicionalmente abaixo superam esses problemas. O retransformador 36 pode, de acordo com essas realizações, ser substituído por um reconstrutor de sinal de informações descrito adicionalmente abaixo.
Entretanto, no ambiente descrito em relação às Figuras la e lb, não ocorrem somente problemas no caso do codificador central 16 e do decodificador central 22 que são do tipo de codificação de transformada. Preferencialmente, problemas também podem ocorrer no caso de utilização de bancos de filtro com base em transformada sobreposta para formar os reamostradores 14 e 24, respectivamente. Vide, por exemplo, as Figuras 3a e 3b. As Figuras 3a e 3b apresentam uma realização especifica para realizar reamostradores 14 e 24. De acordo com a realização das Figuras 3a e 3b, ambos os reamostradores são implementados ao utilizar uma concatenação de bancos de filtros de análise 38 e 40, respêctivamente, seguidos pelos bancos de filtros de sintese 32 e 44, respectivamente. Conforme ilustrado nas Figuras 3a e 3b, os bancos de filtros de análise e de sintese 38 a 44 podem ser implementados como bancos de filtros QMF, isto é, bancos de filtros com base em MDCT utilizando QMF para dividir o sinal de informações antecipadamente e reunir o sinal novamente. O QMF pode ser implementado semelhante ao QMF utilizado na parte SBR de MPEG HE-AAC ou AAC-ELD, o que significa que um banco de filtros modulado de múltiplos canais com uma sobreposição de 10 blocos, em que 10 é somente um exemplo. Assim, uma representação de transformada sobreposta é gerada pelos bancos de filtros de análise 38 e 40, e o sinal reamostrado é reconstruído a partir dessa representação de transformada sobreposta no caso dos bancos de filtros de sintese 42 e 44. A fim de produzir uma alteração de taxa de amostragem, o banco de filtros de sintese 42 e banco de filtros de análise 40 podem ser implementados para operar em extensão de transformada variante, em que, entretanto, o banco de filtros ou taxa de QMF, isto é, a taxa na qual as transformadas consecutivas são geradas pelos bancos de filtros de análise 38 e 40, respectivamente, por um lado, e retransformadas pelos bancos de filtros de sintese 42 e 44, respectivamente, por outro lado, é constante e o mesmo para todos os componentes 38 a 44. A alteração da extensão de transformada, entretanto, resulta em uma alteração de taxa de amostragem. Considere, por exemplo, o par de banco de filtros de análise 38 e banco de filtros de sintese 42. Presuma que o banco de filtros de análise 38 opera utilizando uma extensão de transformada constante e um banco de filtros ou taxa de transformada constante. Nesse caso, a representação de transformada sobreposta da saída do sinal de entrada pelo banco de filtros de análise 38 compreende, para cada uma das regiões consecutivas que se sobrepõem do sinal de entrada, tendo extensão de amostra constante, uma transformada de uma versão janelada da respectiva região, as transformadas também tendo uma extensão constante. Em outras palavras, o banco de filtros de análise 38 encaminharia para o banco de filtros de síntese 42 um espectrograma de uma resolução de tempo/frequência constante. A extensão de transformada do banco de filtros de síntese, entretanto, mudaria. Considere, por exemplo, o caso de subamostragem de uma taxa de subamostragem entre a taxa de amostra de entrada na entrada do banco de filtros de análise 38 e a taxa de amostragem da saída de sinal na saída do banco de filtros de síntese 42, a uma segunda taxa de subamostragem. Contanto que a primeira taxa de subamostragem seja válida, a representação de transformada sobreposta ou saída de espectograma pelo banco de filtros de análise 38 seria meramente utilizado de maneira parcial para alimentar as retransformações dentro do banco de filtros de síntese 42. A retransformação do banco de filtros de síntese 42 seria simplesmente aplicada à parte de frequência inferior das transformadas consecutivas dentro do espectrograma do banco de filtros de análise 38. Devido à extensão de transformada menor utilizada na retransformação do banco de filtros de síntese 42, o número de amostras dentro das retransformadas do banco de filtros de síntese 42 também seria menor comparado ao número de amostras tendo sido sujeitas, em grupos das partes de tempo de sobreposição, para transformações no banco de filtros 38, resultando, com isso, em uma taxa de amostragem menor quando comparada à taxa de amostragem original do sinal de informações que entra na entrada do banco de filtros de análise 38. Não ocorreriam problemas contanto que a taxa de subamostragem permaneça a mesma, uma vez que ainda não é problema para o banco de filtros de sintese 42 realizar o cancelamento de aliasing de tempo na sobreposição entre as retransformadas consecutivas e as regiões consecutivas que se sobrepõem do sinal de saida na saida do banco de filtros 42.
Ocorre problema sempre que uma alteração na taxa de subamostragem ocorre, como a alteração de uma primeira taxa de subamostragem para uma segunda taxa de subamostragem maior. Nesse caso, a extensão de transformada utilizada dentro da retransformação do banco de filtros de sintese 42 seria ainda reduzida, resultando, com isso, em uma taxa de amostragem ainda menor para as respectivas regiões subsequentes após um ponto de alteração de taxa de amostragem no tempo. Novamente, ocorrem problemas para o banco de filtros de sintese 42, uma vez que o cancelamento de aliasing de tempo entre a retransformada referente à região imediatamente anterior ao ponto de alteração da taxa de amostra no tempo e a retransformada em relação à região do sinal reamostrado que sucede imediatamente o ponto de alteração da taxa de amostra no tempo, atrapalha o cancelamento de aliasing de tempo entre as retransformadas em questão. Da mesma forma, não ajuda muito que problemas semelhantes não ocorram no lado de decodif icação, onde o banco de filtros de análise 40 com uma extensão de transformada variante precede o banco de filtros de síntese 44 de extensão de transformada constante. Aqui, o banco de filtros de síntese 44 se aplica ao espectrograma de taxa de QMF/transformada constante, mas de resolução de frequência diferente, isto é, as transformadas consecutivas encaminhadas do banco de filtros de análise 40 para o banco de filtros de síntese 44 em uma taxa constante, mas com uma extensão de transformada diferente ou variante no tempo para preservar a parte de frequência menor de toda a extensão de transformada do banco de filtros de síntese 44 com preenchimento da parte de frequência maior de toda a extensão de transformada com zeros. O cancelamento de aliasing de tempo entre as retransformadas consecutivas produzidas pelo banco de filtros de síntese 44 não é problemático, uma vez que a taxa de amostragem da saída de sinal reconstruída na saída do banco de filtros de síntese 44 tem uma taxa de amostra constante. Assim, novamente há um problema em tentar realizar a variação/adaptação da taxa de amostra apresentada acima em relação às Figuras la e 1b, mas esses problemas podem ser superados ao implementar o banco de filtros inverso ou de síntese 42 da Figura 3a, de acordo com algumas das realizações subsequentemente explicadas para um reconstrutor de sinal de informações.
Os pensamentos acima em relação a uma adaptação/variação de taxa de amostragem são ainda mais interessantes ao considerar conceitos de codificação de acordo com os quais uma parte de frequência maior de um sinal de informações a ser codificado é codificada de maneira paramétrica, por exemplo, ao utilizar Replicação de Faixa Espectral (SBR), enquanto uma parte de frequência menor disso é codificada utilizando codificação de transformada e/ou codificação preditiva ou similar. Vide, por exemplo, as Figuras 4a e 4b que apresentam um par de codificador de sinal de informações e decodificador de sinal de informações. No lado da codificação, o codificador central 16 sucede um reamostrador realizado conforme apresentado na Figura 3a, isto é, uma concatenação de um banco de filtros de análise 38 e o banco de filtros de sintese de extensão de transformada variante 42. Conforme observado acima, a fim de alcançar uma taxa de subamostra variante no tempo entre a entrada do banco de filtros de análise 38 e a saida do banco de filtros de sintese 42, o banco de filtros de sintese 42 aplica sua retransformação em uma subparte do espectro de variação constante, isto é, as transformadas de extensão constante e taxa de transformada constante 46, saida pelo banco de filtros de análise 38, cujas subpartes têm o comprimento variante no tempo da extensão de transformada do banco de filtros de sintese 42. A variação de tempo é ilustrada pela seta de duas pontas 48. Embora a parte de frequência menor 50 reamostrada pela concatenação do banco de filtros de análise 38 e do banco de filtros de sintese 42 seja codificada pelo codificador central 16, o restante, isto é, a parte de frequência maior 52 que compensa a parte de frequência restante do espectro 46, pode ser sujeito a uma codificação paramétrica de seu invólucro no codificador de invólucro paramétrico 54. O fluxo de dados central 56 é, portanto, acompanhado por um fluxo de dados de codificação paramétrica 58 produzido por um codificador de invólucro paramétrico 54.
No lado da decodificação, o decodificador, da mesma forma, compreende o decodificador central 22, seguido por um reamostrador implementado conforme apresentado na Figura 3b, isto é, por um banco de filtros de análise 40 seguido por um banco de filtros de sintese 44, com o banco de filtros de análise 40 tendo uma extensão de transformada variante no tempo sincronizada à variação de tempo da extensão de transformada do banco de filtros de sintese 42 no lado da codificação. Enquanto o decodificador central 22 recebe o fluxo de dados central 56 a fim de decodificá- lo, um decodificador de invólucro paramétrico 60 é provido a fim de receber o fluxo de dados paramétrico 58 e derivar disso uma parte de frequência maior 52' , que complementa uma parte de frequência menor 50 de uma extensão de transformada variante, a saber, uma extensão sincronizada à variação de tempo da extensão de transformada utilizada pelo banco de filtros de sintese 42 no lado da codificação e sincronizada à variação da taxa de amostragem produzida pelo decodificador central 22.
No caso do codificador da Figura 4a, é vantajoso que o banco de filtros de análise 38 esteja presente de qualquer forma, de modo que a formação do reamostrador necessite meramente da adição do banco de filtros de sintese 42. Ao trocar a taxa de amostra, é possivel adaptar a proporção da parte de LF do espectro 46, que é sujeito a uma codificação central mais precisa comparada à parte de HF que é sujeita à codificação de invólucro meramente paramétrica. Em particular, a proporção pode ser controlada de maneira eficiência, dependendo de condições externas, como a amplitude de faixa de transmissão disponível para transmitir o fluxo de dados geral ou similar. A variação de tempo controlada no lado da codificação é fácil de sinalizar para o lado da decodificação por meio dos respectivos dados de informação paralelas, por exemplo. Assim, em relação às Figuras la a 4b, foi apresentado que seria favorável se existisse um conceito em mãos que permitisse efetivamente que uma taxa de amostragem mudasse apesar do uso das representações de transformada sobreposta que necessitam de cancelamento de aliasing de tempo. A Figura 5 apresenta uma realização de um reconstrutor de sinal de informações que, se utilizado para implementar o banco de filtros de sintese 42 ou o retransformador 36 na Figura 2b, superaria os problemas delineados acima e alcançaria as vantagens de explorar as vantagens dessa alteração da taxa de amostra, conforme delineado acima.
O reconstrutor de sinal de informações, apresentado na Figura 5, compreende um retransformador 70, um reamostrador 72 e um combinador 74, que são conectados em série na ordem de sua menção, entre uma entrada 76 e uma saida 78 do reconstrutor de sinal de informações 80.
O reconstrutor de sinal de informações, apresentado na Figura 5, é para reconstruir, utilizando cancelamento de aliasing, um sinal de informações de uma representação de transformada sobreposta do sinal de informações que entra na entrada 76. Isto é, o reconstrutor de sinal de informações é para produzir na saida 78 o sinal de informações em uma taxa de amostra variante no tempo utilizando a representação de transformada sobreposta desse sinal de informações, conforme entra na entrada 76. A representação de transformada sobreposta do sinal de informações compreende, para cada uma das regiões de tempo consecutivas que se sobrepõem (ou intervalos de tempo) do sinal de informações, uma transformada de uma versão janelada da respectiva região. Conforme será descrito em mais detalhes abaixo, o reconstrutor de sinal de informações 80 é configurado para reconstruir o sinal de informações em uma taxa de amostra que muda em um limite 82 entre uma região anterior 84 e uma região posterior 86 do sinal de informações 90.
A fim de explicar a funcionalidade dos módulos individuais 70 a 74 de reconstrutor de sinal de informações 80, presume-se preliminarmente que a representação de transformada sobreposta do sinal de informações que entra na entrada 76 tem uma resolução de tempo/frequência constante, isto é, uma resolução constante no tempo e frequência. Posteriormente, outro cenário é discutido.
De acordo com a suposição mencionada agora, a representação de transformada sobreposta poderia ser pensada como a apresentada em 92, na Figura 5. Conforme é apresentado, a representação de transformada sobreposta compreende uma sequência de transformadas que são consecutivas no tempo com uma determinada taxa de transformada Δt. Cada transformada 94 representa uma transformada de uma versão janelada de uma respectiva região de tempo i do sinal de informações. Em particular, como a resolução de frequência é constante no tempo para representação 92, cada transformada 94 compreende um número constante de coeficientes de transformada, a saber, Nk. Isso significa efetivamente que a representação 92 é um espectrograma do sinal de informações compreendendo componentes espectrais Nk ou subfaixas que podem ser ordenadas estritamente ao longo de um eixo espectral k, conforme ilustrado na Figura 5. Em cada componente ou subfaixa espectral, os coeficientes de transformada dentro do espectrograma ocorrem na taxa de transformada Δt.
Uma representação de transformada sobreposta 92 tendo essa resolução de tempo/frequência constante é, por exemplo, produzida pelo banco de filtros de análise QMF, conforme apresentado na Figura 3a. Nesse caso, cada coeficiente de transformada seria de valor complexo, isto é, cada coeficiente de transformada teria uma parte real e uma imaginária, por exemplo. Entretanto, os coeficientes de transformada da representação de transformada sobreposta 92 não são necessariamente de valor complexo, mas também poderia ser somente de valor real, como no caso de uma MDCT pura. Além disso, é observado que a realização da Figura 5 também seria transferível a outras representações de transformada sobreposta que causam aliasing nas partes de sobreposição das regiões de tempo, cujas transformadas 94 estão consecutivamente dispostas dentro da representação de transformada sobreposta 92.
O retransformador 70 é configurado para aplicar a retransformação nas transformadas 94 de modo a obter, para cada transformada 94, uma retransformada ilustrada por um respectivo invólucro de tempo 96 para regiões de tempo consecutivas 84 e 86, o invólucro de tempo correspondente grosseiramente à janela aplicada às partes de tempo mencionadas acima do sinal de informações, a fim de produzir a sequência de transformadas 94. Na medida em que a região de tempo anterior 84 é tratada, a Figura 5 presume que o retransformador 70 aplicou a retransformação na transformada completa 94 associada àquela região 84 na representação de transformada sobreposta 92, de modo que a retransformada 96 para a região 84 compreenda, por exemplo, Nk amostras ou amostras Nk duas vezes - em qualquer caso, quanto mais amostras, conforme constituídas, cuja parte janelada da respectiva transformada 94 foi obtida - que amostra toda a extensão temporal Δt • a da região de tempo 84 com o fator a sendo um fator que determina a sobreposição entre as regiões de tempo consecutivas em unidades das quais as transformadas 94 da representação 92 foram geradas. Deve ser observado aqui que a igualdade (ou duplicidade) do número de amostras de tempo dentro da região de tempo 84 e o número de coeficientes de transformada dentro da transformada 94 que pertence àquela região de tempo 84 foi meramente escolhida para fins de ilustração e que a igualdade (ou duplicidade) também pode ser substituída por outra proporção constante entre ambos os números, de acordo com uma realização alternativa, dependendo da transformada sobreposta detalhada utilizada. Agora, presume-se que o reconstrutor de sinal de informações visa alterar a taxa de amostra do sinal de informações entre a região de tempo 84 e a região de tempo 86. A motivação para fazer isso pode se originar de um sinal externo 98. Se, por exemplo, o reconstrutor de sinal de informações 80 é utilizado para implementar o banco de filtros de sintese 42 da Figura 3a e da Figura 4a, respectivamente, o sinal 98 pode ser provido sempre que uma alteração da taxa de amostra prometer uma codificação mais eficiente, como a evolução de uma alteração nas condições de transmissão do fluxo de dados.
No presente caso, para fins de ilustração, presume-se que o reconstrutor de sinal de informações 80 visa reduzir a taxa de amostra entre as regiões de tempo 84 e 86. Da mesma forma, o retransformador 70 também aplica uma retransformação na transformada da versão janelada da região posterior 86, de modo a obter a retransformada 100 para a região posterior 86, mas dessa vez o retransformador 70 usa uma extensão de transformada menor para realizar a retransformação. Para ser mais preciso, o retransformador 70 realiza a retransformação no mais baixo N/ < Nk dos coeficientes de transformada da transformada para a região posterior 86 somente, isto é coeficientes de transformada 1 ... Nk' , de modo que a retransformada 100 obtida compreenda uma taxa de amostra menor, isto é, é amostrado meramente com Nk' ao invés de Nk (ou uma fração correspondente do último número). Conforme é ilustrado na Figura 5, o problema que ocorre entre as retransformadas 96 e 100 é o seguinte. A retransformada 96 para a região anterior 84 e a retransformada 100 para a região posterior 86 sobreposta em uma parte de cancelamento de aliasing 102 em um limite 82 entre as regiões anterior e posterior 84 e 86, com a extensão de tempo da parte de cancelamento de aliasing sendo, por exemplo, (a - 1) • Δt, mas o número de amostras da retransformada 96 dentro dessa parte de cancelamento de aliasing 102 é diferente (nesse mesmo exemplo, é maior que) do número de amostras da retransformada 100 dentro da mesma parte de cancelamento de aliasing 102. Assim, o cancelamento de aliasing de tempo ao realizar a sobreposição-adição de ambas as retransformadas 96 e 100 em que o intervalo de tempo 102 não é direto.
Da mesma forma, o reamostrador 72 é conectado entre o retransformador 70 e o combinador 74, cujo último é responsável para realizar o cancelamento de aliasing de tempo. Em particular, o reamostrador 72 é configurado para reamostrar, por interpolação, a retransformada 96 para a região anterior 84 e/ou a retransformada 100 para a região posterior 86 na parte de cancelamento de aliasing 102, de acordo com a alteração da taxa de amostra no limite 82. Conforme a retransformada 96 atinge a entrada do reamostrador 72 anteriormente que a retransformada 100, pode ser preferível que o reamostrador 72 realize a reamostragem na retransformada 96 para a região anterior 84. Isto é, por interpolação 104, a parte correspondente da retransformada 96, conforme contida dentro da parte de cancelamento de aliasing 102, seria reamostrada de modo a corresponder à condição de amostragem ou posições de amostra da retransformada 100 dentro da mesma parte de cancelamento de aliasing 102. O combinador 74 pode, então, simplesmente adicionar amostras co-localizadas da versão reamostrada da retransformada 96 e da retransformada 100, a fim de obter o sinal reconstruído 90 dentro daquele intervalo de tempo 102 na nova taxa de amostra. Nesse caso, a taxa de amostra na saida sinal reconstruído trocaria da taxa de amostra antiga para a nova na parte final (começo) da parte de tempo 86. Entretanto, a interpolação também poderia ser aplicada de maneira diferente para uma metade inicial e posterior do intervalo de tempo 102, de modo a alcançar outro ponto 82 no tempo para a troca de taxa de amostra no sinal reconstruído 90. Assim, momento no tempo 82 foi desenhado na Figura 5 para estar no meio da sobreposição entre a parte 84 e 86, meramente para fins de ilustração e de acordo com outras realizações, o mesmo ponto no tempo pode existe em algum lugar também entre o inicio da parte 86 e o fim da parte 84, ambos, de maneira inclusiva.
Da mesma forma, o combinador 7 4 é, então, capaz de realizar o cancelamento de aliasing entre as retransformadas 96 e 100 para as regiões anterior e posterior 84 e 86, respectivamente, conforme obtidas pela reamostragem na parte de cancelamento de aliasing 102. Para ser mais preciso, a fim de cancelar o aliasing dentro da parte de cancelamento de aliasing 102, o combinador 74 realiza um processo de sobreposição-adição entre as retransformadas 96 e 100 dentro da parte 102, utilizando a versão reamostrada, conforme obtida pelo reamostrador 72. O processo de sobreposição-adição produz, junto ao janelamento para gerar as transformadas 94, uma reconstrução de aliasing livre e constantemente amplificada do sinal de informações 90 na saida 78 mesmo além do limite 82, mesmo que a taxa de amostra do sinal de informações 90 mude no momento no tempo 82 de uma taxa de amostra maior para uma taxa de amostra menor.
Assim, como se vê da descrição acima da Figura 5, a proporção da extensão de transformada da retransformação aplicada à transformada 94 da versão janelada da região de tempo anterior 84 para uma extensão temporal da região anterior 84 se difere de uma proporção de uma extensão de transformada da retransformação aplicada à versão janelada da região posterior 86 para uma extensão temporal da região posterior 86 por um fator que corresponde à alteração da taxa de amostra no limite 82 entre ambas as regiões 84 e 86. No exemplo descrito agora, essa alteração de proporção foi iniciada de maneira ilustrativa por um sinal externo 98. A extensão temporal das regiões de tempo anterior e sucessiva 84 e 86 foi presumida para ser igual entre elas e o retransformador 70 foi configurado para restringir a aplicação da retransformação na transformada 94 da versão janelada da região posterior 86 em uma parte de frequência baixa disso, como, por exemplo, até o Nk'-nésimo coeficiente de transformada da transformada. Naturalmente, essa captação já poderia ter ocorrido em relação à transformada 94 da versão janelada da região anterior 84, também. Ademais, contrário à ilustração acima, a alteração da taxa de amostra no limite 82 poderia ser realizada em outra direção e, portanto, nenhuma captação pode ser realizada em relação à região posterior 86, mas, ao invés disso, meramente em relação à transformada 94 da versão janelada da região anterior 84.
Para ser mais preciso, até agora, o modo de operação do reconstrutor de sinal de informações da Figura 5 foi descrito de maneira ilustrativa para um caso no qual uma extensão de transformada da transformada 94 da versão janelada das regiões do sinal de informações e a extensão temporal das regiões do sinal de informações são constantes, isto é, a representação de transformada sobreposta 92 foi um espectrograma tendo a resolução de tempo/frequência constante. A fim de localizar o limite 82, o reconstrutor de sinal de informações 80 foi descrito de maneira exemplar para ser responsive a um sinal de controle 98.
Da mesma forma, nessa configuração, o reconstrutor de sinal de informações 80 da Figura 5 poderia ser parte do reamostrador 14 da Figura 3a. Em outras palavras, o reamostrador 14 da Figura 3a poderia ser composto de uma concatenação de um banco de filtros 38 para prover a representação de transformada sobreposta de um sinal de informações, e um banco de filtros inverso compreendendo um reconstrutor de sinal de informações 80 configurado para reconstruir, utilizando cancelamento de aliasing, o sinal de informações da representação de transformada sobreposta do sinal de informações, conforme descrito até agora. O retransformador 70 da Figura 5 poderia, da *mesma forma, ser configurado como um banco de filtros de sintese QMF, com o banco de filtros 38 sendo implementado como banco de filtros de análise QMF, por exemplo.
Conforme se torna claro a partir da descrição das Figuras la e 4a, um codificador de sinal de informações poderia compreender esse reamostrador junto a um estágio de compressão, como o codificador central 16 ou o codificador central de conglomeração 16 e codificador de invólucro paramétrico 54. O estágio de compressão seria configurado para comprimir o sinal de informações reconstruído. Conforme é apresentado na Figuras 1 e 4a, esse codificador de sinal de informações poderia ainda compreender um amostrador de controle de taxa de configurado para controlar o sinal de controle 98 dependendo de uma informação externa na taxa de bits de transmissão disponivel, por exemplo.
Entretanto, de maneira alternativa, o reconstrutor de sinal de informações da Figura 5 poderia ser configurado para localizar o limite 82 ao detectar uma alteração na extensão de transformada da versão janelada das regiões do sinal de informações dentro da representação de transformada sobreposta. A fim de tornar essa possivel implementação mais clara, vide 92' na Figura 5, onde um exemplo de uma representação de transformada sobreposta de entrada é apresentado de acordo com o que as consecutivas transformadas 94 dentro da representação 92' ainda estão chegando no retransformador 70 em uma taxa de transformada constante Δt, mas a extensão de transformada da transformada individual muda. Na Figura 5, por exemplo, presume-se que a extensão de transformada da transformada da versão janelada da região de tempo anterior 84 é maior que (a saber, Nk) a extensão de transformada da transformada da versão janelada da região posterior 86, que é presumida para ser meramente Nk' . De certo modo, o retransformador 70 é capaz de analisar corretamente as informações sobre a representação de transformada sobreposta 92' da entrada fluxo de dados e, da mesma forma, o retransformador 70 pode adaptar uma extensão de transformada da retransformação aplicada na transformada da versão janelada das regiões consecutivas do sinal de informações para a extensão de transformada das transformadas consecutivas da representação de transformada sobreposta 92' . Da mesma forma, o retransformador 70 pode utilizar uma extensão de transformada de Nk para a retransformação da transformada 94 da versão janelada da região de tempo anterior 84, e uma extensão de transformada de um Nk' para a retransformação da transformada da versão janelada da região de tempo sucessiva 86, obtendo, assim, a discrepância de taxa de amostra entre as retransformações que já foram discutidas acima e é apresentado na Figura 5 no meio superior da figura. Da mesma forma, na medida em que o modo de operação do reconstrutor de sinal de informações 80 da Figura 5 é tratado, esse modo de operação coincide com a descrição acima, além da diferença mencionada agora na adaptação da extensão de transformada de retransformação para a extensão de transformada das transformadas dentro da representação de transformada sobreposta 92'.
Assim, de acordo com a última funcionalidade, o reconstrutor de sinal de informações não teria de ser responsive a um sinal de controle externo 98. Preferencialmente, a representação de transformada sobreposta de entrada 92' poderia ser suficiente a fim de informar o reconstrutor de sinal de informações sobre os pontos no tempo de alteração da taxa de amostra.
O reconstrutor de sinal de informações 80 que opera conforme descrito agora poderia ser utilizado a fim de formar o retransformador 36 da Figura 2b. Isto é, um decodificador de sinal de informações poderia compreender um descompressor 34 configurado para reconstruir a representação de transformada sobreposta 92' do sinal de informações de um fluxo de dados. A reconstrução poderia, conforme já descrito acima, envolver decodificação por entropia. A extensão de transformada variante no tempo das transformadas 94 poderia ser sinalizada dentro do fluxo de dados que entra no descompressor 34 de maneira adequada. Um reconstrutor de sinal de informações conforme apresentado na Figura 5 poderia ser utilizado como o reconstrutor 36. Ele poderia ser configurado para reconstruir, utilizando cancelamento de aliasing, o sinal de informações da representação de transformada sobreposta, conforme provida pelo descompressor 34. No último caso, o retransformador 70 poderia, por exemplo, ser realizado para utilizar uma IMDCT, a fim de realizar as retransformações, e a transformada 94 poderia ser representada por coeficientes de valor real, ao invés dos que têm valor complexo.
Assim, as realizações acima permitem o alcance de muitas vantagens. Para codecs de áudio que operam em uma variação completa de taxa de bits, por exemplo, como de 8 kb por segundo a 128 kb por segundo, uma taxa de amostra ideal pode depender da taxa de bits, conforme foi descrito acima em relação à Figura 4a e 4b. Para taxas de bits menores, somente a frequência menor deve, por exemplo, ser codificada com métodos de codificação mais precisos, como ACELP ou codificação de transformada, enquanto as frequências maiores devem ser codificadas de maneira paramétrica Para taxas de bits altas, o espectro completo seria, por exemplo, codificado com os métodos precisos. Isso significaria, por exemplo, que esses métodos precisos devem sempre codificar sinais em uma representação ideal. A taxa de amostra desses sinais deve ser otimizada, permitindo o transporte dos componentes de frequência de sinal mais relevantes, de acordo com o teorema de Nyquist. Assim, veja a Figura 4a. O controlador de taxa de amostra 120 aqui apresentado poderia ser configurado para controlar a taxa de bits de amostra na qual o sinal de informações é alimentado no codificador central 16 dependendo da taxa de bits de transmissão disponivel. Isso corresponde a alimentar somente uma subparte de frequência menor do espectro do banco de filtros de análise no codificador central 16. A parte de frequência maior restante poderia ser alimentada no codificador de invólucro paramétrico 54. A variação de tempo na taxa de amostra e na taxa de bits de transmissão não é, respectivamente, conforme descrito acima, um problema.
A descrição da Figura 5 se refere à reconstrução do sinal de informações que poderia ser utilizada a fim de tratar de um problema de cancelamento de aliasing de tempo nos casos de tempo de alteração da taxa de amostra. Conforme já mencionado acima em relação às Figuras 1 a 4b, algumas medidas tiveram de ser feitas nas interfaces entre os módulos consecutivos nos cenários das Figuras 1 a 4b, onde um transformador deve gerar uma representação de transformada sobreposta, conforme, então, entra no reconstrutor de sinal de informações da Figura 5.
A Figura 6 apresenta essa realização para um transformador de sinal de informações. O transformador de sinal de informações da Figura 6 compreende uma entrada 105 para receber um sinal de informações na forma de uma sequência de amostras, um captador 106 configurado para captar regiões consecutivas que se sobrepõem do sinal de informações, um reamostrador 107 configurado para aplicar uma reamostragem em pelo menos um subconjunto das regiões consecutivas que se sobrepõem, de modo que cada uma das regiões consecutivas que se sobrepõem tenha uma taxa de amostra constante, entretanto, em que a taxa de amostra constante varia entre as regiões consecutivas que se sobrepõem, um janelador 108 configurado para aplicar um janelamento nas regiões consecutivas que se sobrepõem, e um transformador configurado para aplicar uma transformação individualmente nas partes janeladas de modo a obter uma sequência de transformadas 94 que forma a representação de transformada sobreposta 92' que é, então, produzida em uma saida 110 do transformador de sinal de informações da Figura 6. O janelador 108 pode utilizar um janelamento de Hamming ou similares.
O captador 106 pode ser configurado para realizar a captação, de modo que essas regiões consecutivas que se sobrepõem do sinal de informações tenham extensão igual no tempo, como, por exemplo, 20 ms cada.
Assim, o captador 106 encaminha ao reamostrador 107 uma sequência de partes de sinal de informações. Presumindo que o sinal de informações de entrada tem uma taxa de amostra variante no tempo que troca de uma primeira taxa de amostra para uma segunda taxa de amostra em um momento no tempo predeterminado, por exemplo, o reamostrador 107 pode ser configurado para reamostrar, por interpolação, as partes de sinal de informações de entrada que envolvem temporalmente o momento no tempo predeterminado, de modo que as taxas de amostras consecutivas mudem uma vez da primeira taxa de amostra para a segunda taxa de amostra, conforme ilustrado em 111 na Figura 6. Para tornar isso mais claro, a Figura 6 apresenta de maneira ilustrativa uma sequência de amostras 112 na qual a taxa de amostra troca em algum momento no tempo 113, em que as regiões de extensão de tempo constante 114a a 114d são captadas de maneira exemplar com uma compensação de região constante 115 Δt definindo - junto à extensão de tempo de região constante - uma sobreposição predeterminada entre as regiões consecutivas 114a a 114d, como uma sobreposição de 50% por pares consecutivos de regiões, embora isso deva ser meramente entendido como um exemplo. A primeira taxa de amostra antes do momento no tempo 113 é ilustrada com δti e a taxa de amostra após o momento no tempo 113 é indicada por δt2. Conforme ilustrado em 111, o reamostrador 107 pode, por exemplo, ser configurado para reamostrar a região 114b, de modo a ter a taxa de amostra constante δtx, entretanto, em que a região 114c que sucede no tempo é reamostrada para ter a taxa de amostra constante δt2. A principio, pode ser suficiente se o reamostrador 107 reamostra, por interpolação, a subparte das respectivas regiões 114b e 114c, que envolvem temporalmente o momento no tempo 113, que ainda não teve a taxa de amostra alvo. No caso da região 114b, por exemplo, pode ser suficiente se o reamostrador 107 reamostra a subparte dela que sucede no tempo, momento no tempo 113, enquanto, no caso da região 114c, a subparte que precede o momento no tempo 113 pode ser somente reamostrada. Nesse caso, devido à extensão de tempo constante de regiões captadas 114a a 114d, cada região reamostrada tem diversas amostras de tempo NI,2 correspondentes à respectiva taxa de amostra constante δti,2. O janelador 108 pode adaptar sua janela ou extensão de janela para esse número de amostras para cada parte de entrada, e o mesmo se aplica ao transformador 109, que pode adaptar sua extensão de transformada de sua transformação, da mesma forma. Isto é, no caso do exemplo ilustrado em 111, na Figura 6, a representação de transformada sobreposta na saida 110 tem uma sequência de transformadas, cuja extensão de transformada varia, isto é, aumenta ou reduz, em linha com, isto é linear dependente de, o número de amostras das regiões consecutivas e, por sua vez, na taxa de amostra constante na qual a respectiva região foi reamostrada.
Deve ser observado que o reamostrador 107 pode ser configurado de modo que registre a alteração da taxa de amostra entre as regiões consecutivas 114a a 114d, de modo que o número de amostras que têm de ser reamostradas dentro das respectivas regiões seja minimo. Entretanto, o reamostrador 107 pode, de maneira alternativa, ser configurado diferentemente. Por exemplo, o reamostrador 107 pode ser configurado para preferir a subreamostragem sobre a subamostragem ou vice-versa, isto é, para realizar a reamostragem de modo que todas as regiões que se sobrepõem com o momento no tempo 113 sejam reamostradas na primeira taxa de amostra δtT ou na segunda taxa de amostra δt2.
O transformador de sinal de informações da Figura 6 pode ser utilizado, por exemplo, a fim de implementar o transformador 30 da Figura 2a. Nesse caso, por exemplo, o transformador 109 pode ser configurado para realizar uma MDCT.
Nesse aspecto, deve ser observado que a extensão de transformada da transformação aplicada pelo transformador 109 pode ser ainda maior que o tamanho das regiões 114c medidas no número de amostras reamostradas. Nesse caso, as áreas da extensão de transformada que se estendem além das regiões janeladas, produzidas pelo janelador 108, podem ser ajustadas a zero antes de aplicar a transformação nelas pelo transformador 109.
Antes de proceder para descrever possiveis implementações para realizar a interpolação 104 na Figura 5 e a interpolação dentro do reamostrador 107 na Figura 6 em mais detalhes, é feita referência às Figuras 7a e 7b que apresentam possiveis implementações para os codificadores e decodificadores das Figuras la e 1b. Em particular, os reamostradores 14 e 24 são realizados conforme apresentado nas Figuras 3a e 3b, enquanto o codificador central e decodificador central 16 e 22, respectivamente, são realizados como um codec que é capaz de trocar entre codificação de transformada com base em MDCT por um lado e codificação CELP, como codificação ACELP, por outro lado. Os ramos de codificação/decodificação com base em MDCT 122 e 124, respectivamente, poderiam ser, por exemplo, um codificador TCX e decodificador TCX, respectivamente. De maneira alternativa, um par de codificador/decodificador de AAC poderia ser utilizado. Para a codificação CELP, um codificador ACELP 126 poderia formar o outro ramo de codificação do codificador central 16, com um decodificador ACELP 128 que forma o outro ramo de decodificação do decodificador central 22. A troca entre ambos os ramos de codificação poderia ser realizada por estrutura por estrutura, como é o caso em USAC [2] ou AMR-WB+ [1] para o texto padrão do qual é feita referência para mais detalhes em relação a esses módulos.
Considerando o codificador e o decodificador das Figuras 7a e 7b como um exemplo especifico adicional, um esquema de permitir uma troca da taxa de amostragem interna para entrar nos ramos de codificação 122 e 126 e para reconstrução pelos ramos de decodificação 124 e 128 é descrito em mais detalhes abaixo. Em particular, o sinal de entrada que entra na entrada 12 pode ter uma taxa de amostra constante, como, por exemplo, 32 kHz. O sinal pode ser reamostrado utilizando o par de banco de filtros de análise e de sintese QMF 38 e 42 da maneira descrita acima, isto é, com uma proporção de análise e de sintese adequada em relação ao número de faixas, como 1,25 ou 2,5, levando a um sinal de tempo interno que entra no codificador central 16 que tem uma taxa de amostra dedicada de, por exemplo, 25,6 kHz ou 12,8 kHz. O sinal subamostrado é, assim, codificado utilizando um dos ramos de codificação de modos de codificação, como, utilizando a representação de MDCT e um esquema de codificação de transformada clássico, no caso de ramo de codificação 122 ou no dominio de tempo, utilizando ACELP, por exemplo, no ramo de codificação 126.
O fluxo de dados assim formado pelos ramos de codificação 126 e 122 do codificador central 16 é produzido e transportado para o lado da decodificação, onde esse é sujeito à reconstrução.
Para trocar a taxa de amostra interna, os bancos de filtro 38 a 44 precisam ser adaptados de estrutura por estrutura, de acordo com a taxa de amostra interna na qual o codificador central 16 e o decodificador central 22 devem operar. A Figura 8 apresenta alguns possiveis cenários de troca, em que a Figura 8 meramente apresenta o caminho de codificação de MDCT do codificador e decodificador.
Em particular, a Figura 8 apresenta que a taxa de amostra de entrada que é presumida para ser de 32 kHz pode ser subamostrada para qualquer dentre 25,6 kHz, 12,8 kHz ou 8 kHz com uma possibilidade adicional de manter a taxa de amostra de entrada. Dependendo da proporção da taxa de amostra escolhida entre a taxa de amostra de entrada e a taxa de amostra interna, há uma proporção de extensão de transformada entre a análise do banco de filtros, por um lado, e sintese do banco de filtros, por outro lado. As proporções são deriváveis das Figuras 8 dentro das caixas sombreadas em cinza: 40 subfaixas nos bancos de filtro 38 e 44, respectivamente, independente da taxa de amostra interna escolhida, e 40, 32, 16 ou 10 subfaixas nos bancos de filtro 42 e 40, respectivamente, dependendo da taxa de amostra interna escolhida. A extensão de transformada da MDCT utilizada dentro do codificador central é adaptada à taxa de amostra interna resultante, de modo que a taxa de transformada resultante ou intervalo de timbre de transformada medido no tempo seja constante ou independente da taxa de amostra interna escolhida. Pode, por exemplo, ser constantemente de 20 ms, resultando em uma extensão de transformada de 640, 512, 256 e 160, respectivamente, dependendo da taxa de amostra interna escolhida.
Utilizando os princípios delineados acima, é possivel trocar a taxa de amostra interna que obedece às seguintes restrições em relação à troca de banco de filtros:
Não é causado atraso adicional durante uma troca; - A troca ou alteração da taxa de amostra pode acontecer de maneira instantânea; - Os artefatos de troca são minimizados ou, pelo menos, reduzidos; e - A complexidade computacional é baixa.
Basicamente, os bancos de filtro 38-44 e a MDCT dentro do codificador central, são transformadas sobrepostas em que os bancos de filtro podem utilizar uma sobreposição maior das regiões janeladas quando compradas à MDCT do codificador e decodificador central. Por exemplo, uma sobreposição de 10 vezes pode se aplicar para os bancos de filtro, enquanto uma sobreposição de duas vezes pode se aplicar para a MDCT 122 e 124. Para transformadas sobrepostas, os buffers de estado podem ser descritos como um buffer de janela de análise para os bancos de filtros de análise e MDCTs, e buffers de sobreposição-adição para os bancos de filtros de sintese e IMDCTs. No caso de troca de taxa, esses buffers de estado devem ser ajustados de acordo com a troca de taxa de amostra da maneira que foi descrita acima em relação à Figura 5 e à Figura 6. A seguir, é provida uma discussão mais detalhada em relação à interpolação que também pode ser realizada no lado de análise discutido na Figura 6, ao invés do caso de sintese, discutido em relação à Figura 5. O protótipo ou janela da transformada sobreposta pode ser adaptado. A fim de reduzir os artefatos de troca, os componentes de sinal nos buffers de estado devem ser preservados, a fim de manter a propriedade de cancelamento de aliasing da transformada sobreposta.
A seguir, é provida uma descrição mais detalhada de como realizar a interpolação 104 dentro do reamostrador 72.
Dois casos podem ser distinguidos: 1) A troca para cima é um processo de acordo com o qual a taxa de amostra aumenta da parte de tempo anterior 84 para uma parte de tempo subsequente ou que sucede 86. 2) A troca para baixo é um processo de acordo com o qual a taxa de amostra reduziu da região de tempo anterior 84 para região de tempo que sucede 86.
Presumindo uma troca para cima, isto é, como de 12,8 kHz (256 amostras por 20 ms) para 32 kHz (640 amostra por 20 ms), os buffers de estado, como o buffer de estado do reamostrador 72 apresentado de maneira ilustrativa com o sinal de referência 130 na Figura 5, ou seu conteúdo precisa ser expandido por um fator correspondente à alteração da taxa de amostra, como 2,5 no exemplo dado. Possíveis soluções para uma expansão sem causar atraso adicional são, por exemplo, uma interpolação linear ou interpolação spline. Isto é, o reamostrador 72 pode, precisamente, interpolar as amostras da ponta da retransformada 96 que se refere à região de tempo anterior 84, conforme existe dentro do intervalo de tempo 102, dentro do buffer de estado 130. O buffer de estado, pode, conforme ilustrado na Figura 5, funcionar como um buffer que entra primeiro e que sai primeiro. Naturalmente, nem todos os componentes de frequência que são necessários para um cancelamento de aliasing completo podem ser obtidos por esse procedimento, mas, pelo menos, uma frequência menor, como, por exemplo, de 0 a 6,4 kHz, pode ser gerada sem quaisquer distorções e, a partir de um ponto de vista psicoacústico, essas frequências são as mais relevantes.
Para os casos de troca para baixo para taxas de amostra menores, a interpolação linear ou spline também pode ser utilizada para dizimar o buffer de estado da mesma forma, sem causar atraso adicional. Isto é, o reamostrador 72 pode dizimar a taxa de amostra por interpolação. Entretanto, uma troca para baixo para taxas de amostra nas quais o fator de dizimação é amplo, como a troca de 32 kHz (640 amostras por 20 ms) para 12,8 kHz (256 amostras por 20 ms), onde o fator de dizimação é 2,5, pode causar aliasing de deturpação grave se os componentes de alta frequência não forem removidos. Para ocorrer esse fenômeno, a filtração de sintese pode ser dedicada, onde componentes de frequência maiores podem ser removidos por "nivelação" do banco de filtros ou retransformador. Isso significa que o banco de filtros sintetiza menos componentes de frequência no momento da troca e, portanto, limpa o buffer de sobreposição-adição de componentes espectrais altos. Para ser mais preciso, imagine uma troca para baixo de uma primeira taxa de amostra para a região de tempo anterior 84 para uma taxa de amostra menor para a região de tempo que sucede 86. Desviando-se da descrição acima, o retransformador 70 pode ser configurado para preparar a troca para baixo, não deixando com que todos os componentes de frequência da transformada 94 da versão janelada da região de tempo anterior 84 participe na retransformação. Preferencialmente, o retransformador 70 pode excluir componentes de alta frequência não relevantes da transformada 94 da retransformação, ao ajustá-los a 0, por exemplo ou de outra forma, reduzindo sua influência na retransformada, como ao atenuar gradualmente esses componentes e frequência maiores de maneira crescente. Por exemplo, os componentes de alta frequência afetados podem ser os componentes de frequência acima N/ . Da mesma forma, no sinal de informações resultante, uma região de tempo 84 foi construída de maneira intencional em uma amplitude de faixa espectral que é menor que a amplitude de faixa que estaria disponivel na entrada da representação de transformada sobreposta na entrada 76. Por outro lado, entretanto, os problemas de aliasing que ocorrem de outra forma no processo de sobreposição-adição ao introduzir sem intenção as partes de frequência maiores no processo de cancelamento de aliasing dentro do combinador 74, apesar da interpolação 104, podem ser evitados.
Como uma alternativa, uma representação de amostra baixa adicional pode ser gerada simultaneamente para ser utilizada em um buffer de estado adequado para uma troca de uma representação de taxa de amostra maior. Isso garantiria que o fator de dizimação (no caso, a dizimação seria necessária) seja sempre mantido relativamente baixo (isto é, menor que 2) e, portanto, artefatos de deturpação, causados da aliasing, não ocorrerão. Conforme mencionado antes, isso não preservaria todos os componentes de frequência, mas, pelo menos, as frequências menores que são de interesse em relação à relevância psicoacústica.
Assim, de acordo com uma realização especifica, seria possivel modificar o codec de USAC da seguinte forma, a fim de obter uma versão de atraso baixo de USAC. Primeiramente, somente os modos de codificação TCX e ACELP poderiam ser permitidos. Os modos AAC poderiam ser evitados. A extensão da estrutura poderia ser selecionada para obter uma estruturação de 20 ms. Então, os seguintes parâmetros de sistema poderiam ser selecionados dependendo do modo de operação (faixa super ampla (SWB), faixa ampla (WB), faixa estreita (NB), amplitude de faixa completa (FB)) e da taxa de bits. Uma visão geral dos parâmetros de sistema é dada na seguinte tabela.
Figure img0001
No que diz respeito ao modo de faixa estreita, o aumento da taxa de amostra poderia ser evitado e substituído ao ajustar a taxa de amostragem interna para ser igual â taxa de amostragem de entrada, isto é 8 kHz, com a seleção da extensão da estrutura da mesma forma, isto é, para ser 160 amostras longa. Da mesma forma, 16 kHz poderia ser escolhido para o modo de operação de faixa ampla com a seleção da extensão da estrutura da MDCT para TCX para ser 320 amostras longa, ao invés de 256.
Em particular, seria possivel superar a operação de troca por meio de uma lista inteira de pontos de operação, isto é, taxas de amostragem suportadas, taxas de bits e amplitudes de faixa. A seguinte tabela delineia as diversas configurações em relação à taxa de amostragem interna de uma versão de atraso baixo antecipada agora de um codec USAC.
Figure img0002
Tabela que a apresenta a matriz de modos de taxa de amostragem interna de um codec USAC de atraso baixo
Como uma informação paralela, deve ser observado que o reamostrador de acordo com a Figura 2a e 2b não precisa ser utilizado. Um conjunto de filtro IIR poderia ser provido de maneira alternativa para presumir a responsabilidade da funcionalidade de reamostragem da taxa de amostragem de entrada para a frequência de amostragem central dedicada. 0 atraso desses filtros IIR está abaixo de 0,5 ms, mas devido â proporção impar entre a frequência de entrada e de saida, a complexidade é bastante considerável. Presumindo um atraso idêntico para todos os filtros IIR, a troca entre diferentes taxas de amostragem pode ser permitida.
Da mesma forma, o uso da realização do reamostrador da Figura 2a e 2b pode ser preferido. O banco de filtros QMF do módulo de invólucro paramétrico (isto é, SBR) pode participar em cooperação para iniciar a funcionalidade de reamostragem, conforme descrito acima. No caso de SWB, isso adicionaria um estágio de banco de filtros de sintese ao codificador, enquanto o estágio de análise já está em uso, devido ao módulo de codificador de SBR. No lado do decodificador, o QMF já é responsável para prover a funcionalidade de sobreamostragem quando a SBR for permitida. Esse esquema pode ser utilizado em todos os outros modos de amplitude de faixa. A tabela a seguir provê uma visão geral das configurações de QMF necessárias.
Figure img0003
Tabela Lista de configuracoes de QMF no lada do codificador (número de faixas de análise/número de faixas de sintese). Outra configuração possivel pode ser obtida ao dividir todos os números por um fator de 2.
Presumindo uma frequência de amostragem de entrada constante, a troca entre as taxas de amostragem internas é permitida ao trocar o protótipo de sintese de QMF. No lado da decodificação a operação inversa pode ser aplicada. Observe que a amplitude de faixa de uma faixa de QMF é idêntica ao longo de toda a variação de pontos de operação.
Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é claro que esses aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou um aspecto de uma etapa do método. De maneira análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item correspondente ou aspecto de um aparelho correspondente. Alguma ou todas as etapas do método podem ser executadas por (ou utilizando) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas realizações, alguma ou mais das etapas do método mais importantes podem ser executadas por esse aparelho.
Dependendo de determinadas exigências de implementação, as realizações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legiveis armazenados nele, que cooperam (ou são capazes de cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser legivel por computador.
Algumas realizações, de acordo com a invenção, compreendem um carregador de dados tendo sinais de controle eletronicamente legiveis, que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos seja realizado.
De modo geral, as realizações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operado para realizar um dos métodos quando o produto de programa de computador executar em um computador. O código de programa pode, por exemplo, ser armazenado em um carregador legivel por máquina.
Outras realizações compreendem o programa de computador para realizar um dos métodos aqui descritos, armazenado em um carregador legivel por máquina.
Em outras palavras, uma realização do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador executar em um computador.
Uma realização adicional dos métodos inventivos é, portanto, um carregador de dados (ou um meio de armazenamento digital ou um meio legivel por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos aqui descritos. O carregador de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitórios.
Uma realização adicional do método inventivo é, portanto, um fluxo de* dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido por meio de uma conexão de comunicação de dados, por exemplo, por meio da Internet.
Uma realização adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado ou adaptado para realizar um dos métodos aqui descritos.
Uma realização adicional compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos aqui descritos.
Uma realização adicional, de acordo com a invenção, compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador para realizar um dos métodos aqui descritos para um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou similares. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador ao receptor.
Em algumas realizações, um dispositivo de lógica programável (por exemplo, uma matriz de porta de campo programável) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos aqui descritos. Em algumas realizações, uma matriz de porta de campo programável pode cooperar com um microprocessador, a fim de realizar um dos métodos aqui descritos. De modo geral, os métodos são preferencialmente realizados por qualquer aparelho de hardware.
As realizações descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações das disposições e dos detalhes aqui descritos serão aparentes aos técnicos no assunto. Portanto, pretende ser limitada somente pelo escopo das reivindicações da patente iminentes e não pelos detalhes específicos apresentados a titulo de descrição e explicação das realizações aqui. Literatura: [1]: 3GPP, "Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions", 2009, 3GPP TS 26.290. [2] : USAC codec (Unified Speech e Audio Codec), ISO/IEC CD 23003-3 dated September 24, 2010

Claims (22)

1. RECONSTRUTOR DE SINAL DE INFORMAÇÕES CONFIGURADO PARA RECONSTRUIR, utilizando o cancelamento de aliasing, um sinal de informações de uma representação de transformada sobreposta do sinal de informações, caracterizado por compreender, para cada uma das regiões consecutivas que se sobrepõem do sinal de informações, uma transformada de uma versão janelada da respectiva região, em que o reconstrutor de sinal de informações é configurado para reconstruir o sinal de informações em uma taxa de amostra que muda em um limite (82) entre uma região anterior (84) e uma região posterior (86) do sinal de informações, o reconstrutor de sinal de informações compreende um retransformador (70) configurado para aplicar uma retransformação na transformada (94) da versão janelada da região anterior (84) de modo a obter uma retransformada (96) para a região anterior (84), e aplicar uma retransformação na transformada da versão janelada da região posterior (86) de modo a obter uma retransformada (100) para a região posterior (86), em que a retransformada (96) para a região anterior (84) e a retransformada (106) para a região posterior (86) se sobrepõem em uma parte de cancelamento de aliasing (102) no limite (82) entre as regiões anterior e posterior; um reamostrador (72) configurado para reamostrar, por interpolação, a retransformada (96) para a região anterior (84) e/ou a retransformada (100) para a região posterior (86) na parte de cancelamento de aliasing (102), de acordo com a alteração da taxa de amostra no limite (82); e um combinador (74) configurado para realizar o cancelamento de aliasing entre as retransformadas (96, 100) para as regiões anterior e posterior (84, 86), conforme obtidas pela reamostragem na parte de cancelamento de aliasing (102).
2. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 1, caracterizado por o reamostrador ser configurado para reamostrar a retransformada (96) para a região anterior na parte de cancelamento de aliasing, de acordo com a alteração da taxa de amostra no limite.
3. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 1 ou 2, caracterizado por a proporção de uma extensão de transformada da retransformação aplicada à transformada (94) da versão janelada da região anterior (84) a uma extensão temporal da região anterior (84) difere de uma proporção de uma extensão de transformada da retransformação aplicada à versão janelada da região posterior (86) a uma extensão temporal da região posterior (86) por um fator correspondente à alteração da taxa de amostra.
4. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 3, caracterizado por as extensões temporais das regiões anterior e posterior (84, 86) serem iguais entre si, e o retransformador (70) é configurado para restringir a aplicação da retransformação na transformada da versão janelada da região anterior (84) para uma parte de frequência baixa da transformada da versão janelada da região anterior e/ou restringir a aplicação da retransformação na transformada da versão janelada da região posterior em uma parte de frequência baixa da transformada da versão janelada da região posterior.
5. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por uma extensão de transformada da transformada da versão janelada das regiões do sinal de informações e uma extensão temporal das regiões do sinal de informações são constantes e o reconstrutor de sinal de informações é configurado para localizar o limite (82) em resposta a um sinal de controle (98).
6. REAMOSTRADOR COMPOSTO DE UMA CONCATENAÇÃO DE UM BANCO DE FILTROS (38) PARA PROVER UMA REPRESENTAÇÃO DE TRANSFORMADA SOBREPOSTA DE UM SINAL DE INFORMAÇÕES, E UM BANCO DE FILTROS INVERSO (42), caracterizado por compreender um reconstrutor de sinal de informações (80) configurado para reconstruir, utilizando o cancelamento de aliasing, o sinal de informações da representação de transformada sobreposta do sinal de informações, de acordo com a reivindicação 5.
7. CODIFICADOR DE SINAL DE INFORMAÇÕES, caracterizado por compreender um reamostrador, de acordo com a reivindicação 6, e um estágio de compressão (16) configurado para comprimir o sinal de informações reconstruído, o codificador de sinal de informações compreendendo ainda um controle de taxa de amostra configurado para controlar o sinal de controle (98) dependendo de uma informação externa na taxa de bits de transmissão disponível.
8. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por a extensão de transformada da transformada da versão janelada das regiões do sinal de informações varies, enquanto uma extensão temporal das regiões do sinal de informações é constante, em que o reconstrutor de sinal de informações é configurado para localizar o limite (82) ao detectar uma alteração na extensão de transformada da versão janelada das regiões do sinal de informações.
9. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 8, caracterizado por o retransformador ser configurado para adaptar uma extensão de transformada da retransformação aplicada na transformada da versão janelada das regiões anterior e posterior para a extensão de transformada da transformada da versão janelada das regiões anterior e posterior.
10. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, caracterizado por compreender um descompressor (34) configurado para reconstruir uma representação de transformada sobreposta de um sinal de informações de um fluxo de dados, e um reconstrutor de sinal de informações, de acordo com a reivindicação 9, configurado para reconstruir, utilizando o cancelamento de aliasing, o sinal de informações da representação de transformada sobreposta.
11. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com qualquer uma das reivindicações 1 a 5, 8 e 9, caracterizado por a transformada sobreposta é amostrada criteriosamente, como uma MDCT.
12. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com qualquer uma das reivindicações 1 a 5, 8 e 9, caracterizado por a representação de transformada sobreposta é um banco de filtros de valor complexo.
13. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com qualquer uma das reivindicações 1 a 5, 8, 9, 11 e 12, caracterizado por o reamostrador é configurado para utilizar uma interpolação linear ou spline para a interpolação.
14. RECONSTRUTOR DE SINAL DE INFORMAÇÕES, de acordo com qualquer uma das reivindicações 1 a 5, 8, 9, 11 e 12, caracterizado por a taxa de amostra diminui no limite (82) e o retransformador (70) é configurado para, ao aplicar a retransformação na transformada (94) da versão janelada da região anterior (84), atenuar ou ajustar a zero frequências maiores da transformada (94) da versão janelada da região anterior (84).
15. TRANSFORMADOR DE SINAL DE INFORMAÇÕES CONFIGURADO PARA GERAR UMA REPRESENTAÇÃO DE TRANSFORMADA SOBREPOSTA DE UM SINAL DE INFORMAÇÕES UTILIZANDO UMA TRANSFORMADA SOBREPOSTA QUE CAUSA ALIASING, caracterizado por compreender uma entrada (105) para receber o sinal de informações na forma de uma sequência de amostras; um captador (106) configurado para captar regiões consecutivas que se sobrepõem dos sinais de informações; um reamostrador (107) configurado para aplicar, por interpolação, uma reamostragem em pelo menos um subconjunto das regiões consecutivas que se sobrepõem dos sinais de informações de modo que cada uma das partes consecutivas que se sobrepõem tem uma respectiva taxa de amostra constante, mas a respectiva taxa de amostra constante varia entre as regiões consecutivas que se sobrepõem; um janelador (108) configurado para aplicar um janelamento nas regiões consecutivas que se sobrepõem do sinal de informações; e um transformador (109) configurado para aplicar individualmente uma transformada nas regiões janeladas.
16. TRANSFORMADOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 15, caracterizado por o captador (106) ser configurado para realizar a captação das regiões consecutivas que se sobrepõem do sinal de informações de modo que as regiões consecutivas que se sobrepõem do sinal de informações tenham extensão de tempo constante.
17. TRANSFORMADOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 15 ou 16, caracterizado por o captador (106) ser configurado para realizar a captação das regiões consecutivas que se sobrepõem do sinal de informações de modo que as regiões consecutivas que se sobrepõem do sinal de informações tenham uma compensação de tempo constante.
18. TRANSFORMADOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 16 ou 17, caracterizado por a sequência de amostras tem uma taxa de amostra variante que troca de uma primeira taxa de amostra para uma segunda taxa de amostra em um momento no tempo predeterminado (113), em que o reamostrador (107) é configurado para aplicar a reamostragem nas regiões consecutivas que se sobrepõem (114b,c) sobrepondo-se com o momento no tempo predeterminado, de modo que a sua taxa de amostra constante troque meramente uma vez da primeira taxa de amostra para a segunda taxa de amostra.
19. TRANSFORMADOR DE SINAL DE INFORMAÇÕES, de acordo com a reivindicação 18, caracterizado por o transformador ser configurado para adaptar uma extensão de transformada da transformada de cada região janelada a diversas amostras da respectiva região janelada.
20. MÉTODO PARA RECONSTRUIR, UTILIZANDO CANCELAMENTO DE ALIASING, um sinal de informações de uma representação de transformada sobreposta do sinal de informações, caracterizado por compreender, para cada uma das regiões consecutivas que se sobrepõem do sinal de informações, uma transformada de uma versão janelada da respectiva região, em que o reconstrutor de sinal de informações é configurado para reconstruir o sinal de informações em uma taxa de amostra que muda em um limite (82) entre uma região anterior (84) e uma região posterior (86) do sinal de informações, o método compreendendo aplicação de uma retransformação na transformada (94) da versão janelada da região anterior (84) de modo a obter a retransformada (96) para a região anterior (84), e aplicar uma retransformação na transformada da versão janelada da região posterior (86) de modo a obter a retransformada (100) para a região posterior (86), em que a retransformada (96) para a região anterior (84) e a retransformada (106) para a região posterior (86) se sobrepõem em uma parte de cancelamento de aliasing (102) no limite (82) entre as regiões anterior e posterior; reamostragem, por interpolação, da retransformada (96) para a região anterior (84) e/ou a retransformada (100) para a região posterior (86) na parte de cancelamento de aliasing (102), de acordo com uma alteração da taxa de amostra no limite (82); e realização do cancelamento de aliasing entre as retransformadas (96, 100) para as regiões anterior e posterior (84, 86) conforme obtidas pela reamostragem na parte de cancelamento de aliasing (102).
21. MÉTODO PARA GERAR UMA REPRESENTAÇÃO DE TRANSFORMADA SOBREPOSTA DE UM SINAL DE INFORMAÇÕES UTILIZANDO UMA TRANSFORMADA SOBREPOSTA QUE CAUSA ALIASING, caracterizado por compreender recepção do sinal de informações na forma de uma sequência de amostras; captação de regiões consecutivas que se sobrepõem do sinal de informações; aplicação, por interpolação, de uma reamostragem em pelo menos um subconjunto das regiões consecutivas que se sobrepõem do sinais de informações, de modo que cada uma das partes consecutivas que se sobrepõem tenha uma respectiva taxa de amostra constante, mas a respectiva taxa de amostra constante varia entre as regiões consecutivas que se sobrepõem; aplicação de um janelamento nas regiões consecutivas que se sobrepõem do sinal de informações; e aplicação individual de uma transformação nas regiões janeladas.
22. Memória lida por computador caracterizada por conter conjunto de instruções que, quando executadas, efetuam o método das reivindicações 20 ou 21.
BR112012029132-7A 2011-02-14 2012-02-14 Representação de sinal de informações utilizando transformada sobreposta BR112012029132B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052458 WO2012110478A1 (en) 2011-02-14 2012-02-14 Information signal representation using lapped transform

Publications (2)

Publication Number Publication Date
BR112012029132A2 BR112012029132A2 (pt) 2020-11-10
BR112012029132B1 true BR112012029132B1 (pt) 2021-10-05

Family

ID=71943597

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112012029132-7A BR112012029132B1 (pt) 2011-02-14 2012-02-14 Representação de sinal de informações utilizando transformada sobreposta

Country Status (18)

Country Link
US (1) US9536530B2 (pt)
EP (1) EP2550653B1 (pt)
JP (2) JP5712288B2 (pt)
KR (1) KR101424372B1 (pt)
CN (1) CN102959620B (pt)
AR (1) AR085222A1 (pt)
AU (1) AU2012217158B2 (pt)
BR (1) BR112012029132B1 (pt)
CA (1) CA2799343C (pt)
ES (1) ES2458436T3 (pt)
HK (1) HK1181541A1 (pt)
MX (1) MX2012013025A (pt)
MY (1) MY166394A (pt)
PL (1) PL2550653T3 (pt)
RU (1) RU2580924C2 (pt)
SG (1) SG185519A1 (pt)
TW (2) TWI564882B (pt)
WO (1) WO2012110478A1 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013049256A1 (en) * 2011-09-26 2013-04-04 Sirius Xm Radio Inc. System and method for increasing transmission bandwidth efficiency ( " ebt2" )
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
RU2625444C2 (ru) 2013-04-05 2017-07-13 Долби Интернэшнл Аб Система обработки аудио
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
BR112016003029B1 (pt) * 2013-08-23 2023-04-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Aparelho e método para processamento de um sinal de áudio utilizando uma combinação em uma faixa de sobreposição
SG11201509526SA (en) 2014-07-28 2017-04-27 Fraunhofer Ges Forschung Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
US10770082B2 (en) * 2016-06-22 2020-09-08 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
CN110870006B (zh) 2017-04-28 2023-09-22 Dts公司 对音频信号进行编码的方法以及音频编码器
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization

Family Cites Families (217)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2225321T3 (es) 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送系统
JP3304717B2 (ja) * 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
EP0932141B1 (en) 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
CN1145928C (zh) 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
KR100711047B1 (ko) 2000-02-29 2007-04-24 퀄컴 인코포레이티드 폐루프 멀티모드 혼합영역 선형예측 (mdlp) 음성 코더
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20040142496A1 (en) 2001-04-23 2004-07-22 Nicholson Jeremy Kirk Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7206739B2 (en) 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP3815323B2 (ja) * 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) * 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) * 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
KR100728428B1 (ko) 2002-09-19 2007-06-13 마츠시타 덴끼 산교 가부시키가이샤 오디오 디코딩 장치 및 오디오 디코딩 방법
RU2331933C2 (ru) 2002-10-11 2008-08-20 Нокиа Корпорейшн Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
JP4719674B2 (ja) 2003-06-30 2011-07-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズの加算によるデコードオーディオの品質の向上
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
CA2475283A1 (en) 2003-07-17 2005-01-17 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre Method for recovery of lost speech data
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US7418396B2 (en) * 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
CN1875402B (zh) 2003-10-30 2012-03-21 皇家飞利浦电子股份有限公司 音频信号编码或解码
CN1914669A (zh) * 2004-01-28 2007-02-14 皇家飞利浦电子股份有限公司 使用复数值数据的音频信号解码
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
EP1722359B1 (en) 2004-03-05 2011-09-07 Panasonic Corporation Error conceal device and error conceal method
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CA2566368A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
KR101237546B1 (ko) 2005-01-31 2013-02-26 스카이프 통신 시스템에서 프레임들을 연결하는 방법
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
EP1845520A4 (en) 2005-02-02 2011-08-10 Fujitsu Ltd SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
NZ562182A (en) 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
PL1897085T3 (pl) 2005-06-18 2017-10-31 Nokia Technologies Oy System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy
JP5032314B2 (ja) * 2005-06-23 2012-09-26 パナソニック株式会社 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
JP2009524101A (ja) 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
CN101371297A (zh) 2006-01-18 2009-02-18 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US8255213B2 (en) 2006-07-12 2012-08-28 Panasonic Corporation Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method
JP5052514B2 (ja) 2006-07-12 2012-10-17 パナソニック株式会社 音声復号装置
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
EP2044575B1 (en) 2006-07-24 2017-01-11 Sony Corporation A hair motion compositor system and optimization techniques for use in a hair/fur graphics pipeline
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8024192B2 (en) 2006-08-15 2011-09-20 Broadcom Corporation Time-warping of decoded audio signal after packet loss
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
ES2631906T3 (es) 2006-10-25 2017-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
EP2120234B1 (en) 2007-03-02 2016-01-06 Panasonic Intellectual Property Corporation of America Speech coding apparatus and method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5596341B2 (ja) 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) * 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2823560T3 (es) 2007-08-27 2021-05-07 Ericsson Telefon Ab L M Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
CN101842833B (zh) 2007-09-11 2012-07-18 沃伊斯亚吉公司 语音和音频编码中快速代数码本搜索的方法和设备
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CN102789782B (zh) * 2008-03-04 2015-10-14 弗劳恩霍夫应用研究促进协会 对输入数据流进行混合以及从中产生输出数据流
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8423852B2 (en) 2008-04-15 2013-04-16 Qualcomm Incorporated Channel decoding-based error detection
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
MY181231A (en) 2008-07-11 2020-12-21 Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
KR101250309B1 (ko) * 2008-07-11 2013-04-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 에일리어싱 스위치 기법을 이용하여 오디오 신호를 인코딩/디코딩하는 장치 및 방법
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
EP2346029B1 (en) 2008-07-11 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and corresponding computer program
EP2410522B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
TWI419148B (zh) 2008-10-08 2013-12-11 Fraunhofer Ges Forschung 多解析度切換音訊編碼/解碼方案
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
CA3162807C (en) 2009-01-16 2024-04-23 Dolby International Ab Cross product enhanced harmonic transposition
JP2012516462A (ja) 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
JP5520967B2 (ja) 2009-02-16 2014-06-11 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
ES2374486T3 (es) 2009-03-26 2012-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo y método para manipular una señal de audio.
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
JP5699141B2 (ja) * 2009-06-23 2015-04-08 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
PL2491555T3 (pl) 2009-10-20 2014-08-29 Fraunhofer Ges Forschung Wielotrybowy kodek audio
RU2591011C2 (ru) 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
BR122020024243B1 (pt) 2009-10-20 2022-02-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio.
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
AR085895A1 (es) 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio

Also Published As

Publication number Publication date
MX2012013025A (es) 2013-01-22
EP2550653A1 (en) 2013-01-30
JP5712288B2 (ja) 2015-05-07
CA2799343A1 (en) 2012-08-23
KR101424372B1 (ko) 2014-08-01
TW201246186A (en) 2012-11-16
JP2014240973A (ja) 2014-12-25
KR20130007651A (ko) 2013-01-18
CN102959620B (zh) 2015-05-13
JP2013531820A (ja) 2013-08-08
PL2550653T3 (pl) 2014-09-30
MY166394A (en) 2018-06-25
TW201506906A (zh) 2015-02-16
AR085222A1 (es) 2013-09-18
ES2458436T3 (es) 2014-05-05
CA2799343C (en) 2016-06-21
SG185519A1 (en) 2012-12-28
RU2580924C2 (ru) 2016-04-10
CN102959620A (zh) 2013-03-06
HK1181541A1 (en) 2013-11-08
EP2550653B1 (en) 2014-04-02
TWI483245B (zh) 2015-05-01
JP6099602B2 (ja) 2017-03-22
AU2012217158A1 (en) 2012-12-13
WO2012110478A1 (en) 2012-08-23
RU2012148250A (ru) 2014-07-27
US9536530B2 (en) 2017-01-03
TWI564882B (zh) 2017-01-01
BR112012029132A2 (pt) 2020-11-10
AU2012217158B2 (en) 2014-02-27
US20130064383A1 (en) 2013-03-14

Similar Documents

Publication Publication Date Title
BR112012029132B1 (pt) Representação de sinal de informações utilizando transformada sobreposta
CA3076203C (en) Improved harmonic transposition
KR101701759B1 (ko) 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
BR112013003303B1 (pt) Reamostrar sinais de saída de codecs de áudio com base em qmf
CA3162808C (en) Improved harmonic transposition
AU2021204779B2 (en) Improved Harmonic Transposition
AU2023203942B2 (en) Improved Harmonic Transposition

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 14/02/2012, OBSERVADAS AS CONDICOES LEGAIS.