BRPI0612987A2 - dispositivo de codificaÇço/decodificaÇço hierÁrquica - Google Patents

dispositivo de codificaÇço/decodificaÇço hierÁrquica Download PDF

Info

Publication number
BRPI0612987A2
BRPI0612987A2 BRPI0612987-0A BRPI0612987A BRPI0612987A2 BR PI0612987 A2 BRPI0612987 A2 BR PI0612987A2 BR PI0612987 A BRPI0612987 A BR PI0612987A BR PI0612987 A2 BRPI0612987 A2 BR PI0612987A2
Authority
BR
Brazil
Prior art keywords
coding
signal
transform
band
frequency band
Prior art date
Application number
BRPI0612987-0A
Other languages
English (en)
Inventor
Stephane Ragot
David Virette
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Publication of BRPI0612987A2 publication Critical patent/BRPI0612987A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Patente de Invenção: DISPOSITIVO DE CODIFICÇçO/DECODIFICAÇçO HIERÁRQUICA. A presente invenção refere-se a sistema de codificação de um sinal áudio hierárquico, compreendendo, pelo menos, uma camada núcleo de codificação paramétrica por análise por síntese em uma primeira banda de frequência, uma camada de extensão de banda destinada a alargar essa primeira banda de freqúência em uma segunda banda de freqúência, essa banda estendida. De acordo com a invenção, esse sistema compreende também uma camada de melhoria da qualidade da codificação áudio na banda estendida, baseada em uma codificação por transformada, utilizando um parâmetro espectral oriundo dessa camada de extensão de banda. Aplicação à transmissão de sinais de fala e/ou áudio sobre redes de feixes.

Description

Relatório Descritivo da Patente de Invenção para "DISPOSITIVODE CODIFICAÇÃO/DECODIFICAÇÃO HIERÁRQUICA".
A presente invenção refere-se a um sistema de codificação áu-dio-hierárquica. A invenção refere-se também a um codificador e a um deco-dificador áudio hierárquicos.
A presente invenção refere-se a uma aplicação particularmentevantajosa no domínio da transmissão de sinais de fala e/ou é áudio sobrerede de feixes, de tipo voz sobre IP. Mais especialmente, a invenção permi-te, nesse contexto, fornecer uma qualidade modulável que vai de uma bandatelefônica a uma banda larga, isto em função da capacidade em fluxo datransmissão e garantindo a interoperabilidade com um núcleo existente embanda telefônica.
Numerosas técnicas existem atualmente para converter um sinaláudio-freqüências (fala e/ou áudio) sob a forma de um sinal numérico e trataros sinais assim numerados. Os métodos clássicos de codificação áudio deboa qualidade são em geral classificadas em "codificação de forma de on-da", "codificação paramétrica por análise por síntese" e "codificação percep-tual em sub-bandas ou por transformada".
A primeira categoria inclui técnicas de quantificação com ou semmemória como a codificação MIC ou MICDA (PCM ou ADPCM em inglês).
A segunda categoria inclui as técnicas que representam o sinalcom o auxílio de um modelo, em geral linear preditivo, mas cujos parâmetrossão determinados com o auxílio de métodos oriundos da codificação de for-ma de onda. Por essa razão, essa categoria é freqüentemente qualificada decodificação híbrida. A título de exemplo a codificação CELP ("Code ExcitedLinear Prediction") pertence a essa segunda categoria. Em codificaçãoCELP, o sinal de entrada é codificado com o auxílio de um modelo "fonte-filtro" inspirado do processo de geração da fala. Os parâmetros transmitidosrepresentam separadamente a fonte (também denominada "excitação") e ofiltro. O filtro é, em geral, um filtro polo. As noções de base sobre a codifica-ção dos sinais áudio-freqüências e mais particularmente da codificaçãoCELP e da quantificação são expostas notadamente nas seguintes obras:WB. Kleijn and K.K. Paliwal editors, Speech Coding and Synthe-sis, ^vier1 1995, e Njco|as MoreaUj Techniques de compressjon des sj_naux, Collection Tecm^ie θ Scientifiquejdes Télécomunications, Masson,1995.
uppr , terCeira Cate90ria inC'Ui 'éCniCaS de COdi,icaCão tais «"«oMPEG 1 e 2 Layer III, mais conhecida pelo nome de MP3 ou ainda MPEG 4AAC.
o sistema G.729 recomendado ao UIT-T é um exemplo de codi-ficaçao CELP concebido para sinais de fala em banda telefônica (300-3400Hz, transformados em amostras e apresentados a 8 kHz. Ele opera a um
"X0 de 8 kbi,/S COm 10 ms. Seu funcionamento detalhado éespecificado na recomendação ITU-T G.729, Coding o, Speech at 8using Conjugate StruCure Algebraic Code Exeited Linear PreCietion (CS-ACELP), March 1996.
Um esquema simplificado do codificador e do decodificador as-sociados é dado nas figuras 1 (a), 1(b, e 1(c,. A figura 1(c, mostra como odeco ificador G.729 reconstrói o sina, de fala a partir dos dados fornecidospelo desmultiplicador (,12). A excitação é reconstituída por subtramas de 5ms, acrescentando duas contribuições:
- um código inovador (113), de um comprimento de 5 ms, consti-de 4 PU'S0S * 1 c0l0cacfoS na Por um ganho gc (114 e 118, e dezeros;
- um bloco de 5 ms considerado no passado da excitação e de-asado por um retardo fracionário (especificado pelos parâmetros de períodofundamenta, ou "passo" TO1 TO-frac) (I15 e 116), colocados na escala porumganhogp(1i7e 118).
A excitação assim decodificada é enfermada por um filtro de sín-tese LPC ("Linear Predictive Coding") 1/A(z) (120) de ordem 10, cujos coefi-c^tes são decodificados (H9) n0 dominio dos pares de raias espectraisLSF ( Line SpeCrum Frequency) e interpelados por subtrama de 5 ms A fimde melhorar a qualidade e ocultar certos artefatos de codificação, o sinal re-construi é em seguida tratado por um pós-filtro adaptador (121, e um filtropassa-alto de pós-tratamento (122). O decodificador da figura 1© se apoia,portanto, sobre o modelo "fonte-filtro" para sintetizar o sinal. Os parâmetrosassociados a esse modelo são listados na tabela da figura 2, distinguindoaqueles que descrevem a excitação e aqueles que descrevem o filtro.
A figura 1(a) representa um esquema de elevado nível de codifi-cador G.729. Ela faz assim sobressair a filtragem passa-alto de pré-tratamento (101), a análise e a quantificação LPC (102), a codificação daexcitação (103) e a multiplexagem dos parâmetros codificados (104). Osblocos de pré-tratamento e de análise e quantificação LPC do codificadorG.729 não são discutidos aqui; pode-se fazer referência à recomendaçãoUIT-T pré-citada para maiores detalhes. O funcionamento da codificação daexcitação é esquematizado na figura 1(b). Esta mostra como são determina-dos e quantificados os parâmetros da excitação listados na figura 2. A exci-tação é codificada em 3 etapas:
- determinação do retardo de " passo"(106) e estimativa do ga-nho de " passo"(107);
- determinação dos parâmetros do código inovador no dicionárioACELP (posições e sinais dos 4 pulsos (108)) e estimativa do ganho (109);
- codificação conjunta dos ganhos de " passo" e de código.
A determinação dos parâmetros da excitação é realizada, mini-mizando-se o erro quadrático (111) entre o alvo CELP (105) e a excitaçãofiltrado por W(z)Â(z) (110). Esse processo de análise por síntese é detalhadono recomendação UIT-T mencionada mais acima.
Na prática, a complexidade do codificador/decodificador (codec)G.729 é relativamente elevada (aproximadamente 18 WMOPS) ("WeightesMillion Operations Per Second")). Para responder as necessidades das apli-cações tais como a transmissão simultânea de vozes e de dados sobre mo-dem DSVD ("Digital Simultaneous Voice and Data"), um sisteam interoperá-vel, mas de complexidade menor (aproximadamente 9 WMOPS) foi tambémrecomendado a UIT-T: o código G.729A. Este é descrito e comparado aoG729 em R. Salami et al. Description of ITU-T Recommandation G.729 An-nex A: Reduced complexity 8 kbit/s CS-ACELP codec, ICASSP 1997.Dentre as diferenças notáveis entre G.729 e G.729A, aquela quepermite reduzir mais a complexidade do G.729 se refere à pesquisa no di-cionário ACELP: no codificador G.729A uma pesquisa em profundidade ini-cialmente 4 pulsos assinados substitui a busca por circuitos imbricados utili-zada no codificador G.729. Por sua vez, sua pouca complexidade, o codecG.729A é então muito difundido nas aplicações de voz sobre IP ou ATM embanda telefônica (300-3400 Hz).
Como desenvolvimento de fibras ópticas e de redes banda largacomo ADSL, daqui para o futuro é considerável desdobrar novos serviços,tais como comunicações bidirecionais de qualidade bem melhor do que ossistemas clássicos em banda telefônica. Uma etapa nesse sentido consisteem fornecer uma qualidade em "banda larga", isto é, considerandoi-se sinaisáudio-freqüê.ncias mostrados a 16 kHz e restritos a uma banda útil dde 50-7000 Hz. A qualidade obtida é, então, similar àquela da rádio AM.
A escolha de um codec para desdobrar a qualidade "banda lar-ga" no lugar da qualidade "banda estreita" deve considerar várias questõesimportantes:
- a infra-estrutura das redes IP atuais e dos pontos de conexão(modems telefônicos, ADSL, Lan, WiFi, etc.) é muito heterogênea em termosde fluxo, de qualidade de serviço caracterizada por giga, a taxa de perdas defeixes, etc.
- os terminais que reproduzem os sons (telefone, PC ou outros)diferem às vezes em termos de freqüência de amostragem e do número decanais áudio. As vezes, é difícil conhecer antes a nível do codificador a ca-pacidade real dos terminais;
- numerosos padrões de codificação dos sinais áudio-freqüências (cujos codecs G.729 e G.729A) são desdobrados nas redes. Atranscodificação entre os diferentes formatos associados é freqüentementenecessário (nas passarelas ou estradas, por exemplo), embora este impliqueem geral uma perda de qualidade e uma complexidade não desprezível.
A abordagem conhecida pelo nome de "codificação hierárquica"é a solução técnica amais adaptada para considerar todos esses esforços.Contrariamente à codificação convencional, tal como a codifica-ção G.729 ou G.729A, gerando um fluxo binário de passagem fixa, a codifi-cação hierárquica consiste em gerar um fluxo binário, do qual se pode deco-dificar todo ou parte. De maneira geral, a codificação hierárquica compreen-de uma camada de núcleo e uma ou várias camadas de melhoria. A camadade núcleo é gerada por um codec de baixo fluxo fixo, qualificado de "núcleo",garantindo a qualidade mínima da codificação. Essa camada deve ser rece-bida pelo decodificador para manter un nível de qualidade aceitável. As ca-madas de melhoria servem para melhorar a qualidade. Pode, todavia, acon-tecer que elas não sejam todas recebidas pelo decodificador, devido a defei-tos na transmissão, por exemplo no caso de congestão de uma rede IP.
Essa técnica oferece, portanto, uma grande flexibilidade na es-colha do fluxo e da qualidade de reconstrução. O codificador funciona sem-pre supondo-se que o fluxo é máximo. Todavia, em não importa que local dacadeia der comunicação, o fluxo pode ser adaptado, truncando-se simples-mente o fluxo binário. A codificação hierárquica permite, além disso, desdo-brar a qualidade em banda larga progressivamente, baseando-se em umpadrão de tipo codificação CELP em banda telefônica (como os padrõesUIT-T G.729 ou G.729A).
Dentre as diferentes abordagens de codificação hierárquicaconstruída a partir de um codificador núcleo CELP, podem-se citar as quatroseguintes técnicas:
- a codificação CELP hierárquica com enriquecimento de excita-ção descrita no artigo de R.D. De lacovo, D.Sereno, Enbedded CELPcodingfor variable-rate between 6.4 and 9.6 kbit/s, ICASSP 1991;
- a extensão de banda com transmissão de informação auxiliardescrita no artigo de J.-M.Valin et al., Bandwidth Extension of NarrowbandSpeech for Low Bit-Rate Wideband Coding, Proc. IEEE Speech CodingWorkshop (SCW), 2000, pp. 130-132;
- no artigo de S.K. Jung, K-T. Kim1 H-G. Kang, A bit/rate bandscalable speech coder based on ITU-T G. 723.1 padrão, ICASSP 2004, umcodec hierárquico é construído a partir de um codificador G.723.1 e com du-as camadas de melhoria, a primeira sendo do tipo CELP em cascata embanda telefônica, a segunda sendo uma codificação por transformada nabanda alta obtida por filtragem QMF ("Quadrature Mirror Filter");
- no artigo de H. Taddéi et al. A scalable Three Bitrate (8, 14.2and 24 kBits/s) Audio Coder, 107th Convention AES 1999, a codificação uti-liza um codificador núcleo G.729 com 8 kbit/s, uma camada intermediária demelhoria em banda telefônica para ir a 14,2 kbit/s, seguida de uma camadade melhoria em banda larga por codificação por transformada para chegar a24 kbit/s.
A diferença entre o conceito decodificação CELP hierárquico porenriquecimento de excitação e a codificação apresentada na figura 1 (b) levaà adição de um dicionário inovador para melhor representar o alvo CELP.Essa abordagem de codificação é na realidade similar a uma quantificaçãomultiestágios realizada no domínio do alvo CELP (ou domínio ponderado"perceptualmente"). Esse dicionário adicional permite enriquecer, ou melho-rar, a excitação decodificada, pois se acrescenta na realidade a nível do de-codificador à contribuição cumulada dos 2 dicionários de adaptação e fixo dedecodificação CELP convencional da figura 1(c). Esse princípio de enrique-cimento de excitação CELP pode também ser variado para incluir um dicio-nário de adaptação suplementar ou ainda vários dicionários inovadores.
O sistema de extensão de banda proposta no artigo pré-citadode J-M. Valin é esquematizado na figura 3. Um sinal em banda telefônica(300-3400 Hz) é estendido à banda larga 0-8000 Hz, acrescentando-se (31)três contribuições:
- uma banda baixa regenerada pelo bloco (32);
- o sinal em banda telefônica, por exemplo, codificado pelo sis-tema G.729 (40) e transformado em amostra pelo bloco (33) a 16 kHz;
- uma banda alta construída como auxílio dos blocos (34) a (39).
Observar-se-á mais particularmente nesse esquema a extensãoda banda alta, que é baseada no modelo "fonte-filtro". Esta começa por umaanálise LPC em banda estreita (34) que determina os coeficientes do filtro depredição ANb(z) (36). O resultado dessa análise LPC é também utilizado pelobloco de extensão do envoltório LPC (35) para determinar os coeficientes deum filtro de síntese LPC plena faixa 1/Bwb (ZO (38). A extensão de envoltóriopode ser realizada, por exemplo por técnicas de "codebook mapping", semtransmissão de informação auxiliar ou bem com informação explícita querequer a transmissão por quantificação a um baixo fluxo adicional. Em para-lelo, o sinal residual (ou excitação) LPC em banda estreita é calculado pelobloco (36). A excitação resultante em amostra a 8 kHz é estendida à fre-qüência de amostragem de 16 kHz pelo bloco (37). Essa operação pode serrealizada no domínio da excitação, empregando-se uma não linearidade,uma superamostragem e uma filtragem, a fim de estender a estrutura har-mônica e clarear a excitação banda plena. A excitação extensa é em segui-da enformada pelo filtro de síntese banda plena 1/BWb (Z) (38) e o resultadoé limitado pela filtragem passa-alto (39) à banda 3400-8000 Hz.
O conjunto das técnicas conhecidas da técnica anterior levanta,todavia, os seguintes problemas:
- fala em banda larga degradada por certos artefatos, tais comoa dobra freqüencial devido ao emprego de um banco de filtros QMF;
- música mal codificada pelos modelos ligados ao processo deprodução da fala;
- granularidade forte em fluxo;
- qualidade degrada pela presença de pré-eco na camada demelhoria, utilizando uma codificação por transformada;
- retardo e complexidade.
Por outro lado, certos problemas fundamentais são apenas ra-ramente abordados na técnica anterior: a não-linearidade de fase do pré- edo pós-tratamento raramente é apenas considerada. Ora, as camadas demelhoria que se baseiam na codificação de um sinal diferença entre original(pré-tratado ou não) e síntese da camada inferior terão desempenhos muitodegradados, se a não-linearidade de fase (ou de retardo de grupo) dos filtrosde pré- e de pós-tratamento não for compensada ou eliminada.
Também, a invenção tem por finalidade prevenir os diferentesproblemas enunciados mais acima, propondo um sistema de codificação deum sinal áudio-hierárquico, compreendendo, pelo menos, uma camada nú-cleo de codificação paramétrica por análise por síntese em uma primeirabanda de freqüência em uma segunda banda de freqüência, essa bandaestendida, notável no que se refere a esse sistema compreende tambémuma camada de melhoria da qualidade da codificação áudio na banda es-tendida, baseada em uma codificação por transformada, utilizando um pa-râmetro espectral oriundo dessa camada de extensão de banda.
Convém sublinhar no caso que o termo de "banda larga" utiliza-do nesse relatório corresponde a um caso particular da noção geral de "ban-da estendida". Entende-se por "banda larga" uma banda de freqüência resul-tante da extensão de uma primeira banda, a banda telefônica entre 300 e3400 Hz, a uma segunda banda, a banda larga, entre 50 e 700 Hz.
De acordo com um modo de realização vantajoso, esse sistemacompreende também uma camada de melhoria da qualidade de codificaçãoáudio nessa primeira banda de freqüência.
Em um primeiro modo de realização do sistema de codificação,de acordo com a invenção, esse parâmetro espectral é um envoltório espec-trai oriundo da camada de extensão de banda. Dois modos de utilização po-dem ser considerados: esse envoltório espectral é especificado por um filtrode predição linear em banda estendida, ou esse envoltório espectral é dadopela energia por sub-banda do sinal.
Em um segundo modo de realização do sistema de codificação,de acordo com a invenção, esse parâmetro espectral é pelo menos uma par-te da transformada do sinal sintetizado pela camada de extensão de banda.
Vantajosamente, nesse caso, esse sistema compreende um módulo de ajus-te progressivo da energia em sub-bandas da transformada do sinal sintetiza-do pela camada de extensão de banda.
A invenção prevê também que essa codificação paramétrica poranálise por síntese é uma codificação CELP. Em particular, essa codificaçãoCELP é uma codificação G.729 ou uma codificação G.729A.
Assim, conforme será visto mais longe em detalhes, o sistemade codificação proposto pela invenção constitui um sistema de codificaçãohierárquico apto a funcionar, por exemplo a fluxos de 8 e 12 kbits/s e a todosos fluxos entre 14 e 32 kbits/s.
Em resposta aos problemas levantados pela técnica anterior, osistema de codificação/decodificação, de acordo com a invenção, permiteconseguir que:
- a fala sintetizada em banda larga não tenha pré-eco e nenhumartefato de tipo dobra freqüencial esteja presente,
- a música seja bem-codificada com fluxo suficientemente eleva-do (entre 24 e 32 kbits);
- a granularidade em fluxo seja muito fina (ao bit aproximada-mente) entre 14 e 32 kbit/s.
A invenção se refere também a um processo para a utilização dosistema de codificação, de acordo com o primeiro modo de realização, com-preendendo as seguintes etapas:
- codificação de um sinal original nessa primeira banda de fre-qüência;
- codificação do sinal original em uma extensão da primeira ban-da de freqüência, utilizando um envoltório espectral;
- cálculo de um sinal residual a partir do sinal original e dos si-nais oriundos das operações de codificação precedentes, notável pelo fatode esse processo compreender também uma etapa de produção de umacamada de melhoria da qualidade da codificação áudio utilizando uma codi-ficação por transformada, essa codificação por transformada desse sinal re-sidual utilizando esse envoltório espectral.
A invenção se refere, além disso, a um processo para a utiliza-ção do sistema de codificação, de acordo com, o segundo modo de realização, compreendendo as seguintes etapas:
- codificação de um sinal original nessa primeira banda de fre-qüência;
- codificação do sinal original em uma camada de extensão daprimeira banda de freqüência;
- cálculo de um sinal residual a partir do sinal original e dos si-nais oriundos das operações de codificação precedentes, notável pelo fatoesse processo compreender também uma etapa de produção de uma cama-da de melhoria utilizando uma codificação por transformada desse sinal resi-dual, essa codificação por transformada utilizando a transformada do sinalsintetizado pela camada de extensão de banda.
Vantajosamente, esse processo compreende uma etapa de ajus-te progressivo da energia em sub-bandas da transformada do sinal sintetiza-do pela camada de extensão de banda.
A invenção se refere também a um programa de computador,compreendendo instruções de programa para a utilização das etapas doprocesso, de acordo com a invenção, quando esse programa é executadopor um computador.
Por outro lado, a invenção se refere a um primeiro codificadoráudio hierárquico, compreendendo:
- um codificação núcleo de codificação paramétrica para o análi-se por síntese, destinado a codificar um sinal original em uma primeira ban-da de freqüência;
- um estágio de codificação em uma extensão da primeira bandade freqüência, compreendendo um envoltório espectral;
- um estágio de cálculo de um sinal residual a partir do sinal ori-ginal e sinais oriundos dos estágios de codificação precedentes, notável pelofato de esse codificador compreender também um estágio de melhoria daqualidade da codificação áudio em banda estendida por codificação portransformada, incluindo uma transformada inversa, utilizando esse envoltórioespectral.
Da mesma forma, a invenção se refere a um segundo codifica-dor áudio hierárquico, compreendendo:
- um codificador núcleo de codificação paramétrica por análisepor síntese, destinado a codificar um sinal original em uma primeira bandade freqüência;
- um estágio de codificação em uma extensão da primeira bandade freqüência;- um estágio de cálculo de um sinal residual a partir do sinal ori-ginal e sinais oriundos dos estágios de codificação precedentes, notável pelofato de esse codificador compreender também um estágio de melhoria daqualidade da codificação áudio em banda estendida por codificação portransformada, utilizando uma transformada do sinal sintetizado pela camadade extensão de banda.
A invenção se refere ainda a um primeiro decodificador áudiohierárquico, compreendendo:
- um decodificador núcleo de codificação paramétrica por análisepor síntese destinado a decodificar em uma primeira banda de freqüênciaum sinal recebido codificado pelo primeiro codificador;
- um estágio de decodificação em uma extensão da primeirabanda de freqüência, compreendendo um envoltório espectral, notável pelofato de esse codificador compreender também um estágio de melhoria daqualidade da codificação áudio em banda estendida por decodificação portransformada, incluindo uma transformada inversa, utilizando esse envoltórioespectral.
Enfim, a invenção se refere a um segundo decodificador áudiohierárquico, compreendendo:
- um decodificador núcleo de codificação paramétrica por análisepor síntese destinado a decodificar em uma primeira banda de freqüênciaum sinal codificado pelo segundo codificador;
- um estágio de decodificação em uma extensão da primeirabanda de freqüência, notável pelo fato de esse codificador compreendertambém um estágio de melhoria da qualidade da decodificação áudio embanda estendida por decodificação por transformada, incluindo uma trans-formada inversa, utilizando a transformada do sinal sintetizado pela camadade extensão de cinta.
A descrição que será feita a seguir com relação aos desenhosanexados, dados a título de exemplos não limitativos, fará com se compre-ende em que consiste a invenção e como ela pode ser realizada.
A figura 4(a) é um esquema dos três primeiros estágios de umcodificador, segundo a presente invenção .
A figura 4(b) é um esquema do quarto estágio de codificação docodificador da figura 4(a).
A figura 5 representa uma tabela dos coeficientes do filtro passa-baixo utilizado na presente invenção.
A figura 6 representa uma tabela dos coeficientes do filtro passa-alto utilizado para gerar um sinal de melhoria em banda larga, de acordocom a invenção.
A figura 7 representa uma tabela que especifica o recorte emsub-bandas dos espectros MDCT, de acordo com a invenção.
A figura 8 representa uma tabela que dá o número de bits permi-tidos para cada trama a cada um dos parâmetros de um codificador e de umdecodificador, segundo a presente invenção.
A figura 9 representa a estrutura do trem binário associado àpresente invenção.
A figura 10 (a) representa um esquema geral do decodificadorem quatro camadas da presente invenção .
A figura 10(b) representa um esquema de detalhe do estágio dedecodificação preditivo por transformada do decodificador da figura 10 (a).
O conjunto das figuras 4(a) a 10(b) descreve um sistema de co-dificação/decodificação hierárquica constituído de codificador e de um deco-dificador que vão a seguir ser descritos sucessivamente.
Lembra-se inicialmente que na seqüência dessa descrição otermo "banda larga" faz referência ao caso particular de uma banda telefôni-ca 300-3400 Hz estendida ao domínio 50-7000 Hz.
A figura 4(a) dá um esquema bloco do codificador. Um sinal áu-dio original de banda útil entre 50 e 7000 Hz e amostrado a 16 kHz é recor-tado em trama de 320 amostras, seja 20 ms. Uma filtragem passa-alto 601de freqüência de corte 50Hz é aplicado ao sinal de entrada. O sinal obtido,denominado SWB, é reutilizado em várias ramificações do codificador e cor-responde ao sinal realmente codificado.
Inicialmente, em uma primeira ramificação, uma filtragem passa-baixo (da qual os coeficientes são fornecidos na tabela da figura 5) e umasubamostra por dois 602 são aplicadas a SWB. Isto permite obter um sinal embanda telefônica Slb amostrado em 8 kHz. Esse sinal é tratado pelo codifi-cador núcleo 603, codificação de tipo CELP G.729A+, por exemplo. Precisa-se que o codificador G.729A+ corresponde no caso ao codificador G.729sem pré-tratamento de filtragem passa-alto, e para o qual a pesquisa no di-cionário ACELP foi substituído por aquela do G.729A conforme descrito an-teriormente. Variantes desse modo de realização poderão utilizar codificado-res G.729A, G.729 ou outros codificadores de tipo CELP sem pré-tratamento. Essa codificação dá o núcleo do trem binário com um fluxo de 8kbit/s no caso do codificador G.729A+.
Em seguida, uma primeira camada de melhoria introduz um se-gundo estágio 603 de codificação CELP. Esse segundo estágio consiste emum código inovador constituído de quatro pulsos em +1 suplementares parauma subtrama de 5 ms (dicionário equivalente àquele do G.729A), essespulsos são colocados na escala por um ganho genh· O princípio desse está-gio de melhoria foi descrito mais acima com referência ao artigo de R.D. Delacovo. Esse dicionário efetua um enriquecimento da excitação CELP e ofe-rece uma melhoria de qualidade, particularmente sobre os sons não de vo-zes. O fluxo desse segundo estágio de codificação é de 4 kbits/s e os parâ-metros associados são posições e os sinais de impulsos e o ganho associa-do para cada subtrama de 40 amostras (5 ms a 8 IHz). Em uma variantedesse modo de realização, esse estágio de codificação utiliza outros modosde melhoria, por exemplo aqueles descritos no artigo de De lacovo anterior-mente citado.
As decodificações do codificador núcleo e da primeira camadade melhoria são realizados para se obter o sinal de síntese em banda telefô-nica a 12 kbit/s. É importante anotar que o pós-filtragem de adaptação e pós-tratamento (filtragem passa-alto) do codificador núcleo são desativados a fimde considerar a defasagem não linear dessas operações; a diferença entre osinal original pré-tratado e a síntese a 8 e 12 kbit/s é portanto minimizada.
Uma superamostragem e uma filtragem passa-baixo 604 permitem obter aversão amostrada a 16 kHz dos dois primeiro estágios do codificador.
A segunda camada de melhoria dita também camada de exten-são de banda permite passar em banda larga. O sinal de entrada Swb podeser filtrado por um filtro de pré-ênfase 605 com μ = 0,68. Esse filtro permiterepresentar melhor as altas freqüência s a partir do filtro de predição linearem banda larga. Para compensar o efeito do filtro de pré-ênfase, um filtro dede-ênfase dual 606 é então utilizado na síntese. Em um modo de realizaçãopreferido, nenhum filtro de pré-ênfase e de de-ênfase não são integrados àestrutura de codificação e de decodificação. A etapa seguinte consiste emcalcular e em quantificar o filtro de predição linear 607 em banda larga. Aordem do filtro de predição linear é de 18, mas em uma variante desse modode realização, uma outra ordem de predição, por exemplo menor (16), é es-colhida. O filtro de predição linear pode ser calculado pelo método da auto-correlação e o algoritmo Ie Levinson-Durbin.
Esse filtro de predição linear ÂWB (z) em banda larga é quantifi-cada, utilizando-se uma predição desses coeficientes eventualmente a partirdo filtro ÂNB (z) oriundo do codificador 603 em banda telefônica. Os coefici-entes podem em seguida ser quantificados, utilizando, por exemplo, umaquantificação vetorial multiestágios e utilizando os parâmetros LSF desquan-tificados do codificador núcleo em banda telefônica, conforme descrito noartigo de H. Ehara, T. Morii, M. Oshikiri e K. Yoshida, Predictive VQ forbandwidth scalable LSP quantization, ICASSP 2005.
A excitação em banda larga 608 é obtida a partir dos parâmetrosda excitação em banda telfônica do codificador núcleo: o retardo de " passo",o ganho associado, assim como as excitações algébricas do codificador nú-cleo e da primeira camada de enriquecimento da excitação CELP e os ga-nhos associados. Essa excitação é gerada, utilizando-se uma versão supe-ramostrada dos parâmetros da excitação dos estágios em banda telefônica.Em uma variante desse modo de realização, a excitação é calculada a partirdo retardo de " passo" e do ganho associado, esses parâmetros sendo utili-zados para gerar uma excitação harmônica a partir de um ruído branco.Nessa variante, a excitação do dicionário algébrico é substituída por um rui-do branco.
Essa excitação em banda larga é em seguida filtrada pelo filtrode síntese 609 calculado anteriormente. No caso em que uma pré-ênfase foiaplicada ao sinal de entrada, aplica-se o filtro de de-ênfase 606 sobre o sinalde saída do filtro de síntese. O sinal obtido é um sinal em banda larga quenão é ajustado em energia. Para o cálculo do ganhoq eu permite a coloca-ção a nível da energia da banda alta (3400-7000 Hz), uma filtragem passa-alto 611 (cujos coeficientes são dados na tabela da figura 6) é aplicada aosinal de síntese em banda larga. Paralelamente, o mesmo filtro passa-alto612 é aplicado ao sinal de erro correspondente à diferença entre o sinal ori-ginal retardo 610 e o sinal de síntese dos dois estágios precedentes. Essesdois sinais são em seguida utilizados para o cálculo do ganho a aplicar aosinal de síntese da faixa alta. Esse ganho é calculado por uma relação deenergia entre os dois sinais. O ganho gWB 611 é em seguida aplicado ao si-nal S14ub por subtrama de 80 amostras (5 ms a 16 kHz). O sinal assim obtidoé acrescentado ao sinal de síntese do estágio precedente para criar o sinalem banda larga correspondente ao fluxo de 14 kbit/s.
A seqüência da codificação é feita no domínio freqüencial, utili-zando-se um esquema de codificação preditivo por transformada, utilizando-se o filtro de predição linear oriundo da camada de extensão de banda.
Esse estágio de codificação constitui a camada de melhoria daqualidade de codificação na banda extensa.
A figura 4(b) descreve essa parte do codificador. Os sinais deentrada retardado 614 e de síntese a 14 kbit/s 615 são filtrados respectiva-mente por um filtro de ponderação perceptual, 616 e 617, de tipoAwB(z/y)*(1-pz), com tipicamente y = 0,92 e μ = 0,68. Esses sinais são emseguida codificados pelo esquema de codificação por transformada.
Uma transformada em co-seno discreta modificada (ou MDCTem inglês) é aplicada: por um lado, sobre blocos de 640 amostras do sinalde entrada ponderado 618 com uma abrangência de 50 % (restauração daanálise MDCT a cada 20 ms), por outro lado, sobre o sinal de síntese ponde-rado 619 oriundo do estágio precedente de extensão de banda a 14 kbit/s(mesma extensão do bloco e mesma taxa de abrangência). O espectroMDCT a condificar 620 corresponde à diferença entre o sinal de entradaponderado e o sinal de síntese a 14 kbit/s para a banda de 0 a 3400 Hz, aosinal de entrada ponderado de 3400 Hz a 7000 Hz. Limita-se o espectro a7000 Hz, colocando-se em zero os 40 últimos coeficientes (só os 280 primei-ros coeficientes são codificados). O espectro é dividido em 18 bandas: umabanda de 8 coeficientes e 17 bandas de 16 coeficientes conforme descritona tabela da figura 7. Uma variante desse modo de realização utiliza 20bandas de larguras iguais (14 coeficientes). Para cada banda do espectro, aenergia dos coeficientes MDCT é calculada (fatores de escala). Os 18 fato-res de escala constituem o envoltório espectral do sinal ponderado que é emseguida quantificado, codificado e transmitido na trama.
Os fatores de escalada banda alta (3400 -7000 Hz) são transmi-tidos antes daqueles da banda baixa (0-3400 Hz), conforme mostra o forma-to do trem binário na figura 9.
A alocação dinâmica dos bits se baseia na energia das bandasdo espectro a partir da versão desquantificada do envoltório espectral. Istopermite ter uma compatibilidade entre a alocação binária do codificador e dodecodificador. A alocação de bits no módulo TDAC ("Time Domain AliasinghCancellation") 620 se realiza em duas fases. Inicialmente, um primeiro cálcu-lo do número de bits a alocar a cada banda é feita: cada um dos valores ob-tidos é arredondada ao fluxo do dicionário disponível o mais próximo. Se ofluxo total alocado não for exatamente igual àquele disponível, uma segundafase é utilizada para realizar o reajuste. Essa etapa é feita por um procedi-mento iterativo baseada em um critério energético que acrescenta ou retirabits nas bandas conforme descrito no artigo de Y. Mahieux e J.P. Petit,Transform coding of áudio signals at 64 kbit/s, IEEE GLOBECOM 1990. As-sim, se o número total de bits distribuídos for inferior àquele disponível, oacréscimo de bits será feito nas bandas onde a melhoria perceptual é maisimportante (energia mais importante). Caso contrário, em que o número totalde bits distribuídos é superior àquele disponível, a extração de bits sobre asbandas é feita de maneira dual.Os coeficientes MDCT normalizados (estrutura fina) em cadabanda são em seguida quantificados por quantificadores vetoriais utilizandodicionários imbricados em tamanho e em resolução, os dicionários sendocompostos de uma união de códigos de permuta, tais como descritos no pe-dido internacional WO/0400219. Finalmente, as informações sobre o codifi-cação núcleo, o estágio de enriquecimento CELP em banda telefônica, oestágio CELP em banda larga eenfim o envoltório espectral e os coeficientesnormalizados codificados são multiplexados e transmitidos em trama.
O número de bits alocado em cada um dos parâmetros do codi-ficador e decodificador é especificado na tabela da figura 8.
A estrutura da trama do trem binário é descrita na figura 9.
A estrutura do decodificador vai a seguir ser descrita com rela-ção às figuras 10(a) e 10(b).
O módulo 701 efetua a desmultiplexagem dos parâmetros conti-dos no trem binário. Existe vários casos de decodificação em função do nú-mero de bits recebidos para uma trama, os três primeiros casos são descri-tos a partir da figura 10(a) e o último caso a partir da figura 10(b):
1- o primeiro se refere à recepção do número de bits mínimo pe-lo decodificador. Nesse caso, só o primeiro estágio é decodificado. Portanto,só o trem binário relativo ao decodificador núcleo 702 de tipo CELP(G.729A+) é recebido e decodificado. Essa síntese pode ser tratada pelopós-filtro de adaptação e o pós-tratamento do decodificador G.729. Essesinal é superamostrado e filtrado para produzir um sinal amostrado a 16 kHz(703);
2- O segundo caso se refere à recepção do número de bits rela-tivo ao primeiro e ao segundo estágios de decodificação. Nesse caso, o de-codificador de núcleo assim com o primeiro estágio de enriquecimento daexcitação CELP são decodificados. Essa síntese pode ser tratada pelo pós-filtro de adaptação e o pós-tratamento do decodificador G.729. Esse sinal éem seguida superamostrado e filtrado para produzir um sinal amostrado a 16kHz (703);
3- o terceiro caso corresponde à recepção do número de bitsrelativos aos três primeiros estágios de decodificação. Nesse caso, os doisprimeiros estágios de decodificação são inicialmente realizados conforme nocaso 2, depois o módulo de extensão dos parâmetros dos pares de raiosespectrais (WB-LSF) em banda larga (704), assim como ganhos associadosà excitação. A excitação em banda larga é gerada a partir dos parâmetros docodificador núcleo e do primeiro estágio de enriquecimento da excitaçãoCELP 705. Essa excitação é em seguida filtrada pelo filtro de síntese 706 eeventualmente pelo filtro de de ênfase 707 no caso em que um filtro de pré-ênfase foi utilizado no codificador. Aplica-se um filtro passa-alto 708 ao sinalobtido e adapta-se a energia do sinal de extensão da banda com o auxíliodos ganhos associados (709) a cada 5 ms. Esse sinal é em seguida acres-centado ao sinal em banda telefônica amostrada a 16 KHz obtido a partir dosdois primeiros estágios de decodificação. Coma finalidade de obter um sinallimitado a 7000 Hz, esse sinal é filtrado no domínio transformado por coloca-ção em 0 dos 40 últimos coeficientes MDCT, antes da passagem pela trans-formada MDCT inversa 713 e o filtro de síntese ponderado 714;
4- este último caso corresponde à decodificação do último está-gio do decodificador (figura 10(b)). Esse estágio corresponde à camada demelhoria da qualidade da decodificação na banda extensa. Este último está- gio é constituído de um decodificador preditivo por transformada, utilizando ofiltro de predição linear oriundo da camada de extensão de banda. A etapa 3descrita anteriormente é inicialmente realizada. Depois, em função do núme-ro de bits suplementares recebidos , o esquema de decodificação é adaptado:
- no caso em que o número de bits corresponde apenas a umaparte ou à totalidade do envoltório espectral 715 mas que a estrutura finanão seja recebida (721), o envelope espectral parcial ou completo é utilizadopara ajustar a energia das bandas de coeficientes MDCT (722) entre 3400Hz e 7000 Hz (720) correspondendo a uma parte da transformada do sinalgerado pelo estágio de extensão de banda 711. Esse sistema permite obteruma melhoria progressiva da qualidade áudio em função do número de bitsrecebido;- no caso em que o número de bits corresponde à totalidade doenvoltório espectral e a uma parte ou à totalidade da estrutura fina. A aloca-ção binária é feita do mesmo modo que no codificador 716. Nas bandas emque a estrutura fina é recebida, os coeficientes MDCT decodificados são cal-culados a partir do envoltório espectral 715 e da estrutura fina desqualifica-da 717. Nas bandas espectrais entre 3400 Hz e 7000 Hz nas quais a estrutu-ra fina não foi recebida, o procedimento do parágrafo precedente é utilizada,isto é, os coeficientes MDCT calculados sobre o sinal obtido pela extensãode banda - que constituem um parâmetro espectral oriundo da camada deextensão de banda - são ajustados em energia a partir do envoltório espec-tral recebido (722). O espectro MDCT utilizado para a síntese é, portanto,constituído: por um lado, sinal de síntese dos dois primeiros estágios de de-codificação acrescentado ao sinal de erro decodificado nas bandas entre 0 e3400 Hz (718 e 719); por outro lado, para as bandas compreendidas entre3400 Hz e 7000 Hz dos coeficientes MDCT decodificados nas bandas emque a estrutura fina foi recebida e coeficientes MDCT do estágio de extensãode banda ajustados em energia para as outras bandas espectrais (721 e 722).
Uma transformação MDCT inversa é em seguida aplicada aoscoeficientes MDCT decodificados (713) e uma filtragem pelo litro de sínteseponderado (714) permite obter o sinal de saída.
Em uma variante do modo de realização anteriormente descrito,o estágio de codificação / decodificação predicativo por transformada funcio-nará inteiramente sobre o sinal de diferença entre o sinal original e o sinal desíntese do estágio de extensão de banda entre 0 e 7000 Hz.
Em uma outra variante desse modo de realização, a extensão debanda será realizada, efetuada na codificação e na decodificação no domí-nio transformado a partir de um envoltório espectral determinado pela ener-gia por sub-banda do sinal e de uma codificação da estrutura fina. Esse en-voltório espectral pode ser quantificado por quantificação vetorial. Nessa va-riante, o estágio de melhoria em banda larga utiliza uma codificação portransformada de tipo TDAC, conforme descrito anteriormente (sem filtragemde ponderação). Assim, o envoltório espectral que é dado pela energia porsub-banda do sinal e que constitui um parâmetro espectral é transmitida noestágio de extensão debanda e será reutilizada pela camada de melhoria embanda alargada.
Por outro lado, em um modo de realização alternativo, a primeirabanda de freqüência codificada poderia corresponder à banda larga 50-700Hz e a segunda banda de freqüência codificada poderia ser uma banda FM(50-15000 Hz) ou hifi (20-24000 Hz).

Claims (21)

1. Sistema de codificação de um sinal áudio hierárquico, com-preendendo, pelo menos, uma camada núcleo de codificação paramétricapor análise por síntese em uma primeira banda de freqüência, uma camadade extensão de banda destinada a alargar essa primeira banda de freqüên-cia em uma segunda banda de freqüência, essa banda estendida, caracteri-zado pelo fato de esse sistema compreender também uma camada de me-lhoria da qualidade da codificação áudio na banda estendida, baseada emuma codificação por transformada, utilizando um parâmetro espectral oriun-do dessa camada de extensão de banda.
2. Sistema de codificação, de acordo com a reivindicação 1, ca-racterizado pelo fato de esse sistema compreender também uma camada demelhoria da qualidade de codificação áudio nessa primeira banda de fre-qüência.
3. Sistema de codificação, de acordo com uma das reivindica-ções 1 ou 2, caracterizado pelo fato de essa codificação paramétrica por a-nálise por síntese ser uma codificação CELP.
4. Sistema de codificação, de acordo com qualquer uma das rei-vindicações 1 a 3, caracterizado pelo fato de esse parâmetro espectral serum envoltório espectral oriundo da camada de extensão de banda.
5. Sistema de codificação, de acordo com a reivindicação 4, ca-racterizado pelo fato de esse envoltório espectral ser especificado por umfiltro de predição linear em banda estendida.
6. Sistema de codificação, de acordo com a reivindicação 4, ca-racterizado pelo fato de esse envoltório espectral ser determinado pela e-nergia por sub-banda do sinal.
7. Sistema de codificação, de acordo com qualquer uma das rei-vindicações 1 a 3, caracterizado pelo fato de esse parâmetro espectral serpelo menos uma parte da transformada do sinal sintetizado pela camada deextensão de banda.
8. Sistema de codificação, de acordo com a reivindicação 7, ca-racterizado pelo fato de esse sistema compreender um módulo de ajusteprogressivo da energia em sub-bandas da transformada do sinal sintetizadopela camada de extensão de banda.
9. Processo para a utilização do sistema de codificação, de a-cordo com a reivindicação 4, compreendendo as seguintes etapas:- codificação de um sinal original nessa primeira banda de fre-qüência;- codificação do sinal original em uma extensão da primeira ban-da de freqüência, utilizando um envoltório espectral;- cálculo de um sinal residual a partir do sinal original e dos si-nais oriundos das operações de codificação precedentes, caracterizado pelofato de esse processo compreender também uma etapa de produção deuma camada de melhoria da qualidade da codificação áudio utilizando umacodificação por transformada, essa codificação por transformada desse sinalresidual utilizando esse envoltório espectral.
10. Processo para utilização do sistema de codificação, deacordo com a reivindicação 7, compreendendo as seguintes etapas:- codificação de um sinal original nessa primeira banda de fre-qüência;- codificação do sinal original em uma extensão da primeira ban-da de freqüência, utilizando um envoltório espectral;- cálculo de um sinal residual a partir do sinal original e dos si-nais oriundos das operações de codificação precedentes, caracterizado pelofato de esse processo compreender também uma etapa de produção deuma camada de melhoria utilizando uma codificação por transformada dessesinal residual, essa codificação por transformada, utilizando a transformadado sinal sintetizado pela camada de extensão de banda.
11. Processo, de acordo com uma das reivindicações 9 ou 10,caracterizado pelo fato de esse processo compreender uma etapa de ajusteprogressivo da energia em sub-bandas de transformada do sinal sintetizadopela camada de extensão de banda.
12. Programa de computador, compreendendo instruções deprograma para a utilização das etapas do processo, como definido em qual-quer uma das reivindicações 9 a 11, quando esse programa é executado porum computador.
13. Codificador áudio hierárquico, compreendendo:- um codificador núcleo (603) de codificação paramétrica por a-nálise por síntese, destinado a codificar um sinal original em uma primeirabanda de freqüência;- um estágio de codificação em uma extensão da primeira bandade freqüência, compreendendo um envoltório espectral (607);- um estágio de cálculo de um sinal residual a partir do sinal ori-ginal e sinais oriundos dos estágios de codificação precedentes, caracteriza-do pelo fato de esse codificador compreender também um estágio de melho-ria da qualidade da codificação áudio em banda estendida por codificaçãopor transformada, incluindo uma transformada inversa, utilizando esse envol-tório espectral (607).
14. Codificador áudio hierárquico, compreendendo:- um codificador núcleo (603) de codificação paramétrica por a-nálise por síntese, destinado a codificar um sinal original em uma primeirabanda de freqüência;- um estágio de codificação em uma extensão da primeira bandade freqüência;- um estágio de cálculo de um sinal residual a partir do sinal ori-ginal e sinais oriundos dos estágios de codificação precedentes, caracteriza-do pelo fato de esse codificador compreender também um estágio de melho-ria da qualidade da codificação áudio em banda estendida por codificaçãopor transformada, utilizando a transformada do sinal sintetizado pela camadade extensão de banda.
15. Codificador, de acordo com uma das reivindicações 13 ou-14, caracterizado pelo fato de esse codificador núcleo (603) comporta umestágio de melhoria da qualidade da codificação áudio nessa primeira bandade freqüência.
16. Codificador, de acordo com qualquer uma das reivindicações-13 a 15, caracterizado pelo fato de essa transformada ser uma transformadaem co-seno discreta modificada (MDCT).
17. Decodificador áudio hierárquico, compreendendo:- um decodificador núcleo (702) de codificação paramétrica poranálise por síntese destinado a decodificar em uma primeira banda de fre-qüência um sinal recebido codificado pelo primeiro codificador, como defini-do na reivindicação 13;- um estágio de decodificação em uma extensão da primeirabanda de freqüência, compreendendo um envoltório espectral, caracterizadopelo fato de esse decodificador compreender também um estágio de melho-ria da qualidade da decodificação áudio em banda estendida por decodifica-ção por transformada, incluindo uma transformada inversa, utilizando esseenvoltório espectral.
18. Decodificador áudio hierárquico, compreendendo:- um decodificador núcleo (702) de codificação paramétrica poranálise por síntese destinado a decodificar em uma primeira banda de fre-qüência um sinal recebido codificado pelo primeiro codificador;- um estágio de decodificação em uma extensão da primeirabanda de freqüência, caracterizado pelo fato de esse codificador compreen-der também um estágio de melhoria da qualidade da codificação áudio embanda estendida por decodificação por transformada, incluindo uma trans-formada inversa, utilizando a transformada do sinal sintetizado pela camadade extensão de banda.
19. Decodificador, de acordo com uma das reivindicações 17 ou 18, caracterizado pelo fato de esse decodificador compreender um estágiode adaptação progressiva da energia em sub-bandas do espectro geradopor codificação por transformada.
20. Decodificador, de acordo com qualquer uma das reivindica-ções 17 a 19, caracterizado pelo fato de esse decodificador núcleo (702)comporta uma estágio de melhoria da qualidade da decodificação áudionessa primeira banda de freqüência.
21. Decodificador, de acordo com qualquer uma das reivindica-ções 17 a 20, caracterizado pelo fato de essa transformada inversa ser umatransformada inversa em co-seno discreta modificada (MDCT).
BRPI0612987-0A 2005-07-13 2006-07-07 dispositivo de codificaÇço/decodificaÇço hierÁrquica BRPI0612987A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0552199A FR2888699A1 (fr) 2005-07-13 2005-07-13 Dispositif de codage/decodage hierachique
FR0552199 2005-07-13
PCT/FR2006/050690 WO2007007001A2 (fr) 2005-07-13 2006-07-07 Dispositif de codage/decodage hierarchique

Publications (1)

Publication Number Publication Date
BRPI0612987A2 true BRPI0612987A2 (pt) 2010-12-14

Family

ID=36608212

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0612987-0A BRPI0612987A2 (pt) 2005-07-13 2006-07-07 dispositivo de codificaÇço/decodificaÇço hierÁrquica

Country Status (9)

Country Link
US (1) US8374853B2 (pt)
EP (1) EP1905010B1 (pt)
JP (1) JP5112309B2 (pt)
KR (1) KR101303145B1 (pt)
CN (1) CN101263553B (pt)
AT (1) ATE511179T1 (pt)
BR (1) BRPI0612987A2 (pt)
FR (1) FR2888699A1 (pt)
WO (1) WO2007007001A2 (pt)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
JPWO2008066071A1 (ja) * 2006-11-29 2010-03-04 パナソニック株式会社 復号化装置および復号化方法
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
KR100916400B1 (ko) 2008-04-07 2009-09-07 현대자동차주식회사 후드용 안전후크 구조
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
UY31968A (es) 2008-07-09 2010-01-29 Sanofi Aventis Nuevos derivados heterocíclicos, sus procesos para su preparación, y sus usos terapéuticos
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US9082395B2 (en) 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
CN101989429B (zh) * 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
PL3998606T3 (pl) 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
WO2011142709A2 (en) * 2010-05-11 2011-11-17 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for processing of audio signals
CN108366264B (zh) * 2010-06-04 2022-08-26 索尼公司 图像处理设备和方法
US8904027B2 (en) * 2010-06-30 2014-12-02 Cable Television Laboratories, Inc. Adaptive bit rate for data transmission
JP5695074B2 (ja) * 2010-10-18 2015-04-01 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声復号化装置
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
US8895547B2 (en) 2011-03-08 2014-11-25 Sanofi Substituted phenyl-oxathiazine derivatives, method for producing them, drugs containing said compounds and the use thereof
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
US9552818B2 (en) * 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US10141004B2 (en) * 2013-08-28 2018-11-27 Dolby Laboratories Licensing Corporation Hybrid waveform-coded and parametric-coded speech enhancement
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
KR102121642B1 (ko) 2014-03-31 2020-06-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
CN108549048B (zh) * 2018-03-23 2021-10-22 武汉大学 一种多频WiFi外辐射源雷达相参处理方法
CN114258569A (zh) * 2019-08-20 2022-03-29 杜比国际公司 用于音频编码的多滞后格式

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP2002531979A (ja) * 1998-12-01 2002-09-24 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 改良波形補間型符号器
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
KR20010101422A (ko) * 1999-11-10 2001-11-14 요트.게.아. 롤페즈 매핑 매트릭스에 의한 광대역 음성 합성
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
CN1293534C (zh) * 2001-01-16 2007-01-03 皇家菲利浦电子有限公司 参数编码器和参数编码方法及参数译码器和参数译码方法
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
EP1444688B1 (en) * 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
JP3870193B2 (ja) * 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
DE60214599T2 (de) * 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
JP3881946B2 (ja) 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
AU2003247568B2 (en) 2002-06-20 2008-03-06 Septodont Holding Sas Stabilized formulations of alpha adrenergic receptor antagonists and uses thereof
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100728428B1 (ko) * 2002-09-19 2007-06-13 마츠시타 덴끼 산교 가부시키가이샤 오디오 디코딩 장치 및 오디오 디코딩 방법
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR100513729B1 (ko) * 2003-07-03 2005-09-08 삼성전자주식회사 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
CN100507485C (zh) * 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
DE602005017358D1 (de) * 2004-01-28 2009-12-10 Koninkl Philips Electronics Nv Verfahren und vorrichtung zur zeitskalierung eines signals
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP3118849B1 (en) * 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding device, decoding device, and method thereof
US20060023748A1 (en) * 2004-07-09 2006-02-02 Chandhok Ravinder P System for layering content for scheduled delivery in a data network
RU2007108288A (ru) * 2004-09-06 2008-09-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство масштабируемого кодирования и способ масштабируемого кодирования
EP1987513B1 (fr) * 2006-02-06 2009-09-09 France Telecom Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants
BRPI0818927A2 (pt) * 2007-11-02 2015-06-16 Huawei Tech Co Ltd Método e aparelho para a decodificação de áudio

Also Published As

Publication number Publication date
WO2007007001A2 (fr) 2007-01-18
EP1905010B1 (fr) 2011-05-25
US8374853B2 (en) 2013-02-12
ATE511179T1 (de) 2011-06-15
US20090326931A1 (en) 2009-12-31
JP5112309B2 (ja) 2013-01-09
EP1905010A2 (en) 2008-04-02
CN101263553B (zh) 2013-10-02
FR2888699A1 (fr) 2007-01-19
KR20080032160A (ko) 2008-04-14
KR101303145B1 (ko) 2013-09-09
CN101263553A (zh) 2008-09-10
JP2009501351A (ja) 2009-01-15
WO2007007001A3 (fr) 2007-04-12

Similar Documents

Publication Publication Date Title
BRPI0612987A2 (pt) dispositivo de codificaÇço/decodificaÇço hierÁrquica
US10249313B2 (en) Adaptive bandwidth extension and apparatus for the same
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
US8260620B2 (en) Device for perceptual weighting in audio encoding/decoding
AU2008316860B2 (en) Scalable speech and audio encoding using combinatorial encoding of MDCT spectrum
CA2862712C (en) Multi-mode audio codec and celp coding adapted therefore
BRPI0609530A2 (pt) método e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala
MX2013009306A (es) Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada.
EP2132732B1 (en) Postfilter for layered codecs
Sinder et al. Recent speech coding technologies and standards

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/24 (2013.01)

B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]
B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]