WO2002069328A1

WO2002069328A1 - Reconstruction spectrale et codage d'un signal a spectre incomplet

Info

Publication number: WO2002069328A1
Application number: PCT/FR2002/000618
Authority: WO
Inventors: Pierrik Philippe; Patrice Collen
Original assignee: France Telecom Sa; Telediffusion De France Sa
Priority date: 2001-02-23
Filing date: 2002-02-18
Publication date: 2002-09-06
Also published as: FR2821501B1; FR2821501A1

Abstract

L'invention a trait à un procédé de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, le spectre dudit signal audio à bande limitée à une première bande spectrale pouvant comprendre des trous fréquentiels dans des sous-bandes de ladite première bande spectrale, ledit procédé comprenant: - une étape de correction (120) dudit signal audio à bande limitée adaptée à injecter des composantes spectrales dans lesdites sous-bandes; - une étape de blanchiment spectral (150) par un filtre blanchisseur pour blanchir le contenu spectral de la première bande spectrale, la fonction de transfert dudit filtre blanchisseur étant obtenue à partir d'une information donnant l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction. L'invention concerne également un dispositif de reconstruction spectrale correspondant, un dispositif de décodage comprenant ce dernier ainsi qu'un système de codage/décodage.

Description

RECONSTRUCTION SPECTRALE ET CODAGE D UN SIGNAL A SPECTRE INCOMPLET

La présente invention concerne un procédé et un dispositif de reconstruction spectrale d'un signal à spectre incomplet. Plus particulièrement, la présente invention trouve application dans l'amélioration du décodage d'un signal audio codé par un codeur à limitation de bande spectrale, notamment un codeur à réduction de débit du type par transformée. L'invention concerne un dispositif de décodage comprenant ce dispositif de reconstruction spectrale ainsi qu'un système de codage/ décodage.

En codage audio à réduction de débit, le signal audio doit souvent subir une limitation de bande passante lorsque le débit binaire devient faible. Cette limitation de bande passante est nécessaire pour éviter l'introduction de bruit de quantification audible dans le signal codé. Il est alors souhaitable de régénérer dans la mesure du possible le contenu haute fréquence du signal original.

Est connu de l'état de la technique, et notamment du document WO-A-9857436, le fait de régénérer le contenu spectral haute fréquence du signal original en procédant à une transposition harmonique du spectre basse fréquence du signal décodé vers les hautes fréquences. Cette transposition est effectuée en recopiant la valeur spectrale d'un fondamental à f à toutes les fréquences de la série harmonique n*fk. La forme du spectre haute fréquence ainsi obtenue est ajustée en appliquant des facteurs de pondération spectrale.

Cette technique est fondée sur une analyse en sous-bandes et une duplication harmonique complexe. Elle met en oeuvre des méthodes d'ajustement de phase et d'amplitude coûteuses en calcul. En outre, les facteurs de pondération spectrale ne modélisent que grossièrement l'enveloppe spectrale.

Plus récemment, a été proposée dans la demande française non publiée N° 0005023, déposée par la demanderesse, une technique d'enrichissement spectral, s'appliquant notamment à l'amélioration du décodage d'un signal audio codé par un codeur à limitation de bande spectrale, dans laquelle une information décrivant l'enveloppe spectrale d'un signal avant codage est transmise au décodeur ou est reconstituée par ce dernier. Le spectre du signal basse fréquence décodé est blanchi par le biais d'un filtre blanchisseur de fonction de transfert inverse (ou approximativement inverse) à la fonction d'enveloppe. Le spectre blanchi est transposé vers les hautes fréquences. Le signal à spectre transposé résultant est mis en forme par le biais d'un filtre de mise en forme dont la fonction de transfert est estimée à partir de l'information décrivant l'enveloppe spectrale du signal avant codage. Le signal résultant est ajouté au signal à spectre limité par un sommateur pour générer un signal reconstruit spectralement. Le blanchiment spectral, bien connu dans le domaine du codage audio, peut être réalisé, par exemple, par filtrage LPC (Linear Prédictive Coding), tel que décrit dans l'article de J. Makhoul intitulé « Linear Prédiction : a tutorial review », Proceedings of the IEEE, Vol. 63, N°4, pp 561-580.

Cette technique permet de réaliser une reconstruction spectrale performante avec un dispositif de faible complexité. En outre, la mise en forme spectrale du signal reconstruit est plus précise et plus simple qu'avec les techniques antérieures.

Cependant, lorsque le codeur utilisé est un codeur par transformée, comme par exemple un codeur de type MPEG-4 AAC, le signal décodé peut subir des distorsions spectrales notables. Par exemple, certaines bandes fréquentielles, jugées non perceptibles par le modèle psycho-acoustique, ne sont pas transmises. En outre, il peut être filtré, certaines bandes fréquentielles ayant subi une perte d'énergie. Le blanchiment spectral d'un tel signal est alors très délicat et requiert un filtre blanchisseur utilisant un grand nombre de coefficients. La Fig. 2 représente le spectre d'un signal issu d'un décodeur dans un cas de transmission idéale. Ce signal est un signal audio à bande limitée à la bande 0-5 kHz. L'enveloppe correspondant à ce signal est également représentée à la Fig. 2. Suivant la technique de reconstruction spectrale basée sur le blanchiment du contenu spectral à transposer, l'enveloppe est modélisée sous la forme d'un filtre dont les coefficients sont estimés à partir du signal à bande limitée. En appliquant le filtre inverse sur ce signal, on obtient le signal résiduel blanchi qui est représenté à la Fig. 3.

La Fig. 4 représente le spectre d'un signal audio à bande limitée du même type que celui représenté à la Fig. 2, mais pour lequel une bande de fréquences n'a pas été transmise. L'opération de blanchiment spectral est perturbée par la présence d'un tel trou fréquentiel.

La Fig. 5 représente le signal blanchi correspondant. On observe une énergie trop forte dans les bandes fréquentielles adjacentes à la bande non transmise, les pôles du filtre blanchisseur tendant à augmenter l'énergie des zones fréquentielles de faible énergie.

Le problème à la base de l'invention est, dans le cadre de la reconstruction spectrale d'un signal avec blanchiment d'un contenu spectral à transposer, l'optimisation du blanchiment de signaux ayant subi des distorsions spectrales notables. Le problème à la base de l'invention est résolu par un procédé de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, le spectre dudit signal audio à bande limitée étant limité à une première bande spectrale, ladite première bande spectrale pouvant comprendre des trous fréquentiels dans des sous-bandes de ladite première bande spectrale, ledit procédé comprenant :

- une étape de correction dudit signal audio à bande limitée adaptée à injecter des composantes spectrales dans lesdites sous-bandes ;

- une étape de blanchiment spectral pour blanchir le contenu spectral de la première bande spectrale, utilisant une information donnant l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.

Avantageusement, le procédé de reconstruction spectrale comprend en outre :

- une étape de transposition du contenu spectral blanchi de ladite première bande spectrale dans une seconde bande spectrale pour générer un signal à spectre transposé, de spectre limité à ladite seconde bande spectrale ; - une étape de mise en forme du spectre dudit signal à spectre transposé pour obtenir un signal d'enrichissement ;

- une étape de combinaison dudit signal à bande limitée et dudit signal d'enrichissement pour produire un signal à spectre reconstruit. Selon un premier mode de réalisation, l'étape de blanchiment spectral est avantageusement effectuée en filtrant le signal audio à bande limitée au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.

Selon un second mode de réalisation, l'étape de blanchiment spectral est effectuée en filtrant le signal audio à bande limitée corrigé par ladite étape de correction au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.

Selon une première variante, lesdites composantes injectées dans lesdites sous- bandes sont des composantes de bruit.

Selon un seconde variante, lesdites composantes injectées dans lesdites sous- bandes sont des composantes harmoniques relatives à des composantes connues du signal audio à bande limitée.

Selon une troisième variante, les composantes injectées dans une sous-bande sont obtenues par translation suivie éventuellement d'un retournement du contenu spectral d'une bande spectrale adjacente à ladite sous-bande.

L'invention est également définie par un dispositif de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, comprenant des moyens pour mettre en œuvre les étapes du procédé défini ci-dessus.

Avantageusement, ce dispositif de reconstruction comprend:

- un filtre blanchisseur pour exécuter ladite étape de blanchiment du contenu spectral ;

- un module de transposition du contenu spectral pour exécuter ladite étape de transposition du contenu spectral ;

- un filtre de mise en forme pour exécuter ladite étape de mise en forme ;

- un module de correction pour exécuter ladite étape de correction, la fonction de transfert dudit filtre blanchisseur étant obtenue à partir d'une information issue dudit module de correction. L'invention est également définie par un dispositif de décodage d'un signal audio codé par codage à limitation de spectre d'un signal source, ce dispositif comprenant un décodeur adapté à fournir un signal audio à bande limitée et un dispositif de reconstruction spectrale tel que défini ci-dessus. Avantageusement, ledit décodeur est adapté à fournir au module de correction une information relative à la puissance des composantes à injecter.

Enfin, l'invention est définie par un système de codage/décodage audio, comprenant un codeur audio à limitation de spectre adapté à coder un signal source et un dispositif de décodage comme défini ci-dessus. Ce système peut comprendre en outre des moyens adaptés à transmettre une information d'enveloppe spectrale dans la bande non transmise par le codeur.

Les caractéristiques de l'invention mentionnées ci-dessus, ainsi que d'autres, apparaîtront plus clairement à la lecture de la description suivante d'un exemple de réalisation, ladite description étant faite en relation avec les dessins joints, parmi lesquels: la Fig. 1 représente schématiquement un dispositif de reconstruction spectrale d'un signal audio selon l'invention ; la Fig. 2 représente le spectre d'un signal émis par un décodeur dans un cas de transmission idéale ; la Fig. 3 représente le spectre du signal de la Fig. 2 après blanchiment spectral ; la Fig. 4 représente le spectre d'un signal émis par un décodeur dans le cas où une bande de fréquences n'a pas été transmise ; et la Fig. 5 représente le spectre du signal de la Fig. 4 après blanchiment spectral, les Figs. 6a à 6d illustrent schématiquement un procédé de reconstruction spectrale selon un premier mode de réalisation de l'invention ; la Figs. 7a à 7d illustrent schématiquement un procédé de reconstruction spectrale selon un second mode de réalisation de l'invention.

Le procédé de reconstruction spectrale selon l'invention peut s'appliquer à un signal issu du décodage d'un signal audio codé par un codeur à limitation de bande spectrale, notamment un codeur par transformée, comme par exemple un codeur de type MPEG-4 AAC.

En référence à la Fig. 1 , un signal audio est codé par un codeur 100, par exemple un codeur par transformée, tel que le MPEG-4 AAC. Après transmission du signal codé par un moyen quelconque, les données sont décodées dans le décodeur 1 10 sous la forme de composante spectrales. Celles-ci correspondent en général au spectre d'un signal audio à bande limitée, pouvant en outre présenter des sous-bandes manquantes ou « trous fréquentiels » dans la bande.

Les composantes spectrales sont transmises à un premier module 120 adapté à détecter la présence de trous fréquentiels et à les combler en injectant des composantes de bruit ou des harmoniques de composantes connues. Alternativement, le module 120 comblera un trou fréquentiel par transposition du contenu spectral d'une bande adjacente à ce trou. Cette transposition peut être une simple translation ou une translation combinée avec un retournement. Selon une première variante, la puissance du signal à injecter est déterminée par interpolation à partir des valeurs de puissance des composantes connues. Selon une seconde variante, le niveau de puissance du signal à injecter a été préalablement déterminé au niveau du codeur et transmis sous la forme d'une information auxiliaire au décodeur. Après décodage, cette information auxiliaire est fournie au module 120. Cette variante est symbolisée par la liaison 1 15.

Le module 130 est un module d'estimation d'enveloppe spectrale opérant sur le signal à bande limitée et dont les trous spectraux ont été comblés. Il peut, par exemple, modéliser l'enveloppe spectrale par une analyse LPC après conversion dans le domaine temporel du spectre fourni par le module 120. On obtient ainsi les coefficients d'un filtre modélisant l'enveloppe spectrale dans la bande du signal. Le module 150 est un filtre blanchisseur dont la fonction de transfert est l'inverse de la fonction de transfert de ce filtre de modélisation d'enveloppe. Selon une première variante, le filtre blanchisseur reçoit le signal représenté par le spectre original présentant des trous fréquentiels , tel que fourni par le décodeur 1 10. Cette variante est représentée en traits interrompus par la liaison 1 1 1, Selon un autre mode de réalisation, le filtre blanchisseur reçoit le signal correspondant au spectre dont les trous ont été comblés, tel que fourni par le module 120. Ce mode de réalisation est représentée par la liaison 121.

Le module 160 est un module de transposition spectrale. Il a pour fonction de recopier toute ou partie de la bande du signal dans une bande cible. L'opération de transposition est par exemple une translation ou un retournement suivi d'une translation dans une bande cible.

Le module 170 est un filtre de mise en forme spectrale recevant une information d'enveloppe spectrale dans la bande cible. Cette information peut être transmise par un module 105 adjoint au codeur, adapté à effectuer une modélisation d'enveloppe du signal audio pleine bande. Seule l'information relative à la bande spectrale non codée par le codeur 100 est transmise par le module 170. Alternativement, l'information d'enveloppe spectrale dans la bande cible peut être extrapolée à partir de l'information d'enveloppe spectrale dans la bande limitée. Dans ce cas, le module 130 effectue cette extrapolation et transmet l'information extrapolée au module 170. Ce mode de réalisation est symbolisé par la liaison en traits discontinus 135.

Le module 120 est un module de correction adapté à analyser le signal issu du décodeur 110, afin de déterminer si une ou plusieurs bandes fréquentielles n'ont pas été transmises, à corriger ce signal, en ajoutant des composantes dans la ou les bandes fréquentielles absentes.

Le signal en sortie du décodeur 1 10 est à spectre incomplet ou limité, susceptible d'enrichissement spectral. En outre, le spectre de ce signal peut comporter un ou plusieurs trous fréquentiels. Par exemple, il peut s'agir d'un signal audio à bande limitée à la bande 0 à 5 kHz avec un trou fréquentiel, comme celui qui est représenté à la Fig. 4.

Le module de correction 120 analyse le signal issu du décodeur 110 afin de rechercher d'éventuelles bandes fréquentielles manquantes. Lorsqu'il en détecte, il injecte des composantes spectrales dans la ou les bandes fréquentielles manquantes. Les puissances respectives des composantes à injecter peut avoir été préalablement déterminées au niveau du codeur et transmises comme information auxiliaire au décodeur. Alternativement, les puissances respectives des composantes à injecter peuvent être estimées à partir du signal reçu. Il peut s'agir de calculs basés sur des moyennes, d'estimations effectuées à partir des bandes de fréquences adjacentes à des bandes non transmises, d'interpolations, ou de comparaisons avec un dictionnaire de formes d'ondes.

Les composantes injectées dans le signal par le module 120 peuvent être, soit des composantes de bruit, soit des composantes harmoniques de composantes connues du signal décodé. Les composantes à injecter peuvent être les composantes spectrales d'une bande spectrale adjacente que l'on soumet à une opération de translation, combinée éventuellement à une opération de retournement.

On obtient ainsi un signal corrigé ayant un spectre dont les trous ont été comblés. Le module d'estimation d'enveloppe spectrale 130 estime l'enveloppe spectrale du signal corrigé dans la bande limitée. Ce dernier estime les coefficients du filtre blanchisseur sur la base de ce signal corrigé.

Le signal issu du décodeur, corrigé ou non, est filtré par le filtre blanchisseur 150 dont la fonction de transfert est obtenue à partir de l'estimation de l'enveloppe spectrale, effectuée par le module 130. Le signal de spectre blanchi est soumis à transposition spectrale par le module de transposition 160. Le signal à spectre décalé obtenu est typiquement un signal à spectre translaté vers les hautes fréquences, par exemple vers la bande 5 à 10 kHz dans le cas de l'exemple de la Fig. 4. Ce signal à spectre décalé est filtré par le filtre de mise en forme 170 dont la fonction de transfert est estimée à partir de l'information décrivant l'enveloppe spectrale de la bande cible. Le signal ainsi filtré constitue un signal d'enrichissement spectral qui est ajouté, grâce au sommateur 180, au signal à bande limitée issu, selon le cas, du décodeur via la liaison 1 1 1 ou du module 120 via la liaison 121. On obtient en sortie du sommateur un signal reconstruit spectralement.

Les Figs. 6a à 6d illustrent le procédé de reconstruction selon un premier mode de réalisation de l'invention. Dans ce mode de réalisation, la liaison 1 1 1 existe et la liaison 121 est absente.

La Fig. 6a représente le spectre d'un signal à bande limitée [0,B] présentant un trou fréquentiel B', par exemple le spectre du signal en sortie du décodeur audio 1 10. La Fig. 6b représente le spectre du signal en sortie du module de correction 120. Le trou fréquentiel a été comblé ici par injection d'harmoniques. Le module 130 détermine les coefficients du filtre blanchisseur à partir de ce signal corrigé. La Fig. 6c représente le spectre du signal en sortie du filtre blanchisseur. La Fig. 6d représente le spectre du signal après transposition spectrale, en sortie du module de transposition 160. Ce signal sera remis en forme par le filtre 170 pour fournir un signal d'enrichissement spectral qui sera ajouté au signal initial.

Les Figs. 7a à 7d illustrent le procédé de reconstruction selon un second mode de réalisation de l'invention. Dans ce mode de réalisation, la liaison 121 existe et la liaison 1 1 1 est absente.

Les Figs. 7a et 7b rappellent le spectre du signal en sortie du décodeur et du module de correction.

La Fig. 7c représente le spectre du signal en sortie du filtre blanchisseur. On notera que le signal blanchi ne présente plus de trou fréquentiel. La Fig. 7d représente le spectre du signal après transposition spectrale, en sortie du module de transposition 160. Ce signal sera remis en forme par le filtre 170 pour fournir un signal d'enrichissement spectral qui sera ajouté au signal initial.

Bien que le dispositif selon l'invention ait été représenté sous la forme de modules fonctionnels, il va de soi que tout ou partie de ce dispositif peut être réalisé au moyen d'un processeur unique ou une pluralité de processeurs dédiés ou non.

Claims

REVENDICATIONS

1) Procédé de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, le spectre dudit signal audio à bande limitée étant limité à une première bande spectrale, ladite première bande spectrale pouvant comprendre des trous fréquentiels dans des sous-bandes de ladite première bande spectrale, ledit procédé étant caractérisé en ce qu'il comprend :

- une étape de correction (120) dudit signal audio à bande limitée adaptée à injecter des composantes spectrales dans lesdites sous-bandes ;

- une étape de blanchiment spectral (150) pour blanchir le contenu spectral de la première bande spectrale, utilisant une information donnant l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.

2) Procédé de reconstruction spectrale selon la revendication 1 , caractérisée en ce qu'il comprend en outre : - une étape de transposition (160) du contenu spectral blanchi de ladite première bande spectrale dans une seconde bande spectrale pour générer un signal à spectre transposé, de spectre limité à ladite seconde bande spectrale ;

- une étape de mise en forme (170) du spectre dudit signal à spectre transposé pour obtenir un signal d'enrichissement ; - une étape de combinaison (180) dudit signal à bande limitée et dudit signal d'enrichissement pour produire un signal à spectre reconstruit.

3) Procédé de reconstruction spectrale selon la revendication 1 ou 2, caractérisé en ce que ladite étape de blanchiment spectral est effectuée en filtrant le signal audio à bande limitée au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.

4) Procédé de reconstruction spectrale selon la revendication 1 ou 2, caractérisé en ce que ladite étape de blanchiment spectral est effectuée en filtrant le signal audio à bande limitée corrigé par ladite étape de correction au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.

5) Procédé de reconstruction spectrale selon l'une des revendications précédentes, caractérisé en ce que lesdites composantes injectées dans lesdites sous- bandes sont des composantes de bruit.

6) Procédé de reconstruction spectrale selon l'une des revendications 1 à 4, caractérisé en ce que lesdites composantes injectées dans lesdites sous-bandes sont des composantes harmoniques relatives à des composantes connues du signal audio à bande limitée.

7) Procédé de reconstruction spectrale selon l'une des revendications 1 à 4, caractérisé en ce que les composantes injectées dans une sous-bande sont obtenues par translation suivie éventuellement d'un retournement du contenu spectral d'une bande spectrale adjacente à ladite sous-bande.

8) Dispositif de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, caractérisé en ce qu'il comprend des moyens pour mettre en œuvre les étapes du procédé selon l'une quelconque des revendications 1 à 7.

9) Dispositif de reconstruction spectrale selon la revendication 8, caractérisé en ce qu'il comprend: - un filtre blanchisseur (150) pour exécuter ladite étape de blanchiment du contenu spectral ;

- un module de transposition du contenu spectral (160) pour exécuter ladite étape de transposition du contenu spectral ;

- un filtre de mise en forme (170) pour exécuter ladite étape de mise en forme ; - un module de correction (120) pour exécuter ladite étape de correction, la fonction de transfert dudit filtre blanchisseur étant obtenue à partir d'une information issue dudit module de correction. 10) Dispositif de décodage d'un signal audio codé par codage à limitation de spectre d'un signal source, caractérisé en ce qu'il comporte un décodeur adapté à fournir un signal audio à bande limitée et un dispositif de reconstruction spectrale selon la revendication 8 ou 9.

1 1) Dispositif de décodage d'un signal audio codé par codage à limitation de spectre d'un signal source, caractérisé en ce qu'il comporte un décodeur adapté à fournir un signal audio à bande limitée et un dispositif de reconstruction spectrale selon la revendication 9 et que ledit décodeur est adapté à fournir au module de correction une information relative à la puissance des composantes à injecter.

12) Système de codage/décodage audio, caractérisé en ce qu'il comprend un codeur audio à limitation de spectre adapté à coder un signal source et un dispositif de décodage selon la revendication 10 à 1 1.

13) Système de codage/décodage audio selon la revendication 12, caractérisé en ce qu'il comprend en outre des moyens (105) adaptés à transmettre une information d'enveloppe spectrale dans la bande non transmise par le codeur.