WO2013186506A1

WO2013186506A1 - Procede de traitement d'un signal numerique, dispositif et programmes d'ordinateurs associes

Info

Publication number: WO2013186506A1
Application number: PCT/FR2013/051401
Authority: WO
Inventors: Julien Faure; Grégory PALLONE
Original assignee: Orange
Priority date: 2012-06-15
Filing date: 2013-06-14
Publication date: 2013-12-19
Also published as: FR2992131A1

Abstract

Procédé de traitement d'un signal numérique, dispositif et programme d'ordinateur associés. L'invention concerne un procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence, comprenant les étapes suivantes : - rotation du signal avant l'application d'une transformation de Fourier discrète, dite pré-rotation du signal; - transformation du signal par application d'une transformation de Fourier discrète; - rotation du signal transformé, dite post-rotation du signal; - compensation d'au moins une desdites rotations par multiplication du signal obtenu avec un facteur de compensation approximé, - stockage préalable de valeurs de cosinus en mémoire dans une table, lesdites valeurs stockées étant destinées à être utilisées par les étapes de rotation. Selon l'invention, ledit procédé comprend en outre une étape de correction de l'approximation, consistant à appliquer un facteur multiplicatif de correction F aux valeurs de ladite table, avant leur stockage en mémoire.

Description

Procédé de traitement d'un signal numérique, dispositif et programmes d'ordinateurs associés

1. Domaine de l'invention

L'invention se situe dans le domaine du codage/décodage de signaux audionumériques, plus spécifiquement dans le domaine dit du « codage/décodage audio par transformée».

Le « codage par transformée » consiste à coder des signaux temporels dans le domaine transformé (fréquentiel). Cette transformation permet notamment d'utiliser les caractéristiques fréquentielles de signaux audio (musicaux, de parole ou d'autres) afin d'optimiser les performances de codage. On utilise par exemple le fait qu'un son harmonique est représenté dans le domaine fréquentiel par un nombre fini et réduit de raies spectrales qui peuvent ainsi être codées de manière concise. On a aussi recours à des effets de masquage fréquentiels pour mettre en forme le bruit de codage de manière à ce qu'il soit le moins audible possible.

2. Art antérieur

Une technique habituelle de codage par transformée peut être résumée comme suit. Le flux audionumérique (échantillonné à une fréquence d'échantillonnage Fs donnée), à coder, est sectionné en trames (ou « blocs », plus généralement) comprenant un nombre 2N d'échantillons fini. Chaque trame se recouvre classiquement à 50 % avec la trame précédente. Une fenêtre de pondération h_a (appelée « fenêtre d'analyse ») est appliquée à chaque trame.

Une transformation est ensuite appliquée au signal. Dans le cas d'une transformation dite « MDCT » (pour « Modified Discrète Cosine Transform », en anglais), et dans une réalisation particulière, la trame pondérée est « repliée » suivant une transformation 2N échantillons vers N échantillons. Une transformée DCT de type IV est ensuite appliquée à la trame repliée afin d'obtenir une trame de taille N dans le domaine transformé.

La trame dans le domaine transformé est alors quantifiée en utilisant un quantificateur adapté. La quantification permet de réduire la taille des données, mais introduit un bruit (audible ou non) dans la trame originale. Plus le débit du codeur est élevé, plus ce bruit est réduit et plus la trame quantifiée est proche de la trame originale.

Au décodage, une transformation MDCT inverse est alors appliquée à la trame quantifiée. La trame quantifiée de taille N est convertie en trame de taille N dans le domaine temporel en utilisant une DCT de type IV inverse. Une deuxième transformation de « dépliage » de N vers 2N est alors appliquée à la trame temporelle de taille N. Des fenêtres de pondération h_s dites de « synthèse » sont appliquées ensuite aux trames de tailles 2N.

Le flux audio décodé est alors synthétisé en sommant les parties en recouvrement. Une DCT de type IV peut s'exprimer de la façon suivante :

= f-∑^N _n in) cos (g) (n + ¾ (fc + ¾) (1 )

Où x(n) est le signal temporel de taille N, avec n entier compris entre 0 et N-1 , X(k) est le signal transformé de taille N.

Le terme V(2/N) est un facteur de normalisation. Dans cet exemple ce facteur à (2/iV) permet à la DCT IV d'être utilisée à la fois comme transformée directe et comme transformée inverse.

La DCT-IV est essentielle à la mise en œuvre de la MDCT (pour « Modified Discrète Cosinus Transform », en anglais) utilisée dans la plupart des standards de codeurs et décodeurs de signaux audionumériques (par exemple G729.1 , G718, G.722.1 annexe C, MPEG-4 audio ou MPEG-D USAC).

Si l'on implémentait la DCT-IV telle quelle, la complexité serait proportionnelle à N², N étant la taille de la transformée.

Il est connu du document de De-ming Zhang; Hai-ting Li, intitulé "A Low Complexity Transform - Evolved DCT," publié dans les proceedings de la conférence Computational Science and Engineering (CSE), 2011 IEEE 14th International Conférence on Computational Science and Engineering, vol., no., pp.144-149, qui s'est tenue les 24-26 août 201 1 , une méthode permettant de diminuer de manière importante la complexité de la DCT-IV, par approximation. Cette méthode d'implémentation rapide par transformée de Fourier Discrète ou DFT (pour « Discrète Fourier Transform », en anglais) a été spécifiée dans l'extension SWB du codeur G71 8.

Avec cette méthode, la DCT-IV s'exprime sous la forme suivante :

DCT IV(k) = cos (k + 0.5)(n + 0.5)) (2)

Ses étapes vont maintenant être décrites, en relation avec la Figure 1.

On considère un signal x(n), avec n et k e [ θ,Ι, ... ,^ - l] .

Les éléments du signal x(n) sont d'abord réorganisés dans un complexe z(n), au cours d'une étape Tr1 :

z(n) = x(2n) + jx(L - 1 - 2n), n 6 [θ,Ι, ... ,^ - l] (3) N est la taille du signal d'entrée x et z est le signal réorganisé.

Au cours d'une étape Tr2, une pré-rotation est appliquée à z(n) :

z^'(n) = z{n). a(N). WÏÏÏ⁺¹ (4)

avec a(N) = V2/VN qui correspond à la racine carrée du facteur de normalisation. Ce même facteur a(N) sera appliqué également lors d'une étape ultérieure Tr6 pour permettre de reconstituer le facteur de normalisation de la DCT-IV, soit V²/^N .

Le terme ¾^η+1 est défini par : = cos p¾^) - jsin p¾^)

On comprend ici qu'avantageusement, seul le stockage d'une table cosinus (ou sinus, qui n'est autre qu'un cosinus déphasé) R(n) de taille N/2 est nécessaire au calcul de l'expression a(N). W iï⁺¹ _ . ... . _t .

J^4N , avec R défini tel que :

Au cours d'une étape Tr3, une compensation de la pré-rotation est mise en œuvre, comme suit :

z^"(n) = z^'(n). W™⁺⁰-⁵ (6)

Une telle compensation de la pré-rotation permet d'assurer la reconstruction parfaite de la transformée. Elle est par exemple égale à W^¹ ou ou ou l_{t avec}

Par exemple :

W_4lï = cos ( ) -j sin (= = cos -j sin (^)

^{¾3 = cos}( )-^{j sin}( )

En Tr4, une Transformée de Fourier Discrète ou DFT (pour « Discrète Fourier Transform », en anglais) de taille N/2 est appliquée au signal compensé :

Z(fe) = DF7(z "(n)) (8)

En Tr5, une seconde compensation en rotation est mise en œuvre. La seconde compensation s'exprime donc de la façon suivante :

Z'(k) = Z(k). W™⁺⁰-⁵ (9)

La valeur du facteur de compensation appliqué dépend du choix fait lors de la première compensation faite dans l'étape Tr3.

Par exemple, dans le cas où la compensation utilisée lors de l'étape Tr3 est de 1 , la compensation à appliquer lors de cette étape est de W^.

Pour N grand, _{peut etre} approximé par ¹ + 7 3n/4JV Ainsi, dans la spécification du codeur G718 SWB, il a été choisi d'appliquer une première compensation avec un facteur égal à 1 pour l'étape Tr3 et une deuxième compensation avec un facteur égal à ^WBN pour l'étape Tr5. Il a aussi été choisi d'utiliser une approximation de ^WBN , qui s'exprime de la façon suivante :

W₈ ^~ _N ³~l + ; ^ (10)

Cette approximation permet d'économiser une multiplication par échantillon lors de la mise en œuvre de l'algorithme à cette étape (la partie réelle étant multipliée par 1 ).

En Tr6, les données sont à nouveau transformées par post-rotation :

Z"(k) = Z'(fc). a(N). W₄ ^{2 +1} (1 1 )

Ceci est avantageux, car cette rotation peut être obtenue en utilisant la même table R que celle de l'étape Tr2.

Enfin, au cours d'une dernière étape Tr7, les éléments du signal complexe Z"(k) sont réorganisés dans un réel X(k) :

DCT(2k) = ¾ (z^"( ) r _N -,

, ^;„ _Λ k e 0_; ^ - l (12)

DCT{N - 1 - 2k) = -3(Z (k)) ^{L 2 J}

3. Inconvénients de l'art antérieur L'approximation faite lors de la compensation de l'étape Tr5 permet de réduire la complexité de la rotation suivante, conformément à l'équation (10) évoquée ci-dessus:

Toutefois, si elle est valable pour les N suffisamment grands, elle est loin d'atteindre la reconstruction parfaite pour les N petits. Ceci s'explique par le fait que :

DCT¹ (DCT(x))= DCT(DCT(x))~= x.

Par conséquent, le rapport signal à bruit de la reconstruction parfaite ne respecte pas les standards habituellement admis. La méthode de l'art antérieur ne permet donc pas d'atteindre un résultat optimal quelle que soit la valeur du nombre d'échantillons N. En relation avec la Figure 2, on considère maintenant les courbes de rapport signal à bruit ou SNR (pour « Signal to Noise Ratio » , en anglais) pour la DCT-IV, telle qu'implémentée dans la spécification du codeur G71 8 SWB. Les SNR sont calculés sur des signaux aléatoires. Le SNR « DCT-IV » correspond à la différence entre la DCT-IV classique telle que décrite par l'équation (1 ) nommée DCT et la DCT-IV approximée du G718 SWB nommée DCT^*. :

La courbe SNR « PR DCT(DCT) » correspond à la condition de reconstruction parfaite entre le signal d'entrée et le signal ayant subi deux transformations successives :

SNR (PR DCUDCT)) = 10 log₁₀ (14)

Si l'on considère que la condition de reconstruction parfaite correspond à une valeur de SNR supérieure à 80 dB, on observe que cette condition n'est pas atteinte pour N<240.

On observe aussi que la DCT-IV approximée est assez éloignée de la DCT-IV originale.

4. Exposé de l'invention

La présente invention vient améliorer la situation. Elle propose à cet effet un procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence, comprenant les étapes suivantes :

- rotation du signal avant l'application d'une transformation de Fourier discrète, dite pré-rotation du signal ;

- transformation du signal par application d'une transformation de Fourier discrète ;

- rotation du signal transformé, dite post-rotation du signal;

- compensation d'au moins une desdites rotations par multiplication du signal obtenu avec un facteur de compensation approximé ;

- stockage préalable de valeurs de cosinus en mémoire dans une table, lesdites valeurs stockées étant destinées à être utilisées par les étapes de rotation.

Le procédé selon l'invention est remarquable en ce qu'il comprend une étape de correction de l'approximation, consistant à appliquer un facteur multiplicatif de correction F aux valeurs de ladite table, avant leur stockage en mémoire.

Le procédé de traitement selon l'invention est destiné à être mis en œuvre aussi bien pour l'application d'une transformation temps-fréquence directe que celle d'une transformée temps-fréquence inverse.

Avec l'invention, une éventuelle dérive introduite par l'approximation faite lors de l'étape de compensation en rotation est corrigée, ce qui permet d'une part de maximiser le SNR de la transformée temps-fréquence appliquée au signal, et d'autre part de se rapprocher des conditions de reconstruction parfaite, en particulier lorsque le nombre N d'échantillons est peu élevé.

Un avantage de stocker les valeurs corrigées en mémoire est que ce calcul est fait hors ligne une fois pour toutes, pour tous les signaux numériques susceptibles d'être traités, et donc qu'il n'entraîne pas de coût de calcul supplémentaire par rapport à la mise en œuvre de la DCT IV décrite dans l'état de l'art.

Le coût de la correction apportée se réduit à la multiplication du signal par un facteur de correction. L'invention apporte donc une amélioration du SNR de la transformation temps- fréquence et de la reconstruction, sans augmentation notable de la complexité de calcul.

Ainsi, l'invention permet d'optimiser les performances de traitement d'un signal numérique, aussi bien pour l'application d'une transformation temps-fréquence directe que celle d'une transformée temps-fréquence inverse. Selon un aspect de l'invention, le signal comprend des blocs successifs de N échantillons et le facteur de correction F(N) ne dépend que du nombre N d'échantillons.

Le facteur de correction appliqué au signal numérique ne dépend que du nombre N d'échantillons du signal. Il est donc indépendant de la forme du signal numérique d'entrée.

Un avantage de ce facteur de correction est qu'il n'est nécessaire de le calculer qu'une fois avant de l'appliquer à n'importe quel nouveau signal numérique d'entrée de N échantillons.

En outre, ce facteur peut être calculé hors ligne et appliqué aux différents signaux à traiter en amont de l'application de la transformation temps-fréquence.

Enfin, comme ce facteur dépend du nombre d'échantillons N du signal, il est nécessaire d'en calculer une nouvelle valeur pour chaque nouvelle valeur de N , ce qui permet d'optimiser la correction à chaque découpage du signal d'entrée.

L'invention concerne aussi un procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence, comprenant les étapes suivantes :

- stockage préalable de valeurs de fenêtres de pondération dans une table; - fenêtrage du signal numérique destinée à utiliser lesdites valeurs stockées ;

- rotation du signal transformé, dite post-rotation du signal;

- compensation d'au moins une desdites rotations par multiplication du signal obtenu avec un facteur de compensation approximé.

Le procédé selon l'invention est remarquable en ce qu'il comprend une étape de correction de l'approximation, consistant à appliquer le carré d'un facteur multiplicatif de correction F aux valeurs de ladite table, avant leur stockage en mémoire.

Le fenêtrage du signal est une opération qui est par exemple mise en œuvre lors de l'application d'une MDCT. Comme le fenêtrage n'est appliqué qu'une fois au signal numérique, le facteur multiplicatif de correction appliqué correspond au carré du facteur de correction utilisé dans le mode de réalisation précédent.

Un avantage est donc non seulement que ce calcul du facteur de correction est fait une fois pour toutes pour tous les signaux numériques susceptibles d'être traités, mais aussi que le facteur lui-même n'est appliqué qu'une fois. De ce fait, l'invention n'entraine pas de coût de calcul supplémentaire par rapport à la mise en œuvre de la MDCT de l'état de l'art.

Selon un autre aspect de l'invention, le facteur de correction d'approximation F(N) est fonction d'un premier gain G1 et d'un deuxième gain G2, tel que

F(iV) = +_G|)⁴' ^{"1 et} G² étant fonctions du nombre d'échantillons.

Lorsque la compensation n'est appliquée au signal que pour compenser la post-rotation, le facteur de correction de l'approximation F(N) selon l'invention peut s'exprimer sous une forme simplifiée.

Selon encore un autre aspect de l'invention , la compensation par approximation est appliquée lors de la post-rotation du signal avec un facteur de compensation égal à W₈ ^~3 = ^COS \~8N ) ' ^le P^{rem ier} 9^{ai n est é}9^al à 1 et le deuxième gain G2 à ^..

Dans le cas particulier considéré, le facteur de correction F(N) s'exprime encore plus simplement. Bien sûr, les différents aspects du procédé de traitement selon l'invention qui viennent d'être présentés peuvent être mis en œuvre de façon indépendante ou combinée.

L'invention concerne aussi un procédé de codage d'un signal numérique.

Ce procédé est remarquable en ce qu'il met en œuvre un traitement dudit signal obtenu conformément au procédé de traitement qui vient d'être décrit.

Avec l'invention, il devient possible d'optimiser le SNR de la transformation temps- fréquence directe appliquée au signal numérique à encoder et de ce fait la qualité globale de l'encodage de ce signal, sans en augmenter la complexité. L'invention concerne aussi un procédé de décodage d'un signal numérique.

Ce procédé est remarquable en ce qu'il met en œuvre une étape de traitement obtenu par le procédé de traitement qui vient d'être décrit, qui permet d'appliquer de façon optimisée une transformée temps-fréquence inverse équivalente à la transformée directe.

L'invention concerne aussi un dispositif de traitement d'un signal audionumérique apte à mettre en œuvre le procédé qui vient d'être décrit.

Avantageusement ce dispositif peut être intégré dans un dispositif de codage d'un signal audionumérique selon l'invention.

L'invention concerne donc aussi un dispositif de codage d'un signal numérique. Ce dispositif est remarquable en ce qu'il est apte à mettre en œuvre le dispositif de traitement qui vient d'être décrit.

Avantageusement ce dispositif peut aussi être intégré dans un dispositif de décodage de signal audionumérique.

L'invention concerne donc aussi un dispositif de décodage d'un signal audionumérique. Ce dispositif est remarquable en ce qu'il est apte à mettre en œuvre le dispositif de traitement qui vient d'être décrit.

L'invention concerne encore un programme d'ordinateur comportant des instructions pour la mise en œuvre des étapes d'un procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence tel que décrit précédemment, lorsque ce programme est exécuté par un processeur. Un tel programme peut utiliser n'importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur. L'invention se rapporte aussi à un support de stockage, lisible par un processeur, intégré ou non au dispositif de traitement selon l'invention, éventuellement amovible, mémorisant un programme d'ordinateur mettant en œuvre un procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence tel que décrit précédemment.

L'invention concerne également un programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé de codage d'un signal numérique tel que décrit précédemment, lorsque ce programme est exécuté par un processeur. Un tel programme peut utiliser n'importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur.

L'invention se rapporte enfin à un support de stockage, lisible par un processeur, intégré ou non au codeur selon l'invention, éventuellement amovible, mémorisant un programme d'ordinateur mettant en œuvre un procédé de codage d'un signal numérique tel que décrit précédemment.

L'invention concerne également un programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé de décodage d'un signal numérique tel que décrit précédemment, lorsque ce programme est exécuté par un processeur. Un tel programme peut utiliser n'importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur.

L'invention se rapporte enfin à un support de stockage, lisible par un processeur, intégré ou non au décodeur selon l'invention, éventuellement amovible, mémorisant un programme d'ordinateur mettant en œuvre un procédé de décodage d'un signal numérique tel que décrit précédemment.

5. Liste des figures

D'autres avantages et caractéristiques de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation particulier de l'invention, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :

la figure 1 , déjà décrite, présente de façon schématique, les étapes de calcul d'une transformée temps-fréquence de type DCT-IV selon l'art antérieur ;

- la figure 2, déjà décrite, présente une courbe de mesures de SNR obtenues pour un signal transformé par application d'une DCT-IV implémentée selon l'art antérieur ; la figure 3 présente de façon schématique les étapes du procédé de traitement d'un signal numérique par application d'une transformée temps-fréquence selon un mode de réalisation de l'invention ; la figure 4 présente des courbes d'évolution de la mesure de SNR d'un signal traité en fonction de la valeur du facteur de correction F, selon un mode de réalisation de l'invention;

la figure 5 présente un exemple de performance des procédés de traitement selon l'invention, en comparaison de celle du codeur G718 SWB.

la figure 6 présente de façon schématique les étapes du procédé de codage d'un signal numérique selon un mode de réalisation de l'invention ;

la figure 7 présente de façon schématique les étapes du procédé de décodage d'un signal numérique selon un mode de réalisation de l'invention ;

la figure 8 présente un exemple de structure d'un dispositif de traitement par application d'une transformée temps-fréquence selon un mode de réalisation de l'invention ;

la figure 9 présente un exemple de structure d'un dispositif de codage d'un signal numérique selon un mode de réalisation de l'invention; et

la figure 10 présente un exemple de structure d'un dispositif de décodage de signal numérique selon un mode de réalisation de l'invention.

6. Description d'un mode de réalisation particulier de l'invention

Dans la suite de la description, on considère le cas particulier d'une transformée temps- fréquence de type DCT-IV. Toutefois, l'invention n'est pas limitée à cet exemple et s'applique potentiellement à toute autre transformée temps-fréquence, comme par exemple une transformée de type DST-IV (pour « Discrète Sinus Transform IV », en anglais).

En relation avec la figure 3, on présente les étapes d'un procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence, directe ou inverse, selon un exemple de réalisation de l'invention.

A partir d'un signal numérique s(n), disponible sous forme de blocs de N échantillons, avec N entier non nul et n compris entre 0 et N-1 , le procédé considéré met en œuvre une étape T1 de mise sous forme complexe du signal s(n) en un signal z(n), une étape T2 de prérotation du signal z(n) en un signal z'(n), une première étape T3 de compensation par approximation du signal z'(n) qui fournit un signal compensé z"(n), une étape T4 de transformation du signal z"(n) en un signal transformé Z(k) à l'aide d'une transformée de Fourier discrète, une deuxième étape T5 de compensation de la post-rotation par application d'un facteur de compensation approximé, qui produit un signal compensé Z'(k), une étape T6 de post-rotation du signal compensé en un signal Z"(k) et une étape T7 de retour à un signal numérique réel qui fournit un signal X"(k). Ces étapes sont analogues aux étapes Tr1 à Tr7, déjà décrites en relation avec la Figure 1. Elles ne seront donc pas décrites plus en détail ci- après.

On notera, qu'une des deux étapes de compensation précédemment évoquées n'est pas obligatoire et qu'elle peut être supprimée. Comme évoqué précédemment, sa suppression permet de réduire la complexité du traitement appliqué au signal numérique.

Dans la suite de la description, on considère en particulier que la première compensation (représentée en pointillés sur la figure 3) n'est pas mise en œuvre.

Le procédé selon l'invention comprend en outre une étape T0 de correction de l'approximation faite lors de la deuxième étape de compensation. Cette correction consiste à appliquer un facteur multiplicatif de correction F au signal, au cours de son traitement. L'application de ce facteur de correction F permet de corriger la dérive introduite par l'application du facteur de compensation approximé.

Dans cet exemple de réalisation de l'invention, ce facteur F est appliqué aux termes de la table de cosinus R, mise en œuvre lors des étapes de pré- et post-rotation du signal numérique. Ainsi, au lieu de stocker la table R en mémoire, on stocke une table R^*= F.R Cette étape de stockage peut être faite hors-ligne, en vue du traitement de signaux numériques selon l'invention.

La table de cosinus R^*(n) stockée en mémoire est construite à partir de N/2 échantillons donnée par l'équation suivant

Où F(N) est le facteur de correction de l'approximation.

Bien sûr, le facteur F pourrait être de façon analogue appliquée à une table de sinus stockée en mémoire, par exemple en vue de l'application d'un autre type de transformée temps- fréquence.

Selon une variante, le carré du facteur F pourrait être appliqué à une table de valeurs de fenêtres de pondération destinées à être mises en œuvre lors d'une étape de fenêtrage du signal numérique. Une telle étape sera décrite plus en détails en relation avec la Figure 6. F ne dépend que de N. Il n'est nécessaire de le recalculer que lorsque les signaux d'entrée présentent un nombre N' d'échantillons différent de celui des signaux d'entrée précédents.

Avantageusement, le facteur de correction F est calculé de façon analytique. C'est le cas dans l'exemple de réalisation décrit ci-dessous.

Toutefois, dans certains cas, il n'existe pas de formulation analytique. Il est possible alors de recourir à des méthodes connues d'optimisation, basées sur la minimisation du SNR. Elles sont en effet parfaitement adaptées à la recherche des F optimaux.

On notera que l'on peut choisir d'optimiser différemment le facteur F, selon que l'on souhaite privilégier la condition de reconstruction parfaite et/ou la ressemblance à la DCT-IV classique.

Dans l'exemple de réalisation de l'invention que l'on considère ici, la deuxième étape de compensation T5 réalise une approximation du terme :

_Wn₊O.S _{= s} ( ^2π{η _ + 0.5)^ j _j . _sm . ( ^2π{η _ + 0.5)^ j de la façon suivante : W ⁺⁰-⁵ ~G₁ - j. G₂.

Le facteur F est alors une fonction de N qui de la façon suivante :

Dans le cas particulier où W₈ ^-3 est approximé par l - ^, les gains G1 et G2 s'expriment simplement sous la forme : G, = 1 et G_? =— .

Pour différentes valeurs de N, on obtient alors les valeurs de F de la table 1 ci-dessous :

Table 1

Ce sont des valeurs optimales qui permettent de se rapprocher le plus possible de la DCT-IV et de la reconstruction parfaite pour différentes valeurs de N. On notera que la fonction de N particulière explicitée par l'équation (15) s'appliquerait tout aussi bien, dans un autre mode de réalisation, à la correction de la table de valeurs de fenêtres de pondération.

En relation avec la Figure 4, on présente une courbe d'évolution de rapport signal à bruit de la DCT-IV optimisée et du rapport signal à bruit « PR DCT(DCT) » correspondant à la condition de reconstruction parfaite selon l'invention, en fonction des valeurs du facteur correctif F. Ces courbes illustrent d'une part le fait que la valeur optimale de F n'est pas égale à 1 , et d'autre part qu'il est possible de trouver une valeur de F pour chaque transformée de taille N qui permet d'atteindre la reconstruction parfaite et en même temps, le maximum de SNR pour faire correspondre la DCT-IV optimisée à la DCT-IV.

En relation avec la figure 5, on présente les courbes SNR obtenues pour la DCT-IV optimisée selon l'invention et pour la condition de reconstruction parfaite « PR (DCT(DCT) » . On constate qu'avec le facteur de correction F selon l'invention la condition de reconstruction parfaite est atteinte quelle que soit la valeur de N. Ce résultat est à comparer avec N>=240 obtenu pour l'état de l'art. On constate aussi que la DCT-IV est mieux estimée grâce au facteur de correction que par la technique de l'état de l'art, avec un SNR compris entre 20 et 40 dB supérieur. Ainsi à N=160, ce qui correspond à une trame de 20ms à 8KHz, la DCT-IV optimisée est très proche d'une DCT-IV (SN R > 80dB).

En relation avec la Figure 6, on présente maintenant un procédé de codage d'un signal numérique selon un mode de réalisation de l'invention. Dans cet exemple, le signal est un signal audionumérique et le procédé de codage selon l'invention s'appuie sur une technique de codage spécifiée dans la norme G718-SWB.

On considère donc un signal numérique x(n) organisé en blocs de 2N échantillons, les blocs successifs se recouvrant de N échantillons.

Dans une étape C1 , chaque bloc de taille 2N est fenêtré par une fenêtre de pondération h(n) puis replié dans une étape C2 de manière à obtenir une trame x'(n) de taille N :

V 3Λί „\ , 3N „\ 3N , \ , 3N , \

X (n) =—x (—— n— 1 ) h (—— n— lj—x (— + n ) n (— + n )

(16)

x (ⁿ + = x(n)h(n) - x(N - n - l)h(N - n - 1) n 6 0 Lors d'une étape C3, cette trame x'(n) de taille N est ensuite transformée en spectre réel par application d'une transformée temps-fréquence selon le procédé de traitement qui vient d'être décrit, en relation avec la Figure 3.

L'étape C4 permet de calculer l'enveloppe spectrale, i.e. l'énergie moyenne de chacune des sous-bandes du spectre à coder. L'enveloppe spectrale est ensuite utilisée pour calculer, lors d'une étape C6, l'allocation des bits à chacune des sous-bandes. L'allocation permet lors d'une étape C7, de coder la structure fine de chacune des sous-bandes avec le budget prédéfini par l'allocation. Les sous-bandes ainsi que l'enveloppe spectrale codée sont écrites dans un flux numérique lors de l'étape C8.

Selon une première variante de l'invention, l'étape de correction de l'approximation peut être mise en œuvre au cours de l'étape C3 d'application de la transformée temps-fréquence de type DCT-IV, en particulier lors du calcul des pré- et post-rotations appliquées au signal, comme décrit en relation avec la figure 3.

Selon une deuxième variante de l'invention, la correction est mise en œuvre au cours de l'étape de fenêtrage C1 du signal qui vient d'être décrite. La nouvelle fenêtre h'(n) s'exprime alors par :

=_F2 _{N ) h (jl}) (_{1 7})

On comprend qu'avec la seconde variante, la correction n'étant appliquée qu'une fois au lieu de deux au signal numérique, il est nécessaire de remplacer le facteur F par son carré F².

En relation avec la Figure 7, on présente maintenant un procédé de décodage d'un signal audionumérique selon un mode de réalisation de l'invention.

Dans cet exemple, le signal est un signal audionumérique et le procédé de décodage selon l'invention s'appuie sur une technique de décodage spécifiée dans la norme G718-SWB.

Dans une première étape D1 , on extrait du flux numérique l'enveloppe spectrale ainsi que les sous-bandes codées. L'enveloppe spectrale est décodée lors d'une étape D2. L'allocation déterminée d'après l'enveloppe spectrale lors d'une étape D3 permet de décoder les sous-bandes lors d'une étape D4 et ainsi de reconstituer le spectre Xd(k).

L'étape D5 permet de transformer le spectre en signal temporel xd'(k) en appliquant une transformation temps-fréquence inverse de type DCT IV, équivalente à la transformation directe, comme décrit précédemment en relation avec la figure 3.

L'étape de dépliement D6 permet de passer d'une trame xd'(k) de taille N à une trame xd(k) de taille 2N de la manière suivante : xd ( - 1)

xd(N + k) = -xd (j - k - lj

xd (-^ + =—xd (k)

La trame de taille 2N est ensuite multipliée par une fenêtre de pondération hd(k) lors d'une étape D7. La fenêtre hd doit respecter la condition de reconstruction parfaite.

On obtient ainsi le signal xd décodé.

Selon une première variante, l'étape de correction de l'approximation peut être mise en œuvre au cours de l'étape D5 d'application de la transformée temps-fréquence, comme décrit précédemment en relation avec la figure 3.

Selon une deuxième variante, l'étape de correction de l'approximation est mise en oeuvre au cours de l'étape de fenêtrage D7 du signal correspondant à l'application de la MDCT. La nouvelle fenêtre hd'(k) est ainsi exprimée par : hd^'(k) = F²(N)hd(k) (19)

L'invention qui vient d'être décrite ci-dessus, peut être mise en œuvre au moyen de composants logiciels et/ou matériels. Dans la suite, les termes « module » et « entité », utilisés dans ce document, peuvent correspondre soit à un composant logiciel, soit à un composant matériel, soit encore à un ensemble de composants matériels et/ou logiciels, aptes à mettre en œuvre la ou les fonctions décrites pour le module ou l'entité concerné(e).

En relation avec la Figure 8, on considère maintenant la structure simplifiée d'un dispositif 100 de traitement d'un signal numérique par application d'une transformée temps- fréquence selon un exemple de réalisation de l'invention. Le dispositif de traitement 100 met en œuvre le procédé de traitement d'un signal numérique par application d'une transformée temps- fréquence selon l'invention, tel que décrit ci-dessus.

Par exemple, le dispositif 100 comprend une unité de traitement 1 10, équipée par exemple d'un processeur P1 , et pilotée par un programme d'ordinateur Pg_! 120, stocké dans une mémoire 130 et mettant en œuvre le procédé de traitement d'un signal numérique par application d'une transformée temps-fréquence selon l'invention.

A l'initialisation, les instructions de code du programme d'ordinateur Pg_! 120 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 1 1 0. Le processeur de l'unité de traitement 1 1 0 met en œuvre les étapes du procédé de traitement d'un signal numérique par application d'une transformée temps- fréquence décrit précédemment, selon les instructions du programme d'ordinateur 120. Le dispositif 1 00 comprend un module PRE-ROT de rotation du signal numérique, un module DFT d'application d'une transformée temps-fréquence discrète, une unité COMP2 de compensation par approximation, un module POST-ROT de rotation du signal transformé compensé et un module CORR de correction de l'approximation selon l'invention. Ces modules sont pilotés par le processeur P3 de l'unité de traitement 1 1 0. De façon avantageuse, la table de cosinus corrigée selon l'invention est stockée dans une mémoire, par exemple la mémoire 1 30 du dispositif 1 00. Selon une variante, la table de valeurs de fenêtres de pondération est stockée dans une mémoire, par exemple la mémoire 130 du dispositif 1 00.

En relation avec la Figure 9, on considère maintenant la structure simplifiée d'un dispositif 1 0 de codage d'un signal numérique selon un mode de réalisation de l'invention. 1 0 met en œuvre le procédé de codage d'un signal numérique selon l'invention, tel que décrit ci- dessus.

Le dispositif de codage 1 0 comprend une unité de traitement 1 1 , équipée par exemple d'un processeur P2, et pilotée par un programme d'ordinateur Pg₂ 1 2 stocké dans une mémoire 13 et mettant en œuvre le procédé de codage d'un signal numérique selon l'invention .

A l'initialisation, les instructions de code du programme d'ordinateur Pg₂ sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 1 1 . Le processeur P2 de l'unité de traitement 1 1 met en œuvre les étapes du procédé de codage décrit précédemment, selon les instructions du programme d'ordinateur Pg₂.

Selon l'invention, le dispositif de codage 1 0 comprend donc un module PROC-DCT-IV de traitement par application d'une transformée temps fréquence.

Selon un mode de réalisation de l'invention, le dispositif 1 00 est intégré au dispositif de codage 1 0 d'un signal numérique. Le module PROC-DCT-IV est agencé pour coopérer avec le dispositif de traitement 1 00 selon l'invention, en particulier pour lui commander l'application d'une transformée temps-fréquence optim isée selon l'invention. Ce module est piloté par le processeur P2 de l'unité de traitement 1 1 . De façon alternative, le dispositif de codage 1 0 selon l'invention stocke en mémoire 13 le programme d'ordinateur Pg1 (représenté en pointillés) mettant en œuvre le procédé de traitement d'un signal numérique par application d'une transformée temps-fréquence selon l'invention. A l'initialisation , les instructions de code du programme d'ordinateur Pg-ι sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 1 1 lors de la mise en œuvre du traitement par application d'une transformée temps-fréquence PROC-DCT-IV optimisée. Les étapes du procédé de traitement en question sont alors m ises en œuvre par le processeur P2 du dispositif de codage 1 00.

De façon avantageuse, la table de cosinus corrigée selon l'invention est alors stockée dans une mémoire, par exemple la mémoire 13 du dispositif de codage 1 0. Selon une variante, la table de valeurs de fenêtres de pondération est stockée dans une mémoire, par exemple la mémoire 13 du dispositif 1 0.

En relation avec la Figure 10, on considère enfin la structure simplifiée d'un dispositif 20 de décodage d'un signal numérique selon un mode de réalisation de l'invention. Le dispositif de décodage 20 met en œuvre le procédé de décodage d'un signal numérique selon l'invention, tel que décrit ci-dessus.

Le dispositif de décodage 20 comprend une unité de traitement 21 , équipée par exemple d'un processeur P3, et pilotée par un programme d'ordinateur Pg₃ 22 stocké dans une mémoire 23 et mettant en œuvre le procédé de décodage d'un signal numérique selon l'invention.

A l'initialisation, les instructions de code du programme d'ordinateur Pg₃ sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 21 . Le processeur P3 de l'unité de traitement 21 met en œuvre les étapes du procédé de décodage décrit précédemment, selon les instructions du programme d'ordinateur Pg₃-

Selon un mode de réalisation de l'invention, le dispositif de traitement 1 00 est intégré au dispositif de décodage 20. Le dispositif 20 comprend donc un module PROC-DCT-IV-1 de traitement par application d'une transformée temps fréquence inverse, qui est agencée pour coopérer avec le dispositif de traitement 1 00 selon l'invention, en particulier pour lui commander l'application d'une transformée temps-fréquence optim isée selon l'invention. Ce module est piloté par le processeur P3 de l'unité de traitement 21 .

De façon alternative, le dispositif de décodage 20 selon l'invention stocke en mémoire 23 le programme d'ordinateur Pg1 (représenté en pointillés) mettant en œuvre le procédé de traitement d'un signal numérique par application d'une transformée temps-fréquence selon l'invention. A l'initialisation, les instructions de code du programme d'ordinateur Pg_! sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 21 . Les étapes du procédé de traitement en question sont alors mises en œuvre par le processeur P3 du dispositif de décodage 20.

De façon avantageuse, la table de cosinus corrigée selon l'invention est alors stockée dans une mémoire, par exemple la mémoire 23 du dispositif de décodage 20. Selon une variante, la table de valeurs de fenêtres de pondération est stockée dans une mémoire, par exemple la mémoire 23 du dispositif 20.

Bien sûr d'autres modes de réalisation que les exemples décrits peuvent être envisagés. L'invention, qui vient d'être décrite s'applique donc potentiellement à de nombreuses applications de traitement de signal, y compris en dehors du domaine du codage et du décodage de signaux audionumériques. A titre d'exemple, on cite le domaine des transformées 2D utilisées en traitement d'images.

Les procédés de traitement d'un signal numérique par application d'une transformée temps- fréquence et d'une transformée temps-fréquence inverse selon l'invention présentent de nombreux avantages. Ils permettent notamment d'augmenter significativement le SN R de la transformée temps-fréquence appliquée au signal et de sa condition de reconstruction parfaite, sans incidence sur la complexité globale du traitement.

Claims

REVENDICATIONS

1. Procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence, comprenant les étapes suivantes :

- rotation (T2) du signal avant l'application d'une transformation de Fourier discrète, dite pré-rotation du signal ;

- transformation (T4) du signal par application d'une transformation de Fourier discrète ;

- rotation (T6) du signal transformé, dite post-rotation du signal;

- compensation (T5) d'au moins une desdites rotations par multiplication du signal obtenu avec un facteur de compensation approximé,

- stockage préalable de valeurs de cosinus en mémoire dans une table, lesdites valeurs stockées étant destinées à être utilisées par les étapes de rotation (T2, T6),

ledit procédé étant caractérisé en ce qu'il comprend en outre une étape (TO) de correction de l'approximation consistant à appliquer un facteur multiplicatif de correction (F) aux valeurs de ladite table, avant leur stockage en mémoire.

2. Procédé de traitement d'un signal numérique par application d'une transformation temps-fréquence, comprenant les étapes suivantes :

- stockage préalable de valeurs de fenêtres de pondération dans une table;

fenêtrage du signal numérique destinée à utiliser lesdites valeurs stockées ;

- rotation (T6) du signal transformé, dite post-rotation du signal;

ledit procédé étant caractérisé en ce qu'il comprend en outre une étape (TO) de correction de l'approximation consistant à appliquer le carré d'un facteur multiplicatif de correction d'approximation (F) aux valeurs de ladite table, avant leur stockage en mémoire.

3. Procédé de traitement d'un signal numérique selon l'une des revendications 1 ou 2, caractérisé en ce que, le signal comprenant des blocs successifs de N échantillons, le facteur de correction F(N) ne dépend que du nombre N d'échantillons.

4. Procédé de traitement d'un signal numérique selon l'une des revendications 1 à 3, caractérisé en ce que, le facteur de correction d'approximation F(N) est fonction d'un premier gain G1 et d'un deuxième gain G2, tel que

F(iV) = +_G|)⁴' ^{"1 et} G² étant fonctions du nombre d'échantillons.

5. Procédé de traitement d'un signal numérique selon la revendication 4, caractérisé en ce que, la compensation par approximation est appliquée au signal avec un facteur de compensation égal à W₈ ^~3 = le premier gain G1 est égal à 1 et le

deuxième gain G2 à—.

a AN

6. Procédé de codage d'un signal numérique, caractérisé en ce qu'il met en œuvre un traitement dudit signal obtenu conformément au procédé de traitement des revendications 1 à 5.

Procédé de décodage d'un signal numérique, caractérisé en ce qu'il met en œuvre un traitement dudit signal, conformément au procédé de la revendication 1 à 6.

Dispositif (100) de traitement d'un signal numérique par application d'une transformation temps-fréquence, ledit dispositif comprenant les modules suivants :

- rotation du signal transformé, dite post-rotation du signal;

- compensation d'au moins une desdites rotations par multiplication du signal obtenu avec un facteur de compensation approximé,

- stockage de valeurs de cosinus en mémoire dans une table, lesdites valeurs stockées étant destinées à être utilisées par le module de rotation, ledit dispositif étant caractérisé en ce qu'il comprend en outre un module de correction d'approximation, apte à appliquer un facteur multiplicatif de correction F aux valeurs de ladite table, avant leur stockage en mémoire.

9. Dispositif de traitement d'un signal numérique par application d'une transformation temps-fréquence, ledit dispositif comprenant les modules suivants :

- stockage préalable de valeurs de fenêtres de pondération dans une table;

- fenêtrage du signal numérique destinée à utiliser lesdites valeurs stockées ;

- rotation du signal transformé, dite post-rotation du signal;

ledit dispositif étant caractérisé en ce qu'il comprend en outre un module de correction de l'approximation apte à appliquer le carré d'un facteur multiplicatif de correction d'approximation (F) aux valeurs de ladite table, avant leur stockage en mémoire.

10. Dispositif de codage (10) d'un signal numérique, caractérisé en ce qu'il est apte à mettre en œuvre un dispositif (100) de traitement par transformée temps-fréquence conformément à la revendication 9.

11. Dispositif de décodage (20) d'un signal numérique, caractérisé en ce qu'il est apte à mettre en œuvre un dispositif de traitement par transformée conformément à la revendication 9.

12. Programme d'ordinateur (Pg1 ) comprenant des instructions pour la mise en œuvre du procédé de traitement d'un signal numérique par application d'une transformée selon les revendications 1 à 5 lorsqu'il est exécuté par un processeur.

13. Programme d'ordinateur (Pg2) comprenant des instructions pour la mise en œuvre du procédé de codage d'un signal numérique selon la revendication 6, lorsqu'il est exécuté par un processeur.

14. Programme d'ordinateur (Pg3) comprenant des instructions pour la mise en œuvre du procédé de décodage d'un signal numérique selon la revendication 7, lorsqu'il est exécuté par un processeur.