EP2162883A2

EP2162883A2 - Limitation de distorsion introduite par un post-traitement au decodage d'un signal numerique

Info

Publication number: EP2162883A2
Application number: EP08806164A
Authority: EP
Inventors: Balazs Kovesi; Stéphane RAGOT
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2007-07-06
Filing date: 2008-07-04
Publication date: 2010-03-17
Anticipated expiration: 2028-07-04
Also published as: CN101816041A; KR20100042251A; US8571856B2; CN101816041B; EP2162883B1; US20100241427A1; KR101470940B1; WO2009010672A2; JP5179578B2; JP2010532875A; WO2009010672A3

Abstract

L'invention propose le traitement d'un signal numérique, issu d'un décodeur et d'un post-traitement de réduction de bruit, avec, en particulier, une limitation d'une distorsion introduite par le post-traitement pour délivrer un signal de sortie corrigé (SOUT), en affectant à ce signal de sortie corrigé (SOUT) : une amplitude courante ayant une valeur intermédiaire entre une valeur d'amplitude courante du signal post-traité (SPOST) et une valeur d'amplitude courante correspondante du signal décodé (S'MIC), ou l'amplitude courante du signal post-traité (SPOST), selon les valeurs prises respectivement par l'amplitude courante du signal post- traité (SPOST) et par l'amplitude courante correspondante du signal décodé (S'MIC).

Description

Limitation de distorsion introduite par un post-traitement au décodage d'un signal numérique

La présente invention concerne un traitement de signal, en particulier de signaux numériques dans le domaine des télécommunications, ces signaux pouvant être par exemple des signaux de parole, de musique, des signaux vidéo, ou autres.

Généralement, le débit nécessaire pour faire transiter un signal audio et/ou vidéo avec une qualité suffisante est un paramètre important en télécommunications. Afin de réduire ce paramètre et d'augmenter alors le nombre de communications possibles via un même réseau, des codeurs audio ont été développés notamment pour compresser la quantité d'informations nécessaire pour transmettre un signal.

Certains codeurs permettent d'atteindre des taux de compression de l'information particulièrement élevés. De tels codeurs utilisent en général des techniques avancées de modélisation et de quantification de l'information. Ainsi, ces codeurs ne transmettent que des modèles ou des données partielles du signal.

Le signal décodé, bien qu'il ne soit pas identique au signal d'origine (puisqu'une partie de l'information n'a pas été transmise du fait de l'opération de quantification), reste néanmoins très proche du signal d'origine (au moins du point de vue de la perception). La différence, au sens mathématique, entre le signal décodé et le signal d'origine est alors appelée « bruit de quantification ».

Les traitements en compression de signaux sont souvent conçus de manière à minimiser le bruit de quantification et, en particulier, à rendre ce bruit de quantification le moins audible possible lorsqu'il s'agit de traiter un signal audio. Il existe alors des techniques prenant en compte les caractéristiques psycho-acoustiques de l'audition, dans le but de « masquer » ce bruit. Toutefois, pour obtenir des débits les plus faibles possibles, le bruit de quantification peut être parfois difficile (voire impossible) à masquer totalement, ce qui, dans certaines circonstances, dégrade l'intelligibilité et/ou la qualité du signal.

Afin de réduire ce bruit de quantification et donc améliorer la qualité, deux familles de techniques peuvent être utilisées au décodage.

Il est possible, tout d'abord, d'utiliser un post-filtre adaptatif, du type décrit dans l'article de Chen et Gersho :

"Adaptive postfilte ring for quality enhancement of coded speech" , IEEE Transactions on Speech and Audio Processing, vol. 3, no. 1, Jan. 1995, pages 59 - 71, et employé notamment dans les décodeurs de parole de type CELP (pour « Code Excited Linear Prédiction »).

Il s'agit d'effectuer un filtrage qui améliore la qualité subjective en atténuant le signal dans les zones où le bruit de quantification est le plus audible (notamment entre les formants et les harmoniques de période fondamentale ou "pitch"). Les post-filtres adaptatifs actuels procurent de bons résultats pour des signaux de parole, mais de moins bons résultats pour d'autres types de signaux (signaux de musique, par exemple).

Une autre famille de traitement vise les traitements classiques de réduction de bruit qui distinguent le signal utile des bruits parasites et qui peuvent être appliqués comme post-traitement pour réduire le bruit de quantification après décodage. Ce type de traitement permet à l'origine de réduire le bruit lié à l'environnement de la capture du signal et il est souvent utilisé pour des signaux de parole. Toutefois, il est impossible de rendre transparent le traitement vis-à-vis du bruit lié à l'environnement de la prise de son, ce qui pose problème pour du codage de signal de musique, notamment. Ainsi, en codage/décodage, on peut vouloir transmettre le bruit d'ambiance et il est alors souhaitable que la réduction de bruit ne s'applique pas à ce type de bruit d'ambiance mais uniquement au bruit de quantification, en particulier dans le contexte du posttraitement au décodage visant à réduire le bruit de quantification. Néanmoins, ces différents types de procédés de réduction de bruit de quantification déforment plus ou moins le signal. Par exemple, l'utilisation d'un post-filtre (débruitage) qui serait trop agressive pour le signal de parole permettrait d'éliminer complètement le bruit de quantification mais le son de voix obtenu semblerait moins naturel et/ou étouffé. L'optimisation de ces différents types de procédés est donc difficile et il convient systématiquement de trouver un compromis entre : - l'efficacité de suppression du bruit de quantification, et la conservation des propriétés du signal initial, notamment en termes d'aspect naturel ou non.

La présente invention vient améliorer la situation.

Elle propose à cet effet un procédé de traitement d'un signal numérique, issu d'un décodeur et d'un post-traitement de réduction de bruit. Le procédé au sens de l'invention propose une limitation d'une distorsion introduite par le post-traitement pour délivrer un signal de sortie corrigé, en affectant au signal de sortie corrigé : une amplitude courante ayant une valeur intermédiaire entre une valeur d'amplitude courante du signal post-traité et une valeur d'amplitude courante correspondante du signal décodé, ou l'amplitude courante du signal post- traité, selon les valeurs respectivement prises par l'amplitude courante du signal post-traité et par l'amplitude courante correspondante du signal décodé.

Avantageusement, une ligne à retard est prévue pour assurer une correspondance temporelle entre l'amplitude courante du signal post-traité et l'amplitude courante correspondante du signal décodé.

Dans une réalisation particulière, le procédé comporte les étapes : définition d'un intervalle d'amplitudes admises, l'intervalle comportant une borne inférieure et une borne supérieure qui sont fonctions d'une valeur d'amplitude courante du signal décodé (mais non post-traité), et pour une amplitude courante correspondante du signal post-traité, affectation d'une valeur d'amplitude courante au signal de sortie, égale à la valeur de :

• la borne inférieure si l'amplitude courante du signal post- traité est inférieure à la valeur de la borne inférieure,

• la borne supérieure si l'amplitude courante du signal post-traité est supérieure à la valeur de la borne supérieure, • l'amplitude courante du signal post- traité si la valeur de l'amplitude courante du signal post-traité est incluse dans ledit intervalle.

Ainsi, la présente invention propose de ne pas s'écarter du signal décodé, au-delà d'une certaine tolérance, lors du post-traitement du signal décodé.

On peut alors, dans une réalisation, affecter une plage de valeurs d'amplitude à chaque valeur possible d'amplitude du signal décodé pour définir quantitativement cette tolérance, de sorte que les bornes inférieure et supérieure précitées sont choisies pour que la différence entre la borne supérieure et la borne inférieure soit égale à cette plage de valeurs.

Cette réalisation peut avantageusement être mise en œuvre dans le cas où le signal reçu a été codé par un codage à quantification scalaire, le décodeur délivrant des valeurs d'amplitude quantifiées qui varient entre elles de façon discrète, les écarts successifs entre les valeurs quantifiées définissant des pas successifs de quantification. Ainsi : la borne supérieure peut être donnée par l'addition de sensiblement la moitié du pas de quantification à la valeur quantifiée affectée à l'amplitude courante du signal décodé, et la borne inférieure peut être donnée par la soustraction de sensiblement la moitié du pas de quantification à la valeur quantifiée affectée à l'amplitude courante du signal décodé.

Un exemple de codage à quantification scalaire est le codage dit « à modulation par impulsion et codage », délivrant un indice codé. Dans ce cas, il est possible de déterminer des valeurs courantes respectives des bornes inférieure et supérieure simplement sur la base de l'indice codé courant, reçu au décodeur. On peut prévoir d'ailleurs une table de correspondance donnant, pour un indice reçu courant, une valeur quantifiée correspondante et une moitié de pas de quantification correspondant, à partir desquelles peuvent être alors sont déterminées les valeurs courantes respectives des bornes inférieure et supérieure.

D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels : la figure 1 illustre très schématiquement la structure générale d'un codée à quantification scalaire, dont le décodeur est suivi d'un post-traitement et d'un module, au sens de l'invention, de limitation de distorsion introduite par le posttraitement, - la figure 2 illustre schématiquement la structure du module de limitation de distorsion de la figure 1 et son interaction avec le module de post-traitement, la figure 3 illustre schématiquement des étapes de limitation de distorsion au sens de l'invention, la figure 4 illustre très schématiquement la structure matérielle d'un module de limitation de distorsion au sens de l'invention.

La présente invention intervient avantageusement dans le contexte d'un codage/décodage du type à quantification scalaire. Par exemple, dans le cas du codage de type MIC (pour "Modulation par Impulsion et Codage" - dit aussi PCM en anglais, pour « Puise Code Modulation »), chaque échantillon d'entrée est codé individuellement, sans prédiction. On rappelle le principe d'un tel codée en référence à la figure 1.

Ce type de codage, au sens de la norme ITU-T G.711, réalise une compression des signaux échantillonnés à 8 kHz, typiquement définis dans une bande de fréquences minimale de 300 à 3400 Hz, par une courbe logarithmique qui permet d'obtenir un rapport signal à bruit à peu près constant pour une large dynamique de signaux.

Plus précisément, le pas de quantification est approximativement proportionnel à l'amplitude des signaux. Le signal initial S est d'abord codé (module 10) dans un codeur 13 et la séquence d'indices résultante I_MIC est représentée sur 8 bits par échantillon (voir la référence 15 de la figure 1), ce qui correspond donc à 256 niveaux

(2⁸=256) de quantification. Dans le réseau téléphonique commuté 11, ces 8 bits sont transmis à une fréquence de 8 kHz pour donner un débit de 8x8=64 kbit/s. Au décodeur 14, sur réception du signal l'_Mιc que délivre le réseau 11, le signal finalement décodé S '_M[c est obtenu à la sortie du quantificateur inverse 12. En pratique, si la quantification inverse est contrôlée par une table, elle consiste simplement en un pointage d'un index dans une table comportant 256 valeurs quantifiées et reprises dans le tableau 1 ci-après. Ce tableau 1 est établi pour la norme ITU-T G.711 telle qu'elle est mise en œuvre en Europe (pratique dite « loi A »).

Par exemple, un échantillon d'origine du signal S à coder a une amplitude égale à -75. Par conséquent, cette amplitude est comprise dans l'intervalle [-80, -65] de la ligne 123 (ou « niveau » 123) du tableau. Le codage de cette information consiste à délivrer un indice final codé, référencé I' _Mw sur la figure 1 et sur le tableau 1, qui est égal à 0x51. Au décodage, l'opération de quantification inverse consiste donc à récupérer l'indice I'_MW = 0x51 et à lui faire correspondre une valeur quantifiée VQ, telle que VQ = -72. Par conséquent, le décodage affecte à l'amplitude de l'échantillon correspondant, du signal décodé S'_Mw, cette valeur -72. On relèvera que l'on affecterait cette même valeur VQ = -72 à tous les échantillons à décoder et dont l'amplitude initiale avait une valeur dans l'intervalle [-80, -65], soit en tout 16 valeurs possibles dans l'intervalle, ce qui correspond au pas de quantification ici de 16. En revanche, on relèvera que l'on affecterait la même valeur VQ = 32256 à tous les échantillons dont l'amplitude initiale était dans l'intervalle [31744, 32767], soit en tout 1024 valeurs possibles, ce qui correspond à un pas de quantification de 1024.

Tableau 1 Pour faciliter sa mise en œuvre, la compression MIC est réalisée par une compression d'amplitude linéaire par segments. Dans la norme ITU-T G.711, les 8 bits caractérisant 256 valeurs quantifiées sont ainsi répartis de la façon suivante :

1 bit de signe (0 pour une valeur négative ; et 1 sinon), portant la référence sgn sur la figure 1 ,

3 bits pour indiquer un identifiant de segment de 0 à 7 (tableaux 2 et 3), portant la référence ID-SEG sur la figure 1, et

4 bits pour préciser l'emplacement d'un niveau sur un segment courant, portant la référence ID-POS sur la figure 1.

Dans la norme G.711 selon la loi A en particulier, le pas de quantification est multiplié par deux (16, 32, 64, ...) au passage d'un segment au suivant, et ce, à partir du deuxième segment. Cette loi de codage permet donc d'avoir une précision de quantification de 12 bits (avec un pas de quantification de 16) sur les deux premiers segments d'indices 0 et 1 (tableau 2). Puis, la précision diminue de 1 bit à chaque incrémentation de l'indice de segment (le pas de quantification étant multiplié par deux à chaque incrémentation), comme le montre le tableau 2 ci-après.

Tableau 2 Le tableau 2 s'interprète comme suit. A titre d'exemple, si l'amplitude d'un échantillon d'origine vaut -30000 : l'indice du segment associé « 7 » est codé sur 3 bits, le signe « - » est codé sur 1 bit (à 0), et les 4 bits restants (13, 12, 11 et 10) définissent le niveau d'amplitude dans le segment d'indice 7. De même, si l'amplitude d'un échantillon d'origine vaut +4000 :

- l'indice du segment associé « 4 » est codé sur 3 bits,

- le signe « + » est codé sur 1 bit (à 1), et les 4 bits restants (3, 2, 1 et 0) définissent le niveau d'amplitude dans le segment d'indice 4.

Le tableau 3 ci-après est l'équivalent du tableau 2, mais pour la norme G.711 telle qu'elle est pratiquée notamment aux Etats-Unis d'Amérique ou au Japon (dite « loi μ »), avec en particulier les pas de quantification et les écarts maximums possibles E_MAX entre la valeur quantifiée VQ et la valeur réelle de l'amplitude de l'échantillon d'origine.

Tableau 3 En reprenant alors la ligne 123 du tableau 1, toutes les 16 valeurs de l'intervalle [-80, -65] sont représentées par le mot de code de 0x51 qui, une fois décodé, donne la valeur quantifiée -72. Toutefois, il convient de relever qu'inversement, en obtenant une valeur décodée -72, il est sûr que la valeur d'origine qui a été codée était dans l'intervalle [-80, -65]. On sait donc que l'amplitude maximale de l'erreur de codage pour cet échantillon est E_MAX = 8, ce qui correspond à la moitié du pas de quantification.

Pour ce qui suit, on retiendra que l'indice final l'_Mιc reçu au décodeur permet de déterminer, d'une part, la valeur quantifiée VQ et, d'autre part, l'indice de segment ID-SEG à partir duquel peut être déduit le pas de quantification et, de là, l'amplitude maximale de l'erreur de codage E_MAX- On notera aussi que l'indice du segment ID- SIG peut être trouvé également en fonction de la position du bit de poids le plus fort de l'amplitude du signal dans le cas d'un codage G.711 selon la loi A (tableau 2). En règle générale, on retiendra aussi qu'une spécificité du codage MIC est que l'échantillon d'origine et l'échantillon décodé ont toujours leur amplitude dans un même intervalle de quantification : pour l'échantillon d'origine, à une position quelconque dans l'intervalle, et pour l'échantillon décodé, systématiquement au milieu de l'intervalle.

En référence à nouveau à la figure 1, le signal décodé S'_MIC subit ensuite un filtrage de post-traitement 16 (par exemple un débruitage ou l'application d'un post- filtre perceptuel). Le signal résultant S_POST est alors traité par un module 20 au sens de l'invention.

En effet, comme indiqué précédemment, le post-traitement 16 (même s'il est en général à phase linéaire pour préserver la forme d'onde) peut être trop agressif et altérer notamment l'aspect naturel d'un signal de parole. Au décodeur, on dispose néanmoins d'une information sur le signal d'origine qui peut être exploitée, au sens de la présente invention, pour limiter l'écart entre le signal décodé et post- filtré S_POST, d'une part, et le signal d'origine S, d'autre part. C'est ainsi que le module 20 (figure 1) permet, au sens de l'invention, de limiter la distorsion engendrée par le post- traitement mis en œuvre au décodage.

Un exemple de réalisation possible, décrit en détail plus loin, est d'imposer que la distorsion introduite par le post-traitement 16 par rapport au signal décodé S '_MIC ne puisse pas être supérieure à l'amplitude maximale de l'erreur du codage E_MA_X- On assure alors que le signal post-fïltré reste dans le même intervalle de quantification que le signal d'origine. La distorsion globale due au traitement codage/décodage et posttraitement est limitée, et en particulier très proche de la distorsion maximale du codage E_MA_X- Cette mesure assure aussi que la répartition d'énergie entre échantillons successifs et la forme d'onde globale soient bien conservées.

Un exemple de mise en œuvre de l'invention est illustré sur la figure 2. Sur réception d'un indice final codé I' _Mw, le module 21 calcule l'échantillon décodé S '_MW V^ar quantification inverse de l'indice I'_MW reçu. Le module 22 effectue le post-traitement susmentionné. On retiendra aussi que cette opération introduit, en général, un retard. En parallèle, on prévoit un traitement au sens de l'invention qui commence avantageusement par une ligne à retard (module 23) à laquelle on applique aussi l'indice reçu I'_MW- En particulier, le retard est réglé de sorte que l'indice retardé I' _MW__DEL soit aligné dans le temps avec l'échantillon courant que délivre la sortie S_POS_T du post- traitement 22.

Un exemple de réalisation de la ligne de retard 23 peut être le suivant. En supposant que le post-traitement 22 introduise un retard de 16 échantillons, le module 23 comporte alors, de façon avantageuse, une mémoire MEM de 16 échantillons, à registre de décalage. Par exemple, l'indice 0 de cette mémoire correspond à l'échantillon le plus ancien, alors que l'indice 15 correspond au dernier échantillon mémorisé. Ainsi, lorsqu'un nouvel indice arrive à l'entrée du module 23, les opérations suivantes sont réalisées : - la sortie du module 23 contentant le plus ancien échantillon mémorisé est maintenant telle que : I'_MW__DEL ⁼ MEM(O), on applique un décalage de mémoire : MEM(i) = MEM(i +1), pour i = 0, ... 14, on mémorise le nouvel échantillon arrivé : MEM(15) = I'_MW

A partir de l'indice retardé I'MW_DEL, le module 25 détermine la valeur quantifiée QV et l'erreur maximale de codage E_MAX correspondants, par exemple à partir d'une table 24 qui peut comporter des données du tableau 1 ci-avant. On a retracé sur le tableau 4 ci- après les données du tableau 1 qui peuvent être utilisées pour la détermination des paramètres QV et E_MAX opérée par le module 25.

Tableau 4

Ici, les informations que donne le tableau 4 évoluent en fonction de la valeur quantifiée QV pour montrer que ce tableau 4 est tiré du tableau 1 donné ci-avant. Toutefois, en pratique et comme expliqué plus loin, il est préférable d'utiliser une table 24 qui, en entrée, répertorie les indices reçus et retardés I'MW_DEL et, en sortie, donne les paramètres QV et E_MAX correspondants. Le tableau 5 ci-après contient les mêmes données que le tableau 4, mais il est rangé selon les valeurs d'indice I'MW_DEL- Le tableau 5 présente alors les paramètres respectifs QV et E_MAX en fonction d'un indice I'_MW__DEL donné et peut donc constituer, pour la norme G.711-loi A, le contenu de la table 24 de la figure 2.

Tableau 5

Bien entendu, on pourrait, en variante, présenter à l'entrée de la ligne de retard 23 le signal S' _Mw décodé (avant post-traitement) et, à partir de la valeur quantifiée VQ affectée à chaque échantillon, en déduire le paramètre E_MAX correspondant. On utiliserait alors une table 24 mise en forme selon le tableau 4 donné ci-avant.

Toutefois, cette réalisation est moins avantageuse en particulier dans le codage selon la loi μ, dont on donne ci-après, en tableau 6, l'équivalent du tableau 1 donné pour la loi A. On relèvera en effet sur le tableau 6 qu'une même valeur quantifiée QV = 0 est affectée pour des indices reçus différents : I'_Mιc = 0x7f et I'_Mιc = Oxff. Ainsi, dans le cas d'un codage selon la loi μ, lorsque le module 25 opère sur la base de l'indice reçu (et non sur la base de la valeur quantifiée), les bornes des intervalles dans lesquels pouvait se situer l'amplitude d'un échantillon d'origine peuvent être plus finement déterminées.

Tableau 6 On a représenté alors sur le tableau 7 ci-après les données que peuvent comporter une table 24 dans un traitement du type représenté sur la figure 2, en contexte de codage selon la loi μ.

Tableau 7

La table 24 (pouvant donc inclure les données des tableaux 5 ou 7) peut être stockée en dur dans une mémoire d'un module 20 (figure 1) au sens de l'invention. Toutefois, dans une variante de réalisation, moins coûteuse en mémoire, on calcule, directement à partir de l'indice reçu, les paramètres E_MAX et QV, sans avoir recours à une table 24, comme suit.

En effet, l'identifiant du segment ID-SEG est codé sur trois bits dans l'indice reçu et retardé I'_MW__DEL (bits 1, 2, 3 de la figure 1). Ainsi, le module 25 peut calculer l'erreur maximale de codage E_MAX liée à ce segment d'identifiant ID-SEG, à partir d'une fonction de simple correspondance entre l'identifiant ID-SEG et le paramètre E_MAX, cette fonction pouvant être construite à partir : de la fonction existante liant l'identifiant ID-SEG au pas de quantification et de la fonction existante liant le pas de quantification à l'erreur maximale de codage E_MAX, conformément aux tableaux 2 et 3 donnés précédemment.

Ensuite, le module 26 vérifie si l'écart entre l'échantillon post-traité S_POST et l'échantillon juste décodé sans post-traitement S'_MW n'excède pas la valeur du paramètre E_MAX trouvée, auquel cas le post-traitement a induit des distorsions qu'il convient de limiter. Dans un exemple de réalisation, on ramène alors la valeur de l'échantillon S_POST à une valeur plus proche de la valeur quantifiée QV, de sorte que l'écart entre les valeurs S_POST et QV reste inférieure à un seuil autorisé.

Pour ce faire, le module 26 opère, comme suit, sur la base : - d'un échantillon courant post- traité S_POST, de la valeur quantifiée QV de l'échantillon correspondant juste décodé sans posttraitement, et de l'erreur maximale de codage E_MAX trouvée avec cette valeur quantifiée QV.

La figure 3 détaille les opérations du module 26 de la figure 2 sous la forme d'un organigramme. Les entrées de ce module sont donc les échantillons post-traité S_POST, les valeurs quantifiées QV correspondantes et les erreurs maximales de codage E_MAX correspondantes (étape 31). Aux étapes 32 et 33, on détermine les limites, respectivement inférieure LimiNF et supérieure Limsup de l'intervalle de quantification autour de la valeur quantifiée courante QV. A l'étape 34, on vérifie si l'échantillon post-traité S_POST a une amplitude inférieure à limite inférieure Limi_NF. Ainsi, la variable temporaire Tmp est fixée : soit à la valeur d'amplitude de l'échantillon S_POST, - soit à celle de la limite inférieure autorisée LimiNF (si l'amplitude SPOST est inférieure à la limite Limi_NF). La même vérification est effectuée à l'étape 35, mais pour la limite supérieure Linisup- Finalement la sortie S_OUT donne : soit la valeur inchangée de l'amplitude de l'échantillon S_POST (si elle était déjà dans l'intervalle délimité par les limites LimiNF et Limsup), - soit la limite inférieure LimiNF (si l'amplitude de l'échantillon S_POST était inférieure à cette dernière Limi_Np), - ou encore la limite supérieure Limsup (si l'amplitude de l'échantillon SPOST était supérieure à cette dernière Limsup).

Ainsi le signal de sortie S_OUT reste toujours dans le même intervalle de quantification que le signal d'origine S.

Dans cet exemple de réalisation, le signal de sortie est strictement ramené dans l'intervalle de quantification du signal d'origine, délimité par : [S ' Mw ^~ ^MAX , S ' Mw ^ ^MAX ^~ ^]-

Bien entendu, on pourrait définir autrement l'intervalle dans lequel il est souhaité de conserver l'amplitude du signal de sortie par rapport à la valeur quantifiée trouvée. On peut prévoir par exemple : • un intervalle du type [S'_Mι_C - E_MA_X , S'_Mιc + E_MA_X], légèrement agrandi pour le rendre symétrique, ou encore

• un intervalle du type [S 'MIC - ex EMAX , S 'MIC + ex EMAX], OÙ la valeur du terme α peut être supérieure à 1 pour agrandir encore l'intervalle et tolérer plus d'écart par rapport à la valeur quantifiée QV, ou encore • un intervalle du type [S '_MIC - fi, S '_MIC + f₂] déterminé par des fonctions fi et f₂ par exemple du paramètre E_MA_X et/ou du paramètre QV, ou autre, ou encore

• un intervalle du type [S' - E_MA_X, S' + E_MA_X], OÙ S' peut être la sortie d'un décodeur quelconque, de sorte que la distorsion du post-traitement serait limitée comme s'il s'agissait d'un signal décodé par un décodeur MIC (l'identifiant de segment serait déterminé dans ce cas, en l'absence de l'indice reçu I'_MIC comme dans le codage MIC de la norme G.711, simplement à partir de la position du bit de poids le plus fort de l'amplitude du signal (tableau 2)), ou encore

• un intervalle du type [S' - β.|S'|, S' + β.|S'|], où S' est la sortie d'un décodeur quelconque et les bornes de l'intervalle sont proportionnelles à l'amplitude du signal (par exemple avec β inférieur à 1).

Dans les deux derniers exemples, la distorsion du post-traitement est limitée par rapport au signal décodé, et non pas forcément par rapport au signal d'origine, selon le type de codage/décodage employé.

Dans l'exemple de réalisation illustré sur la figure 3, il peut être prévu une étape préalable 38, optionnelle (illustrée en traits pointillés à cet effet), pour éviter que la limitation de distorsion due au post-traitement soit appliquée de façon systématique. Dans certain cas, il est en effet avantageux d'inhiber le traitement de la figure 2.

Le rapport signal à bruit (noté RSB ci-après), obtenu par le codage/décodage MIC, est sensiblement constant (d'un niveau d'environ 38 dB) pour une large dynamique de signaux. Par contre, pour les faibles niveaux de signal (dans le premier segment d'identifiant 0 typiquement) le rapport RSB est faible et peut même être négatif en début de segment de la loi de compression d'amplitude. La sortie du décodeur MIC est alors très « bruyante » pour les signaux de faible amplitude (par exemple dans les cas de silence entre deux phrases d'un signal de parole). Par ailleurs, il est difficile de supprimer le bruit de codage/décodage MIC simplement avec un post-filtre, compte tenu du très faible rapport RSB. Une solution consiste souvent à modifier le post- traitement de signaux de très faible amplitude en diminuant fortement l'amplitude du signal décodé. L'amplitude du signal résultant de ce type de post-traitement n'est absolument pas fidèle, alors, à l'amplitude du signal d'origine. Dans ces conditions, il est préférable d'inhiber la limitation de distorsion due au post-traitement et les étapes 32 à 35 du traitement au sens de l'invention (figure 3) sont alors évitées. Ainsi, en référence à la figure 3, pour des échantillons post- filtrés S_POST dont l'amplitude est inférieure ou égale à un seuil donné (sortie n du test 38 de comparaison avec le seuil S_e), les étapes 32 à 35 ne sont pas mises en œuvre et l'amplitude des échantillons de sortie S_OUT prend directement la valeur de l'amplitude des échantillons post-filtrés S_POST (étape 37). Dans un exemple de mise en œuvre de cette réalisation, la valeur du seuil S_e est égale à 24 (dans l'échelle, bien entendu, des tableaux donnés ci- avant). En revanche, si l'amplitude des échantillons post-filtrés reste supérieure au seuil S_e (sortie o du test 38), on applique le traitement visant une limitation de la distorsion (étapes 32 à 35 décrites précédemment). Ainsi, le procédé au sens de l'invention n'est finalement mis en œuvre que pour des signaux décodés et post-traités S_POST dont l'amplitude est supérieure à la valeur seuil prédéterminée S_e.

Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci- avant à titre d'exemple ; elle s'étend à d'autres variantes. Par exemple, le module 20 de limitation de distorsion est représenté sur la figure 1 en aval du module 16 de post-traitement. En variante, il peut être intégré directement dans le module de post- traitement 16. D'ailleurs, cette variante peut être avantageuse notamment dans le cadre d'une utilisation de filtres récursif à réponse impulsionnelle infinie (ou HR pour « Infinité Impulse Response » en anglais). En effet, dans le cas d'une utilisation d'un filtre HR, l'échantillon de sortie du filtre dépend des sorties précédentes de ce filtre. Ainsi, en intégrant un module au sens de l'invention dans un post-traitement utilisant un filtrage de type HR, la sortie du filtrage HR peut tenir compte directement des valeurs qui ont immédiatement été modifiées par le module au sens de l'invention.

Par ailleurs, on a décrit ci-avant un exemple de réalisation dans lequel étaient définis des intervalles autour de la valeur décodée S' (qui peut être la valeur quantifiée QV dans le cas d'un codage/décodage à quantification scalaire du type décrit ci-avant). Toutefois, cette réalisation était décrite à titre d'exemple non limitatif. Il peut être prévu, en variante, d'affecter à l'amplitude du signal de sortie S_OUT la moyenne (ou plus généralement une moyenne pondérée) entre la valeur décodée S' et la valeur d'amplitude post- traitée S_POST, tout en s 'autorisant l'affectation directe de la valeur d'amplitude post-traitée SPOST si, par exemple, cette dernière SPOST est encore dans un intervalle choisi. Ainsi, en définissant des limites inférieure LimiNF et supérieure Limsup d'intervalles, ou en définissant des moyennes (éventuellement pondérées) entre la valeur décodée S' et l'amplitude post-traitée S_POST, on définit toujours une valeur intermédiaire possible que peut prendre le signal de sortie S_OUT, corrigé au sens de l'invention.

Plus généralement, la présente invention s'applique à tout type de codage/décodage, au-delà d'un codage selon la norme G.711, et par exemple le mode de réalisation décrit en détail ci-avant peut s'appliquer notamment au cas d'un codage/décodage à quantification scalaire avec un nombre quelconque de niveaux, suivi, au décodage, d'un post-traitement à phase linéaire.

La présente invention vise aussi un module de traitement 20 d'un signal numérique, ce signal étant décodé par un décodeur amont 14 (figure 1) et subissant un posttraitement de réduction de bruit 16. Ce module de traitement 20 au sens de l'invention comporte alors des moyens 23, 24, 25, 26 (figure 2) pour la mise en œuvre du procédé de limitation d'une distorsion introduite par le post-traitement. Matériellement, ce module 20 au sens de l'invention comporte typiquement, en référence à la figure 4, un processeur μP coopérant avec un bloc mémoire BM incluant une mémoire de stockage et/ou de travail, ainsi que la mémoire MEM précitée en tant que moyen pour réaliser, dans un exemple de réalisation, la ligne à retard 23 et fournir l'indice retardé I'_MW__DEL- Le bloc mémoire BM peut comporter en outre un moyen de stockage (préférentiellement en mémoire morte) de la table de correspondance 24 de la figure 2, ou encore un programme informatique pour calculer directement la valeur décodée et l'intervalle correspondant à partir de l'indice retardé I'_MW__DEL, selon le mode de réalisation retenu. Comme indiqué ci-avant, le module 20 peut être indépendant ou intégré dans un module de post-traitement de réduction de bruit. Une mémoire de stockage d'un tel module 20 peut avantageusement comporter aussi un programme informatique comprenant des instructions pour la mise en œuvre du procédé au sens de l'invention, lorsque ces instructions sont exécutées par un processeur μP du module 20. Typiquement, la figure 3 peut illustrer un organigramme représentant l'algorithme d'un tel programme informatique.

Claims

REVENDICATIONS

1. Procédé de traitement d'un signal numérique, issu d'un décodeur (14) et d'un posttraitement (16) de réduction de bruit, dans lequel : un signal reçu (I' _Mw) est décodé pour délivrer un signal décodé (S '_MW), - le signal décodé (S '_MIC) est post-traité pour délivrer un signal post-traité (S_POS_T), caractérisé en ce qu'il comporte une limitation (26) d'une distorsion introduite par le post-traitement pour délivrer un signal de sortie corrigé (S_OU_T), en affectant audit signal de sortie corrigé (S_OU_T) : une amplitude courante ayant une valeur intermédiaire entre une valeur d'amplitude courante du signal post-traité (S_POST) et une valeur d'amplitude courante correspondante du signal décodé (S '_MIC), ou l'amplitude courante du signal post-traité (S_POST), selon les valeurs respectives d'amplitude courante du signal décodé (S '_MIC) et du signal post-traité (SPOST).

2. Procédé selon la revendication 1, caractérisé en ce qu'il comporte les étapes : définition (32,33) d'un intervalle d'amplitudes admises, l'intervalle comportant une borne inférieure (LimiNF) et une borne supérieure (Limsup) qui sont fonctions d'une valeur d'amplitude courante (S '_MIC) du signal décodé, et pour une amplitude courante correspondante du signal post-traité (S_POST), affectation (34,35) d'une valeur d'amplitude courante au signal de sortie (S_OU_T), égale à la valeur de : • la borne inférieure si l'amplitude courante du signal post- traité est inférieure à la valeur de la borne inférieure,

• la borne supérieure si l'amplitude courante du signal post-traité est supérieure à la valeur de la borne supérieure,

• l'amplitude courante du signal post- traité si la valeur de l'amplitude courante du signal post-traité est incluse dans ledit intervalle.

3. Procédé selon la revendication 2, caractérisé en ce qu'une plage de valeurs d'amplitude est affectée à chaque valeur possible d'amplitude du signal décodé (S'_MIC), et en ce que les bornes inférieure et supérieure sont choisies de sorte que la différence entre la borne supérieure et la borne inférieure soit égale à ladite plage de valeurs.

4. Procédé selon la revendication 3, dans lequel le signal reçu a été codé par un codage à quantification scalaire, le décodeur délivrant des valeurs d'amplitude quantifiées (QV), qui varient entre elles de façon discrète, les écarts successifs entre les valeurs quantifiées définissant des pas de quantification, caractérisé en ce que : la borne supérieure est donnée par l'addition de sensiblement la moitié du pas de quantification (E_MAX) à la valeur quantifiée (QV) affectée à l'amplitude courante du signal décodé (S' Mw), et - la borne inférieure est donnée par la soustraction de sensiblement la moitié du pas de quantification (E_MAX) à la valeur quantifiée (QV) affectée à l'amplitude courante du signal décodé (S'MW)-

5. Procédé selon la revendication 4, dans lequel le signal reçu a été codé par un codage à modulation par impulsion et codage délivrant un indice codé (I_MIC), caractérisé en ce que des valeurs courantes respectives des bornes inférieure et supérieure sont déterminées (25) sur la base d'un indice codé courant (I'_MIC__DEL), reçu au décodeur.

6. Procédé selon la revendication 5, caractérisé en ce que l'on prévoit une table de correspondance (24) donnant, pour un indice reçu courant (I'_MW__DEL), une valeur quantifiée correspondante (QV) et une moitié de pas de quantification correspondant (E_MAX), à partir desquelles sont déterminées (25) les valeurs courantes respectives des bornes inférieure et supérieure.

7. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'une ligne à retard (23) est prévue pour assurer une correspondance temporelle entre ladite amplitude courante du signal post-traité (S_POST) et ladite amplitude courante correspondante du signal décodé (S'MIC)-

8. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il est mis en œuvre pour des signaux décodés et post-traités (S_POST) dont l'amplitude est supérieure à une valeur seuil prédéterminée (S_e).

9. Module de traitement d'un signal numérique, le signal étant décodé (14) et subissant un post-traitement de réduction de bruit (16), caractérisé en ce qu'il comporte des moyens (23, 24, 25, 26) pour la mise en œuvre du procédé selon l'une des revendications précédentes, en vue d'une limitation d'une distorsion introduite par le post-traitement.

10. Module selon la revendication 9, caractérisé en ce qu'il est intégré dans un module (16) de post-traitement de réduction de bruit.

11. Programme informatique destiné à être stocké dans une mémoire d'un module (20) selon l'une des revendications 9 et 10, caractérisé en ce qu'il comporte des instructions pour la mise en œuvre du procédé selon l'une des revendications 1 à 8, lorsqu'elles sont exécutées par un processeur dudit module (20).