WO2009027606A1

WO2009027606A1 - Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites

Info

Publication number: WO2009027606A1
Application number: PCT/FR2008/051412
Authority: WO
Inventors: Marie Oger; Thi Minh Nguyet Hoang; Stéphane RAGOT; Marc Antonini
Original assignee: France Telecom
Priority date: 2007-08-24
Filing date: 2008-07-25
Publication date: 2009-03-05
Also published as: CN101842988B; JP2010537533A; CN101842988A; US20110116542A1; JP4981174B2; EP2183851A1

Abstract

L'invention concerne un codage arithmétique par plans de bits (MSB,..., LSB), dans lequel on utilise des tables de probabilités d'avoir un bit à 0 ou à 1 pour le codage de chaque plan de bits. Selon l'invention, ces tables de probabilités sont calculées dynamiquement, pour chaque trame de signal, à partir d'un modèle (Mod) de densité de probabilités correspondant à la distribution (H) du signal (X) sur chaque trame.

Description

Codage/décodage par plans de symboles, avec calcul dynamique de tables de probabilités

Domaine de l'invention La présente invention concerne un traitement de codage/décodage de signaux numériques tels que les signaux de parole, les signaux d'images, ou plus généralement les signaux audio et/ou vidéo, ou plus généralement encore les signaux multimédia, pour leur stockage et/ou leur transmission.

Art antérieur

Parmi les méthodes fondamentales de compression des signaux numériques, on distingue les méthodes de compression sans perte (codage de Huffman, codage de Golomb-Rice, codage arithmétique), qualifiées également de "codage entropique", des méthodes de compression, avec perte, reposant sur une quantification scalaire ou vectorielle.

En référence à la figure 1 , un codeur en compression, général, comporte typiquement : - un module d'analyse 100 de la source à coder S, un module de quantification 101 (de type scalaire ou vectoriel), suivi d'un module 102 de codage, tandis qu'un décodeur homologue comporte : un module de décodage 103, un module de quantification inverse 104, et un module de synthèse 105.

Dans la suite, l'analyse et la synthèse ne sont pas discutées. On ne considère que la quantification, suivie du codage et/ou du décodage associé. On s'intéresse plus particulièrement ici à la quantification scalaire d'un bloc de données suivie par un codage, par plans de symboles, des indices de quantification. Cette technique de codage, utilisée dans plusieurs normes de compression des signaux (en codage audio MPEG-4 dans le codeur "Bit Sliced Arithmetic Coding" (ou BSAC), en codage d'images JBIG sur les plans de bits d'une image, en codage notamment selon la norme JPEG2000, en codage vidéo MPEG-4), est schématisée sur la figure 2.

En référence à la figure 2, la quantification scalaire suivie par codage par plans de symboles implique typiquement, au codage : un module d'adaptation 200 du signal source S pour délivrer un vecteur noté X = [X₁ • • • x_N ] de dimension N ≥ \ , un module de quantification scalaire 201 délivrant un vecteur quantifié définissant une séquence de valeurs entières Y = Iy₁ • • • y_N ] ,

- un module 202 de décomposition en plans de symboles qui peuvent être des bits à 0 ou 1, ce module 202 délivrant alors un vecteur de valeurs P_k = [a_{l k} - - - U_{7V 4} ] avec k = 0,- - -,K - l , et un vecteur de signes S = [s_ι ^{• • •} % ] ,

- un module 203 pour réaliser le codage par plans de bits et un multiplexage des valeurs codées, et un module de régulation de débit 204, selon le nombre de bits Nb à utiliser pour la transmission ; et, au décodage :

- un module de démultiplexage et de décodage 206, - et un module 207 de conversion en nombres entiers pour délivrer un vecteur Y tel que Y = Y , en l'absence d'erreurs binaires et sans troncature de train binaire.

La référence 205 illustre le canal de transmission du codeur au décodeur, qui peut éventuellement appliquer une troncature du train binaire.

Ainsi, en partant du signal adapté, à coder, X = [X₁ • • • x_N ] , la quantification scalaire

(menée par le module 201) produit une séquence de valeurs entières Y = Iy₁ • • • y_N ] . La décomposition en plans de bits (menée par le module 202) revient d'abord à séparer signes et valeurs absolues, comme suit :

puis à décomposer les valeurs absolues sous forme binaire, avec : α_! = B_κ.1 (α_! ) 2^κ-¹ + - B_k (α_! )2^k + ... + B₁ (α_! ) 2¹ + B₀ (α_! ) 2° , où :

B_k ((Z₁ ) est le k^eme bit de la décomposition binaire de la valeur absolue a, de la composante quantifiée Y₁, et

K est le nombre total de plans de bits pour la décomposition de l'ensemble des valeurs a_t , ce nombre K étant défini par :

où [.] désigne l'arrondi à l'entier supérieur et avec Iog₂(θ) = -∞ . On notera que le signe de la valeur zéro étant indéfini, la convention ci-dessus (S₁ = O pour y_t = 0) peut être changée (en ^ = I pour y_t = 0).

Le codage entropique des plans (module 203) peut avantageusement être réalisé par un codeur dit "arithmétique contextuel" . Le principe d'un codeur arithmétique est expliqué dans le document Witten et al :

"Arithmetic Coding for Data Compression" , LH. Witten, R.M. Neal, J.G. Cleary,

Communications of the ACM - Computing Practices, Vol.30, N°6 (juin 1987), p.520-540.

On relèvera, par exemple en référence à la table I (page 521) de ce document Witten et al, que des tables de probabilités doivent être fixées initialement pour mener le codage. Dans un codeur arithmétique dit "contextuel", les données qui sont tirées des tables de probabilités pour les symboles 0 et 1 ne sont pas toujours les mêmes et peuvent évoluer en fonction d'un contexte qui dépend par exemple des valeurs des bits déjà décodés aux alentours (par exemple dans les plans de bits supérieurs et dans les éléments adjacents). Le principe d'un codeur arithmétique contextuel est décrit notamment dans le document Howard et al : "Arithmetic Coding for Data Compression" , P. G. Howard et J. S. Vitter, Proc. IEEE, vol. 82, no. 6 (Juin 1994).

En général, le module 203 code les plans de bits, un par un, en commençant par les plans de bits les plus significatifs jusqu'aux plans de bits les moins significatifs. Cette notion de plans de bits plus ou moins significatifs sera décrite plus loin en référence à la figure 3. Les bits de signe S₁ , pour i = \,- - -,n , ne sont transmis que si la valeur absolue correspondante α_; est non nulle. Pour permettre un décodage partiel des plans de bits, le bit de signe S₁ est transmis dès que l'un des bits décodés {α_α}_{i=0 κ}__γ est égal à 1.

Le débit qui est produit à la sortie du codeur est, en général, variable. On ne décrit pas, dans ce qui suit, la façon de gérer ce débit variable (modules 200 et 204 de la figure 2). Le train binaire généré par le module 203 est enfin transmis sur un canal 205, lequel peut tronquer le train binaire (en exploitant la nature hiérarchique du train binaire) ou encore introduire des erreurs binaires.

Au décodage, le démultiplexeur-décodeur (module 206) reconstruit les plans de bits P_k , un par un, et décode les bits de signes S qui ont été transmis. Ces informations décodées permettent de reconstruire (module 207) le signal Y . En l'absence d'erreurs binaires et sans troncature de train binaire, on a bien entendu :

P_k = P_k , S = S et donc Y = Y

Dans la suite du document, pour la clarté de l'exposé, on suppose qu'il n'y a pas d'erreurs binaires.

L'intérêt principal du codage par plans de bits est qu'il conduit naturellement à un codage hiérarchique (ou progressif) du signal. Des approximations successives du signal de plus en plus précises peuvent être reconstruites à mesure que l'on reçoit l'ensemble du train binaire transmis par le codeur. Un exemple de décomposition en plan de bits est donné à la figure 3 pour N = S . Dans l'exemple représenté, le vecteur Y est tel que Y = [-2, +7, +3,0, +1,-3, -6, +5] . Les valeurs {y_t }_{ι=ι N} non nulles sont dites "significatives" (référence VS de la figure 3). Les bits de signe sont représentés par le vecteur portant la référence sgn sur la figure 3. Dans ce cas, on a K =3, P₀ = [0,1,1,0,1,1,0,1] , P₁ = [1,1,1,0,0,1,1,0] , P₂ = [0,1,0,0,0,0,1,1] et S = [1,0,0,0,0,1,1,0] .

Le vecteur P_k représente alors un plan de bits de poids k . Le plan de bits supérieur

P^_-1 représente le plan des bits le plus significatif (référence MSB pour "Most Significant Bits" en anglais), tandis que le plan de bits inférieur P₀ représente le plan des bits les moins significatifs (référence LSB pour "Least Significant Bits" en anglais).

On décrit maintenant, de façon plus détaillée, le fonctionnement du module 203 de la figure 2, en référence à la figure 4 correspondant à un organigramme du codage arithmétique par plans de bits (suivant une quantification scalaire). Il s'agit d'un codage avec multiplexage de dimension N au sens de l'état de l'art. Après une étape de début 400, on obtient le nombre total K de plans de bits (étape 401). On décrémente un indice courant de boucle k et on fixe alors initialement la valeur de cet indice courant à k=K-l (étape 402) pour terminer le traitement à k=0. Le test 403 vérifie que la valeur de k=0 n'est pas encore atteinte. Tant que cette valeur k=0 n'est pas atteinte (flèche O), on code le plan Pk d'indice courant k (étape 404). La première boucle pour laquelle k=K-l traite donc le plan Pκ-i correspondant au plan MSB et la dernière boucle pour laquelle k=0 traite le plan Po correspondant au plan LSB. A l'étape 405, on transmet les signes des nouveaux coefficients significatifs associés au plan Pk. L'étape suivante 406 vise à décrémenter la valeur de l'indice courant k. Si le plan Po pour la valeur de k=0 a été traité (flèche N en sortie du test 403), le traitement est terminé (étape de fin 407) ou recommence pour un nouveau bloc de données du signal (ou trame). Le codage s'effectue donc sur des plans de bits Pk successifs, du plan MSB au plan LSB. On indique qu'il est possible en outre de fractionner les plans Pk en sous-vecteurs pour permettre un décodage encore plus progressif, ce fractionnement pouvant éventuellement aller jusqu'à obtenir des sous-vecteurs de taille unitaire (égale à 1).

On peut alors coder des plans de bits de valeurs absolues par un codage arithmétique adaptatif. En effet, les plans P_k peuvent être codés un par un (indépendamment les uns des autres, de façon séquentielle en allant du plan MSB au plan LSB), par codage arithmétique adaptatif. L'adaptation des probabilités des symboles (0 et 1) dans le codage d'un plan Pk n'utilise que les bits qui ont déjà été codés dans le même plan Pk. Le codeur arithmétique adaptatif est donc réinitialisé dès que l'on commence à coder un nouveau plan P_k, en particulier en initialisant les probabilités de 0 et de 1 à une valeur de 1/2 (= 0,5) et, au fur et à mesure du codage du même plan, ces probabilités évoluent et sont adaptées en mettant à jour la fréquence de 0 et de 1. Une description détaillée de ce type d'encodage est donnée notamment dans le document :

"An introduction to arithmetic coding", G. C. Langdon, IBM J. Res. Dev. 28, 2, p.135-149 (Mars 1984).

Des codeurs plus sophistiqués ne fixent pas la fréquence initiale de 0 et de 1 à 1/2, mais stockent des valeurs de probabilités dans des tables préenregistrées qui donnent une fréquence initiale de 0 et de 1 adaptée à un certain contexte de fonctionnement (par exemple adaptée au débit, ou encore au type de source à coder). Au mieux, les codeurs de l'état de l'art requièrent donc un stockage de tables de probabilités des symboles

(comportant alors des valeurs de fréquences prédéfinies). De manière plus générale, des tables préenregistrées sont habituellement nécessaires pour pouvoir appliquer un codage entropique de type Huffman ou un codage arithmétique. Les techniques de l'état de l'art sont alors peu flexibles car elles demandent de pré-calculer et stocker des informations qui doivent être adaptées à des conditions particulières d'opération (de débit, de type de source). Par conséquent, il convient d'anticiper, à la conception des codeurs/décodeurs, toutes les situations possibles, afin de générer de telles tables. La présente invention vient améliorer la situation.

Présentation de l'invention

Elle propose à cet effet un procédé de traitement d'un signal pour un codage/décodage en compression du signal par plans de symboles, dans lequel des probabilités de valeurs de symboles sont déterminées pour au moins un plan.

Au sens de l'invention, ces probabilités sont calculées dynamiquement, à partir d'une estimation d'une distribution du signal.

Préférentiellement, le signal étant quantifié avant le codage, l'estimation de la distribution du signal est menée sur le signal à coder, avant quantification, pour avoir une estimation la plus fine possible de la distribution du signal (et non pas une estimation de la distribution du signal appauvri après quantification).

Dans un premier mode de réalisation, le signal comportant une succession de valeurs, chaque valeur est décomposée en une pluralité de valeurs de symboles dans une pluralité respective de plans de symboles. Les probabilités sont calculées pour au moins un plan et visent chacune la probabilité d'avoir, dans ce plan, une valeur de symbole égale à un symbole donné. Préférentiellement, les probabilités sont calculées au moins pour le plan représentant les valeurs de symboles les plus significatives.

Dans un deuxième mode de réalisation, les probabilités sont calculées en outre pour d'autres plans, en tenant compte d'un contexte défini par des valeurs de symboles prises dans des plans représentant des valeurs de symboles plus significatives.

Plus particulièrement, pour une même position de valeur de signal dans ladite succession de valeurs, chaque valeur de symbole prise dans un plan représentant une valeur de symbole plus significative qu'une valeur de symbole dans un plan courant, définit une valeur de contexte pour ce plan courant et pour cette position. Les probabilités précitées sont alors calculées pour ce plan courant en tenant compte d'une pluralité de valeurs possibles du contexte pour ce plan courant. Dans un troisième mode de réalisation, on choisit un nombre limité de valeurs possibles du contexte, préférentiellement un nombre de deux, avec :

- une première valeur de contexte désignant l'occurrence d'au moins une valeur de symbole significative dans les plans représentant des valeurs de symboles plus significatives,

- une seconde valeur de contexte signifiant qu'aucune occurrence de valeur de symbole significative n'a été relevée dans les plans représentant des valeurs de symboles plus significatives.

Ainsi, l'invention propose, au contraire de l'art antérieur, de se passer de tout stockage de tables de probabilités, lesquelles sont plutôt calculées "en ligne" (en fonction du signal), et d'utiliser une estimation de la densité de probabilités de la source à coder/décoder (par exemple représentée par un modèle gaussien généralisé) pour calculer dynamiquement les probabilités des symboles par plans (par exemple les probabilités de 0 et de 1 pour un plan de bits). L'invention peut donc utiliser la connaissance d'un modèle de probabilité de la source à coder (ou à décoder), et ce pour estimer a priori les probabilités de symboles dans chaque plan Pk.

On peut, en effet, "utiliser" un modèle de la source à coder car certains codeurs/décodeurs mettent déjà en œuvre une telle modélisation, notamment pour calculer le facteur de forme (noté habituellement α) du signal à coder. On peut alors s'appuyer sur un modèle de distribution du signal préexistant, par exemple utilisé pour le calcul du facteur de forme α dans l'encodeur par transformée avec codage stack-run et présenté dans le document Oger et al :

"Transform audio coding with arithmetic-coded scalar quantization and model-based bit allocation ", M. Oger, S. Ragot et M. Antonini, ICASSP, avril 2007. On précise néanmoins ici que ce document ne divulgue en rien un quelconque codage par plans de symboles. Liste des figures

D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels, outre les figures 1 à 4 décrites ci-avant : - la figure 5 présente un exemple d'encodeur utilisant, au sens de l'invention, un modèle de distribution du signal à coder, pour un codage par plans de bits, - la figure 6 présente un décodeur homologue de l'encodeur de la figure 5, la figure 7 illustre la densité de probabilités d'une gaussienne généralisée et montre différents intervalles de calcul de probabilité p(α,), - la figure 8 présente l'organigramme du codage par plan de bits avec une initialisation des tables de probabilités pour chaque plan P_k, selon le premier mode de réalisation précité, la figure 9 présente l'organigramme d'un décodage homologue du codage de la figure 8, - la figure 10 présente un exemple de décomposition binaire sur trois plans et de codage contextuel pour le plan LSB, la figure 11 illustre les plans de bits associés à un signal fortement harmonique, ainsi qu'un histogramme H de ce signal à comparer avec un modèle de distribution Mod qui peut lui être affecté (courbe en traits pointillés), la figure 12 illustre le principe d'un codage arithmétique (contextuel pour le codage du plan P_κ-2 dans l'exemple représenté) de plans de bits dont les tables de probabilités ont été calculées dynamiquement par le procédé au sens de l'invention, - la figure 13 présente l'organigramme du codage par plan de bits avec une initialisation contextuelle des tables de probabilités, selon le deuxième mode de réalisation précité, et la figure 14 présente l'organigramme du codage par plan de bits avec une initialisation contextuelle des tables de probabilités dans le cas où l'on n'impose que deux contextes possibles, selon le troisième mode de réalisation précité. Description détaillée

La présente invention propose un traitement de codage/décodage par plans de symboles exploitant une distribution de probabilités de la source à coder pour estimer a priori la probabilité des symboles (par exemple 0 et 1) pour chaque plan. Ce traitement vise une optimisation du codage entropique en apportant une connaissance dynamique des tables de probabilité.

On peut considérer le cas d'un codage arithmétique contextuel comme exemple de codage entropique. On décrit ci-après un exemple où le codage au sens de l'invention s'effectue sans perte des indices issus de la quantification des coefficients de transformée des codeurs fréquentiels, notamment pour des signaux de parole et/ou audio. Néanmoins, l'invention s'applique également au codage avec perte, notamment de signaux tels que les signaux d'images ou vidéo.

On a illustré alors sur la figure 5 un exemple d'encodeur utilisant un modèle de distribution du signal à coder pour connaître a priori les probabilités des symboles 0 ou 1 par plans de bits, au sens de l'invention. La structure de l'encodeur, telle que représentée à titre d'exemple sur la figure 5, est très proche d'un encodeur de l'art antérieur décrit dans le document Oger et al : "Transform audio coding with arithmetic-coded scalar quantization and model-based bit allocation ", M. Oger, S. Ragot et M. Antonini, ICASSP, avril 2007. En particulier, l'encodeur décrit dans ce document détermine un modèle de distribution du signal pour estimer un facteur de forme α qui ne sert, dans le document cité, que pour le contrôle de débit. Par ailleurs, ce type d'encodeur mène un codage selon la technique dite "stack-run" et qui n'a aucun rapport avec un codage par plans de bits au sens de l'invention.

Néanmoins, l'invention peut avantageusement tirer profit d'une structure préexistante comportant un module de calcul du facteur de forme 505 (figure 5) et utiliser en outre ce module 505 pour réaliser un codage par plans de bits comme décrit ci-après. En référence à la figure 5, l'encodeur dans l'exemple représenté comporte : un filtre passe-haut 501, un module de filtrage perceptuel 502, - un module 503 d'analyse LPC (pour "Linear Prédiction Coding") et quantification, pour l'obtention des paramètres de prédiction à court terme, un module 504 de conversion MDCT (pour "Modified Discrète Cosine

Transform") et de mise en forme fréquentielle,

- le module 505 de calcul d'un facteur de forme α, à partir d'un modèle gaussien généralisé dans l'exemple décrit, un module 506 de contrôle de débit, notamment en fonction du nombre de bits utilisés Nb, un module 507 qui exploite par ailleurs le module 505 pour mener les calculs servant au moins à l'initialisation des tables de probabilités du module de codage 509 par plans de bits, dans un premier mode de réalisation, et, dans d'autres modes de réalisation ultérieurs, au calcul de contextes, un module 508 de quantification scalaire uniforme, le module 509 de codage par plans de bits, un module 510 d'estimation du niveau de bruit et quantification, - un multiplexeur 511 des sorties des modules 503, 505, 509 et 510 pour un stockage des données codées ou une transmission pour un décodage ultérieur.

Ainsi, le signal d'entrée x(n) est filtré par un filtrage passe-haut (501) afin de retirer les fréquences inférieures à 50 Hz. Puis, un filtrage perceptuel de mise en forme est appliqué au signal (502) et parallèlement une analyse LPC est appliquée en outre au signal (503) filtré par le module 501. Une analyse MDCT (504) est appliquée au signal après filtrage perceptuel. L'analyse utilisée peut par exemple être la même que celle du codeur normalisé 3GPP AMR-WB+. On estime le facteur de forme α sur les coefficients de la transformée MDCT (505). En particulier, une fois l'estimation du facteur de forme effectuée, on calcule le pas de quantification q qui convient pour atteindre le débit voulu (506). Puis, on effectue une quantification scalaire uniforme du signal suivant ce pas de quantification (507), le module 512 de la figure 5 effectuant une division par ce pas. On récupère ainsi une séquence d'entiers Y(k) qui sont ensuite codés par le module 509. On effectue préférentiellement aussi une estimation du niveau de bruit à injecter au décodeur (module 510).

Ainsi, dans l'exemple représenté sur la figure 5, l'encodage est effectué par transformée avec un codage par plan de bits dont les tables de probabilités sont initialisées en temps réel, au sens de l'invention, suivant un modèle de distribution estimé dynamiquement en fonction du signal à coder. La première partie du codage avant transformation MDCT (modules 501 à 504) est équivalente à celle utilisée pour le codage par transformée avec codage stack-run présentée dans le document Oger et al cité précédemment. L'estimation du facteur de forme (module 505) ainsi que le contrôle du débit peuvent être, eux aussi, communs. Par contre, on se sert ici de l'information du modèle déterminé pour estimer aussi les tables de probabilités (module 507) des symboles 0 et 1 qui vont servir à l'initialisation du module de codage 509. On effectue ensuite aussi une quantification scalaire uniforme (module 508), la référence 512 représentant un module de division. La quantification peut être, elle aussi, commune à celle décrite dans le document Oger et al, mais elle est suivie ici par un codage par plan de bits (module 509) dont l'initialisation des tables de probabilités se fait, comme indiqué ci-avant, suivant un modèle (défini par le module 505). On effectue une estimation du niveau de bruit (module 510) qui peut être encore commune à celle de la référence Oger et al. Les paramètres du codeur sont finalement transmis au décodeur en passant par un multiplexeur 511.

En référence maintenant à la figure 6, un décodeur homologue peut comporter : un module de démultiplexage 601 du flux reçu du codeur de la figure 5, un module 602 de décodage des coefficients LPC, un module 603 d'estimation des probabilités à partir du modèle â défini par le module 505 de la figure 5, - un module 606 de décodage du pas de quantification q , - un module 605 de décodage du niveau de bruit s , utilisant la valeur du pas de quantification décodée, un module 604 de décodage par plans de bits recevant les probabilités estimées (module 603) pour délivrer, en utilisant la valeur du pas de quantification décodée, le vecteur d'entiers décodé Y(k) , un module d'injection de bruit 607,

- un module 608 de désaccentuation des basses fréquences pour retrouver le vecteur décodé X(k) , s 'exprimant dans le domaine transformé, un module 609 de transformée MDCT inverse, et - un module 610 de filtrage perceptuel inverse à partir des coefficients LPC décodés (module 602), pour retrouver un signal x(n) qui, sans perte ou troncature dans la communication, correspond au signal d'origine x(n) de la figure 5.

On indique par ailleurs, en référence à nouveau à la figure 5, que le nombre de bits Nb utilisés par le codage est renvoyé au module d'allocation des bits pour modifier (ou adapter) la valeur du pas de quantification, de sorte que ce nombre de bits reste inférieur ou égal au budget de bits disponibles. Le codage du spectre MDCT s'effectue donc dans une boucle de contrôle de débit avec typiquement 10 à 20 itérations, pour arriver à un pas de quantification optimal q_opt. Plus particulièrement, le pas de quantification initial, fixé pour la première itération sur la détermination du pas de quantification optimal q_opt, est estimé à partir du facteur de forme α que délivre le module 505 de détermination d'un modèle gaussien généralisé.

On détaille ci-après le fonctionnement de ce module 505.

Contrairement au codage classique, le codage dit "basé modèle" (probabiliste) consiste à quantifier et coder la source non pas directement, mais à partir d'un modèle de probabilité. En référence à la figure 11, on a représenté la variation de l'amplitude (A(MDCT)) d'un signal à quantifier et coder (référencé X et correspondant donc à une suite de composantes X₁). Ce signal X peut par exemple être délivré par le module 504 de la figure 5 et correspondre alors à un signal MDCT qui est fonction de la fréquence (freq). On rappelle que le signal X est destiné à être quantifié par un pas de quantification q, pour obtenir (en sortie du module 508 de la figure 5) le signal référencé Y et correspondant à une suite de composantes y,. On détermine les signes et les valeurs absolues a, de ces composantes y, et ces valeurs absolues a, sont décomposées en pans de bits MSB ... LSB représentés sur la figure 11.

Plus particulièrement, pour obtenir l'histogramme H correspondant à la distribution du signal X (graphe de droite sur la figure 11) : on "compte" toutes les occurrences où les composantes x, du signal X sont égales à 0 et on reporte le nombre obtenu en ordonnée (Hist) du graphe, à l'abscisse 0, puis on compte toutes les occurrences elles sont égales à 1 et on reporte le nombre obtenu en ordonnée, à l'abscisse 1 , et ainsi de suite pour les valeurs suivantes 2, 3, etc., et -1, -2, -3, etc. Par conséquent, la référence Val(x,) sur la figure 11 (abscisse du graphe de droite) désigne toutes les valeurs possibles que peut prendre le signal X.

On modélise ensuite cet histogramme H par le modèle Mod (en traits pointillés) qui peut être par exemple d'allure gaussienne. En référence maintenant à figure 7, la distribution H du signal X peut finalement être représentée par un modèle de densité de probabilités (référence pdf pour "probability density function"), suite à un simple changement d'échelle d'abscisses (de VaI(X,) à Val(α,), la référence Val(α,) désignant les différentes valeurs possibles que peut prendre chaque valeur absolue de composante a,). La figure 7 illustre à titre d'exemple la densité de probabilités d'une gaussienne généralisée, qui est un modèle particulier pouvant avantageusement être choisi. On en donne une expression mathématique (notée f_α ) ci-après.

La densité de probabilités d'une source z gaussienne généralisée, de moyenne nulle et d'écart-type σ, est définie par :

où α est le facteur de forme décrivant la forme de la fonction exponentielle (figure 7), les paramètres A(α) et B(α) étant définis par :

. . ccB(α , v r(3/α) A(α) = — Γ-^- et B(α) = , ' y ' 2r(l/α) ^{V ;} \ r(l/α) où F est la fonction Gamma définie comme suit : r(α) = {_oV t^«+1 dt

Ainsi, on modélise la source (le signal à coder) comme le résultat d'un tirage aléatoire d'une variable gaussienne généralisée. Ce modèle gaussien généralisé peut alors être utilisé avantageusement pour modéliser le spectre à coder dans le domaine de la transformée discrète en cosinus modifiée (MDCT). On peut tirer de ce modèle la valeur du facteur de forme α qui caractérise d'ailleurs le modèle. On rappelle qu'avantageusement, le facteur de forme α est déjà estimé pour chaque bloc de signal (ou trame) à partir du spectre à coder, dans certains codeurs existants qui intègrent un module tel que le module 505 de la figure 5, pour calculer le pas de quantification q.

Au sens de l'invention, l'estimation du modèle de distribution (pouvant mener notamment au facteur de forme α) permet de calculer aussi les probabilités des valeurs de symboles par plans. Cette technique est décrite ci-après. En référence encore à la figure 7, l'estimation d'une probabilité p(α,) d'avoir une valeur de composante a, parmi N valeurs possibles (référencées VaI(^) sur la figure 7) repose sur le calcul suivant :

La figure 7 illustre aussi les différents intervalles de calcul de la probabilité p(α/). On observe déjà que, la distribution gaussienne généralisée étant symétrique, on a p(^αJ ⁼ p("^αJ - On relèvera aussi que les intervalles sont réguliers car on met en œuvre une quantification scalaire uniforme de pas q (pour obtenir les composantes y, (ou a,) à partir des composantes X₁). On relèvera aussi que plus la valeur maximale des composantes a, est grande, plus la probabilité associée p(α,) est faible.

Le calcul des probabilités p(αj peut être mené par des méthodes d'intégration classiques. On utilise dans une réalisation préférentielle la méthode dite "des trapèzes", simple de mise en œuvre. Par ailleurs, on normalise préférentiellement la valeur de l'écart-type σ à 1 de sorte que le pas de quantification, pour le calcul de l'intégrale dans l'équation ci-avant, devient q/σ. Cette opération permet un calcul plus efficace des intégrales, car on supprime ainsi le problème de la variation de dynamique sur le signal et on se ramène à une source centrée de variance unitaire quelle que soit la valeur du facteur de forme.

Trois modes de réalisation sont présentés ci-après pour estimer les probabilités des symboles O et 1 par plans de bits à partir de ces calculs de probabilités p(α, ) .

Dans un premier mode de réalisation, on prévoit une estimation de la probabilité d'avoir des bits à O ou à 1 pour chaque plan de bits Pk, définissant alors ce qui était appelé ci-avant les tables initiales de probabilités. Ces tables seront décrites en référence à la figure 12 commentée plus loin.

Dans un deuxième mode de réalisation, on prévoit une estimation de probabilités conditionnelles de O ou de 1 en fonction des bits déjà codés et à la même position dans des plans précédents (ces bits définissant alors un contexte). Dans un troisième mode de réalisation, on prévoit une estimation des probabilités conditionnelles en fonction d'un nombre de valeurs possibles de contexte limité à deux (contexte " significatif ou non").

On rappelle que, dans l'état de l'art, les probabilités de 0 et 1 initialement dans un plan Pk étaient fixées à la valeur 1/2 = 0,5, ou, au mieux, étaient préenregistrées dans une table. Or, la probabilité de 0 et 1 dans chaque plan peut prendre une valeur qui peut, en pratique, être très différente de 1/2 et, plus généralement, être très différente d'une trame de signal à l'autre, par exemple selon le degré de voisement du signal comme on le verra plus loin.

L'organigramme de la figure 8 présente le principe du codage par plans de bit avec, selon le premier mode de réalisation, une initialisation des tables de probabilités, pour chaque plan Pk, qui est basée sur un modèle. Les paramètres du modèle qui sont le facteur de forme α et l'écart-type σ sont d'abord estimés (étape 801 après l'étape de début 800). On en détermine ensuite la valeur du pas de quantification scalaire q (étape 802), par exemple à partir de celle du facteur α comme représenté sur la figure 5. A partir des paramètres σ, α et q, on estime les probabilités des composantes a, (étape 803) comme décrit précédemment. Selon un principe similaire à celui décrit précédemment en référence à la figure 4, on vérifie s'il reste des plans de bits à coder à l'aide du test 805 sur la valeur courante d'un indice de boucle k décrémenté (étape 808) de K-I à 0. On estime alors les probabilités d'avoir un bit à 0 ou à 1 dans chaque plan (étape 806) puis on effectue le codage de ce plan (étape 807) en utilisant cette information sur les probabilités. On effectue cette boucle tant que l'indice k est positif ou nul (tant que des plans sont à coder). Sinon, le traitement se termine (étape de fin 809) ou peut être mis en œuvre à nouveau pour un bloc suivant de signal (ou trame) à coder.

En référence maintenant à la figure 9, au décodage, après une étape de début 900, on décode les paramètres â , σ et q (étape 901) caractérisant le modèle de distribution qui a été utilisé au codage. On estime ensuite, avec ce modèle, les probabilités associées aux composantes a, (étape 902). On applique ensuite une boucle avec une décrémentation (étape 907) de l'indice courant de boucle k fixé initialement à K-I (étape 903). Tant que l'indice k est positif (flèche O en sortie du test 904), on estime les probabilités de 0 et de 1 dans chaque plan Pk (étape 906) afin de décoder aussi plus efficacement chaque plan P_k (étape 907). Sinon {k inférieur ou égal à 0 correspondant à la sortie N du test 904), plus aucun plan n'est à coder et le traitement peut se terminer (étape de fin 908) ou être mis en œuvre à nouveau pour un bloc suivant (ou trame) à décoder.

On a vu ci-avant comment sont calculées les probabilités associées aux valeurs de composantes a,. On décrit maintenant comment peut en découler, pour chaque plan P_k, le calcul des probabilités associées à un symbole donné (étape 806 de la figure 8 et 905 de la figure 9). Afin de simplifier les notations dans les équations, la probabilité p (α, ) associée à une composante a, est notée « p(α) » ci-après.

La probabilité d'obtenir la valeur 0 dans un plan Pk peut être calculée à partir du modèle de probabilité correspondant encore à un modèle gaussien généralisé dans l'exemple décrit. La probabilité d'avoir le k^ieme bit de la décomposition binaire d'une composante a, (donc dans le plan Pk), égal à zéro, est donnée par : l si x ⁼ y , que l'on note ci-après

y p(B_k (α)=0) pour plus de commodité dans l'écriture des équations.

La relation qui permet d'avoir la probabilité d'avoir le symbole 0 dans le plan Pk est

, , p(b_k = 0,α ≤ M) alors donnée par : p (b_k = 0 | a ≤ M) = ,

où b_k et M sont respectivement : - une variable aléatoire représentant un bit quelconque dans le plan P_k, et

- le plus grand entier en valeur absolue que l'on peut avoir sur K plans, soit M=2^K-1. On relèvera que l'expression de la probabilité est dépendante du nombre total de plans K et donc du nombre d'entiers que l'on peut coder. En effet, on suppose ici que le nombre de plans codés est inscrit dans le train binaire et cette donnée est donc disponible au décodage comme au codage, en particulier avant le codage arithmétique des plans Pk. On a donc une probabilité dite "conditionnelle" : sachant que a ≤ M.

M

La probabilité p (α ≤ M) est définie par : p (a ≤ M) = V p(α) . α=-M

M

La probabilité p (b_k = 0, a ≤ M) est définie par : p (b_k = 0, a ≤ M) = J^ PΦ_k (^α) ⁼0) • α=-M

Pour simplifier l'écriture des équations, on note ci-après la valeur p(b_k = 0 | a_t ≤ M) (ou p (b_k = 0 1 a ≤ M) ) comme suit : « p_M (b_k = 0) ». On obtient alors l'expression suivante de la probabilité d'avoir la valeur 0 dans un plan P_k (étape 806) :

1 M 1 M

P_M (K=O) =- x £ p(B_k (α)=0) = - x £ p(α)xδ_{Bk(fl) o}

£ p(^β) ^a-⁼-^M £ p(^β) ^^M a =-M a =-M

On relèvera que la probabilité p(α,) (ou p(α)) intervient dans cette dernière équation, ce qui justifie son calcul préalable aux étapes 803 et 902 des figures 8 et 9.

La technique de codage par plans de bits, elle-même, reste pratiquement inchangée par rapport à l'art antérieur. La différence essentielle relève toutefois de l'initialisation des probabilités de 0 à la valeur p(B_k (α) = θ) donnée ci-dessus, au lieu de choisir par défaut une valeur d'initialisation de 1/2 ou encore une valeur d'initialisation préenregistrée dépendant du débit ou de la source.

Par ailleurs, afin d'obtenir la probabilité d'avoir la valeur 1 soit p_M (b_k=l) , on utilise simplement une relation de complémentarité du type : p_M (b_k=l) + p_M (b_k=0) = 1 . La figure 10 présente un exemple des différentes valeurs {a, = 0, 1, 2, 3,..., 7) qui peuvent être prises sur K=3 plans. Ainsi, pour le plan P₂ (MSB), les bits dont la valeur est zéro correspondent aux entiers 0, 1, 2 et 3 (trait plein) et donc la probabilité d'avoir la valeur 0 sur le plan MSB est donnée, en prenant la dernière équation ci-dessus, par : p_M (b₂=0)=p(α_i = 0) + p(α_i = l) + p (α_i = 2) + p(α_i = 3)

De la même façon, pour le plan Pi, les bits à la valeur zéro correspondent aux entiers 0, 1, 4 et 5 et : p_M (b₁=0)=p(α_! = 0) +p(α, = l) +p(α, = 4) +p(α, = 5) , et ainsi de suite.

On explique maintenant, en revenant à la figure 11 , ce que représente le résultat de ces calculs de probabilité. Sur cette figure, on a représenté à titre purement illustratif un signal spectral X qui présente la particularité d'être très harmonique (ou "tonal").

Ainsi, l'amplitude du signal MDCT est forte (en valeur absolue) sur seulement quelques fréquences qui se suivent (les bits significatifs ayant une valeur de 1 pour ces fréquences), tandis que l'amplitude associée aux autres fréquences est relativement faible (les bits significatifs gardant une valeur à 0). Par conséquent, le plan MSB et le ou les plans immédiatement suivants présentent peu de bits à 1. Avec l'allure de ce signal, une valeur petite du facteur de forme α (inférieure à 0,5) peut être trouvée et la probabilité d'obtenir des valeurs de bits à 0 est élevée (proche de 1) pour le plan MSB et ceux qui le suivent immédiatement. En revanche, le plan LSB des bits les moins significatifs et les plans qui le précèdent immédiatement peuvent comporter, selon une explication très schématique, autant de 0 que de 1 , suivant les fluctuations du bruit, et la probabilité d'y trouver des valeurs de bits à 0 est alors moyenne (proche de 0,5).

Il est à noter que si le signal était moins harmonique et plus bruité (par exemple un signal de parole non voisé), la probabilité de trouver des valeurs de bit à 0 dans le plan

MSB serait plus faible (plus proche de 0,5). Cette observation est détaillée dans la référence Oger et al (figure 1 et ses commentaires). Ainsi, si le signal de la figure 11 est ramené sous la forme d'un histogramme comme décrit dans cette référence Oger et al, on obtient un pic étroit (référence H de la figure 11), avec une faible valeur de largeur à mi-hauteur (donnant le facteur de forme α). En revanche, pour un signal fortement bruité ou non voisé, l'histogramme présenterait un pic plus large et un facteur de forme α plus grand. On comprend ici comment sont liés le modèle Mod de distribution de la source à coder (approximant l'histogramme H de la figure 11), d'une part, et les probabilités des valeurs de bits au moins dans le premier plan MSB, d'autre part.

Ces valeurs de probabilités calculées peuvent alors être données à un codeur arithmétique (ou à un décodeur arithmétique), par exemple tel que celui décrit dans la référence Witten et al citée précédemment : "Arithmetic Coding for Data Compression" , LH. Witten, R.M. Neal, J.G. Cleary, Communications of the ACM - Computing Practices, Vol.30, N°6 (juin 1987), p.520-540.

Dans ce cas, en référence à la figure 12 (qui peut être rapprochée de la figure Ib (page 522) de ce document Witten et al), les déclarations p_M (b_κ.j=0)=A et p_M (b_κ.j=l) =B définissent les tables de probabilités du plan Pκ-i (MSB) (qui peuvent être rapprochées de la table I (page 521) de ce document Witten et al).

Ainsi, il est possible, par la mise en œuvre de la présente invention, de calculer trame par trame les tables de probabilités p_M (b_κ__!=0) ,p_M (b_κ__!=l) au moins pour le plan MSB, directement à partir de la forme même du signal et sans avoir recours à un préenregistrement de tables de probabilités comme au sens de l'art antérieur, nécessitant alors des ressources mémoires supplémentaires, tant au codeur qu'au décodeur, et limitant la souplesse de mise en œuvre. Au sens de l'invention, les calculs des probabilités sont menés directement sur le signal, en temps réel, préférentiellement par une estimation a priori du modèle de distribution du signal (module 507 de la figure 5 et 603 de la figure 6) comme décrit ci-avant.

Le calcul des valeurs A=p_M (b_κ.1=0) et B=p_M (b_κ.1=l) correspond à ce qui a été désigné ci-avant par les termes "initialisation des tables de probabilités" . Cette opération est préférentiellement effectuée pour chaque plan. Dans le premier mode de réalisation précité, on calcule ces probabilités pour un plan courant Pk sans tenir compte des valeurs de bits dans des plans autres que Pk. Dans un deuxième mode de réalisation, on tient compte de ces valeurs en définissant un "contexte".

En effet, en référence à la figure l i a nouveau, on constate que dans les plans qui suivent immédiatement le plan MSB, si un bit d'un plan était à 1, le bit de même rang dans le plan immédiatement suivant est très fréquemment aussi à 1. Certes, la figure 11 n'est présentée qu'à titre illustratif mais cette observation peut être menée en pratique sur des cas réels. Typiquement, si un bit d'un rang i est à 1 dans un plan, il est alors "plus probable" que le bit de même rang soit aussi à 1 dans un plan suivant. A l'inverse, il est habituel que les amplitudes associées à quelques fréquences dans un spectre de signal soient quasi-nulles (notamment dans le cas d'un signal de parole). Ainsi, si le bit d'un plan Pk supérieur est nul, il est "plus probable" qu'un bit de même rang dans le plan suivant P_k-i soit nul aussi. Par conséquent, on peut, pour estimer la probabilité associée à un bit dans un plan, tenir compte avantageusement de la valeur du bit de même rang dans un plan précédent. On peut tirer parti de cette observation en définissant, à partir d'une valeur observée pour un bit de rang i sur un plan P_k (par exemple le seul bit à 1 du plan MSB de la figure 11), un contexte pour un bit de même rang i et sur le plan P_k-i suivant (bit aussi à 1 dans ce plan).

L'exploitation de ce principe notamment est menée par les codeurs arithmétiques dits alors "contextuels" dans les modes de réalisation décrits ci-après.

Ils mettent en œuvre un codage par plans de bits basé sur un modèle permettant un calcul de probabilité conditionnelle pour les plans Pk avec k<K-l. Les traitements de codage par plans de bits décrits précédemment n'exploitaient pas d'information mutuelle entre plans Pk, puisque les plans Pk étaient codés un par un et indépendamment les uns des autres. On présente maintenant une façon d'exploiter l'information déjà codée. Le plan de bits MSB est codé comme dans le cas précédent, de façon indépendante des autres plans de bits en initialisant la probabilité de 0 et de 1 à partir du modèle gaussien généralisé. Par contre, le codage du plan Pk pour k<K-l utilise ici la connaissance d'une information de "contexte" sur les plans précédents P_κ.15... , P_k+2, P_k+1 •

Globalement, on calcule des tables de probabilités pour différents contextes possibles, donc pour différentes valeurs de bits possibles prises dans les plans précédents.

Par exemple, en référence à la figure 12 à nouveau, pour le plan P_K-2, on va calculer deux tables de probabilités (chaque table pour qu'un bit du plan P_κ-2 soit égal à 0 ou à 1) en fonction des valeurs de bit possibles dans le plan précédent P_κ-i (une table pour une valeur à 0 et une table pour une valeur à 1), donc en fonction du contexte noté C sur la figure 12. Dans l'exemple représenté, la valeur du bit de rang z^'=0 dans le plan Pκ-i était 0, donc le contexte vaut C=O et la table des probabilités associée est donnée par les valeurs A' et B'. Pour le rang i=\, la valeur du bit correspondant dans le plan Pκ-i était 1, donc le contexte vaut C=I et la table des probabilités associée est donnée maintenant par les valeurs C et D'. Pour le rang i=2, la valeur du bit correspondant dans le plan Pκ-i était 0, donc le contexte vaut C=O et on reprend la table des probabilités donnée par les valeurs A' et B'. On rappelle que le rang i désigne l'indice i d'une composante a, ou y,. On relèvera sur la figure 12 que les contextes C du plan MSB ne sont pas définis (car, bien entendu, il n'y a pas de plan de bits plus significatifs). Pour une mise en œuvre informatique de cette réalisation, on fixera alors les contextes du plan MSB comme étant tous égaux à 0.

On ne détaille pas ici comment sont codés les plans, ni la manière dont sont découpés successivement les intervalles de probabilités (même si les limites des intervalles sont indiquées sur la figure 12). On pourra se référer utilement au document Witten et al pour la description de tels éléments. L'organigramme de la figure 13 présente le principe du codage par plans de bits avec une détermination de contexte pour chaque bit d'un plan Pk, dans un deuxième mode de réalisation de l'invention. Les éléments similaires à ceux de l'organigramme de la figure 8 portent les mêmes références et ne sont pas décrits à nouveau ici.

Si au moins un plan est à coder (flèche O en sortie du test 805), on estime les probabilités associées aux différentes valeurs possibles de contexte pour chaque plan (étape 1306). Dans le deuxième mode de réalisation, par le terme "contexte", on entend, pour le i^eme bit du k^eme plan, l'ensemble des bits de rang i dans les plans précédant le plan Pk. Ainsi, en référence à la figure 10, pour le rang 7, dans le plan P₁, le contexte est "1" (valeur du bit de rang 7 dans le plan P₂ (MSB)), tandis que dans le plan Po, le contexte est "11" (1 étant la valeur du bit de rang 7 dans le plan P₂ (MSB) et 1 étant la valeur du bit de rang 7 dans le plan Pi).

Le contexte étant ainsi défini pour un bit courant, on estime ensuite les probabilités en fonction du contexte trouvé (étape 1307) pour le rang de ce bit. On code alors, avec les probabilités ainsi calculées, chaque bit d'un plan (étape 1308 de la figure 13) jusqu'à épuisement des rangs. On réitère ce traitement pour un plan suivant, en tenant compte encore du contexte pour chaque bit. On effectue cette boucle tant que des plans sont à coder (flèche O en sortie du test 805). Sinon (flèche N en sortie du test 805), le codage est terminé ou peut être mis en œuvre pour un bloc de signal (ou trame) suivant.

Ainsi, dans un premier temps, on calcule les tables de probabilités pour différents contextes possibles, puis on estime la probabilité d'avoir la valeur zéro ou la valeur 1 sachant le contexte, pour chaque bit. On détaille ci-après la manière de calculer les tables de probabilités pour différents contextes possibles (les valeurs A', B', C, D' dans l'exemple de la figure 12). Le calcul de la probabilité des contextes eux-mêmes C_k (α) (étape 1306) s'effectue comme suit. Pour les plans de bits de rang inférieur à K-I (autres que le plan MSB), on définit les contextes C_k (α) comme étant le quotient de a, par 2^κ~k dans le plan Pk, soit :

K-I

^C _k (^α) = ∑ B_j (α)2^J , avec -M ≤ α < M et pour tout k < K j=k+l Pour le plan Pk, le nombre de contextes possibles est de 2^κ"k. Les différentes valeurs Ck.n possibles des contextes sur le plan Pk sont définies comme suit :

K-I cκ_n = ∑ ^B _j (ⁿ) ^2J - ^avec 0 < n < 2^κ"k et pour tout k < K j=k+l

Ainsi, dans le deuxième mode de réalisation, en référence à l'exemple de la figure 10 où K=3 plans, sur le plan k=l, on dénombre quatre contextes différents qui sont {00,01,10,1 l}et la probabilité d'avoir le k^eme contexte de a dans le plan Pk égal à Ck,_n est donnée (à l'étape 1306 de la figure 13) par :

P(C_k (α) = c,J = p(B_k+1 (α) = B_k+1 (n))xp(C_k+1 (α) = H p(B_j Ia) = B^n))

Maintenant, le calcul de la probabilité conditionnelle d'avoir la valeur zéro sachant le contexte C_k (α) , pour k<K-l, s'effectue, à l'étape 1307 de la figure 13, comme suit.

On cherche à exploiter la connaissance a priori du contexte (plans de rang k+1 à K-I) lors du codage du plan Pk. La probabilité conditionnelle d'avoir la valeur 0, sachant le contexte ct,n, pour k < K-I, est définie par :

Les relations suivantes permettent de déterminer l'ensemble des probabilités en jeu, pour les 2^κ~k différentes valeurs possibles de contexte (0, 1, 00, 01, 10, 11, 000, etc.) :

La probabilité p_M (c_k = c_kn ) , pour k <K-1, est définie par la relation :

La probabilité p_M (b_k = 0,c_k = c_kn ) , pour k <K-1, est quant à elle définie par la relation :

Ainsi, la probabilité conditionnelle d'avoir la valeur 0 sachant le contexte Ck,_n (étape 1307), notée p_M fb_k = 0 c_k = c_Kn ) , pour k < K-I, est finalement définie par la relation :

Un exemple de calcul de la probabilité conditionnelle pour k<K-l est encore présenté en figure 10, sur laquelle, pour le plan P₂ (MSB), il est décidé que tous les contextes sont nuls. Pour le plan Pi, on compte deux contextes possibles 0 ou 1, tandis que pour le plan P₀ (LSB), on compte alors quatre contextes possibles qui sont {00, 01, 10, 11} et pour le plan Po, les entiers dont le contexte est "00" sont 0 et 1. La probabilité d'avoir le contexte "00" (traits pointillés de la figure 10) est donc donnée par : p_M (c₀ = 00) = p(α_! = 0) + p(α_! = l) Dans le cas où le contexte est "00", le seul entier dont le bit dans le plan Po a pour valeur binaire 0 est l'entier 0. Ainsi, la probabilité d'avoir un bit égal à zéro dans le plan Po, sachant que le contexte est "00", est donnée par :

Inversement, la probabilité d'avoir un bit égal à 1 dans le plan Po, sachant que le contexte est "00", est donnée par :

p_M (b₀ = l|c₀ = 00) = l -p_M (b₀ = 0|c₀ = 00) = 1 - Pk = O)

P (U₁ = O) H-P ^₁ = I)

On constate néanmoins que le calcul des tables de probabilités pour les derniers plans (dont le plan LSB avec 2^K contextes possibles) est fastidieux compte tenu de la croissance exponentielle du nombre de contextes à prendre en compte. On décrit maintenant le troisième mode de réalisation correspondant à un codage arithmétique contextuel par plans de bits basé sur un modèle, avec calcul de la probabilité conditionnelle pour k<K-l, en particulier dans le cas où un nombre limité de contextes possibles est imposé (ici deux contextes possibles). Il s'agit d'une variante du cas précédent correspondant à une probabilité conditionnelle avec utilisation de contextes, dans laquelle, au lieu d'avoir un nombre de contextes qui augmente par un facteur égal à 2 à chaque nouveau plan, au fur et à mesure que l'on descend du plan MSB au plan

LSB, on fixe au contraire un nombre maximum de contextes associés à un seul bit (0 ou 1).

Dans l'exemple décrit, ce nombre maximum est de deux et s'interprète ainsi : un contexte à 0 indique que les bits codés dans les plans supérieurs et au même rang sont tous égaux à 0 et donc que le coefficient MDCT quantifié, pour ce rang, est pour l'instant non significatif, et un contexte à 1 indique qu'au moins un des bits déjà codés dans les plans supérieurs et au même rang était égal à 1, ce qui implique que le coefficient actuel, pour ce rang, est significatif. L'organigramme de la figure 14 présente le principe du codage par plans de bits avec une détermination de contexte pour chaque bit d'un plan Pk, en limitant le nombre de contextes possibles à deux ("0" ou "1" à l'étape 1406). Les éléments similaires à ceux des organigrammes des figures 8 et 13 portent les mêmes références et ne sont pas décrits à nouveau ici. Seules les étapes 1406, 1407 et 1408 sont modifiées dans le sens où les seules valeurs possibles du contexte sont maintenant 0 ou 1 , ce qui influe aussi sur le codage réalisé (étape 1408).

On présente ci-après un exemple de calcul de la probabilité conditionnelle, pour k<K-l, menée à l'étape 1406 de la figure 14 avec ces deux valeurs de contexte possibles. En référence à la figure 10, on a repris cet exemple où les deux contextes possibles sont 0 et 1. Sur le plan P₁, les bits dont le contexte est "0" (ce qui correspond à avoir la valeur 0 sur tous les plans avant le plan courant, donc sur P₂ correspondant au plan MSB) sont ceux des entiers Ci₁ = 0, 1, 2 et 3. La probabilité d'avoir un contexte égal à zéro est alors donnée par :

P_M (C, = 0) = p(α, = 0) + p(α, = l) + p(α, = 2) + p(α_! = 3) .

Sur le plan Po (LSB), les bits dont le contexte est "0" (en se référant alors aux plans Pi et P₂) sont ceux des entiers a, = 0 et 1. La probabilité d'avoir un contexte égal à zéro est alors p_M (c₀ = 0) = p(α, = 0) + p(α, = l) .

Le calcul de la probabilité d'avoir le contexte égal à 0 (étape 1406 de la figure 14) se mène comme suit. Pour les plans Pk avec k<K-l (autres que le plan MSB), on définit des contextes :

. fl s'il existe B. (α) = l pour j = k + l,... K-I

^Ck (^α) = 1

[0 autrement

La probabilité d'avoir le k^eme contexte de a dans le plan Pk égal à zéro est donnée alors (étape 1406) par une relation récursive de la forme : p(C_k (α) = O) = p(B_k+1 (α) = θ)xp(C_k+1 (α) = O) =

Le calcul de la probabilité conditionnelle d'avoir la valeur zéro, pour k<K-l, avec deux choix de contextes possibles (à l'étape 1407 de la figure 14) est mené en exploitant la connaissance du contexte (présence d'un bit égal à 1 dans les plans de rang k+1 à K-I) lors du codage du plan de rang Pk. On définit alors la probabilité conditionnelle pour k<K-l (étape 1407) comme suit :

où Ck est une variable aléatoire représentant le contexte associé à un bit bk quelconque dans le plan Pk .

La probabilité p_M (c_k = 0) , pour k <K-1, est donnée par la relation :

La probabilité p(b_k = 0,c_k = 0) , pour k <K-1, est définie quant à elle par la relation

MM

P_M (b_k = 0,c_k = 0) = - -X

M £ [p(B_k (α) = 0)xp(C_k (α) = 0)]

∑ V(fl) a,=-M a=-M

On a donc la probabilité conditionnelle pour k<K-l qui est donc définie par : P_M (b_k = 0|c_k = 0) =

On indique qu'il est possible de calculer aussi p_M (b_k = 0 c_k = l) de façon semblable.

L'invention, selon l'un quelconque des trois modes de réalisation ci-avant, conduit alors à une technique efficace de codage par plan de bits et rend ce type de codage plus flexible qu'au sens de l'état de l'art. En effet, il devient possible de ne plus stocker de tables de probabilités pré-calculées (contextes). Un calcul en dynamique, basé simplement sur le signal à coder/décoder, suffit alors.

La présente invention vise aussi un codeur pour la mise en œuvre du procédé de l'invention, tel que celui représenté à titre d'exemple sur la figure 5 décrite précédemment, et comportant alors un module 505 d'estimation d'une distribution du signal à coder, alimentant un module 507 de calcul des probabilités de valeurs de symboles. Elle vise aussi un décodeur pour la mise en œuvre du procédé de l'invention, tel que celui représenté à titre d'exemple sur la figure 6 décrite précédemment, et comportant alors un module 603 de calcul des probabilités de valeurs de symboles, à partir d'une estimation d'une distribution du signal. En particulier, ce module 603 est alimenté par au moins un paramètre (par exemple le facteur de forme α) caractérisant le modèle de densité de probabilités du signal avant codage, ce paramètre α étant reçu par le décodeur sous forme codée et étant décodé ensuite (référence â de la figure 6).

La présente invention vise aussi un programme informatique destiné à être stocké dans une mémoire d'un tel codeur ou d'un tel décodeur. Il comporte des instructions pour la mise en œuvre du procédé de l'invention, lorsqu'il est exécuté par un processeur du codeur ou du décodeur. Par exemple, les organigrammes des figures 8, 9, 13 ou 14 peuvent schématiser des algorithmes respectifs de différentes versions d'un tel programme informatique.

Bien entendu, la présente invention ne se limite pas aux modes de réalisation décrits ci- avant ; elle s'étend à d'autres variantes.

Par exemple, les codeurs arithmétiques ne fonctionnent pas, en pratique, directement avec les probabilités des symboles, mais plutôt avec les fréquences entières des symboles. L'invention décrite précédemment s'adapte néanmoins facilement à l'utilisation de fréquences, puisque les fréquences correspondent à la probabilité multipliée par un nombre d'occurrences observées. On peut encore se référer au document Witten et al pour plus de détail sur ce point. Il suffit donc de convertir en fréquences les probabilités estimées ci-avant.

Plus généralement encore, on a décrit ci-avant des plans de symboles dont les valeurs sont des valeurs de bits "0" ou "1". L'invention s'étend néanmoins à une application au codage/décodage par plans de symboles (avec plus de deux symboles, par exemple trois symboles : "0", "+1", "-1"). La référence Witten et al (table I et figure Ib) indique comment gérer les probabilités associées à plus de deux symboles. On retiendra ainsi que l'invention permet d'évaluer la probabilité des symboles dans au moins un plan de symboles (préférentiellement le plan des symboles les plus significatifs), à partir d'un modèle de la source (signal à coder/décoder).

D'ailleurs, le principe de l'invention pourrait également s'appliquer au cas d'un codage de type stack-run où les probabilités de quatre symboles (0,1,+,-) pour les "stacks" et les "runs" sont calculées à partir d'un modèle de distribution du signal à coder (selon la référence Oger et al donnée précédemment), par exemple à partir d'un modèle gaussien généralisé. Dans ce cas, on peut initialiser les probabilités des symboles 0, 1, + et -, à partir de la valeur du paramètre α associée au modèle. Par ailleurs, comme on l'a vu précédemment, l'invention permet d'optimiser les contextes du codage arithmétique contextuel. Outre le fait que le codage au sens de l'invention peut être arithmétique contextuel, le codage peut être aussi adaptatif (par exemple en fonction du débit, de la source, ou encore des valeurs prises par les bits d'un même plan) comme décrit par exemple dans la référence Langdon et al citée précédemment.

Plus généralement encore, l'invention s'applique à tout type de codage (Huffman, ou autres) basé sur les probabilités des symboles en codage par plans de symboles. Ainsi, l'invention peut s'appliquer plus généralement à d'autres types de codage entropique que le codage arithmétique.

Par ailleurs, le cas du modèle gaussien généralisé avec transmission du paramètre de forme n'a été décrit ci-avant qu'à titre d'exemple de réalisation. Des modèles autres que le modèle gaussien généralisé sont possibles. Par exemple, des modèles de probabilités fixes (un modèle Laplacien notamment) ou paramétriques (des modèles alpha-stables, de mélange de gaussiennes, ou autres) peuvent aussi être envisagés pour modéliser la source.

Plus généralement encore, il est possible de ne pas modéliser la distribution du signal, mais simplement calculer les tables de probabilités au codage sur la base de la distribution brute (non modélisée) du signal. On pourrait alors coder ces tables de probabilités et les transmettre au décodeur de sorte que ce dernier n'a pas à les recalculer (suppression du module 603 de la figure 6 et réception des tables de probabilités à la place du facteur de forme α). Néanmoins, il est préféré de modéliser la distribution du signal et de ne transmettre au décodeur que quelques paramètres (notamment le facteur de forme α) qui caractérisent le modèle, comme décrit précédemment, pour limiter la quantité de données dans le flux codé.

Claims

REVENDICATIONS

1. Procédé de traitement d'un signal pour un codage/décodage en compression du signal par plans de symboles, dans lequel des probabilités de valeurs de symboles sont déterminées pour au moins un plan (Pκ-i), caractérisé en ce que lesdites probabilités sont calculées dynamiquement, à partir d'une estimation (Mod) d'une distribution du signal (X).

2. Procédé selon la revendication 1, dans lequel le signal est quantifié avant le codage, caractérisé en ce que l'estimation de la distribution du signal est menée sur le signal à coder (X), préférentiellement avant quantification.

3. Procédé selon l'une des revendications 1 et 2, caractérisé en ce que l'estimation de distribution du signal comporte une modélisation de la distribution du signal (H), pour déduire au moins un paramètre (α) caractérisant un modèle (Mod) représentant une densité de probabilités (pdf) du signal.

4. Procédé selon la revendication 3, caractérisé en ce que la modélisation est effectuée au codage (505), en ce que ledit paramètre (α) est communiqué en vue du décodage, et en ce que lesdites probabilités sont calculées, au codage (507) et au décodage (603), en fonction dudit paramètre (α).

5. Procédé selon l'une des revendications 3 et 4, caractérisé en ce que le modèle est de type gaussien généralisé, et en ce que ledit paramètre est un facteur de forme (α).

6. Procédé selon l'une quelconque des revendications précédentes, dans lequel, le signal comportant une succession de valeurs (a,), chaque valeur (a,) est décomposée en une pluralité de valeurs de symboles (0 ; 1) dans une pluralité respective de plans de symboles (P_k), lesdites probabilités étant calculées pour au moins un plan (MSB) et visent chacune la probabilité d'avoir, dans ce plan, une valeur de symbole égale à un symbole donné, caractérisé en ce que lesdites probabilités sont calculées au moins pour le plan (MSB) représentant les valeurs de symboles les plus significatives.

7. Procédé selon la revendication 6, caractérisé en ce que lesdites probabilités sont calculées en outre pour d'autres plans (Pk), en tenant compte d'un contexte (C) défini par des valeurs de symboles prises dans des plans (Pk+i, Pk+2, • • -, Pκ-i) représentant des valeurs de symboles plus significatives.

8. Procédé selon la revendication 7, caractérisé en ce que, pour une même position (z) de valeur de signal (a,) dans ladite succession de valeurs, chaque valeur de symbole prise dans un plan (Pk+i, Pk+2, • • -, Pκ-i) représentant une valeur de symbole plus significative qu'une valeur de symbole dans un plan courant (Pk), définit une valeur de contexte (C) pour ce plan courant (Pk) et pour cette position (z), et en ce que lesdites probabilités sont calculées pour le plan courant (Pk) en tenant compte d'une pluralité de valeurs possibles du contexte (C) pour le plan courant (Pk).

9. Procédé selon la revendication 8, caractérisé en ce qu'on choisit un nombre limité de valeurs possibles du contexte (C).

10. Procédé selon la revendication 9, caractérisé en ce que le nombre de valeurs possibles de contexte par plan de symboles est limité à deux :

- une première valeur de contexte désignant l'occurrence d'au moins une valeur de symbole significative dans les plans (Pk+i, Pk+2, • • -, Pκ-i) représentant des valeurs de symboles plus significatives,

- une seconde valeur de contexte signifiant qu'aucune occurrence de valeur de symbole significative n'a été relevée dans les plans (Pk+i, Pk+2, • • -, Pκ-i) représentant des valeurs de symboles plus significatives.

11. Codeur pour la mise en œuvre du procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comporte un module (505) d'estimation d'une distribution du signal à coder, alimentant un module (507) de calcul desdites probabilités de valeurs de symboles.

12. Décodeur pour la mise en œuvre du procédé selon l'une des revendications 1 à 10, caractérisé en ce qu'il comporte un module (603) de calcul desdites probabilités de valeurs de symboles, à partir d'une estimation (α) d'une distribution du signal.

13. Décodeur selon la revendication 12, pour la mise en œuvre du procédé selon la revendication 4, caractérisé en ce que ledit module (603) de calcul desdites probabilités de valeurs de symboles est alimenté par au moins un paramètre (α) caractérisant le modèle de densité de probabilités du signal avant codage, ledit paramètre étant reçu par le décodeur.

14. Programme informatique destiné à être stocké dans une mémoire d'un codeur selon la revendication 11 ou d'un décodeur selon l'une des revendications 12 et 13, caractérisé en ce qu'il comporte des instructions pour la mise en œuvre du procédé selon l'une des revendications 1 à 10, lorsqu'il est exécuté par un processeur du codeur ou du décodeur.