WO2010001020A2

WO2010001020A2 - Codage/decodage par plans de bits, perfectionne

Info

Publication number: WO2010001020A2
Application number: PCT/FR2009/051064
Authority: WO
Inventors: Thi Minh Nguyet Hoang; Stéphane RAGOT; Marie Oger; Marc Antonini
Original assignee: France Telecom
Priority date: 2008-06-06
Filing date: 2009-06-05
Publication date: 2010-01-07
Also published as: WO2010001020A3

Abstract

La présente invention concerne une technique de codage/décodage par plans de bits, dans lequel les composantes entières d'un vecteur à coder sont décomposées en représentation binaire dans une succession de plans de bits, du plan des bits les plus significatifs au plan des bits les moins significatifs. Au sens de l'invention, le codage du plan des bits les plus significatifs est effectué, en affectant un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles ("+", "-") pour représenter un nombre de zéros successifs en binaire dans un plan, et deux autres valeurs (« 0 », « 1 ») pour coder le signe d'un bit significatif, et le codage des plans de bits suivants jusqu'au plan des bits les moins significatifs s'effectue selon les étapes d'identification des bits nuls dans les plans déjà codés et extraction des bits de mêmes positions dans un plan courant à coder pour former une partie non significative( P_k ^nonsig ), d'identification des bits non nuls dans les plans déjà codés et extraction des bits de mêmes positions dans le plan courant à coder pour former une partie significative (P_k ^sig ), de codage des bits de la partie non significative en utilisant le premier type de symbole, et de codage des bits de la partie significative en utilisant un deuxième type de symbole pour coder la valeur des bits dans la partie significative.

Description

Codage/décodage par plans de bits, perfectionné

La présente invention concerne le codage/décodage de signaux numériques tels que les signaux de parole, audio, images et vidéo, ainsi que leur application pour la transmission et/ou le stockage de tels signaux multimédias.

Plus particulièrement, la présente invention traite d'un type de codage/décodage hiérarchique, représentant les signaux par plans de bits successifs pour coder efficacement les séquences résultantes de bits ayant des valeurs 0 ou 1. Ce codage/décodage de signaux numériques est en particulier très utile pour le codage par transformée des signaux de parole et/ou audio.

On connaît deux familles de techniques de compression de signaux numériques : les méthodes de compression sans perte, telles que le codage de Huffman et le codage arithmétique (on qualifie également de codage entropique ces méthodes car elles visent à s'approcher de la limite théorique inférieure de débit, donnée par l'entropie de la source à coder) : ces méthodes reposent en général sur la connaissance des probabilités des symboles à coder ; et les méthodes de compression avec perte, fondée sur la quantification scalaire ou vectorielle et l'exploitation d'un modèle de production et/ou de perception du signal, mais ces méthodes (comme par exemple le codage CELP de la parole ou le codage audio perceptuel par transformée de type MPEG) introduisent un bruit de quantification qui rend impossible la restitution exacte du signal original.

On s'intéresse par la suite à la deuxième famille des méthodes de compression avec perte des signaux, notamment de parole et audio, qui atteignent des taux de compression adaptés aux applications de communications multimédia (téléphonie, audio/vidéo-conférence, ou autres applications). Ces méthodes de compression avec perte peuvent être décrites, de façon générale, en référence à la figure 1, comme suit. Un codeur comporte typiquement : un module d'analyse 100 du signal source Se, un module de quantification 101 et - un module de codage proprement dit 102. Un décodeur comporte typiquement : un module de décodage proprement dit 103, un module de quantification inverse 104 et un module de synthèse 105.

L'analyse (module 100) peut prendre diverses formes suivant le type de signal, par exemple pour un signal de parole ou un signal audio : calcul des paramètres d'un modèle (prédiction linéaire et de hauteur tonale ou

"pitch"), ou - transformation temps/fréquence, telle que la transformation discrète en cosinus modifiée (ou MDCT).

Le quantificateur (module 101) est de type scalaire ou vectoriel. Il peut s'agir par exemple d'assigner par défaut un indice donné à une valeur du signal qui est proche de cet indice. On comprendra alors que le signal peut perdre de sa précision (en particulier de sa finesse) lors de l'étape de quantification, laquelle s'effectue forcément « avec perte ».

Le codage, ensuite sans perte, que réalise le module 102 est parfois omis en pratique pour simplifier la mise en œuvre. Il vise par exemple à éliminer la redondance statistique après quantification. En l'absence d'erreurs binaires sur le canal, le décodeur sans perte (module 103) reconstruit l'information telle qu'elle était fournie en sortie du quantificateur. Cette information est décodée par le quantificateur "inverse" (module 104). La synthèse (module 105) peut être réalisée sous la forme d'un générateur d'excitation suivi par un filtrage, d'une transformation inverse, ou autre. Dans ce qui suit, les étapes d'analyse et de synthèse ne sont pas discutées. On ne considère que le bloc de quantification suivie par un codage sans perte. On a représenté sur la figure 2 le principe de la quantification scalaire, suivie par un codage sans perte, par plans de bits, des indices issus de la quantification. Ce type de méthode de compression est utilisé dans plusieurs codeurs existants (MPEG-4, JPEG2000 pour du codage d'images, ou autres).

Le module 201 réalise une quantification de la source Se (qui peut être ici par exemple les coefficients d'une transformée fréquentielle d'un signal audio), pour obtenir une séquence d'indices entiers de quantification. Le module 202 réalise une décomposition sous forme binaire de cette séquence d'indices en "plans de bits" successifs. Cette décomposition produit : des séquences, par plans, de 0 et de 1 suivant les poids successifs de puissance de 2, en allant des bits les plus significatifs dans un premier plan de bits dit « MSB » (pour « Most Significant Bits ») jusqu'aux bits les moins significatifs dans un dernier plan de bits dit « LSB » (pour « Least Significant Bits »), ainsi que des bits de signes.

Le module 203 code les séquences de 0 et de 1 associées à chaque plan ainsi que les bits de signes. En général on utilise un codage de Huffman ou un codage par plage, ou encore un codage arithmétique contextuel, pour ce faire.

II apparaît aussi que, pour que le codage par plan de bits (module 203) soit efficace, la décomposition binaire devrait faire apparaître des structures (de longues séquences de mêmes symboles) et des corrélations exploitables par un codage « entropique » (sans perte) de 0 et de 1. Ainsi, le codage des plans est souvent contextuel, les bits à coder étant découpés en blocs de symboles dans lesquels les symboles sont semblables ou, tout au moins, ont des statistiques similaires. Par exemple, on peut changer les tables de codage de 0 et de 1 dans un plan donné suivant les valeurs des bits déjà décodés aux alentours (dans les plans de bits supérieurs et au niveau des bits adjacents).

L'intérêt principal du codage par plans de bits est qu'il conduit naturellement à un codage hiérarchique (ou progressif) du signal : des approximations successives du signal de plus en plus précises peuvent être reconstruites à mesure que l'on reçoit l'ensemble des plans de bits codés.

On décrit en détail dans la suite ce principe de codage. On donne en particulier un exemple de décomposition par plans de bits, en décrivant les formats possibles de trains binaires associés.

La quantification scalaire, suivie par un codage par plans de bits, peut se décrire comme suit. Le signal à coder (adapté par le bloc 200, par exemple par une transformée) peut être représenté par un vecteur X = [ Jc₁ • • • x_N ] de dimension N ≥ 1. La quantification scalaire menée par le module 201 produit un vecteur Y correspondant à une séquence de valeurs entières Y = [^₁ - - - y_N] . La décomposition par plans de bits (menée par le module 202) revient tout d'abord à séparer les entiers yι en signes et valeurs absolues, soit :

où la notation sign(y_t ) désigne le bit de signe associé à l'entier y_t , avec la convention

[I si ^ < 0 [0 si y_t > 0

Le signe de zéro étant indéfini, la convention ci-dessus sign(y_t) = 0 si y_t = 0 peut être modifiée, en variante, en sign(y_t) = 1 si y_t = 0 .

Ensuite, les valeurs absolues y_t sont décomposées sous forme binaire, soit :

où bit_k (y_t) est le k ^eme bit de la décomposition binaire de y_t et K est le nombre de plans de bits à prévoir pour décomposer la séquence complète Y . On a illustré cette décomposition en figure 3. Ici, le vecteur Y s'écrit (-2, +7, +3, 0, +1, -3, -6, +5). Par exemple, le nombre +7 s'écrit 7 = 4+2+1, soit 7 = 2² + 2¹ + 2°, et fait intervenir les trois plans de la figure 3 (de MSB à LSB). Le nombre -6 nécessite la déclaration du signe par le bit 1 dans le plan des bits de signe noté SGN et 6 s'écrit 6 = 2² + 2¹, faisant intervenir la valeur de bit 1 dans le plan MSB.

Ainsi, dans l'exemple de la figure 3 illustrant une décomposition en plan de bits pour N = S et Y = [-2, +7, +3,0, +1,-3, -6, +5] , on a dans ce cas K = 3 ,

P₀ = [0,1,1,0,1,1,0,1] (plan LSB), P₁ = [1,1,1,0,0,1,1,0] , P₂ = [0,1,0,0,0,0,1,1] (plan MSB) et S = [1,0,0,0,0,1,1,0] .

Les valeurs {y_t }_{ι=ι N} non nulles sont dites significatives.

Le nombre K de plans de bits (excepté le plan de signes) est donné par :

où désigne l'arrondi à l'entier supérieur de x, et Iog₂(θ) = -∞ .

On obtient par cette décomposition les vecteurs :

- P_k (Y) = [bit_k (_yι) bit_k (y₂) ... bit_k (y_N)] avec k = 0,-, K -I , et

- S(Y) = [sign(y_ι) sign(y₂) • • • sign(y_N)] .

Le vecteur P_k définit alors le plan de bits de poids k . Le plan de bits supérieur P_i+1 est un plan de bits plus significatifs, tandis que le plan de bits inférieur P^₁ est un plan de bits moins significatifs. Ainsi, le plan P_κ__γ est le plan des bits les plus significatifs MSB. Le plan P₀ est le plan des bits les moins significatifs LSB. Par souci de concision, le plan P_{κ γ} est appelé plan MSB ci-après, le plan P_{κ 2} est appelé plan MSB-I, le plan P_{κ 3} est appelé plan MSB-2, etc. Le module 203 code les plans de bits un par un en commençant par les plans supérieurs (MSB) jusqu'aux plans inférieurs (LSB). Pour ne pas transmettre de bits de signe inutiles, les bits de signe sign{ y_t ) , i = !,- • -, N , ne sont transmis que si la valeur absolue correspondante y_t est non nulle. On comprendra ici que, par exemple pour un signal de parole voisé comportant peu d'énergie en hautes fréquences (donc des amplitudes décroissantes avec la fréquence), un grand nombre de plans de bits comporte uniformément des 0. Ainsi, il n'est pas rare que les plans de bits comportent uniformément des zéros.

De plus, pour permettre un décodage partiel (ou hiérarchique) des plans de bits, le bit de signe sign(y_t) n'est transmis que si l'un des bits décodé {t>it_lζ (y_ι)}_k__{0 κ ι} vaut 1.

En référence à la figure 4, un traitement simple que peut effectuer le module 203 (et qui intervient après quantification scalaire), pour le codage par plan de bits, peut être décrit comme suit. Après la transmission du nombre total K de plans de bits (étape 401) qui fait suite à une étape de début 400, pour tous les plans de bits, du plan MSB au plan LSB (donc pour l'indice k allant k = K -I à fc = 0 à l'étape 402) et pour n = 1 à N dans chaque plan (N étant, pour rappel, la dimension du vecteur Y), chaque bit bit_k (y_t) est codé et si ce bit n'est pas nul, on cherche à connaître le signe de y_t pour coder ce signe noté sign(y_t) si ce signe n'a pas déjà été codé dans un plan de bits plus significatifs. Le codage (étapes 404 et 405 de la figure 4) revient alors à coder successivement chacun des plans, en allant du plan MSB au plan LSB.

Le débit produit en sortie du codeur est variable, en général. On ne décrit pas ici la façon de gérer la variation de ce débit. On indique simplement que la régulation du débit peut être assurée par les modules 200 et 204. Le train binaire que génère le module 203 est transmis sur le canal 205. Ce canal peut tronquer le train binaire (en exploitant la nature hiérarchique du train binaire) ou encore introduire des erreurs binaires. Le démultiplexeur et décodeur 206 reconstruit les plans de bits P_k un par un et démultiplexe les bits de signes S qui ont été transmis. Ces informations décodées permettent de reconstruire (module 207) la séquence d'entiers Y . En l'absence d'erreurs binaires et sans troncature de train binaire on a : - P - P

- S = S et

- Y=Y .

Dans la suite, pour simplifier la description, on suppose que la transmission par le canal 205 ne génère pas d'erreurs binaires car cette question ne concerne pas directement l'invention.

On décrit ci-après plusieurs formats possibles de trains binaires. Le codage s'effectue ainsi sur des plans de bits P_k successifs. Il est alors possible de fractionner les plans P_k en sous-vecteurs pour permettre un décodage progressif. Les figures 5A et 5B présentent plusieurs formats de trains binaires associés.

En particulier, la figure 5A montre le format le plus simple selon lequel on écrit d'abord le nombre de plans K, puis successivement un code (de longueur variable) associé à chaque plan P_k de valeur absolue, et à la fin on rajoute les bits de signes S associés aux coefficients significatifs. Ce format a l'avantage d'être très facile à utiliser mais il ne permet pas un décodage hiérarchique car, dès lors que le débit de décodage est inférieur au débit de codage, le décodeur n'aura accès qu'à une partie du train binaire allant du début jusqu'à un endroit qui peut être situé avant la fin du format de transmission. On perd donc en premier les bits de signes, ce qui rend peu intelligible le signal décodé. Pour permettre un décodage partiel du train binaire (tronqué à partir de la fin), on peut envisager une structure plus sophistiquée de train binaire représentée à la figure 5B. En notant sign_k (y_t) le bit de signe sur le k ^eme plan pour le i^eme coefficient, sign_k (y_t) est défini comme :

fsign(v ) si bit (y )=l et bit (y ) = 0 pour j>k

SIgHJy₁ ) = ] k = 0,- - -, K -l et i = l,- - - , N

0 autrement

où 0 représente l'ensemble vide.

Autrement dit, les bits de signes ne sont définis que pour les entiers non nuls (donc les valeurs entières significatives) et, de plus, ils sont associés uniquement aux bits de valeur " 1 " la plus significative pour chaque entier y_t .

On définit le vecteur de signes S₄ associé à chaque plan de bit k quelque soit 0 < k<K comme suit :

^S _k = [«£ Vtt ) ^siSnJy₂ ) ...

)] i = 1, ^{• • •} , N

Le vecteur S₄ a une dimension variable puisque, par définition, sign_k (y_t) peut correspondre à 0.

Dans la structure de la figure 5B, les bits de signes associés aux coefficients devenus significatifs dans le plan Pk sont transmis immédiatement après chaque plan P_k . La seule différence entre les figures 5A et 5B est donc que le code du plan de signe a été fractionné en sous-codes et chaque sous-code a été intercalé entre les codes des plans P₄. . Il reste malgré tout que les codes associés à chaque plan représentent en général des plans entiers ce qui n'est pas souhaitable.

Ces techniques de l'état de l'art antérieur ne sont pas optimales ou ne sont pas adaptées pour le codage par plans de bits. En effet, le codage par plans de bits classique présente, en général, des performances inférieures au codage non hiérarchique, à bas débit. Cette pénalité est due en grande partie à la difficulté d'exploiter toutes les corrélations entre plans de bits successifs. De plus, on sépare en général le codage des bits de signes et celui des valeurs absolues. Ce codage séparé est sous-optimal car chaque signe est codé seul, dès lors qu'un bit de valeur "1" apparaît dans la décomposition binaire d'un entier. Il serait alors préférable de combiner le codage de ce bit " 1 " (bit le plus significatif de l'entier non nul) et du signe associé.

Par ailleurs, le codage par plages appliqué à une décomposition par plans de bits est relativement efficace pour représenter les plans de bits supérieurs (MSB, MSB-I, etc.) quand ceux-ci ont des probabilités non équilibrées (par exemple peu de "1" et beaucoup de "0"), ce qui est d'ailleurs souvent le cas pour des signaux de parole et audio dans des représentations fréquentielles. Néanmoins, le codage de plages devient beaucoup moins intéressant pour les plans de bits inférieurs (en général à partir du plan MSB-2), car on ne retrouve plus dans de tels plans de longues séquences de symboles identiques. Par ailleurs, le problème du codage séparé des signes et des valeurs absolues se pose, sensiblement de la même manière que dans le cas du codage par plans de bits classique.

La présente invention vient améliorer la situation.

A cet effet, elle propose tout d'abord un procédé de codage par plans de bits, dans lequel les composantes entières d'un vecteur à coder sont décomposées en représentation binaire dans une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB). En particulier, le codage du plan des bits les plus significatifs est effectué, en affectant : - un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles pour représenter un nombre de zéros successifs en binaire dans un plan, et deux autres valeurs pour coder le signe d'un bit significatif, et le codage des plans de bits suivants jusqu'au plan des bits les moins significatifs s'effectue selon les étapes suivantes:

- identification des bits nuls dans les plans déjà codés et extraction des bits de mêmes positions dans un plan courant à coder pour former une partie non significative,

- identification des bits non nuls dans les plans déjà codés et extraction des bits de mêmes positions dans le plan courant à coder pour former une partie significative, codage des bits de la partie non significative en utilisant le premier type de symbole, et codage des bits de la partie significative en utilisant un deuxième type de symbole pour coder la valeur des bits dans la partie significative.

Ainsi, l'invention, de façon très avantageuse, exploite complètement la nature binaire spécifique des plans de bits. De plus, elle permet d'optimiser le codage des signes en le combinant efficacement avec le codage de "1" dans les plans de bits. Avec la mise en œuvre au sens de l'invention, la pénalité en termes de performances à bas débit est fortement réduite, ce qui rend le codage par plans de bits très intéressant.

Le codage des signaux par quantification scalaire suivie par codage par plans de bits, même s'il est déjà largement utilisé en codage audio (norme MPEG-4 BSAC), en codage d'images (norme JPEG200) ou en codage vidéo (norme MPEG-4 FGS), conduit bien à un codage hiérarchique mais, habituellement, ses performances à bas débit sont en général très inférieures à celles du codage non hiérarchique. Cette pénalité en termes de performances est principalement due : à la difficulté d'exploiter les corrélations entre plans de bits successifs ainsi qu'au codage séparé des valeurs absolues des bits et de leur signe. L'invention améliore alors les performances du codage par plans de bits, en particulier à bas débit, et ce simplement en prévoyant deux types de symbole pour coder chacun des plans de bits :

- chaque bit valant " 1" est remplacé par un symbole dédié au signe de la composante vectorielle dont ce bit est le plus significatif, et

- les autres bits (nuls) sont identifiés en tant que suite de bits nuls et le nombre de bits par suite est représenté par exemple en codage binaire par un deuxième type de symbole (par exemple "+" et "-")

- un autre symbole peut avantageusement identifier une fin (ou un début) de plan, c'est-à-dire qu'à partir de (ou jusqu'à) une certaine position, tous les bits sont nuls, ce qui évite alors de coder le nombre de bits nuls en fin (ou en début) de plan.

On comprendra alors que le codage au sens de l'invention offre une combinaison optimisée du codage des signes et des valeurs absolues, ainsi que des séquences de "0" par codage des longueurs de suites de bits nuls.

Le codage des plans de bits suivants s'effectuant en deux passes permet avantageusement d'exploiter les corrélations entre plans de bits successifs.

Bien entendu, la présente invention vise aussi un procédé de décodage par plans de bits, pour reconstruire les composantes entières d'un vecteur qui ont été codées par décomposition binaire, selon une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB). En particulier, les plans sont décodés par ordre du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), et pour reconstruire le plan des bits les plus significatifs: un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles pour indiquer un nombre de zéros successifs en binaire du plan à reconstruire, et deux autres valeurs pour indiquer, en binaire, le signe du bit le plus significatif d'une composante à reconstruire, est utilisé pour insérer des zéros dans le plan à reconstruire et pour identifier le signe du bit le plus significatif d'une composante à reconstruire; et pour reconstruire les plans de bits suivants jusqu'au plan des bits les moins significatifs, le procédé comporte les étapes suivantes: - identification des bits nuls dans les plans déjà décodés et extraction des bits de mêmes positions dans un plan courant à décoder pour former une partie non significative,

- identification des bits non nuls dans les plans déjà décodés et extraction des bits de mêmes positions dans le plan courant à décoder pour former une partie significative, décodage des bits de la partie non significative en utilisant le premier type de symbole, et décodage des bits de la partie significative en utilisant un deuxième type de symbole pour décoder la valeur des bits dans la partie significative.

La présente invention vise aussi un dispositif de codage par plans de bits, comportant un module encodeur apte à coder les composantes entières d'un vecteur en les décomposant en représentation binaire dans une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB). En particulier, le module précité est agencé en outre pour coder le plan des bits les plus significatifs, en affectant :

- un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles pour représenter un nombre de zéros successifs en binaire dans un plan, et deux autres valeurs pour coder le signe d'un bit significatif, et pour coder les plans de bits suivants jusqu'au plan des bits les moins significatifs en exécutant les étapes suivantes:

- identification des bits nuls dans les plans déjà codés et extraction des bits de mêmes positions dans un plan courant à coder pour former une partie non significative, - identification des bits non nuls dans les plans déjà codés et extraction des bits de mêmes positions dans le plan courant à coder pour former une partie significative, - codage des bits de la partie non significative en utilisant le premier type de symbole, et

- codage des bits de la partie significative en utilisant un deuxième type de symbole pour coder la valeur des bits dans la partie significative. Un dispositif de codage selon un exemple de réalisation de l'invention sera décrit en détail en référence à la figure 6 plus loin.

La présente invention vise aussi un dispositif de décodage par plans de bits, comportant un module de décodage pour reconstruire un vecteur dont les composantes entières ont été codées par décomposition binaire, selon une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB).

Le module de décodage est alors agencé en outre pour décoder les plans par ordre du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), le dit module étant agencé pour reconstruire le plan des bits les plus significatifs à partir: d'un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles pour indiquer un nombre de zéros successifs en binaire du plan à reconstruire, et deux autres valeurs pour indiquer, en binaire, le signe du bit le plus significatif d'une composante à reconstruire, pour insérer des zéros dans le plan à reconstruire et pour identifier le signe du bit le plus significatif d'une composante à reconstruire; et pour reconstruire les plans de bits suivants jusqu'au plan des bits les moins significatifs, ledit module est agencé pour: - identifier les bits nuls dans les plans déjà décodés et extraire les bits de mêmes positions dans un plan courant à décoder pour former une partie non significative,

- identifier les bits non nuls dans les plans déjà décodés et extraire les bits de mêmes positions dans le plan courant à décoder pour former une partie significative, décoder les bits de la partie non significative en utilisant le premier type de symbole, et - décoder les bits de la partie significative en utilisant un deuxième type de symbole pour décoder la valeur des bits dans la partie significative.

Un dispositif de décodage selon un exemple de réalisation de l'invention sera décrit en détail en référence à la figure 7 plus loin.

La présente invention vise aussi un programme informatique destiné à être stocké en mémoire d'un dispositif de codage, et comportant des instructions pour la mise en œuvre du procédé de codage ci-avant, lorsqu'elles sont exécutées par un tel dispositif de codage. Un organigramme d'un tel programme de codage, selon un exemple de réalisation, sera décrit en détail en référence à la figure 8 plus loin.

L'invention vise aussi un programme informatique destiné à être stocké en mémoire d'un dispositif de décodage et comportant des instructions pour la mise en œuvre du procédé de décodage ci-avant, lorsqu'elles sont exécutées par un tel dispositif de décodage. Un organigramme d'un tel programme de décodage, selon un exemple de réalisation, sera décrit en détail en référence à la figure 9 plus loin.

L'invention s'applique avantageusement au codage des signaux de parole et audio, pour réaliser un codage hiérarchique. Elle s'applique aussi au codage hiérarchique d'autres signaux tels que les signaux d'images et vidéo. De plus, elle peut être également appliquée au codage sans perte de signaux, comme dans le cas de la future norme UIT-T G.711-« lossless ».

D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels : la figure 1 présente un système de compression général,

- la figure 2 présente schématiquement les étapes générales d'une quantification scalaire suivie par un codage par plans de bits,

- la figure 3 montre un exemple de décomposition en plan de bits, - la figure 4 présente les étapes générales d'un codage par plans de bits et multiplexage, - les figures 5A et 5B présentent des découpages possibles des plans de bits Pk en sous-vecteurs,

- la figure 6 présente l'encodage par transformée avec un codage optimisé au sens de l'invention, par plans de bits, pour chaque plan P_k , - la figure 7 présente le décodage par transformée avec un décodage optimisé au sens de l'invention, par plans de bits et pour chaque plan P₄ ,

- la figure 8 présente les étapes de codage optimisé selon une réalisation de l'invention, par plans de bits pour les plans P_k et en deux passes,

- la figure 9 présente les étapes du décodage optimisé selon une réalisation de l'invention, par plans de bits pour les plans P_k et en deux passes, et

- la figure 10 présente un exemple de passage en représentation quinaire dans le codage par plans de bits et en deux passes, optimisé selon une réalisation de l'invention.

On se réfère tout d'abord à la figure 6 présentant le schéma d'un codeur par transformée selon un mode de réalisation de l'invention. Dans l'exemple représenté, le signal d'entrée est filtré par un filtrage passe-haut (module 601) afin de retirer les fréquences inférieures à 50 Hz. Puis, on applique un filtrage perceptuel de mise en forme sur le signal (module 602). Une analyse LPC est appliquée sur le signal (module 603). Une analyse MDCT pour "modified discrète cosine transform" (module 604) est appliquée sur le signal après filtrage et une mise en forme fréquentielle est appliquée. On estime le facteur de forme α sur les coefficients de la MDCT par un modèle gaussien généralisé (module 605). Une fois l'estimation du facteur de forme effectuée, on calcule le pas de quantification q (module 606). Puis, on effectue une quantification scalaire uniforme du signal suivant ce pas de quantification (module 607). On récupère ainsi une suite de vecteurs Y dont les composantes sont décomposées par plans de bits (module 608), avec un codage particulier de chaque plan au sens de l'invention qui sera décrit en détail plus loin. Dans une réalisation avantageuse, on peut se servir de la connaissance du modèle gaussien généralisé pour initialiser des tables de probabilités de "0" et de " 1" d'un codeur arithmétique dans chaque plan de bits. Le codage par plans de bits (module 608), dont l'initialisation des tables de probabilités, se fait donc suivant le modèle défini par le module 605, par exemple un modèle gaussien.

On peut effectuer ensuite une estimation du niveau de bruit (module 609). Les paramètres du codeur sont ensuite transmis au décodeur en passant par un multiplexeur (module 610).

L'objet de l'invention se situe en particulier ici au niveau de ce module 608.

La figure 7 présente un exemple de décodeur par transformée avec un décodage par plan de bits optimisé au sens de l'invention. Les modules de cette figure 7 réalisent les opérations inverses de celles des modules du codeur de la figure 6. Ainsi, le module

701 démultiplexe les signaux reçus. Le module 705 retrouve le pas de quantification q.

Le module 704 décode le bruit et le module 706 reconstruit le bruit à partir du pas de quantification. Le module 703 reconstruit les plans codés et, de là, les vecteurs Y à partir du pas de quantification reconstruit.

L'objet de l'invention se situe alors aussi au niveau du module 703, en particulier.

Dans ce mode de réalisation, on utilise préférentiellement un codage arithmétique contextuel. On définit ici deux contextes de codage arithmétique (donc avec deux modèles de probabilité) et dans le premier contexte (noté C=O), on définit cinq symboles comme suit : les symboles "+" et "-", associés aux séquences de "0" dans un plan de bit courant, - les symboles "0" et " 1" représentant un bit présentant nouvellement une valeur de

"1" dans le plan de bit courant et le signe associé, - le symbole EoP (pour « End of Plane ») qui indique la fin d'un plan de bit courant. L'intérêt d'utiliser le symbole EoP s'avère surtout pour les plans supérieurs (tel le plan MSB), en présence d'une longue séquence de zéros à la fin du plan : au lieu de coder toute une suite de bits de valeurs nulles, cette suite est remplacée simplement par un symbole EoP pour rendre le codage plus efficace.

Dans le second contexte (noté C=I), on définit deux symboles ("0" et " 1") associés aux bits "0" et " 1" dans un plan courant de bits, comme on le verra plus loin.

La figure 8 représente schématiquement des étapes du codage optimisé par plans de bits, dans un mode de réalisation. Le codeur arithmétique opère selon deux contextes, appelés "contexte 0" et "contexte 1". Le codeur arithmétique est d'abord initialisé (étape 802, après une étape de début 800).

Le contexte 0 comporte un modèle de probabilité pour cinq symboles (+, -, 1, 0, EoP) et le contexte 1 comprend un modèle de probabilité pour deux symboles (0, 1).

On suppose que le nombre de plans K est transmis. On ne décrit donc ici que le codage par plans de bits optimisé en supposant le nombre de plans déjà transmis. Le codage commence par vérifier si la séquence entière est non nulle (étape 801). Pour une séquence nulle, on ne transmet qu'un nombre de plans égal à 0.

Le codage est ensuite effectué du plan MSB au plan LSB globalement en deux séries d'étapes :

- les étapes 803 à 805 pour un codage du plan MSB (de façon séquentielle du début à la fin de plan),

- les étapes 806 à 814 pour le codage du plan MSB-I qui suit immédiatement le plan MSB jusqu'au plan LSB (en deux passes : les étapes 809 et 810 d'une part, et les étapes 811 à 813 d'autre part).

Tout d'abord, à l'étape 804, le plan MSB est converti en une séquence à cinq symboles (+, -, 0, 1, EoP). Cette séquence est ensuite codée en un train binaire par codage arithmétique adaptatif à l'étape 805, dans ce contexte 0. Dans un mode de réalisation, les deux étapes 804 et 805 sont réalisées en une seule opération décrite ci-après.

La séquence binaire est d'abord convertie (implicitement) en une séquence constituée à partir d'un alphabet des cinq symboles : « + », « - », « 1 », « 0 » et « EoP ». Les règles de conversion en une séquence quinaire (à 5 symboles) sont définies comme suit : si la séquence binaire se termine par au moins un "0", la séquence finale de "0" est remplacée par le symbole EoP : il ne peut donc y avoir qu'une occurrence du symbole "EoP" dans un plan donné et si ce symbole apparaît, il termine la séquence,

- les suites consécutives de "0" qui ne terminent pas la séquence binaire sont converties en "+" et "-" : pour chacune de ces suites, le nombre de "0" consécutifs est calculé et écrit en binaire (en commençant par la fin de la suite) et un symbole 0 est remplacé par "-" tandis qu'un symbole 1 est remplacé par "+" ; par ailleurs, si le nombre de zéros consécutifs n'est pas de la forme 2ⁿ-l (n entier), le premier bit de cette décomposition binaire (correspondant forcément à un "+" en fin de décomposition quinaire) n'est pas pris en compte,

- le symbole binaire "1" est remplacé par un symbole "0" ou "1" suivant que la valeur entière relative associée à la position du bit de valeur " 1" est respectivement positive ou strictement négative : un bit " 1 " à la position i dans la séquence binaire est remplacée par son signe sign(y_t) symbolisé par « 0 » ou « 1 ».

A titre d'exemple, pour une séquence Y = [0 0 0 +10 -7 0 0 +1 -6 -11 0 0], avec N= 12, on cherche à extraire dans l'exemple K=A plans de valeurs absolues, étant entendu que le signe des composantes du vecteur Y est retenu pour être retranscrit en représentation quinaire. Le plan MSB est donné alors par [ 0 0 0 1 0 0 0 0 0 1 0 0 ]. Ce plan est converti en la séquence quinaire suivante : [ + + 0 + - 1 EoP ], avec :

« ++ » pour les trois premiers zéros du plan (en retenant que 3 vérifie 3 = 2²-l), « 0 » pour représenter la valeur à 1 du bit de poids fort de la composante +10, laquelle est positive, ce qui justifie la représentation quinaire « 0 », « +- » pour représenter le nombre 5 qui s'écrit 5 = Ix2⁰+0x2¹+lx2², donc « +-+ » en séquence quinaire et avantageusement « +- » car 5 ne vérifie pas une expression du type 2ⁿ-l,

« 1 » pour représenter la valeur à 1 du bit de poids fort de la composante -11, laquelle est négative, ce qui justifie la représentation quinaire « 1 », et

- EoP pour représenter la série de zéros en fin de plan.

On présente ici un exemple détaillé de mise en œuvre combinée des étapes 804 et 805 en particulier pour le plan MSB. On cherche à coder une séquence binaire \b_y b₂... b_nb] de nb bits, correspondant à un plan de bit de la séquence entière [J₁ y₂... y_nb] . On peut écrire alors, pour le plan MSB, que nb=N et, en particulier, [b_{ b₂... b_nh\ =P_κ__γ .

On cherche tout d'abord (étape 804) la position pos _eop du symbole EoP dans le plan MSB. Elle peut être donnée par une expression mathématique du type : pos _ eop <— { V/ e [i, nb] b_k = 0}

Ensuite (étape 805), on code la suite de bits s'arrêtant à cette position : i\ b₂... b_{pos eop}] .

Pour ce faire, on applique le contexte de codage 0 en représentation quinaire, selon les règles définies ci-avant et comme décrit pour l'exemple de codage d'un plan [ 0 0 0 1 0 0 0 0 0 1 0 0 ], en retenant les signes des composantes du vecteur d'origine pour les retranscrire dans la représentation quinaire.

Le codage des plans suivants MSB-I à LSB s'effectue préférentiellement en deux passes.

La première passe commence par une recherche des positions significatives qui serait associée au plan en cours de codage (étape 808) et à coder les bits associés à ces positions dans ce plan (étape 810) en binaire, donc dans le contexte 1. La deuxième passe consiste à coder plus finement le plan par une séquence maintenant quinaire, donc en contexte 0, dans les étapes 811 à 813. En effet, pour exploiter la corrélation entre plans de bits successifs, ces plans ne sont pas codés de façon séquentielle (du premier bit au dernier bit), mais en deux passes, avantageusement en fonction des plans précédemment codés.

Ainsi, pour un plan quelconque P_k (du MSB-I au LSB), on calcule une valeur notée significant_k (i) par la fonction suivante (étape 808) : y ^κ-^[ significatif (i) = .-μ+i = ∑ bit_m(y,)2^], i = l,-, N m=k+l où [.J correspond à l'arrondi à l'entier inférieur (ou « partie entière »).

La valeur de significant_k (i) calculée pour un plan P_k est utilisée pour séparer ce plan

P_k en deux parties :

- une première partie ne comprenant que les bits aux positions vérifiant significant_k (i) ≠ 0 , - une deuxième partie comprenant les bits aux positions vérifiant significant_k (i) = 0 .

On définit donc la partie "significative" d'un plan P_k par :

Pr = {bit_k (y, ), i = l,- , N \ significatif, (i) ≠ θ} et la partie "non significative" du plan P_k par : Pr^as = {bit_k (y,), i = l,-, N significatif, (i) = OJ

Le codage est alors réalisé suivant deux passes comme suit.

A l'étape 809, on extrait une suite P_k ^s qui comprend les bits du plan courant situés aux positions où significant_k (y_ι) ≠ 0 . Il s'agit donc de l'ensemble des bits qui occupent, dans un plan courant P_k , des positions de bits qui, dans des plans précédents plus significatifs (MSB, MSB-I, ...), avaient « 1 » comme valeur. On comprendra dans une autre formulation possible qu'il s'agit de l'ensemble des bits des composantes y_t dont le signe a déjà été codé. Dans la première passe, on code donc à l'étape 810 cette suite sur deux symboles (0, 1) seulement, en binaire. On utilise donc le second contexte (contexte C=I) d'un codeur arithmétique, pour ce faire.

La deuxième passe consiste en le codage quinaire de la suite de bits restants P™'^s qui comprend les bits du plan courant situés aux positions où significant_k (y_ι) = 0 (extraits à l'étape 811). On recherche dans la suite de bits P™'^s la position du dernier bit de valeur non nulle et on définit la position suivante comme devant porter le symbole EoP, comme décrit précédemment pour le plan MSB à l'étape 804. La suite de bits P™'^s dont on a ôté les valeurs nulles de fin à partir de la position EoP est convertie ensuite (étape 812) en symboles (+, -, 1 et EoP), selon le premier contexte de codage arithmétique (C=O) en représentation quinaire, comme décrit ci-avant pour le plan MSB à l'étape 805.

La figure 10 présente un exemple de conversion d'une séquence entière en une séquence de cinq symboles (+, -, 0, 1, EoP) en contexte 0, ou en une séquence de deux symboles (0, 1) en contexte 1, selon la consigne donnée au codeur arithmétique. La séquence prise en exemple est : [0, 0, 0, +35, +4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -H].

La décomposition binaire, compte tenu de la valeur de composante la plus élevée +35, impose un codage sur six plans représentés du plan MSB au plan LSB de la figure 10. On relèvera que l'information sur le signe des composantes (par exemple -11) n'apparaît pas dans les plans de bits mais sera réservée, comme on le verra, pour la représentation quinaire.

Le codage de ces six plans se fait alors comme suit. Le premier plan MSB des bits les plus significatifs (donnés en valeurs absolues) s'exprime par la suite de bits P₅ = [000100000000000] . Ce plan est converti avec les règles définies précédemment en une séquence "++ 0 EoP" qui est codée dans le contexte O (avec « ++ » pour 3 zéros successifs en début de plan, le nombre 3 vérifiant 3 = 2²-l ; « O » pour le bit de valeur 1 et dont la composante (+35) correspondante est positive ; et EoP pour clore la succession de zéros qui terminent le plan).

Le plan MSB-I et les plans suivants se codent en deux passes.

Dans la première passe, on cherche d'abord la position du ou des bits dont la valeur était de « 1 » dans le plan précédent (donc, ici, dans le plan MSB). Dans l'exemple, il s'agit du seul quatrième bit du plan (en partant de la gauche vers la droite tel qu'illustré sur la figure 10). Sa valeur dans le plan MSB-I est « 0 », donc P^*ιg = [0] et on code un seul symbole "0" dans le contexte C=I (partie de gauche de la figure 10). On sort ensuite ce quatrième bit de la série de bits constituant le plan MSB-I et on a pour les bits restants P₄"⁰""* = [000000000000000] , ce qui devient en représentation quinaire le symbole "EoP". On code donc le symbole "EoP" dans le contexte C=O (partie de droite de la figure 10).

Pour le plan MSB-2, on a encore le quatrième bit (bit de même position à « 1 » dans le plan MSB) à comptabiliser pour la première passe et sa valeur est « 0 », soit donc P₃"* = [0] et on code un seul bit "0" dans le contexte C=I.

Dans la deuxième passe, on a les bits restants P₃"⁰"⁵'* = [00000000000001] , ce qui correspond à 14 zéros, puis au bit "1" qui correspond au bit le plus significatif de la composante ^ = -11. Le nombre 14 s'écrit 14 = 0x2⁰+lx2¹+lx2²+lx2³, soit « -+++ » en représentation quinaire. Toutefois, le dernier symbole "+" de la représentation "-+++" n'a pas besoin d'être codé et il reste finalement « -++ ». De plus le bit de valeur 1 est remplacé par le bit de signe (négatif) correspondant sign(y_ι) = l . Donc P_k ^nomιg s'écrit "-++ 1". On notera ici l'absence du symbole "EoP" car le plan P₃ se termine par un " 1". Cette séquence est codée dans le contexte C=O.

Pour le plan suivant MSB-3, on doit maintenant comptabiliser le quatrième bit, mais aussi le dernier bit (bits à « 1 » respectivement dans le plan MSB et dans le plan MSB- 2) pour la première passe et leurs valeurs respectives sont « 0 » et « 0 ». On a alors P₄ ^S« = [00] et on code deux bits à "0" dans le contexte C=I.

Dans la deuxième passe, on a les bits restants P₄"⁰""* = [00010000000000] , ce qui correspond :

- « ++ »,

- « 0 » (pour le bit de poids fort de la composante positive +4), et

- EoP pour les bits à « 0 » restants, soit donc « ++ 0 EoP » codé en contexte C=O.

Pour le plan suivant MSB-4, on doit comptabiliser le quatrième bit, le dernier bit mais aussi le cinquième bit (bits à « 1 » dans les plans précédents) pour la première passe et leurs valeurs respectives sont « 1 », « 0 », puis « 1 ». On a alors Pf* = [101] et on code trois bits « 1 », « 0 », « 1 » dans le contexte C=I. Dans la deuxième passe, tous les bits restants sont nuls, ce qui se représente par le symbole unique EoP.

Il en va de même pour le dernier plan LSB. Dans la première passe, on a PJ^S _B = [101] et on code trois symboles " 101" dans le contexte 1. Dans la deuxième passe, on a P^^« = [0000000000000] qui s'écrit "EoP" et on code un seul symbole "EoP" dans le contexte C=O. Ce simple exemple de réalisation montre à quel point il est avantageux d'utiliser un symbole « EoP » (qui code pratiquement à lui seul le contenu du plan MSB-I, du plan LSB+ 1 et du plan LSB), compte tenu : du grand nombre de zéros dans un plan de bits habituel, - et du fait que l'on extrait les bits aux positions de bits qui ont eu une valeur à « 1 » dans des plans plus significatifs.

La figure 9 présente un mode de réalisation des étapes d'un décodage par plans de bits, optimisé selon l'invention. Ces étapes sont "inverses" du codage représenté sur la figure 8. Il conviendra en particulier de noter par la suite que le décodage commence par le plan MSB. Les deux contextes (C=O et C=I) du décodeur arithmétique sont d'abord initialisés (étape 904) après une étape de début 900 qui peut être initiée sur réception des symboles codés (étapes 901 et 902).

Le traitement de décodage commence par le plan MSB, codé initialement avec un codeur arithmétique utilisant cinq symboles (+, -, 1, 0 et EoP) définis dans le contexte C=O. La séquence de cinq symboles associée est décodée par décodage arithmétique (étape 906). Après conversion, on retrouve : - le plan MSB décodé (étape 906), et - les signes associés aux composantes dont le bit de poids fort pouvait être représenté par un « 1 » dans le plan MSB (étape 907). Le symbole EoP sera interprété en considération : du nombre de zéros dans le plan indiqué par les symboles « + » ou « - », du nombre de symboles « 0 » ou « 1 » indiquant un bit de poids fort dans ce plan, et du nombre N de composantes y, dans un vecteur Y.

Ainsi, en reprenant l'exemple de la figure 10, pour le plan MSB codé en représentation quinaire, « ++ 0 EoP » signifie que :

« ++ » doit s'interpréter comme étant 2°+2¹=3 puisqu'il n'y a pas de symbole « - » dans cette séquence et que l'on a bien 3 = 2²-l,

« 0 » correspond au bit, positif, de valeur 1 en position 3+1 = 4, et - le reste du plan ne comporte que des bits nuls, de la position 5 à la position N-5. Le plan MSB s'écrit alors [0001000000000000] en mémorisant que le signe de la composante y₄ est positif. Les composantes y_ι en cours de décodage sont ensuite mises à jour (étape 908) avec simplement y_ι <— y_ι + 2^K~1P_KΛ , en supposant, bien entendu, que l'information sur le nombre K de plans est bien reçue.

Pour les plans du MSB-I à LSB, on décode chaque plan de bits en deux passes comme dans le cas du codage exposé ci-avant. Pour chaque plan, on calcule (étape 911) le vecteur significant_k (i) comme au codage en s'aidant des plans déjà décodés et selon une expression du type :

K-I significatif \ (i) = y, jk+l = J] MtJy₁)V, i = l,-,N m=k+l

On notera qu'ici, on utilise les valeurs y_ι partiellement décodées et telles que mises à jour à la fin du décodage de chaque plan aux étapes 908 et 918. Ces valeurs sont positives car les signes ne sont préférentiellement appliqués qu'à la fin du décodage (étape 921).

La première passe consiste alors à utiliser l'information significant_k (i) pour connaître les positions des bits donnés par le décodage de la suite P_k ^sιs (étapes 912 et 913). En particulier, à l'étape 912, on relève la longueur de la suite P"^g et, à l'étape 913, on place les bits de la suite P£'^g aux positions du plan en cours de décodage en fonction de l'information significant_k (i) , en contexte C=I d'un décodeur arithmétique.

La deuxième passe de décodage consiste d'abord à déterminer la longueur de la suite p^nonstg (£_tap_e 914) _{en tant} q_ue complément à N de la longueur de la suite P£'^g . Cette information est utile pour déterminer, dans le plan P^, le nombre de zéros à interpréter en présence du symbole EoP. Le décodage proprement dit de la séquence quinaire associée à la suite P™'⁸ s'effectue aux étapes 915 et 916, conformément à la description du décodage du plan MSB décrite ci-avant en référence aux étapes 906 et 907, en notant en particulier que : - l'expression de la suite P™'⁸ en symboles binaires (« 0 » et « 1 ») est obtenue à l'étape 915 (décodage en contexte C=O),

- les signes des composantes représentées par les bits non nuls (symboles binaires à « 1 ») sont mémorisés (étape 916), et

- l'expression complète du plan courant P^ est obtenue à l'étape 917. Les composantes y_t décodées sont finalement mises à jour à l'étape 918.

A la fin du décodage des plans de bits (étape 920), les signes décodés et mémorisés sont appliqués à chaque composante du vecteur Y (étape 921), lequel est finalement complètement décodé (moyennant, bien entendu, une transformation MDCT inverse et les autres étapes mises en œuvre dans un décodeur comme représenté sur l'exemple de la figure 7.

Un intérêt principal du codage par plans de bits est qu'il conduit naturellement à un codage hiérarchique (ou progressif) du signal. Ainsi, des approximations successives du signal de plus en plus précises peuvent être reconstruites à mesure que l'on reçoit l'ensemble des plans de bits codés.

De manière à mettre en œuvre ce principe de codage/décodage hiérarchique, le décodeur est avantageusement adapté pour décoder le train binaire même si celui-ci n'a été reçu que partiellement. On relèvera que le décodeur décrit précédemment possède avantageusement cette propriété importante de possibilité d'un décodage partiel. Préférentiellement, le décodeur arithmétique reçoit en plus du train binaire une indication du nombre de bits reçus et s'arrête de décoder s'il atteint le budget de bits imposé au décodage. Si le décodeur arithmétique détecte qu'il ne peut plus lire de bits supplémentaires, le traitement des étapes 910 à 919 peut s'achever et passer directement à l'étape 921 d'application des signes des composantes représentatives du vecteur Y, puisque les bits de poids les plus forts de ces composantes représentatives ont déjà été décodés en priorité, ainsi que leur signe bien entendu.

Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci- avant à titre d'exemple ; elle s'étend à d'autres variantes.

On a décrit ci-avant un nouveau symbole « EoP » indiquant que les bits d'un plan sont tous nuls à partir d'une certaine position. En variante, un symbole de type « SoP » pour « Start of Plane » peut être prévu et indiquer alors que tous les bits de début de plan sont nuls jusqu'à une certaine position. Toutefois, la réalisation utilisant le symbole « EoP » est préférée car, souvent et notamment pour un signal audio, l'énergie est répartie dans les basses fréquences (premières composantes MDCT d'un vecteur Y). Donc, les premiers bits d'un plan ont plus de chance de ne pas être nuls que les derniers bits de ce plan. On peut toutefois prévoir aussi l'utilisation combinée des deux symboles « EoP » et « SoP » à condition de coder aussi la position du premier ou du dernier bit non nul du plan de manière à positionner correctement les zéros de début et de fin de plan au décodage.

Par ailleurs, on notera que les deux passes de codage (et/ou de décodage) des plans de bits du MSB-I au plan LSB peuvent être inversées par rapport à la description ci-avant en référence aux étapes 809 à 813 de la figure 8, et ce, sans aucune incidence sur le traitement. On code/décode d'abord la suite P₄"⁰"^ avant de coder/décoder la suite P^'^s .

On peut considérer en outre un schéma de codage/décodage en une seule passe selon laquelle chaque plan (du plan MSB au plan LSB) est codé/décodé directement en représentation quinaire, sans être séparé en deux parties P™'⁸ et P"^g . Toutefois, là encore, la réalisation présentée ci-avant en référence à la figure 10 montre bien que lorsque les bits des composantes représentatives ont été isolés dans la suite P"^g , la suite complémentaire P™'^s à coder en représentation quinaire peut s'exprimer très succinctement avec l'apparition rapide du symbole « EoP », ce qui est avantageux en termes d'efficacité de codage.

Par ailleurs, pour améliorer encore les performances du codage, il est possible aussi d'incorporer une estimation des probabilités des symboles (+, -, 1, 0 et EoP) dans chaque plan de bits. Cette technique permet d'optimiser le codage entropique en apportant une connaissance a priori des tables de probabilités. Ici, les probabilités des symboles dans chaque plan sont estimées au codage/décodage de chaque plan. Le codage/décodage est inchangé mis à part qu'une pré-estimation des probabilités est réalisée. Par exemple, cette estimation peut être réalisée dans le contexte 0 du codeur arithmétique comme suit, avec une initialisation :

- probabilité identique pour "+" et "-" donnée par 1/2 . prob (bit 0) . (N-l)/N,

- probabilité identique pour "1" et "0" donnée par 1/2 . prob (bit 1) . (N-l)/N, et

- probabiltié pour « EoP » donnée par 1/N, puis les valeurs prob (bit 0) et prob (bit 1) dans chaque plan P_k peuvent être estimées à partir d'un modèle gaussien généralisé comme décrit dans le document : "EMBEDDED TRANSFORM CODING OF AUDIO SIGNALS BY MODEL-BASED BIT PLANE CODING", Thi Minh Nguyet Hoang, Marie Oger, Stéphane Ragot, Marc Antonini, ICASSP 2008, p.4013-4016.

Enfin, dans une variante encore, il est possible de ne pas transmettre le nombre de plans K. On introduit à cet effet un symbole supplémentaire EoF (pour « End of File »), dans le contexte 0 du codage/décodage. Le décodeur déduit le nombre de plans effectivement transmis qu'au moment où le symbole EoF est décodé. Cela suppose que le train binaire complet a été reçu par le décodeur. En cas de troncature du train binaire transmis par le codeur, le décodeur peut ne recevoir qu'une partie des plans à décoder sans savoir combien de plans auront dû être transmis. Des mécanismes supplémentaires peuvent alors être prévus pour traiter les cas des plans de bits manquants. Une variante intéressante consiste à prévoir alors une amplitude maximale de composante du vecteur Y et fixer un même nombre K de plans pour toutes les trames (donc pour tous les vecteurs Y successifs), sans avoir à transmettre le nombre K.

Tel est le cas par exemple du codage selon la norme G.711 qui associe à chaque échantillon du signal de parole un indice scalaire de huit bits incluant un bit de signe et K=I bits représentant une amplitude. Le train binaire du codage G.711 d'une trame de N échantillons donne donc implicitement une décomposition en K=I plans de bits avec un plan supplémentaire de bits de signe. Dans l'exemple du codage G.711, en général, les premiers plans les plus significatifs P₆ P₅ ... P₄ (0 ≤ k ≤ 6) de beaucoup de trames sont tous nuls. Cette particularité s'observe notamment pour des trames "inactives" (sans parole, avec uniquement du silence ou du bruit ambiant), mais aussi pour certaines trames de signaux de parole de niveau "nominal" (-26 dBov) ou "faible" (-36 dBov).

L'invention peut ainsi exploiter la connaissance a priori du nombre fixe K de plans de bits. Selon cette variante et toujours dans l'exemple du codage G.711, les premiers plans les plus significatifs (P₆ P₅ ... P_k ) qui sont nuls sont d'abord identifiés et ces plans ne sont tout simplement pas codés. Seuls les plans inférieurs P₄^ ... P₀ sont codés, comme décrit précédemment, mais sans transmettre le nombre K, et avant de terminer le codage arithmétique, le symbole « EoP » peut être finalement appliqué dans le contexte 0. Au décodeur, la réception du symbole « EoP » permet de conclure que les plans P_4-1 ... P₀ décodés jusqu'ici sont en fait les seuls plans codés car les K-k = 1-k plans manquants ne sont que des plans nuls qui correspondent aux premiers plans les plus significatifs P₆ P₅ ... P₄ , 0 ≤ k ≤ 6.

Cette réalisation suppose alors que le nombre de plans K est fixe. Elle est particulièrement avantageuse si suffisamment de premiers plans les plus significatifs ( P₆ P₅ ... P₄ , 0 ≤ k ≤ 6) sont nuls. Cette réalisation pourrait faire l'objet d'une protection séparée.

Claims

REVENDICATIONS

1. Procédé de codage d'un signal numérique par plans de bits, dans lequel les composantes entières d'un vecteur à coder et représentant le signal numérique sont décomposées en représentation binaire dans une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), caractérisé en ce que le codage du plan des bits les plus significatifs (MSB) est effectué, en affectant :

- un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles ("+", "-") pour représenter un nombre de zéros successifs en binaire dans un plan, et deux autres valeurs (« 0 », « 1 ») pour coder le signe d'un bit significatif, et en ce que le codage des plans de bits suivants jusqu'au plan des bits les moins significatifs (LSB) s'effectue selon les étapes suivantes: - identification des bits nuls dans les plans déjà codés et extraction des bits de mêmes positions dans un plan courant à coder pour former une partie non significative^"⁰"^ ),

- identification des bits non nuls dans les plans déjà codés et extraction des bits de mêmes positions dans le plan courant à coder pour former une partie significative (P^ ),

- codage des bits de la partie non significative en utilisant le premier type de symbole, et

- codage des bits de la partie significative en utilisant un deuxième type de symbole (« 0 », « 1 ») pour coder la valeur des bits dans la partie significative.

2. Procédé selon la revendication 1, caractérisé en ce que le premier type de symbole comporte en outre au moins une valeur supplémentaire possible de symbole (« EoP ») pour indiquer qu'une suite de zéros commence ou termine un plan à coder.

3. Procédé selon la revendication 1, caractérisé en ce que les bits extraits formant la partie significative sont transmis tels quels à un décodeur par ordre de position dans ledit plan courant.

4. Procédé de décodage par plans de bits, pour reconstruire les composantes entières d'un vecteur qui ont été codées par décomposition binaire, selon une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), caractérisé en ce que les plans sont décodés par ordre du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), et en ce que pour reconstruire le plan des bits les plus significatifs: un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles ("+", "-") pour indiquer un nombre de zéros successifs en binaire du plan à reconstruire, et deux autres valeurs (« 0 », « 1 ») pour indiquer, en binaire, le signe du bit le plus significatif d'une composante à reconstruire, est utilisé pour insérer des zéros dans le plan à reconstruire et pour identifier le signe du bit le plus significatif d'une composante à reconstruire; et pour reconstruire les plans de bits suivants jusqu'au plan des bits les moins significatifs, le procédé comporte les étapes suivantes: - identification des bits nuls dans les plans déjà décodés et extraction des bits de mêmes positions dans un plan courant à décoder pour former une partie non significative^"⁰"^ ),

- identification des bits non nuls dans les plans déjà décodés et extraction des bits de mêmes positions dans le plan courant à décoder pour former une partie significative (P^*w ), décodage des bits de la partie non significative en utilisant le premier type de symbole, et décodage des bits de la partie significative en utilisant un deuxième type de symbole (« 0 », « 1 ») pour décoder la valeur des bits dans la partie significative.

5. Procédé selon la revendication 4, caractérisé en ce que le premier type de symbole comporte en outre au moins une valeur supplémentaire possible de symbole (« EoP ») pour indiquer qu'une suite de zéros commence ou termine un plan à reconstruire.

6. Dispositif de codage d'un signal numérique par plans de bits, comportant un module encodeur apte à coder les composantes entières d'un vecteur représentant le signal numérique en les décomposant en représentation binaire dans une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), caractérisé en ce que ledit module (608) est agencé en outre pour coder le plan des bits les plus significatifs, en affectant :

- un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles ("+", "-") pour représenter un nombre de zéros successifs en binaire dans un plan, et deux autres valeurs (« 0 », « 1 ») pour coder le signe d'un bit significatif, et pour coder les plans de bits suivants jusqu'au plan des bits les moins significatifs en exécutant les étapes suivantes:

- identification des bits nuls dans les plans déjà codés et extraction des bits de mêmes positions dans un plan courant à coder pour former une partie non significative^"⁰"^ ),

- identification des bits non nuls dans les plans déjà codés et extraction des bits de mêmes positions dans le plan courant à coder pour former une partie significative

7. Dispositif de décodage par plans de bits, comportant un module de décodage pour reconstruire un vecteur dont les composantes entières ont été codées par décomposition binaire, selon une succession de plans de bits, du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), caractérisé en ce que ledit module (703) est agencé en outre pour décoder les plans par ordre du plan des bits les plus significatifs (MSB) au plan des bits les moins significatifs (LSB), le dit module étant agencé pour reconstruire le plan des bits les plus significatifs à partir: - d'un premier type de symbole de codage comportant au moins deux valeurs possibles de symboles ("+", "-") pour indiquer un nombre de zéros successifs en binaire du plan à reconstruire, et deux autres valeurs(« 0 », « 1 ») pour indiquer, en binaire, le signe du bit le plus significatif d'une composante à reconstruire, pour insérer des zéros dans le plan à reconstruire et pour identifier le signe du bit le plus significatif d'une composante à reconstruire; et pour reconstruire les plans de bits suivants jusqu'au plan des bits les moins significatifs, ledit module est agencé pour:

- identifier les bits nuls dans les plans déjà décodés et extraire les bits de mêmes positions dans un plan courant à décoder pour former une partie non significative (P_t ^B0MW ),

- identifier les bits non nuls dans les plans déjà décodés et extraire les bits de mêmes positions dans le plan courant à décoder pour former une partie significative (P^ ), décoder les bits de la partie non significative en utilisant le premier type de symbole, et - décoder les bits de la partie significative en utilisant un deuxième type de symbole (« 0 », « 1 ») pour décoder la valeur des bits dans la partie significative.

8. Programme informatique destiné à être stocké en mémoire d'un dispositif de codage, caractérisé en ce qu'il comporte des instructions pour la mise en œuvre du procédé selon l'une des revendications 1 à 3 lorsqu'elles sont exécutées par un tel dispositif de codage.

9. Programme informatique destiné à être stocké en mémoire d'un dispositif de i décodage, caractérisé en ce qu'il comporte des instructions pour la mise en œuvre du procédé selon l'une des revendications 4 à 5 lorsqu'elles sont exécutées par un tel dispositif de décodage.