EP1989707A2

EP1989707A2 - Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants

Info

Publication number: EP1989707A2
Application number: EP07731606A
Authority: EP
Inventors: Balazs Kovesi; Stéphane RAGOT
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2006-02-24
Filing date: 2007-02-13
Publication date: 2008-11-12
Also published as: WO2007096551A2; RU2008137987A; JP5235684B2; US8315880B2; CN101390158A; KR101364979B1; JP2009527785A; KR20080107428A; WO2007096551A3; MX2008010836A; BRPI0708267A2; CN101390158B; US20090030678A1; RU2420816C2

Abstract

Module (402) de codage binaire d'une enveloppe d'un signal, comprenant un module (502) de codage d'un premier mode à longueur variable. Selon l'invention, le module de codage d'un premier mode intègre un détecteur de saturation d'enveloppe et ledit module (402) de codage comprend également un deuxième module (503) de codage d'un second mode, disposé en parallèle au module (502) de codage du premier mode, et un sélecteur (504) de mode apte à retenir un des deux modes de codage, en fonction d'un critère de longueur de code et du résultat issu du détecteur de saturation d'enveloppe. Application au codage par transformée de signaux audio-fréquences.

Description

PROCEDE DE CODAGE BINAIRE D'INDICES DE QUANTIFICATION D'UNE

ENVELOPPE D'UN SIGNAL, PROCEDE DE DECODAGE D'UNE ENVELOPPE D'UN SIGNAL ET MODULES DE CODAGE ET DECODAGE

CORRESPONDANTS

L'invention concerne un procédé de codage binaire d'indices de quantification décrivant une enveloppe d'un signal. Elle concerne également un module de codage binaire pour la mise en œuvre dudit procédé. L'invention concerne en outre un procédé et un module de décodage d'une enveloppe codée au moyen du procédé et du module de codage binaire selon l'invention.

L'invention trouve une application particulièrement avantageuse dans le domaine de la transmission et du stockage de signaux numériques, tels que les signaux audio-fréquences de parole, de musique, etc.. Le procédé et le module de codage selon l'invention sont plus spécialement adaptés au codage par transformée des signaux audio-fréquences.

Différentes techniques existent aujourd'hui pour convertir sous forme numérique et pour compresser un signal audio-fréquences de parole, de musique, etc. Les méthodes les plus courantes sont :

- les méthodes de « codage de forme d'onde », telles que le codage MIC ou MICDA (PCM ou ADPCM en anglais),

- les méthodes de « codage paramétrique par analyse par synthèse » comme le codage CELP (« Code Excited Linear Prédiction »),

- les méthodes de « codage perceptuel en sous-bandes ou par transformée ».

Ces techniques classiques de codage de signaux audio-fréquences sont décrites par exemple dans WB. Kleijn and K.K. Paliwal Editors, Speech Coding and Synthesis, Elsevier, 1995.

Comme cela a été mentionné plus haut, l'invention s'intéresse essentiellement aux techniques de codage par transformée.

La norme UIT-T G.722.1 (ITU-T G.722.1 Recommandation, Coding at 24 and 32 kbit/s for hand-free opération in Systems with low frame loss, September 1999) décrit un codeur par transformée destiné à compresser les signaux audio, parole ou musique, dans une bande passante de 50-7000 Hz, dite bande élargie, à la fréquence d'échantillonnage de 16 kHz et à un débit de 24 ou 32 kbit/s. La figure 1 donne le schéma de codage associé, tel que fourni par la norme précitée.

Comme le montre cette figure, le codeur G.722.1 est basé sur la transformée MLT. La longueur de trame est de 20 ms et contient Λ/=320 échantillons.

La transformée MLT, ou transformation modulée avec recouvrement de Malvar, est une variante de la méthode de transformation connue sous le nom de MDCT (« Modified Discrète Cosine Transform »).

Sur la figure 2, on a représenté succinctement le principe d'une transformation MDCT.

La MDCT X(m) d'un signal x(n) de longueur L=2N comprenant les échantillons de la trame courante et de la trame future est définie comme :

X(m) = Lc(n)

OU m = 0,..., N-I. Dans la formule ci-dessus, le terme en sinus correspond au fenêtrage illustré à la figure 2. Le calcul de X(m) correspond donc à la projection de x(n) sur une base de cosinus locale avec fenêtrage sinusoïdal. Des algorithmes rapides de calcul de la MDCT existent (voir par exemple l'article de P.

Duhamel, Y. Mahieux, J. P. Petit, A fast algorithm for the implementation of filter banks based on time domain aliasing cancellation, ICASSP, vol. 3, pp.2209-2212, 1991 ).

Pour le calcul de l'enveloppe spectrale de la transformée, les valeurs

X(O),...,X(N-I) issus de la MDCT sont regroupées en 16 sous-bandes de 20 coefficients. Seules les 14 premières sous-bandes (14x20=280 coefficients) sont quantifiées et codées, correspondant à la bande de fréquence 0-7000 Hz, la bande 7000-8000 (40 coefficients) étant ignorée par mise à zéro.

La valeur de l'enveloppe spectrale pour la j-ème sous-bande est définie dans le domaine logarithmique comme :

où ; = 0,..., 13, le terme ε servant à éviter Iog₂(0). Cette enveloppe correspond donc à la valeur efficace (« root mean square » ou rms en anglais) par sous- bande.

L'enveloppe spectrale est ensuite quantifiée de la manière suivante. L'ensemble des valeurs

\og_rms = {\og_rms(0) \og_rms(l).. Λog_rms(13)} est d'abord arrondi à : rms_index = {rms_index(0) rms_index(l) ... rms_index(13)} où les indices rmsjndex(j) sont les arrondis à l'entier le plus proche de \og_rms(j)xO,5 pour; = 0,..., 13.

Le pas de quantification est donc de 20 x logio(2⁰'⁵) = 3,0103... dB. Les valeurs obtenues sont bornées :

3 < rmsjndex(θ) ≤ 33 (dynamique 31 x 3,01 = 93,31 dB) pour; = 0 et -6 < rmsjndex(j) ≤ 33 (dynamique 40 x 3,01 = 120,4 dB) pour; = 1,..., 13 Les rmsjndex des 13 dernières bandes sont ensuite transformés en indices différentiels en calculant la différence des valeurs efficaces rms de l'enveloppe spectrale d'une sous-bande et la précédente : diff_rms_index(j) = rms_index(j) - rms_index(j-l) pour; = 1,..., 13 Ces indices différentiels sont également bornés : -12 ≤ diff_rms_index(j) ≤ 11 ; pour; = 1,..., 13

Dans la suite, on désignera par « gamme d'indices de quantification » l'intervalle des indices pouvant être représentés par le codage binaire. Dans le codeur G.722.1 , la gamme d'indices différentiels est limitée à l'intervalle [-

11 ,12]. Ainsi, la gamme du codeur G.722.1 est dite « suffisante » pour coder les écarts entre rmsjndex(j) et rms_index(j-l) si

-12 ≤ rms_index(j) - rms_index(j-l) ≤ 11 Autrement, la gamme du codeur G.722.1 est dite « insuffisante ». Ainsi, le codage d'enveloppe spectrale est en saturation dès que l'écart de rms entre deux sous-bandes adjacentes dépasse 12 x 3,01 = 36,12 dB. L'indice de quantification rmsjndex(θ) est transmis dans le codeur G.722.1 sur 5 bits. Les indices de quantification différentiels diff_rms_index(j) (j = 1,..., 13) sont codés par codage de Huffman, chaque variable ayant sa propre table de Huffman. Il s'agit donc d'un codage entropique de longueur variable qui a pour principe d'affecter un code court en terme de bits aux valeurs d'indice différentiel les plus probables, les valeurs d'indice de quantification différentiel les moins probables ayant un code plus long. Ce type de codage est très efficace en terme de débit moyen, on rappelle que le nombre de bits total utilisé pour coder l'enveloppe spectrale dans le codeur G.722.1 est d'environ 50 bits en moyenne. Cependant, comme on le verra ci- après, le pire cas n'est pas contrôlé.

Le tableau de la figure 3 donne pour chaque sous-bande la longueur du plus court code (Min), donc celui de la valeur la plus probable (meilleur cas), et du plus long code (Max), à savoir celui de la valeur la moins probable (pire cas). On remarquera sur ce tableau que la première sous-bande (j = 0) a une longueur fixe de 5 bits, contrairement aux sous-bandes suivantes.

Avec ces valeurs de longueur de code, on voit que dans le meilleur cas l'encodage de l'enveloppe spectrale demande 39 bits (1 ,95 kbit/s), mais que le pire cas théorique est de 190 bits (9,5 kbit/s). Dans le codeur G.722.1 , les bits restant après le codage des indices de quantification de l'enveloppe spectrale sont ensuite distribués pour coder les coefficients MDCT normalisés par l'enveloppe quantifiée. L'allocation des bits parmi les sous-bandes est effectuée par un processus de catégorisation qui n'est pas lié à la présente invention et ne sera pas détaillé ici. Le reste du codage G.722.1 n'est pas non plus détaillé pour la même raison.

Le codage de l'enveloppe spectrale MDCT dans le codeur G.722.1 présente un certain nombre d'inconvénients.

En effet, comme on vient de le voir, le codage à longueur variable peut conduire à utiliser un nombre de bits très grand pour le codage de l'enveloppe spectrale dans les pires cas. D'autre part, il a été signalé plus haut le risque de saturation pour certains signaux à forte disparité spectrale, comme par exemple les sinusoïdes isolées, le codage différentiel ne fonctionnant pas car, dans ces cas, la plage de +/-36,12 dB ne peut pas représenter toute la dynamique des différences entre les valeurs de rms.

Aussi, un problème technique à résoudre par l'objet de la présente invention est de proposer un procédé de codage binaire d'indices de quantification décrivant une enveloppe d'un signal, comprenant une étape de codage à longueur variable, qui permettrait de minimiser la longueur de codage à un nombre de bits limité, même dans les pires cas.

Par ailleurs, un autre problème à résoudre par l'invention concerne la gestion des risques de saturation pour des signaux présentant de fortes valeurs efficaces, comme les sinusoïdes.

La solution à ce problème technique consiste, selon la présente invention, en ce que ledit procédé comprenant un premier mode de codage à longueur variable est tel que le premier mode de codage intègre une détection de saturation d'enveloppe, et en ce que ledit procédé comprend également un second mode de codage, effectué parallèlement au premier mode de codage et une sélection retenant un des deux modes de codage en fonction d'un critère de longueur de code et du résultat de la détection de saturation d'enveloppe du premier mode de codage.

Ainsi, le procédé conforme à l'invention repose sur la mise en concurrence de deux modes de codage dont au moins un à longueur variable, de manière à pouvoir choisir le mode conduisant au nombre de bits de codage le plus faible, notamment dans les pires cas, c'est à dire pour les valeurs de rms les moins probables.

De plus, lorsque l'un des modes de codage conduit à une saturation de la valeur efficace d'une sous-bande, l'autre mode est « forcé » et devient prioritaire, même s'il conduit à une longueur de codage plus grande.

Dans un mode préféré de réalisation, la sélection est telle que le second mode de codage est retenu si au moins une des conditions suivantes est vérifiée: - la longueur de code du second mode de codage est plus courte que la longueur de code du premier mode de codage;

- la détection de saturation d'enveloppe du premier mode de codage indique une saturation. L'invention concerne également un module de codage binaire d'une enveloppe d'un signal, comprenant un module de codage d'un premier mode à longueur variable, remarquable en ce que le module de codage d'un premier mode intègre un détecteur de saturation d'enveloppe et en ce que ledit module de codage comprend également un deuxième module de codage d'un second mode, disposé en parallèle au module de codage du premier mode, et un sélecteur de mode apte à retenir un des deux modes de codage, en fonction d'un critère de longueur de code et du résultat issu du détecteur de saturation d'enveloppe. En plus de sélectionner le codage le plus approprié, ledit sélecteur de mode est apte à générer un indicateur du mode de codage retenu, afin d'indiquer au décodeur en aval quel mode de décodage il doit appliquer.

L'invention concerne en outre un procédé de décodage d'une enveloppe d'un signal, ladite enveloppe étant codée au moyen du procédé de codage binaire selon l'invention, remarquable en ce que ledit procédé de décodage comprend une étape de détection dudit indicateur du mode codage retenu et une étape de décodage selon le codage retenu. L'invention concerne encore un module de décodage d'une enveloppe d'un signal, ladite enveloppe étant codée au moyen du module de codage binaire selon l'invention, ledit module de décodage comprenant un module de décodage d'un premier mode à longueur variable, remarquable en ce que ledit module de décodage comprend également un deuxième module de décodage d'un second mode, disposé en parallèle audit module de décodage du premier mode à longueur variable, et un détecteur de mode apte à détecter ledit indicateur du mode de codage et à activer le module de décodage correspondant à l'indicateur détecté.

Enfin, l'invention concerne un programme comprenant des instructions enregistrées sur un support lisible par un ordinateur pour mettre en œuvre les étapes du procédé selon l'invention. La description qui va suivre en regard des dessins annexés, donnés à titre d'exemples non limitatifs, fera bien comprendre en quoi consiste l'invention et comment elle peut être réalisée.

La figure 1 est un schéma d'un codeur conforme à la norme G.722.1. La figure 2 représente le schéma d'une transformation de type DMCT.

La figure 3 est un tableau de la longueur minimale (Min) et maximale (Max) en bits des codes dans chaque sous-bande dans un codage de Huffman pour le codeur de la figure 1. La figure 4 est un schéma d'un codeur audio hiérarchique incluant un codeur MDCT mettant en œuvre l'invention.

La figure 5 est un schéma détaillé du codeur MDCT de la figure 4.

La figure 6 est un schéma du module de codage d'enveloppe spectrale du codeur MDCT de la figure 5. La figure 7 donne un tableau (a) définissant la découpe du spectre

MDCT en 18 sous-bandes et un tableau (b) donnant la taille des sous-bandes.

La figure 8 est un tableau donnant un exemple de codes de Huffman pour représenter les indices différentiels.

La figure 9 est un schéma d'un décodeur audio hiérarchique incluant un décodeur MDCT mettant en œuvre l'invention.

La figure 10 est un schéma détaillé du décodeur MDCT de la figure 9.

La figure 11 est un schéma du module de décodage d'enveloppe spectrale du décodeur MDCT de la figure 10.

L'invention va maintenant être décrite dans le cadre d'un codeur audio hiérarchique de 8 à 32 kbit/s d'un type particulier. Cependant, il doit être bien entendu que les procédés et les modules de codage et décodage binaires d'enveloppe spectrale conformes à l'invention ne sont pas limités à ce type de codeur et qu'ils peuvent s'appliquer à tout codage binaire d'enveloppe spectrale décrivant l'énergie en sous-bandes d'un signal. Comme le montre la figure 4, le signal d'entrée du codeur hiérarchique en bande élargie, échantillonné à 16 kHz, est d'abord décomposé en deux sous-bandes par filtrage miroir en quadrature QMF (« Quadrature Mirror Filter »). La bande basse de 0 à 4000 Hz est obtenue par filtrage passe-bas 300 et décimation 301 , et la bande haute de 4000 à 8000 Hz par filtrage passe-haut 302 et décimation 303. Dans un mode de réalisation préféré, les filtres 300 et 302 sont de longueur 64 et sont conformes à ceux décrits dans l'article de J. Johnston, A filter family designed for use in quadrature mirror filter banks, ICASSP. vol. 5, pp. 291 - 294, 1980. La bande basse est pré-traitée par un filtre passe-haut 304 éliminant les composantes en dessous de 50 Hz avant codage CELP 305 en bande étroite 50-4000 Hz. Le filtrage passe-haut tient compte du fait que la bande élargie est définie comme la bande 50-7000 Hz. Dans le mode de réalisation décrit, le codage CELP 305 en bande étroite utilisé correspond à un codage CELP en cascade comprenant comme premier étage un codage G.729 modifié (ITU-T G.729 Recommandation, Coding of Speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prédiction (CS-ACELP), March 1996) sans filtre de pré-traitement, et, comme deuxième étage, un dictionnaire fixe supplémentaire. Le signal d'erreur du codage CELP est calculé par le soustracteur 306 et pondéré perceptuellement par un filtre W_NB(Z) 307 pour obtenir le signal .v_/(, Ce signal est analysé par transformée discrète en cosinus modifiée MDCT 308 pour obtenir le spectre transformé discret Xy.

La bande haute est d'abord dépliée spectralement 309 pour compenser le repliement dû au filtre QMF H 302, puis pré-traitée par un filtre passe-bas 310 éliminant les composantes entre 7000 et 8000 Hz dans le signal original. Le signal résultant χ_h; est transformé par MDCT 311 pour obtenir le spectre transformé discret X_hi. Une extension de bande 312 est réalisée à partir de x_hi e\ X_hi. Comme cela a déjà été expliqué en regard de la figure 2, les signaux ΛV,, et xu sont découpés en trames de N échantillons et la transformée MDCT de longueur L = 2N analyse les trames courante et future. Dans un mode de réalisation préféré, x_to et x_M sont des signaux en bande étroite échantillonnés à 8 kHz et N = 160, soit 20 ms. Les transformées MDCT Xy et X_M comprennent donc N = 160 coefficients ; chaque coefficient représente alors une bande fréquentielle de 4000/160 = 25 Hz. Dans un mode de réalisation préféré, la transformation MDCT est implantée au moyen de l'algorithme décrit dans l'article de P. Duhamel, Y. Mahieux, J. P. Petit, A fast algorithm for the implementation of filter banks based on lime domain aliasing cancellation', ICASSP, vol. 3, pp.2209-2212, 1991.

Les transformées MDCT en bande basse et bande haute Xy et X_M sont codés dans le codeur MDCT 313. L'invention se rapporte plus précisément à ce codeur. Les différents flux binaires générés par les modules de codage 305, 312 et 313 sont multiplexes et structurés en un train binaire hiérarchique dans le multiplexeur 314. Le codage est réalisé par blocs d'échantillons, ou trames, de

20 ms, soit 320 échantillons. Le débit de codage est de 8, 12, ou entre 14 et 32 kbit/s par pas de 2 kbit/s.

Le codeur MDCT 313 va être décrit en détail en référence à la figure 5.

Les transformées MDCT des bandes basse et haute sont d'abord combinées dans le bloc de fusion 400. Ainsi, les coefficients

Xio = {Xio(0) Xι_o(l) ... Xo(N-I)J et X_hi = (X_hi(0) X_hi(l) ... XM(N-I)) sont regroupés en un seul vecteur pour former un spectre transformé discret pleine bande :

X = (X(m) }_m=0..χ_i = (Xi₀(O) Xi₀(I) . .. X₁₀(N-I) X_hl(0) X_hl(l) . .. X_hl(N-l) }

Les coefficients X(O),...,X(L-I) de X issus de la MDCT sont regroupés en K sous-bandes. La découpe en sous-bandes peut-être décrite par un tableau tabis = {tabis(O) tabis(l) ... tabis(K)} de K+1 éléments définissant les frontières des sous-bandes. La première sous-bande comprend alors les coefficients X(tabis(0)) à X(tabis( I)-I), tandis que la seconde sous-bande comprend les coefficients X(tabis(l)) à X(tabis(2)-1), etc.

Dans un mode de réalisation préféré, K=18, la découpe associée est spécifiée dans le tableau (a) de la figure 7.

L'enveloppe spectrale d'amplitude log_rm.s décrivant la répartition énergétique par sous-bandes est calculée 401 puis codée par le codeur d'enveloppe spectrale 402 pour obtenir les indices rmsjndex. Les bits sont alloués à chaque sous-bande 403 et une quantification vectorielle sphérique 404 est appliquée au spectre X. Dans un mode de réalisation préféré, l'allocation des bits correspond à la méthode exposée dans l'article de Y. Mahieux, J. P. Petit, Transform coding of audio signais at 64 kbit/s, IEEE GLOBECOM, pp. 518 - 522, vol.1 , 1990, et la quantification vectorielle sphérique est réalisée comme décrit la demande internationale PCT/FR04/00219.

Les bits issus du codage de l'enveloppe spectrale et de la quantification vectorielle des coefficients MDCT sont traités par le multiplexeur 314. On va maintenant décrire plus particulièrement le calcul et le codage d'enveloppe spectrale.

L'enveloppe spectrale log_rm,s dans le domaine logarithmique est définie pour la j-ème sous-bande comme :

tabιs n(jj++ln)-→l log_ rms(j) = -log X(m)² + ε nb_ coeff(j) _m=ta 'bιs(j)

où j=0...K-I et nb_coeff(j) = tabis(j+l)-tabis(j) est le nombre de coefficients dans la j-ème sous-bande. Le terme ε sert à éviter Iog₂(0). L'enveloppe spectrale correspond à la rms en dB de la j-ème sous-bande; il s'agit donc d'une enveloppe d'amplitude.

Dans un mode de réalisation préféré, la taille des sous-bandes nb_coeff(j) est donnée au tableau (b) de la figure 7. De plus, ε = 2^"24, ce qui implique log_rms(j) ≥ -12. Le codage de l'enveloppe spectrale par le codeur 402 est détaillé à la figure 6.

L'enveloppe log_rm.s dans le domaine logarithmique est d'abord arrondie à rms_index = {rms_index(0) rms_index(l) ... rms_index(K-l)} par quantification uniforme 500. Cette quantification est donnée simplement par : rmsJndexQ) = arrondi à l'entier le plus proche de \og_rms(j)xO,5 si rmsjndexφ < -11, rmsjndexφ = -11 si rmsJndexQ) > +20, rmsJndexQ) = +20

L'enveloppe spectrale est ainsi codée avec des pas logarithmiques uniformes de 20 x Iog-ι₀(2⁰'⁵) = 3,0103... dB. Le vecteur rmsjndex résultant contient des indices entiers compris entre -11 et +20 (soit 32 valeurs possibles). Ainsi, l'enveloppe spectrale est représentée avec une gamme dynamique de l'ordre de 32 x 3,01 = 96,31 dB.

L'enveloppe quantifiée rmsjndex est ensuite décomposée en deux sous-vecteurs par le bloc 501 : l'un rms_index_bb = {rmsjndex(θ) rmsjndex(l) ... rms_index(K_BB-l)} pour l'enveloppe en bande basse et l'autre mιs_index_bh =

{rms_index(K_BB) ... rmsJndex(K-l)} pour l'enveloppe en bande haute. Dans un mode de réalisation préféré, K = 18 et K_BB = 10; autrement dit, les 10 premières sous-bandes sont dans la bande basse (0-4000 Hz) tandis que les 8 dernières sont dans la bande haute (4000-7000 Hz).

L'enveloppe bande basse rms_index_bb est mise sous forme binaire par deux modules de codage 502 et 503 mis en compétition, à savoir un module de codage différentiel à longueur variable 502 et un module de codage à longueur fixe, dit "équiprobable", 503. Dans un mode de réalisation préféré, le module 502 est un module de codage de Huffman différentiel, et le module 503 un module de codage binaire naturel.

Le module de codage de Huffman différentiel 502 comprend deux étapes de codage qui sont détaillées ci-dessous :

- calcul des indices différentiels.

Les indices de quantification différentiels diffjndex(l) diff_index(2) ... diffjndex (K_BB-1) sont donnés par : saturjbb = 0 diff_index(j) = rms_index(j) — rms_index(j-l)

Si {diffjndex(j) < -12 ) ou {diffjndex(j) > +12 ), saturjbb = 1

L'indicateur binaire satur_bb permet de détecter les cas où diffjndex(j) n'est pas dans l'intervalle [-12, + 12]. Si satur_bb = 0, tous les éléments diffjndex(j) sont dans cet intervalle et donc la gamme d'indices du codage de Huffman différentiel est suffisante, autrement, l'un de ces éléments est inférieur à -12 ou supérieur à +12 et ladite gamme d'indices est alors insuffisante. L'indicateur satur_bb permet donc de détecter des saturations d'enveloppe spectrale par codage de Huffman différentiel de la bande basse.

Dans le cas où une saturation est détectée, on bascule sur le mode équiprobable de codage à longueur fixe. En effet, la gamme d'indices du mode équiprobable est de par sa conception toujours suffisante.

- conversion binaire du premier indice et codage de Huffman des indices différentiels :

* l'indice de quantification rmsjndex(θ) a une valeur entière comprise entre -11 et +20. Il est codé directement en binaire de longueur fixe sur 5 bits.

Ensuite, les indices de quantification différentiels diffjndex(j) pour j=l...K_BB-1 sont convertis sous forme binaire par codage de Huffman (à longueur variable). La table de Huffman utilisée est spécifiée dans le tableau de la figure 8.

* le nombre total de bits, bit_cntl_bb, issu de cette conversion binaire de rmsjndex(θ) et codage de Huffman des indices de quantification diffjndex(j) est variable.

* dans un mode de réalisation préféré, la longueur maximale d'un code de Huffman est de 14 bits et le codage de Huffman est appliqué à K_BB-1 = 9 indices différentiels de la bande basse. Donc, la valeur théorique maximale de bit_cntl_bb est 5 + 9x14 = 131 bits. Bien qu'il ne s'agisse que d'une valeur théorique, on observe que dans le pire cas le nombre de bits utilisés par le codage de l'enveloppe spectrale de la bande basse peut être très important; c'est précisément le rôle du codage « équiprobable » que de limiter le cas pire.

Le module de codage équiprobable 503 se résume à convertir directement sous forme binaire naturelle les éléments rmsjndex(θ) rmsjndex(l) ... rms_index(K_BB-l). Ceux-ci sont compris entre -11 et +20 et sont donc codés chacun sur 5 bits. Le nombre de bits nécessaire au codage équiprobable est donc simplement : bit_cnt2_bb = 5 * K_BB bits. Dans un mode de réalisation préféré, K_BB = 10, donc bit_cnt2_bb = 50 bits.

Le sélecteur de mode 504 choisit lequel des deux modules 502 ou 503, Huffman différentiel ou équiprobable, génère le nombre de bits le plus faible. Comme le mode Huffman différentiel sature les indices différentiels à +/-12, le mode équiprobable est aussi choisi dès qu'une saturation est détectée dans le calcul des indices de quantification différentiels. Ce procédé permet d'éviter les saturations d'enveloppe spectrale dès que l'écart des valeurs de rms entre deux bandes adjacentes dépasse 12 x 3,01 = 36,12 dB. La sélection de mode est spécifiée ci-dessous :

- si (saturjbb = 1 ) ou (bit_cnt2_bb < bit_cntl_bb), le mode équiprobable est choisi,

- sinon, le mode Huffman différentiel est choisi. Le sélecteur de mode 504 génère un bit qui indique le mode sélectionné entre les modes Huffman différentiel et équiprobable avec la convention suivante : 0 pour le mode Huffman différentiel, 1 pour le mode équiprobable. Ce bit est multiplexe aux autres bits générés par le codage de l'enveloppe spectrale dans le multiplexeur 510. De plus, le sélecteur de mode 504 actionne une bascule 505 qui permet de multiplexer dans le multiplexeur 314 les bits du mode de codage choisi.

L'enveloppe bande haute rms_index_bh subit un traitement identique au traitement de rms_index_bb : codage uniforme du premier indice log_rms(0) sur 5 bits par le module de codage équiprobable 507 et codage de Huffman des indices différentiels par le module de codage 506. La table de Huffman utilisée dans le module 506 est identique à celle du module 502. De même, le codage équiprobable 507 est identique à celui de bande basse 503. Le sélecteur de mode 508 génère un bit qui indique le mode sélectionné entre les codages de Huffman différentiel et équiprobable, et ce bit est multiplexe aux bits issus de la bascule 509 dans le multiplexeur 314. Le nombre de bits nécessaire au codage équiprobable de la bande haute est bit_cnt2_bh = (K-K_BB) x 5 ; dans le mode de réalisation préféré, K-K_BB = 8 donc bit_cnt2_bh = 40 bits. II est important de noter que dans le mode de réalisation préféré les bits associés à l'enveloppe de la bande haute sont multiplexes avant les bits associés à l'enveloppe de la bande basse. De cette façon, si une partie seulement de l'enveloppe spectrale codée est reçue au décodeur, l'enveloppe de la bande haute peut être décodée avant celle de la bande basse. Le décodeur audio hiérarchique associé au codeur qui vient d'être décrit est représenté à la figure 9. Les bits décrivant chaque trame de 20 ms sont démultiplexés dans le démultiplexeur 600. On présente ici le décodage qui fonctionne de 8 à 32 kbit/s. En pratique le flux binaire a pu être tronqué à 8, 12, 14 ou entre 14 et 32 kbit/s par pas de 2 kbit/s. Le flux binaire des couches à 8 et 12 kbit/s est utilisé par le décodeur

CELP 601 pour générer une première synthèse en bande étroite (0-4000 Hz). La portion du flux binaire associée à la couche à 14 kbit/s est décodé par le module d'extension de bande 602; le signal obtenu en bande haute (4000- 7000 Hz) est transformé par MDCT 603 en un signal transformé X_hl . Le décodage MDCT 604 est explicité à la figure 10 et discuté ci-après. Il génère à partir du flux binaire associé aux débits de 14 à 32 kbit/s un spectre reconstruit X₁₀ en bande basse et un spectre reconstruit X_hι en bande haute. Ces spectres sont ramenés à des signaux temporels x_l0 et x_hι par MDCT inverse dans les blocs 605 et 606. Le signal χ_;oest ajouté à la synthèse CELP 608 après filtrage perceptuel inverse 607, le résultat est ensuite postfiltré 609.

Le signal de sortie en bande élargie, échantillonné à 16 kHz, est obtenu par l'intermédiaire du banc de filtres QMF de synthèse qui comprend les opérations de sur-échantillonnage 610 et 612, filtrages passe-bas et passe- haut 611 et 613 et addition 614.

Le décodeur MDCT 604 est maintenant décrit en regard de la figure 10.

Les bits associés à ce module sont démultiplexés dans le démultiplexeur 600. L'enveloppe spectrale est d'abord décodée 701 pour obtenir les indices rmsjndex ainsi que l'enveloppe spectrale reconstruite en échelle linéaire mιs_q. Le module de décodage 701 est explicité à la figure 11 et détaillé ci-après. En l'absence d'erreur binaire et si tous les bits décrivant l'enveloppe spectrale sont bien reçus, les indices rmsjndex correspondent exactement à ceux qui sont calculés au codeur; cette propriété est essentielle car l'allocation des bits 702 doit disposer de la même information au codeur et au décodeur pour que les codeur et décodeur soient compatibles. Les coefficients MDCT normalisés sont décodés dans le bloc 703.

Les sous-bandes non-reçues ou non codées, car d'énergie trop faibles, sont remplacées par celles du spectre X_hι dans le module de substitution 704. Enfin, le module 705 applique l'enveloppe d'amplitude par sous-bandes aux coefficients fournis en sortie de module 704, et le spectre reconstruit X est séparé 706 en spectre reconstruit X_loen bande basse (0-4000 Hz) et spectre reconstruit X₁₀ en bande haute (4000-7000 Hz).

La figure 11 présente le fonctionnement du décodage de l'enveloppe spectrale. Les bits associés à l'enveloppe spectrale sont démultiplexés par le démultiplexeur 600.

Dans le mode de réalisation préféré, les bits associés à l'enveloppe spectrale de la bande haute sont transmis avant ceux de la bande basse. Ainsi, le décodage commence par la lecture dans le sélecteur de mode 801 de la valeur du bit de sélection de mode reçu du codeur, mode Huffman différentiel ou mode équiprobable. Le sélecteur 801 suit la même convention qu'au codage à savoir : 0 pour le mode Huffman différentiel, 1 pour le mode équiprobable. La valeur du bit permet d'actionner les bascules 802 et 805. Si le bit de sélection de mode est à O, un décodage de Huffman différentiel est réalisé par le module de décodage à longueur variable 803 : la valeur absolue rms_index(K_BB) comprise entre -11 et +20 et représentée sur 5 bits est d'abord décodée, puis les codes de Huffman associés aux indices de quantification différentiels diffjndex(j) pour j= K_BB..K-1 sont ensuite décodées. Les indices entiers rmsjndex(j) sont alors reconstruits par la relation

rms_index(j) = rms_index(j-l) + diff_index(j) pour j= K_BB.. K-I.

Si le bit de sélection de mode est à 1 , les valeurs de rmsjndex(j) comprises entre -11 et +20 et représentées sur 5 bits pour 7= K_BB..K-1 sont décodées successivement par le module de décodage à longueur fixe 804. Dans le cas où aucun code de Huffman n'a été trouvé, en mode 0, ou si le nombre de bits reçu est insuffisant pour réaliser le décodage complet de la bande haute, le décodage indique au décodeur MDCT qu'une erreur a eu lieu.

Les bits associés à la bande basse sont décodés de la même façon que ceux de la bande haute. On retrouve donc pour cette partie le sélecteur de mode 806, les bascules 807 et 810 et les modules de décodage 808 et 809.

L'enveloppe spectrale reconstruite en bande haute comprend les indices entiers rmsjndex(j) pour j= K_BB..K-1. Celle qui est reconstruite en bande basse comprend les indices entiers rmsjndex(j) pour 7= 0...K_BB-l. Ces indices sont regroupés en un seul vecteur rmsjndex = {rmsjndex(θ) rmsjndex(l) ... rmsJndex(K-l)} dans le bloc de fusion 811. Le vecteur rmsjndex représente l'enveloppe spectrale reconstruite sur une échelle logarithmique en base 2; l'enveloppe spectrale est convertie sur une échelle linéaire par le module de conversion 812, qui réalise l'opération suivante :

rms_q(j) = 2^msJndex<j)

OU j= 0,...,K-l.

Il est bien entendu que l'invention n'est pas limitée au seul mode de réalisation qui vient d'être décrit. En particulier, on notera que l'enveloppe codée par l'invention peut correspondre à l'enveloppe temporelle décrivant la valeur efficace rms par sous-trames d'un signal au lieu d'une enveloppe spectrale décrivant la valeur efficace par sous-trame.

De plus, l'étape de codage à longueur fixe mise en compétition avec le codage de Huffman différentiel peut être remplacée par une étape de codage à longueur variable, par exemple un codage de Hufman des indices de quantification au lieu de celui des indices différentiels. Le codage de Huffman peut également être remplacé par toute autre forme de codage sans perte, tel que codage arithmétique, codage de Tunstall, etc.

Claims

REVENDICATIONS

1. Procédé de codage binaire d'indices de quantification décrivant une enveloppe d'un signal, comprenant un premier mode de codage à longueur variable caractérisé en ce que le premier mode de codage intègre une détection de saturation d'enveloppe, et en ce que ledit procédé comprend également un second mode de codage, effectué parallèlement au premier mode de codage et une sélection retenant un des deux modes de codage en fonction d'un critère de longueur de code et du résultat de la détection de saturation d'enveloppe du premier mode de codage.

2. Procédé selon la revendication 1 , caractérisé en ce que la sélection est telle que le second mode de codage est retenu si au moins une des conditions suivantes est vérifiée:

- la longueur de code du second mode de codage est plus courte que la longueur de code du premier mode de codage;

- la détection de saturation d'enveloppe du premier mode de codage indique une saturation.

3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce que ledit procédé comprend également une étape de génération d'un indicateur du mode de codage retenu.

4. Procédé selon la revendication 3, caractérisé en ce que ledit indicateur est constitué par un bit unique.

5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit second mode de codage est un codage binaire naturel à longueur fixe.

6. Procédé selon l'une quelconque des revendications 1 à 5, caractérisé en ce que ledit premier mode de codage à longueur variable est un codage différentiel à longueur variable.

7. Procédé selon l'une quelconque de revendications 1 à 6, caractérisé en ce que ledit premier mode de codage à longueur variable est un codage de Huffman différentiel.

8. Procédé selon l'une quelconque des revendications 1 à 7, caractérisé en ce que lesdits indices de quantification sont obtenus par quantification scalaire d'une enveloppe fréquentielle décrivant l'énergie en sous-bandes dudit signal.

9. Procédé selon l'une quelconque des revendications 1 à 7, caractérisé en ce que lesdits indices de quantification sont obtenus par quantification scalaire d'une enveloppe temporelle décrivant l'énergie en sous-trames dudit signal.

10. Procédé selon l'une des revendications 8 ou 9, caractérisé en ce que la première sous-bande ou sous-trame est codée selon un codage à longueur fixe, et en ce que l'énergie différentielle d'une sous-bande ou sous-trame par rapport à la précédente est codée selon le codage à longueur variable.

1 1. Procédé de décodage d'une enveloppe d'un signal, ladite enveloppe étant codée au moyen du procédé de codage binaire selon l'une quelconque des revendications 2 à 10, caractérisé en ce que ledit procédé de décodage comprend une étape de détection dudit indicateur du mode de codage retenu et une étape de décodage selon le mode de codage retenu.

12. Module (402) de codage binaire d'une enveloppe d'un signal, comprenant un module (502) de codage d'un premier mode à longueur variable, caractérisé en ce que le module de codage d'un premier mode intègre un détecteur de saturation d'enveloppe et en ce que ledit module (402) de codage comprend également un deuxième module (503) de codage d'un second mode, disposé en parallèle au module (502) de codage du premier mode, et un sélecteur (504) de mode apte à retenir un des deux modes de codage, en fonction d'un critère de longueur de code et du résultat issu du détecteur de saturation d'enveloppe.

13. Module selon la revendication 12, caractérisé en ce que ledit sélecteur (504) de mode est apte à générer un indicateur du mode de codage retenu.

14. Module (701 ) de décodage d'une enveloppe d'un signal, ladite enveloppe étant codée au moyen du module de codage binaire selon la revendication 13, ledit module de décodage comprenant un module (808) de décodage d'un premier mode à longueur variable, caractérisé en ce que ledit module (701 ) de décodage comprend également un deuxième module (809) de décodage d'un second mode, disposé en parallèle audit module (808) de décodage du premier mode, et un détecteur (806) de mode apte à détecter ledit indicateur du mode de codage et à activer le module (808, 809) de décodage correspondant à l'indicateur détecté.

15. Application du procédé de codage selon l'une quelconque des revendications 1 à 10 et du module de codage selon l'une quelconque des revendications 12 à 13 au codage par transformée de signaux audiofréquences.

16. Application selon la revendication 15, caractérisée en ce que ladite transformée est une transformée MDCT.

17. Programme comprenant des instructions enregistrées sur un support lisible par un ordinateur pour mettre en œuvre les étapes du procédé selon les revendications 1 à 10, lorsque ledit programme est exécuté sur un ordinateur.