WO1997009711A1

WO1997009711A1 - Procede de quantification vectorielle de vocodeurs bas debit

Info

Publication number: WO1997009711A1
Application number: PCT/FR1996/001347
Authority: WO
Inventors: Pierre André LAURENT
Original assignee: Thomson-Csf
Priority date: 1995-09-05
Filing date: 1996-09-04
Publication date: 1997-03-13
Also published as: US6016469A; FR2738383B1; EP0850470B1; FR2738383A1; DE69602963T2; DE69602963D1; EP0850470A1

Abstract

Le procédé consiste à déterminer le domaine du codage en entourant par une enveloppe le nuage des points de la matrice d'autocorrélation des coefficients de réflexion (Ki, LARi) du filtre de modélisation du conduit vocal, à déterminer (3) les axes principaux du volume de points intérieurs à l'enveloppe, à projeter (4) les coefficients de la matrice d'autocorrélation sur les axes principaux, à découper le volume intérieur de l'enveloppe en volumes élémentaires et à coder les coefficients résultats de la projection en fonction de leurs coordonnées dans l'espace défini par les axes principaux du volume des points intérieurs à l'enveloppe en n'attribuant comme valeurs de codes que celles correspondant aux emplacements des volumes élémentaires dans lesquels ils se trouvent. Application: vocodeurs à prédiction linéaire.

Description

Procédé de quantification vectorielle de vocodeurs bas débit.

La présente invention concerne un procédé de quantification vectorielle de vocodeurs bas débit.

Elle s'applique notamment aux vocodeurs à prédiction linéaire, similaires à ceux décrits par exemple dans la Revue Technique THOMSON-CSF, volume

14, n° 3, septembre 1982, pages 715 à 731 , suivant lesquels le signal de parole est identifié à la sortie d'un filtre numérique dont l'entrée reçoit, soit une forme d'onde périodique correspondant à celles des sons voisés comme le sont les voyelles, soit une forme d'onde aléatoire correspondant à celles des sons non voisés comme le sont la plupart des consonnes.

II est connu que la qualité auditive des vocodeurs à prédiction linéaire dépend en grande partie de la précision avec laquelle leur filtre prédicteur est quantifié et que cette qualité diminue généralement lorsque le débit numérique entre vocodeurs diminue car la précision de quantification du filtre devient alors insuffisante. D'une manière générale le signal de parole est segmenté en trames indépendantes de durée constante et le filtre est renouvelé à chaque trame. Ainsi pour arriver à un débit d'environ 1820 bits par seconde, il faut, selon une réalisation standard normalisée, représenter le filtre par un paquet de 41 bits transmis toutes les 22,5 millisecondes. Pour des liaisons non standard à plus faible débit, de l'ordre de 800 bits par seconde, moins de 800 bits par seconde doivent être transmis pour représenter le filtre ce qui constitue approximativement un rapport de 3 en débit par rapport aux réalisation standards. 30 bits en moyenne sont utilisés pour quantifier un filtre sur deux, et ces 30 bits se décomposent en 3 bits définissant un schéma de quantification et 27 bits pour quantifier 10 quantités obtenues à partir de coefficients LAR

(abréviations anglo-saxonnes de Log Area Ratios) par déplacement et rotation dans l'espace à 10 dimensions ainsi défini. Le résultat est que la quantification commence à n'être plus qu'approximativement transparente, et qu'il faut compenser auditivement cet artefact en quantifiant grossièrement les filtres situés dans les transitions du signal de parole et finement ceux correspondant à des zones stables. Pour obtenir malgré tout une précision de quantification suffisante du filtre prédicteur l'approche classique consiste à mettre en oeuvre un schéma de quantification vectorielle intrinsèquement plus efficace que celui utilisé dans les systèmes standards où les 41 bits mis en oeuvre servent à quantifier scalairement les P = 10 coefficients de leur filtre de prédiction. La méthode repose sur l'utilisation d'un dictionnaire contenant un nombre déterminé de filtres standards obtenus par apprentissage. Elle consiste à transmettre uniquement la page ou l'index où se trouve le filtre standard le plus proche du filtre idéal. L'avantage est dans la réduction du débit binaire qui est obtenu, seulement 10 à 15 bits par filtre étant transmis au lieu des 41 bits nécessaires en mode de quantification scalaire, mais cette réduction de débit est obtenue au prix d'une très forte augmentation de la taille de mémoire nécessaire pour stocker les éléments du dictionnaire et d'une charge de calcul importante imputable à la complexité de l'algorithme de recherche des filtres.

En appliquant également cette approche aux vocodeurs à bas débit de 800 bits/s et moins, il est communément admis que 24 bits suffisent pour un dictionnaire composite produit de deux dictionnaires de 4 096 éléments prenant en compte les quatre premiers LSP et les six derniers respectivement.

L'inconvénient majeur de ce type de quantification réside encore dans la nécessité de constituer ce dictionnaire, de le stocker, et d'effectuer la quantification proprement dite.

Des alternatives au schéma de quantification vectorielle ont aussi été proposées pour réduire le nombre d'éléments stockés dans le dictionnaire. C'est ainsi qu'il est connu notamment une technique de quantification de vecteur pyramidal, dont une description peut être trouvée dans la revue IEEE trans. on INFTH vol. IT 32 n° 4 juillet 1986 pages 568 à 582 de M. Thomas R. FISCHER ayant pour titre " A pyramid vector quantizer". Suivant cette technique les données d'entrée multidimensionnelles sont réparties sur les sommets d'un réseau régulier inclus dans une pyramide de dimension multiple. Cette technique de quantification est appliquée principalement pour des données à caractéristique de répartition Laplaciennes. Mais la réduction en débit qui en résulte n'est toutefois pas suffisamment appréciable. Ceci est particulièrement dû au fait qu'en pratique la forme de l'ensemble des données multidimensionnelles à traiter est plutôt inscrite à l'intérieur d'un ellipsoïde, notamment lorsqu'il est utilisé un système de calcul à prédiction/extrapolation qui amène toujours une forme à caractéristique Gaussienne des données. D'autre part la pyramide qui est inscrite sur cet ellipsoïde amène à coder des points qui se trouvent à l'extérieur de l'ellipsoïde entourant le nuage de points à coder ce qui oblige à dimensionner les mots de code avec un nombre de bits qui va au delà de ce qui est strictement nécessaire.

Le but de l'invention est de pallier les inconvénients précités.

A cet effet, l'invention a pour objet un procédé de quantification vectorielle de vocodeurs bas débit caractérisé en ce qu'il consiste à déterminer le domaine du codage en entourant par une enveloppe le nuage des points de la matrice d'auto-corrélation des coefficients de réflexion du filtre de modélisation du conduit vocal , à déterminer les axes principaux du volume de points intérieurs à l'enveloppe , à projeter les coefficients de la matrice d'autocorrélation sur les axes principaux, à découper le volume intérieur de l'enveloppe en volumes élémentaires et à coder les coefficients résultats de la projection en fonction de leurs coordonnées dans l'espace défini par les axes principaux du volume des points intérieurs à l'enveloppe en n'attribuant comme valeurs de codes que celles correspondant aux emplacements des volumes élémentaires dans lesquels ils se trouvent.

L'invention a pour principal avantage qu'elle met en oeuvre un procédé de quantification des filtres de prédiction qui n'exige pratiquement pas plus d'éléments binaires pour quantifier les points représentatifs des filtres de prédiction qu'un procédé de quantification vectorielle à dictionnaire tout en restant de réalisation simple, rapide n'occupant qu'un espace mémoire réduit.

D'autres caractéristiques et avantages de l'invention apparaîtront ci-après à l'aide de la description qui suit faite en regard des figures des dessins annexés qui représentent :

La figure 1 un organigramme illustrant le procédé de codage de la parole mis en oeuvre par l'invention.

La figure 2 un espace vectoriel à deux dimensions figurant une répartition de coefficients d'aire dérivés des coefficients de réflexion modélisant le conduit vocal.

La figure 3 une illustration du procédé de codage selon l'invention dans un espace à trois dimensions.

Les figures 4 à 8b des exemples de répartition du codage de points dans un espace à trois dimensions obtenu par la mise en oeuvre du procédé selon l'invention.

Le procédé de codage selon l'invention consiste, après avoir découpé le signal de parole en trames de longueur constante d'environ 20 à 25 ms, comme ceci a lieu habituellement dans les vocodeurs, à déterminer et à coder les caractéristiques du signal de parole sur des trames successives en déterminant l'énergie du signal P fois par trame.

La synthèse du signal de parole sur chaque trame a lieu ensuite en procédant au détramage et au décodage des valeurs des caractéristiques codées du signal de parole.

Les étapes représentatives du procédé de codage selon l'invention qui sont représentées à la figure 1 consistent à calculer à l'étape 1 , après une étape non représentée d'échantillonnage du signal de parole SK sur chaque trame et- quantification des échantillons sur un nombre déterminé de bits suivit d'une préaccentuation de ces échantillons, les coefficients Kj d'un filtre de modélisation du conduit vocal à partir de coefficients d'autocorrélation Rj des échantillons Sf< suivant une relation de la forme

Ri = ∑S(k)-S(k+i) (1 ) k

Le calcul des coefficients Kj est effectué par exemple en appliquant l'algorithme connu de M. LEROUX-GUEGEN dont une description peut être trouvée dans l'article de la revue IEEE Transaction on Acoustics Speech, and

Signal Processing June 1977 ayant pour titre "A fixed point computation of partial corrélation coefficients". Ce calcul revient à inverser une matrice carrée dont les éléments sont les coefficients Rj de la relation (1 ). L'étape 2 suivante consiste à distordre de façon non linéaire les coefficients de réflexion en les transformant en coefficients d'aire notés LARj de l'abréviation anglo-saxonne LOG AREA RATIO par la relation

avec i = (1...P) de façon à calculer à l'étape 3 les vecteurs propres d'une matrice d'autocorrélation des coefficients LARj qui définissent dans l'espace à P dimensions les directions privilégiées d'un nuage de points dont les coordonnées sont les coefficients LARj avec i = 1 - P. A titre d'exemple, le nuage de points représenté à la figure 2 dans un espace à seulement deux dimensions fait apparaitre deux directions privilégiées symbolisées par les vecteurs propres

V-| et V₂.

En retournant à la figure 1 , l'étape 4 consiste à projeter les coefficients LAR sur les directions privilégiées en calculant par exemple des coefficients λj, représentant la somme des projections des coefficients (LARi - LAR ;) sur les vecteurs propres Vj à Vp de la matrice d'autocorrélation des coefficients LAR, par la relation λi = ∑ Vij(LARj - LÂR j) (3) j=l pour i = (1— p) dans laquelle Vj_ι j désigne les vecteurs propres et LAR ; est la valeur moyenne de chaque coefficient LARj de rang j.

Comme chacun des coefficients λj évolue entre une valeur minimale ^_λimax ^{et une} valeur maximale +λj_max, cette évolution rend possible l'approximation de la forme du nuage de points observé par un hyperellipsoïde dont les valeurs des demi-grands axes sont représentées par les coefficients λjmax Pour chacun des λj, il est alors effectué une quantification uniforme entre une valeur minimale λj_mj_nj et une valeur maximale λj_max avec un nombre de bits nj qui est calculé par les moyens classiques en fonction du nombre total N de bits utilisés pour quantifier le filtre et les pourcentages d'inertie correspondant aux vecteurs propres Vj.

La quantification des coefficients λj a lieu en utilisant une mesure de distance entre filtres dont la plus naturelle est la distance Eucledienne pondérée de la forme : p

DCFi.F^) = ∑yi(λ_{1ι i} - λ2,i)² (4) i=1 dans laquelle les coefficients γj sont fonction décroissante de leur rang i et sont ajustés expérimentalement.

De façon équivalente, sachant que les coefficients λj sont centrés autour du barycentre de l'hyperéllipsoïde, le même résultat peut aussi être obtenu en utilisant une mesure de distance purement Euclidienne portant sur les coefficients modifiés, telle que

P ²

D(Fi^,F₂) = ∑(μ_1ιj - μ2,i) avecμ_Kιj = λ_K,iVrî^" (⁵) i=1 Les points représentatifs des filtres de coordonnées μj , sont alors situés à l'intérieur d'un hyperellipsoïde de dimension P dont les P demi-grands axes valent respectivement μjmax avec μj_max = λj_max γj^{1 /2} . Dans ces conditions si chacune des coordonnées μj était quantifiée uniformément entre -μjmax ^{et +}l^Jimax _>'^e nombre de bits nécessaire serait alors égal au logarithme en base 2 du rapport entre lun volume paraUélépipédique (pavé) quantifiable et le volume d'un hypercube élémentaire selon la relation

NQ = l _n / l_n 2 (6)

Δ^P où Δ est le pas de quantification. Mais cette définition, conduit à représenter non seulement les points qui sont à l'intérieur de l'ellipsoïde mais également une multitude de points extérieurs. Par exemple, en dimension 3, cela conduit à représenter 2 fois plus de points qu'il n'est nécessaire. Cette inflation du nombre de points à coder croit d'autant plus que le nombre de dimensions de l'espace à considérer augmente.

En effet, en considérant le volume d'un ellipsoïde défini pour P pair par la relation

le nombre de bits Nj= strictement nécessaire est alors donné par

ce qui donne

Pour le cas d'un filtre de prédiction à P=10 coefficients cela représente une différence de -8,65 bits et montre qu'il suffit en principe de n'utiliser pour Nf£ que seulement 24 bits au lieu des 33 bits nécessaire pour quantifier les coefficients μj de façon indépendante.

Dans ces conditions il apparaît que le seul moyen de gagner effectivement les bits souhaités consiste à effectuer une quantification dans un espace qui est strictement limité à l'intérieur du volume utile, de l'ellipsoïde des points μj. Ceci est réalisé par l'invention grâce à l'exécution à l'étape 5 d'un algorithme qui permet de numéroter sans ambiguïté tous les points situés dans ce volume.

Pour la commodité du raisonnement on supposera dans ce qui suit que le volume des points est délimité par une enveloppe de forme ellipsoïde ou pyramidale, mais on concevra que le procédé de codage de l'invention qui est décrit vaut aussi pour des volumes d'enveloppe quelconque.

En supposant pour simplifier que l'espace des données à quantifier est un espace de dimension 3 (N=3) et que tous les points à l'intérieur d'un ellipsoïde d'axes orthonormés 2X, 2Y, 2Z peuvent être quantifiés avec un pas de quantification égal à l'unité, le procédé de quantification selon l'invention appliqué à cet espace consiste à associer un nombre unique à chaque ensemble de coordonnées entières xO, yO, zO vérifiant la relation :

Comme le montre la figure 3 cette association est réalisée en trois étapes. Une première étape consiste à parcourir l'axe des x et à calculer le nombre total de points situés dans les tranches de l'ellipsoïde qui lui sont perpendiculaires et coupant l'axe des x en des points pour lesquels x prend les valeurs entières successives -X , -X+1 ,..., x-2, x-1. La deuxième étape consiste à parcourir l'axe des y en ajoutant au résultat précédent la somme des nombres de points situés dans les tranches de l'ellipsoïde pour lesquelles l'abscisse vaut x et l'ordonnée vaut successivement -Y(x), -Y(x+1 ), .... y-2, y-1 où Y(x)≤Y et est la plus grandfe valeur pour laquelle le point de coordonnées (x Y(x), 0) est situé dans l'ellipsoïde ou sa surface. Enfin suivant la troisième étape, l'axe des z est parcouru en ajoutant au résultat précédent la somme des nombres de points situés dans les tranches pour lesquelles l'abscisse vaut x, l'ordonnée vaut y et l'altitude vaut successivement -Z(x,y), -Z(x,y)+1 ,..., z-2, z-1 où Z(x,y)<Z et est la plus grande valeur pour laquelle le point de coordonnées (x,y,Z(x,y) est situé dans l'ellipsoïde ou sa surface. Le résultat final donne le nombre exact de points s'étendant avant le point à quantifier, c'est-à-dire les points pour lesquels x ou y ou z est inférieur à xo, yo ou zo respectivement. Ce principe peut naturellement être étendu à des dimensions d'espace d'ordre quelconque. Pour un espace d'ordre N, les différents volumes de dimensions 2, 3,..., N-1 sont précalculés et mémorisés dans une mémoire morte. En généralisant ce principe à un ellipsoïde à N dimensions, et en désignant par A-| , A₂ ,..., AN les dimensions des demi- axes le volume intérieur à l'ellipsoïde est défini par la relation :

V_n

(H)

et l'équation de sa surface est définie par la relation :

En désignant par V_m(A) le volume d'une tranche à m dimensions (m< ou égal à

N) de l'ellipsoïde, dans laquelle la m'^eme coordonnée est comprise entre -A et +A celui-ci s'exprime par la relation : v _{Ï A Λ} f^A _ΛY f+βm.m-¹(A)A_m_₁ r+β_m l(A)Aι ^vm(A) = J ^J-A _Δ dXm J J-β _{R m}, _mm- ,l(/AA W)A_m_ ,ι ^dXm-l -J J-β _Rm, ,l(/AA Λ)AA ,ι ^dXl "⁴)

La relation (14) permet de déduire sans difficulté une relation de récurrence liant deux volumes de dimensions consécutives soit : ^

Le nombre de points à quantifier peut alors être obtenu à partir des relations précédentes en considérant par exemple que le pas de quantification vaut 1 et que les dimensions des axes Ai sont des entiers positifs. Cette détermination peut être obtenue en considérant successivement les points isolés (dimension 0), les séries de points contigus (dimension 1 ), puis en calculant itérativement les volumes de dimensions 2...N-1.

Un microprogramme permettant d'obtenir ce résultat est fourni en Annexe 1. L'algorithme de quantification selon l'invention est déduit de l'exemple précité en 3 dimensions. Cet algorithme consiste à accumuler dans la valeur de code le nombre de points rencontrés en partant d'une valeur minimale des coordonnées pour arriver à la valeur de code du point considéré. Pour effectuer ce traitement les valeurs réelles des coordonnées Xj sont d'abord converties en leur valeur entière la plus proche. Les valeurs résultantes sont alors corrigées de façon à être sûr que le point correspondant est bien situé à l'intérieur de l'ellipsoïde, car pour les points éventuellement extérieurs, il est admis que l'erreur de quantification peut être plus grande que celle obtenue pour les points à l'intérieur. Un processus optimum permettant de traiter ces points serait de trouver les points qui semblent les plus proches à l'intérieur de l'ellipsoïde.

Cependant à l'exception d'une quantification de points à l'intérieur d'une sphère il n'existe malheureusement pas de procédé simple pour effectuer ce traitement. Un algorithme suboptimum permettant de placer ces points itérativement à l'intérieur de l'ellipsoïde par une modification de leurs coordonnées successives est le suivant :

R = A_N FOR n = N DOWN TO 1

IF X_n>R THEN X_π = R

ELSE IF X_n<-R THEN X_n = -R R = (_An.₁/A_n) (R2 - X_n2)1/2

END FOR

En pratique les instructions de l'algorithme précédent doivent être incluses dans le microprogramme de codage proprement dit en utilisant les volumes V_n (A) déjà calculés. Cet algorithme consiste en une accumulation dans le code final du nombre de points laissés derrière le point codé de coordonnées (X-| ...XN) en partant d'un point de coordonnées (0, 0...0, AN) à la surface de l'ellipse et en descendant vers le point à quantifier. Un microprogramme pour l'exécution de cet algorithme de codage est fourni en Annexe 2. Naturellement le temps d'exécution maximum de l'algorithme précédent peut être raccourci grâce aux symétries. En effet, si CodeO représente le code du point d'origine de coordonnées (00...0) et C représente la valeur de code pour le point de coordonnées X-j ,..., XN le code correspondant au point symétrique (-Xi -XN) est exactement égal à 2^* CodeO-C. Pour tenir compte de ce fait le microprogramme précédent peut être complété par les instructions suivante : Inversion = FALSE IF X_N > = 0

Inversion = TRUE FOR i = 1 TO N DO Xj = -Xj END IF IF Inversion THEN Code = 2 CodeO - Code Un exemple de quantification est représenté à la figure 4 pour les valeurs d'axe Aι =1 , A-j=3 et A-| =4. Dans cette représentation il y a au total 37 centroïdes de cubes élémentaires et le barycentre de l'ellipsoïde correspond au code 18. Pour comparaison, un exemple de quantification pyramidale équivalent est représenté à la figure 5. Dans ce cas le barycentre correspond au code 14. L'algorithme de déquantification procède en cherchant à reconstituer les termes qui ont été additionnés pour donner la valeur du code sachant que cette reconstruction est unique par nature.

Un microprogramme correspondant est fourni en Annexe 3.

Pour tenir compte de certaines situations où il peut être intéressant de déplacer l'origine de l'ensemble des centroïdes., les algorithmes précédents peuvent encore être modifiés en considérant des coordonnées demi entières plutôt qu'entières. Une première possibilité peut consister à réaliser un quantificateur dont les axes sont de dimension double des axes Aj requis. Un vecteur de N valeurs réelles peut alors être quantifié après doublement, en utilisant seulement des entiers impairs. L'algorithme précédent peut alors être utilisé, le code de sortie obtenu étant converti par une table donnant le code final. Ce transcodage est nécessaire pour la raison que si environ un quart seulement des centroïdes originaux sont à considérer, cette réduction ne facilite pas pour autant l'exécution de l'algorithme. En effet, comme le montre la figure 6 on obtient alors avec des dimensions d'axe A-j =1 , A₂=3, A3=4, un ellipsoïde étendu de dimensions 2, 6 et 8 qui contient 369 centroïdes ce qui est très important comparés aux 56 centroïdes de l'ellipsoïde conçu en coordonnées demi-entières.

Une deuxième possibilité peut consister à modifier l'initialisation de l'algorithme, le codage et le décodage de façon à n'utiliser que des coordonnées paires. Des microprogrammes correspondant modifiés sont fournis en Annexe 4. Les codes sont transmis suivant des mots binaires. Cependant, comme le nombre de points compris à l'intérieur d'un ellipsoïde n'a, a priori aucune raison particulière de former une exacte puissance de deux, il paraît hautement souhaitable pour utiliser un nombre optimal de bits dans la formation du code, que ce nombre soit aussi près que possible d'une exacte puissance de deux. Ceci peut être obtenu en ajustant le volume de l'ellipsoïde par des longueurs d'axes fractionnaires plutôt qu'entières.

De manière à simplifier l'exposé, on supposera que les fractions représentant les axes Aj ont un dénominateur commun. En pratique les valeurs de dénominateur de 1 , 2, 3 sont suffisantes pour obtenir sans difficulté des ellipsoïdes contenant un nombre de centroïdes aussi voisins que possible d'une puissance exacte de deux.

Par exemple, en considérant en dimension 4 un ellipsoïde de dimensions (3, 4, 5, 6), celui-ci contient exactement 1765 points. Ce nombre est exactement compris entre 1024 et 2048. En modifiant ces dimensions dans les rapports (9/3, 13/3, 15/3, 19/3) ce nombre est changé par le nombre 2025 qui est 98,87% proche de 2048 et on peut dire qu'il représente une perte binaire équivalente de log.2(0,9887)=0,016 bits. La différence 2048 - 2025 = 23 de codes perdus peut alors être utilisée pour le codage de configurations particulières si nécessaire.

En conséquence, les algorithmes précédents peuvent encore être modifiés en considérant des longueurs d'axes de la forme (A-|/D, A₂/D AN/D) où D est un dénominateur commun de valeur faible. Les valeurs fortes pour D ne sont pas nécessaires car dans la pratique il est toujours possible d'obtenir un bon codage avec D=1 , 2 ou 3.

L'introduction d'un dénominateur commun conduit à effectuer les traitements suivants :

1 - définition des axes :

2 - équation de l'ellipsoïde (K=2) de la pyramide (K=1 ) :

3 - Valeur maximale de X_n

4 - En réduisant au même dénominateur et en conservant seulement les numérateurs on définit les formules de récurrences suivantes : Den_nX^ < Num_n avec DenN = D^κ

N Den_n = A^₊₁Den_n+1 = D^K flA?^C ,n = N- l,N - 2,..., l i=n+l

N- 1, N -2,...,1

Les relations précédentes montrent que si D est différent de l'unité ou si les axes Aj n'ont pas des dimensions faibles ou si les dimensions N sont importantes, un nombre important de points doit être calculé et que ce calcul doit être effectué en multiprecision arithmétique. La valeur maximum de X_n est exactement (Num_n/Den_n)^1/^, et cette valeur n'est presque jamais entière, de ce fait, il est impossible d'utiliser les tableaux tels que V_n(X_n) en programmation. En pratique, ce problème peut être résolu en utilisant deux tableaux, un tableau pour les volumes et un tableau de valeurs correspondant au numérateur puisque les dénominateurs ne changent pas. De la sorte, l'accès à un volume déterminé peut être trouvé par le numérateur correspondant à celui recherché. Pour réduire le temps de calcul les numérateurs sont mémorisés dans l'ordre croissant avec leur volume correspondant. Les microprogrammes d'initialisation de codage et de décodage sont alors modifiés de la façon représentée à l'annexe 5.

Une autre possibilité consiste à considérer seulement les centroïdes dont la somme des coordonnées est paire ou impaire. Ceci revient à conserver seulement la moitié des centroïdes d'origine, ceux-ci se répartissant sur le réseau original d'origine DN dénoté ici D_no où son complément D_n-| qui ne comprend pas l'origine.

Le principal avantage de procéder ainsi est que cela permet de diminuer l'erreur de quantification moyenne de -0,25 db si N=3 où d'environ -0,4 db pour N=4 à 10. Cela conduit à modifier l'algorithme de quantification initiale en ne considérant seulement que les points de coordonnées respectivement paires ou impaires. Dans ces conditions l'algorithme de quantification consiste à quantifier comme précédemment les points en recherchant des valeurs entières les plus proches de chaque coordonnée et à modifier les coordonnées entières qui sont les plus distantes de leur valeur réelle d'origine. Cependant le codage et le décodage sont alors légèrement plus complexes que pour un réseau de points ayant des coordonnées entières.

En effet deux ensembles de volumes doivent être trouvés pour les dimensions 1 à N-1 , un premier ensemble Vo_τn(A) ^de volumes à n dimensions ayant une somme impaire de coordonnées à un deuxième ensemble V-|_nΛûΛ de volumes de dimension n ayant une somme paire de coordonnées. Dans ces conditions le calcul des volumes a lieu de la façon décrite par le microprogramme de l'annexe 6.

Un exemple de quantification ellipsoïdale de vecteur pour D3 Q et D3 -_j est représenté aux figures 7a et 7b. Dans cette représentation, les trois axes ont respectivement pour dimensions 2, 4, 5, c'est-à-dire qu'ils sont légèrement plus grands que ceux des exemples précédents pour obtenir un nombre suffisant de points. Chaque centroïde est relié à ses voisins les plus proches de la même façon qu'aux figures 4 et 6. II peut être vérifié sur ces figures que le barycentre appartient (figure 7a) ou n'appartient pas ( figure 7b) à l'ensemble des centroïdes.

Une généralisation du procédé à une quantification pyramidale est aussi représentée aux figures 8a et 8b.

ANNEXES

Annexe 1

1. Pour les points isolés V_o(0)=1

2. Pour les séries de points contigus de dimension 1

FOR A + 0 TO Ai DO V-j (A) = 2*A+1

3. Pour les volumes de dimensions 2,..., N-1 FOR n = 2 TO N-1 FORA = 0TOA_nXX

V_n(A) = 0

FOR X_n = 0 TO A

X_n-l =(A_n.₁/A_n)(A2-X_n2)1/2

IFX_n = 0 THENV_n(A) = V_n.₁(X_n.₁) ELSE V_n(A) = V_n(A) + 2^*V_Π-1 (X_π-1 )

END FOR END FOR END FOR Annexe 2

Code = 0

R = A_N

FOR n = N DOWN TO 1

IF> :_Π>-R

FOR X = -R TO X_n.-j

Y=INT((A_π.₁/A_π)(R2- χ2)1/2)

Code = Code + V_Π-1(Y) END FOR

END IF

R = (A_n-l/A_n)(R²- •X_n2)1/2

END FOR

Annexe 3

R = A_N

FOR n = N DOWN TO 1 X_n = -R γ=|_NT((A_n.₁/A_n)(R2-X_n2)1/2)

WHILECode>=V_n.-ι(Y) Code = Code-V_n.₁(Y) X_n = X_{n +} 1 Y=INT((A_n.₁/A_n)(R2-X_n2)1/2₎ END WHILE R = Y END FOR Une amélioration de la vitesse d'exécution de ce microprogramme peut aussi être obtenue en introduisant les instructions suivantes : Inversion = FALSE IF Code>Code 0

Inversion = TRUE Code = 2 Code 0 - Code

END IF

(decoding giving Xj)

IF Inversion THEN FOR i = 1 TO N DO Xj = - Xj Annexe 4 FOR A = 0 TO A-j DO V₁ (A) = 2 INT((A+1 )/2) FOR n = 2 TO N-1

FOR A = 0 TO A_n V_n(A) = 0

FORX_n = 0TO INT((A-1)/2) X_n = 2 X_n +1 χ_n_₁ = |NT(((A_n.₁/A_n)(A2 - X_n2)1/2-i)/₂₎

X_n.i = 2Xn.! + 1 V_n(A) =V_n(A) +2V_n.ι(X_n-1) END FOR END FOR END FOR

Modification du codage Code = 0 R = A_N FOR n = N DOWN TO 1

X_n = INT((X_n-1)/2); r = INT((R - 1 )/2) IF X_n>-r

FOR x = -r TO Xn.-i X = 2 x + 1 y = INT(((A_n.₁/A_n)(R2- χ2)1/2._1)/2)

Y=2y+1

Code = Code + V_n.-|(Y) END FOR END IF R = (A_n.₁/A_n)(R2-X_n2)1/2

Modification du décodage. R = AN

FOR n = N DOWN TO 1

X_n = -2INT((R-1)/2)-1 y = INT (((A_n.₁/A_n)(R2 - X_n2)1/2. i)/₂

Y=2y+1 WHILECode>=V_n.₁(Y)

X_n = X_n + 2 y = 2 INT(((A_n.₁/A_n)(R2 - X_n2)1'² __1)/2 Y=2y+1 ENDWHILE

R = Y END FOR Annexe 5

A initialisation : calcul des volumes et des numérateurs DenN-1 = D²

FOR i=N-2 DOWN TO 0 DO

² _{Dénominateurs préca}|_CU|_és Calcul des volumes (dimensions 2...N-1 seulement) (Z) FOR 1 = 1 TO N-2 DO NVj.-i = 0 (D) FOR 1 = 1 TO N-2 DO NV_0ιj_-| = 0

Mult_n_ι = D

FOR 1 = N-2 DOWN TO 0 DO Multj=Mult_i+1 Aj₊₁

XMaxN--]=AN-i/D division entière maxCode = -1

NUΓTIN-1 = 1 n = N (D) Sum_n=0 Somme des coordonnées précédentes

Nouvelle Dimension n = n - 1

Xmax_n_ι = 0

X_n = -XMax_n - 1 lnitialNum_n = Num_n A_n 2 previous V_{π =} m_axCode appel de ia dernière valeur finale Accroissement de coordonnée

X_n = X_{n +} 1 (D) Sum_n = Sum_n+-ι + X_π (D) p = REM2(Sum_n) parité courante

Num_n_-| = initialNum_n - Mult_n ² X_n ²

ANum_n_ι = Num_n.-| A_n_ι ²

IF X_Π <= O

WHILE Den_n_ι XMax_n.-j ² < Anum_n_-| DO WHILE Den_n_-j XMax_n_ι ²>ANum_n_ι DO XMax_π_ι = XMax_n_ι-1

IF n > GOTO nextDimension (Z) maxCode = maxCode+(1 +2 XMax₀)

(D) IF p = Parity THEN maxCode = max Code +1 +2 INT(XMaxo/2) (D) ELSE maxCode = maxCode + 2 INT((XMax₀+1 )/2)

Test de coordonnée

IF X_n<XMax_n GOTO increaseCoordinate

IF n = N-1 THEN END

vol = maxCode - previousV_n Conservation des valeurs max de Num dans l'ordre croissant, avec leur valeur associé V

(D) IF Sum_n+-ι =2INT(Sum_n+-ι/2)THEN p=0 ELSE p=1 parité courante (Z/D) IF NV_n_-| =0 premier volume de cette dimension. (Z/D) NV_n._{1 =}1

(Z/D) maxNumer_π.-| ι = Num_n

ELSE ce n'est pas le premier volume : texter l'ordre (Z/D) M = NV_n_-|

FOR i = NV_n_ι - 1 DOWN TO 0 (Z/D) IF vol = V_n_ι _ιj

(Z/D) IF Num_n>maxNumer_n_-| _ιj

(Z/D) maxNumer_n_-| j= Num_n GOTO numerFound

END IF (Z/D) If voKVn.^ j THEN M ≈ i

END FOR END FOR (Z/D) IF M < = NV_n_ι modifier maxNumer et V

(Z/D) FOR - = NV_n_ι DOWN TO M+1

(Z/D) maxNumer_n_-] _ j = maxNumer_n_-| ;_-| (Z/D) V_n._{1 ι i} = V_n._{1 ι}' _M

END FOR END IF (Z/D) maxNumer_n_ι _ M = Num_n (Z/D) V_n._{1 | M} = vol (Z/D) NV_n_-| = NV_n_ι + 1 END IF nombre trouvé n = n + 1 GOTO testCoordinate

B. Algorithme de codage (les XJ sont supposés correctes).

Code = 0 R = A_N-1 Num = 1

Mult = D (D) Sum_n = 0 somme des coordonnées précédentes

FOR n = N - 1 DOWN TO 1 Boucle sur les dimensions R_o = 0 initialNum = Num AN 2

Si la peme coordonnée est supérieure au minimum R, ajouter au code des volumes correspondant à -R, -R+1 ,...X_n-1 IF X_n> -R

FOR iX = -R TO X_n-1 Num = initialNum - Mult² iX²

(D) Sum_n = Sum_n+ι +iX p = REM2(Sum_n) parité courante IF n>1 Si n>1 , les volumes sont accèdes par la valeur de Num i = 1

(Z/D) WHILE Num>maxNumer_n.-| , DO i = i -+- 1

(Z/D) Code = Code + V_n_ι j

ELSE Si n=1 , les volumes sont calculés ANum = Num A_Q 2 IF iX < = 0

WHILE Den₀ R₀ ²<ANum DO R₀=R₀ ⁺1 WHILE Den₀ R₀ ²>ANum DO R₀=R₀-1 (Z) Code = Code + 1 + 2^*R₀

(D) IF p = parity THEN Code=Code+1 +2INT(Ro/2)

(D) ELSE Code=Code+2INT((R₀+1 )/2)

END IF END FOR END IF

(D) Sum_n = Sum_n+-| + X_n

Si nécessaire, calcul de R pour la dimension suivante Num = initialNum - Mult² X_n ² Anum = Num A_n_ι 2 IF n>1 si n>1 , calcul itératif

R = 0

WHILE Den_n_ι R²<ANum DO R = R+1 IF Den_n.-ι R²>ANum THEN R=R -1 Mult = Mult A_n ELSE si n = 1 , la prochaine dimension est 1

Ajuster R en prenant en compte le fait qu'il peut seulement croître si X-_|£θ et décroître si X-| <0 R = R₀ IF X-_| < = 0 WHILE Den₀ R² < ANum DO R = R + 1

WHILE Den₀ R²>ANum DO R = R-1

(Z) Code = Code + X₀ + R Ajustement final du code

(D) IF X₀> -R (D) FOR i = -R TO X₀ - 1

(D) IF REM2 (Sum-| +i) = Parity

(D) END IF

(D) END FOR

C. Algorithme de décodage R = AN_-| /D division entière

Num = 1

Mult = D (D) Sum_n somme des coordonnées précédentes

FOR n = N - 1 DOWN TO 1 Boucle sur les dimensions Si la coordonnée n^eme X[n] est supérieure à son minimum, R, le code contient la somme des volumes à n dimensions correspondant à -R, -R+1 ,...X_n-1 Ro = 0 initialNum = Num A_n ² X_n = -R

Num = initialNum - Mult² χ_n 2 (D) p = REM2(Sum_n+1+ X_n) Essai de soustraction des volumes pour former le code

IF n>1 Ces volumes sont mis en table pour n>1 , comme étant une fonction de Num i = 1 (Z/D) WHILE Num>maxNumer_n j DO i = i + 1 (Z/D) WHILE Code>=V_n_ j

(Z/D) Code = Code - V_n_ j

X_n = X_{n +} 1 (D) P = 1 - P

Num = initial Num - Mult² X_n ² i = 1

(Z/D) WHILE Num > maxNumer_nι j DO i = i + 1

END WHILE ELSE Si n = 1 , les volumes sont presque facile à calculer..

ANum = Num A₀ ² IF X_π < =0

WHILE Den₀ R₀ ²<ANum DO R₀ = R₀ + 1 WHILE Den₀ R₀ ²>ANum DO R₀ = R_D - 1 (Z) length = 1 + 2 R₀

(D) IF p = Parity THEN length = 1 + 2 INT(R₀/2) (D) ELSE length = 2 INT((R₀ + 1 )/2)

WHILE Code> = length

Code = Code - length X_n = X_{n +} 1 (D) p = 1 - p changer la parité Num = initialNum - Mult² X_n ²

ANum = Num A₀ 2 IF X_n < = 0

WHILE Den₀ R₀ 2<ANum D0 R_o = R₀ + 1 WHILE Den₀ R₀ ²>ANum DO R₀ = R₀ - 1 (Z) length = 1 + 2 R₀

(D) IF p = Parity THEN length = 1 + 2 INT(R,y2)

ELSE length = 2 INT((R₀+1/2) END WHILE

END IF Si nécessaire, calcul de R pour la dimension suivante.

ANum = Num A_n_-j ² (D) Sum_{n = Su}m_n+1 + X_n IF n>1 if n>1 , interative computation

R = 0

WHILE Den_n_ι R²<ANum DO R = R+1 IF Den_n.^«| R²>ANum THEN R = R - 1 Mult = Mult A_n 2 ELSE Si n-1 , la prochaine dimension est 1

Ajuste R en prenant en compte le fait qu'il peut seulement augmenter si X1 < = 0, et diminuer si X-pO R = R₀ IF X-ι <=0 WHILE Den₀ R2<ANum DO R = R + 1

WHILE Den₀ R2>ANum DO R = R - 1 (Z) X₀ = -R Code dernière coordonnée...

(D) p = Sumι - 2 INT(Suπv|/2)

(D) X₀ = -R + 2 Code dernière coordonnée (D) p₀ = REM2(X₀) parité de X₀

(D) IF Parity = 0

(D) IF p₀<>p THEN X₀=X₀ ⁺1

(D) ELSE

IF p₀=p THEN X₀=X₀+1 (D) END IF

END IF END FOR Nota : Les instructions référencées par (Z) sont celles à utiliser lorsque les axes ont des longueurs entières. Les instructions référencées par (D) concernent des réseaux de points ayant des coordonnées à sommes paires et impaires. Pour les instructions référencées par (Z/D), NV_{a D} est remplacé par NVp _{a D}, V_{a D} par Vp_ _a_ b et maxNumer_a t₎ est remplacé par maxNumerp _{a D} si le réseau courant est D_no ou D_n_ι . Pour D_n, la parité variable est 0 pour D_nrj et 1 pour D_nι . La fonction REM2(X) calcule le reste de la division de X par 2 : elle est équivalente à X - 2 INT(X/2). Annexe 6

Première dimension FOR A = 0 TO A-j STEP 2 DO V_0ι 1 (A)=A+1 FOR A = 1 TO A-! STEP 2 DO V-\ j (A)=A+1 Dimensions 2...N-1 : FOR n = 2 TO N-1

FOR A = 0 TO A_n V₀, _n(A)=0

Vl,n(A)=0 FOR X_n=0 TO A

X_n-l=(A_n.₁/An)(A²-X_n ²)1/² IF X_n = 2 INT(X_n/2)

IF X_n = 0

Vθ,n(A) = V₀,n-l(Xn-l) Vl,n(A) = V_{1ι n}.₁(X_n.₁)

ELSE V_0ιn(A) = V₀, _n(A) + 2^*V₀,_n-l )(Xp-1 )

Vl,_n(A) = V_{1ι n}(A) + 2Λ/_1ιn.₁)(X_n.₁) END IF ELSE

Vθ,n(A) = V_0ιn(A) + 2Λ/_1ιn.₁)(X_n.₁) V_1ιn(A) = V_1ιn(A) + 2^*V_0ln-l)(Xn-l)

END IF

END FOR

Claims

REVENDICATIONS

1. Procédé de quantification vectorielle de vocodeurs bas débit caractérisé en ce qu'il consiste à déterminer le domaine du codage en entourant par une enveloppe le nuage des points de la matrice d'auto-corrélation des coefficients de réflexion (Ki.LARi)) du filtre de modélisation du conduit vocal , à déterminer (3) les axes principaux du volume de points intérieurs à l'enveloppe , à projeter (4) les coefficients de la matrice d'autocorrélation sur les axes principaux, à découper le volume intérieur de l'enveloppe en volumes élémentaires et à coder les coefficients résultats de la projection en fonction de leurs coordonnées dans l'espace défini par les axes principaux du volume des points intérieurs à l'enveloppe en n'attribuant comme valeurs de codes que celles correspondant aux emplacements des volumes élémentaires dans lesquels ils se trouvent.

2. Procédé selon la revendication 1 caractérisé en ce qu'il consiste pour effectuer le codage de chaque point , à découper le volume intérieur à l'enveloppe en tranches perpendiculaires à une première direction d'axe principal depuis une première tranche d'extrémité jusqu'à une tranche précédant la dernière tranche comportant le point à coder , en accumulant les nombres de points compris dans chaque tranche successive, et à ajouter au nombre de points obtenus le nombre de points restant dans la dernière tranche pour arriver au point à coder.

3. Procédé selon l'une quelconque des revendications 1 et 2 caractérisé en ce que l'enveloppe entourant le nuage de points est un hyperéllipsoïde centré au barycentre du nuage de points.

4. Procédé selon l'une quelconque des revendications 1 et 2 caractérisé en ce que l'enveloppe entourant le nuage de points est de forme pyramidale et est centrée au barycentre du nuage de points.

5. Procédé selon l'une quelconque des revendications 2 à 4 caractérisé en ce qu'il consiste à convertir les valeurs réelles des coordonnées des points à coder en leur valeur entière les plus proches.

6. Procédé selon l'une quelconque des revendications 2 à 4, caractérisé en ce qu'il consiste à ne considérer pour le codage que des coordonnées demi- entières.

7. Procédé selon l'une quelconque des revendications 2 à 4, caractérisé en ce qu'il consiste à ne considérer pour le codage des coordonnées de sommes paires ou impaires.

8. Procédé selon l'une quelconque des revendications 1 à 7 caractérisé en ce qu'il consiste à ajuster le volume intérieur de l'enveloppe par des longueurs d'axes de coordonnées fractionnaires.

9. Procédé selon la revendication 8 caractérisé en ce que les longueurs d'axes fractionnaires ont un dénominateur commun.