EP0347307A2

EP0347307A2 - Procédé de codage et codeur de parole à prédiction linéaire

Info

Publication number: EP0347307A2
Application number: EP89401644A
Authority: EP
Inventors: Michel Lever; Marc Delprat
Original assignee: Matra Communication SA
Current assignee: Nortel Networks France SAS
Priority date: 1988-06-13
Filing date: 1989-06-13
Publication date: 1989-12-20
Anticipated expiration: 2009-06-13
Also published as: EP0347307A3; ES2052043T3; EP0347307B1; DE68915057T2; FR2632758B1; DE68915057D1; FR2632758A1

Abstract

Le procédé, utilisable notamment pour la transmission de parole à faible débit, utilise l'excitation vectorielle. On représente une trame de signal d'une part par des paramètres de prédiction, d'autre part par une succession de vecteurs d'excitation contenus dans un dictionnaire (20) et par des gains (G_k) d'amplification de ces vecteurs, les vecteurs retenus étant déterminés par recherche du minimum de l'énergie d'un signal d'erreur obtenu par soustraction de chaque vecteur à son tour, après l'avoir soumis à un filtrage, à la trame du signal de parole. Avant soustraction, on soumet : chaque trame du signal de parole à un filtrage d'analyse à court terme et à un filtrage de synthèse pondéré, à coefficients éventuellement fixes dans le temps et le vecteur amplifié à un filtrage prédictif à long terme et au même filtrage de synthèse pondéré perceptuelle que le signal de parole.

Description

La présente invention a pour objet un procédé de codage et un codeur de parole du type dit à.analyse par prédiction linéaire. Elle concerne plus particulièrement les procédés et codeurs de parole de ce genre à excitation par vecteur d'excitation, souvent désignés par l'abréviation anglo-saxonne CELP, qui sont à distinguer des procédés de codage à analyse par prédiction linéaire à excitation multi-impulsionnelle (MPLPC) dont un exemple est donné dans le document EP-A-0 195 487 auquel on pourra se reporter.
Le codage à analyse par prédiction linéaire à excitation vectorielle fournit une solution intéressante au problème de la transmission de parole dans un canal à bande étroite, par exemple de la transmission entre mobiles et vers les mobiles dans un canal de 12,5 kHz qui réduit le débit disponible à environ 8 kbits/s ; dans ce dernier cas le débit affecté à la transmission des paramètres représentant le signal de parole est réduit à environ 6 kbits/s du fait qu'une partie du débit global doit être affectée à la transmission d'un code de correction d'erreur.
On connaît déjà des codeurs de parole à prédiction linéaire et excitation vectorielle, utilisables avec un faible débit binaire, habituellement entre un quart de bit et un demi bit par échantillon de parole. On pourra notamment trouver un exemple de réalisation d'un tel codeur dans l'article de SCHROEDER et ATAL "Code excited linear prédiction (CELP) : high quality speech at very low bit rates", proc. ICASSP, mars 1985.
La figure 1 donne un schéma de principe d'un tel codeur 10. Le signal de parole est appliqué à ce codeur par l'intermédiaire d'une chaîne de numérisation. Dans le mode de réalisation montré en figure 1, la chaîne comprend, à partir d'un microphone 12, un filtre passe-bas 14 limitant la bande passante à 4 000 Hz environ et un échantillonneur-codeur 16. L'échantillonneur prélève des échantillons de parole à une cadence qui est par exemple de 8 kHz et fournit des échantillons successifs, regroupés par trames vocodeurs occupant des fenêtres temporelles de durée déterminée, par exemple 20 ms.
Le codeur 10 transforme le signal de parole en un signal codé ayant une cadence de bits inférieure, transmis vers l'équipement d'émission par un multiplexeur 18 qui reçoit, pour chaque trame, les indices k des vecteurs d'excitation optimaux c_k, les gains G_k associés et des coefficients identifiant des paramètres de prédiction, pour chacun des blocs constitutifs de la trame, occupant chacun une sous-fenêtre.
Le codeur 10 représenté à titre d'exemple sur la figure 1 utilise l'analyse par synthèse : le spectre de parole dans chaque fenêtre est modélisé par un filtre prédicteur linéaire dont les coefficients sont variables dans le temps. Le signal résiduel, obtenu par soustraction, fait l'objet d'une quantification vectorielle en utilisant un dictionnaire de formes d'onde. Sur la figure 1, le dictionnaire 20 contient K + vecteurs d'excitation c_k (avec k=₀, ..., k, ..., K) et attaque un amplificateur 22 de gain G_k.
Habituellement les vecteurs d'excitation mémorisés dans le dictionnaire 20 sont choisis soit de façon empirique en tenant compte de données statistiques sur la langue, soit de façon aléatoire, soit encore à partir de codes numériques binaires classiques tels que les codes de Golay.
L'article de SCHROEDER et autres mentionné plus haut propose par exemple un dictionnaire comportant 1024 vecteurs d'excitation constitués chacun de 40 échantillons. Ce nombre de vecteurs se place entre le minimum au dessous duquel l'excitation serait mal représentée et le maximum au delà duquel le nombre de bits laissés libres serait insuffisant pour transmettre les paramètres des prédicteurs.
La sortie de l'amplificateur 22 est appliquée à un filtre prédictif de synthèse constitué d'un filtre prédicteur à long terme 24, destiné à introduire la périodicité du signal à long terme, et d'un filtre prédicteur à court terme 26. La sortie Sn du filtre prédicteur, qui représente une synthèse d'estimation du signal de parole, est appliquée à l'entrée soustractive d'un soustracteur 28 qui reçoit, sur son entrée additive, le signal de parole Sn échantillonné et numérisé.
Les fonctions de transfert respectives 1/B(z) et 1/A(z) des filtres 24 et 26 une fois calculées et quantifiées, l'opération de codage consiste à déterminer la séquence optimale d'innovation _Ck et le gain G_k pour chaque trame de parole par un processus d'analyse par synthèse. Pour chacune des séquences de codage _Ck, le signal de synthèse obtenu S est comparé au signal d'origine S et le signal de différence obtenu dans le soustracteur 28 est traité dans un filtre de pondération perceptuelle 30 ayant une fonction de transfert W(z), dont la fonction est d'atténuer les fréquences pour lesquelles les erreurs ont moins d'importance du point de vue perceptuel et d'amplifier au contraire les fréquences pour lesquelles les erreurs ont davantage d'importance du point de vue perceptuel.
Un circuit 32 recherche la séquence de codage pour laquelle l'énergie contenue dans le signal d'erreur pondéré e_k pour une sous-fenêtre, est minimale ; cette séquence est sélectionnée pour le bloc en cours, puis le gain optimum G_k est calculé.
Classiquement, la fonction A(z) du filtre prédicteur à court terme 26 est de la forme :
Dans cette formule, qui utilise la notation classique en z, les coefficients a(i) constituent les paramètres de prédiction linéaire. Leur nombre est généralement compris entre 8 et 16 pour des fenêtres de 20 ms.
Quant à la fonction de transfert B(z), elle peut être de la forme 1-bz-^T et faire intervenir un retard T allant de 40 à 120 échantillons.
Le filtre de pondération perceptuelle 30 a de son côté une fonction de transfert W(z) qui est généralement de la forme :
En dépit de son intérêt, le procédé de codage qui vient d'être exposé ne peut pratiquement pas être mis en oeuvre en temps réel, du fait du volume énorme de calculs requis pour rechercher la séquence d'innovation, (c'est-à-dire le vecteur d'excitation) optimale par K+1 parcours successifs de boucle, chaque parcours constituant le filtrage d'un vecteur d'excitation, par des filtres à coefficients variables dans le temps. On connait également un procédé de codage CELP conforme au préambule de la revendication 1 (IEEE Journal on selected areas in communications, Vol. 6, n°2, Février 1988, pages 353-363) ; la présente invention vise à fournir un procédé de codage à prédiction linéaire et excitation par vecteurs de codage de ce type, répondant mieux que ceux antérieurement connus aux exigences de la pratique, notamment en ce qu'elle réduit d'au moins un ordre de grandeur le volume de calcul à effectuer pour le codage d'un segment.
Pour cela l'invention propose notamment un procédé de codage de parole, à prédiction linéaire et excitation vectorielle, suivant la partie caractérisante de la revendication 1.
Du fait que chaque séquence de codage est constituée de plusieurs impulsions équidistantes séparées par des zéros, avantageusement binaires, c'est-à-dire qu'on utilise une excitation par séquences d'impulsions régulières, ou RPCELP, on réduit dans des proportions très considérables la durée de recherche de la séquence optimale, surtout si on fait un choix approprié des caractéristiques du filtre de pondération perceptuelle.
D'autres caractères de l'invention sont définis dans les revendications 2 à 6.
L'invention sera mieux comprise à la lecture de la description qui suit de modes particuliers de réalisation, donnés à titre d'exemples non limitatifs. La description se réfère aux dessins qui l'accompagnent, dans lesquels :

- la figure 1, déjà mentionnée, est un schéma de principe d'un codeur de parole à prédiction linéaire et excitation vectorielle déjà connu ;
- la figure 2, similaire à la figure 1, est une variante du schéma montrant une constitution possible de codeur de la figure 1, susceptible d'être simplifiée pour constituer un premier mode de réalisation de l'invention ;
- les figures 3, et 5 sont des schémas montrant des évolutions successives du codeur de la figure 2 ;
- la figure 6, similaire à la figure 5, montre de façon plus complète un mode de réalisation de l'invention réduisant encore le volume de calcul ;
-la figure 7 montre une répartition possible de séquences de codage dans le dictionnaire ;
-la figure 8 montre une autre constitution possible du dictionnaire.

Dans le codeur de parole représenté schématiquement en figure 2 (où les éléments correspondant à ceux de la figure 1 sont désignés par le même numéro de référence) le filtre de pondération perceptuelle 30, placé à la sortie du soustracteur 28 sur la figure 1, est reporté sur les deux branches d'entrée du soustracteur sous forme de filtres 34 et 36, de fonction de transfert 1/A(z/y). On trouve ainsi en cascade, sur la branche affectée au signal d'origine S(n), le filtre 33 de fonction de transfert A(z) et le filtre 36 ayant la même fonction de transfert que le filtre 34.
Le filtrage de tous les vecteurs par le filtre de synthèse, de fonction de transfert 1/A(z/y) dont les coefficients varient dans le temps, représente un volume énorme de calculs. Ce volume est réduit de façon très considérable suivant un premier aspect de l'invention, en adoptant un filtre de pondération perceptuelle à petit nombre de coefficients fixes dans le temps, choisis en fonction des caractéristiques moyennes de la parole sur un long intervalle de temps. Le filtre de pondération perceptuelle a alors une fonction de transfert W'(z) qui peut s'écrire :

W'(z) = A(z)/C(z/y)
où C(z/y) est la fonction de transfert d'un prédicteur de parole à court terme, par exemple de la forme :

Les fonctions de transfert des composants 34 et 36 de la figure 2 deviennent alors 1/C(z/y).
Un autre mode de mise en oeuvre de l'invention, pouvant être combiné au premier, apparaît mieux en considérant les transformations successives apportées au circuit de la figure 2 pour y aboutir.
Tout d'abord, comme indiqué sur les figures 3 et 4, la contribution de la mémoire dans le filtre prédicteur à long terme 24, de fonction de transfert 1/B(z), et dans le filtre prédicteur à court terme pondéré de fonction de transfert 1/A(z/y), est soustraite du signal d'origine ayant subi la pondération pour obtenir un signal _Xn, avant le début de la recherche dans le dictionnaire de vecteurs 20. Cette opération s'effectue sur la figure 3 à l'aide d'un soustracteur 38 qui reçoit uniquement la composante de mémoire du filtre prédicteur à long terme 24. Ainsi, au cours de la procédure de recherche du vecteur optimal, chaque vecteur k est traitée uniquement par le filtre de synthèse pondéré 34.
On va maintenant montrer comment il est possible de réduire encore notablement le volume de calcul en faisant référence à la figure 4. Sur cette figure, chacun des filtres 34 et 36 a été montré décomposé en un filtre 34a ou 36a de fonction de transfert 1/Ã (z/y), sans mémoire, et un filtre 34b ou 36b correspondant uniquement à la contribution des termes de mémoire.
Au cours de la recherche du vecteur optimal Ck , chaque vecteur k amplifié avec le gain C _k n'est plus traité que par le filtre de synthèse pondéré sans mémoire 1/Ã (z/y) qui fournit en sortie un signal z(n). Si on identifie par une tilde les grandeurs sans mémoire et si on désigne par :

r le signal résiduel après soustraction des effets du prédicteur à long terme 24,
x le signal original dont la redondance à long terme a été écartée dans le soustracteur 38 et qui a été pondéré par W(z),
z_k le signal synthétisé,
x° et z° les contributions des mémoires des filtres au calcul de x et z.

On peut écrire :

x = Hr + x°
x̃ = Hr
Z_k = G_k.H C_k + Z°

L'opération de filtrage par le filtre 34a, sans mémoire, est exprimée ci-dessus par la convolution de deux séquences finies, représentée par le produit d'une matrice et d'un vecteur : Z_k = G_k H c_k (4) où H est une matrice triangulaire inférieure LxL (L étant la longueur commune des séquences) dont les éléments sont tirés de la réponse impulsionnelle h(i) de 1/A(z/y), de la forme :
qui se confond avec celle de 1/Ã (z/y)
Le vecteur x' à l'entrée du soustracteur 28, après soustraction des effets de mémoire, peut lui-même s'écrire :

x' = Hr + x° - z°

L'énergie de l'erreur E_k pondérée pour le vecteur d'indice k (avec O ≦ k ≦ K) peut s'écrire :
Le processus de recherche de la séquence d'innovation optimale (indice k de vecteur Ck et gain d'amplification G_k) comporte deux étapes qui découlent de l'équation (6) si on tient compte du fait connu (J.P. ADOUL et coll. "Fast CELP coding based on algebraic codes", Proc. ICASSP, April 1987) que minimiser l'énergie E_k revient à maximiser un produit scalaire Pm :

- recherche de l'indice k pour lequel le produit scalaire Pω(k) est maximum :

- calcul du gain correspondant G_k:

Le calcul d'un produit scalaire est évidemment plus rapide que la recherche d'une distance euclidienne, de sorte que le schéma de la figure 3 permet déjà à lui seul de réduire le volume de calcul.
L'étape suivante de la démarche consiste à faire disparaître les termes de mémoire, c'est-à-dire les opérations schématisées en 34a et 36a, pour arriver à la constitution montrée en figure 5.
Comme dans le cas de la figure 2, une simplification importante consiste à substituer des filtres fixes de synthèse à fonction de transfert 1/C(z/y) aux filtres 34a et 36a de fonction 1/Ã(z/γ), ce qui revient encore à adopter un filtre de pondération perceptuelle de la forme W'(z) = A(z)/C(z/y). Il n'y a plus à effectuer une opération de filtrage répétitive par 34a, dans la mesure où les vecteurs d'excitation sont stockés dans le dictionnaire 20, d'une part à l'état préfiltré pour les appliquer directement au circuit de maximisation de produit scalaire 38, d'autre part sous forme originale pour application à l'amplificateur 22 de gain Gk. La simplification apparaît immédiatement par une comparaison avec les processus classiques de recherche de minimum.
Un autre mode encore de mise en oeuvre de l'invention met en oeuvre un critère d'évaluation d'erreur à minimiser modifié. Les trames d'échantillons occupant chacun une fenêtre sont successivement appliquées ; en conséquence, la réponse impulsionnelle du filtre pondéré de synthèse pour une trame (ou un bloc) intervient sur la trame suivante (ou le bloc suivant). Pour écarter cet effet, on utilise l'amortissement des filtres et on applique à leur entrée, au lieu d'une séquence constituée uniquement de L échantillons, une séquence constituée de L échantillons et J zéros, J étant choisi de façon que la réponse impulsionnelle du filtre de synthèse W(z)/A(z) soit pratiquement nulle après J échantillons. Une valeur J = 10 est généralement suffisante pour que l'amortissement des filtres permette d'écarter les termes représentatifs de leur mémoire. La matrice de réponse impulsionnelle devient alors une matrice rectangulaire du type "bande" à (L+J)xL termes du type :
La matrice H^tH = R est alors une matrice symétrique de Toeplitz, construite à partir de l'autocorrélation R(i) de la réponse impulsionnelle h(n). H^t désigne la transposée de H.
L'erreur de mémoire qui apparaît dans l'équation représentative de x' est alors suffisamment faible pour pouvoir être considérée comme nulle et l'équation (7) peut s'écrire :
Le vecteur y^t = r^t H^t H peut être calculé de façon précise, une seule fois par trame, par une opération de filtrage, en utilisant un filtre adaptatif dont les coefficients sont les termes d'auto-corrélation R(i).
Pour mettre en oeuvre ce procédé dant le cas d'un signal de parole échantillonné à 8 kHz et dont les échantillons sont répartis en trames de 160 échantillons occupant chacune 20 ms, on peut notamment fractionner chaque trame, après filtrage en 33 (figure 5), en quatre blocs de L=40 échantillons qui sont successivement appliqués au filtre 36a, suivis chaque fois de J=₁₀ zéros.
A sera alors calculé pour chaque trame tandis que k et G_k seront calculés pour chaque bloc.
Une solution particulièrement intéressante dans ce cas consiste à utiliser des séquences d'impulsions de longueur L ayant une structure régulière constituée de q impulsions équidistantes séparées par D-1 zéros, la première impulsion occupant l'une des positions 0 à D-1 et le nombre de séquences étant tel que toutes ces positions sont successivement occupées. On peut ainsi donner une représentation satisfaisante de l'information de phase dans le signal d'excitation. La figure 7 montre, à titre d'exemple, quatre séquences (pour k=0, 1, 2 et 3) identiques sauf en ce qu'elle correspondent à D=4 phases différentes. On peut considérer que le dictionnaire est constitué par un jeu de base de K/D séquences, avec une phase nulle et avec trois décalages successifs, soit en tout K séquences.
L'excitation par séquences d'excitation régulières réduit le nombre d'opérations à effectuer, du fait que beaucoup des produits à effectuer sont nuls, l'un des facteurs étant un zéro dont la position est connue pour chaque échantillon. On peut encore simplifier les calculs en constituant les séquences uniquement d'échantillons binaires ne pouvant prendre que les valeurs + 1, -1 (et 0), comme indiqué sur la figure 8. En effet toutes les séquences contiennent alors la même énergie ; la recherche de la séquence optimum s'effectue avec des produits purement scalaires et revient à chercher le vecteur binaire qui donne le meilleur résultat. On peut à sujet noter que le document EP-A-O 195 487 concerne un procédé de codage MPLPC suivant lequel il faut successivement déterminer une phase optimale d'impulsions, puis chercher l'amplitude optimale de toutes les impulsions constituant séquence parmi des valeurs discrètes, quantifiées par exemple sur 3 bits. Dans le cas du critère modifié et d'une excitation par séquences régulières, et notamment dans le cas de séquences constituées d'échantillons binaires, et à la condition supplémentaire que l'auto-corrélation soit normalisée et présente des termes nuls dont l'écartement correspond aux échantillons non nuls des séquences, les termes H c_k deviennent tous égaux et on a :
où d_m désigne l'une des séquences (au nombre de K/D) résultant de la décimation des composantes des K vecteurs par élimination des zéros ; la séquence d_m pour 0 :5 k :5 3 est donnée en figure 7 à titre d'exemple.
Si les séquences sont normalisées, la procédure de recherche se limite à la recherche de la séquence pour laquelle le produit scalaire P(k) = y^t.c_k est maximum.
Les conditions nécessaires à l'applicabilité de la formule (11) peuvent notamment être obtenues :

- soit en adoptant un filtre fixe R tel que R(iD) soit nul pour i > 0,
- soit en adoptant un filtre à coefficients variables, mais dont la réponse impulsionnelle finie (RIF) est tronquée pour les indices d'échantillons supérieurs à D.

Le codeur présente alors la constitution de principe montrée en figure 6. Une opération de filtrage unique est effectuée sur la trame de signal de parole par le filtre 33. La séquence c_k testée, sous forme qui n'a plus besoin d'être préfiltrée, est appliquée au circuit 32 de calcul du produit scalaire c_k ^t.y et de détermination du maximum, pour lequel un ordre de sélection d'indice est envoyé en 40. La séquence c_k amplifiée en 22 est appliquée au prédicteur à long terme 24, représenté avec un seul coefficient b. Le terme r est formé en soustrayant la sortie du prédicteur à long terme 24 de la sortie du filtre 34 sur la voie de parole, dans le soustracteur 38. Le filtre 42 qui reçoit le résidu r a une réponse fixe R(z) représentée par une matrice de Toeplitz symétrique.
La recherche du vecteur optimal peut alors s'effectuer par un nombre réduit d'opérations de multiplication et d'addition, sous la réserve que la réponse soit tronquée si le filtre est variable, par exemple par la démarche suivante si les vecteurs d'excitation régulière sont binaires :

- détermination de la phase qui donne une valeur maximale à M(p) :
- puis, parmi les vecteurs ayant la phase retenue, sélection du vecteur d_m tel que
yt.c_k = M(P)
. c'est-à-dire :
d_m(i) = signe de y(p+iD)
pour i = 0, ..., q-1

Une fois sélectionné le vecteur optimal, le gain G_k à retenir s'en déduit directement, puisque 1 l H ckl 12 est égal à une valeur constante q, quelle que soit la valeur de k, dans le cas de vecteurs binaires qui ont tous la même norme.
Ce processus réduit le nombre de calculs requis dans un rapport qui est typiquement de trois ordres de grandeur environ par rapport au procédé CELP classique, et ce quelle que soit la longueur L choisie pour les blocs de parole.
Les données à transmettre par le multiplexeur 18 seront :

-le coefficient unique b et la période T (correspondant à la périodicité du signal de parole) du filtre prédicteur à long terme 24, une ou plusieurs fois par fenêtre, les coefficients a du filtre 33, de fonction de transfert A(z), une fois par fenêtre,
- l'indice k du vecteur optimal et le gain correspondant G_k, une fois par bloc correspondant à une sous-fenêtre de par exemple 40 échantillons.

Le gain G_k est, en vue de la transmission, quantifié dans un quantificateur 46. Chaque trame de signal est fractionnée en plusieurs blocs, une mémoire intermédiaire 48 doit être interposée entre les composants 33 et 44.
Il faut au surplus noter que, du fait que l'excitation est binaire et régulière, elle est peu sensible aux erreurs de transmission : une erreur modifiant la valeur d'un bit ne modifie le vecteur que localement. Les bits de phase en nombre réduit peuvent être protégés par un code correcteur.

Claims

1. Procédé de codage de parole, à prédiction linéaire et excitation vectorielle, permettant de coder des signaux de parole mis sous forme d'échantillons numérisés répartis en trames, suivant lequel : on représente une trame de signal d'une part par des paramètres de prédiction, d'autre part par une succession de vecteurs d'excitation contenus dans un dictionnaire (20) et par des gains (G_k) d'amplification de ces vecteurs, les vecteurs retenus étant déterminés par recherche (32) du minimum de l'énergie d'un signal d'erreur obtenu en soustrayant chaque vecteur à son tour, préalablement soumis à un filtrage, à la trame du signal de parole ; et,
avant soustraction, on soumet chaque trame du signal de parole à un filtrage d'analyse à court terme et à un filtrage de synthèse pondéré, à coefficients éventuellement fixes dans le temps et on soumet le vecteur amplifié à un filtrage prédictif à long terme et au même filtrage de synthèse pondéré perceptuelle que le signal de parole,
caractérisé en ce que tous les vecteurs de codage sont constitués du même nombre d'impulsions, équidistantes et séparées par des zéros.

2. Procédé selon la revendication 1, caractérisé en ce que les impulsions séparées par des zéros sont binaires.

3. Procédé selon la revendication 1 ou 2, caractérisé en ce que l'on effectue chaque recherche (32) du minimum d'énergie du signal d'erreur en soumettant au filtrage (34,36 ou 34a,36a) un ensemble comprenant, en plus des échantillons réels d'un bloc constituant une fraction de la trame, des échantillons nuls en nombre suffisant pour que la réponse impulsionnelle de filtrage prédictif correspondant au dernier échantillon réel soit sensiblement amortie, le filtrage (34,36 ou 34a, 36a) étant effectué sans mémorisation d'un bloc à l'autre.

4. Procédé selon la revendication 1 ou 2, caractérisé en ce que chaque trame du signal de parole, après avoir été soumise à un filtrage prédictif d'analyse à court terme A(z) est appliquée à l'entrée additive d'un soustracteur (38) qui reçoit sur son entrée soustractive la contribution de la mémoire du filtre prédictif à long terme (24),

- on soumet la sortie du soustracteur à un filtrage (42),

- on calcule le produit scalaire (32) de la sortie filtrée du soustracteur et de chaque séquence non amplifiée à son tour en recherchant la séquence pour laquelle le produit scalaire est maximum.

5. Procédé selon la revendication 4, caractérisé en ce que le filtrage (42) est à coefficients fixes. 6. Procédé de codage de parole à prédiction linéaire et excitation vectorielle, permettant de coder des signaux de parole mis sous forme d'échantillons numérisés répartis en trames, suivant lequel : on représente chaque bloc constituant une fraction de trame de signal par l'un des vecteurs contenus dans un dictionnaire (20), par un gain (G_k) d'amplification du vecteur et par des paramètres de prédiction, le vecteur retenu étant déterminé par recherche du minimum de l'énergie d'un signal d'erreur obtenu par soustraction de chaque vecteur à son tour, préalablement soumis à un filtrage, à la trame du signal de parole ; et,
avant soustraction, on soumet chaque trame du signal de parole à un filtrage d'analyse à court terme A(z) ; caractérisé en ce que :
on soumet le résultat de la soustraction (38) à un filtrage prédicteur de parole à court terme à coefficients fixes dans le temps et,
on soumet le vecteur d'excitation, mémorisé sous forme précalculée et filtré, à un filtrage par un filtre prédicteur 1 / c (z/y) fixe et sans mémoire.