FR2700632A1

FR2700632A1 - Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.

Info

Publication number: FR2700632A1
Application number: FR9300601A
Authority: FR
Inventors: Lozach Bruno
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1993-01-21
Filing date: 1993-01-21
Publication date: 1994-07-22
Anticipated expiration: 2013-01-21
Also published as: EP0608174A1; EP0608174B1; FR2700632B1; DE69412294D1; US5583963A; DE69412294T2

Abstract

L'invention concerne un système de codage prédictif d'un signal numérique de parole à codes imbriqués. Le signal numérique codé (Sn ) est formé par un signal de parole codé et, le cas échéant, par des données auxiliaires. Un filtre de pondération perceptuelle (11) est formé par un filtre de prédiction à court terme du signal de parole à coder pour réaliser une répartition fréquentielle du bruit de quantification. Un circuit (12) permet d'effec (CF DESSIN DANS BOPI) signal perceptuel réactualisé Pn . Un circuit de prédiction à long terme (13) est formé, en boucle fermée, à partir d'un dictionnaire réactualisé par l'excitation passée modélisée (CF DESSIN DANS BOPI) module de transformée orthonormée (MT) comporte un module de transformée adaptative (14) et un module de modélisation progressive par vecteurs orthogonaux (16), ce qui permet de délivrer des index représentatifs du signal de parole codé. Un circuit (19) permet l'insertion des données auxiliaires par vol de bits du signal de parole codé. Application à tout système de transmission et au stockage de signaux de parole.

Description

i

SYSTEME DE CODAGE-DECODAGE PREDICTIF D'UN SIGNAL NUMERIQUE

DE PAROLE PAR TRANSFORMEE ADAPTATIVE A CODES IMBRIOUES

La présente invention est relative à un système de codage-décodage prédictif d'un signal numérique de parole

par transformée adaptative à codes imbriqués.

Dans les codeurs prédictifs par transformée actuel-

lement utilisés, ce type de codeur étant représenté en figure 1, on cherche à construire un signal synthétique Sn le plus ressemblant possible au signal numérique de parole

à coder Sn, ressemblance au sens d'un critère perceptuel.

Le signal numérique à coder Sn, issu d'un signal de parole source analogique, est soumis à un processus de prédiction à court terme, analyse LPC, les coefficients de prédiction étant obtenus par prédiction du signal de parole sur des fenêtres comportant M échantillons Le signal numérique de parole à coder Sn est filtré au moyen d'un

filtre de pondération perceptuelle W(z) déduit des coeffi-

cients de prédiction précités, pour obtenir le signal perceptuel pn Un processus de prédiction à long terme permet ensuite de prendre en compte la périodicité du résidu pour

les sons voisés, sur toutes les sous-fenêtres de N échantil-

lons, N < M, sous forme d'une contribution P laquelle est soustraite du signal perceptuel pn de façon à obtenir le

signal p'n sous forme d'un vecteur PIERN.

Une transformation suivie d'une quantification sont

ensuite réalisées sur le vecteur P' précité en vue d'effec-

tuer une transmission numérique Les opérations inverses permettent, après transmission, la modélisation du signal

synthétique S'.

Afin d'obtenir un bon comportement perceptuel, selon les critères habituels établis par l'expérience, il est nécessaire d'établir un processus de transformation par transformée orthonormée F et de quantification du vecteur

P', en présence de valeurs de gain G vérifiant des proprié-

tés bien déterminées, G = FT Pl o FT désigne la matrice transposée de la matrice F. Une première solution, proposée par G Davidson et A.Gersho, dans la publication "Multiple-Stage Vector Excitation Coding of Speech Wave forms", ICASSP 88, Vol 1,

pp 163-166, consiste à utiliser une matrice de transforma-

tion non singulière V = HC o H est une matrice triangulaire inférieure et C un dictionnaire non singulier, construit par apprentissage, assurant l'inversablité de la matrice de

transformation V pour toute sous-fenêtre.

Afin de pouvoir exploiter certaines propriétés de décorrélation et d'ordonnancement des composantes du vecteur de coefficients de la transformée G lors de l'étape de

quantification, plusieurs solutions utilisant des transfor-

mées orthonormées ont été proposées.

La transformée de Karhunen-Loeve, obtenue à partir des vecteurs propres de la matrice d'auto-corrélation I EP Pli i=O o I est le nombre de vecteurs contenu dans le corpus d'apprentissage, permet de maximiser l'expression K E Gi i=l

o K est un entier, K S N On démontre que l'erreur quadra-

tique moyenne de la transformée de Karhunen-Loeve est inférieure à celle de toute autre transformation pour un ordre de modélisation K donné, cette transformée étant, dans ce sens, optimale Ce type de transformée a été introduit dans un codeur prédictif par transformée orthogonale par N.Moreau et P Dymarski, confer publication "Successive Orthogonalisations in the Multistage CELP Coder", ICASSP 92

Vol l, pp I-61 I-64.

Toutefois, afin de réduire la complexité de calcul du vecteur de gain G, il est possible d'utiliser des transformées sous-optimales, telles que la transformée de Fourier Rapide (FFT), la transformée en cosinus discrète (TCD) la transformée discrète de Hadamard (DHT) ou de Walsh

Hadamard (DWHT) par exemple.

Une autre méthode pour la construction d'une transformée orthonormée consiste à décomposer en valeurs singulières la matrice de Toeplitz triangulaire inférieure H définie par: h(O 0) O O H h( 1) h(O) O h( 2) h( 1) lh(N-1) h(n-2) h(O) matrice dans laquelle h(n) est la réponse impulsionnelle du filtre de prédiction à court terme 1/A(z) de la fenêtre courante. La matrice H peut alors être décomposée en une somme de matrices de rang 1: N H = UDVT = E Uidi V i=l La matrice U étant unitaire, celle-ci peut être utilisée en tant que transformée orthonormée Une telle construction a été proposée par B S Atal dans la publication "A Model of LPC Excitation in Terms of Eigenvectors of the Autocorrelation Matrix of the Impulse Response of the LPC Filter", ICASSP 89, Vol l, pp 45-48 et par E Ofer dans la

publication "A Unified Framework for LPC Excitation Repre-

sentation in Residual Speech Coders" ICASSP 89, Vol 1 pp 41-

44. Les codeurs à codes imbriqués actuellement connus permettent de transmettre des données par vol d'éléments binaires normalement alloués à la parole sur le canal de transmission, et ce, d'une façon transparente pour le

codeur, lequel code le signal de parole au débit maximum.

Parmi ce type de codeurs, un codeur à 64 kbit/s à quantificateur scalaire à codes imbriqués a été normalisé en 1986 par la norme G 722 établie par le CCITT Ce codeur opérant dans le domaine de la parole en bande élargie

(signal audio de largeur de bande de 50 Hz à 7 k Hz, échan-

tillonné à 16 k Hz), est basé sur un codage en deux sous-

bandes contenant chacune un codeur à Modulation par Impul-

sion et Codage Différentiel Adaptatif (codage MICDA) Cette technique de codage permet de transmettre des signaux de parole en bande élargie et des données, si nécessaire, sur un canal à 64 kbit/s, à trois débits différents 64-56-48

kbit/s et 0-8-16 kbit/s pour les données.

En outre, dans le cadre de la mise en oeuvre de codeurs excités par codes (ou codeurs CELP) M Johnson et T.Tanigushi ont décrit un codeur CELP multi-étages à codes imbriqués Confer la publication des auteurs précités intitulée "Pitch Orthogonal Code-Excited LPC", Globecom 90,

Vol 1, pp 542-546.

Enfin, R Drogo De Iacovo et D Sereno ont décrit un codeur de type CELP modifié permettant d'obtenir des codes imbriqués ou modélisant le signal d'excitation du filtre d'analyse LPC par une somme de différentes contributions et utilisant seulement la première d'entre elles pour la remise à jour de la mémoire du filtre de synthèse, confer la publication de ces auteurs "Embedded CELP Coding For Variable Bit-Rate Between 6 4 and 9 6 kbit/s" ICASSP 91

Vol 1, pp 681-684.

Les codeurs prédictifs par transformée de l'art antérieur précités ne permettent pas de transmettre des données et ne peuvent donc pas remplir la fonction de codeurs à codes-imbriqués En outre, les codeurs à codes imbriqués de l'art antérieur n'utilisent pas la technique de la transformée orthonormée, ce qui ne permet pas de tendre

vers ou d'atteindre un codage par transformée optimal.

La présente invention a pour objet de remédier à l'inconvénient précité par la mise en oeuvre d'un système de codage-décodage prédictif d'un signal numérique de parole

par transformée adaptative à codes imbriqués.

Un autre objet de la présente invention est la mise en oeuvre d'un système de codage-décodage prédictif d'un signal numérique de parole et de données permettant une

transmission à des débits réduits et flexibles.

Le système de codage prédictif d'un signal numérique en un signal numérique à codes imbriqués, dans lequel le signal numérique codé est constitué par un signal de parole

codé et, le cas échéant, par un signal de données auxiliai-

res insérées au signal de parole codé après codage de ce dernier, objet de la présente invention, comprend un filtre

de pondération perceptuelle piloté par une boucle de prédic-

tion à court terme permettant d'engendrer un signal percep-

tuel et un circuit de prédiction à long terme délivrant un signal perceptuel estimé, ce circuit de prédiction à long

terme formant une boucle de prédiction à long terme permet-

tant de délivrer, à partir du signal perceptuel et du signal

d'excitation passée estimé, un signal d'excitation percep-

tuelle modélisé et des circuits de transformée adaptative et de quantification permettant à partir du signal d'excitation

perceptuelle d'engendrer le signal de parole codé.

Il est remarquable en ce que le filtre de pondéra-

tion perceptuelle consiste en un filtre de prédiction à court terme du signal de parole à coder, de façon à réaliser une répartition fréquentielle du bruit de quantification et en ce qu'il comporte un circuit de soustraction de la contribution du signal d'excitation passée du signal perceptuel pour délivrer un signal perceptuel réactualisé, le circuit de prédiction à long terme étant formé, en boucle

fermée, à partir d'un dictionnaire réactualisé par l'excita-

tion passée modélisée correspondant au débit le plus faible permettant de délivrer une forme d'onde optimale et un gain

associé à celle-ci, constitutif du signal perceptuel estimé.

Le circuit de transformée est formé par un module de

transformée orthonormée comportant un module de transforma-

tion orthogonale adaptative et un module de modélisation

progressive par vecteurs orthogonaux Le module de modélisa-

tion progressive et le circuit de prédiction à long terme permettent de délivrer des index représentatifs du signal de parole codé Un circuit d'insertion des données auxiliaires

est couplé au canal de transmission.

Le système de décodage prédictif par transformée adaptative d'un signal numérique codé à codes imbriqués dans lequel le signal numérique codé est constitué par un signal numérique codé et, le cas échéant, par un signal de données auxiliaires insérées au signal de parole codé après codage de ce dernier, est remarquable en ce qu'il comporte un circuit d'extraction du signal de données permettant, d'une part, l'extraction des données en vue d'une utilisation auxiliaire et, d'autre part, la transmission d'index représentatifs du signal de parole codé Il comprend en outre un circuit de modélisation du signal de parole au débit minimum et un circuit de modélisation du signal de

parole à au moins un débit supérieur au débit minimum.

Le système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués objet de la présente invention trouve application, de manière générale, à la transmission de la parole et de données à des débits flexibles, et, plus particulièrement,

aux protocoles de conférences audio-visuelles, au visiopho-

ne, à la téléphonie sur haut-parleurs, au stockage et au transport de signaux audio-numériques sur des liaisons longues distances, à la transmission avec des mobiles et des

systèmes à concentration de voies.

Une description plus détaillée du système de codage-

décodage objet de l'invention sera donnée ci-après en relation avec les dessins dans lesquels, outre la figure l relative à l'art antérieur concernant un codeur prédictif par transformée, la figure 2 représente un schéma de principe du système de codage prédictif d'un signal de parole par transformée

adaptative à codes imbriqués objet de la présente inven-

tion, la figure 3 représente un détail de réalisation d'un module de prédiction à long terme en boucle fermée utilisé dans le système de codage représenté en figure 2, les figures 4 a et 4 b représentent un schéma partiel d'un codeur prédictif par transformée et un schéma équivalent au schéma partiel de la figure 4 a, la figure 5 a représente un organigramme d'un processus de transformée orthonormée construit par apprentissage, la figure 5 b représente deux diagrammes comparatifs de valeurs de gain normalisées obtenus par décomposition en valeurs singulières respectivement par apprentissage, les figures 6 a et 6 b représentent schématiquement le processus de transformation de Householder appliqué au signal perceptuel, la figure 7 représente un module de transformation adaptative mettant en oeuvre une transformation de Householder, la figure 8 a représente, pour la décomposition en valeurs

singulières respectivement la construction pour appren-

tissage, un critère normalisé de gain en fonction du nombre de composantes du vecteur de gains,

la figure 8 b représente un schéma de principe de quanti-

fication vectorielle multiétage dans lequel le vecteur de gains G est obtenu par combinaison linéaire de vecteurs issus de dictionnaires stochastiques, la figure 9 est une représentation géométrique de la prospection du vecteur de gain G dans un sous-espace de vecteurs issus de dictionnaires stochastiques, les figures l Oa e l Ob représentent le schéma de principe d'un processus de quantification vectorielle de gain par modélisations progressives orthogonales, correspondant à une projection optimale de ce vecteur de gain représentée en figure 9, dans le cas d'un seul respectivement de plusieurs dictionnaires stochastiques, la figure 11 représente un mode de réalisation de la modélisation de l'excitation du filtre de synthèse correspondant au débit le plus faible, la figure 12 représente un schéma de principe d'un système

de décodage prédictif d'un signal de parole par transfor-

mée adaptative à codes imbriqués objet de la présente invention, la figure 13 a représente un schéma de principe d'un module de modélisation du signal de parole au débit minimum, la figure 13 b représente un mode de réalisation d'un module de transformation orthonormée inverse,

la figure 14 a représente un schéma d'un module de modéli-

sation du signal de parole aux débits autres que le débit minimum, la figure 14 b représente un schéma équivalent au module de modélisation représenté en figure 14 a, la figure 15 représente la mise en oeuvre d'un filtre adaptatif de post-filtrage destiné à améliorer la qualité

perceptuelle du signal de parole de synthèse Sn.

Une description plus détaillée d'un système de

codage prédictif d'un signal numérique de parole par transformée adaptative en un signal numérique à codes imbriqués sera maintenant donnée en liaison avec la figure

2 et les figures suivantes.

D'une manière générale on considère que le signal numérique codé par la mise en oeuvre du système de codage objet de la présente invention est constitué par un signal de parole codé et le cas échéant par un signal de données auxiliaires insérées au signal de parole codé, après codage

de ce signal numérique de parole.

Bien entendu, le système de codage objet de la

présente invention peut comprendre, à partir d'un trans-

ducteur délivrant le signal de parole analogique, un conver-

tisseur analogique-numérique et un circuit de mémorisation d'entrée ou buffer d'entrée permettant de délivrer le signal

numérique à coder Sn.

Le système de codage objet de la présente invention comprend également un filtre de pondération perceptuelle 11 piloté par une boucle de prédiction à court terme permettant

d'engendrer un signal perceptuel, noté P '.

Il comprend également un circuit de prédiction à long terme, noté 13, délivrant un signal perceptuel estimé,

lequel est noté P'.

Le circuit de prédiction à long terme 13 forme une boucle de prédiction à long terme permettant de délivrer, à partir du signal perceptuel et du signal d'excitation passée estimée, noté \PF un signal d'excitation perceptuelle modélisée. Le système de codage objet de l'invention tel que représenté en figure 2 comporte en outre un circuit de transformée adaptative et de quantification permettant à partir du signal d'excitation perceptuel P, d'engendrer le signal de parole codé ainsi qu'il sera décrit ci-après dans

la description.

Selon un premier aspect particulièrement avantageux du système de codage objet de la présente invention, le filtre de pondération perceptuelle 11 consiste en un filtre de prédiction à court terme du signal de parole à coder, de façon à réaliser une répartition fréquentielle du bruit de quantification Le filtre de pondération perceptuelle 11 délivrant le signal perceptuel P le dispositif de codage selon l'invention comprend ainsi que représenté sur la même figure 2 un circuit 120 de soustraction de la contribution du signal d'excitation passée P, du signal perceptuel pour délivrer un signal perceptuel réactualisé, ce signal

perceptuel réactualisé étant noté P,.

Selon une autre caractéristique particulièrement avantageuse du dispositif de codage objet de la présente invention, le circuit de prédiction à long terme 13 est

formé en boucle fermée à partir d'un dictionnaire réactua-

lisé par l'excitation passée modélisée correspondant au débit le plus faible, ce dictionnaire permettant de délivrer

une forme d'onde optimale et un gain estimé associé à celle-

ci Sur la figure 2, l'excitation passée modélisée corres-

pondant au débit le plus faible est notée rn On indique en outre que la forme d'onde optimale et le gain estimé associé à celle-ci sont constitutifs du signal perceptuel estimé 4 n

délivré par le circuit 13 de prédiction à long terme.

Selon une autre caractéristique du système de codage objet de la présente invention, ainsi que représenté en figure 2, le circuit module de transformée, noté MT, est formé par un module de transformée orthonormé 14, comportant

un module de transformation orthogonale adaptative propre-

ment dit et un module de modélisation progressive par

vecteurs orthogonaux, noté 16.

Conformément à un aspect particulièrement avantageux du système de codage objet de la présente invention, le module de modélisation progressive 16 et le circuit de prédiction à long terme 13 permettent de délivrer des index représentatifs du signal de parole codé, ces index étant notés i(O), j(O) respectivement i(l), j(l) avec 1 E l 1,Ll

sur la figure 2.

Enfin, le système de codage selon l'invention comprend en outre un circuit 19 d'insertion des données

auxiliaires couplé au canal de transmission, noté 18.

Le fonctionnement du dispositif de codage objet de

la présente invention peut être illustré de la façon ci-

après. Ainsi qu'on l'a indiqué précédemment, on cherche à reconstituer un signal synthétique An le plus ressemblant

possible perceptuellement au signal numérique à coder Sn.

Le signal synthétique Qn est bien entendu le signal reconstitué à la réception, c'est à dire au niveau décodage après transmission ainsi qu'il sera décrit ultérieurement

dans la description.

Une analyse de prédiction à court terme formée par le circuit d'analyse 10 de type LPC pour "Linear Predictive Coding" et par le filtre de pondération perceptuelle 11 est réalisée pour le signal numérique à coder par une technique classique de prédiction sur des fenêtres comportant par exemple M échantillons Le circuit d'analyse 10 délivre alors les coefficients ai, o les coefficients ai précités

sont les coefficients de prédiction linéaire.

Le signal de parole à coder Sn est alors filtré par le filtre de pondération perceptuelle 11 de fonction de transfert W(z), lequel permet de délivrer le signal percep- tuel proprement dit, noté P'n'

Les coefficients du filtre de pondération percep-

tuelle sont obtenus à partir d'une analyse de prédiction à court terme sur les premiers coefficients de corrélation de la séquence des coefficients ai du filtre d'analyse A(z) du circuit 10 pour la fenêtre courante Cette opération permet de réaliser une bonne répartition fréquentielle du bruit de quantification En effet, le signal perceptuel délivré tolère des bruits de codage plus importants dans les zones de fortes énergies o le bruit est moins audible, car masqué fréquentiellement par le signal On indique que l'opération de filtrage perceptuel se décompose en deux étapes, le signal numérique à coder Sn étant filtré une première fois par le filtre constitué par le circuit d'analyse 10, afin d'obtenir le résidu à modéliser, puis une seconde fois par le filtre de pondération perceptuelle 11 pour délivrer le a

signal perceptuel P n.

Dans le processus de fonctionnement du dispositif de codage objet de la présente invention, la seconde opération consiste à retirer alors la contribution de l'excitation passée, ou signal d'excitation passée estimée, noté pn du

signal perceptuel précité.

En effet, on montre que:

1 N

Pn = 1,rilhni + 1 h 1 = Pn + Pn () i=-M i= O Dans cette relation, hn est la réponse impulsionnelle du double filtrage réalisé par le circuit 10 et le filtre de pondération perceptuelle 11 dans la fenêtre courante et rn est l'excitation passée modélisée correspondant au débit le plus faible, ainsi qu'il sera décrit ultérieurement dans

la description.

Le mode opératoire du circuit de prédiction à long terme 13 en boucle fermée est alors le suivant Ce circuit permet de prendre en compte la périodicité du résidu pour les sons voisés, cette prédiction à long terme étant réalisée toutes les sous-fenêtres de N échantillons, ainsi

qu'il sera décrit en liaison avec la figure 3.

Le circuit 13 de prédiction à long terme en boucle

fermée comprend un premier étage constitué par un diction-

naire adaptatif 130, lequel est remis à jour toutes les sous-fenêtres précitées par l'excitation modélisée notée

r, délivrée par le module 17, lequel sera décrit ultérieu-

rement dans la description Le dictionnaire adaptatif 130

permet de minimiser l'erreur, notée N-1 E = E ( (rn go rnq)*h(n))2 ( 2) n=O

par rapport aux deux paramètres go et q.

Une telle opération correspond, dans le domaine fréquentiel, à un filtrage par le filtre de fonction de transfert: B(z) = 1 ( 3)

1 goz-

Cette opération est équivalente à la recherche de la forme d'onde optimale, notée f J(O) et de son gain associé go dans un dictionnaire judicieusement construit Confer l'article publié par R Rose, et T Barnwell, intitulé "Design

and Performance of an Analysis by Synthesis Class of Predic-

tive Speech Coders", IEEE Trans on Acoustic Speech Signal

Proceessing, Septembre 1990.

La forme d'onde d'indice j, notée Cn = rn issue du dictionnaire adaptatif, est filtrée par un filtre 131 et correspond à l'excitation modélisée au débit le plus

faible rn retardé de q échantillons par le filtre précité.

La forme d'onde optimale fn est délivrée par le dictionnaire

adaptatif filtré 133.

Un module 132 de calcul et de quantification du gain de prédiction permet à partir du signal perceptuel P, et de l'ensemble des formes d'ondes f N (O) d'effectuer un calcul de quantification du gain de prédiction, et de délivrer un index i(O) représentatif du numéro de la plage de quantifi-

cation, ainsi que son gain associé quantifié g(O).

Un circuit multiplicateur 134 délivre à partir du dictionnaire adaptatif filtré 133, c'est-à-dire du résultat j j de filtrage de la forme d'onde d'indice j Cn, soit fn, et du gain associé quantifié g(O), l'excitation de prédiction à

long terme modélisée et filtrée perceptuellement notée Pn.

Un circuit soustracteur 135 permet alors d'effectuer

une minimisation portant sur en = Pn "n NI cette expres-

sion représentant le signal d'erreur Un module 136 permet

de calculer la norme euclidienne |en| 2.

Un module 137 permet de rechecher la forme d'onde optimale correspondant à la valeur minimale de la norme euclidienne précitée et de délivrer l'index j(O) Les paramètres transmis par le système de codage objet de l'invention pour la modélisation du signal de prédiction à long terme sont alors l'indice j(O) de la forme d'onde optimale fi(O) ainsi que le numéro i(O) de la plage de

quantification de son gain associé g(O) quantifié.

Une description plus détaillée du module de trans-

formation orthogonale adaptative MT de la figure 2 sera

donnée en liaison avec les figures 4 a et 4 b.

Dans le cadre de la mise en oeuvre du système de codage prédictif par transformée orthonormée objet de la présente invention, la méthode utilisée pour la construction de cette transformée correspond à celle proposée par B.S Atal et E Ofer, ainsi que mentionné précédemment dans la

description.

Conformément au mode de réalisation du système de codage selon la présente invention, celui-ci consiste à décomposer, non la matrice de filtrage de prédiction à court terme, mais la matrice de pondération perceptuelle W formée par une matrice de Toeplitz triangulaire inférieure définie par la relation ( 4) w( 0) O O O O O O O W =() w(O) O O O O O w( 2) w( 1) w(O) O O O O w( 3) w( 2) w( 1) w(O) O O O w(N-1) w(N-2) w(N-3) w(N- 4) w( 2) w( 1) w(O) Dans cette relation, w(n) désigne la réponse impulsionnelle du filtre de pondération perceptuelle W(z) de

la fenêtre courante précédemment mentionnée.

Sur la figure 4 a, on a représenté le schéma partiel d'un codeur prédictif par transformée et sur la figure 4 b, le schéma équivalent correspondant dans lequel la matrice ou filtre de pondération perceptuelle W, désigné par 140, a été mise en évidence, un filtre de pondération perceptuelle inverse 121 ayant par contre été inséré entre le module de

prédiction à long terme 13 et le circuit soustracteur 120.

On indique que le filtre 140 réalise une combinaison linéaire des vecteurs de base obtenus à partir d'une décomposition en valeurs singulières de la matrice représentative du filtre de pondération perceptuelle W. Ainsi que représenté sur la figure 4 b, le signal S', correspondant au signal de parole à coder S, auquel il a été soustrait la contribution de l'excitation passée délivrée par le module 12, ainsi que celle de la prédiction à long terme Pn filtrée par un module de pondération perceptuelle inverse de fonction de transfert (W(z))-', est filtré par le filtre de pondération perceptuelle de fonction de transfert

W(z), de façon à obtenir le vecteur P'.

Cette opération de filtrage s'écrit:

P' = WS'

et peut être exprimée sous forme d'une combinaison linéaire de vecteurs de base en utilisant la décomposition en valeurs singulières de la matrice W. En ce qui concerne le mode de réalisation du filtre de pondération perceptuelle 140, on indique que celui-ci comprend pour toute matrice W représentative du filtre de pondération perceptuelle un premier module matriciel U = (U 1,,UN) et un deuxième module matriciel

V = (V,,VN).

Le premier et le deuxième modules matriciels vérifient la relation:

UTWV = D

relation dans laquelle: UT désigne le module matrice transposée du module U, D est un module matrice diagonale dont le coefficients constituent les valeurs singulières précitées,

Ui et Vj désignent respectivement le ième vecteur singu-

lier gauche et le jème vecteur singulier droit, les

vecteurs singuliers droit { Vjl} formant une base orthonor-

mée.

Une telle décomposition permet de remplacer l'opéra-

tion de filtrage par produit de convolution par une opéra-

tion de filtrage par une combinaison linéaire.

On indique que la décomposition en valeurs singuliè-

res de la matrice de filtrage perceptuelle W permet d'obte- nir les deux matrices unitaires U et V vérifiant la relation précitée o

UTWV = diag(dl,,d)

avec la propriété d'ordonnancement telle quedi d di+ 1 > 0.

Les éléments di sont appelés valeurs singulières, et les

vecteurs Ui et Vj, ième vecteur singulier gauche, respective-

ment jème vecteur singulier droit.

La matrice W se décompose alors en une somme de matrices de rang 1, et vérifie la relation: N W = UDV = E Uidi Vl ( 5) i=l La matrice V étant unitaire, les vecteurs singuliers droits { Vi} forment une base orthonormée et le signal S', exprimé sous la forme: N S' = Z g(i)Vi avec 9 (i) = <S',Vi> ( 6) i=l permet d'obtenir le vecteur P' vérifiant la relation: N T N, N d P' = WS' = ( x Uidi Vi * zg(k)Vk) = g(k)U( 7) i= 1 k= 1 k= 1

avec g(k) = g(k)dk.

Par le processus de décomposition en valeurs singulières, on indique qu'un changement sur une composante de l'excitation S' associée à une petite valeur singulière produit un changement petit à la sortie du filtre 140 et vice-versa pour l'opération de filtrage perceptuel inverse

effectuée par le module 121.

Afin d'utiliser ces propriétés, la matrice unitaire U peut être utilisée en tant que transformée orthonormée, vérifiant la relation: F = lfo'rth,,forthl, c'est à dire: ( 8) foirth = Ui pour i = 1 à N. Le signal perceptuel pondéré P' se décompose alors de la façon ci- après:

G = UTP' ( 9)

Après quantification vectorielle des gains G, le signal perceptuel pondéré modélisé P est calculé de la manière ci-après:

' F = UG ( 10)

On indique que les vecteurs singuliers gauches associés aux plus grandes valeurs singulières jouent un rôle prépondérant dans la modélisation du signal perceptuel pondéré P' Ainsi, afin de modéliser ce dernier, il est possible de ne conserver que les composantes associées aux K valeurs singulières les plus grandes, K < N, c'est-à-dire les K premières composantes du vecteur de gain G vérifiant la relation: G = (gl,g 2 g K, 0,) ( 11) Le circuit de filtrage d'analyse à court terme 10 étant réactualisé sur des fenêtres de M échantillons, la décomposition en valeurs singulières de la matrice de

pondération perceptuelle W est effectuée à la même fréquen-

ce.

Des processus de décomposition en valeurs singuliè-

res d'une matrice quelconque permettant un traitement rapide ont été développés, mais les calculs restent relativement complexes. Conformément à un objet de la présente invention, il est, afin de simplifier les opérations de traitement précitées, proposé de construire une transformée orthonormée fixe sous optimale possédant cependant de bonnes propriétés

perceptuelles, quelle que soit la fenêtre courante.

Dans un premier mode de réalisation, tel que

représenté en figure 5, le processus de transformée ortho-

normée est construit par apprentissage Dans un tel cas, le module de transformée orthonormée peut être formé par un sous-module de transformée stochastique construite par

tirage d'une variable aléatoire gaussienne pour l'initiali-

sation, ce sous-module comportant sur la figure 5 les étapes

de processus 1000, 1001, 1002 et 1003 et étant noté SMTS.

L'étape 1002 peut consister à appliquer l'algorithme de la

K-moyenne sur le corpus de vecteur précité.

Le sous-module SMTS est suivi successivement d'un module 1004 de construction des centres, d'un module 1005 de construction des classes et, afin d'obtenir un vecteur G dont les composantes soient relativement ordonnées, d'un module 1006 de réordonnancement de la transformée selon le

cardinal de chaque classe.

Le module 1006 précité est suivi d'un module de calcul de Gram- Schmidt, noté 1007 a, de façon à obtenir une transformée orthonormée Au module 1007 a précité est associé un module 1007 b de calcul de l'erreur dans les conditions classiques de mise en oeuvre du processus de traitement de Gram-Schmidt. Le module 1007 a est lui-même suivi d'un module 1008 de test sur le nombre d'itération, ceci afin de permettre d'obtenir une transformée orthonormée effectuée hors ligne par apprentissage Enfin, la mémoire 1009 de type mémoire morte permet de mémoriser la transformée orthonormée sous

forme de vecteur de transformée On indique que l'ordonnan-

cement relatif des composantes du vecteur de gain G est accentué par le processus d'orthogonalisation Lorsque le processus de construction par apprentissage a convergé, on obtient une transformée orthonormée dont les formes d'ondes sont graduellement corrélées avec le corpus d'apprentissage des vecteurs délivrés par l'étape 1001 de transformée initiale. La figure 5 b représente l'ordonnancement des composantes du vecteur de gain G, c'est-à-dire de la valeur G moyenne normalisée pour une transformée obtenue d'une part par décomposition en valeurs singulières de la matrice de

pondération perceptuelle W, et d'autre part, par apprentis-

sage La transformée F obtenue par cette dernière méthode pour celles des formes d'ondes orthonormées dont les spectres en fréquence sont passe-bandes et relativement ordonnés en fonction de k, ce qui permet d'attribuer à cette transformée des propriétés pseudo- fréquentielles Une évaluation de la qualité de transformation en termes de concentration d'énergie a permis de montrer que, à titre indicatif, sur un corpus de 38 000 vecteurs perceptuels P', le gain de transformation est de 10 35 décibels pour la transformée optimale de Karhunen-Loeve, et de 10 29 décibels pour une transformée construite par apprentissage, cette dernière tendant donc vers la transformée optimale en termes

de concentration d'énergie.

Ainsi que précédemment mentionné dans la descrip-

tion, la transformée orthonormée F peut être obtenue selon

deux méthodes différentes.

En observant que généralement la forme d'onde la plus corrélée avec le signal perceptuel P est celle issue du dictionnaire adaptatif, il est possible d'envisager de réaliser une transformée orthonormée adaptative F' dont

f' Orth est égal à la forme d'onde optimale issue du diction-

naire adaptatif fi(O) normalisé, la première composante du vecteur de gain G étant alors égale au gain de prédiction à long terme normalisé g(O), qu'il n'est pas nécessaire de recalculer, puisque celui-ci a été quantifié lors de cette prédiction. La nouvelle dimension du vecteur de gain G devient alors égale à N-l, ce qui permet d'augmenter le nombre

d'éléments binaires par échantillon lors de la quantifica-

tion vectorielle de celui-ci et donc la qualité de sa modélisation. Une première solution pour calculer la transformée F' peut alors consister à faire une analyse de prédiction à

* long terme, à décaler la transformée obtenue par apprentis-

sage d'un cran, de placer le prédicteur à long terme à la

première position, puis d'appliquer l'algorithme de Gram-

Schmidt, afin d'obtenir une nouvelle transformée F'.

Une seconde solution, plus avantageuse, consiste à utiliser une transformation permettant de faire pivoter la base orthonormée, afin que la première forme d'onde coïncide avec le prédicteur à long terme, c'est-à-dire

F' = TF

avec fi(O) orth -= Tforth ( 2 ffirh ( 12)

Dans le but de conserver la propriété d'orthogona-

lité, la transformation utilisée doit conserver le produit scalaire Une transformation particulièrement adaptée est la transformée de Householder vérifiant la relation

T = I -2 BBT ( 13)

BTB

B fi(O) fi(O)I fi avec B = If)l orth Une représentation géométrique de la transformée

précitée est donnée en figures 6 a et 6 b.

Pour une définition plus détaillée de ce type de transformation, on pourra utilement se reporter à la publication de Alan O Steinhardt intitulée "Householder Transforms in Signal Processing", IEEE ASSP Magazine, July

1988, pp 4-12.

Par l'utilisation de cette transformation, il est

possible de réduire la complexité des calculs et la projec-

tion du signal perceptuel P dans cette nouvelle base s'écrit: G = Fa TP = FTTP = F Tpu ( 14)

avec P' = TP = (P-Blw BTPl).

Dans cette relation, W désigne un scalaire égal à

W = 2/BTB.

On indique que dans ce mode de réalisation de la transformée orthonormée, la transformation n'est appliquée qu'au signal perceptuel P et le signal perceptuel modélisé

P peut être alors calculé par la transformation inverse.

Un mode de réalisation particulièrement avantageux du module de transformée orthonormée proprement dit 14 dans le cas o une transformation de Householder est utilisée

sera maintenant décrit en liaison avec la figure 7.

Ainsi qu'on l'a représenté sur la figure 7 précitée, le module 14 de transformation adaptative peut comporter un module 140 de transformation de Householder recevant le signal perceptuel estimé constitué par la forme d'onde optimale et par le gain estimé et le signal perceptuel P pour engendrer un signal perceptuel transformé P" On indique que le module 140 de transformation de Householder comporte un module de calcul 1401 des paramètres B et w B tels que définis précédemment par la relation 13 Il

comporte également un module 1402 comprenant un multiplica-

teur et un soustracteur permettant de réaliser la transformation proprement dite selon la relation 14 On indique que le signal perceptuel transformé P" est délivré sous forme de vecteur de signal perceptuel transformé de

composante P"k, avec k E l 0,N-1 l.

Le module de transformation adaptative 14 tel que rerpésenté en figure 7 comprend également une pluralité N de registres de mémorisation des formes d'ondes orthonormées, le registre courant étant noté r, avec r E l 1,Nl On indique que les N registres de mémorisation précités forment la

mémoire morte précédement décrite dans la description,

chaque registre comportant N cellules de mémorisation, chaque composante de rang k de chaque vecteur, composante notée folrth(k) étant mémorisée dans une cellule de rang

correspondant du registre courant r considéré.

En outre, ainsi qu'on l'observera sur la figure 7,

le module 14 comprend une pluralité de N circuits multipli-

cateurs associés à chaque registre de rang r formant la pluralité des registres de mémorisation précédemment mentionnés En outre, chaque registre multiplicateur de rang k reçoit d'une part la composante de rang k du vecteur mémorisé et d'autre part la composante P"k du vecteur de signal perceptuel transformé de rang k correspondant Le circuit multiplicateur Mrk délivre le produit P"k forth(k) des

composantes de signal perceptuel transformé.

Enfin, une pluralité de N-1 circuits sommateurs est associée à chaque registre de rang r, chaque circuit sommateur de rang k, noté Srk, recevant le produit de rang antérieur k-l, et le produit de rang correspondant k délivré par le circuit multiplicateur Mrk de même rang k Le circuit sommateur de rang le plus élevé, Sr N-l, délivre alors une composante g(r) du gain estimé exprimé sous forme de vecteur de gain G. On indique que le système de codage prédictif utilisant la transformée orthonormée adaptative construite par apprentissage est susceptible de donner de meilleurs résultats, alors que la transformation de Householder permet

d'obtenir une complexité réduite.

Ainsi qu'on l'observera sur la figure 2, le module de modélisation progressive par vecteurs orthogonaux comporte en fait un module 15 de normalisation du vecteur de gain pour engendrer un vecteur de gain normalisé, noté Gk, par comparaison de la valeur normée du vecteur de gain G par rapport à une valeur de seuil Ce module de normalisation 15 permet d'engendrer en outre un signal de longueur du vecteur de gain normalisé lié à l'ordre de modélisation k vers le

système décodeur en fonction de cet ordre de modélisation.

Le module de modélisation progressive par vecteurs orthogonaux comporte en outre, en cascade avec le module 15 de normalisation du vecteur de gain, un étage 16 de modélisation progressive par vecteurs orthogonaux Cet étage de modélisation 16 reçoit du vecteur normalisé Gk et délivre les index représentatifs du signal de parole codée, ces index étant notés I( 1), J(l), ces index étant représentatifs des vecteurs sélectionnés et de leur gain associé La transmission des données auxiliaires formées par les index est effectuée en écrasant les parties de la trame allouée aux indices et numéros de plages pour former le signal de

données auxiliaires.

Le fonctionnement du module de normalisation 15 est

le suivant.

L'énergie du signal perceptuel donnée par |p F 12 = AGE 2

est constante pour une sous fenêtre donnée Dans ces condi-

tions, maximiser cette énergie est équivalent à minimiser l'expression:

N K

IPI-FITGKI 2 =Z gi 2 = l P'I 2E gi 2 ( 15) i=K+l i= 2

o Gk = (Og 2,g 3 r,g Kf , O).

On indique que lors d'une telle opération, une façon supplémentaire d'augmenter le nombre d'éléments binaires par échantillon lors de la quantification vectorielle du vecteur G est d'utiliser le critère normalisé suivant, consistant à choisir K tel que K Z gk k= 2 IIP'II 2 S avec O 5 S S 1 ( 16) Le vecteur de gain ainsi obtenu GK est alors quantifié et sa longueur k est transmise par le système de codage objet de l'invention afin d'être prise en compte par le système de décodage correspondant, ainsi qu'il sera

décrit ultérieurement dans la description.

Le critère normalisé moyen en fonction de l'ordre de modélisation K est donné en figure 8 a pour une transformée orthonormée obtenue d'une part par décomposition en valeurs singulières de la matrice de pondération perceptuelle W et

d'autre part par apprentissage.

Un mode de réalisation particulièrement avantageux

du module de modélisation progressive par vecteurs orthogo-

naux 16 sera maintenant donné en liaison avec la figure 8 b.

Le module précité permet de réaliser en fait une quantifica-

tion vectorielle multiétage.

Le vecteur de gain est obtenu par combinaison linéaire de vecteurs, notée g = ( 0, W 2, f 3,,UO,0 O) ( 17)

Ces vecteurs étant issus de dictionnaires stochasti-

ques, notés 161, 162, 16 L, construits soit par tirage d'une variable aléatoire gaussienne, soit par apprentissage Le vecteur de gain estimé G vérifie la relation /6 'l L i= 1 Dans cette relation, e 1 est le gain associé au vecteur optimal IF(î) issu du dictionnaire stochastique de

rang 1, noté 16 1.

Toutefois, les vecteurs sélectionnés itérativement ne sont généralement pas linéairement indépendants et ne forment donc pas une base Dans un tel cas, le sous-espace engendré par les L vecteurs optimaux t(L)est de dimension inférieure à L. Sur la figure 9 on a représenté la projection du vecteur G sur le sous-espace engendré par les vecteurs optimaux de rang 1, respectivement 1-1, cette projection

étant optimale lorsque les vecteurs précités sont orthogo-

naux.

Il est donc particulièrement avantageux d'orthogona-

liser le dictionnaire stochastique de rang 1 par rapport au

vecteur optimal de l'étage de rang précédent K 11.

Ainsi, quel que soit le vecteur optimal de rang 1 issu du nouveau dictionnaire ou étage de rang correspondant 1, celui-ci sera orthogonal au vecteur optimal Fj ( 11 de rang antérieur, et l'on obtient: orth(l) orth(l+l)orth( 1)r(lj) ( 1) ( 18) Dans cette relation, on indique que: ( 1)1 y( 1) j 1 2 ( 9 a, -= orth(I) I 2 ( 19) correspond à l'énergie de l'onde sélectionnée à l'étape 1, orth( 1) r(l,j) = < pi 1 5 r(l,) = <,i orth(l) > ( 20) représente l'intercorrélation des vecteurs optimaux de rang j et de rang j(l) et Iorth( 1) TK i N (J)T TK N r= INo th(l)T ( 21)

1 C 1

représente la matrice d'orthogonalisation.

L'opération précédente permet de retirer du diction-

Hnaire la contribution de l'onde précédemment sélectionnée et impose ainsi une indépendance linéaire pour tout vecteur optimal de rang i compris entre 1 + 1 et L par rapport aux

vecteurs optimaux de rang inférieur.

Des schémas de principe de la quantification vectorielle par modélisation progressive orthogonale sont donnés aux figures 10 a et 10 b selon qu'il existe un ou

plusieurs dictionnaires stochastiques.

Afin de réduire la complexité du processus de quantification vectorielle, on indique que l'algorithme de Gram-Schmidt modifié récursif peut être utilisé ainsi que

proposé par N Moreau, P Dymarski, A Vigier, dans la publica-

tion intitulée: "Optimal and Suboptimal Algorithms for Selecting the Excitation in Linear Predictive Products",

Proc ICASSP 90, pp 485-488.

Compte tenu des propriétés d'orthogonalisation, on montre que:

1 1-1

r 1) l v >r(i,j()r(ij)l ( 22) i:l Compte tenu de cette expression, l'algorithme de Gram- Schmidt modifié récursif tel que proposé précédemment

peut être utilisé.

Il n'est alors plus nécessaire de recalculer

explicitement les dictionnaires à chaque étape de l'orthogo-

nalisation. Le processus de calcul précité peut être explicité sous forme matricielle à partir de la matrice A = l 3 ( 1), ( 1) ( 23) in r(l i( 2 r(l i(L-i 1)rfd(L) j (i) 1 aj( 1) O 1 r( 2 L i (L a(( 2) j(i) n-I i( 1) A=QR=l: orth(l) orth(L)l ( 24) O 1 r(L-1 t(L))

0 1

Y L-1 On indique que Q est une matrice orthonormée, et R une matrice triangulaire supérieure dont les éléments de la diagonale principale sont tous positifs, ce qui assure

l'unicité de la décomposition.

Le vecteur de gain G vérifie la relation matriciel-

le: G = Q e = A 8 = QRO ( 25)

%

ce qui implique que R 8 = 8.

La matrice R triangulaire supérieure permet ainsi de calculer récursivement les gains 8 (k) relatifs à la base d'origine. La contribution des vecteurs optimaux à la base orthonormée, notée orth(L)j} dans la modélistion du vecteur de gain GK a tendance à décroître, et les gains { l} sont ordonnés de façon décroissante Le résidu peut être modélisé de façon graduelle de la façon ci-après o ék d désigne le gain associé au vecteur optimal orthogonal orth(k) quantifié, compte tenu des relations: L Cod qi 3 j ( 1) G E E 1, orth( 1) i= 1 2 L 2-1 -Cod j() = E) orth( 1) l=L 1 L = 'cod v orth(l) l=L 2 G = G 1 + G + G 3 (Débit le plus élevé) = G 1 + G 2 (Débit intermédiaire) G = G 1 (Débit le plus faible) avec 1 < Li < L 2 L. On obtient alors les vecteurs de gain Gl, G 2, G 3 orthogonaux dont la contribution dans la modélisation du vecteur de gain G est décroissante, ce qui permet la modélisation graduelle du résidu rn de manière efficace Les paramètres transmis par le système de codage objet de l'invention pour la modélisation du vecteur de gain G sont alors les indices j(l) des vecteurs sélectionnés ainsi que les numéros i(l) des plages de quantification de leurs gains associés, EQ La transmission des données se fait alors en écrasant les parties de la trame allouées aux indices et numéros de plages j(l), i(l), pour 1 E lL 1,L 2-1 l et lL 2, Ll

selon les besoins de la communication.

Le processus de traitement précédemment mentionné utilise l'algorithme de Gram-Schmidt modifié récursif afin de coder le vecteur de gain G Les paramètres transmis par le système de codage selon l'invention étant les indices précités, j(O) à j(L) des différents dictionnaires ainsi que

les gains quantifiés g(O) et { e, il est nécessaire de co-

der les différents gains précités g(O) et f ej Une étude a montré que les gains relatifs à la base orthogonale { q J (L>) orth(L)' étant décorrélés, ceux-ci possèdent de bonnes propriétés pour leur quantification En outre, la contribution des vecteurs optimaux dans la modélisation du vecteurs de gain G ayant tendance à décroître, les gains t 161 sont ordonnés de façon relativement décroissantes, et il est possible d'utiliser cette propriété en codant non pas les gains précités, mais leur rapport donné par el/ 01 Plusieurs solutions peuvent être utilisées pour coder les rapports précités. Ainsi qu'on le remarquera sur la figure 2, le dispositif de codage objet de la présente invention comporte un module de modélisation de l'excitation du filtre de synthèse correspondant au débit le plus faible, ce module

étant noté 17 sur la figure précitée.

Le schéma de principe de calcul du signal d'excita-

tion du filtre de synthèse correspondant au débit le plus faible est donné en figure 11 Une transformation inverse est appliquée aux vecteurs de gain modélisés G, cette transformation adaptative inverse pouvant par exemple

correspondre à une transformation inverse de type Househol-

der, laquelle sera décrite ultérieurement dans la decrip-

tion, en liaison avec le dispositif de décodage objet de la présente invention Le signal obtenu après transformation adaptative inverse est ajouté au signal de prédiction à long terme B'I au moyen d'un sommateur 171, le signal perceptuel estimé ou signal de prédiction à long terme étant délivré par le circuit 13 de prédiction à long terme en boucle fermée Le signal résultant délivré par le sommateur 171 est filtré par un filtre 172, lequel correspond du point de vue de la fonction de transfert au filtre 131 de la figure 3 Le filtre 172 délivre le signal résiduel modélisé fr 1 rn Un système de décodage prédictif par transformée adaptative à codes imbriqués d'un signal numérique codé constitué par un signal de parole codée, et le cas échéant, par un signal de données auxiliaires inséré au signal de parole codé après codage de ce dernier sera maintenant

décrit en liaison avec la figure 12.

Selon la figure précitée, le système de décodage comprend un circuit 20 d'extraction du signal de données permettant d'une part l'extraction des données en vue d'une utilisation auxiliaire, par une sortie des données auxiliai- res et, d'autre part, la transmission d'index représentatifs du signal de parole codé On comprend bien sûr que les index précités sont les index i(l) et j(l), pour 1 compris entre

O et L 1-l précédemment décrits dans la description et pour

1 compris entre l et L dans les conditions qui seront décrites ci-après Ainsi qu'on l'a représenté en outre en figure 12, le système de décodage selon l'invention comprend un circuit 21 de modélisation du signal de parole au débit minimum, ainsi qu'un circuit 22 ou 23 de modélisation du signal de parole à au moins un débit supérieur au débit

minimum précité.

Dans un mode de réalisation préférentiel, tel que représenté en figure 12, le système de décodage selon l'invention comporte, outre le système d'extraction des données 20, un premier module 21 de modélisation du signal de parole au débit minimum recevant directement le signal codé et délivrant un premier signal de parole estimé, noté S, et un deuxième module 22 de modélisation du signal de

parole à un débit intermédiaire connecté au système d'ex-

traction 20 des données par l'intermédiaire d'un circuit 27 de commutation conditionnelle sur critère du débit réel alloué au signal de parole et délivrant un deuxième signal de parole estimé, noté Le système de décodage représenté en figure 12 comporte également un troisième module de modélisation 23 du signal de parole à un débit maximum, ce module étant

connecté au système d'extraction des données 20 par l'inter-

médiaire d'un circuit 28 de commutation conditionnelle sur critère du débit réel alloué à la parole et délivrant un

troisième signal de parole estimé in.

En outre, un circuit sommateur 24 reçoit le premier, le deuxième et le troisième signal de parole estimé, et délivre à sa sortie un signal de parole estimé résultant, noté 4 %, En sortie du circuit sommateur 24 sont connectés en cascade un circuit de filtrage adaptatif 25 recevant le signal de parole estimé résultant S et délivrant un signal de parole estimé reconstitué, noté /n, Un convertisseur numérique- analogique 26 peut être prévu pour recevoir le signal de parole reconstitué et pour délivrer un signal de

parole reconstitué audio-fréquence.

Selon une caractéristique particulièrement avanta-

geuse du dispositif de décodage objet de la présente invention, chacun des modules de modélisation du signal de

parole à un débit minimum, intermédiaire et maximum, c'est-

à-dire les modules 21, 22 et 23 de la figure 12, comprend un sous-module de transformation adaptative inverse, suivi d'un

filtre de pondération perceptuelle inverse.

Le schéma de principe du module de modélisation du

signal de parole au débit minimum est donné en figure 13 a.

D'une manière générale, le système de décodage objet de la présente invention prend en compte les contraintes imposées par la transmission des données au niveau du système de codage et notamment au niveau du dictionnaire

adaptatif, ainsi que la contribution de l'excitation passée.

Le circuit de modélisation du signal de parole au débit minimum 21 est identique à celui décrit relativement au circuit 17 du système de codage selon l'invention à partir d'un module de transformation adaptative inverse semblable au module 170 décrit en relation avec la figure 11 On note simplement que sur la figure 13 a, on a explicité l'obtention du signal perceptuel Pn à partir des index Ii(O),j(O)1, de l'ordre de modélisation K et des indices

i(l),j(l) pour 1 = 1 à Ll-1.

En ce qui concerne la transformation adaptative inverse, un mode de réalisation avantageux de celle-ci est

représenté en figure 13 b On indique que le mode de réalisa-

tion représenté en figure 13 b correspond à une transformée

de type Householder inverse utilisant des éléments identi-

ques à la transformée de Householder représentée en figure 7 On indique simplement que pour un signal perceptuel délivré par le circuit de prédiction à long terme 13, ce signal étant noté P 1, entrant dans un module semblable 140, les signaux entrant dans le module 1402, respectivement au niveau des multiplicateurs associés à chaque registre, sont inversés Le signal résultant délivré par le sommateur correspondant au sommateur 171 de la figure 11 est filtré par un filtre de fonction de transfert inverse de la

fonction de transfert de la matrice de pondération percep-

tuelle et correspondant au filtre 172 de la même figure 11.

Les modules de modélisation du signal de parole au débit intermédiaire ou au débit maximum, module 22 ou 23,

sont représentés en figures 14 a et 14 b.

Bien entendu, il est possible pour des raisons de complexité de regrouper les différentes modélisations du signal de parole correspondant aux autres débits en un seul bloc tel que représenté sur la figure 14 a et 14 b Selon le

débit réel alloué à la parole, les vecteurs de gain modéli-

sés îG 2, IG 3 sont additionnés, ainsi que représenté en figure

14 b, par un sommateur 220, soumis au processus de transfor-

mation adaptative inverse dans un module 221 identique au module 210 de la figure 13 a, puis filtrés par le filtre de pondération inverse W- '(z) précédemment mentionné, ce filtre étant désigné par 222, le filtrage partant de conditions initiales nulles, ce qui permet d'effectuer une opération équivalente à la multiplication par la matrice inverse W-1, afin d'obtenir une modélisation progressive du signal de synthèse Ain On note sur la figure 14 b la présence de dispositifs de commutation, lesquels nesont autres que les dispositifs de commutation 24 et 28 représentés en figure 12, lesquels sont commandés en fonction du débit réel des

données transmises.

Enfin, en ce qui concerne le filtre adaptatif 25, un mode de réalisation particulièrement avantageux est donné en figure 15 Ce filtre adaptatif permet d'améliorer la qualité perceptuelle du signal de synthèse S, obtenu suite à la sommation par le sommateur 24 Un tel filtre comprend par exemple un module de post-filtrage à long terme noté 250, suivi d'un module de post-filtrage à court terme et d'un module 252 de contrôle de l'énergie, lequel est piloté par un module 253 de calcul du facteur d'échelle Ainsi, le filtre adaptatif 25 délivre le signal N filtré, ce signal

correspondant au signal dans lequel le bruit de quantifica-

tion introduit par le codeur sur le signal de parole synthétisé a été filtré dans les endroits du spectre o cela est possible On indique que le schéma représenté en figure correspond aux publications de J H Chen et A Gersho,

"Real Time Vector APC Speech Coding at 4800 Bps with Adapta-

tive Postfiltering", ICASSP 87, Vol 3, pp 2185-2188.

On a ainsi décrit un système de codage prédictif par transformée orthonormée à codes imbriqués permettant d'apporter des solutions inédites dans le domaine des codeurs à codes imbriqués On indique que d'une manière générale, le système de codage objet de l'invention permet un codage en bande élargie à des débits parole/données de

32/0 kbit/s, 24/8 kbit/s et 16/16 kbit/s.

Claims

REVENDICATIONS

1 Système de codage prédictif d'un signal numéri-

que en un signal numérique à codes imbriqués, codé par transformée adaptative à codes imbriqués, dans lequel le signal numérique codé est constitué par un signal de parole

codé et, le cas échéant, par un signal de données auxiliai-

res, insérées au signal de parole codé après codage de ce dernier, système du type comportant un filtre de pondération perceptuelle ( 11) piloté par une boucle de prédiction à court terme permettant d'engendrer un signal perceptuel *P et un circuit de prédiction à long terme délivrant un signal perceptuel estimé Pn, ce circuit de prédiction à long terme formant une boucle de prédiction à long terme permettant de délivrer, à partir du signal perceptuel et du signal

d'excitation passée estimé, un signal d'excitation percep-

tuelle modélisé, et des moyens de transformée adaptative et de quantification permettant à partir du signal d'excitation

perceptuelle d'engendrer le signal de parole codé, caracté-

risé en ce que le filtre de pondération perceptuelle consiste en un filtre de prédiction à court terme du signal de parole à coder, de façon à réaliser une répartition fréquentielle du bruit de quantification, et en ce qu'il comprend un moyen ( 12) de soustraction de la contribution du signal d'excitation t P, passée dudit signal perceptuel pour délivrer un signal perceptuel réactualisé Pn, et en ce que le circuit de prédiction à long terme est formé, en boucle

fermée, à partir d'un dictionnaire réactualisé par l'excita-

tion passée modélisée correspondant au débit le plus faible permettant de délivrer une forme d'onde optimale et un gain estimé associé à celle-ci, constitutifs du signal perceptuel estimé, et en ce que les moyens de transformée sont formés par un module de transformée orthonormée comportant un module de transformation orthogonale adaptative et un module de modélisation progressive par vecteurs orthogonaux, ces

moyens de modélisation progressive et le circuit de prédic-

tion à long terme permettant de délivrer des index représen-

tatif S du signal de parole codé, ledit système comportant en outre des moyens ( 19) d'insertion des données auxiliaires

couplés au canal de transmission.

2 Système de codage selon la revendication 1, caractérisé en ce que ledit module de transformation orthogonale adaptative comporte: un filtre réalisant une combinaison linéaire des vecteurs de base, obtenus à partir d'une décomposition en valeurs singulières de la matrice représentative du filtre de

pondération perceptuelle.

3 Système de codage selon la revendication 2, caractérisé en ce que ledit filtre comprend pour toute

matrice W représentative du filtre de pondération percep-

tuelle: un premier module matriciel U = (U 1,,UN) et un deuxième module matriciel V = (V 1, V,), lesdits premier et deuxième modules matriciels vérifiant la relation: UTWV = D dans laquelle Ut désigne le module matrice transposée du module U, et o D est un module matrice diagonale dont les coefficients constituent lesdites valeurs singulières, Ui et V, désignant respectivement le im vecteur singulier gauche et le jère vecteur singulier droit, lesdits vecteurs singuliers droits IV) formant une base orthonormée, ce qui permet de transformer l'opération de filtrage par produit de

convolution par une opération de filtrage par une combinai-

son linéaire.

4 Système de codage selon la revendication 1,

caractérisé en ce que ledit module de transformée orthonor-

mée est formé par: une sous-module de transformée stochastique construite par tirage d'une variable aléatoire gaussienne, pour l'initialisation, un module de moyennisation globale sur une pluralité de vecteurs issus d'un codeur prédictif par transformée, un module de réordonnancement, un module de traitement de Gram-Schmidt, une réitération des traitements par les modules précédents permettant d'obtenir une transformée orthonormée, effectuée hors ligne, formée par apprentissage,

une mémoire de type mémoire morte, permettant de mémori-

ser la transformée orthonormée, sous forme de vecteurs de transformée. Système de codage selon la revendication 4, caractérisé en ce que ladite transformée est formée par des formes d'ondes orthonormées dont les spectres de fréquence sont passe-bandes et ordonnées relativement, la première forme d'onde des formes d'ondes orthonormées ordonnées

relativement étant égale à la forme d'onde optimale normali-

sée issue dudit dictionnaire adaptatif et la première composante de gain estimé est égale au gain de prédiction à

long terme normalisé.

6 Système de codage selon la revendication 2 et 5, caractérisé en ce que ledit module de transformation adaptative comporte: un module de transformation de Householder recevant ledit signal perceptuel estimé pi constitué par ladite forme d'onde optimale et par ledit gain estimé, et ledit signal perceptuel pour engendrer un signal perceptuel transformé P" sous forme de vecteur de signal perceptuel transformé de composante P"k, et une pluralité de N registres de mémorisation desdites

formes d'ondes orthonormées, ladite pluralité de regis-

tres formant ladite mémoire morte, chaque registre de rang r comportant N cellules de mémorisation, une composante de rang k de chaque vecteur étant mémorisée dans une cellule de rang correspondant, une pluralité de N circuits multiplicateurs associée à chaque registre formant ladite pluralité de registres de mémorisation, chaque circuit multiplicateur de rang k recevant, d'une part, la composante de rang k du vecteur mémorisé, et, d'autre part, la composante P'k du vecteur de signal perceptuel transformé de rang k, et délivrant le produit P"k fk'rth(k) des composantes de vecteur de signal perceptuel transformé, une pluralité de N-1 circuits sommateurs associés à chaque registre de rang r, chaque circuit sommateur de rang k recevant le produit de rang antérieur k-1 délivré par le circuit multiplicateur de rang antérieur et le produit de rang correspondant k délivré par le circuit multiplicateur de rang antérieur et le produit de rang correspondant k délivré par le circuit multiplicateur de même rang k, le circuit sommateur de rang le plus élevé, N-1, délivrant une composante g(r) du gain estimé, exprimé sous forme de vecteur de gain G. 7 Système selon la revendication 1, caractérisé en ce que ledit module de modélisation progressive par vecteur orthogonaux comporte: un module de normalisation du vecteur de gain pour

engendrer un vecteur de gain normalisé Gk, par comparai-

son de la valeur normée du vecteur de gain G par rapport à une valeur de seuil, ledit module de normalisation permettant d'engendrer en outre un signal de longueur du vecteur de gain normalisé Gk, vers le système décodeur en fonction de l'ordre de modélisation, un étage de modélisation progressive par vecteurs orthogonaux proprement dit recevant ledit vecteur normalisé Gk et délivrant lesdits index représentatifs du signal de parole codé, lesdits index étant représentatifs des vecteurs sélectionnés et de leurs gains associés, la transmission des données auxiliaires, formées par les index étant effectuée en écrasant les parties de la trame allouée aux indices et numéros de plages pour former le

signal de données auxiliaires.

8 Système de décodage prédictif par transformée adaptative d'un signal numérique codé à codes imbriqués dans lequel le signal numérique codé est constitué par un signal de parole codé et, le cas échéant, par un signal de données auxiliaires insérées au signal de parole codé après codage de ce dernier, caractérisé en ce qu'il comprend:

des moyens d'extraction dudit signal de données permet-

tant, d'une part, l'extraction desdites données en vue d'une utilisation auxiliaire, et d'autre part, la transmission d'index représentatifs du signal de parole codé, des moyens de modélisation du signal de parole au débit minimum, des moyens de modélisation du signal de parole à au moins un débit supérieur au débit minimum, 9 Système de décodage selon la revendication 8, caractérisé en ce que ce décodeur comporte, outre le système d'extraction de données, un premier module de modélisation du signal de parole au débit minimum, recevant directement le signal codé et délivrant un premier signal de parole, estimé Snt un deuxième module de modélisation du signal de parole à

un débit intermédiaire connecté audit système d'extrac-

tion de données par l'intermédiaire de moyens de commuta-

tion conditionnelle sur critère de la valeur desdits index, et délivrant un deuxième signal de parole estimé, un troisième module de modélisation du signal de parole à un débit maximum, connecté audit système d'extraction de données par l'intermédiaire de moyens de commutation conditionnelle sur critère de la valeur desdits index et 6 ^ 3 délivrant un troisième signal de parole estimé, Sn,

un circuit sommateur recevant sur ses entrées de somma-

tion le premier, le deuxième respectivement le troisième signal de parole estimé et délivrant en sa sortie un signal de parole estimé résultant, et connectés en cascade en sortie dudit circuit sommateur, un circuit de filtrage adaptatif recevant ledit signal de parole estimé résultant et délivrant un signal de parole estimé reconstitué, et un convertisseur numérique

analogique recevant ledit signal de parole estimé recons-

titué et délivrant un signal de parole reconstitué audio-

fréquence. 10 Système de décodage selon la revendication 9, caractérisé en ce que chacun des modules de modélisation du signal de parole à un débit minimum, intermédiaire ou maximum comprend un sous- module de transformation adaptative inverse suivi d'un filtre de pondération perceptuelle

inverse.