FR2475264A1

FR2475264A1 - Procede et systeme de transmission d'un signal de parole avec codage a prediction

Info

Publication number: FR2475264A1
Application number: FR8020155A
Authority: FR
Inventors: Atal Bishnu Saroop
Original assignee: Western Electric Co Inc
Current assignee: AT&T Corp
Priority date: 1978-04-07
Filing date: 1980-09-17
Publication date: 1981-08-07
Also published as: JPS55500402A; FR2475264B1; WO1979000901A1; GB2036515A; EP0012766A1; US4133976A; CA1119724A; GB2036515B; DE2945414C2; JPS5912186B2

Abstract

L'INVENTION CONCERNE LA TRANSMISSION DE LA PAROLE. UN SYSTEME DE TRAITEMENT DE SIGNAL DE PAROLE A PREDICTION COMPREND UN FILTRE ADAPTATIF 120, BRANCHE DANS UN RESEAU DE REACTION 137 CONNECTE AU QUANTIFICATEUR 111. LE FILTRE ADAPTATIF COMBINE LE SIGNAL D'ERREUR DE QUANTIFICATION, LES SIGNAUX DE PARAMETRE DEPREDICTION LIES AUX FORMANTS ET LE SIGNAL DE DIFFERENCE POUR CONCENTRER LE BRUIT DE QUANTIFICATION DANS LES PICS SPECTRAUX QUI CORRESPONDENT AUX FORMANTS DU SPECTRE DE LA PAROLE, GRACE A QUOI LE BRUIT DE QUANTIFICATION EST MASQUE PAR LES FORMANTS. APPLICATION A LA TELEPHONIE.

Description

La présente invention concerne la transmission

numérique des signaux de parole et elle porte plus parti-

culièrement sur des configurations de traitement de signal de parole à prédiction qui sont conçues de façon à réduire les effets de bruit. Le codage des signaux pour la transmission sur

des voies numériques dans les systèmes de transmission te'é-

phoniques ouaiGres néceEtt généralement l'échantillonnage d'un signal d'entrée, la quantification des échantillons, et la génération d'un code numérique pour chaque signal quantifié. Les signaux de parole sont fortement corrélés et ils comprennent donc une partie qui peut être prédite à partir de ses valeurs passées. Si un émetteur à codage numérique et un récepteur décodeur comprennent tous deux un dispositif qui élabore la partie prédite du signal de parole fortement corrélé, il suffit de coder et de transmettre la partie non prédite du signal de parole. De ce fait, le codage par prédiction d'un signal de parole conduit à une utilisation efficace des voies numériques,

sans dégradation du signal.

Le codage de signaux de parole par prédiction, tel qu'il est décrit dans les brevets U.S. 3 502 986 et 3 631 520, fait intervenir la génération de paramètres de prédiction à partir d'une suite d'échantillons de signal de parole et la formation d'une valeur prédite de

chaque échantillon de signal de parole à partir des para-

mètres générés et des échantillons de signal de parole précédents. La différence entre chaque échantillon et

sa valeur prédite est quantifiée, codée sous forme numé-

rique et émise vers un récepteur dans lequel le signal de différence est décodé et combiné avec la valeur prédite correspondante formée dans le récepteur. De cette manière, seule la partie du signal qui ne peut pas être prédite à partir du signal déjà codé est quantifiée et transmise, ce qui permet de réaliser une économie sur la capacité de

la voie. L'économie se traduit par la cadence de bit ré-

duite qui est nécessaire pour transmettre uniquement la par-

tie non prédite du signal de parole redondant, en comparai-

son de la cadence de bit très supérieure qui serait néces-

saire pour transmettre le signal de parole codé directement.

On quantifie généralement des échantillons de

signal en engendrant sélectivement un signal qui corres-

pond au niveau d'un ensemble de niveaux d'amplitude spé-

cifiés qui est le plus proche de l'amplitude de l'échan-

tillon de signal. Cependant, l'erreur produite par la

quantification produit une distorsion du signal transmis.

Comme il est décrit dans le brevet U.S. 2 927 962, on peut réduire le bruit produit par la quantification en formant un signal d'erreur correspondant à la différence entre les échantillons quantifiés et non quantifiés et en modifiant les échantillons de signal d'une manière prédéterminée en

se basant sur le signal d'erreur. Bien que les configura-

tions de modification n'affectent pas la puissance totale de bruit de quantification, elles permettent de concentrer la puissance de bruit dans une partie spécifiée du spectre

du signal dans laquelle ses effets sont les plus faibles.

Une configuration de filtre à réaction utilisant ce prin-

cipe en codage de signal de télévision, pour placer le

bruit de quantification dans la gamme de fréquence supé-

rieure de la bande du signal,,est décrite dans l'article intitulé "Synthesis of Optimal Filters for a Feedback Quantization System," par E. G. Kimme et F.F. Kuo, IEEE Transactions on Circuit Theory, septembre 1963, pages

405-413.

Les configurations de réduction d'erreur de quan-

tification mentionnées précédemment, qui concentrent géné-

ralement la puissance d'erreur dans des parties fixes du spectre de fréquence pour réduire au minimum la puissance

efficace d'erreur, ne conduisent pas à une réduction op-

timale du bruit pour les configurations de codage de signal de parole. L'absence de réduction optimale du bruit résulte de la nature du spectre du signal de parole qui comprend plusieurs parties de fréquences de formants variant au

cours du temps, qui correspondent à des parties de l'enve-

loppe spectrale à court terme dans laquelle l'énergie de parole est concentrée, et des parties inter-formants. Dans les régions sonores de la parole, les parties de formants

sont directement liées aux résonances dans l'organe vocal.

La puissance du signal de paroLe est donc concentrée dans

ces parties de formants, tandis que les régions inter-

formants contiennent notablement moins de puissance de

signal de parole. De ce fait, la concentration de la puis-

sance'd'erreur de quantification dans une partie fixe du spectre de fréquence ne tient pas compte de la relation entre le spectre de bruit de quantification et le spectre de parole changeant, si bien que des effets de bruit

appréciables demeurent.

L'invention porte sur une configuration de codage de signal de parole dans laquelle on engendre des signaux de paramètre de prédiction liés aux formants, à partir

d'une analyse du signal de parole sur des intervalles sé-

lectionnés. On forme un signal représentatif de la diffé-

rence entre le signal de parole et sa valeur prédite, à partir de la partie présente et de la partie précédente

du signal de parole et des signaux de paramètre de prédic-

tion engendrés. On modifie le signal de différence pour définir sélectivement le bruit. On quantifie le signal de différence modifié et on produit un signal d'erreur de quantification correspondant à la différence entre le

signal de différence modifié quantifié et non quantifié.

La modification du signal de différence comprend la combi-

naison du signal d'erreur de quantification, des signaux de paramètre de prédiction liés aux formants et du signal de différence pour concentrer l'erreur de quantification dans les parties de formants du spectre de signal de parole,

grâce à quoi le bruit de quantification transmis est mas-

qué par les formants du signal de parole.

Conformément à un aspect de l'invention, le signal d'erreur quantifié est modifié en fonction des signaux de paramètre de prédiction liés aux formants, afin de produire un signal d'erreur pondéré de formant. Le signal d'erreur pondéré de formant est combiné avec le signal de différence pour concentrer l'erreur de quantification dans les parties de formantsdu spectre de signal de parole afin

que le rapport du signal de parole au bruit de quantifi-

cation soit maintenu au-dessus d'un niveau prédéterminé

sur la totalité du spectre du signal de parole.

Selon un autre aspect de l'invention, on forme un ensemble de signaux de paramètre de filtre à partir des signaux de paramètre de prédiction liés aux formants ak et on produit un signal d'erreur pondéré de formant à partir des signaux de paramètre de filtre et du signal

d'erreur. On soustrait le signal d'erreur pondéré de for-

mant du signal de différence pour concentrer l'erreur de quantification dans les parties de formantsdu spectre du

signal de parole.

Selon un autre aspect encore de l'invention, on forme l'ensemble de signaux de paramètre de filtre fk à partir de l'ensemble de signaux de paramètre de prédiction de formant ak conformément à la relation prédéterminée: p+l p .. k 1-(i+ az_

-fkz = (1 + zl k-

k=1 k=1 dans laquelle z-1 représente un retard d'un intervalle

d'échantillon et p représente le nombre de signaux de para-

mètre de prédiction. On modifie le signal d'erreur par les signaux de paramètre de filtre f fixés pour former le k signal d'erreur pondéré de formant p+i wn = fken-k k=1 qui est soustrait du signal de différence, le terme en

désignant la valeur présente du signal d'erreur de quanti-

fication. On supprime la redondance due à la structure de

formants du signal de parole en soustrayant la valeur pré-

dite du signal de parole présent, obtenue à partir des signaux de paramètre de prédiction liés au formant, de la valeur réelle du signal de parole présent. Cependant, la

redondance liée à la hauteur demeure dans le signal de diffé-

rence résultant, comme le décrit le brevet U.S. 3 740 476.

Selon un autre aspect encore de l'invention, on forme un ensemble de signaux de paramètre de prédiction liés à la hauteur, à partir de l'analyse du signal de parole pour chaque intervalle sélectionné. On combine le signal quan- tifié avec les signaux de paramètre de prédiction liés à

la hauteur pour produire l'échantillon de signal de diffé-

rence prédit. On applique le signal de différence prédit aux moyens de modification de différence pour réduire la

redondance liée à la hauteur dans le signal quantifié.

L'invention sera mieux comprise à la lecture de

la description qui va suivre d'un exemple de réalisation

et en se référant aux dessins annexés sur lesquels:

La figure 1 est un schéma synoptique d'un cir-

cuit de codage de signal de parole par prédiction corres-

pondant à l'invention;

La figure 2 est un schéma synotpique d'un cir-

cuit de décodage de signal de parole par prédiction qui est utilisé en association avec le circuit de la figure 1

La figure 3 est un schéma synoptique du calcula-

teur de prédiction de la figure 1; La figure 4 est un schéma synoptique détaillé du générateur de coefficients de filtre et circuit de mémoire de la figure 1; La figure 5 est un schéma synoptique détaillé des prédicteurs de formants des figures 1 et 2 La figure 6 est un schéma synoptique détaillé du filtre de pondération de la figure 1; La figure 7 est un schéma synoptique détaillé des prédicteurs de périodicité vocale des figures 1 et 2 La figure 8 représente des signaux qui illustrent le fonctionnement du circuit calculateur de prédiction de la figure 3; La figure 9 est un graphique qui illustre les caractéristiques de réduction de bruit de quantification du circuit codeur de la figure 1; et La figure 10 représente des signaux obtenus dans

le circuit de la figure 1..

2475264-

On voit sur la figure 1 un codeur de signal de

parole à prédiction correspondant à l'invention. Un signal.

de parole s (t) qui provient de la source de signal de

parole 101 est appliqué au circuit de filtrage et d'échantIn-

lonnage 103 dans lequel il est soumis à un filtrage passe- bas, modifié par une configuration de préaccentuation haute

fréquence et est échantillonné à une cadence prédéterminée.

Le circuit 103 peut comprendre un filtre passe-bas avec

une fréquence de coupure de 4 kHz, un réseau de préaccen-

tuation avec une pente de 6 dB par octave commençant à

700 Hz, et un échantillonneur ayant une cadence d'échan-

tillonnage CL1 de 8 kHz. Les échantillons de signal succes-

sifs provenant du circuit de filtrage et d'échantillonnage 103 sont appliqués au convertisseur analogique-numérique 105 qui produit pour chaque échantillon de signal un code

numérique s convenant à l'utilisation dans le codeur.

n Les échantillons codés successifs s n provenant du convertisseur 105 sont appliqués directement sur une entrée du calculateur de paramètres de prédiction 135 et ils sont appliqués par le circuit de retard d'échantillon 106 à l'entrée de signal du prédicteur de formants 107 et à l'entrée positive du réseau soustracteur 109. Le circuit

de retard 106 peut être constitué par un registre à déca-

lage ou toute autre configuration de retard bien connue.

Le prédicteur 107 réagit aux échantillons de code retardés

s et à l'ensemble fixé de signaux de prédiction A = a1,a2,...

ak.....ap, provenant du calculateur 135,en engendrant un code de valeur de prédiction p sn-kak (1) k=1 pour chaque échantillon, en désignant par ak le coefficient de paramètre de prédiction linéaire de rang k et par p

l'ordre du prédicteur. On sait que le prédicteur 107 pré-

dit la valeur présente de chaque échantillon de signal sn sur la base de la somme pondérée d'un certain nombre de

valeurs d'échantillons antérieures conformément à l'ex-

pression (1). La prédiction est basée sur l'enveloppe spectra-

le à court terme du signal de parole et les signaux de paramètre de prédiction a1, a2.....ap sont liés à la structure de formants de la fonction de transmission de

l'organe vocal.

La figure 5 représente un filtre transversal

de type bien connu qu'on peut utiliser en tant que prédic-

teur de formants 107. Le prédicteur de la figure 5 peut être caractérisé de la manière suivante, avec la notation de la transformation en z: p Ps(Z) = akz-k (2) k k k=1

en désignant par z-1 un retard d'un intervalle d'échantil-

lon et par ai, a2,.....ak9.... ap les p coefficients du prédicteur. Sur la figure 5, p est égal à 10. Le registre à décalage 503 est un registre à décalage à 10 étages qu'on fait fonctionner à la cadence d'échantillonnage CL1 de

8 kHz et qui reçoit 1es échantillons successifs sn à par-

tir du circuit de retard 106, par la ligne 501. Le signal de sortie du premier étage du registre à décalage, sur la ligne 504-1, est appliqué sur une entrée du multiplicateur 505-1. De façon similaire, les signaux de sortie des étages restants du registre à décalage, sur les lignes 504- 2 à 504-10, sont appliqués aux multiplicateurs respectifs 505-2 à 505-10. Les signaux de coefficient de prédiction linéaire A=A1, A2,..., A1O qui proviennent du calculateur 135 sont appliqués aux multiplicateurs 505-1 à 505-10 par la ligne 510. Chaque multiplicateur forme le produit snkak et les produits sont sommés deux à la fois dans les additionneurs 507-2 à 507-10, de façon à obtenir sur la ligne de sortie 512 un signal représentatif de la somme des produits,

conformément à l'équation (1).

Le signal prédit provenant de la ligne 512 est appliqué sur l'entrée négative du réseau soustracteur 109 dans lequel il est soustrait de l'échantillon codé présent sn. Le signal de différence résultant: dn = sn - sn-kk (3) k=1 correspond au signal de parole, avec suppression de sa

redondance due aux formants. La suppression de la redon-

dance due aux formants est illustrée sur la figure 10, sur laquelle le signal 1001 représente une partie d'un signal de parole provenant de la source 101 et comportant à la

fois une redondance de formants et une redondance de pé-

riode de hauteur. Le signal 1003 correspond au signal de différence de l'équation (3) dans lequel la composante de formant prédite est supprimée du signal de parole, tandis

que la redondance liée à la période de hauteur demeure.

Le signal de différence dn provenant du réseau soustracteur 109 est appliqué au circuit modificateur 137 qui comporte le prédicteur de périodicité vocale 128 qui est conçu de façon à supprimer la redondance de période de hauteur qui demeure dans le signal de différence, et le

filtre de pondération 120 qui est conçu de façon à redis-

tribuer le bruit de quantification dans le signal de diffé-

rence afin de réduire sa perception. Le.signal de sortie du circuit modificateur 137, qn' est appliqué à l'entrée

du quantificateur 111 qui, comme il est bien connu, sélec-

tionne un niveau parmi un ensemble de niveaux d'amplitude

prédéterminés, en fonction de la valeur de chaque échan-

tillon de signal de différence présent sur son entrée.

Dans le quantificateur 111, la taille de pas, c'est-à-

dire la différence entre les niveaux d'amplitudes du quan-

tificateur, est déterminée par les caractéristiques statis-

tiques du signal de différence modifié et est engendrée

dans le calculateur de paramètres de prédiction 135.

Le signal de sortie du quantificateur 111, qn' est appliqué au réseau soustracteur-113, ainsi qu'à l'additionneur 131 par l'intermédiaire du codeur numérique 112. L'additionneur 131 et le prédicteur de périodicité

vocale 128 forment un code de valeur prédite d'n pour cha-

n que échantillon de signal de différence d, à partir d'un ensemble de codes de différence antérieurs, de signaux de sortie de quantificateur et de signaux de paramètre de prédicteur B = bl, b2, b3, ainsi que d'un code m qui est représentatif de la période de hauteur du segment de signal de parole courant. L'additionneur 131 forme la somme du signal qn et du signal de différence prédit, cette somme

étant appliquée au prédicteur 128. Le prédicteur 128 en-

gendre une valeur prédite du signal de différence présent, conformément à la relation: d' = bd' + b2dnm + b3dnm (4a) n i n-m+l 2 n-m 3 n-m-i n Le prédicteur 128 est caractérisé par la fonction suivante, avec la notation de la transformation en z: Pb-m+ +bz -m-! P = b + + b2z-m + b3zm-1 (4b) d i 2 3

dans laquelle z représente un retard de m échantillons.

bl, b2 et b3 sont les signaux de coefficient de prédiction qui sont déterminés en minimisant la valeur quadratique

moyenne de l'erreur de prédiction entre le signal de diffé-

rence dn et sa valeur prédite.

Les signaux m et b1, b2 et b3 sont engendrés dans le caleultateur 135,pour chaque intervalle de signal de

parole. Le code de valeur prédite pour le signal de diffé-

rence présent est soustrait du signal de différence pré-

sent dn dans le réseau soustracteur 126, de façon que la redondance liée à la période de hauteur soit extraite du

signal de-différence. Le signal 1005 sur la figure 10 re-

présente le signal de différence après extraction de la redondance liée à la période de hauteur, dans le réseau soustracteur 126. Contrairement au signal de parole 1001 et au signal de différence 1003, le signal 1005 est par nature analogue à du bruit, ce qui indique la suppression de la redondance liée aux formants comme de la redondance

liée à la période de hauteur.

La figure 7 représente de façon plus détaillée le prédicteur 128. Sur la figure 7, le registre à décalage 703 comprend 120 étages qui enregistrent les échantillons successifs reçus à partir de l'additionneur 131. Les 120 étages représentent une durée de 15 ms qui correspond au plus long intervalle de hauteur prévu. Le signal de sortie de chaque étage du registre à décalage est appliqué au circuit sélecteur 705 qui transmet sélectivement les signaux

2475264-

de sortie correspondant à trois étages consécutifs du registre à décalage, sous l'action du code m lié à la

période de hauteur qui provient du calculateur 135, confor-

mément aux équations (4a) et (4b). Le signal de sortie de l'étage sélectionné d'extrême-gauche du registre à décala-

ge est appliqué au multiplicateur 706-1. De façon simi-

laire, les signaux de sortie des étages sélectionnés adja-

cents du registre à décalage sont appliqués aux multipli-

cateurs respectifs 706-2 et 706-3. Les signaux de para-

mètre de prédiction b1, b2 et b3 sont appliqués aux mul-

tiplicateurs 706-1, 706-2 et 706-3 à partir du calcula-

teur 135, par la ligne 711. Les codes de produit prove-

nant des multiplicateurs 706-1, 706-2 et 706-3 sont sommés dans les additionneurs 707-2 et 707-3, grâce à quoi le

code de valeur prédite pour le signal de différence pré-

sent apparaît sur la ligne 712.

Le calculateur de paramètres de prédiction 735

engendre les signaux de paramètre de prédiction nécessai-

res pour le prédicteur de formants 107 et le prédicteur de périodicité vocale 128, ainsi que la taille de pas et d'autres signaux utilisés dans le codeur. On sait que les signaux de parole ne sont pas stationnaires. Cependant, les caractéristiques de la parole qui varient au cours du temps changent relativement lentement, si bien qu'il suffit d'adapter les signaux de paramètre de prédiction au signal

changeant toutes les 10 ms pour une cadence d'échantillon-

nage de 8 kHz. Ainsi, le calculateur de paramètres de pré-

diction 135 reçoit les échantillons de parole sn au cours de chaque intervalle de temps de 10 ms et il fournit des signaux de paramètre de prédiction pour chaque intervalle

de temps de 10 mspour tenir compte des conditions chan-

geantes du signal.

La figure 3 représente une configuration de trai-

tement qu'on peut utiliser pour le calculateur 135. En consi-

dérant la figure 3, on note que le processeur 309 reçoit l'information de signal enregistrée provenant de la mémoire

d'échantillons320 et il reçoit une information de programme----

enregistrée de façon permanente qui provient des mémoires 1l mortes 303 et 305 par le contrôleur 307. Sous l'effet des

signaux reçus et de l'information de programme, le proces-

seur 309 engendre un ensemble de coefficients de prédic-

tion linéaire liés aux formants A = a1, a2,....a10; un ensemble de signaux de coefficient de prédiction linéaire liés à la hauteur B = b1, b2, b3; un ensemble de signaux de coefficient de corrélation partielle liés aux formants r1, r29....R10; et un signal de valeur efficace 2R, un

signal lié à la période de hauteur m et un signal de tail-

le de pas à destinés à être utilisés dans d'autres parties

du codeur de la figure 1. Les signaux de sortie du proces-

seur 309 sont enregistrés dans des mémoires de sortie 331

à 336, comme il est représenté sur la figure 3. Le proces-

seur 309 peut être constitué par le Macro Arithmetic Processor System 100, de la firme CSP Inc., ou il peut être constitué par d'autres configurations de processeur

bien connues.

Le contrôleur 307 de la figure 3 est conçu de façon à fractionner chaque intervalle de temps de 10 ms

du signal de parole en une suite de trois périodes prédé-

terminées, chacune d'elles étant consacrée à un mode de fonctionnement particulier. Les modes de fonctionnement sont représentés sur la figure 8. Les impulsions d'horloge

CL2 provenant de l'horloge 140 de la figure 1 sont espa-

cées de 10 ms et elles déterminent les intervalles de temps de 10 ms. Sur la figure 8, une impulsion d'horloge CL2 apparaît à l'instant t1, c'est-àdire au début d'un intervalle de temps de 10 ms. Cette impulsion d'horloge CL2 place le contrôleur 307 dans son mode d'entrée de données, comme le montre le signal 805. Pendant le mode d'entrée de données, le contrôleur 307 est connecté au processeur 309 et à la mémoire d'échantillons de parole 320. Sous l'effet des signaux de commande qui proviennent du contrôleur 307, les 80 codes d'échantillon sn qui ont été insérés dans la mémoire d'échantillons 320 pendant l'intervalle de temps de 10 ms précédent sont transférés vers la mémoire de données 316 par l'interface d'entrée/ sortie 318. Comme le montre le signal 805, le mode d'entrée

de données se termine à l'instant t2, lorsque 80 codes -

d'échantillon provenant de la mémoire 320 ont été appli-

qués à des adresses prédéterminées dans la mémoire de données 316. Pendant que les 80 échantillons enregistrés sont transférés vers la mémoire de données 316, les échan- tillons de l'intervalle de temps présent sont insérés dans la mémoire 320, sous la commande des impulsions

d'horloge CL1.

Juste après l'instant t2, le contrôleur 307 est placé dans son mode de paramètres de prédiction de formants comme le montre le signal 807. Pendant le mode de paramètres de prédiction de formants, la mémoire de programme de paramètres de prédiction 303 est connectée

au processeur central 312 par l'intermédiaire du contrô-

leur 307, du circuit d'interface de contrôleur 310 et du

bus 340. Sous l'effet des instructions qui sont enregis-

trées de façon permanente dans la mémoire morte 303, le processeur 309 engendre les signaux de coefficient de corrélation partielle de formantsrm = ri, r2...., r10 et les signaux de coefficient de prédiction linéaire de

formants A = a1,...a10. Les signaux A et rm sont transfé-

rés respectivement vers les mémoires 331 et 333. La liste en langage Fortran des instructions enregistrées dans la mémoire morte 303 pour produire les signaux de prédicteur

de formants figure à l'annexe 1.

On sait qu'on engendre les signaux de paramètre en formant la matrice de covariance P, dont les termes sont: Pij 1 sn-isn-j' i=1,2,....,10,j= 1,2,. .,10 (5) n=1 et les facteurs de corrélation de parole: ci = Snsn i i= 1,2,

.,10 (6) n=1 On calcule ensuite les facteurs g1 à g10, conformément à la relation: r1013 T [ c21 (7) i0J 0ci0 dans laquelle T désigne la matrice triangulaire inférieure obtenue par la décomposition triangulaire de [Pijl = T T (8) On calcule ensuite les coefficients de corrélation partiel- le rm conformément à la relation: gm; rm kon 1/2 (9) o - gi dans laquelle: co Sn..DTD: CO = 'Z S2

n=l -

correspond à l'énergie du signal de parole dans l'inter-

valle de temps de 10 ms. On calcule les signaux de para-

mètre de prédiction linéaire de formants A = a1, a2.....

a1O à partir des signaux de paramètre de corrélation par-

tielle rm, conformément à la formule récursive: ai(m) = ai(m-1) + rmam i(m-1) ao(o) = 1 i=1,2,...,m=1,2,...,10 (10) Les signaux de paramètre de corrélation partielle rm et les signaux de paramètre de prédiction linéaire ai qui sont engendrés dans le processeur 309 au cours du mode de paramètres de prédiction de formants sont transférés de la mémoire de données 316 vers les mémoires 331 et 333 pour être utilisés au cours de l'intervalle de temps de ms suivant. Les signaux A sont également transférés vers le générateur de coefficients de filtre et mémoire 122. Au cours du mode de paramètres de prédiction de

formants, le contrôleur 307 compte les impulsions d'hor-

loge CL1 qui proviennent de l'horloge 140 pour déterminer

l'instant d'achèvement de ee mode.

A l'instant t3, après le transfert des signaux de paramètre de prédiction linéaire et de corrélation partielle vers les mémoires 331 et 333, le contrôleur 337 est placé dans son mode de paramètres de prédiction de hauteur, comme il apparait sur le signal 809. Entre les instants t3 et t4, le contrôleur 307 connecte la

mémoire de programme de prédiction de hauteur 305 au pro-

cesseur central 312 par l'interface de contrôleur 310 et

le bus 340. Les codes d'instruction contenus dans la mé-

moire morte 305, dont la liste en langage Fortran figure à l'annexe 2, forment les signaux de paramètre de hauteur b1, b2 et b3, ainsi que le signal m lié à la hauteur, qui sont destinés à être utilisés dans le prédicteur de périodicité vocale 128 de la figure 1. Conformément à la liste en langage Fortran de l'annexe 2, le processeur 309 calcule au cours du mode de prédiction de hauteur les corrélations entre les signaux de différence dn et.dn_1

sur un intervalle fixé, de la manière indiquée par l'équa-

tion (11): nddn-i n= 80 =41, 42...., 120 (11)

=7 - 80 8

2 d27 d2n-i n=1 n=1 pour déterminer l'indice de temps i pour lequel "i est

maximal. L'instant auquel Si est maximal (m) est trans-

féré à partir de la mémoire de données 316 sous la commande

du contrôleur 307.

Le processeur 309 calcule également les paramè- tres de prédiction de hauteur b1, b2, et b3 en se basant sur le principe

qui consiste à minimiser l'expression: Z (dn-bld-m+l-b2dn-m-b3dn-m-1)2 (12) n=1 Le facteur 2R pour l'écrêteur 124 est calculé conformément à la relation: R =1(dn-bldn- m±b2dn m-b3dn-m-1) 2 (13) J. n ln-m+2 nm 3 n-i n=1 Le facteur de taille de pas À est également calculé, pour être utilisé dans le quantificateur 111, selon la relation:

A = 1,224R (14)

pour un quantificateur à trois niveaux, de la manière dé- crite dans l'article intitulé "Quantizing for Minimum Distortion," par Joel Max, paru dans la revue IRE Transactions on Information Theory, Vol. IT-6, pages 7-121,

mars 1960. A l'instant t4, les termes 2R et sont trans-

férés dans les mémoires 334 et 336. Pendant l'intervalle de temps de 10 ms qui sépare les instants t1 et t5, les signaux de sortie des mémoires 331 à 336 correspondent aux valeurs de signal s obtenues dans l'intervalle de temps de 10 ms précédent l'instant t1. A l'instant t5, les signaux de paramètre placés dans ces mémoires entre les

instants t1 et t4 sont appliqués sur les sorties des mémoi-

res, sous l'effet d'un signal de commande provenant du contrôleur 307. Pendant l'intervalle de temps suivant, les signaux de paramètre caiculés entre les instants t1 et t5 commandent le codeur de la figure 1. Du fait que les échantillons de signal qui proviennent du convertisseur analogique-numérique 105 sont retardés d'une durée de 10 ms dans le circuit de retard 106, les signaux de paramètre provenant du calculateur 135 correspondent aux échantillons de signal sn qui sont traités dans les prédicteurs 107 et

128 et le quantificateur 111.

* Le signal de sortie du codeur numérique 112, pro-

venant du quantificateur 111, consiste en une suite de codes numériques qn qui sont représentatifs de la composante non prédite du signal de parole, c'est-à-dire le signal de parole duquel on a fait disparaître la redondance liée aux

formants et à la hauteur. Du fait que les niveaux d'ampli-

tude prédéterminés qu'on emploie dans le quantificateur 111 ne sont pas égaux aux valeurs des échantillons qn qui sont appliqués à ce quantificateur, une distorsion ou un bruit de quantification correspondant à en = qn - qn (15) est également présent dans le signal q qui provient du n codeur numérique 112. La distorsion est ensuite transmise par la voie de communication 150 et elle apparaît dans le signal de parole reconstitué (t) en sortie du circuit

décodeur de la figure 2.

Le bruit de quantification présent dans le

signal transmis peut être réduit par une prédiction effi-

cace. Cependant, cette réduction n'assure pas une faible valeur de la distorsion perçue dans le signal de parole

reconstitué, du fait que la distorsion dépend de la rela-

tion entre le spectre du bruit de quantification et le spectre'de la parole. Le spectre du signal de parole est caractérisé par des régions de formants qui varient au cours du temps, c'est-à-dire des régions dans lesquelles la puissance du signal de parole est concentrée, et par des régions inter-formants dans lesquelles la puissance de signal est relativement faible. La ligne 901 de la figure 9 illustre un spectre caractéristique pour une partie d'un signal de parole. Cependant, la fréquence du

bruit de quantification en est généralement répartie uni-

formément, de la manière qui est représentée par la ligne 903. L'examen des lignes 901 et 903 de la figure 9

montre clairement que le bruit de quantification corres-

pondant à la ligne 903 est plus faible que la puissance de signal de parole dans des régions de formants, mais est prédominant dans les régions inter-formants dans lesquelles le niveau du signal de parole est faible. Plus précisément, le bruit de quantification de la ligne 903 dépasse le signal de parole dans la région inter-formants entre les pics de formants des fréquences fa et fb' En outre, alors que le

rapport entre le signal de parole et le bruit de quantifi-

cation est relativement élevé pour les formants, il est beaucoup plus faible dans les positions inter-formants du

spectre de parole.

On sait qu'on peut modifier le spectre du bruit de

quantification par un filtrage, avec la restriction consis-

tant en ce que le bruit de quantification moyen demeure constant. Les configurations de filtrage de l'art antérieur emploient des caractéristiques qui sont conçues de façon à décaler le bruit de quantification vers les parties de fréquence supérieure du spectre de fréquence, ou de façon à réduire au minimum la valeur efficace du bruit. Cependant, ces configurations de filtrage sont invariantes dans le temps et elles sont donc incapables de réduire le bruit perçu dans un signal de parole dans lequel les formants

se décalent au cours du temps.

Conformément à l'invention, on introduit un fil-

tre à réaction adaptatif dont les caractéristiques sont commandées par les signaux de paramètre de prédiction liés aux formants. Le filtre adaptatif concentre le bruit de quantification dans les parties de formantsdu spectre de parole d'une manière qui varie au cours du temps afin que le bruit de quantification soit toujours masqué par les formants changeants du signal de parole. La ligne 905

représente le spectre de bruit de quantification redistri-

bué désiré. Comme le montre le signal 905, la puissance de bruit de quantification est concentrée dans les parties de formants du spectre de signal de parole représenté par

la ligne 901, si bien que la puissance de bruit de quanti-

fication est réduite dans les régions inter-formants dans lesquelles le bruit perçu est élevé. Ainsi, le rapport entre le signal de parole et l'erreur de quantification

est maintenu au-dessus d'une valeur acceptable prédéter-

minée sur la totalité du spectre de signal de parole. De cette manière, on réduit la distorsion perçue qui est due

au bruit d'erreur de quantification.

Sur la figure 1, la configuration de masquage du bruit de quantification comprend un filtre à pondération

adaptatif 120 qui modifie le signal d'erreur de quantifi-

cation en produit dans le réseau soustracteur 113, confor-

mément aux signaux de paramètre qui proviennent du géné-

rateur de coefficients 122. Ces signaux de paramètre sont produits à partir des signaux de paramètre de prédiction de

formants A=al, a2,....ap qui sont engendrés dans le calcu-

lateur 135. La distorsion qui est due à la quantification

dans le circuit de la figure 1 est l'erreur de quantifica-

tion e de l'équation (15), modifiée par les fonctions de n transfert du prédicteur de formants 107 et du filtre à réaction 120, comme l'indique l'expression (16):

E (1-F) (16)

(i-P S) Dans cette expression E représente la transformée de Fourier à court terme du signal d'erreur en; F représente la transformée de Fourier à court terme de la fonction de transfert du filtre de pondération 120 et P représente la s transformée de Fourier à court terme de la fonction de

transfert du prédicteur de formants 107. Ainsi, le spec-

tre de puissance de bruit de quantification du signal de

sortie du codeur peut être remodelé conformément à l'équa-

tion (16). On a constaté que la fonction suivante, en notation de la transformation en z: 1-F 1+z-1 1 1_-z__-1

1-P 2 + ( 1_-P) ( 2 (17)

_ (17)

T 2 '1P'2

S s réalise le filtrage du bruit de quantification qui est nécessaire pour obtenir la distribution de spectre de

bruit correspondant à la ligne 905.

L'équation (17) peut être réduite à: F = 1 (1 + z-1)Ps (18)

Du fait que la fonction de transfert du prédicteur de-

formants 107, avec la notation de la transformation en-z, est: Ps akzk (19) k=l la fonction de transfert du filtre de l'équation (18) devient: il 10 F = j fkz-k = 1 (akz-k + akzk) (20) k=l k=l A partir de l'équation (20), on détermine les valeurs suivantes pour les signaux de paramètre destinés à commander le filtre de pondération 120 f --a1

1 2 1

f k (ak+ a k) pour k = 2, 3,.-....................,10.(21) et f - 1 a10 il 2 0 Comme le montre l'examen de l'équation (21), - les signaux de paramètre de filtre de pondération f1 à

fil sont directement liés aux signaux de paramètre de pré-

diction de formants a1.....aIO' Du fait que les signaux

de paramètre de prédiction de formants a1,..... alo chan-

gent sous l'effet du signal de parole variant au cours du temps, les signaux de paramètre de filtre de pondération fi à fil sont modifiés de façon que le spectre de bruit de quantification qui correspond à la ligne 905 suive les caractéristiques de formants changeantes du spectre de signal de parole correspondant à la ligne 901. De cette manière, le spectre du bruit de quantification dans le signal q est toujours masqué par la partie de fréquences n de formants du signal de parole et on maintient un rapport

minimal entre le signal de parole et le bruit de quantifi-

cation sur la totalité du spectre de parole.

Le générateur de coefficients de filtre et mémoi-

re 122 est représenté en détail sur la figure 4. En consi-

dérant la figure 4, on voit que le signal de paramètre a est appliqué directement au circuit diviseur par deux 422-1 qui peut être constitué par un circuit à registre à décalage conçu de façon à effectuer un décalage d'un rang vers la droite. On sait que le fait de décaler un code binaire d'un rang vers la droite divise effectivement le code par un facteur égal à deux. Le signal de sortie du circuit diviseur par deux 422- 1 est le signal de paramètre de filtre f. Les signaux de paramètre a1 et- a2 sont sommés dans le circuit additionneur 420-2 et le signal résultant

est divisé par deux dans le circuit 422-2. De façon simi-

laire, l'additionneur 420-3 fait la somme des paramètres

a2 et a3 de façon que le signal de sortie du circuit divi-

seur par deux 422-3 soit le signal de paramètre de filtre f De façon similaire, les signaux de paramètre de filtre 3'. f4 à fg sont produits par un dispositif similaire qui

n'est pas représenté sur la figure 4. Le signal de paramè-

tre de filtre f10 est obtenu à partir du circuit diviseur

par deux 422-10 qui reçoit son signal d'entrée de l'addi-

tionneur 420-10. Le signal de paramètre a10 est divisé par deux dans le circuit 422-11 pour produire le signal de

paramètre de filtre fil.

Les signaux de paramètre de filtre f1 à fil

sont engendrés conformément à l'équation (21) dans le cir-

cuit-de la figure 4 et ils sont transférés vers là section d'entrée de la mémoire 430 pendant l'intervalle de temps

de 10 ms qui précède l'utilisation de ces signaux de para-

mètre de filtre dans le filtre de pondération 120. Au début de l'intervalle de 10 ms suivant, sous l'effet du signal d'horloge CL2 qui provient de l'horloge 140, les signaux de paramètre de filtre présents dans la section

d'entrée de la mémoire 430 sont transférés vers sa sec-

tion de sortie. De cette manière, les signaux de paramètre

de filtre sont affectés à chaque ensemble de 80 échantil-

lons dans les filtres 120, au cours de l'intervalle de

temps de 10 ms approprié.

Les signaux de coefficient de filtre f à f11 1 i qui proviennent du circuit de générateur et de mémoire

122 sont appliqués au filtre 120 par la ligne 123. Le cir-

cuit de filtre de pondération- 120 est représenté en détail sur la figure 6. En considérant la figure 6, on voit que les échantillons-de signal d'erreur én qui proviennent du soustracteur 113 sont appliqués séquentiellement par la

ligne 123 au registre à décalage à 11 étages 603. Les si-

gnaux en sont décalés séquentiellement vers la droite par les impulsions d'horloge CL1 qui proviennent de l'horloge , de manière classique. Les signaux de paramètre de

filtre f 1à fàl sont appliqués par la ligne 610 aux mul-

tiplicateurs respectifs 605-1 à 605-11. Les signaux d'er-

reur en, enl....en_11 sont appliqués aux multiplicateurs 605-1 à 605-11 à partir des étages du registre à décalage

603, par les lignes respectives 604-1 à 604-11. Le multi-

plicateur 605-1 forme un code de prédiction fl en' De façon similaire, le multiplicateur 605-11 forme le code de

produit fil e n-11' Les signaux de sortie des multiplica-

teurs 605-1 à 605-11 sont sommés successivement dans les additionneurs 607-2 à 607-11, grâce à quoi le signal d'erreur pondéré de formants: Wn = fkenk (22) (22) k=l

apparaît sur la ligne 612.

Le signal d'erreur pondéré de formantswn est

appliqué au soustracteur 126 par le circuit écrêteur 124.

Dans le circuit écreteur 124, le signal codé w est compa-

ré au signal de valeur efficace 2R qui provient de la mémoire 337 du calculateur 135. Lorsque la valeur présente du signal d'erreur pondéré remplit la condition: IwI < 2R (23)

le signal w est transmis directement au soustracteur 126.

Cependant, lorsque la condition: IwI > 2R (24) est remplie, le signal 2R est transmis au soustracteur 126 si le signal w est positif. Le signal 2R est transmis au soustracteur 126 si w est négatif. De cette manière, le signal de réaction que le filtre de pondération d'erreur 120 applique au soustracteur 126 est limité au double de

la valeur efficace du signal de différence dn.

Le signal de sortie du soustracteur 126 corres-

pond aux composantes non prédites du signal de parole modifiées par le signal d'erreur de quantification filtré

2475264-

avec réaction. Le signal de sortie résultant du codeur numérique 112, qn, est représentatif de la composante

quantifiée non prédite du signal de parole ayant un spec-

tre de bruit de quantification modifié. Le signal q. est appliqué au circuit multiplexeur et modulateur 115, en compagnie des signaux de paramètre de hauteur b et m, des signaux de paramètre de corrélation partielle rm et du signal de taille de pas à. Le circuit 115 forme un signal modulé de façon appropriée qui est transmis par la voie de communication 150 vers le circuit décodeur de la

figure 2.

Le circuit décodeur qui est représenté sur la figure 2 reçoit l'information transmise par le canal de communication 150 et il forme une image du signal de parole s(t) que la source 101 a appliqué à l'origine au

circuit codeur de la figure 1. Sur la figure 2, le cir-

cuit démodulateur et démultiplexeur 201 réagit à l'infor-

mation provenant de la voie de communication 150 en appli-

quant au décodeur numérique 203 le signal non prédit quan-

tifié qn et le signal de taille de pas A. De façon clas-

sique, le décodeur 203 effectue une mise à l'échelle du signal qn par le signal de taille de pas Cet le signal quantifié et mis à l'échelle est appliqué sur une entrée du circuit additionneur 205. L'autre signal d'entrée du

circuit additionneur 205 provient du prédicteur de pério-

dicité vocale 217.

Les signaux de paramètre liés à la hauteur B =

b1, b2, b3, qui proviennent du démultiplexeur et démodu-

lateur 201, pour chaque intervalle de temps de 10 ms, sont enregistrés dans la mémoire de coefficients de hauteur

213 et sont appliqués à partir de cette mémoire au prédic-

teur 217. Le prédicteur 217 est identique au prédicteur 128 de la figure 1 qui est représenté en détail sur la figure 7. Sous l'effet de la séquence de codes de signal

provenant de l'additionneur 205 et des signaux de paramè-

tre de prédiction b1, b2, b3 et m provenant de la mémoire 213, le prédicteur 217 forme la composante prédite liée à

la hauteur du signal de parole et il applique cette compo-

sante à l'additionneur 205. Le signal de sortie de l'addi-

tionneur 205 représente le signal d'excitation et il

comprend la composante non prédite et la composante pré-

dite liée à la hauteur du signal de parole. Le signal d'excitation qui provient de l'additionneur 205 est alors appliqué sur une entrée de l'additionneur 207 dont l'autre

signal d'entrée provient du prédicteur de formants 219.

Selon une caractéristique avantageuse, la formation de l'excitation employant le prédicteur de périodicité de ^

parole 217 ne nécessite pas la détection des segments sono-

res et sourds du signal de parole ou l'utilisation d'une source de bruit pour l'excitation correspondant aux sons sourds.

Les signaux de paramètre de corrélation partiel-

le liés aux formants rm de chaque intervalle de temps de msprovenant du démultiplexeur 201,sont transférés vers le convertisseur de coefficients et mémoire 215. Le convertisseur 215 convertit les signaux de paramètre de

corrélation partielle rm en signaux de paramètre de pré-

diction linéaire A = a1, a2.a10. Le convertisseur de coefficients 215 peut être constitué par un processeur tel que celui qui est utilisé dans le calculateur 135 de

la figure 1, ou par toute autre configuration de micro-

processeur de type classique.-Le convertisseur 215 forme les signaux de paramètre de prédiction linéaire de formants

a1, a2,... a10 à partir des signaux de paramètre de corré-

lation partielle rm, conformément à la formulation récur-

sive de l'équation (10). Les signaux rm sont transmis au

récepteur de la figure 2 du fait que ceci améliore la sta-

bilité, comme il est bien connu.

Le prédicteur de formants 219 est identique au prédicteur 107 de la figure 1 qui est représenté en détail sur la figure 5. Sous l'effet de la séquence des signaux d'excitation provenant de l'additionneur 207 et des signaux

de paramètre de prédiction de formants a1, a2,....a10 pro-

venant du convertisseur 215, le prédicteur de formants en-

gendre la composante de formants prédite du signal de

parole. Le signal de sortie. de l'additionneur 207 corres-

pond alors à la séquence de codes de signal image n. Le signal de sortie de l'additionneur 207 est appliqué au

filtre 209 qui-consiste en un réseau de désaccentuation qui.

exerce une action complémentaire de celle du réseau de pré-

accentuation appartenant au filtre 103, et en un filtre passe-bas qui correspond aux configurations de filtre du

filtre 103 de la figure 1. Le convertisseur numérique-analo-

gique 211 convertit la séquence d'échantillons de signal

provenant du filtre 209 en un signal analogique image 9(t).

On vient de décrire l'invention en considérant

un exemple de réalisation. Il va de soi que de nombreuses -

modifications peuvent être apportées au mode de réalisa-

tibn décrit et représenté, sans sortir du cadre de l'in-

vention. Par exemple, l'entrée du prédicteur de formants de la figure 1 peut être connectée au codeur numérique 112 au lieu d'être connectée au circuit de retard-106. De cette manière, la valeur prédite du signal de parole est formée à partir du signal quantifié codé qn au lieu de

l'être à partir de l'échantillon de signal de parole s.

2475264-

ANNEXE 1

C+++++ GENERATION DES PARAMETRES DE COEFFICIENT DE

PREDICTION LINEAIRE

SUBROUTINE LPCPAR

COMMON/BLKSIG/S(81),X(90),D(200),V(80),E(91),Y(90)

COMMON/BLKPAR/R(lO),A(lO),B(3),M COMMON/BLKSCR/P(10, O10),T(10,lO),C(tO), Q(10),W(10) C+++++ X(l)......X(90) SONT LES ECHANTILLONS DE PAROLE

C+++++ X(1)......X(10) SONT LES ECHANTILLONS PROVENANT

DE L'INTERVALLE PRECEDENT.

C+++++ X(11)... X(90) SONT LES ECHANTILLONS PROVENANT

DE L'INTERVALLE COURANT.

C+++++ CALCUL DE L'ENERGIE DES ECHANTILLONS DE PAROLE

C+++++ ENERGIE = PX

CALL INPROD(X(ll),X(11),80,PX)

C+++++ GENERATION DES COEFFICIENTS DE CORRELATION DE

PAROLE C(1)....C(10)

DO 1 I = 1,10

1 CALL INPROD (X(ll),X(ll-I),80,C(I))

C+++++ GENERATION DES CORRELATIONS PARTIELLES ET DES

COEFFICIENTS DE PREDICTEUR

EE-PX

DO 100 I = 1,10

C+++++ GENERATION DES ELEMENTS DE MATRICE DE COVARIANCE

- P(I,J)

DO 20 J = 1,10

XX = 0.0

IF (I.EQ. 1.AND. I. EQ.J) XX = PX

IF (I.EQ. 1.AND. J.GT. 1) XX = C(J-1)

IF (I.GT. 1) XX = P(I-1,J-1)

P(I,J) = XX + X(ll-I)*X(ll-J) - X(91-I)*X(91-J)

C+++++ CONVERSION EN MATRICE TRIANGULAIRE T AVEC P = T*T

(TRANSPOSEE)

DO 40 J = 1,I

SM = P(J,I)

K= 1

3 IF (K.EQ. J) GO TO 4

SM = SM - T(I,K)*T(J,K)

K = K + 1

GO TO 3

4 IF (I.EQ. J) W(J) = 1/SQRT(SM)

IF (I.NE.J) T(I,J) = SM*W(J)

CONTINUE

C+++++ GENERATION DE LA CORRELATION PARTIELLE R(I)

SM = C(I)

IF (I.EQ.1) GO TO 5

DO 50 J = 2,I

SM = SM - T(I,J-1)*Q(J-1)

Q(I) = SM*W(I)

IF (I.EQ. 1) GO TO 80

EE = EE - Q(I-1)XQ(I-1)

R(I) = -Q(I)/SQRT(EE)

C+++++ GENERATION DES COEFFICIENTS DE PREDICTEUR

A(1).... A(I)

A(I) = R(I)

IF (I.EQ. 1) GO TO 100

K = 1

6 IF (K.GT. I/2) GO TO 100

TI = A(K)

TJ = A(I-K)

A(K) = TI + R(I)*TJ

A(I-K) = TJ + R(I)*TI

K = K + 1

GO TO 6

CONTINUE

C+++++ GENERATION DU PREMIER SIGNAL DE DIFFERENCE

DO 110 N = 11,90

D(N) = X(N)

L =N - 1

DO 10 I = 1,10

D(N) = D(N) + A(I)*X(L)

L = L - 1

CONTINUE

RETURN

END

SUBROUTINE INPROD (X,Y,N,PX)

Gan (I)X*(I)X + Xd = Xa T I1 = I I oc O'0 = Xd

(N)X (N)À NOIONSWIG

LZ. i99zSCZ

ANNEXE 2

C++++++ GENERATION DES PARAMETRES DE PREDICTEUR DE

HAUTEUR

SUBROUTINE PCHPAR

* COMMON/BLKSIG/S(81),X(90),D(200),V(80),E(91),Y(90)

COMMON/BLKPAR/R(lO),A(lO),B(3),M COMMON/BLKSCR/P(10,lO),T(lO,lO),C(lO), Q(10),W(10)

C+++++ CALCUL DE L'ENERGIE DU PREMIER SIGNAL DE DIFFE-

RENCE DANS L'INTERVALLE COURANT

C+++++ ENERGIE = PDO

CALL INPROD(D(121),D(121),80,PDO)

C+++++ CALCUL DE L'ENERGIE DU PREMIER SIGNAL DEDIFFE-

RENCE PASSE

C+++++ ENERGIE= PD1 -

CALL INPROD(D(81),D(81),80,PD1)

C+++++ DETERMINATION DE L'EMPLACEMENT DU PIC DE CORRE-

LATION

CORMAX = -1.1

CORP = 1.1

CORT = 0,0

DO 100 I = 41,120

C+++++ GENERATION DE LA CORRELATION POUR LE RETARD I

C+++++ CORRELATION = CORL

CALL INPROD (D(121),D(121-I),80,P2)

PD1 = PD1 + (D(121+I) + D(201-I))*(D(121-I) - D(201-I))

CORL = p2/SQRT(PD1*PDO)

C+++++ SAUT A 10 SI ON N'EST PAS A UN PIC DE CORRELA-

TION

IF(CORT.LT. CORL.OR. CORT.LT. CORP) GO TO 10

C+++++ DETERMINATION DU PIC CORRECT PAR INTERPOLATION

CORM = CORT + O.125*((CORP - CORL)**2)/(2*CORT - CORP -CORL)

IF(CORM. LT. CORMAX) GO TO 10

CORMAX = CORM

M = I-1

OORP=CORT

OORT=O CORL

CONTINUE

GENERATION DES COEFFICIENTS B POUR LA PREDICTION

DE HAUTEUR

GNs (I)x*(I)X + Xd = Xd N'T = I I oI 0'0 = Xd

(N)X' (M)I NOISMSWIG

( Xd'Nis'2iX)GOUdNI INILnOUgnf NIfl,, (I)X*(I)X + Xd = Xd N'TI= I I oa 0'0 = Xd (N)X' (M)X NOIS:WIGa (Xd' N'.'X) GOHdNI SIIMLOUfnS aNM: NUflLT1I

- (w-N)a*(E)a -

Unod iaHaa d SDNaIIIGa (gH +

Z-:)/(Z0.(ZU

(T-W-N)OE*(E)S

(T+N-N)C.*()9 - (M)G = (N)A 011I

00'ITZ = N OTI oc HngLnVH Vq sa IVNDIS na HOI:VwINUD (C)G - (T)a - Tg = (eq - úg)*9'0 = () (e) g (sa + a)*s'o = (T)g r -**:g- I)/( Z. - oú0 + TOD) = S (Z- l)/(o - TO-) = z (u + F**TU +:I* - T) + (C +:o)*(:u - T))= Tg Gd/úSD = ú cid/D = To Gd/13- 10 (úD'O9' (w-OZT)u' (TUl)a)cIO'dHî I VO (sD'oú'(w-T:)c'(: T)a)aou:cii TIVD (ID'O9'(w-gTI)a'(TT)a)uOadiNI IqVO Gd/lGd = T ( ad'08' (w-ZI) a' (w-oZT)a)aoacai TIVO (lad'oú'(w-îzz)a'(w-îZ) a)aoacI TIVo T T - t9zçztz

Claims

REVENDICATIONS

1. Système de transmission de signal de parole à prédiction comprenant un dispositif (135) qui analyse

un signal de parole dans des intervalles de temps sélec-

tionnés pour engendrer un ensemble de signaux de paramètre de prédiction liés aux formants pour chaque intervalle des circuits (107, 109) qui réagissent conjointement au signal de parole et aux signaux de paramètre de prédiction liés aux formants en produisant un signal représentatif de

la différence entre le signal de parole et sa valeur pré-

dite; un circuit de modification (137) destiné à modifier

le signal représentatif de la différence; un quantifica-

teur (111) qui réagit au signal de différence modifié en engendrant un signal quantifié; et un circuit soustracteur

(113) qui forme un signal d'erreur de quantification cor-

respondant à la différence entre le signal de différence modifié quantifié et non quantifié; caractérisé en ce que le circuit de modification (137) réagit conjointement aux signaux de paramètre de prédiction liés aux formants, au

signal d'erreur de quantification et au signal de diffé-

rence en concentrant l'erreur de quantification dans les parties de formants du spectre du signal de parole, grâce

à quoi l'erreur de quantification est masquée par les for-

mants du signal de parole.

2. Système de transmission de signal de parole à prédiction selon la revendication 1, caractérisé en ce que le circuit de modification (137) comprend des moyens (120, 122, 124) qui réagissent conjointement aux signaux de paramètre de prédiction liés aux formants et au signal d'erreur de quantification en formant un signal d'erreur pondéré de formants, et des moyens (126) qui combinent le

signal d'erreur pondéré de formantsavec le signal de diffé-

rence pour concentrer l'erreur de quantification dans les parties de formants du spectre du signal de parole, afin de maintenir le rapport entre le signal de parole et l'erreur de quantification au-dessus d'un niveau prédéterminé, sur

la totalité du spectre du signal de parole.

3. Système de transmission de signal de parole

à prédiction selon la revendication 2, caractérisé en ce-

que les moyens de formation de signal d'erreur pondéré de formantscomprennent des moyens (122) qui réagissent aux signaux de paramètre de prédiction liés aux formants en engendrant un ensemble de signaux de paramètre de filtre adaptatif, et des moyens (120) qui réagissent conjointement aux signaux de paramètre de filtre adaptatif et au-signal d'erreur de quantification pour former le signal d'erreur de quantification pondéré de formants; et les moyens de combinaison (126) soustraient le signal d'erreur pondéré

de formants du signal de différence.

4. Système de transmission de signal de parole à prédiction selon la revendication 3, caractérisé en ce

que les moyens (122) qui engendrent des signaux de para-

mètre de filtre adaptatif sont conçus de façon à former

un ensemble de signaux de paramètre de filtre fi, f2,....

fp, fp+1, conformément à la relation prédéterminée p+l P p+1 p1' _ I fkz =.. (1+z1) 3 a k=i k=1 dans laquelle z représente un terme de retard, ak est le signal de paramètre de prédiction lié aux formants de rang k

et p est le nombre de signaux de paramètre de prédiction.

5. Système de transmission de signal de parole à prédiction selon la revendication 4, caractérisé en ce que les moyens (120) de formation de signal d'erreur de quantification pondéré de formants comprennent un circuit à filtre transversal qui est conçu de façon à former un signal d'erreur de quantification pondéré de formants p+l Wn L fken-k k=1 dans lequel wn est la valeur présente du signal d'erreur de

quantification pondéré de formants et e est la valeur pré-

n

sente du signal d'erreur de-quantification.

6. Système de transmission de signal de parole'

à prédiction selon l'une quelconque des revendications 2

à 5, caractérisé en ce que le dispositif d'analyse (135) est également conçu de façon à engendrer un ensemble de signaux de paramètre de prédiction liés à la hauteur b1, b2, b3 et un signal lié à la période de hauteur, m, et les

moyens de modification (137) comprennent en outre un pré-

dicteur de périodicité vocale (128) qui réagit au signal quantifié, aux signaux de paramètre de prédiction liés à la hauteur bi, b2 et b3 et au signal lié à la période de hauteur, m, en formant un signal: d- b di_ + b dl + b d' + n =ln m+1 2 n-m 3 n-m-i n correspondant à la valeur prédite du signal de différence,

dans lequel d' est la valeur présente du signal de diffé-

n rence prédit et q est le signal quantifié, et les moyens

de combinaison (126) sont également conçus de façon à sous-

traire du signal de différence la valeur prédite de ce signal de différence afin de réduire la redondance liée

à la hauteur dans le signal de différence modifié.

7. Système de transmission de signal de parole à prédiction selon la revendication 6, comprenant en outre

des moyens (203, 205, 217) qui réagissent au signal quan-

tifié en produisant un signal d'excitation et des moyens (215, 219, 207) qui réagissent conjointement au signal d'excitation et aux signaux de paramètre de prédiction liés aux formants en formant une image du signal de parole,

caractérisé en ce que les moyens produisant un signal-

d'excitation (215, 219, 207) comprennent un prédicteur de périodicité vocale (217)qui réagit au signal quantifié, aux signaux de paramètre de prédiction liés à la hauteur et au signal lié à la période de hauteur en formant un signal correspondant à la valeur prédite du signal de différence, et des moyens (205) qui combinent la valeur

prédite du signal de différence avec le signal quantifié.

8. Procédé de traitement d'un signal de parole comprenant les opérations qui consistent à analyser le signal de parole dans des intervalles sélectionnés pour

2475264;

engendrer un ensemble de signaux de paramètre de prédiction liés aux formants pour chaque intervalle; à produire un signal représentatif de la différence entre le signal de parole présent et sa valeur prédite, à partir du signal de parole et des signaux de paramètre de prédiction liés aux formants; à modifier le signal de différence; à quantifier le signal de différence modifié; et à former un signal d'erreur de quantification correspondant à la différence entre les signaux de différence modifiés quantifiés et non quantifiés; caractérisé en ce que la modification du signal de différence comprend l'opération qui consiste à combiner les signaux de paramètre de prédiction liés aux formants,

le signal d'erreur de quantification et le signal de diffé-

rence, pour concentrer l'erreur de quantification dans les parties de formantsdu spectre du signal de parole afin

que l'erreur de quantification soit masquée par les for-

mants du signal de parole.

9. Procédé de traitement d'un signal de parole

selon la revendication 8, caractérisé en ce que la modifi-

cation du signal de différence comprend l'opération consis-

tant à former un signal d'erreur de quantification pondéré

de formants, à partir des signaux de paramètre de prédic-

tion liés-aux formants et du signal d'erreur de quantifi-

cation, et à combiner le signal d'erreur pondéré de for-

mants avec le signal de différence pour concentrer l'erreur de quantification dans les parties de formants du spectre du signal de parole afin de maintenir le rapport entre le signal de parole et l'erreur de quantification au-dessus d'un niveau prédéterminé sur la totalité du spectre du

signal de parole.

10. Procédé de traitement d'un signal de parole-

selon la revendication 9, caractérisé en ce que la formation du signal d'erreur pondéré de formants comprend l'opération consistant à engendrer un ensemble de signaux de paramètre de filtre adaptatif à partir des signaux de paramètre de prédiction liés aux formants, et à pondérer les signaux d'erreur de quantification avec les signaux de paramètre de filtre adaptatifs; et l'opération consistant à combiner

2-475264

le signal de différence avec le signal d'erreur pondéré de formants comprend l'opération consistant à soustraire

le signal d'erreur pondéré de formants du signal de diffé-

rence.

11. Procédé de traitement d'un signal de parole

selon la revendication 10, caractérisé en ce que l'opéra-

tion consistant à engendrer les signaux de paramètre de

filtre adaptatif comprend l'opération qui consiste à for-

mer un ensemble de signaux de paramètre de filtre f1,f2.

fp, fp+, conformément à la relation p+i P X f -k 1 (i+z1) > akz k=1 k=1 dans laquelle z 1 représente un retard déterminé, ak est le signal de paramètre de prédiction lié aux formants de

rang k et p est le nombre de signaux de paramètre de pré-

diction liés aux formants.

12. Procédé de traitement d'un signal de parole--

selon la revendication 11, caractérisé en ce que l'opéra-

tion de formation du signal d'erreur de quantification pondéré de formants comprend l'opération qui consiste à filtrer le signal d'erreur de quantification conformément à la relation p+i n fken-k k=l dans laquelle wn est la valeur présente du signal d'erreur de quantification pondéré de formantset en est la valeur

présente du signal d'erreur de quantification.

13. Procédé de traitement d'un signal de parole

selon l'une quelconque des revendications 9 à 12, caracté-

risé en ce que l'analyse du signal de parole comprend en outre l'opération qui consiste à former un ensemble de signaux de paramètre de prédiction liés à la hauteur b1, b2, b3 et un signal lié à la période de hauteur, m, pour chaque intervalle, la modification du signal de différence comprend l'opération qui consiste à produire un signal correspondant à la valeur prédite du signal de différence,

conformément à la relation: -

dl'=b d' + bdn' + bdl n _lnm+l 2 n-m 3 n-m-l n dans laquelle dl est la valeur présente du signal de diffé- n rence prédit et qn est le signal quantifié, et la valeur prédite du signal de différence est combinée avec le signal de différence et avec le signal d'erreur pondéré de formants pour réduire la redondance lié à la hauteur dans le signal

de différence modifié.

14. Procédé de traitement d'un signal de parole

selon la revendication 13, comprenant en outre les opéra-

tions qui consistent à produire un signal d'excitation sous l'effet du signal quantifié et à former une image du signal de parole en combinant le signal d'excitation avec les signaux de paramètre de prédiction liés aux formants, caractérisé en ce que l'opération consistant à produire une excitation comprend les opérations consistant à former un signal correspondant à la valeur prédite du signal de différence, à partir de la partie précédente du signal quantifié, des signaux de paramètre de prédiction liés à la hauteur b1, b2, b3 et du signal lié à la période de hauteur, m, et à combiner le signal quantifié présent

avec la valeur prédite du signal de différence.