FR2517452A1 - Circuit de traitement numerique de la parole - Google Patents

Circuit de traitement numerique de la parole Download PDF

Info

Publication number
FR2517452A1
FR2517452A1 FR8219772A FR8219772A FR2517452A1 FR 2517452 A1 FR2517452 A1 FR 2517452A1 FR 8219772 A FR8219772 A FR 8219772A FR 8219772 A FR8219772 A FR 8219772A FR 2517452 A1 FR2517452 A1 FR 2517452A1
Authority
FR
France
Prior art keywords
signal
speech
interval
representative
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8219772A
Other languages
English (en)
Other versions
FR2517452B1 (fr
Inventor
Bishnu Saroop Atal
Joel Richard Remde
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of FR2517452A1 publication Critical patent/FR2517452A1/fr
Application granted granted Critical
Publication of FR2517452B1 publication Critical patent/FR2517452B1/fr
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

L'INVENTION CONCERNE LES TECHNIQUES DE CODAGE DE LA PAROLE. UN CIRCUIT DE TRAITEMENT DE PAROLE COMPREND NOTAMMENT UN ANALYSEUR A PREDICTION 110 QUI FORME UN SIGNAL REPRESENTATIF DE LA PAROLE DANS CHAQUE INTERVALLE DE TEMPS SUCCESSIF, ET UN CIRCUIT DE FORMATION DE SIGNAL D'EXCITATION 120 QUI FORME UN SIGNAL REPRESENTATIF D'UNE PAROLE ARTIFICIELLE DANS CHAQUE INTERVALLE. UN SIGNAL CODE EST FORME DE FACON A MINIMISER LA DIFFERENCE ENTRE LE SIGNAL REPRESENTATIF DE LA PAROLE ET LE SIGNAL REPRESENTATIF DE LA PAROLE ARTIFICIELLE, ET CE SIGNAL CODE EST UTILISE POUR CONSTRUIRE UNE VERSION REPRODUITE DE LA CONFIGURATION DE PAROLE DE L'INTERVALLE. APPLICATION A LA TELEPHONIE.

Description

La présente invention concerne le traitement de la parole et porte plus
particulièrement sur des techniques de
codage numérique de la parole.
Les systèmes de communication numériques dans le domaine de la parole, y compris les dispositifs d'enregis-
trement de la parole et de réponse vocale, utilisent la com-
pression du signal pour réduire le débit binaire nécessaire pour l'enregistrement et/ou la transmission Il est bien
connu qu'une configuration de parole contient des redondan-
ces qui ne sont pas essentielles à sa qualité apparente La suppression des composantes redondantes de la configuration de parole diminue notablement le nombre de codes numériques qui sont nécessaires pour élaborer une version reproduite de la parole La qualité subjective de la version reproduite de la parole dépend cependant des techniques de compression et
de codage.
Un système bien connu pour le codage numérique de la parole, décrit par exemple dans le brevet U S. 3 624 302, fait intervenir une analyse par prédiction linéaire d'un signal de parole d'entrée Le signal de parole est séparé en intervalles successifs et on génère un ensemble
de paramètres représentatifs de la parole de chaque inter-
valle L'ensemble de paramètres comprend des signaux de coefficients de prédiction linéaire qui sont représentatifs de l'enveloppe spectrale de la parole dans l'intervalle, et des signaux de hauteur et de voisement qui correspondent à l'excitation de la parole On peut coder ces signaux de paramètres avec un débit binaire très inférieur à celui du signal de parole lui-même On forme une version reproduite du signal de parole d'entrée à partir des codes de signaux de paramètres, en procédant par synthèse Le dispositif synthétiseur comprend généralement un modèle de l'appareil vocal humain, dans lequel les impulsions d'excitation sont modifiées par les coefficients de prédiction représentatifs de l'enveloppe spectrale, dans un filtre de prédiction ne
comportant que des pôles.
Le codage précédent, du type à prédiction linéaire
avec excitation par le paramètre de hauteur, est très effi-
251745 a cace Cependant, la version de la parole qui est produite présente une qualité synthétique qui est souvent difficile à comprendre En général, la mauvaise qualité de la parole
résulte de l'absence de correspondance entre la configura-
tion de parole et le modèle de prédiction linéaire utilisé. Des erreurs dans le code de hauteur ou des erreurs dans la
détermination du caractère voisé ou non voisé d'un inter-
valle de parole font que la version reproduite de la parole
a une sonorité déformée ou artificielle Des problèmes simi-
laires se manifestent également dans le codage de la parole par formants D'autres techniques de codage dans lesquelles l'excitation de la parole est obtenue à partir du résidu
après prédiction, comme par exemple la modulation MIC diffé-
rentielle adaptative, ou le codage par prédiction adaptatif,
procurent une amélioration importante du fait que l'excita-
tion ne dépend pas d'un modèle inexact Le débit binaire d'excitation de ces systèmes est cependant supérieur d'au moins un ordre de grandeur à celui correspondant au modèle à prédiction linéaire Les tentatives faites pour diminuer le débit binaire d'excitation dans les systèmes du type à
résidu ont généralement conduit à une perte notable de qua-
lité Un but de l'invention est de procurer un codage de la parole amélioré, de haute qualité, avec des débits binaires
inférieurs à ceux des techniques de codage par résidu.
L'invention porte sur une technique de traitement
d'une configuration séquentielle dans laquelle la configura-
tion séquentielle est divisée en intervalles de temps successifs Dans chaque intervalle de temps, on forme un signal représentatif de la configuration séquentielle de
l'intervalle et un signal de configuration artificielle.
Sous la dépendance du-signal de la configuration séquentielle de l'intervalle et du signal de la configuration artificielle, on forme un signal codé qui est conçu de façon à réduire la
différence entre la configuration séquentielle de l'inter-
valle et la configuration artificielle, pour représenter la
configuration séquentielle.
Selon un aspect de l'invention, on sépare une con-
figuration de parole en intervalles de temps successifs Dans t Si 74 si chaque intervalle, on forme un signal représentatif de la configuration de parole de l'intervalle, ainsi qu'un signal représentatif d'une parole artificielle On génère un signal correspondant à la différence entre le signal représentatif de la parole de l'intervalle et le signal représentatif de la parole artificielle; et on forme un signal qui est conçu de façon à modifier le signal représentatif de la parole
artificielle de l'intervalle pour réduire le signal corres-
pondant à la différence.
Dans un mode de réalisation de l'invention, on génère un ensemble de signaux de paramètres de prédiction pour chaque intervalle de temps d'un signal de parole On forme un signal de résidu de prédiction sous la dépendance
du signal de parole de l'intervalle de temps et des paramè-
tres de prédiction de l'intervalle de temps On fait passer le signal de résidu de prédiction dans un premier filtre de
prédiction pour produire un signal représentatif de la paro-
le pour l'intervalle de temps On génère un signal représen-
tatif d'une parole artificielle pour l'intervalle de temps, dans un second filtre de prédiction, à partir des paramètres de prédiction de l'intervalle Sous la dépendance du signal représentatif de la parole et du signal représentatif de la parole artificielle, pour l'intervalle de temps, on forme un signal d'excitation codé et on l'applique au second filtre de prédiction pour minimiser la différence quadratique moyenne, pondérée conformément à la -perception humaine, entre le signal représentatif de la parole de l'intervalle et le signal représentatif de la parole artificielle On
utilise le signal d'excitation codé et les signaux de para-
mètres de prédiction pour construire une version reproduite
de la configuration de parole de l'intervalle de temps.
L'invention sera mieux comprise à la lecture de
la description qui va suivre d'un mode de réalisation et en
se référant aux dessins annexés sur lesquels: La figure 1 représente un schéma synoptique d'un circuit de traitement de parole qui illustre l'invention; La figure 2 représente un schéma synoptique d'un circuit de traitement générateur de signal d'excitation 11 i 745 f qu'on peut utiliser dans le circuit de la figure 1 La figure 3 est un organigramme qui illustre le fonctionnement du circuit générateur de signal d'excitation de la figure 1; Les figures 4 et 5 sont des organigrammes qui illustrent le fonctionnement du circuit de la figure 2
La figure 6 est un diagramme séquentiel qui illus-
tre le fonctionnement du circuit générateur de signal d'excitation de la figure 1 et de la figure 2; et La figure 7 montre des signaux qui illustrent le
traitement de la parole conformément à l'invention.
La figure 1 montre un schéma synoptique général
d'un circuit de traitement de parole qui illustre l'inven-
tion Sur la figure 1, un transducteur de type microphone, 101, reçoit une configuration de parole telle qu'un message
parlé Le signal de parole analogique correspondant qui pro-
vient du transducteur est soumis à une limitation de bande et est converti en une séquence d'échantillons sous forme d'impulsions dans le circuit de filtrage et d'échantillonnage 113 de l'analyseur à prédiction 110 Le&filtrage peut 8 tre conçu de façon à supprimer les composantes de fréquence du signal de parole supérieures à 4,0 k Hz, et l'échantillonnage peut être effectué à une cadence de 8,0 k Hz, comme il est bien connu dans la technique Les instants de prélèvement des échantillons sont définis par un signal d'horloge
d'échantillons CL provenant du générateur d'horloge 103.
Chaque échantillon provenant du circuit 113 est transformé dans le convertisseur analogique-numérique 115 en un code
numérique représentatif de l'amplitude.
La séquence d'échantillons de parole est appliquée au calculateur de paramètres de prédiction 119 qui, comme il
est bien connu dans-la technique, divise les signaux de paro-
le en intervalles de 10 à 20 ms et génère un ensemble de signaux de coefficients de prédiction linéaire ak, avec k = 1, 2,, p, qui sont représentatifs du spectre à court
terme prédit pour les N " p échantillons de parole de cha-
que intervalle Les échantillons de parole provenant du con-
vertisseur analogique-numérique 115 sont retardés dans le
| 517450
circuit de retard 117 pour laisser un temps suffisant pour la formation des signaux ak Les échantillons retardés sont appliqués à l'entrée du générateur de résidu de prédiction 118 Comme il est bien connu dans la technique, le générateur de résidu de prédiction réagit aux échantillons de parole retardés et aux paramètres de prédiction ak en formant un signal qui correspond à la différence entre eux La formation
des paramètres de prédiction et du signal de résidu de pré-
diction pour chaque intervalle de temps, qui est représentée
dans l'analyseur à prédiction 110, peut être accomplie confor-
mément à la configuration décrite dans le brevet U S. 3 740 476 ou conformément à d'autres configurations connues
dans la technique.
Bien que les signaux de paramètres de prédiction
ak forment une représentation efficace du spectre de la paro-
le à court terme, le signal de résidu varie généralement dans une large mesure d'un intervalle à un autre et présente un débit binaire élevé qui ne convient pas dans de nombreuses
applications Dans le dispositif de codage vocal ou "voco-
deur" excité par le paramètre de hauteur, seuls les pics du
résidu sont transmis en tant que codes d'impulsions de hau-
teur Cependant, la qualité résultante est généralement
médiocre Le signal 701 de la figure 7 montre une configura-
tion de parole caractéristique sur deux intervalles de temps.
Le signal 703 montre le signal de résidu de prédiction qui est élaboré à partir de la configuration du signal 701 et
des paramètres de prédiction des intervalles On voit faci-
lement que le signal 703 est relativement complexe, ce qui fait que le codage d'impulsions de hauteur correspondant aux
pics de ce signal ne procure pas une approximation appro-
priée du résidu de prédiction Conformément à l'invention, le circuit de traitement de code d'excitation 120 reçoit le signal de résidu dk et les paramètres de prédiction ak de
l'intervalle et il génère un code d'excitation de l'inter-
valle qui a un nombre prédéterminé de positions de bit Le code d'excitation résultant représenté par le signal 705
présente un débit binaire relativement faible qui est cons-
tant Le signal 707 représente une version reproduite de la t Si? 452 configuration de parole du signal 701 qui est construite à partir du code d'excitation et des paramètres de prédiction des intervalles Comme le montre une comparaison des signaux
701 et 707, on obtient avec des débits binaires très infé-
rieurs un codage par prédiction adaptatif ayant de meilleu-
res caractéristiques de qualité de la parole.
Le signal de résidu de prédiction dk et les signaux de paramètre de prédiction ak pour chaque intervalle successif sont appliqués par le circuit 110 au circuit de
formation de signal d'excitation 120, au début de l'inter-
valle suivant Le circuit 120 produit un code d'excitation
d'intervalle à plusieurs éléments, EC, ayant un nombre pré-
déterminé de positions de bit pour chaque intervalle Chaque code d'excitation correspond à une séquence de 1 L i É I
impulsions qui sont représentatives de la fonction d'excita-
tion de l'intervalle L'amplitude Pl et la position mi de chaque impulsion dans l'intervalle sont déterminées dans le
circuit de formation de signal d'excitation de façon à per-
mettre la construction d'une version reproduite du signal de parole de l'intervalle, à partir du signal d'excitation et des signaux de paramètresde prédiction de l'intervalle Les signaux Pl et mi sont codés dans le codeur 131 et ils sont multiplexés dans le multiplexeur 135 avec les signaux de paramètres de prédiction de l'intervalle, pour donner un signal numérique correspondant à la configuration de parole
de l'intervalle.
Dans le circuit de formation de signal d'excita-
tion 120, le signal de résidu de prédiction dk et les signaux de paramètres de prédiction a k d'un intervalle sont
appliqués au filtre 121 par l'intermédiaire des portes res-
pectives 122 et 124 Au début de chaque intervalle, le signal d'horloge d'intervalle FC ouvre les portes 122 et 124, ce qui fait que les signaux dk sont appliqués au filtre
121 et les signaux a k S nt appliqués aux filtres 121 et 123.
Le filtre 121 est conçu de façon à modifier le signal dk afin de concentrer le spectre de quantification du signal d'erreur dans les régions de formants de celui-ci Comme il
est décrit dans le brevet U S 4 133 976, cette configura-
k 17452 tion de filtre a pour effet de masquer l'erreur dans les parties du spectre qui correspondent à une énergie de signal élevée. La fonction de transfert du filtre 121 s'exprime en notation de la transformation en z sous la forme H(z) = ( 1) 1-B(z)
dans laquelle la quantité B(z) est définie par les paramè-
tres de prédiction ak de l'intervalle.
Le filtre de prédiction 123 reçoit les signaux de paramètres de prédiction provenant du calculateur 119 et un signal d'excitation artificielle EC provenant du circuit de traitement de signal d'excitation 127 La filtre 123 a la fonction de transfert de l'équation ( 1) Le filtre 121 forme
un signal de parole d'intervalle pondéré y sous la dépendan-
ce du résidu de prédiction dk, tandis que le filtre 123 génère un signal de parole artificielle pondéré y, sous la dépendance du signal d'excitation qui provient du circuit de traitement 127 Les signaux y et y sont corrélés dans le circuit de traitement de corrélation 125 qui génère un signal E correspondant à la différence pondérée entre ces signaux Le signal E est appliqué au circuit de traitement de signal 127 pour ajuster le signal d'excitation EC-de façon à réduire les différences entre le signal pondéré représentatif de la parole, provenant du filtre 121, et le
signal pondéré représentatif de la parole artificielle, pro-
venant du filtre 123.
Le signal d'excitation est une séquence de 1 _ i, I impulsions Chaque impulsion a une amplitude Qi et une position mi Le circuit de traitement 127 est conçu de façon à former successivement les signaux (i, mi qui
réduisent les différences entre le signal pondéré représen-
tatif de la parole de l'intervalle, provenant du filtre 121, et le signal pondéré représentatif de la parole artificielle de l'intervalle, provenant du filtre 123 Le signal pondéré représentatif de la parole de l'intervalle est: n n Z= dkhnk 1 < N N ( 2 k=n-k et le signal pondéré représentatif de la parole artificielle de l'intervalle est
3 <IN < N)
Sn jú pjn-rn n C j= j-m en désignant par h la réponse impulsionnelle du filtre 121 n
ou du filtre 123.
Le signal d'excitation formé dans le circuit 120 est un signal codé ayant des éléments Pi, mi, avec i = 1, 2,, I Chaque élément représente une impulsion dans l'intervalle de temps Pl est l'amplitude de l'impulsion et m est la position de l'impulsion dans l'intervalle Le i circuit générateur de signal de corrélation 125 génère
successivement un signal de corrélation pour chaque élément.
Chaque élément peut être placé à un instant lqQ dans l'in-
tervalle de temps Par conséquent, le circuit de traitrement de corrélation forme Q candidats possibles pour l'élément i, conformément à l'équation ( 4):
N N
Ciq g =EYn hn ni hn-q ()
j n= n-q nn-
nq= avec: i-1 _ j:l ( 5)
fni 1 j-I (s)n-
Le générateur de signal d'excitation 127 reçoit les signaux C.iq provenant du circuit générateur de signal de corrélation,
il sélectionne le signal Ciq ayant la valeur absolue maxima-
le et il forme l'élément de rang i du signal codé, sous la forme: = = hk i Ciq*=o hk ( 6) mi = q i 1745} dans laquelle q est la position du signal de corrélation ayant la valeur absolue maximale L'indice i est incrémenté
et devient i+ 1 et le signal yn à la sortie du filtre de pré-
diction 123 est modifié Le processus conforme aux équations ( 4) ( 5) et ( 6) est répété pour former l'élément yi+ 1 ' mi+ 1. Après la formation de l'élément RI m I, le signal comprenant les éléments (Plml' 2 m 2, ô jm 1 est transféré vers le codeur 131 Comme il est bien connu dans la technique, le codeur 131 quantifie les éléments Pimi et il forme un signal
codé qui convient pour la transmission vers le réseau 140.
Chacun des filtres 121 et 123 de la figure 1 peut consister en un filtre transversal du type décrit dans le
brevet U S 4 133 976 précité Chacun des circuits de trai-
tement 125 et 127 peut être constitué par l'un des disposi-
tifs de traitement bien connus dans la technique, conçus de façon à accomplir le traitement exigé par les équations ( 4) et ( 6), comme le dispositif Macro Arithmetic Processor System 100 de la firme C S P, Inc, ou d'autres dispositifs de traitement bien connus dans la technique Le circuit de traitement 125 comprend une mémoire morte qui enregistre de façon permanente des instructions programmées destinées à
commander la formation du signal Ciq conformément à l'équa-
tion ( 4), et le circuit de traitement 127 comprend une
mémoire morte qui enregistre de façon permanente des ins-
tructions programmées destinées à sélectionner les éléments de signal Pi' mi conformément à l'équation ( 6), comme il
est bien connu dans la technique Les instructions de pro-
gramme enregistrées dans le circuit de traitement 125 sont
présentées en langage FORTRAN à l'Annexe A, et les instruc-
tions de programme enregistrées dans le circuit de traitement 127 sont indiquées en langage FORTRAN à l'Annexe B. La figure 3 représente un organigramme qui montre le fonctionnement des circuits de traitement 125 et 127 pour chaque intervalle de temps En considérant la figure 3, on
note que les signaux de réponse impulsionnelle hk sont géné-
rés à la case 305 sous la dépendance des paramètres de pré-
diction de l'intervalle pour la fonction de transfert de l'équation ( 1) Ceci se produit après la réception du signal 2 ii 74 gi FC provenant de l'horloge 103 sur la figure 1, ce qui correspond à la case d'attente 303 L'indice d'élément i et l'indice de position d'impulsion d'excitation q sont fixés
initialement à 1 à la case 307 Le signal Ciq est formé con-
formément à la case 309, à la réception des signaux y N et
Yni 11 provenant des filtres de prédiction 121 et 123.
L'indice de position q est incrémenté à la case 311 et la formation du signal Ciq correspondant à la position suivante
est déclenchée.
Une fois que le signal Ci Q a été formé pour l'élé-
ment de signal d'excitation i, dans le circuit de traitement
, le circuit de traitement 127 est mis en fonction.
L'indice q dans le circuit de traitement 127 est fixé ini-
tialement à 1 à la case 315, et l'indice i ainsi que les signaux Ciq formés dans le circuit de traitement 125 sont transférés vers le circuit de traitement 127 Le signal Ciq * qui représente le signal Ciq ayant la valeur absolue
maximale, et sa position q,sont fixés à zéro à la case 317.
Les valeurs absolues des signaux Ciq sont comparées à celle du signal C iq* et le maximum de ces valeurs absolues est
enregistré en tant que signal C iq*, dans la boucle qui com-
prend les cases 319, 321, 323 et 325.
Une fois que le signal Ci Q provenant du circuit de traitement 125 a été traité, on passe de la case 325 à la case 327 La position d'élément de code d'excitation m est
* 1
fixée à q et la valeur de l'élément de code d'excitation Pl est générée conformément à l'équation ( 6) L'élément Pimi est émis vers le filtre de prédiction 123 à la case 328 et l'indice i est incrémenté à la case 329 Après formation de l'élément P Im I de l'intervalle, on retourne à la case
d'attente 303 à partir de la case de décision 331 Les cir-
cuits de traitement 125 et 127 sont alors placés dans des états d'attente jusqu'à l'impulsion d'horloge d'intervalle
FC de l'intervalle suivant.
Le code d'excitation présent dans le circuit de traitement 127 est également appliqué au codeur 131 Le codeur transforme le code d'excitation provenant du circuit de traitement 127 sous une forme convenant à l'utilisation
17452
dans le réseau 140 Les signaux de paramètres de prédiction
ak pour l'intervalle sont appliqués à l'entrée du multiple-
xeur 135 par un circuit de retard 133 Le signal d'excita-
tion codé EC qui provient du codeur 131 est appliqué à l'autre entrée du multiplexeur Les codes d'excitation et les codes de paramètres de prédiction multiplexés pour l'intervalle
sont ensuite émis vers le réseau 140.
Le réseau 140 peut être un système de télécommuni-
cations, la mémoire de message d'un dispositif d'enregistre-
ment de parole, ou un appareil conçu pour enregistrer un message complet ou un vocabulaire d'éléments de message définis, par exemple des mots, des phonèmes, etc, pour l'utilisation dans des synthétiseurs de parole Quel que soit l'élément de message, la séquence résultante de codes de l'intervalle, provenant du circuit 120, est acheminée par le
réseau 140 vers le synthétiseur de parole 150 Le synthéti-
seur utilise à son tour les codes d'excitation de l'inter-
valle, provenant du circuit 120, ainsi que les codes de para-
mètres de prédiction de l'intervalle pour construire une
version reproduite de la configuration de parole.
Le démultiplexeur 152 appartenant au synthétiseur sépare le code d'excitation EC d'un intervalle par
rapport aux paramètres de prédiction ak de cet intervalle.
Après avoir été décodé en une séquence d'impulsions d'exci-
tation dans le décodeur 153, le code d'excitation est appli-
qué à l'entrée d'excitation du filtre 154 du synthétiseur de parole Les codes ak sont appliqués aux entrées de paramètres du filtre 154 Sous l'effet des signaux d'excitation et de paramètres de prédiction, le filtre 154 forme une version reproduite codée du signal de parole de l'intervalle, comme
il est bien connu dans la technique Le convertisseur numéri-
que-analogique 156 transforme la version reproduite codée en
un signal analogique qui est transmis par le filtre passe-
bas 158 et est transformé en une configuration de parole par
le transducteur 160.
Une autre configuration pour accomplir les opéra-
tions de formation de code d'excitation du circuit 120 peut être basée sur l'erreur quadratique moyenne pondérée entre les signaux y N et Yn' Après formation de pi et mi pour l'impulsion de signal d'excitation de rang i, cette erreur quadratique moyenne pondérée est: N i 2 ( 7) Ei = 11 -n -E S hn M n= j= 1 jnmj) Dans cette expression, hn est l'échantillon de rang N de la réponse impulsionnelle de H(z), m est la position de l'impulsion de rang j dans le signal de code d'excitation et
Pj est l'amplitude de l'impulsion de rang j.
Les positions et les amplitudes des impulsions sont générées séquentiellement On détermine l'élément de
rang i de l'excitation en minimisant Ei dans l'équation ( 7).
i On peut récrire l'équation ( 7) sous la forme: r = i 1 2 + h 2 + n= 1 j= 1 n-i I i-i -2 i (ynhn-mi Z jhn-m h ( 8) j= 1 de façon que les éléments de code d'excitation connus qui
précèdent pi' mi n'apparaissent que dans le premier terme.
Comme il est bien connu, on peut déterminer la valeur de pi qui minimiae Ei en différentiant l'équation ( 8) par rapport à i et en posant:
8 E ( 9)
ai = O Par conséquent, la valeur optimale de est donnée par l'expression: mi+K i-1 krn 1-'i O k=mi K j 1,j (
__ __ ( 10)
251745 a dans laquelle K Z h h_ C k < ( 11) r=k sont les coefficients d'autocorrélation du signal de réponse
impulsionnelle hk du filtre de prédiction.
pi dans l'équation ( 10) est fonction de la posi- tion de l'impulsion et on le détermine pour chaque valeur possible de celle-ci On sélectionne ensuite le maximum des
valeurs Jlilsur toutes les positions d'impulsion possibles.
Une fois qu'on a obtenu les valeurs pi et mi, on génère les
valeurs Fi+l mi+ 11 en résolvant d'une façon similaire l'équa-
tion ( 10) Le premier terme de l'équation ( 10) c'est-à-dire: m.+K I 1 dk km, miti k=m -K kkm t
correspond au signal représentatif de la parole de l'inter-
valle à la sortie du filtre de prédiction 121 Le second ter-
me de l'équation ( 10), c'est-à-dire: i-1 j= 1 j-mi correspond au signal représentatif de la parole artificielle
de l'intervalle, à la sortie du filtre de prédiction 123.
i est l'amplitude d'une impulsion d'excitation à la position mi qui minimise la différence entre les premier et second termes.
Le circuit de traitement de données qui est repré-
senté sur la figure 2 constitue une autre configuration possi-
ble pour le circuit de formation de signal d'excitation 120 de la figure 1 Le circuit de la figure 2 fournit le code d'excitation pour chaque intervalle de la configuration de parole, sous la dépendance du signal de résidu de prédiction
de l'intervalle, dk, et des signaux de paramètres de prédic-
tion de l'intervalle, ak, conformément à l'équation ( 10), et
il peut être constitué par le dispositif Macro Arithmetic Pro-
cessor System 100 de la firme C S P, Inc mentionné précé-
demment, ou par d'autres dispositifs de traitement bien
-1 745 J
connus dans la technique.
En considérant la figure 2, on voit que le circuit de traitement 210 reçoit du circuit 110, par l'intermédiaire de la mémoire 218, les signaux de paramètres de prédiction ak et les signaux de résidu de prédiction dn de chaque inter- valle successif de la configuration de parole Le circuit de traitement forme les éléments de signal de code d'excitation l',ml, P 2, m 2 ' ( 3 I, m 1 sous la commande d'instructions
enregistrées en permanence dans la mémoire morte de sous-
programme de filtre de prédiction, 201, et dans la mémoire morte de sousprogramme de traitement d'excitation, 205 Le sous-programme de filtre de prédiction de la mémoire morte
201 est présenté à l'Annexe C et le sous-programme de traite-
ment d'excitation de la mémoire morte 205 est présenté à.
l'Annexe D. Le circuit de traitement 210 comprend un bus commun 225, une mémoire de données 230, un processeur central
240, un processeur arithmétique 250, une interface de contrô- leur 220 et une interface d'entrée-sortie 260 Comme il est bien connu dans
la technique, le processeur central 240 est conçu de façon à commander la séquence d'opérations des autres unités du circuit de traitement 210 sous la dépendance
d'instructions codées provenant d'un contrôleur 215 Le pro-
* cesseur arithmétique 250 est conçu de façon à accomplir le traitement arithmétique sur des signaux codés provenant de la mémoire de données 230, sous la dépendance de signaux de commande provenant du processeur central 240 La mémoire de
données 230 enregistre des signaux sous la commande du pro-
cesseur central 240 et elle fournit ces signaux au processeur
arithmétique 250 et à l'interface d'entrée-sortie 260.
L'interface de contrôleur 220 procure une liaison de trans-
mission pour acheminer vers le processeur central 240, par le contrôleur 215, les instructions de programme contenues dans la mémoire morte 201 et la mémoire morte 205 L'interface d'entrée-sortie 260 permet d'appliquer les signaux dk et ak à la mémoire de données 230 et elle fournit au codeur 131 de la figure 1 les signaux de sortie pi et mi qui proviennent de la
mémoire de données.
Le fonctionnement du circuit de la figure 2 est illustré par l'organigramme de traitement de paramètres de filtre de la figure 4, l'organigramme de traitement de codes d'excitation de la figure 5 et le diagramme séquentiel de la figure 6 Au début du signal de parole, on passe à la case 406 de la figure 4, par l'intermédiaire de la case 405, et le compte d'intervalle r est fixé au premier intervalle par une impulsion ST unique provenant du générateur d'horloge 103 La figure 6 montre le fonctionnement du circuit des figures 1 et 2 pour deux intervalles successifs Entre les instants t O et t 7 dans le premier intervalle, l'analyseur à prédiction 110 forme les échantillons de configuration de
parole de l'intervalle r+ 2, conformément à ce qui est indi-
qué en 605, sous la commande des impulsions d'horloge d'échantillon du signal 601 L'analyseur 110 génère les signaux ak correspondant à l'intervalle r 1 entre les
instants t O et t 3 et il forme le signal de résidu de prédic-
tion dk entre les instants t 3 et t 6, comme il est indiqué en
607 Le signal FC (indiqué en 603) apparaît entre les ins-
tants t O et t 1 Les signaux dk provenant du générateur de signal de résidu 118, et enregistrés précédemment dans la mémoire 218 pendant l'intervalle précédent, sont placés dans la mémoire de données 230 par l'intermédiaire de l'interface d'entrée-sortie 260 et du bus commun 225, sous la commande du processeur central 240 Conformément à ce qui est indiqué à la case d'opération 415 de la figure 4, ces opérations
s'effectuent sous la dépendance du signal d'horloge d'inter-
valle FC Les signaux de paramètre de prédiction de l'inter-
valle ak, provenant du calculateur de paramètres de prédic-
tion 119, qui ont été placés précédemment dans la mémoire 218 pendant l'intervalle précédent, sont également introduits
dans la mémoire 230, conformément à la case d'opération 420.
Ces opérations ont lieu entre les instants t et t sur la
figure 6.
Après introduction des signaux dk et ak de l'inter-
valle dans la mémoire 230, on passe à la case 425 et les coefficients de filtre de prédiction bk correspondant à la fonction de transfert de l'équation ( 1): 251745 s b =k ak k= 1,2,,P ( 12) k sont générés dans le processeur arithmétique 250 et sont placés dans la mémoire de données 230 p est de façon caractéristique égal à 16 et a est de façon caractéristique égal à 0,85 pour une cadence d'échantillonnage de 8 k Hz Les signaux de réponse impulsionnelle du filtre de prédiction, hk ho = min(k-1,p) hk = i bkhk-i k= 1,2,,K ( 13) i= 1 sont ensuite générés dans le processeur arithmétique 250 et enregistrés dans la mémoire de données 230 Lorsque le signal de réponse impulsionnelle h K est enregistré, on passe
à la case 435 pour générer et enregistrer les signaux d'auto-
corrélation du filtre de prédiction correspondant à l'équa-
tion ( 11).
A l'instant t 2 sur la figure 6, le contrôleur 215 déconnecte la mémoire morte 201 de l'interface 220 et connecte à l'interface la mémoire morte de sous-programme de traitement d'excitation, 205 La formation des codes
d'impulsion d'excitation Pi, mi, représentée sur l'organi-
gramme de la figure 5, est alors déclenchée La séquence d'impulsions d'excitation est formée entre les instants t 2 et t 4 sur la figure 6 L'indice d'impulsion d'excitation i est fixé initialement à 1 et l'indice de position d'impulsion q est fixé à 1 à la case 505 est fixé à zéro à la case 510 et on passe à la case d'opération 515 pour déterminer piq = 11 11 est l'impulsion d'excitation optimale à la position q= 1 de l'intervalle La valeur absolue de 11 est alors comparée, à la case de décision 520 au Pl enregistré précédemment Du fait que Pl est initialement égal à zéro, le code mi est fixé à q=l et le code pi est fixé à ( 11 ' à la
case 525.
t 745 s L'indice de position q est ensuite incrémenté à la case 530 et on passe à la case 515 par la case de décision 535, pour générer le signal P 12 ' La boucle comprenant les cases 515, 520, 525, 530 et 535 est itérée pour toutes les valeurs de position d'impulsion 1 _ q 4 Q Après la Qième itération, la première amplitude d'impulsion d'excitation
1 = iq* et sa position dans l'intervalle ml=q sont enre-
gistrées dans la mémoire 230 De cette manière, la première des I impulsions d'excitation est déterminée En considérant le signal 705 sur la figure 7, on voit que l'intervalle r s'étend entre les instants t et t 1 Le code d'excitation
pour l'intervalle comprend 8 impulsions La première impul-
sion d'amplitude 1 et de position m 1 apparaît à l'instant tml sur la figure 7, conformément à la détermination faite
dans l'organigramme de la figure 5 pour l'indice i=l.
L'indice i est incrémenté à la case 545 pour correspondre à l'impulsion d'excitation suivante, et on passe à la case d'opération 515 à partir de la case 550 et de la case 510 A l'achèvement de chaque itération de la boucle qui s'étend entre les cases 510 et 550, le signal d'excitation est modifié pour réduire davantage le signal de l'équation ( 7) A l'achèvement de la seconde itération,
on forme l'impulsion e 2 m 2 (instant tm 2 sur le signal 705).
On forme ensuite successivement les impulsions d'excitation ( 3 m 3 (instant tm 3), P 4 m 4 (instant tm 4), P 5 m 5 (instant tm 5) t 6 m 6 (instant tm 6), ( 7 m 7 (instant tm 7), et f 8 m 8 (instant
tm 8), au fur et à mesure que l'indice i est incrémenté.
Après la Iième itération (en t 4 sur la représen-
tation faite en 609), on passe à la case 555 à partir de la case de décision 550, pour générer le code d'excitation de
l'intervalle courant: 1 m 1, P 2 m 2, 3 m L'indice d'in-
tervalle est incrémenté à la case 560 et les opérations du
filtre de prédiction de la figure 4 pour l'intervalle sui-
vant sont déclenchées à la case 415, correspondant à l'ins-
tant t 7 sur la figure 6 Lorsqueapparait le signal d'horloge FC pour l'intervalle suivant, en t 7 sur la figure 6, on
génère les signaux de paramètres de prédiction pour l'inter-
valle r+ 3 (entre les instants t 7 et t 14 sur la représenta-
tion faite en 605), on génère les signaux a k et dk pour
l'intervalle r+ 2 (entre les instants t 7 et t 13 sur la repré-
sentation faite en 607), et on génère le code d'excitation pour l'intervalle r+ 1 (entre les instants t 7 et t 12 sur la
représentation faite en 609).
Le code d'excitation de l'intervalle provenant du circuit de traitement de la figure 2 est appliqué au codeur
131 de la figure 2 par l'intermédiaire de l'interface d'en-
trée-sortie 260, comme il est bien connu dans la technique.
Le codeur 131 fonctionne de la manière indiquée précédemment de façon à quantifier le code d'excitation et à lui donner un format approprié pour l'application au réseau 140 Les signaux de paramètres de prédiction ak de l'intervalle sont appliqués à une entrée du multiplexeur 135 par le circuit de retard 133, de façon à pouvoir être multiplexés d'une manière appropriée avec le -code d'excitation de l'intervalle qui est émis par le codeur 131. On a décrit l'invention en considérant des modes
de réalisation particuliers, pris à titre d'exemples.
L'homme de l'art notera évidemment que diverses modifica-
tions peuvent être apportées sans sortir du cadre de l'inven-
tion Par exemple, les modes de réalisation décrits ici uti-, lisent des paramètres de prédiction linéaire et un résidu de prédiction On peut remplacer les paramètres de prédiction
linéaire par des paramètres de formants ou d'autres paramè-
tres de parole bien connus dans la technique Les filtres de prédiction sont alors conçus de façon à réagir aux paramètres de parole qui sont utilisés et au signal de parole, de façon à utiliser le signal d'excitation formé dans le circuit 120 de la figure 1 en combinaison avec les signaux de paramètres
de parole, pour construire une version reproduite de la con-
figuration de parole de l'intervalle, conformément à l'inven-
tion La technique de codage de l'invention peut être étendue
à des configurations séquentielles telles que des configura-
tions biologiques et géologiques pour obtenir des représenta-
tions efficaces de celles-ci.
NIJ
UúIOJISU
0090105 (xlilxi 131 II) II L+I=l (HCSI:ft S#I)LZUXOZ -IlïD Ot 7 O oz 01015 (XVW 121,i O) ji LOZ C SO Vo XOIJ Vislaaoo Sa IV Nzjj S na Ino,,Vo sin NIJIN 00 O O; Ge
T= 009
T=ô T=j LO 2 SISVO NOIIVIIOX 211 (i IVNDIS S'I H 110 d 'IVIIINI Sidwoo na NOIIVXIJ O OE COL Dd'IN"L=IEGLO(l
0 =(Y)H
L-ï 1 L=-A u LOG
= (X) H
Rl In S SOE ISNIV 121 (')H àflb JNVJ, MS SUJSID 2 lHNS 19 S (T)H e(T)H qf 1 È INVI Ma SU ISI Dagtlg ISS (O)H (Z)H NOIIDIGS Hd Sa s Ulq Ij na Squammoisindwi SSN Odzu VI Sa lflolv D O 91 E sunoli 'soc ss VD ++++O *(N) V=(X)j LOL v Hd 7 ï*D= 5 L =f) 01 Moii, -DIGS Ud SU 9 UIIIJ Hq Wl Od SINSIDIJJSOD 929 inoi Vo O L /X i X I " /9 PO/ H JI V # / 9 61 X Ii ii C 2 /9 L/Ddlx v Iva NOIIVISHHOO Sa 7 V Nn Is m unalvag Na D O T san Dil 'su Dorig flv axods Hugo D Hwwvuooud-gnos go D
V SIXSINNV
VOL ïHdlï* 5 = 5 0 alx'L=X LcOQ 0-V =f) moiioicislud SOE O suiliii 2 lli ulioci SINHI Dilqqa O o saci liflorivo O ( 914 v) Ifid Ni qqvo Otl S 2 vo Noiloiasad sa ssuiaxvuvd ssa auniosi ge ( 081 ( 6 z)cl) If Id Ni 11, IVD git, ssvo NOIIDIG Had SOE ficlissa SIOE 'IVNDIS ticl surilosli O /ZL/XUNI J/9810/ HEIVU oc viva Now;OD MOJIDIGRUT SICl mmil + 4 O ? safi Dii io?, smox quiowsx vri v clNodoqiiuoo awwvuooud-snos so O 0 ZXSlKNV o 3 HCSNRS/a VISCID=(I)VISE avisc=(i) wl C 137,ô) ai L+ô=c LOE OCú o=uvisôio 0 = 81 illsô GZE-STO sasvo O Noiivusuaoo s(i uvmois na D Ic I ng HHD'âSHOSU O
ESOSINI
(ZL)WI(ZL)VI Sa? Nomvi ioxsi OE qmis Ha uns IVU 21 N 50 O i sunoij Lzi ooqg nv axodssmaoo aw Kvuooud-sfios so D 9 2 lXSINNV zsUsz Hn Nilmoo 00 l o=xvwviag 517 sflmilmoo OOG l=ô T=I qoq asvo Noil -VIID Xqi G q VNDIS SI Hf I Od q VIIINI Md WOO na NOIIVXII O Ot, SIS SISVO 121 OT MOMMÈS 'T o N SWUSI O (T=i) qvilimi iviug livm Dis fia Moqvo O
/ZL/Xïï,I
275311 NI oc Nowio:) Sa IN Ewal Ivul D sun Dij so,, O SIUOW SUIOWSW VI V GN Od SSUUOO ZWWVUDO Ud-2 nos s D O qi 7,
CI SXSNNV
C KS Nufllju t U U O= MI la xvwy,=xtc Lo G
GCV ZSVD ++++O
Moilvqglduooolflvîa NOIIDNOJ Sa Xflv Nj DIS SHOE In DIVO O EOL si ZOL
L-ML=IZGLOG 01
0 =(X)H
:)EIN' ?:=i ZOL OQ
L=(L)H
ov asvo O a il O q -MS SC ISNIV IS '(E)H 9110 INVI NZ SUISIDZU Nq J'sa D (T)H '(I)H ZnÈ INVI NU SUISIDHUMU 19 q (O)H O (Z)H NOIIDIGZ Hd HG O quiqij fia aqqa Nmoisqndwi SON Od Hu VI 29 inoqvo D
C CALCUL DU SIGNAL BETAI CASE 515
IF(I EQ 1)GOT 0300
201 D 0201 J= 1,i-l
BETAI(Q)=BETAI(Q)-BETA(J)*PHI( 1 +IABS(M(J)-Q"
C RECHERCHE DU PIC DU SIGNAL BETAI CASES 520-525
300 IF(ABS(BETAI(") IT BETAMAX)-OT 0301
M(I)=Q
BETA Iff AX=ABS(BETAI(Q" 1-0 BETA(I)=B Ei"AI(Q)/PHI(I) 301 Q=Q+l
IF(Q LE XADGOT 0200
IF(I LE IMAX)GOT 05 ')O
CALL OUTPUT(BETAIIIAX)
CALL OUTPUT(MIMAX)
D 05 K= 1,29
D(K)=D(K+ 80)
RETOUR
FIN

Claims (22)

REVENDICATIONS
1 Procédé de traitement d'une configuration séquentielle, dans lequel on divise cette configuration
séquentielle en intervalles de temps successifs, et on génè-
re un signal représentatif de la configuration séquentielle pour chaque intervalle de temps, caractérisé en ce qu'on
génère un signal représentatif d'une configuration artifi-
cielle pour l'intervalle, on forme un signal capable de réduire la différence entre la signal représentatif de la configuration séquentielle et le signal représentatif de la configuration artificielle, pour l'intervalle, et on utilise le signal formé pour construire une version reproduite de la
configuration séquentielle de l'intervalle.
2 Procédé de traitement d'une configuration de parole selon la revendication 1, caractérisé en ce qu'on forme le signal capable de réduire la différence en générant un signal correspondant à la différence entre le signal représentatif de la parole de l'intervalle et le signal représentatif de la parole artificielle, et en formant un signal capable de modifier le signal représentatif de la parole artificielle pour réduire le signal correspondant à
la différence.
3 Procédé selon la revendication 2, caractérisé en ce que l'opération qui consiste à générer le signal
représentatif de la parole comprend les opérations qui con-
sistent à générer un ensemble de signaux de paramètres de
parole représentatifs de la configuration de parole de l'in-
tervalle, et à produire un signal représentatif de la parole sous la dépendance des signaux de paramètres de parole et de
la configuration de parole; l'opération consistant à géné-
rer le signal représentatif de la parole artificielle com-
prend la formation du signal représentatif de la parole arti-
ficielle de l'intervalle sous la dépendance des signaux de paramètres de parole; et l'opération de formation de signal comprend les opérations consistant à générer un premier
signal sous la dépendance du signal correspondant à la diffé-
rence et à modifier le signal représentatif de la parole artificielle de l'intervalle sous la dépendance du premier signal. 4 Procédé selon la revendication 3, caractérisé en ce que l'opération de génération du signal de paramètres de parole comprend la génération d'un ensemble de signaux
représentatifs du spectre de parole de l'intervalle.
Procédé selon la revendication 4, caractérisé en ce que l'opération de génération dessignauxde spectre de parole de l'intervalle comprend la formation d'un ensemble de signaux de paramètres de prédiction linéaire, sous la dépendance de la configuration de parole de l'intervalle l'opération consistant à produire le signal représentatif de la parole compre nd la formation d'un signal de résidu de prédiction sous la dépendance de la configuration de parole de l'intervalle et des signaux de paramètres de prédiction linéaire de l'intervalle, et la combinaison des signaux de paramètres de prédiction linéaire avec les signaux de résidu de prédiction; et l'opération de génération du premier signal comprend les opérations qui consistent à produire un signal codé ayant au moins un élément, sous la dépendance du signal correspondant à la différence, et à modifier le
signal représentatif de la parole artificielle de l'inter-
valle, sous la dépendance de l'élément du signal codé.
6 Procédé selon la revendication 5, caractérisé en ce que l'opération consistant à générer le premier signal
comprend les opérations, exécutées un nombre de fois prédé-
terminé, qui consistent à générer un élément du signal codé sous la dépendance du signal correspondant à la différence,
et à modifier le signal représentatif de la parole artificiel-
le de l'intervalle sous la dépendance des éléments du signal codé. 7 Procédé selon la revendication 6, caractérisé en ce que l'opération de génération du signal correspondant
à la différence s'effectue en générant un signal représenta-
tif de la corrélation entre le signal représentatif de la
parole de l'intervalle et le signal représentatif de la paro-
le artificielle.
8 Procédé selon la revendication 5, caractérisé
17452
en ce que l'opération de génération du signal correspondant
à la différence comprend la génération d'un signal représen-
tatif de la différence quadratique moyenne entre le signal représentatif de la parole de l'intervalle et le signal représentatif de la parole artificielle. 9 Procédé selon la revendication 2, caractérisé en ce qu'on produit un signal codé capable de modifier le signal représentatif de la parole artificielle pour réduire
le signal correspondant à la différence.
10 Procédé selon la revendication 9, caractérisé en ce qu'on combine le signal codé produit et les signaux de
paramètres de parole pour générer un signal codé représenta-
tif de la configuration de parole.
11 Procédé selon la revendication 9, caractérisé en ce que la génération du signal de configuration de parole comprend la génération d'un ensemble de signaux de-paramètres de prédiction linéaire pour l'intervalle, sous la dépendance
d'une configuration de parole de l'intervalle; et la généra-
tion d'un signal représentatif de la parole de l'intervalle comprend la génération d'un signal de résidu de prédiction sous la dépendance des signaux de paramètres de prédiction linéaire de l'intervalle et de la configuration de parole de l'intervalle, et la formation d'un signal représentatif de la parole de l'intervalle sous la dépendance des signaux de paramètres de prédiction linéaire de l'intervalle et du
signal de résidu de prédiction de l'intervalle.
12 Procédé selon la revendication 11, caractérisé en ce que l'opération consistant à produire le signal codé comprend la génération d'un signal codé ayant au moins un élément, sous la dépendance du signal correspondant à la différence, et la modification du signal représentatif de la parole artificielle de l'intervalle, sous la dépendance des
éléments du signal codé.
13 Procédé selon la revendication 11, caractérisé en ce que l'opération consistant à produire le signal codé comprend la génération d'un signal codé à plusieurs éléments, par génération successive d'un élément du signal codé sous la dépendance du signal correspondant à la différence, et la
17452
modification du signal représentatif de la parole artifi-
cielle, sous la dépendance des éléments du signal codé.
14 Procédé selon l'une quelconque des revendica-
tions 2 à 13, caractérisé en ce qu'on utilise le signal formé pour construire une version reproduite de la configuration de
parole de l'intervalle.
Circuit de traitement d'une configuration séquentielle comprenant des moyens destinés à diviser une configuration séquentielle en intervalles de temps successifs, et des moyens destinés à générer un signal représentatif de la configuration séquentielle, pour chaque intervalle de temps, caractérisé en ce qu'il comporte des moyens destinés à
générer un signal de configuration artificielle pour l'inter-
valle, des moyens destinés à former un signal capable de réduire la différence entre le signal représentatif de la configuration séquentielle et le signal de configuration
artificielle pour l'intervalle, et des moyens destinés à uti-
liser le signal formé pour construire une version reproduite
de la configuration séquentielle de l'intervalle.
16 Circuit de traitement de parole comprenant des moyens destinés à diviser une configuration de parole en intervalles -de temps successifs, et des moyens destinés à générer un signal représentatif de la configuration de parole de chaque intervalle, caractérisé en ce qu'il comprend des
moyens destinés à générer un signal représentatif d'une paro-
le artificielle pour l'intervalle de temps, des moyens desti-
nés à générer un signal correspondant à la différence entre le signal représentatif de la parole de l'intervalle et le signal représentatif de la parole artificielle, et des moy'ens destinés à former un signal capable de modifier le signal représentatif de la parole artificielle pour réduire le
signal correspondant à la différence.
17 Circuit de traitement de parole selon la reven-
dication 16, caractérisé en ce que les moyens de génération de signal représentatif de la parole comprennent des moyens destinés à générer un ensemble de signaux de paramètres de parole pour la configuration de parole de l'intervalle, et des moyens qui réagissent aux signaux de paramètres de parole et à la configuration de parole en produisant le signal représentatif de la parole; les moyens de génération de signal représentatif de la parole artificielle comprennent des moyens qui réagissent aux signaux de paramètres de parole en formant le signal représentatif de la parole artificielle
de l'intervalle; et les moyens de formation de signal com-
prennent des moyens qui réagissent au signal correspondant à la différence en générant un premier signal, et des moyens
qui réagissent au premier signal en modifiant le signal repré-
sentatif de la parole artificielle de l'intervalle.
18 Circuit de traitement de parole selon la reven-
dication 17, caractérisé en ce que les moyens de génération de signaux de paramètres de parole comprennent des moyens destinés à générer un ensemble de signaux représentatifs du
spectre de la configuration de parole de l'intervalle.
19 Circuit de traitement de parole selon la reven-
dication 18, caractérisé en ce que les moyens de génération de signaux de paramètres de parole comprennent des moyens qui réagissent à la configuration de parole de l'intervalle en formant un ensemble de signaux de paramètres de prédiction linéaire; les moyens produisant un signal représentatif de
la parole comprennent des moyens qui réagissent à la configu-
ration de parole de l'intervalle et aux s ignaux de paramètres
de prédiction linéaire en formant un signal de résidu de pré-
diction, et des moyens destinés à combiner les signaux de paramètres de prédiction linéaire de l'intervalle avec le
signal de résidu de prédiction, pour former le signal repré-
sentatif de la parole de l'intervalle; et les moyens de génération du premier signal comprennent des moyens qui
réagissent au signal correspondant à la différence en produi-
sant un signal codé ayant au moins un élément, et des moyens qui réagissent à l'élément du signal codé en modifiant le
signal de parole artificielle de l'intervalle.
Circuit de traitement de parole selon la reven-
dication 19, caractérisé en ce que les moyens de génération du premier signal comprennent des moyens qui fonctionnent N
fois de façon à produire un signal codé à N éléments, compre-
nant des moyens qui réagissent au signal correspondant à la différence en générant un élément du signal codé, et des moyens qui réagissent à l'élément du signal codé en modifiant
-le signal représentatif de la parole artificielle de l'inter-
valle. 21 Circuit de traitement de parole selon la reven- dication 20, caractérisé en ce que les moyens de génération de signal correspondant à la différence comprennent des moyens destinés à générer un signal représentatif de la corrélation entre le signal représentatif de la parole de l'intervalle et
le signal représentatif de la parole artificielle.
22 Circuit de traitement de parole selon la reven-
dication 15, caractérisé en ce que les moyens de génération de signal correspondant à la différence comprennent des moyens destinés à générer un signal représentatif de la différence quadratique moyenne entre le signal représentatif de la parole
de l'intervalle et le signal représentatif de la parole arti-
ficielle.
23 Circuit de traitement de parole selon la reven-
dication 16, caractérisé en ce qu'il comprend des moyens destinés à produire un signal codé capable de modifier le signal représentatif de la parole artificielle de façon à
réduire le signal correspondant à la différence.
24 Circuit de traitement de parole selon la reven-
dication 23, caractérisé en ce qu'il comprend des moyens destinés à combiner le signal codé produit et les signaux de
paramètres de parole de façon à former un signal codé repré-
sentatif de la configuration de parole de l'intervalle.
Circuit de traitement de parole selon la reven-
dication 23, caractérisé en ce que les moyens de génération de signaux de paramètres de parole comprennent des moyens qui
réagissent à la configuration de parole en générant un ensem-
ble de signaux de paramètres de prédiction linéaire; et les moyens de génération de signal représentatif de la parole
comprennent des moyens qui réagissent aux signaux de paramè-
tres de prédiction linéaire et à la configuration de parole en générant un signal de résidu de prédiction, et des moyens
qui réagissent aux signaux de paramètres de prédiction linéai-
re et au signal de résidu de prédiction en formant le signal
17452
représentatif de la parole.
26 Circuit de traitement de parole selon la
revendication 25, caractérisé en ce que les moyens qui pro-
duisent le signal codé comprennent des moyens qui réagissent au signal correspondant à la différence en générant un signal codé ayant au moins un élément, et des moyens qui réagissent à l'élément du signal codé de façon à modifier le signal
représentatif de la parole artificielle.
27 Circuit de traitement de parole selon la
revendication 25, caractérisé en ce que les moyens qui pro-
duisent le signal codé comprennent des moyens destinés à générer un signal codé à plusieurs éléments, comprenant des moyens qui fonctionnent successivement de façon à générer un
élément du signal codé sous la dépendance du signal corres-
pondant à la différence et de façon à modifier le signal représentatif de la parole artificielle sous la dépendance
des éléments du signal codé.
28 Circuit de traitement de parole selon la revendication 16, caractérisé en ce qu'il comporte des moyens qui réagissent au signal correspondant à la différence en générant un signal d'excitation codé pour l'intervalle et en appliquant le signal d'excitation codé aux moyens de génération de signal représentatif de la parole artificielle,
pour réduire le signal correspondant à la différence.
29 Circuit de traitement de parole selon la revendication 28, caractérisé en ce qu'il comprend des moyens qui réagissent au signal d'excitation codé et aux
signaux de paramètres de prédiction en construisant une ver-
sion reproduite de la configuration de parole.
30 Circuit de traitement de parole selon l'une
quelconque des revendications 28 ou 29, caractérisé en ce
que les moyens de génération du signal d'excitation codé comprennent des moyens qui fonctionnent successivement de
façon à former un signal codé à plusieurs éléments, compre-
nant des moyens qui réagissent au signal correspondant à la différence en formant un élément du signal codé à plusieurs éléments, et en modifiant le signal représentatif de la parole
artificielle sous la dépendance des éléments du signal codé.
FR8219772A 1981-12-01 1982-11-25 Circuit de traitement numerique de la parole Expired FR2517452B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/326,371 US4472832A (en) 1981-12-01 1981-12-01 Digital speech coder

Publications (2)

Publication Number Publication Date
FR2517452A1 true FR2517452A1 (fr) 1983-06-03
FR2517452B1 FR2517452B1 (fr) 1986-05-02

Family

ID=23271926

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8219772A Expired FR2517452B1 (fr) 1981-12-01 1982-11-25 Circuit de traitement numerique de la parole

Country Status (8)

Country Link
US (1) US4472832A (fr)
JP (2) JPS6046440B2 (fr)
CA (1) CA1181854A (fr)
DE (1) DE3244476A1 (fr)
FR (1) FR2517452B1 (fr)
GB (1) GB2110906B (fr)
NL (1) NL193037C (fr)
SE (2) SE456618B (fr)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720863A (en) * 1982-11-03 1988-01-19 Itt Defense Communications Method and apparatus for text-independent speaker recognition
JPS59153346A (ja) * 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
EP0119033B1 (fr) * 1983-03-11 1987-04-15 Prutec Limited Dispositif de codage de la parole
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US4638451A (en) * 1983-05-03 1987-01-20 Texas Instruments Incorporated Microprocessor system with programmable interface
CA1219079A (fr) * 1983-06-27 1987-03-10 Tetsu Taguchi Vocodeur multi-impulsion
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
NL8302985A (nl) * 1983-08-26 1985-03-18 Philips Nv Multipulse excitatie lineair predictieve spraakcodeerder.
CA1236922A (fr) * 1983-11-30 1988-05-17 Paul Mermelstein Methode et appareil de codage de signaux numerique
CA1223365A (fr) * 1984-02-02 1987-06-23 Shigeru Ono Methode et appareil de codage de paroles
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
EP0163829B1 (fr) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Dispositif pour le traitement des signaux de parole
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
JPS60239798A (ja) * 1984-05-14 1985-11-28 日本電気株式会社 音声信号符号化/復号化装置
US4872202A (en) * 1984-09-14 1989-10-03 Motorola, Inc. ASCII LPC-10 conversion
DE3583494D1 (de) * 1984-12-25 1991-08-22 Nec Corp Verfahren und vorrichtung zur kodierung/dekodierung eines bildsignals.
US4675863A (en) 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
US4890328A (en) * 1985-08-28 1989-12-26 American Telephone And Telegraph Company Voice synthesis utilizing multi-level filter excitation
US4912764A (en) * 1985-08-28 1990-03-27 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder with different excitation types
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
USRE34247E (en) * 1985-12-26 1993-05-11 At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
CA1323934C (fr) * 1986-04-15 1993-11-02 Tetsu Taguchi Appareil de traitement de paroles
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
JP2625998B2 (ja) * 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5301274A (en) * 1991-08-19 1994-04-05 Multi-Tech Systems, Inc. Method and apparatus for automatic balancing of modem resources
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
US5546383A (en) 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
DE19643900C1 (de) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Nachfiltern von Hörsignalen, speziell von Sprachsignalen
US5839098A (en) 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6003000A (en) * 1997-04-29 1999-12-14 Meta-C Corporation Method and system for speech processing with greatly reduced harmonic and intermodulation distortion
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US7392180B1 (en) 1998-01-09 2008-06-24 At&T Corp. System and method of coding sound signals using sound enhancement
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6516207B1 (en) * 1999-12-07 2003-02-04 Nortel Networks Limited Method and apparatus for performing text to speech synthesis
US7295614B1 (en) 2000-09-08 2007-11-13 Cisco Technology, Inc. Methods and apparatus for encoding a video signal
JP4209257B2 (ja) 2003-05-29 2009-01-14 三菱重工業株式会社 分散型コントローラとその動作方法、及び、分散型コントローラを備えるフォークリフト
EP2595146A1 (fr) * 2011-11-17 2013-05-22 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Procédé et appareil pour évaluer l'intelligibilité d'un signal vocal dégradé

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1044991A (en) * 1963-05-07 1966-10-05 Gunnar Fant A vocoder system
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US3740476A (en) * 1971-07-09 1973-06-19 Bell Telephone Labor Inc Speech signal pitch detector using prediction error data
DE2435654C2 (de) * 1974-07-24 1983-11-17 Gretag AG, 8105 Regensdorf, Zürich Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
JPS5246642A (en) * 1975-10-09 1977-04-13 Mitsubishi Metal Corp Swimming pool
JPS5343403A (en) * 1976-10-01 1978-04-19 Kokusai Denshin Denwa Co Ltd System for analysing and synthesizing voice
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
JPS5648690A (en) * 1979-09-28 1981-05-01 Hitachi Ltd Sound synthesizer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1044991A (en) * 1963-05-07 1966-10-05 Gunnar Fant A vocoder system
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
COMPUTER, vol. 14, no. 7, juillet 1981 LONG BEACH C.A. (US) *
ICASSP 82, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 3-5 Mai 1982, Paris FR, vol. 1 of 3, IEEE NEW YORK (US) *
THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 33, no. 12, décembre 1961 NEW YORK (US) *

Also Published As

Publication number Publication date
NL193037C (nl) 1998-08-04
DE3244476A1 (de) 1983-07-14
SE8704178L (sv) 1987-10-27
JPS6156400A (ja) 1986-03-22
JPS6046440B2 (ja) 1985-10-16
GB2110906A (en) 1983-06-22
NL8204641A (nl) 1983-07-01
NL193037B (nl) 1998-04-01
DE3244476C2 (fr) 1988-01-21
SE456618B (sv) 1988-10-17
SE8206641D0 (sv) 1982-11-22
GB2110906B (en) 1985-10-02
US4472832A (en) 1984-09-18
SE467429B (sv) 1992-07-13
FR2517452B1 (fr) 1986-05-02
SE8704178D0 (sv) 1987-10-27
JPH0650437B2 (ja) 1994-06-29
SE8206641L (sv) 1983-06-02
JPS58105300A (ja) 1983-06-23
CA1181854A (fr) 1985-01-29

Similar Documents

Publication Publication Date Title
FR2517452A1 (fr) Circuit de traitement numerique de la parole
CA2182386C (fr) Procede de codage de parole a prediction lineaire et excitation par codes algebriques
CA2160749C (fr) Codeur de paroles, decodeur de signaux vocaux codes, methode de codage et de decodage de paroles et appareil d&#39;extraction de caracteristique phase-amplitude mettant en oeuvre cette methode
EP0608174B1 (fr) Systeme de codage-décodage prédictif d&#39;un signal numérique de parole par transformée adaptative à codes imbriqués
EP0865028A1 (fr) Décodeur de parole à interpolation de formes d&#39;ondes utilisant des fonctons pline
US6006174A (en) Multiple impulse excitation speech encoder and decoder
NL8400728A (nl) Digitale spraakcoder met basisband residucodering.
EP0782128A1 (fr) Procédé d&#39;analyse par prédiction linéaire d&#39;un signal audiofréquence, et procédés de codage et de décodage d&#39;un signal audiofréquence en comportant application
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
EP0865029B1 (fr) Interpolation de formes d&#39;onde par décomposition en bruit et en signaux périodiques
EP0195441B1 (fr) Procédé de codage à faible débit de la parole à signal multi-impulsionnel d&#39;excitation
JPH1063297A (ja) 音声符号化方法および装置
JP2001509616A (ja) 長期間予測と多重パルス励起信号を用いて音声信号を符号化および/または復号化する方法
US5235670A (en) Multiple impulse excitation speech encoder and decoder
EP2171713B1 (fr) Codage de signaux audionumériques
NO862602L (no) Vocoder innebygd i digitale signalbehandlingsenheter.
US5905970A (en) Speech coding device for estimating an error of power envelopes of synthetic and input speech signals
CA1336841C (fr) Systeme de codage du type multi-implusion
Matsuyama et al. Voice coding and tree encoding speech compression systems based upon inverse filter matching
EP1192619B1 (fr) Codage et decodage audio par interpolation
JP2621376B2 (ja) マルチパルス符号化装置
EP1192621B1 (fr) Codage audio avec composants harmoniques
EP0402947A2 (fr) Procédé et dispositif de codage de la parole utilisant une suite régulière d&#39;impulsions d&#39;excitation
EP1192618B1 (fr) Codage audio avec liftrage adaptif
JPH043878B2 (fr)