FR2502822A1 - Dispositif et procede de reconnaissance de la parole - Google Patents

Dispositif et procede de reconnaissance de la parole Download PDF

Info

Publication number
FR2502822A1
FR2502822A1 FR8205106A FR8205106A FR2502822A1 FR 2502822 A1 FR2502822 A1 FR 2502822A1 FR 8205106 A FR8205106 A FR 8205106A FR 8205106 A FR8205106 A FR 8205106A FR 2502822 A1 FR2502822 A1 FR 2502822A1
Authority
FR
France
Prior art keywords
frame
level
signal
speech
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8205106A
Other languages
English (en)
Other versions
FR2502822B1 (fr
Inventor
Cory Scott Myers
Frank Christopher Pirz
Lawrence Richard Rabiner
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of FR2502822A1 publication Critical patent/FR2502822A1/fr
Application granted granted Critical
Publication of FR2502822B1 publication Critical patent/FR2502822B1/fr
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Abstract

L'INVENTION CONCERNE LES TECHNIQUES DE RECONNAISSANCE DE LA PAROLE. ON ENREGISTRE UN ENSEMBLE DE SIGNAUX REPRESENTATIFS DES CARACTERISTIQUES ACOUSTIQUES D'UN CERTAIN NOMBRE DE MOTS DE REFERENCE ET ON GENERE UN ENSEMBLE DE SIGNAUX REPRESENTATIFS DES CARACTERISTIQUES ACOUSTIQUES DE LA CONFIGURATION DE PAROLE A RECONNAITRE. ON GENERE DES SUITES DE MOTS DE REFERENCE QU'ON COMPARE A LA CONFIGURATION DE PAROLE A RECONNAITRE. CETTE COMPARAISON S'EFFECTUE EN OPERANT UNE MISE EN COINCIDENCE DANS LE TEMPS ENTRE LES SIGNAUX DE CARACTERISTIQUES DE LA PAROLE A RECONNAITRE ET DES MOTS DE REFERENCE, CE QUI DEFINIT DES CHEMINS DE CORRESPONDANCE 110-1, 110-2, ETC. DONT LA COMPARAISON PERMET DE DETERMINER LA MEILLEURE CORRESPONDANCE. APPLICATION A LA COMMUNICATION HOMME-MACHINE.

Description

La présente invention concerne la reconnaissance de configurations et elle
porte plus particulièrement sur des structures destinées à reconnattre automatiquement une configuration de parole continue pour l'identifier à une série de mots.
Dans les systèmes de télécommunications, d'infor-
matique et de commande, il est souvent souhaitable d'utiliser
la parole en tant que moyen d'entrée directe pour des deman-
des, des ordres, des données ou d'autres informations. Les dispositifs de reconnaissance de la parole suppriment la nécessité d'employer un équipement terminal manoeuvré manuellement et ils permettent à des personnes d'être en
interaction avec un équipement automatisé, tout en entrepre-
nant simultanément d'autres activités. Cependant, la varia-
bilité des configurations de parole d'un locuteur à un autre, et même pour un locuteur particulier, a limité la précision de la reconnaissance de la parole. Il en résulte que les structures de reconnaissance de parole ont rencontré
le plus de succès dans des environnements spécialement con-
çus. Les systèmes de reconnaissance de parole sont généralement conçus de façon à transformer des signaux de parole d'entrée en ensembles de caractéristiques acoustiques déterminées. On compare les caractéristiques acoustiques des signaux de parole d'entrée avec des ensembles enregistrés de caractéristiques acoustiques, obtenues précédemment, de mots de référence identifiés. Le signal de parole est identifié lorsque les caractéristiques de parole d'entrée correspondent aux caractéristiques enregistrées d'une séquence particulière de mots de référence, selon des critères de reconnaissance
prédéterminés. La précision de tels systèmes de reconnaissan-
ce dépend fortement des caractéristiques sélectionnées et
des critères de reconnaissance fixés. On obtient les meil-
leurs résultats lorsque les caractéristiques de référence et les caractéristiques de parole d'entrée sont élaborées à partir de la même personne et lorsque la configuration de parole d'entrée à reconnaître est prononcée avec des pauses
distinctes entre les mots individuels.
On peut accomplir la reconnaissance de ccrfigura-
tions de parole continues en comparant la séquence de carac-
téristiques de parole d'entrée avec toutes les combinaisons possibles de configurations de signaux de caractéristiques de mots de référence qui sont élaborées à partir de la paro- le continue. Cependant, de telles structures nécessitent d'effectuer des tests, prenant beaucoup de temps, sur toutes les combinaisons possibles de configurations de mots de référence, ainsi qu'une recherche exhaustive dans le grand nombre de combinaisons de mots de référence. Comme on le
sait, le nombre de séquences possibles augmente exponentiel-
lement en fonction du nombre de mots dans la série. Par ccn-
séquent, il est généralement impossible en pratique d'effec-
tuer la recherche exhaustive, m8me pour un nombre limité de
mots dans une configuration de parole.
On peut concevoir des règles sémantiques et syn-
taxiques pour limiter le nombre de séquences possibles dans
une recherche, de façon à pouvoir analyser aisément certai-
nes classes d'information. Par exemple, le brevet U. S. 4 156 868 décrit une structure de reconnaissance basée sur une analyse syntaxique, dans laquelle on ne compare une configuration de parole d'entrée qu'à des configurations de référence possibles au point de vue syntaxique. Cependant, la reconnaissance de séquences de mots prononcés n'ayant pas de lien entre eux, comme une série de nombres prononcés, n'est pas améliorée par le recours à de telles contraintes
faisant appel au contexe.
Les brevets U. S. 4 049 913 et 4 059 725 décrivent des systèmes de reconnaissance de parole continue dans lesquels on calcule la similitude entre des configurations individuelles de caractéristiques de mots de référence et les caractéristiques de tous les intervalles possibles de la configuration de parole d'entrée. A partir des mesures de
similitude, on établit des résultats de reconnaissance par-
tielle pour chaque configuration de caractéristiques de mot de référence. On enregistre dans une table les mesures de similitude partielles comme les résultats de reconnaissance partielle. On extrait de la table les résultats reconnus pour fournir la série de mots de référence qui correspond à la configuration de parole d'entrée. On sélectionne dans la table toutes les combinaisons de configurations partielles
possibles qui forment des configurations continues. On choi-
sit alors la configuration sélectionnée pour laquelle la similitude est maximale. Bien que ces systèmes se soient avérés efficaces pour la reconnaissance de parole continue, le traitement du signal pour obtenir des configurations de référence et des mesures partielles de la similitude des configurations est excessivement complexe et inutilisable
d'un point de vue économique pour de nombreuses applica-
tions.
La demande de brevet U. S. 138 647 décrit un ana-
lyseur de parole continue qui est conçu de façon à reconnat-
tre une émission sonore comme étant une série de mots de référence pour lesquels des signaux de caractéristiques
acoustiques sont enregistrés. Sous la dépendance de l'émis-
sion sonore et des caractéristiques acoustiques des mots
de référence, on génère au moins une série de mots de réfé-
rence en tant que série candidate pour l'émission sonore considérée. On identifie des positions de mot successives pour l'émission sonore. Dans chaque position de mot, on génère une série candidate partielle en déterminant les
segments d'émission sonore correspondant aux mots de réfé-
rence et en combinant des mots de référence ayant une simi-
litude déterminée avec leurs segments d'émission sonore,
avec une série candidate partielle sélectionnée de la posi-
tion de mot précédente. On permet aux segments d'émission sonore déterminés de chevaucher une plage prédéterminée du
segment d'émission sonore pour la série candidate de posi-
tion de mot précédente, afin de tenir compte de la pronon-
ciation groupée et des différences entre les caractéristi-
ques acoustiques de l'émission sonore et celles des mots
de référence prononcés isolément.
La structure mentionnée en dernier réduit notable-
ment la complexité du traitement du signal, en sélection-
nant une série de mots partielle candidate particulière pour chaque intervalle successif de l'émission sonore inconnue, et elle améliore également la reconnaissance de la présence d'une prononciation groupée. Cependant, la sélection de certaines séries candidates à chaque position de mot
interdit de prendre en considération d'autres séries candida-
tes possibles de mots de référence, lorsque la reconnaissance
progresse en passant par chaque position de mot. Par consé-
quent, la précision de la reconnaissance des émissions sono-
res est limitée pour les émissions sonores les plus longues.
L'invention a pour but de permettre une meilleure reconnais-
sance d'une configuration de parole continue avec des exigen-
ces limitées en ce qui concerne le traitement du signal.
L'invention concerne la reconnaissance d'une confi-
guration de parole continue pour l'identifier à une suite de mots de référence déterminés. On enregistre des signaux représentatifs de la séquence temporelle des caractéristiques acoustiques des mots de référence individuels, depuis une trame initiale jusqu'à une trame finale. On produit une
séquence temporelle de signaux correspondant aux caractéris-
tiques acoustiques de la configuration de parole continue. On génère un ensemble de suites de mots de référence, sous la dépendance conjointe des signaux de caractéristiques de la configuration de parole et des signaux de caractéristiques des mots de référence. On identifie la configuration de parole comme étant l'une des suites de mots de référence qui
sont générées.
La génération de suites candidates de mots de référence comprend l'opération qui consiste à établir un ensemble de signaux qui identifient des niveaux de mot successifs pour la configuration de parole. On affecte un
segment de configuration de parole à chaque niveau successif.
A chaque niveau successif, on fait coïncider dans
le temps les signaux de caractéristiques de segment de con-
figuration de parole du niveau de mot et chacun des signaux de caractéristiques de mot de référence, pour les trames
acoustiquement possibles des configurations de caractéristi-
ques de référence, afin de produire des signaux de trame finale de segment de configuration de parole de mise en coïncidence dans le temps, et des signaux de correspondance
de mise en coïncidence dans le temps pour chaque mot de réfé-
rence. On sélectionne des suites de mots de référence sous
la dépendance des signaux de trame finale et de correspon-
dance pour la mise en coïncidence dans le temps, pour les niveaux. Selon un aspect de l'invention, on enregistre le meilleur signal de correspondance pour chaque trame finale de niveau, un signal représentatif du mot de référence ayant la meilleure correspondance pour chaque trame finale de niveau et un signal représentatif de la trame initiale pour la mise en coïncidence dans le temps du mot de référence
ayant la meilleure correspondance.
Selon un autre aspect de l'invention, on restreint les trames initiales de mise en coïncidence dans le temps du segment de configuration de parole, à chaque niveau, aux trames finales de mise en coïncidence dans le
temps du niveau précédent.
Selon un autre aspect encore de l'invention, on
restreint la plage des trames initiales de mise en coinci-
dence dans le temps du segment de configuration de parole, à chaque niveau, à la plage de trames finales du niveau précédent ayant des signaux de meilleure correspondance, à la limite, inférieurs au signal de meilleure correspondance
minimal du niveau précédent.
Selon un autre aspect encore de l'invention, on sélectionne la plage de trames de mots de référence pour la mise en coïncidence dans le temps avec chaque trame de segment de configuration de parole, de façon à réduire les effets de prononciation groupée. On étend la trame limite
inférieure de la plage de mots de référence jusqu'à la tra-
me initiale de mots de référence, lorsque la trame limite inférieure de mots de référence sélectionnée est inférieure à un premier nombre prédéterminé, et on étend la trame limite supérieure de la plage de mots de référence jusqu'à la trame finale de mot de référence lorsque la trame limite supérieure de mot de référence sélectionnée est supérieure
à un second nombre prédéterminé.
Selon un autre aspect encore de l'invention, on sélectionne une trame finale de segment de configuration de parole de mise en coïncidence dans le temps lorsque la trame
limite supérieure de plage de mots de référerce est supérieu-
re ou égale à la trame finale de mot de référence.
Selon un autre aspect encore de l'invention, on génère un signal de correspondance de mise en coïncidence dans le temps pour chaque trame de segment de configuration de parole de niveau. On génère un signal de correspondance
maximal admissible pour cette trame de segment de configura-
tion de parole de niveau, et on arrête la mise en coinciden-
ce dans le temps pour chaque mot de référence lorsque le
signal de correspondance de mise en coïncidence est supé-
rieur au signal de mise en coïncidence maximal admissible
pour la trame considérée.
Selon un autre aspect encore de l'invention, on compare la trame limite inférieure de la plage de mot de référence pour la mise en coincidence, pour chaque trame de segment de configuration de parole, avec la trame finale de mot de référence, et on arrête la mise en coïncidence dans le temps pour le niveau, pour chaque mot de référence, lorsque la trame limite inférieure de mot de référence est
supérieure ou égale à la trame finale de mot de référence.
Selon un autre aspect encore de l'invention, on
sélectionne les mots de référence pour la mise en coinciden-
ce dans le temps, à chaque niveau, sous la dépendance des
signaux d'identification de niveau.
L'invention sera mieux comprise à la lecture de
la description qui va suivre d'un mode de réalisation et en
se référant aux dessins annexés sur lesquels: La figure 1 représente graphiquement un processus de reconnaissance de parole continue qui constitue un exemple de l'invention;
Les figures 2 et 3 représentent un schéma synopti-
que d'un circuit de reconnaissance de parole qui constitue un exemple de l'invention;
La figure 4 représente un schéma synoptique détail-
lé et un dispositif de commande utilisable dans le circuit des figures 2 et 3;
La figure 5 représente un schéma synoptique détail-
lé d'un circuit logique de séquence de trames qui est utili-
sable dans le circuit des figures 2 et 3; La figure 6 représente un organigramme général qui illustre le processus de reconnaissance de parole conforme à l'invention; et Les figures 7 à 12 représentent des organigrammes détaillés qui illustrent les structures de reconnaissance de
parole conformes à l'invention.
Considérations générales Dans la reconnaissance de la parole sous forme continue, comme par exemple une configuration de mots liés,
on enregistre une séquence temporelle de signaux de caracté-
ristiques acoustiques
RV RV(1), RV(2),... RV(M) (1)
v pour chaque mot d'un ensemble de.mots de référence. Comme il est bien connu, on peut élaborer les caractéristiques à partir d'une analyse spectrale, à prédiction, ou d'un autre type, de prononciations ou d'émissions sonores de chaque
mot de référence RV,l 5. v < V. On élabore une séquence tem-
porelle de signaux de caractéristiques acoustiques
T, T(1), T(2),...,T(N M) (2)
à partir d'une analyse similaire d'une configuration de parole d'entrée. En général, on synthétise toutes les suites possibles de mots de référence et on compare la séquence de signaux de caractéristiques pour chaque suite avec la séquence de signaux de caractéristiques de l'émission sonore
d'entrée. On identifie la suite ayant la meilleure corres-
pondance comme étant l'émission sonore d'entrée. Du fait que le rythme de la parole varie largement, on peut employer la technique bien connue de programmation dynamique pour faire coïncider dans le temps les caractéristiques de la suite de mots de référence avec les caractéristiques de l'émission
sonore d'entrée. De cette manière, on peut obtenir une mesu-
re relativement précise de la correspondance entre les sui-
tes de mots de référence et l'émission sonore d'entrée.
Chaque suite de mots de référence est un enchaîne-
ment de mots de référence: R s R 1 R V2 RvLmax (3) On soumet les signaux de caractéristiques acoustiques de la suite RS à une transformation temporelle dynamique (TTD) qui les amène en correspondance avec les signaux de caractéris-
tiques de l'émission sonore, pour générer le signal de dis-
tance minimalede TTD entre le vecteur de caractéristiques de la suite de mots de référence: v1 Rs= Rvl1(),RVl(2),...R 1(Mvl), Rv2(1), v2 v2 VLmax
R (2),...R (M),... R (1)
v2 v Lma v Lmax R Lmax(2)...,R LmaX(M) (4) Lmax et le vecteur de caractéristiques de l'émission sonore: T, T(1), T(2),...T(n),...T(Nm) (5) Le signal de distance cumuléeobtenu par transformation temporelle de la suite RS pour la faire correspondre aux vecteurs de caractéristiques d'émission sonore de T est: N D(T,RS) min d(T(n),RS(w(n)) (6) w(n) n=1 Dans cette relation, w(n) est le facteur de transformation entre les vecteurs de caractéristiques T et RS, et d(T(n),RS(w(n))) d(n,w(n)) est la distance locale entre les vecteurs de caractéristiques de la trame n de l'émission S
sonore T et la trame m=w(n) de la suite RS. w(n) est habi-
tuellement restreint de façon que les points finals de l'émission sonore correspondent aux points finals de la suite, et la pente du facteur de transformation w(n) est sélectionnée de façon à correspondre à la plage de trames de configuration de parole prévues. L'application directe de la transformation temporelle dynamique à toutes les suites RS possibles donne un volume de traitement de signal qui nécessite beaucoup de temps et qui n'est pas économique,
même pour un nombre modeste de mots de référence.
Conformément à l'invention, on divise la transfor-
mation temporelle dynamique en niveaux successifs, de façon à réduire notablement le traitement du signal. Cependant, le nombre de suites RS qu'on considère comme candidates pour l'émission sonore d'entrée n'est pas restreint, ce qui fait que la précision de la reconnaissance n'est pas affectée. La
figure 1 illustre la structure de traitement par niveaux.
L'axe horizontal de la figure 1 correspond aux trames succes-
sives de l'émission sonore 1, 2,...n,...Nm. Un segment d'émission sonore est affecté à chaque niveau qui est défini par des limitations de coïncidence dans le temps au point de vue acoustique. L'axe vertical est divisé en niveaux L,1, 2,...L max, en désignant par Lmax le plus grans nombre de mots prévu dans l'émission sonore. Chaque niveau sur
l'axe vertical est divisé en trames des mots de référence.
Pour chaque mot de référence, le niveau L comporte Mw tra-
mes. Le nombre de trames est généralement différent pour chaque mot de référence, du fait que les configurations de mot de référence ont des durées différentes. Les signaux de caractéristiques de chaque mot de référence Rv sont soumis à une transformation temporelle les faisant coïncider avec le segment d'émission sonore, en commençant par les trames
initiales du niveau.
Pour chaque mot de référence, on fait passer les chemins de mise en coïncidence possibles entre le mot de référence et le segment d'émission sonore pour le niveau, par des points (n,m), conformément à la relation DA (n,m) = d(n,m) + min DA(n-lj) MI2e j< m-Il (7) dans laquelle 1 < n < Nm sont les trames de l'émission sonore, 1 < m < Mw sont les trames de mot de référence pour le niveau et DA (n,m) est le signal de distance cumuléele long du chemin au point n,m. d(n,m) est la distance locale entre les vecteurs de caractéristiques de l'émission sonore
à la trame d'émission sonore n et le vecteur de caractéris-
tiques de mot de référence à la trame de mot de référence m.
Le terme qui est le plus à droite dans l'équation (7) repré-
sente la distance cumulée jusqu'à la trame d'émission sonore
n-1 et la trame m-I2. j 4 m-Il de la suite de mots de réfé-
rence R. On choisit la trame I1 pour se conformer à la pla-
ge admissible de différence de rythme de parole. On la fixe habituellement à 1 si w(n-1)=w(n-2) et on la fixe à zéro dans les autres cas. On fixe de façon caractéristique 12 à 2. Ainsi, j s'étend sur la plage de m-2 à m-1 si w(n-l) = w(n-2) et s'étend sur la plage de m-2 à m dans les autres cas. Des structures de transformation temporelle dynamique
sont décrites de façon plus détaillée dans l'article "Mini-
mum Prediction Residual Applied to Speech Recognition" par F. Itakura, IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP23, pages 67-72, février 1975
et l'article "Considerations in Dynamic Time Warping Algo-
rithms for Discrete Word Recognition" par L. R. Rabiner, A. E. Rosenberg et S. E. Levinson, IEEE Transactions on Acoustics, Speech and Signal Processing," Vol. ASSP-26,
pages 575-582, décembre 1978.
On détermine par le traitement de transformation temporelle dynamique, conformément à l'équation 7, la trame initiale du chemin et la trame finale du chemin, ainsi que la distance cumulée entre les caractéristiques des mots de référence et de l'émission sonore, sur chaque chemin. Les trames finales de l'émission sonore du niveau correspondent à toutes les trames initiales de chemin possibles du niveau suivant. Pour chaque trame finale de niveau, on enregistre la distance cumulée minimale jusqu'à cette trame, le mot de
référence correspondant au signal de distance cumulée mini-
male et la trame initiale de niveau pour le chemin de dis-
tance cumulée minimale. Une fois que le traitement du der-
nier niveau est terminé, on reconstruit la séquence qui a
la meilleure correspondance, à partir des signaux de dis-
tance enregistrés, des mots de référence, des trames finales
de niveau et des trames initiales de niveau.
En considérant la figure 1, on note que le traite-
ment de transformation temporelle dynamique est restreint à la région des trames de parole attendues, pour éviter un
traitement inutile. Par exemple, la trame initiale de l'émis-
il sion sonore n-l sur la figure 1 ne peut pas correspondre
au point de vue acoustique, à la trame finale de l'un quel-
conque des mots de référence. De manière similaire, d'autres
régions de la figure 1 ne sont pas acoustiquement possibles.
Par conséquent, on peut limiter le traitement de TTD à la région des trames de parole acoustiquement probables, sans perte de précision de la reconnaissance. Sur la figure 1, le traitement de TTD est restreint à la région limitée par les
lignes 101, 102, 103 et 104, pour une émission sonore d'en-
trée de quatre mots. Les points extr8mes de la région permi-
se correspondent aux points finals des suites de mots de
référence possibles et de l'émission sonore. Le parallélo-
gramme qui est limité par les lignes 101, 102, 103 et 104 représente une accélération dans le rapport de deux à un et une réduction du rythme de parole dans le rapport de deux à un, entre les suites de mots de référence et l'émission sonore. Ces lignes limites sont fixées par les restrictions
de plage de l'équation 7. Bien que la région pour le traite-
ment de TTD qui est représentée sur la figure 1 soit appro-
priée pour l'invention, on comprend évidemment qu'on peut
sélectionner dans le cadre de l'invention d'autres configu-
rations restrictives bien connues.
La figure 1 représente graphiquement la partie du processus de reconnaissance consistant dans la construction des niveaux, pour une configuration de parole constituée par la séquence de quatre mots prononcés correspondantà la séquence binaire 1001. L'organigramme de la figure 6 montre la séquence d'opérations de la structure de construction de
niveaux. Après enregistrement des signaux de caractéristi-
ques pour chaque mot de référence, c'est-à-dire 0 et 1, on effectue l'analyse de l'émission sonore qui correspond à la case d'opération 601. Dans l'étape d'analyse, on produit la séquence de caractéristiques acoustiques correspondant à l'émission sonore d'entrée. Le niveau de mot est ensuite fixé initialement au niveau L=0 (case 603), pour lequel il
y a une seule trame initiale d'émission sonore nôl.
Le traitement du premier niveau commence par
l'initialisation de la mémoire relative au signal de distan-
ce et aux signaux de trame initiale du niveau L+1I, confor-
mément à la case d'opération 605. Sur la figure 1, le premier niveau s'étend de l'abscisse 150 jusqu'à la ligne 160 et ces lignes correspondent aux trames initiales et finales des mots de référence dans le niveau L=1. La fin du niveau L=O correspondant à l'abscisse 150 est explorée (case 607) pour y détecter la première trame initiale. Après détection de la trame initiale n=l dans l'exploration, la transformation temporelle dynamique des caractéristiques de l'émission sonore pour les faire correspondre aux caractéristiques de mot de référence pour le niveau L+1=1 commence conformément
à la case d'opération 609.
Dans l'étape de traitement de transformation tem-
porelle, les signaux de caractéristiques du mot de référence "zéro" provenant de la trame de mot de référence mo1
jusqu'à la trame M0 sont tout d'abord soumis à une transfor-
mation temporelle dynamique pour les faire correspondre aux signaux de caractéristiques d'émission sonore commençant à la trame d'émission sonore nl. De cette manière, on génère les chemins autorisés dans la région limitée par les lignes 101, 104 et 160, représentant le segment de configuration d'émission sonore pour le premier niveau. On détermine les chemins 110-1 et 110-2, ayant les points finals n1 et n1, comme le montre la figure 1. On enregistre les points finals pour ces chemins ainsi que les correspondances de distances cumulées le long de ces chemins et le signal
d'identification de mot de référence "zéro". On peut égale-
ment déterminer les chemins qui se terminent au point final n3 pour le mot de référence "zéro". Cependant, ces chemins ont des distances cumulées supérieures à celles obtenues
ultérieurement pour le mot de référence "un".
On applique ensuite aux signaux de caractéristi-
ques du mot de référence "un" provenant des trames m-1 à M=M1 une transformation temporelle dynamique pour les faire correspondre aux signaux de caractéristiques d'émission sonore commençant à la trame d'émission sonore n=l. On génère les chemins 110-3, 110-4, 110-5, et 1106 pour le
mot de référence 1, comme le montre la figure 1. Or enregis-
tre les points finals de ces chemins n3, n4, n5, et n6, ainsi que les distances de chemins cumulées et le signal d'identification de mot de référence "un". On peut également obtenir les chemins ayant les points finals n et n 2pour le mot de référence "un". Cependant, seul le chemin conduisant à un point final ayant la distance cumulée minimale est représenté sur la figure 1. Lorsqu'un chemin pour le mot de référence "zéro" et un chemin pour le mot de référence "un" se terminent au même point final, on sélectionne le chemin qui a la plus faible distance cumulée. Ainsi, seuls sont retenus les chemins pour le mot de référence "zéro" qui se
1 1
terminent aux points n1 et n2, tandis que seuls sont retenus les chemins pour le mot de référence "un" qui se terminent i 1 aux points n3 à n6. De cette manière, on évalue toutes les combinaisons possibles de signaux de caractéristiques de
mots de référence pour l'émission sonore. Lorsque la trans-
formation temporelle dynamique pour le niveau L+1,1, est terminée, on compare le niveau L au niveau maximal
(Lmax,4), conformément à la case de décision 611. La compa-.
raison a pour résultat d'incrémenter le niveau LEO à L=1.
On repasse à la case 605 par l'intermédiaire de la case de décision 611, ce qui initialise la mémoire de distance et
de trame initiale pour le niveau L+1,2. L'exploration rela-
tive à la première trame initiale du niveau L=1, à la case
607, conduit à la détection de la trame n1en tant que pre-
mière trame initiale pour la transformation temporelle
dynamique du niveau L+1,2.
Dans le traitement de TTD du second niveau (case 609), la séquence detrames de signaux de caractéristiques de mots de référence est comprise entre les lignes 160 et 170. Seuls sont autorisés les chemins de traitement de TTD qui se trouvent dans la région limitée par les lignes de segments de configuration de parole 160, 101, 170, 103 et 104. Les trames initiales pour le traitement du second niveau correspondent aux trames finales pour les chemins du premier niveau, afin de maintenir la continuité. Les signaux de caractéristiques pour le mot de référence zéro, commençant à la ligne 160, sont soumis à une transformation temporelle dynamique les faisant correspondre aux signaux de caractéristiques de l'émission sonore commençant à la trame d'émission sonore ni. Comme il est indiqué sur la figure 1, on génère entre autres les chemins de TTD 120-5, 120-7, 120-8, 120-9, et 120-10. On enregistre les trames finales
2 2 2 2 2
pour ces chemins n5, n7, n8, n9 et n10, en compagnie des distances cumulées jusqu'à ces points finals, à partir du point initial de l'émission sonore, ainsi que le signal
d'identification de mot de référence zéro et les trames ini-
tiales du second niveau L+1i2 pour les chemins déterminés.
On soumet ensuite les signaux de caractéristiques du mot de référence "un", entre les lignes 160 et 170, à une transformation temporelle qui les fait correspondre aux signaux de caractéristiques d'émission sonore commençant à la trame n1, pour déterminer les chemins du second niveau pour le mot de référence "un". On construit entre autres les
chemins 120-1, 120-2, 120-3, 120-4, et 120-6. Pour les tra-
2 2 2 2 2
mes finales de ces chemins, ni, n2, n3, n4, et n6, on enre-
gistre les distances cumulées à partir de la trame initiale de l'émission sonore, le signal d'identification pour le mot de référence un, et les trames le long de la ligne 160 de laquelle partent les chemins. Lorsque le traitement de mise en coïncidence dans le temps pour le second niveau (L+1=2) est terminé (case d'opération 609), on a évalué toutes les suites partielles de deux mots situées dans la région autorisée et on a enregistré tous les signaux définissant les suites candidates possibles. On retourne à la case de décision 611. Du fait que le dernier niveau LMax 4 n'a pas été traité, le niveau L est incrémenté et
porté à 2 (case 615).
On retourne maintenant à la case 605 et on ini-
tialise la mémoire pour le niveau suivant L+1=3. On explore ensuite le niveau L=2 (case 607) pour détecter la trame
finale n2 en tant que première trame initiale pour le trai-
tement de mise en coïncidence dans le temps du troisième niveau (L+1,3). Pendant le traitement du troisième niveau
(case 609), les signaux de caractéristiques de mots de réfé-
rence sont répétés au troisième niveau entre la ligne 170 et la ligne 180. La transformation temporelle dynamique des signaux de caractéristiques de mots de référence pour les faire correspondre aux signaux de caractéristiques d'émission sonore commençant à la trame d'émission sonore n1 sur la ligne 170,donne les chemins de meilleure distance 130-1, -3, 130-4, 130-5, et 130-6 pour le mot de référence zéro et le chemin de meilleure distance 130-2 pour le mot de référence un. Les autres chemins possibles partant des trames initiales sur la ligne 170 sont invalides du fait qu'ils tombent à l'extérieur de la région définie par la ligne 170, la ligne 101, la ligne 102, la ligne 180 et la ligne 103, ou
du fait qu'ils ont des distances cumulées qui sont trop gran-
des pour être prises en considération. Avec l'enregistrement
des signaux de distances cumulées, des signaux d'identifica-
tion de mot de référence et des signaux de trame initiale
pour les points finals autorisés, toutes les suites possi-
bles de trois mots de référence sont identifiées à la fin du
troisième niveau.
* On retourne à la case de décision 611, ce qui a pour effet de faire passer l'index de niveau à L-3 dans la case d'index 615. Comme mentionné précédemment en relation avec le traitement du niveau précédent, la mémoire de trame et de signal de distance pour le niveau L+1=4 est initialisée à la case d'opération 605. Les signaux de trame enregistrés pour. le niveau L,3 sont explorés conformément à la case d'opération 607, et la trame initiale n3 est sélectionnée en tant que première trame pour la transformation temporelle dynamique du niveau L+1-4. Le traitement de TTD du quatrième
niveau est ensuite accompli conformément à la case d'opéra-
tion 609.
Comme le montre la figure 1, la transformation temporelle dynamique du quatrième niveau entre les signaux de caractéristiques de mots de référence et les signaux de caractéristiques d'émission sonore donne un seul chemin 140-1 entre la trame d'émission sonore n 3 sur la ligne 180
et la trame finale d'émission sonore N1 sur la ligne 190.
Après le traitement de TTD du quatrième niveau, on détecte l'intersection d'un chemin de transformation temporelle dynamique avec la trame finale d'émission sonore N, et le
traitement de niveau est terminé à la case de décision 611.
On passe à la case d'opération 613 et on reconstruit la meilleure suite de mots de référence à partir des données de niveau enregistrées& Ainsi, sur la figure 1, les points 3 2 i finals de niveau enregistrés n, n9, et n5 permettent de remonter les chemins 140-1, 130-5, 120-8, et 110-5 en passant par les niveaux 4, 3, 2 et 1. De cette manière on sélectionne la séquence binaire 1001 en tant qu'émission sonore d'entrée. Lorsque dans un niveau quelconque il y a
plus d'un chemin se terminant sur la trame finale d'émis-
sion sonore Nm, on peut sélectionner la suite de mots de
référence ayant la meilleure correspondance par une compa-
raison des distances cumulées pour les chemins possibles de mise en coïncidence dans le temps, sur la figure 1. Selon une variante, on sélectionne la suite de mots de référence
ayant un nombre particulier de chiffres.
La région des chemins de mise en coïncidence admissibles dans l'exemple qu'illustre la figure 1 est fixée de façon à n'accepter que les émissions sonores d'un nombre déterminé de mots liés, en faisant correspondre la
trame finale de l'émission sonore, Nm, avec les trames fina-
les du dernier mot de référence, sur la ligne 190. On peut
aisément modifier cette structure pour accepter des émis-
sions sonores contenant moins de mots, en étendant la
région admissible de façon qu'elle comprenne un point extr8-
me pour chaque niveau tombant au-dessus de la ligne limite de rythme minimal de parole, 104. Sur la figure 1, on peut traiter les émissions sonores avec des suites de mots de référence comprenant deux ou trois mots, en agrandissant la région de transformation temporelle dynamique conformément aux prolongements en pointillés des lignes 104, 170 et 180 et à la ligne en pointillés 105. La région étendue permet
la reconnaissance d'émissions sonores de mots liés de dif-
férentes longueurs, avec la limitation consistant en ce que le nombre maximal de mots dans une émission sonore d'entrée
est fixé.
Dans l'exemple représenté sur la figure 1, le point final du chemin du quatrième niveau 140-1 se trouve sur
la ligne définissant la trame finale N de l'émission sonore.
Une telle contrainte peut restreindre excessivement la sélection de suites candidates de mots de référence. Une structure dans laquelle on définit une plage finale de plu- sieurs trames autorise une certaine marge d'erreur dans la
détermination de la trame finale de l'émission sonore d'en-
trée. Ainsi, sur la figure 1, une plage finale comprise
entre les lignes 192 et 194 peut définir une région appro-
priée pour le point final de l'émission sonore. La ligne 102 est décalée vers la ligne en pointillés 109 pour tenir compte de la plage plus étendue des trames finales de
l'émission sonore.
Comme il est bien connu, l'opération de mise en
coïncidence dans le temps de configurations de parole for-
mées de mots liés, avec des enchaInements de configurations de mots de référence isolés,fait généralement apparaître des erreurs qui sont dues à la prononciation groupée dans la configuration de parole consistant en mots liés. Ces erreurs sont attribuables à des discordances dans les régions initiales et finales des mots, du fait que les mots
de référence sont généralement allongés lorsqu'ils sont pro-
noncés isolément. La structure qui est représentée à titre d'exemple par la figure 1 peut être modifiée pour tenir compte d'une telle prononciation groupée, en permettant la
sélection des trames initiales et finales donnant la meil-
leure correspondance, aux frontières de chaque niveau.
Ainsi, les structures de mise en coïncidence dans le temps qui sont proches des frontières de niveau sont ajustées
pour tenir compte des effets de prononciation groupée.
Les trames initiales de l'émission sonore à cha-
que niveau de la figure 1 correspondent aux trames finales produites au niveau précédent et elles sont indépendantes des valeurs des distances cumulées associées aux points finals du niveau précédent. On peut modifier la structure de reconnaissance pour réduire encore davantage les exigences de traitement de signal, en limitant les trames initiales conformément à une plage déterminée de la meilleure distance cumulée moyenne, déterminée dans le traitement du niveau précédent. La précision de la reconnaissance résultante n'est pratiquement pas affectée par une telle restriction, du fait que seules les suites candidates les moins probables ne sont plus prises en considération.
Description détaillée
Les figures 2 et 3 représentent un schéma synopti-
que détaillé d'un dispositif de reconnaissance de parole continue qui constitue un exemple de l'invention. Sur la figure 2, la mémoire de signaux de caractéristiques de mots de référence 205, qui peut être le circuit intégré de mémoire
morte programmable du type 745287 (qui figure dans le docu-
ment Data Book OElectronic Information Series publié par DATA INC. 9889 Willow Creek Road, B. P. 26875, San Diego, Californie, E.U.A. 92126) est conçue de façon à enregistrer un ensemble de signaux de gabarit. Chaque signal de gabarit
est représentatif de la séquence de caractéristiques acous-
tiques d'un mot de référence. Ces caractéristiques acousti-
ques sont élaborées à partir d'émissions sonores isolées du
mot, au moyen d'une analyse à prédiction linéaire bien con-
nue. Bien qu'on utilise des paramètres de prédiction linéaire en tant que signaux de caractéristiques dans le circuit des figures 2 et 3, il faut noter qu'on peut également utiliser avec l'invention d'autres caractéristiques acoustiques telles
que des paramètres spectraux ou de formants. L'émission sono-
re de chaque mot de référence est divisée en M trames et on produit un signal de vecteur de caractéristiques d'ordre
(p+i) pour chaque trame. Le signal de vecteur de caractéris-
tiques correspond aux coefficients de prédiction linéaire autocorrélés du signal de parole de la trame. Le gabarit de mot de référence est alors représenté par le signal de l'équation 1. On enregistre les signaux de gabarit pour les
mots de référence w1, w2...Wm dans la mémoire de caractéris-
tiques 105 et on définit leur adresse par le signal de numé-
ro de mot de gabarit w qui provient du compteur de mots 220 et qui peut consister en compteurs binaires réversibles du type 74163 figurant dans le document DATA BOOK n. On suppose à titre d'exemple que le dispositif de reconnaissance des
figures 2 et 3 est conçu de façon à reconnaître des séquen-
ces de nombres prononcés. Par conséquent, l'ensemble de mots
de référence est constitué par les chiffres zéro à neuf.
Le générateur de signaux de caractéristiques d'émission sonore 201, sur la figure 2, est conçu de façon à recevoir un signal de parole provenant du transducteur électroacoustique 200 et à convertir l'émission sonore
reçue en une séquence de signaux de caractéristiques acousti-
ques du même type que ceux qui sont enregistrés dans la mémoire de signaux de caractéristiques de référence 105. On accomplit une analyse de codage par prédiction linéaire sur chaque trame du signal de parole provenant du transducteur pour former un signal de vecteur de caractéristiques d'ordre (p+l) pour la trame. L'analyse fournit la séquence
de signaux de caractéristiques d'émission sonore de l'équa-
tion 2. On transfère séquentiellement ces signaux de vecteur de caractéristiques T(n) dans la mémoire de signaux de
caractéristiques d'émission sonore 203 (constituée par plu-
sieurs mémoires vives du type 745207 figurant dans le docu-
ment DATA BOOK n) dans laquelle ces signaux sont enregistrés trame par trame. Le générateur de caractéristiques d'émission
sonore 201 peut être le générateur de coefficients de prédic-
tion linéaire qui est décrit dans le brevet U. S.
4 092 493, ou bien il peut être constitué par un autre dis-
positif de génération de coefficients de prédiction linéaire
bien connu.
Le traitement de mise en coïncidence dans le temps est accompli dans le dispositif de traitement de TTD 207 pour chaque niveau, sous la dépendance des caractéristiques
d'émission sonore provenant de la mémoire 203 et des carac-
téristiques de mots de référence provenant de la mémoire 205. Les signaux de distance cumulée dS qui sont générés dans le dispositif de traitement 207 sont introduits dans la
section 210-2 de la mémoire de niveau 210 qui peut être cons-
tituée par plusieurs mémoires vives du type 745207, figurant dans le document DATA BOOK O. La mémoire de niveau est adressée corjointemert par le numéro de trame d'émission sonore n et par le niveau L. La section 2101 enregistre les numéros de trame initiale SFN que fournit le dispositif de traitement de TTD 207, dans le traitement de transformation temporelle dynamique. La section 210-3 enregistre les signaux d'identification de mot de référence w qui sont associés au traitement. Les résultats du traitement, adressé par les signaux n et L,sont présentés en tant que signal de trame initiale SFN, que signal de distance cumulée d et que signal
d'identification de mot de référence w, sur les lignes res-
pectives 211-1, 211-2 et 211-3.
Le circuit logique de séquence de trames 307, sur la figure 3, fournit la séquence de trames d'émission sonore n qui commande la lecture des signaux de caractéristiques d'émission sonore dans la mémoire 203, et il génère également des signaux de commande pour déterminer le fonctionnement du dispositif de traitement de TTD 207. La mémoire de retour en
arrière 260 sur la figure 2 est mise en fonction à l'achève-
ment du traitement du dernier niveau, pour enregistrer les chemins de TTD qui sont déterminés dans le traitement de niveau, de façon à pouvoir sélectionner la suite de mots de
référence qui présente la meilleure correspondance.
A titre d'exemple, on suppose que le dispositif de reconnaissance de parole des figures 2 et 3 est utilisé pour identifier une émission sonore consistant en une séquence de
nombres prononcés ayant une longueur maximale de cinq chif-
fres. Il faut cependant noter qu'on peut utiliser le disposi-
tif de reconnaissance de parole pour reconr.attre des mots ou des groupes de mots prononcés de n'importe quelle nature et
d'une longueur autre que cinq mots. L'émission sonore sélec-
tionnée à titre d'exemple est la séquence de chiffres "4453", s'étendant sur 128 trames. Avant l'application de l'émission sonore au transducteur électroacoustique 200, le générateur de signal 204 produit le signal DEPART sous la commande d'un
dispositif externe tel que l'interrupteur 206.
Le signal DEPART est appliqué au dispositif de commande 350 qui est représenté de façon plus détaillée sur
la figure 4. Le dispositif de commande de la figure 4 ccm-
prend un circuit de commande de séquence 400 qui est conçu de façon à déterminer la séquence générale des opérations du
dispositif de reconnaissance des figures 2 et 3, et des dis-
positifs de commande 410, 420, 430, 440 et 450 qui sont
conçus de façon à déterminer un mode de fonctionnement indi-
viduel sélectionné par le circuit de commande de séquence 400. Chaque circuit de commande de la figure 4 est un micro- ordinateur d'un type bien connu, tel que celui décrit dans l'article "Let A Bipolar Processor Do Your Control and Take Advantage of Its High Speed" par Stephen Y. Lau, paru
aux pages 128-139 de Electronic Design, 4, 15 février 1979.
Comme il est bien connu, un dispositif de commande de ce type produit un ou plusieurs signaux de sortie sélectionnés
sous la dépendance des états des signaux qui lui sont appli-
qués. Chaque circuit de commande comporte une mémoire morte
dans laquelle est enregistré un ensemble d'instructions pro-
pres à diriger sa séquence de fonctionnement. Les instruc-
tions pour le circuit de commande de séquence 400 sont indi-
qués en langage FORTRAN à l'annexe A. De façon similaire, les instructions pour les dispositifs de commande 410, 420, 430, 440 et 450 sont indiquées respectivement aux annexes B, C, D, E et F. Le signal DEPART qui provient du générateur 204 est appliqué au circuit de commande de séquence 400 qui génère en réponse l'impulsion de commande SA et le signal de
commande A. L'impulsion de commande SA est appliquéeau géné-
rateur de signaux de caractéristiques d'émission sonore 201 sur la figure 2 et elle commande le générateur 201 de façon
qu'il produise une séquence de signaux de vecteur de carac-
téristiques d'émission sonore T(n) et de signaux d'adressa-
ge de trame FSA, sous la dépendance du signal de configura-
tion de parole qui provient du transducteur 200. Les signaux d'adressage de trame sont transférés vers l'entrée d'adresse de la mémoire de signaux de caractéristiques d'émission sonore 203 par l'intermédiaire de la porte ET 222 et de la porte OU 226, lorsque le signal de commande A
est à l'état de validation.
L'organigramme de la figure 7 représente l'opéra-
tion d'analyse de l'émission sonore. Lorsque le signal DEPART apparaît (case 700), l'impulsion de commande SA est produite et les signaux de caractéristiques d'émission sonore sont générés et enregistrés à la case d'opération 710. A
l'achèvement de l'analyse de l'émission sonore et de l'enre-
gistrement des signaux de caractéristiques dans la mémoire 203, le générateur 201 produit l'impulsion de commande EA et la trame finale de l'émission sonore N =128 est transférée m du générateur 201 vers le compteur de trames 230. Le circuit
de commande de séquence 400 de la figure 4 génère des impul-
sions de commande SBO et SLJM sous l'action de l'impulsion EA. Ces signaux ont pour action d'initialiser le traitement de niveau au premier niveau, ce qui correspond à la case d'opération 720 sur la figure 7. L'impulsion de commande SBO est appliquée à l'entrée de positionnement du compteur de retour en arrière 240 sur la figure 2, ce qui a pour effet de le restaurer à son état zéro. L'impulsion SLJM passe par la porte OU 467 et le signal SLJ qui apparaît en sortie de cette porte est appliqué au compteur de niveaux 250. Le compteur de niveaux 250 est ainsi restauré à son état zéro, ce qui fait que son signal de sortie L est à zéro et son signal de sortie L+1 est à un. Le compteur 250 comprend un circuit compteur du type 74163, un circuit additionneur du type 74283 et un circuit comparateur du type 7485, dans
une configuration bien connue.
L'impulsion EA qui apparaît à la fin de l'analyse de l'émission sonore fait également générer au circuit de commande 400 l'impulsion de commande SI qui est indiquée dans l'organigramme de la figure 8. L'impulsion de commande
SI a pour effet de conditionner le dispositif de reconnais-
sance des figures 2 et 3 de façon qu'il passe au premier mode d'initialisation, dans lequel les positions de mémoire
du niveau L+1=1 de la mémoire de niveau 210 sont préposi-
tionnées. De cette manière, la mémoire de niveau 210 est initialisée avant la transformation temporelle dynamique des signaux de caractéristiques d'émission sonore du segment du premier niveau, faisant correspondre ces signaux aux signaux
de caractéristiques de mots de référence du premier niveau.
Conformément à la case 810 de la figure 8, l'adresse de trame de configuration de parole pour le niveau L+1,1 de la mémoire
210 est fixée initialement à la première trame n,=l. La posi-
tion de mémoire du signal de distance pour la première trame est fixée au code LPN qui correspond au plus grand nombre possible existant dans le circuit des figures 2 et 3, et la position de trame initiale qui est associée à la trame d'émission sonore nj=l est fixée à zéro à la case d'opération 820. Le numéro de trame d'émission sonore est incrémenté
(case 830) et la case de décision 840 ramène à la case d'opé-
ration 820, ce qui permet de prépositionner le signal sui-
vant de distance de trame d'émission sonore et la position
suivante de numéro de trame initiale. L'opération d'initia-
lisation de la mémoire se poursuit jusqu'à ce que le numéro
de trame d'émission sonore soit supérieur à la trame maxima-
le d'émission sonore N M128, et, à ce moment, l'impulsion de
commande de temps EI est produite.
Au début de l'initialisation, l'impulsion SI pro-
venant du circuit de commande 400 est appliquée au disposi-
tif de commande d'initialisation de niveau 410. Le signal de commande I que produit le dispositif de commande 410 est
appliqué à la porte OU 231 et à la porte OU 254 dans le cir-
cuit logique d'adressage de mémoire de niveau 290. Le signal de commande I valide la porte ET 233. De façon similaire, le
signal de sortie de la porte OU 254 valide la porte ET 256.
Le dispositif de commande 410 génère alors l'impulsion de commande SNlI de façon que le signal SN1 soit transféré de la porte OU 461 vers l'entrée de restauration du compteur de trames 230. Le compteur de trames est ainsi initialisé dans son premier état dans lequel le signal de sortie ns est fixé à un. Le signal n,=l passe par la porte ET 233 et la porte OU 238, de façon à adresser la position de trame d'émission sonore n=1 de la mémoire de niveau 210. Le compteur de niveaux 250 a été restauré précédemment et son signal de sortie L+1 est à un. Le signal L+l- passe par la porte ET 256 et la porte OU 259, ce qui a pour effet d'adresser le
niveau L=1 de la mémoire 210. De cette manière, on sélection-
ne les premières cellules de mémoire de trame d'émission sono-
re du niveau 1 dans la mémoire 210.
La mémoire 210, qui peut être constituée par des
circuits intégrés de mémoire vive du type 745207 et de mémoi-
re morte programmable du type 745287, est divisée en trois sections. La trame initiale de chemin de mise en coïncidence
dans le temps, SFN, pour l'adresse sélectionnée, est enre-
gistrée dans la section 210-1. La distance cumulée d obtenue
par transformation temporelle dynamique pour la trame adres-
sée est enregistrée dans la section 210-2 et le signal
d'identification de mot de référence w qui est obtenu à par-
tir de la transformation temporelle dynamique pour la trame
adressée est enregistré dans la section 210-3.
Au moment o la trame d'émission sonore ns=1 du niveau L+1i1 est adressée dans la mémoire 210, un signal de code zéro passe par la porte ET 274 et la porte OU 286, sous l'action du signal I. Le signal zéro apparait à l'entrée d'information de la section de mémoire 210-1. La porte ET 284, validée par le signal I, laisse passer le signal LPN vers l'entrée d'information de la section de mémoire 210-2, par l'intermédiaire de la porte OU 282. Le dispositif de commande 410 est mis en fonction pour produire le signal WLSI, et le signal d'écriture WLS est appliqué à l'entrée
de validation d'écriture de la mémoire 210 par l'intermé-
diaire de la porte OU 465. Un code zéro et un code LPN sont ainsi respectivement introduits aux positions L=l, nr1 des
sections 210-1 et 210-2 de la mémoire de niveau.
Le dispositif de commande 410 génère ensuite l'impulsion de commande INlI qui est appliquée au compteur de trames 230 par la porte OU 463. Le compteur de trames est incrémenté. Le signal ns=2 que fournit ce compteur adresse les secondes positions de trame d'émission sonore
de la mémoire de niveau 210 (L=1, n,2). Le signal WLS sui-
vant provenant du dispositif de commande 410 a pour effet d'initialiser respectivement à zéro et LPN les positions
SFN(2) et d(2). La séquence d'impulsions INlI et WLSI pro-
venant du dispositif de commande 410 se répète à une cadence prédéterminée pour prépositionner les positions de trame
d'émission sonore 1 à Nm du niveau L+1=1. Le signal de sor-
tie NMS du compteur de trames 230 est validé lorsque ce compteur atteint son état nsNm. Sous l'effet du signal NMS provenant du compteur 230, le dispositif de commande 410
produit l'impulsion de commande EI qui termine l'initialisa-
tion du premier niveau, après que les positions L,=, n-Nm
des sections de mémoire 210-1 et 210-2 ont été respective-
ment positionnées à 0 et LPN. La transformation temporelle dynamique de chaque traitement de niveau commence à la trame finale la plus basse du niveau précédent, après détection et enregistrement de la trame finale la plus élevée du niveau précédent. Par conséquent, les positions L=0 dans la section de mémoire de niveau 210-1 sont explorées à partir de la trame n sl pour détecter la première trame dans laquelle se trouve une trame initiale ayant une valeur différente de zéro. Le niveau L=0 correspond au début de l'émission et il comporte une seule trame initiale de valeur différente de zéro SFN,1 pour la trame ns=1. Dans la mémoire de niveau 210, les rubriques L=0 sont fixées et elles sont établies dans une partie de mémoire morte. La position n,=l de la section 210-1 est fixée de façon permanente à SFN=1, et la position
correspondante dans la section 210-2 est fixée de façon per-
manente à d=0. Toutes les autres positions de trame pour le
niveau L,0 dans la section 210-1 sont fixées de façon per-
manente à SFN-0 et toutes les autres positions dans la sec-
tion 210-2 sont fixées à dLPN.
Le mode d'exploration est déclenché sous l'effet de l'impulsion EI qui provient du dispositif de commande 410 et qui fait en sorte que le circuit de commande de séquence 400
génère l'impulsion de commande SB. Sous l'effet de l'impul-
sion SB, le dispositif de commande d'exploration 420 produit
le signal BB qui est appliqué par l'intermédiaire de la por-
te OU 469, et sous la forme du signal B, aux portes OU 231 et 252, dans le circuit logique d'adressage de mémoire de
niveau 290, pendant la durée d'exploration. Le signal de sor-
tie de la porte OU 231 valide la porte ET 233, ce qui fait que la séquence de ns signaux d'adresse d'exploration pro-
venant du compteur de trames 230 peut être appliquée par la porte OU 238 à l'entrée d'adresse n de la mémoire de niveau 210. Le signal de sortie de la porte OU 252 valide la porte ET 258, grâce à quoi le signal L=0 passe par la porte ET 258 et la porte OU 259 pour être appliqué à l'entrée d'adresse L
de la mémoire de niveau 210.
Le dispositif de commande d'exploration 420 pro-
duit également les impulsions BD et SNM au début du mode d'exploration. L'impulsion SNM positionne le compteur de trames à l'état correspondant au point final de l'émission sonore (nsNm) conformément à la case de positionnement d'index 910 de la figure 9. Le circuit logique d'adresse 290 sélectionne alors la trame ns=Nm du niveau L=0 et les signaux SFN=0 et d=LPN pour la trame Nm sont respectivement appliqués à la porte 335 et au diviseur 355. Le signal SFN=O est appliqué à une entrée du comparateur 338. Sous
l'effet du signal SFN=0, le comparateur 338 demeure invali-
dé. Par conséquent, le signal DMTA en sortie de la porte ET 381 demeure invalidé (case d'opération 912). Le dispositif de commande d'exploration 420 produit alors l'impulsion DN1 qui décrémente le compteur de trames 230, conformément à la case d'opération 914. Le signal NSO demeure invalidé pour nsNm (case d'opération 916). Le signal ns est comparé à
zéro dans le comparateur 385 lorsque le signal BD est pré-
sent. De cette manière, le compteur de trames est décrémen-
té de façon répétée jusqu'à ce qu'on ait ns=.
Le signal SFN=l pour n,=l valide la sortie du comparateur 338. Le signal d pour L^^, ns=l qui provient de la section 210-2 de la mémoire de niveau 210 est égal à zéro. Le diviseur 335 forme le signal d(1)/1=0 qui est
comparé dans le comparateur 305 avec le signal LPN enre-
gistré précédemment dans la mémoire temporaire 309. Le signal DMT est validé et la porte 381 applique un signal DMTA validé à la mémoire temporaire 360, par la porte ET
359. Le signal ns=l est ainsi placé dans la mémoire tempo-
raire 350 (case d'opération 920). Le signal DMTA est égale-
ment appliqué au dispositif de commande 420 qui invalide le signal BD et valide le signal BU. Le dispositif de commande d'exploration 420 produit maintenant le signal SN1B qui passe par la porte OU 461 de façon à donner l'impulsion SNI qui restaure le compteur de trames 230 à son état initial n,=l (case d'opération 922). De cette manière, la position
de trame d'émission sonore ns=l du niveau L,0 dans la mémoi-
re 210 est sélectionnée. Le signal de distance pour la posi-
tion de trame sélectionnée dans la section de mémoire de niveau 210-2, soit d=0, est alors disponible sur la ligne
211-2 qui attaque une entrée du comparateur 305 sur la figu-
re 3, par l'intermédiaire du diviseur 335 et de la porte 304. L'autre signal d'entrée du comparateur 305, provenant du multiplicateur 303,est supérieur à zéro à ce moment, et le signal DMT que fournit le comparateur 305 est validé. Le signal DMT validé est appliqué à la porte 381. Du fait que le signal SFN=l provenant de la section de mémoire 210-1 est présent dans le comparateur 338, le signal DMTA est validé et la bascule 370 est positionnée par l'intermédiaire de la porte ET 368. Le dispositif de commande d'exploration 420 produit alors l'impulsion de commande EB sous l'action du signal DMTR provenant de la bascule 370. Le signal EB met fin à l'opération d'exploration. L'impulsion EB commande d'autre part le circuit de commande de séquence 400 de façon
qu'il produise les impulsions FSL et SC.
L'impulsion FSL est appliquée au circuit logique de séquence de trames 307 de façon que le code SFN courant (n,=l) provenant de la section de mémoire de niveau 210-1
soit introduit dans le circuit logique de séquence de tra-
mes 307. De cette manière, la transformation temporelle dynamique pour le premier niveau est déclenchée à la trame
n=l. L'impulsion SC fait en sorte que le dispositif de com-
mande de TTD 430 génère la séquence de signaux de commande
qui conditionne le circuit des figures 2 et 3 pour l'accom-
plissement de la transformation temporelle dynamique des signaux de caractéristiques de segment de configuration de parole du premier niveau, pour les faire correspondre aux signaux de caractéristiques de mots de référence du premier
niveau, pour la trame d'émission sonore SFN-1.
L'organigramme de la figure 10 représente les
structures de transformation temporelle dynamique de l'in-
vention. Comme mentionné précédemment, le traitement de
transformation temporelle dynamique a pour effet de détermi-
ner les points finals des chemins de mise en coïncidence dans le temps pour le niveau L=1 et d'enregistrer dans la mémoire de niveau 210 les signaux de distance cumulés, les signaux d'identification du meilleur mot de référence et les signaux de trame initiale pour ces points finals. Sur la figure 10, un indicateur est positionné initialement à la case 1001 et cet indicateur est restauré au moment de la détection d'une trame finale de niveau valide. Le premier mot de référence w0 (zéro) est sélectionné à la case 1005 et
la première trame pour la transformation temporelle dynami-
que est fixée à la trame initiale SFN=l déterminée dans le mode d'exploration immédiatement précédent (case 1010). La première trame du mot de référence zéro est la trame nôs. La
transformation temporelle dynamique des signaux de caracté-
ristiques de segment de configuration de parole, pour les faire correspondre aux signaux de caractéristiques de mots
de référence commence alors (case 1015).
Le traitement de TTD est accompli en suivant la procédure générale indiquée par l'équation 7. Conformément à l'invention, les trames de mot de référence de chaque niveau sont divisées en trois segments, soit un segment initial ER1, un segment final SR2, et le segment situé
entre le segment initial et le segment final. Comme mention-
né précédemment en relation avec l'équation 7, les trames de mot de référence autorisées sont sélectionnées de façon à se conformer à des conditions acoustiques possibles. Dans le segment intermédiaire d'un niveau, on suit les restrictions de rythme de parole de l'équation 7. Les caractéristiques acoustiques de mots de référence contenues dans la mémoire
205 sont obtenues à partir d'émissions sonores du mot pronon-
cé isolément. Les mots adjacents dans la configuration de parole consistant en mots liés sont généralement prononcés de manière groupée. Par conséquent, la plage des trames de mot de référence est ajustée dans les segments initial et final pour tenir compte de la prononciation groupée. Dans le segment initial, le choix des trames de référence pour le terme final de l'équation 7 est étendu à la plage de trames de SR1. Pour le segment R1, I2 est égal à m et I est égal à un si w(r-l)=w(n-2), ou à zéro dans le cas contraire. De façon similaire, dans le segment terminal le choix de trames est étendu à la région SR2. Dans le segment SR2, I1 est égal
à un si w(n-l),w-n-2) et zéro dans le cas contraire. La tra-
me finale de mot de référence est mw et I est égal à SR2 - ML. De cette manière, la mise en coïncidence dans le w temps des caractéristiques de l'émission sonore et des caractéristiques de référence est rendue plus précise en
présence d'une prononciation groupée. De façon caractéristi-
que, 6Rl,4 et &R2=6 pour des gabarits de signaux de caracté-
ristiques de référence adaptés au locuteur. Le SR1 est fixé
à zéro et SR2=4 pour des configurations de référence indé-
pendantes du locuteur.
La transformation temporelle dynamique qui corres-
pond à la case d'opération 1015 est accomplie sur la plage de trames de mot de référence 1 < m < ML pour chaque trame d'émission sonore n successive. La sélection de trame des opérations de traitement temporel dynamique qui sont effectuées dans le dispositif de traitement de TTD 207 est commandée par le circuit logique de séquence de trames 307
qui est représenté de façon plus détaillée sur la figure 5.
Dans le mode de réalisation représenté sur les figures 2-5, le dispositif de commande de traitement de TTD 430 produit des impulsions de commande SW1 et FSR ainsi qu'un signal de commande C, sous l'effet de l'impulsion SC qui provient du circuit de commande de séquence 400. Le compteur de mots 220 sur la figure 2 est restauré à son état ww0 par l'impulsion SW1. L'impulsion FSR restaure le compteur 505 à son état initial. Le compteur 505 enregistre
le nombre de trames d'émission sonore du niveau déjà traité.
La trame initiale d'émission sonore introduite dans la mémoi-
re temporaire 501 est transférée vers le compteur 503 par l'impulsion FSR. La sortie n du compteur 503 fournit le
signal de trame de configuration de parole d'entrée qui pro-
vient du traitement de TTD. Le signal FSR positionne égale-
* ment la bascule 370 par l'intermédiaire de la porte OU 369.
Le signal DMTR est ainsi validé au début de chaque explora-
tion de TTD.
Le signal C provenant du dispositif de commande 430 est appliqué aux portes OU 251 et 252 du circuit logique d'adresse de mémoire de niveau 290. Le signal de trame n qui provient du compteur 503 passe alors par la porte ET 236 pour être appliqué à l'entrée d'adresse n de la mémoire 210. La porte ET 258 réagit au signal de sortie de la porte OU 252 en transmettant à l'entrée d'adresse L de la mémoire 210 le
signal de niveau L qui provient du compteur de niveaux 250.
Au début du traitement de TTD pour le niveau, la première trame de segment de configuration de parole provenant du compteur 503 de la figure 5 fournit le signal d'adressage de trame de segment de configuration de parole n pour la mémoire de signaux de caractéristiques d'émission sonore, 203, par l'intermédiaire de la porte ET 224 et de la porte OU 226. Les
signaux de caractéristiques de configuration de parole corres-
pondant au signal de trame n sont appliqués à l'entrée du
dispositif de traitement de TTD 207. Le dispositif de traite-
ment de TTD 207 est initialement préconditionné de façon à fournir le premier signal de trame de mot de référence sur sa sortie de limite inférieure de plage (ML). Ce signal ML=1 est appliqué au comparateur 524 de la figure 5 qui est conçu de façon à détecter si le traitement se trouve dans le segment
initial du niveau, SR1. Le segment SR1 est fixé de façon-
caractéristique à quatre trames. Pour 1 < ML < SR1, le signal de sortie du comparateur 524 est validé et la porte ET 530 fournit le signal Ri si la trame d'émission sonore courante est une trame finale du niveau précédent, et si le signal DMTR qui provient de la bascule 370 est validé. Le signal DMTR est présent lorsque les trames de segment de parole sont
comprises dans la plage de trames finales du niveau précédent.
Ceci représente ainsi la continuité des chemins de transfor-
mation temporelle dynamique de niveau en niveau.
Le traitement de TTD est déclenché par l'impulsion de commande DST qui provient du dispositif de commande de TTD 430. On utilise le signal de trame de mot de référence MH provenant du dispositif de traitement 207 pour adresser la mémoire de signaux de caractéristiques de mot de référence 205, afin que les caractéristiques de référence des trames nécessaires pour le mot sélectionné w soient appliquées au
dispositif de traitement de TTD, conformément à l'équation 7.
Lorsque le signal de trame de mot de référence ML dépasse SR1, le signal de sortie du comparateur 524 est invalidé et le signal Rl n'est plus appliqué au dispositif de traitement de TTD. Par conséquent, les restrictions sur le traitement de TTD qui sont définies par l'équation 7 sont changées de façon à se conformer aux conditions acoustiques pour le segment intermédiaire. Le signal de trame finale de mot de référence ML qui provient de la mémoire 205 correspond à la trame finale
du mot de référence adressé et il est appliqué au soustrac-
teur 515 et au comparateur 520 dans le circuit logique de
séquence de trames de la figure 5. Le signal MH, c'est-à-
dire la limite supérieure de la plage de trame de mot de référence dans la transformation temporelle dynamique en cours, est appliqué par le dispositif de traitement 207 au soustracteur 515 et au comparateur 520. Lorsque le signal de différence ML - M qui provient du soustracteur 515 est w H inférieur ou égal au signal SR2 qui correspond au segment terminal du niveau, le signal de sortie du comparateur 518 (R2) est validé. Le signal R2 est appliqué sur l'une des entrées de commande du dispositif de traitement 207, de
façon à changer les restrictions de transformation temporel-
le dynamique pour les adapter au segment final du traitement
de niveau.
Pendant le fonctionnement du dispositif de traite-
ment 207, le signal d', représentatif de la distance entre les caractéristiques du mot de référence courant et les caractéristiques du segment de configuration de parole jusqu'à la trame (n) du niveau, est comparé à une valeur de seuil T(n), ce qui correspond à la case de décision 1020 de la figure 10. Le seuil T(n) est le signal de sortie de la mémoire morte 509 et il est fixé à la valeur du plus grand signal de distance prévu pour un mot de référence candidat valide, dans la trame courante. Dans le cas o le signal de distance d' qui provient du dispositif de traitement 207 dépasse le seuil T, le traitement de distance pour le mot de référence est abandonné. On passe à la case d'index 1050 et on sélectionne le mot de référence suivant. On passe ensuite à la case de décision 1055 pour déterminer si tous les mots de référence pour le niveau ont été traités. S'il y a des mots de référence non traités, on recommence la transforma- tion temporelle dynamique conformément à la case 1015, après
que la trame d'émission sonore pour le traitement a été res-
taurée à la trame initiale déterminée dans l'opération
d'exploration précédente (case 1010).
En considérant les figures 2 et 5, on voit que le signal d' provenant du dispositif de traitement de TTD 207 est appliqué à une entrée du comparateur 511 qui prend la
décision de seuil correspondant à la case 1020. Comme men-
tionné précédemment, le compteur 505 est restauré à un au début du traitement de distance, par le signal FSR. Le compteur 505 est incrémenté par le signal FSI après qu'une
trame de segment de parole n a été traitée, à la case 1015.
Le signal de sortie de trame du compteur 505 adresse la mémoire morte 509 et le signal de seuil de distance maximale T(n) qui provient de la mémoire morte est appliqué à l'autre entrée du comparateur 511. Si le signal d'(n) dépasse le signal de seuil qui est affecté à la trame dans la mémoire morte 509, le signal d'abandon AB provenant du comparateur 511 est validé et il est appliqué au dispositif de commande
430. Le dispositif de commande 430 génère alors une impul-
sion IW1 qui incrémente le compteur de mots 220 sur la figure 2, et une impulsion FSR qui restaure le compteur 505 et qui transfère vers le compteur 503 le signal de trame qui se trouve dans la mémoire temporaire 501. Le circuit des figures
2 et 3 est ainsi conditionné de façon à accomplir le traite-
ment de TTD de niveau pour le mot de référence suivant.
Dans le traitement du premier niveau pour l'émis-
sion sonore d'entrée 4453, le segment de configuration de parole commençant à la trame n=1 est tout d'abord soumis à
une transformation temporelle dynamique le faisant correspon-
dre au mot "zéro" dans le dispositif de traitement 207.
Cependant, le traitement du premier niveau pour tous les mots de référence à l'exception de "quatre" est abandonné sans générer de chemins de mise en coïncidence dans le temps, du
fait de la discordance du signal de caractéristiques de réfé-
rence par rapport aux signaux de caractéristiques de segment
de configuration de parole du premier mot. Pendant le traite-
ment de TTD pour le mot de référence "zéro", un signal de distance d'(n) dépasse le signal de seuil T(n) avant la détection d'un point final d'un chemin de mise en coïncidence
de la transformation temporelle dynamique. Le signal AB pro-
venant du comparateur 511 est validé et, sous l'action de ce signal, le dispositif de commande de TTD 430 sur la figure 4 génère les impulsions de commande IW1 et FSR. L'impulsion IW1 incrémente le compteur de mots 220 sur la figure 2 et le signal de sortie w de ce compteur adresse les signaux de caractéristiques pour le mot de référence "un" dans la mémoire
205. L'impulsion FSR restaure le compteur 505 à son état ini-
tial et transfère vers le compteur 503 le signal de trame qui se trouve dans la mémoire temporaire 501. La transformation temporelle dynamique du segment initial de la configuration de parole, pour la faire correspondre au mot de référence "un" est ainsi commencée. Pendant La mise en coïncidence dans le
temps par la TTD pour le mot de référence "un", le compara-
teur 511 est validé à nouveau et le traitement est abandonné sans atteindre un point final de mise en coïncidence dans le temps. La transformation temporelle dynamique des mots de référence "deux" et "trois" conduit également à des signaux
d'abandon AB, du fait que les signaux de distance d' prove-
nant du dispositif de traitement 207 dépassent le signal de seuil T(n) venant de la mémoire morte 509 avant la génération d'un point final d'un chemin de mise en coïncidence dans le
temps.
Une fois que le traitement de TTD pour le mot de référence "trois" est terminé, le contrôleur de TTD 430 génère les impulsions FSR et IW1. L'impulsion IW1 incrémente le compteur de mots 220, ce qui a pour effet d'adresser les signaux de caractéristiquespour le mot de référence "quatre" dans la mémoire 205. L'impulsion SFR restaure le compteur 503 à la première trame de traitement de TTD na1 dans la mémoire temporaire 501, et elle restaure le compteur 505 à un. Le compteur 503 applique ensuite le signal de trame n=1 à la mémoire de caractéristiques d'émission sonore 203 et à la mémoire de niveau 210. Les signaux de caractéristiques du
segment d'émission sonore pour le niveau 1 sont ensuite pré-
sentés au dispositif de traitement de TTD 207, sous l'effet de l'adressage du compteur 503, et la mémoire de niveau 210 est conditionnée de façon à recevoir les résultats de chemins de mise en coïncidence dans le temps pour le mot de référence "quatre". Le dispositif de traitement 207 est alors en état d'effectuer la transformation temporelle des signaux de caractéristiques du mot de référence sélectionné (quatre) pour les trames 1 < m C M4 pour les faire correspondre aux
signaux de caractéristiques de l'émission sonore pour la tra-
me n qui est enregistrée dans le compteur 503. La transforma-
tion temporelle pour la trame n=1 commence sous l'action du
signal DST provenant du dispositif de commande 430.
Le dispositif de traitement de TTD 207 peut être constitué par une structure telle que celle décrite dans le document Microproducts Hardware System Reference publié par Data General Corporation, Westboro, Massachusetts, 1979, ou
par d'autres systèmes de traitement bien connus. Le disposi-
tif de traitement 207 peut comprendre l'unité centrale de traitement Micro Nova MP100, la mémoire vive dynamique de 4K/8K MP1100, la mémoire morte programmable de 8K MP/100 et
une ou plusieurs unités d'interface d'entrées/sorties numé-
riques du type 4222. La séquence de fonctionnement du dispo-
sitif de traitement 207 est déterminée par les instructions enregistrées de façon permanente dans sa mémoire morte. La
liste de ces instructions en langage FORTRAN figure à l'anne-
xe G. Le dispositif de traitement 207, fonctionnant confor-
mément aux instructions enregistrées de façon permanente qui sont indiquées à l'annexe G, accomplit les opérations de transformation temporelle dynamique de l'équation 7 pour chaque trame de segment de configuration de parole n. Chaque opération de mise en coïncidence dans le temps pour une trame commence sous l'effet du signal DST. La sélection de trames de mot de référence pour la mise en coïncidence dans le temps s'effectue conformément à l'équation 7, modifiée sous la
dépendance des signaux Rl et R2.
Le dispositif de traitement 207 produit le signal d' qui correspond à la distance de chemin du niveau courant pour la trame nôs, le signal MI qui correspond à la trame de mot de référence de limite inférieure-, le signal MH qui
correspond à la trame de mot de référence de limite supé-
rieure, le signal SFN qui correspond à la trame initiale du chemin de mise en coïncidence, et le signal ds qui correspond à la distance cumulée du chemin de mise en coïncidence dans le temps, à partir de la trame initiale du segment d'émission sonore. A la fin de l'opération de TTD du dispositif de traitement 207 pour la trame n=l, le signal DDN est appliqué par le dispositif de traitement au dispositif de commande de TTD 430. Le comparateur 511 compare le signal d' provenant du dispositif de traitement 207 avec le signal T(n) pour la trame 1 qui provient de la mémoire morte 509. Pour d'(1) < T(1), le signal de sortie AB du comparateur est
invalidé. A ce moment, le dispositif de traitement 207 pré-
sente en sortie la trame de mot de référence de limite supé-
rieure de la transformation temporelle, MH, et le compara-
teur 520 la compare à la trame finale ML du mot de référence w4, provenant de la mémoire 205. Le signal de sortie EP du L comparateur 520 demeure invalidé du fait que MH < M4. Sous l'effet du signal DDN et des signaux invalidés EP et AB, le
dispositif de commande 430 produit le signal FSI qui incré-
mente les compteurs 503 et 505 pour les faire passer dans leurs états n-2, et il produit également le signal DST pour faire démarrer l'opération de TTD pour la trame n=2, dans
le dispositif de traitement 207.
Dans l'organigramme de la figure 10, on utilise la case de décision 1020 pour comparer d' à T(n) dans chaque opération de transformation temporelle et on passe à la case
de décision 1025 pour comparer la trame de référence supé-
L rieure MH à la trame finale de mot de référence Mw. Lorsque la case de décision 1025 donne une indication "non", on
passe à la case de décision 1040. Dans la case 1040, on com-
pare le signal de trame de mot de référence de limite infé-
rieure M avec la trame finale de mot de référence ML et on L w compare la trame d'émission sonore n avec la trame finale d'émission sonore NM. Si on a MML ou n > NM, la fin du segment de configuration de parole pour le niveau est attein- te. Les opérations de mise en coïncidence dans le temps pour le mot de référence sont alors terminées dans la case de
modification d'index 1050, de la manière décrite précédem-
ment. Dans le cas contraire, la trame de configuration de
parole n est incrémentée dans la case d'index 1045.
Si la distance de chemin de niveau d'(n) jusqu'à la trame n comprise est inférieure au seuil T(n) qui est fixé dans la mémoire morte 509 (case de décision 1020) et
si la trame de référence de limite supérieure MH est supé-
rieure ou égale à la trame du dernier mot de référence ML (case de décision 1025), on a déterminé un chemin valide w 4 de mise en coincidence dans le temps. On compare ensuite le signal de distance cumulée de chemin d s(n) provenant du dispositif de traitement 207, avec le signal de distance cumulée d enregistré précédemment dans la position de la trame de rang n de la mémoire de niveau. Lorsque
ds(n) < d(n), le signal de distance cumulée d s(n) qui pro-
vient du dispositif de traitement remplace le signal de dis-
tance d(n) dans la section de mémoire 210-2, et le signal de
trame initiale SFN(n) qui provient du dispositif de traite-
ment remplace le signal SFN(n) dans la section de mémoire 210-1. L'opération de remplacement de la case 1035 a lieu du
fait que le dernier chemin déterminé correspond à un meil-
leur chemin candidat pour un mot de référence, se terminant
à la trame n. Cependant, si d s(n) > d(n), le chemin détermi-
né précédemment est le meilleur candidat et on passe de la
case 1030 à la case de décision 1040.
Dans l'exemple considéré, M. > Mw à la trame n=29
du premier niveau et d (29),15,2 est inférieur à d(29),LPN.
Par conséquent, d(29) devient 15,2 et SFN(29) devient 1.
Après l'opération de remplacement de la case 1035, la trame de référence de limite inférieure ML provenant du dispositif de traitement de TTD est comparée à la trame finale de mot
de référence ML, et la trame d'émission sonore n est compa-
rée à la trame finale d'émission sonore N à la case de déci-
m
sion 1040, pour déterminer si les limites du segment de con-
figuration de parole du niveau ont été atteintes. Lorsque la limite inférieure remplit la condition M > ML ou lorsque L w n > Nmo le traitement de TTD de niveau pour le mot de référence "quatre" est terminé et on passe à la case d'index 1050. Dans le cas contraire, la trame d'émission
sonore est incrémentée dans la case 1045 et la transforma-
tion temporelle pour la trame suivante est déclenchée.
Dans le circuit des figures 2 et 3, la transforma-
tion temporelle dynamique des caractéristiques du mot de
référence "quatre" pour les faire correspondre aux caracté-
ristiques d'émission sonore pour les trames d'émission sonore
successives à partir de n=l, est accomplie dans le disposi-
tif de traitement 207. A la fin de l'opération de TTD pour la trame d'émission sonore n,29, le signal de trame de référence
de limite supérieure MH qui provient du dispositif de traite-
ment 207 est égal au signal M4L qui provient de la mémoire de caractéristiques de référence 205, ce qui signifie qu'on a atteint un point final. Les signaux MH et M4 sont appliqués au comparateur 520 qui est maintenant validé. Le signal EP provenant du comparateur 520 est appliqué au dispositif de commande de TTD 430. Sous l'effet du signal EP, le dispositif de commande 430 invalide le signal C et valide le signal E. Le comparateur 301 sur la figure 4 est alors validé du fait que le signal de distance cumulée ds(29),15,2 provenant du
dispositif de traitement 207 est inférieur au signal de dis-
tance cumulée dLPN qui est enregistré pour la trame 29 dans la section de mémoire 210-2 relative au niveau L+1=1. Le signal de sortie SFN du dispositif de traitement de TTD 207 est à un, ce qui correspond à la trame initiale du premier niveau. Le signal de sortie ds du dispositif de traitement est 15,2, ce qui correspond à la distance cumulée jusqu'au point final n,29 dans le niveau un. Le signal SFN=1 est
appliqué à l'entrée de la section de mémoire 210-1, par l'in-
termédiaire de la porte ET 272 et de la porte OU 286, et le signal d.=15, 2 est appliqué à l'entrée de la section de mémoire 210-2 parl'intermédiaire de la porte ET 280 et de la porte OU 282. Le signal de sortie w=4 du compteur de mots est appliqué par la porte ET 281 à l'entrée de la section de
mémoire de niveau 210-3.
Sous l'effet de la validation du signal DS, le signal WLSC provenant du dispositif de commande 430 est
appliqué sous la forme d'un signal WLS à l'entrée de valida-
tion d'écriture de la mémoire 210, par l'intermédiaire de la porte OU 465. De cette manière, le signal d'identification de mot de référence w=4, le signal de distance cumulée ds=15,2 et le code de trame initiale SFN-1 sont introduits dans les positions n,29, L,1 de la mémoire de niveau 210. Le
signal WLSC restaure également la bascule d'abandon 290.
Après la fin de l'impulsion d'écriture WLS, le dispositif de commande 430 produit l'impulsion FSI pour incrémenter les
compteurs 503 et 505 sur la figure 5. Le signal E est invali-
dé et le signal C est validé. Le signal DST qui provient du dispositif de commande 430 est émis vers le dispositif de
traitement 207 pour faire démarrer la transformation tempo-
relle dynamique pour la trame d'émission sonore n=30.
La transformation temporelle dynamique pour chacune des trames d'émission sonore 29 à 40 conduit à la génération de la trame finale pour le niveau L+1=1. La terminaison de la transformation temporelle pour chaque trame d'émission sonore est indiquée par le signal DDN provenant du dispositif de traitement 207. La validation simultanée du signal de fin DDN qui provient du dispositif de traitement 207, du signal de trame finale EP qui provient du comparateur 520 du circuit logique de séquence de trames et du signal DS qui provient du
comparateur 301 déclenche l'enregistrement du signal de dis-
tance cumulée de chemin de trame finale d, du signal de trame initiale de chemin SFN, et du signal d'identification de mot de référence w dans la mémoire de niveau 210, de la manière décrite en relation avec la trame de configuration de parole 29. Le traitement de TTD du mot de référence "quatre" pour les trames n,29 à n=40 conduit à la détermination de chemins de mise en coïncidence dans le temps qui partent de la trame
initiale SN,1.
Le tableau 1 donne la liste du signal d'identifi-
cation de mot w, du signal de distance cumulée d et des signaux de trame initiale SFN qui sont enregistrés dans la mémoire de niveau 210 sous l'effet du traitement des trames n-29 à n,40, pour le premier niveau.
Tableau 1
n w d SFN n w d SFN
29 4 15,2 1 35 4 14,3 1
4 14,4 1 36 4 14,8 1
31 4 13,1 1 37 4 15,1 1
32 4 12,3 1 38 4 15,4 1
33 4 12,6 1 39 4 16,6 1
34 4 13,3 1 40 4 19,1 1
Pendant la transformation temporelle dynamique des caractéristiques du mot de référence "quatre" et du segment d'émission sonore du premier niveau pour la trame
d'émission sonore n=41, le signal d' provenant du disposi-
tif de traitement 207 dépasse le signal de seuil maximal qui est établi dans la mémoire morte 509, sans qu'un signal
de point final EP soit généré. Par conséquent, le compara-
teur 511 produit un signal d'abandon AB. Le signal d'abandon
AB agit sur le dispositif de commande 430 pour qu'il incré-
mente le compteur de mots 220 au moyen de l'impulsion IW1 et
qu'il restaure le compteur 503 à la trame initiale enregis-
trée dans la mémoire temporaire 501, au moyen du signal FSR,
afin de faire démarrer la transformation temporelle dynami-
que pour le mot de référence "cinq".
La transformation temporelle dynamique des carac-
téristiques acoustiques du mot de référence pour les faire
correspondre aux caractéristiques du segment de configura-
tion de parole du premier niveau, conformément à l'organi-
gramme de la figure 10, se répète pour les mots de référence
"cinq", "six", "sept", "huit" et "neuf". Dans l'exemple con-
sidéré, chaque traitement de TTD pour ces mots de référence
se termine par la case de décision 1020 qui indique un résul-
tat de discordance entre les signaux de caractéristiques du mot de référence et de l'émission sonore. Ainsi, le tableau 1 représente les chemins de mise en coïncidence dans le temps qui sont déterminés dans le traitement de TTD du premier niveau. Chaque fois que l'index de mot de référence est incrémenté dans la case 1050, on passe à la case de décision 1055 pour déterminer si le dernier mot de référence a été traité. Après le traitement des caractéristiques du dernier mot de référence, l'indicateur d'abandon est examiné dans la
case de décision 1060. Si l'indicateur d'abandon est restau-
ré, comme dans l'exemple considéré, un chemin valide de mise en coïncidence dans le temps a été déterminé et le niveau L est incrémenté à la case d'index 1065. Lorsque l'indicateur d'abandon demeure positionné, aucun chemin valide n'a été déterminé pour le niveau. Ainsi, il n'y a pas de chemin de mise en coïncidence possible pour le niveau suivant. Si le premier niveau ne comporte pas de chemin valide, on passe à la case de répétition 1080 par l'intermédiaire de la case de
décision 1075 et on signale au locuteur de répéter l'émis-
sion sonore. Le circuit de commande de séquence 400 génère le signal RPT sous l'effet du signal ABFF qui provient de la bascule 291. Sous l'effet du signal RPT, le synthétiseur de message 295 produit un message synthétisé qui demande au locuteur de répéter l'émission sonore. Si dans les niveaux suivants il n'y a pas de nouveau chemin valide, les candidats de l'émission sonore sont évalués sur la base des signaux de chemin déjà enregistrés. Pour l'émission sonore 4453, le niveau L est incrémenté à L1 et on passe par la case de décision 1070 au mode de fixation de plage qui est illustré
par l'organigramme de la figure 11.
Comme décrit précédemment, le segment de configu-
ration de parole sélectionné pour la mise en coïncidence dans le temps, dans chaque niveau, peut s'étendre sur toute
la plage des trames finales déterminées pour le niveau précé-
dent. On a cependant trouvé que les trames finales qui se trouvent aux extrémités d'un segment de configuration de parole de niveau ont généralement des signaux de distance cumulée d très élevés. Par conséquent, les chemins générés
en passant par ces points finals sont hautement improbables.
Conformément à l'invention, on restreint la plage de trames initiales SFN pour chaque niveau à (dn): MT(d)/n pour n p d
éliminer ces chemins hautement improbables. MT est un fac-
teur de plage fixé et dp/nd est un signal de distance cumu- p lée minimale normalisée qui est obtenu dans le traitement de niveau précédent. En particulier, on explore les points finals d'un niveau après le traitement de TTD du niveau pour déterminer la distance cumulée normalisée minimale dp et le np point final np correspondant. On utilise ensuite la valeur de distance minimale normalisée dp/nd pour restreindre la p
plage de trame initiale du traitement de TTD de niveau sui-
vant.
L'organigramme de la figure 11 montre la détermi-
nation du signal de distance minimale normalisée et de la trame correspondante, et cette détermination est accomplie
dans le circuit des figures 2 et 3 sous la commande du dis-
positif de commande de plage 440. Les opérations de fixation de plage commencent sous l'effet du signal EC provenant du dispositif de commande 430, qui apparaît à la terminaison du mode de traitement de TTD de niveau. Sous l'effet du signal
EC, le circuit de commande de séquence 400 produit l'impul-
sion de départ SD. L'impulsion SD est à son tour appliquée
au dispositif de commande de plage 440 qui génère initiale-
ment l'impulsion SNlD, l'impulsion SLPN et le signal de commande BF. L'impulsion SN1D est transmise par la porte OU 461 pour restaurer le compteur de trames initiales 230 de façon que le signal ns soit égal à 1, ce qui correspond à
la case de fixation d'index 1110 sur la figure 11. L'impul-
sion SLPN provenant du dispositif de commande 440 introduit un signal dp=LPN dans la mémoire temporaire 309, tandis que
l'impulsion SLT1 introduit un signal un dans la mémoire tem-
poraire 320, ce qui correspond à la case de fixation d'index
1120. La porte OU 469 applique le signal B au circuit logi-
que d'adresse 290 sur la figure 2, sous l'effet du signal BF qui provient du dispositif de commande 440. Le signal B valide la porte ET 233 par l'intermédiaire de la porte OU
231 et il valide également la porte ET 258 par l'intermédiai-
re de la porte OU 252. De cette manière, le signal de sortie de trame d'exploration du compteur de trames initiales 230 est transmis sous la forme du signal n aux entrées d'adresse de la mémoire de niveau 210, et le signal de niveau L1, provenant du compteur de niveau 250, est appliqué à ces entrées d'adresse sous la forme du signal L. On utilise le comparateur 311 pour comparer le signal de sortie de distance cumulée normalisée provenant du diviseur 355 et de la section 210-2, d(n s)/ns, au signal de
sortie de la mémoire temporaire 309 (dp/nd), ce qui corres-
pond à la case de décision i130. Le diviseur 355 peut être constitué par un circuit intégré d'unité arithmétique AM 9511 de la firme Advanced Micro Devices. Dans le cas o le signal d(ns)/ns est inférieur au signal de sortie dp/nd de la mémoire temporaire 309, le signal de sortie DL du P comparateur 311 est validé. Le signal d(n)/n. provenant de la section de mémoire 210-2 est ainsi introduit dans la mémoire temporaire 309, tandis que la trame correspondante ns est introduite dans la mémoire temporaire 320, ce qui correspond à la case d'opération 1140. En l'absence du signal DL provenant du comparateur 311, le contenu des
mémoires temporaires 309 et 320 demeure inchangé. Le dispo-
sitif de commande 440 génère alors l'impulsion IN1D qui est
appliquée au compteur de trames initiales 230 par l'inter-
médiaire de la porte OU 463, pour incrémenter la trame
d'exploration ns, ce qui correspond à la case d'index 1150.
Lorsque la trame incrémentée ns est la trame finale de l'émission sonore (case de décision 1160), le compteur de trames initiales 230 produit le signal NMS pour terminer l'opération de fixation de plage en faisant en sorte que le dispositif de commande de plage 430 produise le signal de
fin ED.
Pendant la séquence d'opérations d'exploration de plage, la valeur ns qui provient du compteur de trames 230
est appliquée sur une entrée du soustracteur 330 par l'in-
termédiaire de la porte ET 324 et de la porte OU 326. Le soustracteur 330 génère un signal Nm - nd. Le comparateur p 332 valide le signal DE lorsque le signal nd est compris p dans la plage de trame finale SEND, ce qui correspond à la case de décision 1170. Lorsque le signal DE est validé, la trame de distance minimale n d constitue une trame finale p valide pour le traitement de niveau et ce traitement est terminé. Pour le niveau L=1, le signal de distance minimale normalisée présent dans la mémoire temporaire 309 est (d'après le tableau 1): dp/nd! 12,6, 0,382 et la trame p 33 rd qui lui correspond est la trame 33. Par conséquent, le p signal DE qui correspond à la sortie du comparateur 332 n'est pas validé et le mode d'initialisation représenté sur
l'organigramme de la figure 8 est déclenché.
Le signal ED provenant du dispositif de commande de plage 440 et le signal DE provenant du comparateur 332 sont appliqués au circuit de commande de séquence 400 à la fin du mode de fixation de plage. Le circuit de commande de séquence déclenche le mode d'initialisation pour le second niveau en générant l'impulsion de commande SI qui met en fonction le dispositif de commande d'initialisation de niveau, 410. Sous l'effet de l'impulsion SI, le dispositif
de commande 410 produit le signal de commande I et l'impul-
sion de commande SN1I. Comme décrit précédemment en relation
avec l'initialisation du premier niveau, le signal I condi-
tionne le circuit logique d'adresse de mémoire de niveau 290 de façon qu'il applique aux entrées d'adresse de la mémoire de niveau 210 des signaux d'exploration de trame provenant
du compteur de trames 230 et le signal de niveau L+1-2 pro-
venant du compteur de niveaux 250. Le signal I valide égale-
ment les portes 274 et 284, grâce à quoi un code LPN est appliqué à l'entrée de la section de mémoire de niveau 210-2 et un code zéro est appliqué à l'entrée de la section de mémoire de niveau 210-1. Le compteur de trames 230 est restauré dans son état ns=l par l'impulsion SN1 provenant de
la porte OU 461, ce qui correspond à la case de positionne-
ment d'index 810 sur la figure 8. Les emplacements de trame du second niveau, n relatifs au riveau L+1=2 sont ensuite modifiés successivement conformément aux cases d'opération
820, 830 et 840.
Initialement, le signal ns=l provenant du compteur de trames 230 adresse la première trame d'émission sonore n 1 du niveau L+1i2 dans la mémoire 210. Le code LPN est introduit dans la section 210-2 et le code zéro est introduit dans la section de mémoire 210-1 sous l'effet de l'impulsion de validation d'écriture WLS qui est obtenue à partir de
l'impulsion de commande WLSI qui apparatt en sortie du dispo-
sitif de commande 410. Le compteur de trames 230 est alors incrémenté par l'impulsion INlI provenant du dispositif de commande 410, ce qui correspond à la case d'index 830 sur la figure 8. Le processus d'introduction se répète pour les signaux ns successifs provenant du compteur de trames 230, aussi longtemps que le signal ns ne dépasse pas la trame
finale de l'émission sonore, Nm (case de décision 840).
Lorsque ns=Nm, le signal NMS provenant du compteur de trames 230 est validé. Le dispositif de commande 410 produit alors
l'impulsion de fin EI pour mettre fin au mode d'initialisa-
tion.
Le mode d'exploration qui est représenté sur l'organigramme de la figure 9 est mis en oeuvre sous la commande du dispositif de commande d'exploration 420. Ce dispositif de commande est mis en action par l'impulsion de commande SB provenant du circuit de commande de séquence 400, sous l'effet de l'impulsion de fin EI. Au début du mode
d'exploration, le circuit logique d'adresse 290 est condi-
tionné de façon à appliquer aux entrées d'adresse de la mémoire de niveau 210 le signal ns provenant du compteur de trames 230 et le signal L provenant du compteur de niveaux 250, sous l'effet du signal BB provenant du dispositif de
commande 420. L'impulsion SNM positionne le compteur de tra-
mes 230 dans son état ns=Nm (case d'index 910 sur la figure 9). Les signaux d(N M) et SPN(Nm) provenant de la mémoire de niveau 210 sont respectivement appliqués au diviseur 355 et à la porte ET 335. Le signal MT est fixé de façon permanente à 1,2. Le diviseur 355 génère le signal d(Nm)/Nm = LPN/128 qui est comparé au signal de sortie du multiplicateur 303 (1,2 dP/nd = 0,458). Le multiplicateur 303 peut être le circuit intégré AM 9511 précité. Le signal d(Nm)/Nm est supérieur au signal de sortie du multiplicateur. Le signal D MT provenant du comparateur n'est pas validé et le signal DMTA provenant de la porte ET 381 demeure invalidé (case de décision 912). Sous l'effet du signal DMTA invalidé provenant de la porte ET 381, le dispositif de commande 420 produit une impulsion DN1 pour décrémenter le compteur de trames 230. Le
compteur est décrémenté sous l'effet d'un signal DMTA inva-
lidé pour les trames successives Nm, Nmi1' etc, jusqu'à ce
qu'on atteigne une trame ns pour laquelle d(n s)/n C. 0,458.
Ceci se produit pour la trame ns=39, pour laquelle SFN(39)40 et d(ns)/n, =0,426. Le signal DMTA provenant de la porte 381 est alors validé. Le signal n,=39 est introduit dans la mémoire temporaire 350 sous l'effet des signaux DMTA et BD (case 920). Le signal ns est appliqué à une entrée du comparateur 385 par la porte 383. Dans le cas o n < 0, le signal NSO est validé. Sous l'effet du signal NSO, le dispositif de commande d'exploration 420 produit un signal RPT. Le signal RPT déclenche le fonctionnement du synthétiseur de message 295 et on demande au locuteur de répéter son émission sonore. Dans le dispositif de commande 420, le signal DMTA invalide le signal BD et valide le
signal BU.
* L'impulsion SN1B provenant du dispositif de com-
mande 420 et appliquée par la porte OU 461, restaure le compteur 230 dans son état ns=l, conformément à la case de fixation d'index 922 sur la figure 9, ce qui fait que les signaux d(1) et SFN(l) sont respectivement disponibles sur
les lignes 211-2 et 211-1. Conformément à la case de déci-
sion 924, le signal d(n s)/MD est comparé au facteur de fixa-
tion de plage (MT).(dp/nd) et la trame initiale SFN (n s) p
est comparée à zéro pour déterminer si la trame d'explora-
tion courante ns est comprise dans la plage fixée. Le signal
de distance minimale normalisée obtenu au cours du traite-
ment du niveau 1, c'est-à-dire dp, 12,6 = 0,382, est n d 0,8,3s p
enregistré dans la mémoire temporaire 309 de la figure 3.
Le signal dp est multiplié par le facteur de pla-
n ge MT=1,2 dans le multiplicateur 303, et le signal de sortie du multiplicateur est appliqué sur une entrée du comparateur 305. Le signal d(1)/lLPN provenant du diviseur 355 est appliqué sur l'autre entrée du comparateur 305. Le signal de sortie du comparateur 305 n'est pas validé. Le signal SFN(1),0 est appliqué à une entrée du comparateur 338 par
l'intermédiaire de la porte ET 335 et de la porte OU 337.
Le signal de sortie du comparateur 338 n'est pas validé du
fait que le signal SFN n'est pas supérieur à zéro. Par con-
séquent, le signal DMTA provenant dé la porte ET 381 demeu-
re invalidé. A ce moment, le dispositif de commande 420 génère le signal IN1B qui incrémente le compteur de trames
230 par l'intermédiaire de la porte OU 463. De cette maniè-
re, le signal ns provenant du compteur de trames 230 est fixé à deux, conformément à la case de changement d'index
930 sur la figure 9.
Les signaux dLprovenant de la section de mémoire de niveau 210-2 ont des valeurs LPN jusqu'à ce que la trame ns=29 soit atteinte. Le signal d(ns) /ns pour la trame ns=29 est 15,2/29=0,524 et le signal SFN qui lui correspond est égal à un. Lorsque les positions ns,29 de la mémoire de
niveau 210 sont adressées, le comparateur 305 demeure inva-
lidé et le comparateur 338 est validé. Le signal DMTA demeure invalidé et le compteur de trames 230 est incrémenté
et passe à ns=30. Pour la trame ns,31, le signal DMTA pro-
venant de la porte ET 381 est appliqué au dispositif de commande 420 sous l'effet des conditions SFN(31)=l et d(31>es 31 0,423, et le mode d'exploration du second niveau est terminé par la génération du signal EB dans le dispositif de commande 420. L'impulsion EB agit sur le circuit de commande
de séquence 400 de façon qu'il génère les impulsions de com-
mande FSL et SC. L'impulsion FSL positionne la bascule d'abandon 291 et transfère le code ns-31 vers la mémoire
temporaire 501 de la figure 5. Le traitement de transforma-
tion temporelle dynamique du second niveau commence à cette trame. Le signal SC actionne le dispositif de commande de TTD 440 pour déclencher le traitement de TTD pour le second
niveau, conformément à l'organigramme de la figure 10.
Dans le traitement de TTD du second niveau, la plage de trames initiales de segment de configuration de
parole s'étend de la trame ns,31 à la trame ns=39. Le dis-
positif de commande 430 produit initialement les impulsions de commande SW1 et FSR et le signal de commande C, sous
l'effet de l'impulsion SC qui provient du circuit de comman-
de de séquence 400. L'impulsion SW1 restaure le compteur de mots 220 à ww0, conformément à la case d'index 1005 sur la figure 10. L'impulsion FSR transfère le code ns,31 de la mémoire temporaire 501 vers le compteur 503 (case 1010) et restaure le compteur 505 à 1. Le signal C conditionne le circuit logique d'adresse 290 de façon qu'il applique aux entrées d'adresse n et L de la mémoire de niveau 210 le signal de trame provenant du compteur 503 et le signal de
niveau L=- provenant du compteur de niveaux 250.
Le dispositif de commande 430 applique ensuite le signal DST au dispositif de traitement de TTD 207, pour faire démarrer le traitement de transformation temporelle dynamique entre les signaux de caractéristiques de segment de configuration de parole de la trame d'émission sonore 31, dans la mémoire 203, et les signaux de caractéristiques
du mot de référence zéro, dans la mémoire de mots de réfé-
rence 205. Le traitement de mise en coïncidence dans le
temps qu'effectue le dispositif de traitement 207 se pour-
suit conformément à la case d'opération 1015 de la figure 10,
de la manière décrite en relation avec le traitement du pre-
mier niveau. Du fait de la discordance des signaux de carac-
téristiques pour le mot de référence "zéro" et pour le
segment d'émission sonore du second niveau, la transforma-
tion temporelle dynamique est abandonnée, conformément à la case de décision 1020, avant qu'un point final soit atteint à la case de décision 1025. Par conséquent, aucun signal de distance ri aucun signal de trame initiale n'est enregistré dans la mémoire de niveau 210 en correspondance avec le mot
de référence "zéro".
Sous la dépendance conjointe du signal AB qui pro-
vient du comparateur 511 et du signal DDN provenant du dis-
positif de traitement 207 au moment de l'abandon, le dispo-
sitif de commande de traitement 430 produit l'impulsion IW1.
L'impulsion IW1 incrémente le compteur de mots 220, ce qui
correspond à la case d'index 1050, ce qui fait que le traite-
ment de TTD pour le mot de référence "un" peut commencer. Le signal FSR est généré et le compteur 503 est restauré au code de trame initiale n=31, tandis que le compteur 505 est restauré à son premier état. Le traitement de TTD pour le mot de référence "un" est accompli pour chaque trame d'émission sonore à partir de la trame n=31, sous l'effet des impulsions de départ successives DST qui proviennent du dispositif de commande 430, des impulsions de fin DDN qui
proviennent du dispositif de traitement 207, et des impul-
sions d'lincrément FSI qui proviennent du dispositif de com-
mande 430. Les opérations suivent la boucle comprenant la case d'opération 1015, les cases de décision 1020, 1025 et 1040, et la case de changement d'index 1045, sur la figure
10, jusqu'à ce que la trame d'émission sonore 71 soit trai-
tée. A la trame d'émission sonore 71, le signal de trame de mot de référence de limite supérieure MH provenant du dispositif de traitement de TTD 207 est supérieur à la trame finale de mot de référence M1 pour le mot de référence "un". Le comparateur 520 sur la figure 5 produit le signal EP, c'est-à-dire l'indication de trame finale, conformément à la case de décision 1025. Le signal EP est généré par le dispositif de commande 430 et on passe à la case de décision
1030. Le signal de distance cumulée d pour la trame 71, pré-
sent dans la section de mémoire de niveau 210-2, est appli-
qué au comparateur 301, et le signal de distance cumulée de TTD, ds, provenant du dispositif de traitement 207, est appliqué à l'autre entrée de ce comparateur. Le signal ds
41,2 est inférieur à d=LPN.
Le signal E modifie le circuit logique d'adresse 290 pour adresser la trame n=71 des positions de niveau L+1=2 dans la mémoire de niveau 210. Le signal DS provenant du comparateur 301 est validé et le dispositif de commande 430 produit le signal WLSC. Le signal de distance cumulée ds (71) =41,2 et le code de trame initiale SFN(71)_38 sont
ensuite introduits dans la mémoire de niveau 210 par l'in-
termédiaire des portes ET respectives 280 et 274, sous l'effet du signal de validation d'écriture WLS. Le signal d'identification pour le mot de référence "un" est placé
dans la mémoire de niveau 210 par l'intermédiaire de la por-
te ET 281. Lorsque l'enregistrement des signaux ds et SFN est achevé, conformément à la case d'opération 1035, on retourne à la case d'opération 1015 pour la trame n,72, en passant par la case de décision 1040 et la case d'index 1045. D'une manière similaire, une impulsion EP est générée pour chacune des trames d'émission sonore 72 et 73. Le signal de distance cumulée de la trame n=72, soit ds=35,2, et le code de trame initiale SFN=38 provenant du dispositif de traitement 207 sont placés dans le niveau L+1=2 de la mémoire 210. Pour la trame d'émission sonore 73, le signal de distance cumulée d.=39,1 et le signal SFN=38 provenant du dispositif de traitement 207 sont placés dans le niveau L+1,2 de la mémoire, conformément à la case d'opération 1035. A la suite du traitement de la trame n=73, la transformation temporelle dynamique de la case d'opération 1015 fait apparaître un signal d'abandon AB en sortie du comparateur 511 (case de décision 1020). A la génération du signal AB, le compteur de mots 220 est incrémenté par le signal IW1 conformément à la case d'index 1050. Le compteur 503 est restauré à la trame n=31 conformément à la case 1010, et la transformation temporelle dynamique pour le mot
de référence "deux" est déclenchée sous la commande du dis-
positif de commande 430.
Le traitement de TTD du mot de référence "deux" pour le second niveau conduit à des chemins de mise en coïncidence dans le temps qui se terminent aux trames 47 à du segment de configuration de parole. Le tableau 2 donne une liste partielle des signaux de distance cumulée d et
des signaux de trame initiale SFN pour ces trames finales.
Tableau 2
Niveau 2 w=2 Fin 47 48 53 d s 25,5 26,1 27,5
SFN 32 32 32
Pour chacune de ces trames d'émission scnore, le signal de distance d enregistré précédemment dans la mémoire 210-2
était LPN. Sous l'effet du signal de distance cumulée prove-
nant du dispositif de traitement 207, le comparateur 301 est validé, grâce à quoi le signal de distance cumulée et les
codes de trame initiale provenant du dispositif de traite-
ment 207 sont introduits dans la mémoire de niveau 210 sous la dépendance des signaux E et WLSC provenant du dispositif
de commande 430.
Le traitement de TTD pour le mot de référence "deux" est terminé à la fin de l'opération du dispositif de
traitement 207 relative à la trame nr60 du segment de confi-
guration de parole, après que le comparateur 520 a fourni le signal EP (case 1025) et que les signaux d s(60) et SFN(60) provenant du dispositif de traitement ont été placés dans la mémoire de niveau 210 (case 1035). Le comparateur 522 est alors validé par le fait que la trame de mot de référence de limite inférieure ML est égale à la trame finale M du mot L w de référence. Le signal DN est produit après les changements effectués dans la mémoire de niveau 210 pour la trame
d'émission sonore 60.
Le signal DN provenant de la porte OU 528 condi-
tionne le dispositif de commande de TTD 430 de façon à
déclencher le traitement de transformation temporelle dyna-
mique pour le mot de référence "trois", conformément aux cases de fixationd'index 1050, 1055 et 1010. Le dispositif de commande 430 produit l'impulsion IW1 qui incrémente le compteur de mots 220 pour le faire passer dans son état W-W3, et l'impulsion FSR. L'impulsion SER transfère le signal n,31 de la mémoire temporaire 501 vers le compteur
503 et restaure le compteur 505 à son premier état. L'impul-
sion FSR positionne également la bascule 370 pour valider le
signal DMTR. Le dispositif de traitement de TTD 207 sélec-
tionne successivement des chemins de mise en coïncidence
dans le temps, sous la dépendance des signaux de caractéris-
tiques pour le mot de référence "trois" provenant de la mémoire 205 et des signaux de caractéristiques de segment de configuration de parole, pour les trames adressées par le
compteur 503, conformément à la case d'opération 1015.
Le traitement pour les trames successives à partir de n,31 suit la boucle comprenant la case d'opération 1015,
les cases de décision 1020, 1025 et 1040 et la case de fixa-
tion d'index 1045 sur la figure 10, sans que le signal EP
soit généré, jusqu'à ce que le signal d' provenant du dispo-
sitif de traitement 207 dépasse le signal de seuil présent en sortie de la mémoire morte 509. Du fait de la discordance des signaux de caractéristiques du mot de référence "trois" et de ceux du segment de configuration de parole du second niveau, aucun point final de chemin de mise en coïncidence n'est détecté dans le comparateur 520 avant que le signal d'abandon AB soit validé dans le comparateur 511. Sous la dépendance conjointe du signal AB provenant du comparateur 511 et du signal DDN provenant du dispositif de traitement 207, dans la trame dans laquelle les conditions d'abandon apparaissent, le dispositif de commande 430 déclenche le
traitement de TTD pour le mot de référence "quatre" en géné-
rant les signaux IW1 et FSR, conformément aux cases de fixa-
tion d'index 1050, 1055 et 1010.
Le tableau 3 donne la liste des points finals des
chemins de mise en coïncidence dans le temps qui sont géné-
rés au cours du traitement de TTD pour le mot de référence "quatre".
Tableau 3
Niveau 2 w=4 A la fin du traitement de TTD pour la trame de configuration Fin 59 60--- 64--- 71 72 73--- 98 99 d5 31,2 216,3--29,2--39,1 37,1 35,9-54,9 57,1
SFN 34 34 ----32---- 32 32 32---- 32 32
de parole n=59 dans le dispositif de traitement 207, le signal d,30,0 provenant de la section de mémoire de niveau 210-2 est comparé dans le comparateur 301 au signal d qui provient du dispositif de traitement 207. Du fait que le signal d,30,0 (tableau 2) est inférieur au signal d.=31,2 (tableau 3), le comparateur 301 n'est pas validé et le
traitement de TTD pour la trame 60 est déclenché sans intro-
duction des signaux ds et SFN pour la trame 59, provenant du dispositif de traitement de niveau 207. Il en résulte que la mémoire de niveau 210 conserve les codes w,2, d=30,0 et
SFN=32 qui ont été introduits précédemment au cours du trai-
tement de la trame d'émission sonore n=59 pour le mot de
référence "deux".
Le signal EP généré dans le traitement de la trame n=60 pour le mot de référence "quatre" introduit dans la mémoire de niveau 210 les codes ds=26,3 et SFN=34 provenant du dispositif de traitement 207. Il en est ainsi du fait que le signal ds=26,3 (tableau 3) est inférieur au signal d=31,2 (tableau 2) qui a été placé précédemment dans la mémoire de niveau 210 au cours du traitement de TTD du mot de référence "deux". De façon similaire, les valeurs de la trame n=71 et de la trame n,73 pour le mot de référence "quatre" sont introduites dans la mémoire 210 à la place
des valeurs obtenues pour le mot de référence "un". Cepen-
dant, les valeurs de la trame n=72 pour le mot de référence "un" sont conservées dans la mémoire 210. Conformément à l'invention, on enregistre dans la mémoire de niveau le meilleur chemin de mise en coïncidence pour chaque trame
finale du niveau.
Après le traitement de TTD pour la trame d'émis-
sion sonore n,99, aucune trame finale n'est obtenue à la case de décision 1025 avant la terminaison du traitement de TTD par l'intermédiaire de la case de décision d'abandon 1020 ou de la case de décision de trame finale 1040. On peut passer à la case de fixation d'index de mot 1050 sous l'effet des signaux DDN et AB ou des signaux DDN et DN, ce
qui fait que le dispositif de commande 430 génère les impul-
sions IW1 et FSR pour faire démarrer le traitement de TTD pour le mot de référence "cinq". Le traitement pour le mot de référence "cinq" conduit aux chemins de mise en coïncidence se terminant aux trames d'émission sonore 98 à 102 qui sont
indiquées dans le tableau 4.
Tableau 4 Niveau 2 w,5 Fin 98 99 100 101 102 ds 55,9 56,6 57,8 59,4 61,5
SFN 32 32 32 32 32
Des valeurs de chemin de mise en coïncidence sont placées dans la mémoire de niveau 210 pour les trames d'émission
sonore 98 et 99, pour le mot de référence "quatre". Des che-
mins déterminés dans le traitement de TTD pour le mot de
référence "cinq" se terminent également aux trames 98 et 99.
En ce qui concerne la trame 98, le signal de distance cumu-
lée pour le mot de référence "quatre" est inférieur à celui qui correspond au mot de référence "cinq", et les signaux indiqués dans le tableau 3 pour cette trame sont conservés
dans la mémoire de niveau 210. Pour la trame d'émission sono-
re 99, le signal de distance indiqué dans le tableau 4 est inférieur à celui indiqué dans le tableau 3. Par conséquent, le signal de distance ds=55,9 et le code de trame initiale SFN=32, apparaissant en sortie du dispositif de traitement 207 dans la trame 99 remplacent le signal de distance et le
code de trame initiale qui ont été introduits dans la mémoi-
re de niveau 210 pour le mot de référence "quatre".
A l'achèvement du traitement de TTD pour le mot de référence "cinq", par l'intermédiaire de la case de décision
1020 ou de la case de décision 1040, le circuit de reconnais-
sance des figures 2 et 3 est conditionné de façon à traiter successivement les mots de référence "six, sept, huit et neuf". Cependant, les signaux de caractéristiques pour ces mots de référence ne conduisent à aucun chemin de mise en coïncidence dans le temps et les signaux d. et SFN pour ces mots de référence ne sont pas placés dans la mémoire de niveau 210. Après sortie du traitement de TTD pour le mot de référence "neuf" par l'intermédiaire de la case de décision d'abandon 1020, le compteur de mots 220 est incrémenté à la case de fixation d'index de mot 1050 et on passe à la case de décision d'indicateur d'abandon 1060 par l'intermédiaire de la case de décision de dernier mot 1055, sous l'effet de la validation du signal Wm dans le compteur de mots 220. Le signal Wm agit sur le circuit de commande 400 de façon qu'il génère l'impulsion de fin EC qui termine le traitement de
distance pour le niveau 2.
Pendant le traitement de TTD pour chaque mot de référence, les signaux R1 et R2 régissent les restrictions
concernant l'opération accomplie par le dispositif de traite-
ment 207. Comme mentionné précédemment, la sélection des trames de mot de référence varie pour tenir compte de la prononciation groupée. La plage de trames initiales pour le niveau 2 s'étend depuis la trame d'émission sonore 31
jusqu'à la trame d'émission sonore 39. Le signal DMTR prove-
nant de la bascule 370, qui n'apparaît que pendant la plage de trames initiales,est appliqué à la porte ET 530 sur la figure 5. Le signal DMTR est validé entre les trames 31 et 39. Lorsque le signal de trame de limite inférieure de mot de référence ML provenant du dispositif de traitement 207 est inférieur à SR1, la plage de trames de mot de référence autorisée dans le dispositif de traitement 207 est étendue à la trame de référence m=l, sous l'effet du signal R. Les signaux de sortie d et SFN provenant de la mémoire 210 sont
appliqués au dispositif de traitement de TTD 207 par l'in-
termédiaire des portes ET 242 et 246, ce qui fait que la
trame initiale et la distance initiale pour un nouveau che-
min de mise en coïncidence dans le temps peuvent être utili-
sées dans l'opération de transformation temporelle dynamique du dispositif de traitement. Le signal DMTR limite la plage de trames initiales du traitement de niveau aux points finals des chemins de mise en coïncidence dans le temps du niveau
immédiatement précédent. Ceci assure la continuité des che-
mins de mise en coïncidence dans le temps entre les niveaux.
Le signal de trame de configuration de parole de limite supérieure de plage, nw, qui se trouve dans la mémoire temporaire 360, est comparé dans le comparateur 366 avec le signal de trame de traitement n qui provient du compteur 503. La bascule 370 est positionnée par le signal FSR à la trame ns-31 et elle demeure positionnée entre les trames ns=31 et ns-39. Lorsque le signal de trame n=40 est atteint, la sortie du comparateur 366 est validée et la bascule 370 est restaurée. La porte 530 est validée par le signal DMTR, ce qui fait que la plage de trames initiales sélectionnées de mot de référence s'étend entre les trames de segment de configuration de parole ns,31 et ns=39. La porte 530 sur la
figure 5 est ensuite invalidée, ce qui fait que le disposi-
tif de traitement 207 ne peut travailler qu'avec les res-
trictions de région finale, sous l'effet du signal R2 pro-
venant du comparateur 511, ou avec les restrictions de
région intermédiaire de l'équation 7.
Le tableau 5 montre les signaux de chemin de mise en coïncidence w, d et SFN qui sont enregistrés dans la
partie de niveau L+2 de la mémoire 210 à la fin du traite-
ment de TTD du second niveau pour les trames d'émission
sonore 47 à 102.
250282Z
Tableau 5
n w d
2 25,5
2 26,1
2 26,3
2 26,9
2 27,8
2 28,8
2 27,5
2 27,7
2 28,1
2 28,6
2 29,5
2 30,0
2 28,9
4 26,3
4 26,9
4 27,2
4 27,4
4 29,2
4 31,0
4 33,1
4 34,7
4 36,1
4 37,9
4 38,5
4 39,1
1 36,2
4 35,9
4 36,6
SFN n w d SFN
4 37,2
4 37,6
4 38,0
4 38,7
4 39,4
4 40,1
4 40,9
4 41,7
4 42,3
4 42,8
4 43,0
4 44,0
4 45,0
4 45,7
4 46,7
4 47,4
4 48,4
4 49,6
4 50,7
4 51,8
4 52,7
4 53,4
4 54,6
4 54,9
56,6
57,8
59,4
61,5
La première de mise en colonne indique
coincidence, n.
les trames finales des chemins
La colonne 2 indique l'identifi-
cation de mot de référence w pour le chemin ayant la plus petite distance cumulée qui se termine à la trame finale de la colonne 1. La colonne 3 indique le signal de distance
cumulée d pour le chemin de mise en coincidence qui se ter-
mine à la trame finale de la colonne 1 et la colonne 4
indique la trame initiale SFN du chemin de mise en coinci-
dence qui se termine à la trame finale de la colonne 1.
Dans la première ligne du tableau 5, par exemple, la trame finale du chemin de mise en coincidence est n=47. Le mot de
référence pour le chemin correspondant à la plus petite dis-
tance cumulée est w=2. La distance cumulée du chemin est
d=25,5 et la trame initiale par ce chemin est SFN=32.
Pendant le traitement de TTD du second niveau, la bascule d'abandon 291 a été restaurée au moment o les signaux de chemin de mise en coïncidence ont été introduits initialement dans la mémoire de niveau 210. Du fait que le compteur de niveaux 250 n'est pas dans son état L Ma, le signal LMS est invalidé. Sous la dépendance conjointe des signaux invalidés ABFF et LMS et de l'impulsion EC provenant du dispositif de commande 430, le circuit de commande 400 est conditionné de façon à produire les impulsions IL1 et SD. L'impulsion IL1 incrémente le compteur de niveaux 250 pour le faire passer à son état L-2, et l'impulsion SD est appliquée au dispositif de commande de plage 440 pour
déclencher le mode de fixation de plage.
Comme il a été décrit en détail en relation avec le niveau 1, les trames finales n du niveau L=2 qui vient
juste d'être traité sont explorées, conformément à l'organi-
gramme de la figure 11, pour déterminer le signal de distance minimale normalisée dP/nd. Le signal de distance minimale p normalisée est enregistré dans la mémoire temporaire 309 et la trame dans laquelle ce signal de distance est apparu, nd est enregistrée dans la mémoire temporaire 320, conformé- P
ment aux structures de la figure 11. Le signal dP/nd déter-
p miné pour le niveau 2 est 0,435 et la trame correspondante est 63. Du fait que la trame nd =63 n'est pas comprise dans une plage de SEND=4 trames par rapport à la trame finale de l'émission sonore (128) au second niveau (case de décision 1170), le mode d'initialisation du troisième niveau est déclenché.
Conformément à l'organigramme du mode d'initiali-
* sation qui est représenté sur la figure 8, chacune des posi-
tions de trame pour le niveau L+1=3 dans la mémoire de niveau 210 est positionnée de façon que le signal d(n s) soit égal à LPN et que le signal SFN(n) soit égal à zéro. Après initialisation de la position de la trame finale d'émission sonore Nm, le dispositif de commande d'initialisation de niveau 410 produit le signal EI (case de décision 840) et le mode d'exploration est initialisé sous l'effet du signal SB qui provient du circuit de commande de séquence 400. Le mode d'exploration sélectionne la plage de trames initiales pour le traitement de transformation temporelle dynamique du troisième niveau, conformément à l'organigramme de la figure 9, sous la commande de signaux provenant du dispositif de commande d'exploration 420. On détermine tout d'abord la limite supérieure de la plage, conformément à la case de décision 912. La trame 88 est sélectionnée en tant que trame nw, du fait que le signal d(88)/88.0,519 est inférieur au signal 1,2(d P/np), 0,522 dans la mémoire temporaire 309. Une fois que la trame de limite supérieure ns=88 est enregistrée dans la mémoire temporaire 360 (case de fixation d'index 920), le compteur
de trames 230 est restauré dans son état niât (case de fixa-
tion d'index 922). On compare ensuite les signaux de distan-
ce provenant de la mémoire de niveau 210 pour la trame ns=l et le signal 1,2(dp/n p) provenant du multiplicateur 303, et
on compare avec zéro le signal SFN correspondant, conformé-
ment à la case de décision 924, jusqu'à ce qu'on atteigne la trame de configuration de parole 53. Le signal de distance normalisée pour la trame 53 (0,519) est inférieur à 1,2 dp/p (0,522), ce qui a pour effet de valider le signal DMTR provenant de la bascule 370. Le dispositif de commande 420 produit ensuite le signal de fin EB (case de décision
924) et on passe au mode de traitement de TTD de l'organi-
gramme de la figure 10.
Le traitement de TTD du niveau trois correspondant à l'organigramme de la figure 10 conduit à la génération de chemins de mise en coïncidence dans le temps pour lesquels
les signaux de distance cumulée d, les signaux de trame ini-
tiale SFN et les signaux de mot de référence sélectionné w sont enregistrés dans la mémoire de niveau 210. Le tableau 6 donne la liste des signaux w, d et SFN qui sont introduits dans la mémoire de niveau 210 pour le traitement de TTD du
troisième niveau.
Tableau 6
n w d SFN
77
82
87
92
97
4 37,1
4 37,4
4 37,6
4 39,9
1 38,3
1 38,3
1 38,4
1 38,7
37,8
36,1
35,0
34,4
33,2
32,9
33,0
33,1
33,7
34,3
35,0
35,9
36,6
36,8
37,1
37,3
38,2
39,5
41,2
n w d SFN i
43,3
0 51,2
0 52,4
0 53,9
4 54,2
4 53,6
4 53,1
4 53,3
4 53,4
4 54,1
4 55,0
4 56,3
4 57,6
4 58,8
3 60,3
3 59,6
3 58,4
3 58,4
3 59,0
3 59,7
3 60,2
3 60,6
3 60,9
3 61,4
3 61,8
3 62,6
3 62,9
Les trames finales du niveau depuis la trame 75 jusqu'à la sonore 128. Toutes les trames tableau 6 sont comprises dans SFN=89 qui est déterminée par 3 du tableau 6 s'étendent l trame finale de l'émission initiales SFN dans le la plage allant de SFN=53 à r l'opération de restriction
de plage qui précède le traitement du niveau 3.
Seuls les signaux de caractéristiques des mots de référence "zéro, un, trois, quatre et cinq" ont été suffisamment similaires aux signaux de caractéristiques du segment de configuration de parole du niveau 3 pour donner des chemins de mise en coincidence acceptables. Pour le mot de référence "zéro", les chemins ont des trames finales
d'émission sonore comprises entre les trames 103 et 105.
Les trames finales pour les chemins du mot de référence "un" s'étendent de la trame d'émission sonore 79 jusqu'à la
trame d'émission scnore 82. Pour le mot de référence "qua-
tre", les trames finales s'étendent de la trame 75 à la tra-
me 79 et de la trame 106 à la trame 115. Pour le mot-de
référence "cinq", les trames finales de chemin sont compri-
ses entre la trame 84 et la trame 102.
A la fin du traitement de TTD pour le mot de réfé- rence "neuf" du niveau 3, on trouve à la case de décision 1060 que l'indicateur d'abandon est restauré, le compteur de niveaux 250 est incrémenté de façon à passer dans son état L=3 et le mode de fixation de plage qui est représenté sur la figure 11 est déclenché par l'intermédiaire de la case
de décision 1070.
Comme décrit en relation avec le niveau précédent, les résultats du traitement de TTD du niveau 3, enregistrés dans la mémoire de niveau 210, sont explorés à partir de la trame n,=l jusqu'à la trame finale d'émission sonore NM=128. Le signal de distance cumulée pour la trame finale
dans le tableau 6 est égal à 33,1 et l'opération accom-
plie par le diviseur 355, la mémoire temporaire 309 et le comparateur 311 détermine que la distance normalisée correspondante (0,368) est minimale. Le signal 0,368 est enregistré dans la mémoire temporaire 309. Le signal de la trame ns,90 qui correspond à la distance normalisée minimale
est chargé dans la mémoire temporaire 320 pendant l'opéra-
tion d'exploration et il est appliqué au soustracteur 330 sous la forme du signal n d pour déterminer de combien le
signal n d est éloigné de P la trame finale d'émission sono-
p re Nm. Le comparateur 332 compare le signal de sortie du soustracteur 330 à 8END,4. Du fait que-la différence
Nm - n d est de 38 trames, le signal DE provenant du compa-
rateur P332 n'est pas validé et le traitement pour le qua-
trième niveau est nécessaire. -
En considérant l'organigramme général de la figure 6, on voit que l'initialisation des positions de trame du quatrième niveau dans la mémoire de niveau 210 est accomplie conformément à la case 605, de façon que chaque signal de distance cumulée de trame d'émission sonore d soit fixé à LPN et que chaque signal de trame initiale SEN soit fixé à zéro. Les positions de trame d'émission sonore pour le niveau 3 sont ensuite explorées conformément à la case 607 pour déterminer la plage de trames initiales autorisée. Sous la dépendance conjointe du signal de distance normalisée minimale qui est enregistré dans la mémoire temporaire 309 et des signaux de distance normalisée qui s.ont déterminés pour les distances cumulées à partir de la section de mémoire de niveau 210-2, la trame de limite supérieure ns,102 est sélectionnée en tant que signal n d et elle est placée dans
la mémoire temporaire 360. Ensuite, la trame limite infé-
rieure ns-84 est sélectionnée et placée dans la mémoire tem-
poraire 501 en préparation du traitement de TTD du niveau 4,
conformément à la case 609.
Le tableau 7 donne la liste des points finals de
chemins de mise en coïncidence, des signaux de mot de réfé-
rence sélectionné, des signaux de distance cumulée et des
signaux de trame initiale pour les chemins de mise en coin-
cidence dans le temps qui résultent du traitement du qua-
trième niveau (case 609).
Tableau 7
n w d
99
104
109
3 48,2
3 46,3
2 44,5
2 43,0
2 41,5
2 41,1
2 42,3
2 42,8
2 42,4
2 43,2
2 43,3
2 44,3
2 45,2
4 44,7
4 45,2
4 45,5
4 46,3
SFN n w d SFN
3 45,5
3 44,7
3 44,5
3 44,6
3 45,1
3 45,3
3 45,3
3 45,1
3 45,3
3 45,3
3 45,6
3 45,9
3 46,3
3 46,6
3 46,8
3 47,5
Les trames d'émission finales déterminées s'étendent depuis la trame sonore 96 jusqu'à la trame finale d'émission sonore 128. La plage de trames initiales est comprise dans les limites fixées au cours du mode d'exploration précédent et on trouve des chemins de mise en coïncidence pour les mots de référence "deux, trois et quatre". A l'achèvement de l'opération de transformation temporelle dynamique pour le mot de référence "neuf", le compteur de niveaux 250 est incrémenté de façon à passer à son état L,4. Du fait que le dernier niveau n'a pas été atteint (case de décision 611), les positions de mémoire pour le cinquième niveau (L=5) sont
initialisées conformément à la case d'opération 605.
Dans l'exploration qui suit des trames finales du niveau quatre (case d'opération 607), la distance normalisée minimale détectée est trouvée à la case 127. Ce signal de trame est placé dans la mémoire temporaire 320 à partir de laquelle il est appliqué au soustracteur 330. Le sigral ik
sortie du soustracteur 330 correspond à Nm - nd =1. La posi-
tion de la trame normalisée minimale est comprise dans une plage de SEND=4 trames par rapport à la trame finale d'émission sonore, et le signal DE provenant du comparateur
332 est validé. A ce moment, le chemin de mise en ccirciden-
ce optimal a atteint la plage de trames finales d'émission
sonore et le traitement de niveau est terminé.
Sous l'effet du signal de trame finale NMS prove-
nant du compteur de trames 230, le dispositif de commande
de plage 440 génère une impulsion de fin ED. Sous la dépen-
dance conjointe du signai DE provenant du comparateur 332 et du signal ED provenant du dispositif de commande de plage
440, le circuit de commande de séquence 400 produit l'impul-
sion de commande SE. L'impulsion de commande SE actionne le
dispositif de commande de retour en arrière 450 qui condi-
tionne le circuit des figures 2 et 3 de façon à retourner en arrière dans les chemins de mise en coïncidence dans le temps qui sont enregistrés dans la mémoire de niveau 210, et à transférer les suites candidates de mots de référence valides de la mémoire 210 vers la mémoire de retour en
arrière 260, en compagnie des signaux de distance normali-
sée pour les chemins. L'opération de retour en arrière est
accomplie conformément à l'organigramme de la figure 12.
Au début du mode de retour en arrière, l'impulsion
SE provenant du circuit de commande 400 agit sur le disposi-
tif de commande de retour en arrière 450 de façon qu'il génère les impulsions SLJE, SNM, SLPN, SLT1 et le signal D. L'impulsion SLJE est appliquée au compteur de niveaux 250 par la porte OU 467 et elle provoque le transfert vers le compteur de niveaux 250 du signal LB=0 qui est présent en sortie du compteur de retour en arrière 240 (case d'index 1205) . L'impulsion SNM positionne le compteur de trames 230 dans son état ns128 (case d'index 1210). L'impulsion SLPN introduit un signal LPN dans la mémoire temporaire 309, tandis que l'impulsion SLT1 introduit un signal de trame
"un" dans la mémoire temporaire 320. Le signal D condition-
ne le circuit logique d'adresse 290 de façon que le signal L-O et le signal ns=128 soient appliqués aux entrées
d'adresse de la mémoire de niveau 210.
A ce moment, les n,=128 positions de trame du
niveau L-0 dans la mémoire de niveau 210 sont adressées.
Comme indiqué précédemment, le signal SFN pour chaque trame de chaque niveau L est égal à zéro, sauf pour la trame ns-l, et le signal de distance d pour chaque trame sauf la trame ns-l est égal à LPN. Le signal de sortie d de la section de mémoire de niveau 210-2 est normalisé dans le diviseur 355 et le signal de distance normalisée d(128)/128 provenant du diviseur est comparé dans le comparateur 311 avec le contenu de la mémoire temporaire 309. Le contenu de la mémoire temporaire 309 est inférieur au signal de sortie du diviseur 355 et le signal DL que fournit le comparateur 311 est validé. Par conséquent, les contenus des mémoires temporaires 309 et 320 sont respectivement remplacés par
LPN/128 et 128.
Le soustracteur 330 produit le signal Nm-ns-o sous l'effet du signal d'entrée Nm et du signal d'entrée ns provenant de la porte 324. Le signal N m-n s=o est inférieur à 8END=4 (case de décision 1215). Par conséquent, le signal DE provenant du comparateur 332 est validé. Le signal DE
validé agit sur le dispositif de commande de retour en arriè-
re 450 de façon qu'il génère l'impulsion DN1 (case d'index 1225) qui incrémente le compteur de trames 230 pour le faire passer dans son état n. =127. La séquence d'impulsions DN1 provenant du dispositif de commande de retour en arrière 450
se poursuit jusqu'à ce que la trame ns=124 soit atteinte.
Dans cet intervalle de temps, le signal d(n s)/ns minimal est
placé dans la mémoire temporaire 309 et le signal n s corres-
pondant est placé dans la mémoire temporaire 320. Le signal DE provenant du comparateur 332 est alors invalidé, ce qui fait que le dispositif de commande de retour en arrière 450
produit l'impulsion de commande LSF.
-Sous l'effet de l'impulsion de commande LSF, la trame de distance normalisée minimale n d enregistrée dans p la mémoire temporaire 320 est introduite dans la mémoire temporaire 345 par l'intermédiaire de la porte ET 336 et de la porte OU 337. Après un court retard, le dispositif de
commande 450 génère le signal F qui modifie le circuit logi-
que d'adresse 290 de façon à donner n-nd. Le signal de tra-
me initiale SFN(nd) provenant de la section de mémoire de p niveau 210-1 est appliqué sur une entrée du comparateur 338 par l'intermédiaire de la porte ET 335 et de la porte OU 337. Le signal SFN(nd) est égal à zéro et le comparateur p 338 valide le signal SFNO. L'état validé du signal SFNO signifie qu'il n'existe aucun chemin valide de mise en coincidence dans le temps se terminant à la trame nd dans p le niveau 0. Le compteur de retour en arrière 450 change donc d'état de façon à permettre la détection des chemins de mise en coïncidence dans le temps qui se terminent dans le
niveau 1.
L'impulsion de commande IB1 provenant du disposi-
tif de commande de retour en arrière 450 incrémente le compteur de retour en arrière 240 pour le faire passer à LB=1. Sous l'effet de l'impulsion SLJE, le signal LB=1 est
transféré du compteur 240 vers le compteur de niveaux 250.
L'impulsion SNM positionne le compteur de trames 230 dans son état nsNm etles impulsions SLPN et SLTO positionnent respectivement les mémoires temporaires 309 et 320 à LPN/128
et 128. La détection du signal de distance normalisée mini-
male est ensuite accomplie pour le niveau 1 conformément à la boucle comprenant la case de décision 1212, la case 1214, la case de décision 1215 et la case d'index 1225 dans l'organigramme de la figure 12. Lorsque la trame ns est atteinte, la mémoire temporaire 309 contient le signal dp=LPN/128 et la mémoire temporaire 320 contient le signal ns-0. Il en est ainsi du fait que le traitement de TTD du niveau 1 n'a pas donné de chemins de mise en coïncidence dans le temps compris dans la plage de trames finales de l'émission sonore. La case de décision 1230 détermine que le signal SFN(SF') est égal à zéro. Le comparateur 338 valide le signal SFNO. Le compteur 240 est incrémenté par le signal IB1 (case d'index 1255) et
la case de décision 1260 fait passer à la case d'index 1205.
L'opération de retour en arrière du niveau L=2 est ensuite déclenchée par les impulsions de commande SLJE, SNM, SLPN, et SLT1, et le signal D provenant du dispositif de commande de retour en arrière 450, sous l'effet du signal SFNO validé provenant du comparateur 338. Comme décrit en relation avec le traitement de retour en arrière du niveau 1, le circuit logique d'adresse 290 applique aux entrées d'adresse de la mémoire de niveau 210 les signaux d'adresse ns provenant du compteur de trames 230 et les
signaux d'adresse L=2 provenant du compteur de niveaux 250.
Le compteur de trames 230 est positionné dans son état ns=Nm et le signal de distance normalisée minimale dp/nd dans la plage de trames finales de l'émission sonore P SEND est détecté et enregistré dans la mémoire temporaire
309. La trame qui correspond au signal de distance normali-
sée minimale nd est enregistrée dans la mémoire temporaire 320. Il n'y a pas de chemins de mise en coïncidence pour le second niveau qui soient compris dans la plage de trames finales SEND. Par conséquent, la mémoire temporaire 309 contient dp/nd =125 et la mémoire temporaire 320 contient
nd:125. A la trame ns=124, le signal DE provenant du compa-
p rateur 332 est validé, grâce à quoi le code de trame nd est p introduit dans la mémoire temporaire 345 sous l'effet du
signal LSF. Le signal SFN pour la trame nd est égal à zéru -
p du fait qu'il n'y a eu dans le traitement de TTD du niveau 2
aucun chemin de mise en coïncidence dans le temps se termi-
nant dans la plage de trames oEND. Sous l'effet du signal SFN(nd),0, le comparateur 338 valide le signal SFNO. Le p traitement de retour en arrière du niveau 3 est déclenché par le signal IB1 provenant du dispositif de commande de retour en arrière 450 qui incrémente le compteur de retour
en arrière 240 pour le faire passer à LB=3.
Comme il est indiqué dans le tableau 6, le trai-
tement de TTD du niveau 3 a fait apparaître des chemins de mise en coIncidence dans le temps ayant des points finals aux trames 125, 126, 127 et 128. Conformément à la case de décision 1212, à la case de fixation d'index 1214, à la case de décision 1215 et à la case d'index 1225 de la figure 12, on traite les signaux de distance normalisée d(n S) /nS pour
ces trames finales du niveau 3. On trouve le signal de dis-
tance normalisée minimale dp/nd 0,49 pour la trame 126.
dp Une fois que le compteur de trames 230 a atteint la trame
n, 124, le signal nd,126 est transféré de la mémoire tempo-
raire 320 vers la mémoire temporaire 345 par le signal LSF.
Le signal F est généré par le dispositif de commande 450 et le signal SFN=89 qui provient de la mémoire de niveau 210 est appliqué à une entrée du comparateur 338 par la porte ET
335 et la porte OU 337. Le signal SFNO provenant du compara-
teur demeure invalidé et le signal WBS est appliqué à l'en-
trée de validation d'écriture de la mémoire de retour en
arrière 260. A ce moment, le signal w=3 provenant de la sec-
tion de mémoire de niveau 210-3 et le signal d(126)/126 pro-
venant du diviseur 355 sont introduits à l'adresse L=3,
LB,3 de la mémoire 260.
Le signal SFN(126),89 provenant de la section de mémoire de niveau 210-1 est ensuite placé dans la mémoire temporaire 345 par l'intermédiaire de la porte ET 335 et de la porte OU 337, sous l'effet du signal LSF qui provient du dispositif de commande 450. L'impulsion de commande DL1 qui provient du dispositif de commande de retour en arrière 450 décrémente le compteur de niveaux 250 pour le faire passer à son état L,2. Les positions n,89, L,2 de la mémoire de niveau 210 sont ensuite adressées de façon à placer les signaux w,4, d(89)/89-0,521 à la position L,2, LB=3 de la mémoire de retour en arrière 260. Le signal SFN(89)=32 provenant de la section 210-1 de la mémoire de niveau est introduit dans la mémoire temporaire 345 sous l'effet du signal LSF et le compteur de niveaux 250 est décrémenté par le signal DL1, pour passer à son état L=1. L'adresse de mémoire de retour en arrière est ainsi changée et devient L=1, LB-3, et les
signaux w=4, d(32)/32=0,384 provenant de la position de tra-
me n=32, niveau L=2, sont introduits dans la mémoire de retour en arrière sous l'effet du signal WBS qui provient du
dispositif de commande 450.
Le signal SFN(32)=1 provenant de la section de mémoire 210-1 est placé dans la mémoire temporaire 345 et le compteur de niveaux 250 est décrémenté de façon à passer dans son état L=0 (case d'index 1250). Le signal LZS est validé lorsque le compteur de niveaux 250 est placé dans son
état L,0. Sous l'effet du signal LZS, le dispositif de com-
mande 450 génère une impulsion IB1. Le compteur de retour en arrière 240 est alors incrémenté pour passer à son état LB,4, et l'opération de retour en arrière du quatrième niveau commence sous l'effet de la génération des impulsions SLJE, SNM, SLPN et SLTO et du signal de commande D. Dans l'opération de retour en arrière du quatrième niveau, on compare les signaux de distance pour la séquence
de trames allant de 128 à 125. Le signal de distance norma-
lisée minimale d(127) 0,369 et la trame correspondante
(nd -127) sont respectivement placés dans les mémoires tempo-
P _ raires 309 et 320. La trame initiale SFN(U27)489 est comparée
à zéro dans le comparateur 338. Du fait qu'elle est diffé-
d(127)sotirdus rente de zéro, les codes w(127)=3 et 127 sont introduits à la position L-4, LB,4 de la mémoire de retour en arrière 260. Le code SFN(127)=89 est alors introduit dans la mémoire temporaire 345 par le signal LSF; le compteur de niveaux 250 est incrémenté pour passer à son état L=3 et on accède aux positions L=3, n,89 de la mémoire de niveau 210. Les signaux w(89)=5 et d(89)/89=0,373 sont placés à la position L-3, LB=4 de la mémoire de retour en arrière 260 et le signal SFN(89),60 est introduit dans la mémoire temporaire 345. Le compteur 250 est décrémenté pour passer à son état L=,2. Le signal SFN(60),32 est différent de zéro. Par conséquent, les positions L=2, n=32 de la mémoire de niveau 210 sont adressées de façon que les signaux w(60)44, d(60)/60=0,438 soient introduits dans la position L=2, LB=2 de la mémoire 260. Le signal SFN(60) =32 est introduit dans la mémoire temporaire 345 et le compteur de niveaux 250 est décrémenté pour prendre son état L=1. Le signal SFN(32)=1 qui se trouve dans les positions L=1, n=32 de la mémoire de niveau 210 est différent de zéro, ce qui fait que les signaux w(32)=4, d(32)/32=0, 384 sont introduits dans la
position L=l, LB=4 de la mémoire de retour en arrière 260.
Le signal SFN(32)=1 est placé dans la mémoire temporaire 345. Le compteur 250 est décrémenté pour prendre son état L,0, dans lequel le signal LZS est validé. Sous l'effet du
signal LZS, le signal IB1 provenant du dispositif de comman-
de 450 incrémente le compteur de retour en arrière 240 pour le faire passer à son état LB=5. A ce moment, LBLMAX. Le
compteur 240 produit un signal LBS qui conditionne le dis-
positif de commande 450 de façon à générer une impulsion de
*fin EE.
Le traitement de retour en arrière est terminé et la mémoire 260 contient la suite de mots de référence 443 qui se termine au niveau 3 et la suite de mots de référence 4453 qui se termine au niveau 4, ainsi que les signaux de
distance correspondants. Le signal EE est appliqué au cir-
cuit de commande de séquence 400 qui produit le signal
TERMINE. Le signal TERMINE est appliqué au dispositif d'uti-
lisation 390 qui est conçu de façon à prélever les codes dans la mémoire de retour en arrière, adressée par les signaux LB' et L'. Le dispositif d'utilisation peut être un
dispositif de traitement de données, un réseau de télécom-
munications ou une machine commandée par un code. Le disposi-
tif de reconnaissance des figures 2 et 3 peut par exemple faire partie d'un appareil téléphonique conçu de façon à , recevoir des numéros de compte prononcés, dans un but de facturation. Le dispositif d'utilisation 390 peut être conçu de
façon à sélectionner la suite de mots de référence de dis-
tance minimale dans la mémoire de retour en arrière 260, ou 1Q bien il peut être conçu de façon à sélectionner dards la mémoire 260 une suite de mots de référence de longueur déterminée. Dans certaines configurations, il peut y avoir
des restrictions concernant les mots de référence particu-
liers dans chaque position de mot. Un sélecteur de mots de référence 207 peut être incorporé dans le circuit de la
figure 2 de façon à ne fournir que des signaux de caracté-
ristiques de mots de référence prédéterminés pour chaque niveau L, sous l'effet du signal de sortie du compteur de niveaux 250 et du compteur de mots 220. Par exemple, le premier mot de la configuration de parole peut être limité aux chiffres 2 et 3. En présence des signaux de niveau L=0 et L=1, le sélecteur 207 sélectionne uniquement les signaux
de caractéristiques pour les chiffres 2 et 3, pour le trai-
tement de TTD. Le signal Wm provenant du sélecteur 207 ter-
mine alors le traitement de TTD du premier niveau à la fin de la génération des chemins de mise en coïncidence dans le
temps pour le mot de référence "trois".
Il va de soi que de nombreuses modifications peuvent être apportées au dispositif décrit et représenté,
sans sortir du cadre de l'invention.
ANNEXE A
C PROGRAMME POUR LE CIRCUIT DE COMMANDE DE SEQUENCE
C (400/FIG. 6)
CONTINUE
LEV=.FALSE.
CALL WAITFOR (START)
C PRELEVEMENT DE L'EMISSION SONORE
CALL OUTPUT (MODE=A)
CALL OUTPUT (SA)
CALL WAITFOR (EA)
C INITIALISATION DES COMPTEURS DE NIVEAUX ET DE RETOUR
C EN ARRIERE
CALL OUTPUT (SBO)
CALL OUTPUT (SLJM)
C BOUCLE DE TRAITEMENT
CONTINUE
C INITIALISATION DU NIVEAU SUIVANT
CALL OUTPUT (SI)
CALL WAITFOR (EI)
C EXPLORATION POUR LIMITER LA PLAGE DES TRAMES INITIALES
CALL OUTPUT (SB)
CALL WAITFOR (EB,REPEAT)
IF (REPEAT.EQ.1) GC TO 10
C TRANSFERT DE LA TRAME INITIALE VERS LE SEQUENCEUR
C DE TRAMES
CALL OUTPUT (FSL)
C EXECUTION DE LA TRANSFORMATION TEMPORELLE DYNAMIQUE
C POUR CE NIVEAU
CALL OUTPUT (SC)
CALL WAITFOR (EC)
C CONTROLE DE LA BASCULE D'ABANDON
CALL INPUT (ABFF)
IF (ABFF.EQ.1) GO TO 150
C PAS D'ABANDON PASSAGE AU NIVEAU SUIVANT
LEV=.TRUE.
CALL OUTPUT (ILl)
CALL INPUT (LMS)
IF (IMS.EQ.1) GO TO 200
C FIN DE LA BOUCLE - CALCUL DU MINIMUM
C A UTILISER DANS LA RESTRICTION DE PLAGE
CALL OUTPUT (SD)
CALL WAITFOR (ED)
GO TO 100
CONTINUE
C ABANDON - EST-CE LE PREMIER NIVEAU ?
IF (LEV) GO TO 200
C ABANDON SUR LE PREMIER NIVEAU - ERREUR
CALL OUTPUT (REPEAT 2)
GO TO 10
200 CONTINUE
C FIN DU TRAITEMENT POUR TOUS LES NIVEAUX
C RETOUR EN ARRIERE DANS LA MEMOIRE DE NIVEAUX
CALL OUTPUT (SE)
CALL WAITFOR (EE)
CALL OUTPUT (DONE)
GO TO 10
END
ANNEXE B
C PROGRAMME POUR
C L'INITIALISATION DE NIVEAU (410/FIG. 8)
CONTINUE
CALL WAITFOR (SI)
CALL OUTPUT (MODE=I)
C RESTAURATION DU COMPTEUR DE TRAMES
CALL OUTPUT (SNII)
CONTINUE
C ECRITURE DANS LA MEMOIRE DE DONNEES
CALL OUTPUT (WLSI)
C POUR TOUTES LES TRAMES
CALL OUTPUT (INII)
CALL INPUT (NMS)
IF (NMS. NE. 1) GO TO 100
C INITIALISATION TERMINEE
CALL OUTPUT (EI)
GO TO 10
END
ANNEXE C
C PROGRAMME POUR
C LA COMMANDE D'EXPLORATION (420/FIG.
CONTINUE
CALL WAIT FOR (SB)
CALL OUTPUT (MODE=BB)
C POSITIONNEMENT DU COMPTEUR DE TRAMES
C ET EXPLORATION VERS L'AVANT
CALL OUTPUT (SNM)
CALL OUTPUT (BD)
100 CONTINUE
CALL INPUT (DMTA)
IF (DMTA.EQ. 1) GC TO 110
C POURSUITE DE L'EXPLORATION VERS L'AR:
CALL OUTPUT (DN1)
CALL INPUT (NSO)
IF (NSO.NE. 1) GO TO 100
CALL OUTPUT (REP)
GO TO 10
CONTINUE
C EXPLORATION VERS L'AVANT
CALL OUTPUT (SN1B)
CALL OUTPUT (BU)
CONTINUE
CALL INPUT (DMTR)
IF (DMTR.EQ. 1) GO TO 200
C POURSUITE DE L'EXPLORATION
CALL OUTPUT (IN1B)
GO TO 150
CONTINUE
C EXPLORATION TERMINEE
CALL OUTPUT (EB)
GO TO 10
END 9)
AU MAXIMUM
RIERE
ANNEXE D
C PROGRAMME POUR LE DISPOSITIF DE COMMANDE DE TTD
(430/FIG. 10)
CONTINUE
CALL WAIT FOR (SC)
C POSITIONNEMENT DU COMPTEUR DE MOTS
CALL OUTPUT (SW1)
CONTINUE
C POSITIONNEMENT DU COMPTEUR DANS LE SEQUENCEUR DE
C TRAMES
CALL OUTPUT (FSR)
CONTINUE
CALL OUTPUT (MODE=C)
C EXECUTION DU TRAITEMENT DE TTD
CALL OUTPUT (DST)
CALL WAIT FOR (DDN)
C CONTROLE D'ABANDON DU TRAITEMENT DE TTD
CALL INPUT (AB)
IF (AB.ED. 1) GO TO 250
C CONTROLE DES INDICATEURS DE POINT FINAL
CALL INPUT (EP)
IF (EP.NE. 1) GO TO 200
C CONTROLE DES DISTANCES
CALL OUTPUT (MODE=E)
CALL INPUT (OS)
IF (DS.NE.1) GO TO 200
C POINT FINAL VALIDE ET DISTANCE INFERIEURE - ECRITURE
C EN MEMOIRE
CALL OUTPUT (WLS)
200 CONTINUE
C TRAITEMENT TERMINE ?
CALL INPUT (DN)
IF (DN.EQ.1) GO TO 250
C NON - TRAME SUIVANTE
CALL OUTPUT (FSI)
250 CONTINUE
C PASSAGE AU MOT SUIVANT
CALL OUTPUT (IW1)
CALL INPUT (WM)
IF (WM.NE.1) GO TO 100
C TERMINE POUR TOUS LES MOTS
CALL OUTPUT (EC)
GO TO 10
END
ANNEXE E
C PROGRAMME POUR
C LE DISPOSITIF DE COMMANDE DE PLAGE (440/FIG. 11)
CONTINUE
CALL WAITFOR (SD)
CALL OUTPUT (MODE=BF)
C RESTAURATION DU COMPTEUR DE TRAMES
CALL OUTPUT (SN1D)
C CHARGEMENT DE LPN DANS LA MEMOIRE TEMPORAIRE DE D
C CIRCONFLEXE
CALL OUTPUT (SLPN)
C ET INITIALISATION DE LA MEMOIRE TEMPORAIRE DE NDP
GNq
OI OL 0D
(s) LndLno nuVD
SNIWHSI
OS oL oD (O'G'SWI) JI (sq) indNI livD (ISI) indino livo LNVAInS nVMAIN nv 3DVSSVd SnNIINOD Ooz oL OD (o'3'szq) JI (SzI) LndNI qqVo (iqG) IndlnO uqVo (SiaM) ILndILnO uVD sagIHHV NZ anosaî sa zuIONMN VI sa unor v aSIN OSZ? O oD (T'bo'ONaS) AI (ONAS) IndNI IqVD GaIIVA NIWMH0 NniGa 3ONSISIXSil ga 2qOHLNOD SfNI1NOD (I=saOw)IndfiO 'qVD (1SI) fldilnO YqVo NS Rfi &NVL NS NfNININ fng INSHHISID3ZNZ SnNIINOD
001 OOI O D
(INa) ILndlanO IVD OS1 0Q OD (t'az'a) JI (Sa) IndNI TqVD
MNNILNO0
GNS9 SWVH.I SSI UH3HOH HUnOd SHSI99V NS HnOLQH (aG=SaON) inidinO ivo (tlqS) IlndInO qVo (NdaS) LndLno qYVo SSUIIVOdoaL SSUIO0WW SSG NOIJVnVISSU (WNS) IndlnO TIVO (rfIs) indInO qIV3 SHUfnldO3 ssG NOIIVUnVISgH SnNIINOD (as) HOiALIVM 1V3 SnNIINOD (Zi 'DIJ/OS) SMUIHUV NS UnOIRU SO 9GNVKWO0 SO /IIISOdSIG M1 UnOd SKWHUOUd
A SXSNNV
GNZ
0I OQ 0D
(as) LfndifnO YiVo SNINWHUI NOIIVHOqdXS
1OOI O 09 (I'TN-SN) AI
(SNN) indNI TIVO (aINI) ifLndflnO qVo SSWVHI Si SgLnOL unOd fSnNIINOD (IlS) findfinO iVo D D OSG D Otb D DSC OOZ
OOI S8
001 SZ
D
D O?
D OS Sl I01 D S D
ZZ8ZOSZ
ANNEXE G
C PROGRAMME POUR LE TRAITEMENT DE TTD DES TRAMES
C DEFINITION DES VARIABLES
C MLW= NOMBRE MAXIMAL DE TRAMES DANS LA REFERENCE
C MH,ML,MC= VALEURS SUPERIEURE,INFERIEURE ET CENTRALE
C DES INDEX DE REFERENCE
C NMAX= NOMBRE MAXIMAL DE TRAMES DANS L'EMISSION
C SONORE
C NFRM= INDEX DE TRAME D'EMISSION SONORE
C LEV=INDICATEUR DE TRAME PAIRE/IMPAIRE (POUR UNE
C PENTE=1/2) +
C PARAMETRE DM=5; LIMITE DE PLAGE MC-DM
C PARAMETRE DR2=1; EXTENSION DE PLAGE POUR LA REGLE 2
C PARAMETRE IRMAX=50; TAILLE MAXIMALE DE LA REFERENCE
C PARAMETRE NFN=9; ELEMENTS DANS LE VECTEUR DE TRAME
C PARAMETRE LPN=lE99; PLUS GRAND NUMERO POSSIBLE
DIMENSION UF(NFV), RF(NFV), RF(NFV) FLOC (IRMAX)
DIMENSION DLOC(IRMAX), RLOC(IRMAX),SFLOC(IRMAX)
DIMENSION DLAST(IRMAX),FLAST(IRMAX),SFLAST(IRMAX)
DIMENSION DTMP(IRMAX)
LOGICAL IEV
CONTINUE
CALL WAITFOR (DST,RFS)
IF (RFS) GO TO 900; INITIALIZATION
C CALCUL DES VALEURS POUR MH, ML POUR CETTE TRAME
CALL INPUT (NFRM, DH, SFNH)
NN= NMAX-NFRM
I1= MLW-(NN*.2)
I2= MLW-(NN/2)
IADD=O
IF(IEV) IADD=1
IEV.NOT.IEV
C CALCUL DE ML
IF (Il.GT.O) GO TO 100
ML=ML+ IADD; 1/2 SLOPE
GO TO 110
*CONTINUE
ML=ML+2
CONTINUE
C CALCUL DE MH
IF (12. GT. O) GO TO 120
MH=MH+2
GO TO 130
CONTINUE
MH=MH+IADD; 1/2 SIOPE
CONTINUE
C CALCUL DE - PAR RAPPORT AU DERNIER CENTRE
MLP=MC-DM
MHP=MC+DM
C SORTIE DE LA VALEUR BASSE
CALL OUTPUT (ML)
C RESTRICTION DE LA PLAGE
ML=MAX(MLP,ML,O)
MH=MIN(MHP,MH,MLW)
C CALCUL DES DISTANCES LOCALES
DO 150 J=1, IRMAX
DTMP(J) = O
RLOC(J) = O
SFLOC(J) = O
CONTINUE
DO 170 J=ML,MH
CALL OUTPUT (MH=J)
CALL INPUT (R1,R2,UF(I),RF(I),I=i,NFV)
DO 160 K=1,NFV
DTMP(J)=DTMP(J)+UF(k)*RF(k)
CONTINUE
IF(R1.EQ.2) RLOC(k)=l IF(R1.EQ.2) RLOC(k)=2
CONTINUE
DO 250 J=ML, MH
FLOC(J)=1
SFLOC(J)=SFLAST(J)
DLOC(J)=DTMP(J) + DLAST(J)
IF(FIAST(J).ED.1) DLOC(J)=LPN
IF (DT+DLAST(J-1).GT. DLOC (J)) GO TO 180
DLOC(J)= DTMP(J) +DLAST(J-1)
SFLOC(J) = SFLAST(J-1)
FLOC(J)=O
CONTINUE
IF (DT+DLAST(J-2).GT.DLOC (J)) GO TO 190
DLOC(J)= DTMP(J) + DLAST (J-2)
SFLOC(J)=SFLAST(J-2)
FLOC(J)=O
CONTINUE
IF(RLOCK(J).ED.O) GO TO 250
IF(RLOCK(J).ED.2) GC TO 190
C APPLICATION DE LA REGLE (1)
IF (DTMP(J) +DH.GT.DLOC(J)) GO TO 250
DLOC(J)= DTMP(J) +DH
SFLOC(J)= SFNH
FLOC(J)=O
GO TC 250
190 CONTINUE
C APPLICATION DE LA REGLE 2
DO 200 K= J-2, MLR2
IF (DTMP(J)+DLAST(K).GT.DLOC(J)) GO TO 200
DLOC(J)=DTNP(J) + DLAST(K)
FLOC(J)=O
SFLOC(J)=SFLAST(K)
CONTINUE
C CALCUL DE LA VALEUR MINIMALE + MISE A JOUR DES DONNEES
PMIN=LPN
DO 300 J=ML, MH
IF (DLOC(J).GT.PMIN) GO TO 290
PMIN=DLOC(J)
IM=J
290 CONTINUE
SFLAST(J)=SFLOC(J)
FLAST(J)=FLOC(J)
DLAST(J)=DTMP(J)
300 CONTINUE
C GENERATION DE L'INFORMATION DE SORTIE
CALL OUTPUT (DS=DLOC(IM),DP=DTMP(IM),SFLOC(IM))
C MISE A JOUR DES DONNEES POUR LE MINIMUM ET LE CENTRE
MC=IM
GO TO 10
C SECTION D'INITIALISATION - PREPARATION POUR LE MOT
a SUIVANT
900 CONTINUE
CALL INPUT (NMAX. MLW)
MLRZ=MLW-DR2
LEV=.FALSE.
ML=O
MH=O
MC=O
DO 910 J=1, IRMAX
DLAST(J)=O
FLAST(J)=O
SFLAST(J)=O
910 CONTINUE
GO TO 10
END

Claims (21)

REVENDICATIONS
1. Dispositif de reconnaissance d'une configura-
tion de parole par identification à une suite de mots de référence prédéterminés, comprenant: des moyens destinés à enregistrer un ensemble de signaux représentatifs de
la séquence temporelle de trames de caractéristiques acous-
tiques de chaque mot de référence, cette séquence tempo-
relle de trames comportant une trame initiale et une tra-
me finale, des moyens destinés à produire un ensemble de signaux représentatifs de la séquence temporelle de trames de signaux de caractéristiques acoustiques de la configuration de parole, des moyens qui réagissent aux
signaux de caractéristiques acoustiques de la configura-
tion de parole et aux signaux de caractéristiques acous-
tiques des mots de référence en générant un ensemble de suites de mots de référence, et des moyens destinés à identifier la configuration de parole comme étant l'une des suites de mots de référence générées; caractérisé en ce que les moyens de génération de suites de mots de référence comprennent: des moyens destinés à générer un
ensemble de signaux pour identifier des niveaux succes-
sifs de mot de référence, des moyens destinés à affecter à chaque niveau successif un segment de la configuration de parole, des moyens qui, dans chaque niveau successif, effectuent une mise en coïncidence dans le temps entre
les signaux de caractéristiques de segment de configura-
tion de parole du niveau et les signaux de caractéristi-
ques de mot de référence, pour produire des signaux de trame finale de segment de configuration de parole de
mise en coïncidence dans le temps, pour le niveau consi-
déré, et des signaux de correspondance de mise en coin-
cidence dans le temps pour les mots de référence, et des moyens qui réagissent aux signaux de trame finale de mise
en coïncidence dans le temps et aux signaux de correspon-
dance de mise en coïncidence dans le temps, pour le niveau
considéré, en sélectionnant des suites de mots de référence.
2. Dispositif selon la revendication 1, caracté-
risé en ce que les moyens de mise en coïncidence dans le temps comprennent: des moyens qui réagissent aux trames finales de configuration de parole de mise en coïncidence
dans le temps du niveau immédiatement précédent, en res-
treignant la plage des trames initiales de mise en coin-
cidence dans le temps pour le niveau courant, et des moyens qui réagissent aux signaux de correspondance de mise en coïncidence dans le temps et aux signaux de trame finale de configuration de parole de mise en coïncidence
dans le temps en enregistrant le meilleur signal de corres-
pondance pour chaque trame finale de mise en coïncidence dans le temps, c'est-à-dire un signal représentatif du mot de référence ayant la meilleure correspondance pour chaque trame finale, et un signal représentatif de la trame initiale de configuration de parole de mise en coïncidence dans le temps qui correspond au meilleur mot
de référence pour chaque trame finale.
3. Dispositif selon la revendication 2, carac-
térisé en ce que les moyens de restriction de trame ini-
tiale de la configuration de parole comprennent: des mc-
yens qui réagissent aux meilleurs signaux de correspondan-
ce de mise en coïncidence dans le temps pour le niveau
précédent en sélectionnant le meilleur signal de corres-
pondance minimal du niveau précédent, et des moyens qui réagissent aux meilleurs signaux de correspondance de mise en coïncidence dans le temps du niveau précédent et au meilleur signal de correspondance minimal sélectionné en sélectionnant des trames initiales de configuration de parole de mise en coïncidence dans le temps pour le
niveau courant.
4. Dispositif selon la revendication 3, carac-
térisé en ce que les moyens de génération de suites de mots de référence comprennent en outre: des moyens qui
réagissent aux signaux de caractéristiques de configura-
tion de parole en générant un signal représentatif de la dernière trame de la configuration de parole; des moyens qui, à chaque niveau, réagissent au meilleur signal de
correspondance minimal en générant un signal représenta-
tif de la trame finale de segment de configuration'de parole ayant le meilleur signal de correspondance minimal; et des moyens qui, lorsque le meilleur signal de correspondance
minimal de trame finale est compris dans une plage déter-
minée par rapport au signal de la dernière trame de la configuration de parole, déclenchent le fonctionnement des
moyens de sélection de suites de mots de référence.
5. Dispositif selon la revendication 4, caracté-
risé en ce que les moyens de sélection de suites de mots de référence comprennent: des moyens qui réagissent aux
signaux enregistrés de trame finale de segment de confi-
guration de parole de mise en coïncidence dans le temps,
aux signaux de trame initiale et aux signaux d'identifica-
tion de mot de référence, ainsi qu'au signal de la derniè-
re trame de la configuration de parole, en produisant des
signaux représentatifs de chaque suite de mots de réfé-
rence ayant une trame finale de configuration de parole de mise en coïncidence dans le temps qui se trouve dans une plage déterminée par rapport à la dernière trame de
la configuration de parole.
6.Dispositif selon la revendication 1, caracté-
risé en ce que les moyens de mise en coïncidence dans le temps comprennent: des moyens destinés à sélectionner une plage de trames de mot de référence, pour la mise en coïncidence dans le temps avec chaque trame de segment de configuration de parole de niveau, comportant des moyens qui réagissent au fait que la trame de limite inférieure de la plage de mots de référence courante est inférieure à un premier nombre prédéterminé, en étendant la trame de limite inférieure de la plage de mot de référence jusqu'à la trame initiale de mot de référence, et des
moyens qui réagissent au fait que la trame de limite su-
périeure de la plage de mot de référence courante est supérieure à un second nombre prédéterminé, en étendant
la trame de limite supérieure de la plage de mot de réfé-
rence, jusqu'à la trame finale de mot de référence, ce qui a pour action de réduire les effets de prononciation groupée.
7. Dispositif selon la revendication 1, caracté-
risé en ce que les moyens de mise en coïncidence dans le temps comprennent: des moyens qui réagissent aux signaux de caractéristiques ds mot de référence et aux signaux de
caractéristiques de segment de parole de niveau en sélec-
tionnant une plage de trames de mot de référence pour la mise en coïncidence dans le temps avec chaque trame de
segment de configuration de parole de niveau et des mo-
yens qui réagissent au fait que la trame de limite infé-
rieure de la plage de mot de référence est supérieure ou égale à la trame finale de mot de référence en générant une trame finale de mise en coïncidence dans le temps,
de segment de configuration de parole de niveau.
8. Dispositif selon la revendication 1, caracté-
risé en ce que les moyens de mise en coïncidence dans le temps comprennent: des moyens qui, dans chaque mise en coïncidence dans le temps de mot de référence du niveau
courant, agisse sous la dépendance du signal de caracté-
ristiques de mot de référence et des signaux de caractéris-
tiques de segment de configuration de parole, en sélection-
nant une plage de trames de mot de référence pour chaque trame de segment de configuration de parole, et des moyens qui, pour chaque trame de segment de configuration de
parole, réagissent au fait que la trame de limite infé-
rieure de mise en coïncidence dans le temps de mot de ré-
férence est supérieure.ou égale à la trame finale de mot de référence, en mettant fin à la mise en coïncidence du
mot de référence.
9. Dispositif selon la revendication 8, carac-
térisé en ce que les moyens de mise en coïncidence dans le temps comprennent: des moyens qui, dans chaque mise en coïncidence dans le temps de mot de référence de niveau, agissent sous la dépendance des signaux de caractéristiques de mot de référence et des signaux de caractéristiques de segment de configuration de parole de niveau, en générant un signal de correspondance de mise en coïncidence dans le temps, pour chaque trame de segment de configuration de parole de niveau, des moyens qui réagissent à la trame de segment de configuration de parole de niveau en générant un signal de correspondance maximale admissible pour la trame de segment de configuration de parole, et des moyens qui réagissent au fait que le signal de correspondance de mise en coïncidence dans le temps d'une trame de segment de configuration de parole dépasse le signal de correspon-
dance maximal admissible pour la trame de segment de con-
figuration de parole, en mettant fin à la mise en coinci-
dence dans le temps pour le mot de référence de niveau.
10. Dispositif destiné à la reconnaissance d'une configuration de parole en l'identifiant à une suite de mots de référence prédéterminés, selon l'une
quelconque des revendications 1 à 9, caractérisé en ce
que les moyens de génération de mot de référence compren-
nent en outre: des moyens qui réagissent aux signaux d'identification de niveau en sélectionnant un ensemble
déterminé de mots de référence pour la mise en colnciden-
ce dans le temps dans chaque niveau de mot de référence.
11. Dispositif selon la revendication 1, carac-
térisé en ce que les moyens qui, à chaque niveau succes-
sif, effectuent la mise en coïncidence dans le temps des signaux de caractéristiques de mot de référence et de
segment de configuration de parole, comprennent des mo-
yens qui appliquent aux signaux de caractéristiques de chaque mot de référence une transformation temporelle
dynamique les faisant correspondre aux signaux de carac-
téristiques du segment de configuration de parole.
12. Procédé de reconnaissance d'une configura-
tion de parole en l'identifiant à une suite de mots de
référence prédéterminés, comprenant les opérations sui-
vantes: on enregistre un ensemble de signaux représenta-
tifs de la séquence temporelle de trames de caractéristi-
ques acoustiques de chaque mot de référence, cette séquen-
ce comportant une trame initiale et une trame finale; on
produit un ensemble de signaux représentatifs de la sé-
quence temporelle de trames de signaux de caractéristiques acoustiques de la configuration de parole; on génère au moins une suite de mots de référence sous la dépendance
des signaux de caractéristiques acoustiques de la configura-
tion de parole et des signaux de caractéristiques acousti-
ques des mots de référence; et on identifie la configura-
tion de parole comme étant l'une des suites de mots de ré-
férence générées; caractérisé en ce que la génération de suites de mots de référence comprend les opérations sui- vantes: on produit un ensemble de signaux identifiant des niveaux successifs de mot de référence; on affecte un
segment de la configuration de parole à chaque mot succes-
sif; pour chaque mot, on effectue une mise en coïncidence temporelle des signaux de caractéristiques de segment de
configuration de parole de niveau et des signaux de carac-
téristiques des mots de référence, pour produire des si-
gnaux de trame finale de segment de configuration de pa-
role de mise en coïncidence dans le temps, pour le niveau considéré, et des signaux de correspondance de mise en coïncidence dans le temps pour les mots de référence, et on sélectionne des suites de mots de référence sous la dépendance des signaux de trame finale de configuration
de parole de mise en coïncidence dans le temps et des si-
gnaux de correspondance de mise en coïncidence dans le
temps, pour les niveaux.
13. Procédé selon la revendication 12, caracté-
risé en ce que la mise en coïncidence dans le temps com-
prend les opérations suivantes: on restreint la plage des trames initiales de mise en coïncidence dans le temps, pour le niveau courant, sous la dépendance des trames finales de segment de parole de mise en coïncidence dans
le temps du niveau immédiatement précédent; et on enregis-
tre pour chaque trame finale de segment de parole de mise
en coïncidence dans le temps le meilleur signal de corres-
pondance pour la trame finale, un signal représentatif du
mot de référence correspondant au meilleur signal de cor-
respondance pour la trame finale, et un signal représenta-
tif de la trame initiale de la configuration de parole de
mise en coïncidence dans le temps qui correspond au meil-
leur mot de référence pour la trame finale.
14. Procédé selon la revendication 13, caractéri-
sé en ce que l'opération consistant à restreindre les trames
initiales de niveau s'effectue en détectant le signal mini-
mal parmi les meilleurs signaux de correspondance du niveau
précédent, sous la dépendance des meilleurs signaux de cor-
respondance de mise en coïncidence dans le temps du niveau précédent, et en sélectionnant les trames initiales de segment de parole de mise en coïncidence dans le temps pour le niveau courant, sous la dépendance des meilleurs
signaux de correspondance du niveau précédent et du meil-
leur signal de correspondance minimal détecté du niveau
précédent.
15. Procédé selon la revendication 14, caracté-
risé en ce que l'opération de génération de suites de mots de référence comprend les actions suivantes: on génère un signal représentatif de la trame finale de configuration
de parole, sous la dépendance des signaux de caractéris-
tiques de configuration de parole; à chaque niveau, on
génère un signal représentatif de la trame finale de seg-
ment de configuration de parole ayant le meilleur signal de correspondance minimal; et on déclenche la sélection de suites de mots de référence lorsque le meilleur signal
de correspondance de trame finale qui a la valeur mini-
male est compris dans une plage déterminée par rapport
au dernier signal de trame de la configuration de parole.
16. Procédé selon la revendication 15, caracté-
risé en ce que l'opération de sélection de mot de réfé-
rence s'effectue en produisant des signaux représentatifs
de chaque suite de mots de référence ayant une trame fina-
le de configuration de parole de mise en coïncidence dans le temps qui se trouve dans une plage prédéterminée par rapport à la dernière trame de la configuration de parole,
sous la dépendance des signaux enregistrés de trame fina-
le de configuration de parole de mise en coïncidence dans le temps, des signaux de trame initiale et des signaux
d'identification de mot de référence.
17. Procédé selon la revendication 12, caracté-
risé en ce que la mise en coïncidence dans le temps s'effec-
tue en sélectionnant une plage de trames de mot de réfé-
rence pour la mise en coïncidence avec chaque trame de seg-
ment de configuration de parole de niveau, sous la dépen-
dance des signaux de caractéristiques de mot de référence
et des signaux de caractéristiques de segment de configu-
ration de parole; et ceci comprend les opérations qui consistent à étendre la trame de limite inférieure de la plage de mot de référence à la trame initiale de mot de référence lorsque la trame de limite inférieure de plage
de mot de référence sélectionnée est inférieure à un pre-
mier nombre prédéterminé, et à étendre la trame de limite supérieure de plage de mot de référence sélectionnée jusqu'à la trame finale de mot de référence, lorsque la trame de limite supérieure de plage de mot de référence
sélectionnée est supérieure à un second nombre prédétermi-
né.
18. Procédé selon la revendication 11, caracté-
risé en ce que la mise en coïncidence dans le temps s'effectue en sélectionnant une plage de trames de mot de référence pour la mise en coïncidence avec chaque trame de segment de configuration de parole de niveau, sous la
dépendance des signaux de caractéristiques de mot de ré-
férence et des signaux de caractéristiques de segment de parole de niveau, et en générant des trames finales de
mise en coïncidence temporelle de segment de configura-
tion de parole de niveau, lorsque la trame de limite supérieure de plage de mot de référence sélectionnée est
supérieure ou égale à la trame finale de mot de référence.
19. Procédé selon la revendication 12, caracté-
risé en ce que la mise en coïncidence dans le temps s'effec-
tue en sélectionnant une plage de trames de mot de référen-
ce pour chaque trame de segment de configuration de parole,
à chaque niveau, sous la dépendance des signaux de carac-
téristiques de mot de référence et des signaux de caracté-
ristiques de configuration de parole, et en mettant fin à la mise en coïncidence dans le temps du mot de référence du niveau considéré, lorsque la trame de limite inférieure de plage de mise en coïncidence de mot de référence qui est sélectionnée est supérieure ou égale à la trame finale de
mot de référence.
20. Procédé selon la revendication 19, caracté-
risé en ce que la mise en coïncidence dans le temps s'effec-
tue en générant un signal de correspondance de mise en coïncidence dans le temps pour chaque trame de segment de configuration de parole de niveau, sous la dépendance des signaux de caractéristiques de mot de référence et des signaux de caractéristiques de configuration de parole de niveau; en générant un signal de correspondance maximal admissible pour la trame de segment de configuration de
parole, sous la dépendance de la trame de segment de con-
figuration de parole de niveau; et en mettant fin à la mise en coïncidence dans le temps du mot de référence de niveau lorsque le signal de correspondance de mise en coïncidence d'une trame de segment de configuration de
parole dépasse le signal de correspondance maximal admis-
sible pour cette trame.
21. Procédé selon l'une quelconque des revendi-
cations 12 à 20, caractérisé en ce que la génération de
suites de mots de référence comprend en outre la sélec-
2C tion d'un ensemble déterminé de mots de référence pour la mise en coïncidence dans le temps, dans chaque niveau
de mot de référence, sous la dépendance des signaux d'iden-
tification de niveau.
FR8205106A 1981-03-27 1982-03-25 Dispositif et procede de reconnaissance de la parole Granted FR2502822A1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/248,570 US4400788A (en) 1981-03-27 1981-03-27 Continuous speech pattern recognizer

Publications (2)

Publication Number Publication Date
FR2502822A1 true FR2502822A1 (fr) 1982-10-01
FR2502822B1 FR2502822B1 (fr) 1985-02-08

Family

ID=22939686

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8205106A Granted FR2502822A1 (fr) 1981-03-27 1982-03-25 Dispositif et procede de reconnaissance de la parole

Country Status (6)

Country Link
US (1) US4400788A (fr)
JP (1) JPS57169800A (fr)
CA (1) CA1167967A (fr)
DE (1) DE3211313A1 (fr)
FR (1) FR2502822A1 (fr)
GB (1) GB2095882B (fr)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58100195A (ja) * 1981-12-10 1983-06-14 日本電気株式会社 連続音声認識装置
JPS58111989A (ja) * 1981-12-25 1983-07-04 シャープ株式会社 音声認識装置
DE3215868A1 (de) * 1982-04-29 1983-11-03 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette
USRE33597E (en) * 1982-10-15 1991-05-28 Hidden Markov model speech recognition arrangement
US4587670A (en) * 1982-10-15 1986-05-06 At&T Bell Laboratories Hidden Markov model speech recognition arrangement
US4989248A (en) * 1983-01-28 1991-01-29 Texas Instruments Incorporated Speaker-dependent connected speech word recognition method
JPS60179797A (ja) * 1983-10-27 1985-09-13 日本電気株式会社 パタンマツチング装置
JPS60122475A (ja) * 1983-11-15 1985-06-29 Nec Corp パタン認識装置
JPS60211498A (ja) * 1984-04-05 1985-10-23 日本電気株式会社 連続音声認識装置
JP2607457B2 (ja) * 1984-09-17 1997-05-07 株式会社東芝 パターン認識装置
US4783809A (en) * 1984-11-07 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Automatic speech recognizer for real time operation
US4718094A (en) * 1984-11-19 1988-01-05 International Business Machines Corp. Speech recognition system
JPS61145599A (ja) * 1984-12-19 1986-07-03 日本電気株式会社 連続音声認識装置
US5241649A (en) * 1985-02-18 1993-08-31 Matsushita Electric Industrial Co., Ltd. Voice recognition method
US4980918A (en) * 1985-05-09 1990-12-25 International Business Machines Corporation Speech recognition system with efficient storage and rapid assembly of phonological graphs
US4748670A (en) * 1985-05-29 1988-05-31 International Business Machines Corporation Apparatus and method for determining a likely word sequence from labels generated by an acoustic processor
US4783803A (en) * 1985-11-12 1988-11-08 Dragon Systems, Inc. Speech recognition apparatus and method
JPS62169199A (ja) * 1986-01-22 1987-07-25 株式会社デンソー 音声認識装置
JPS62232000A (ja) * 1986-03-25 1987-10-12 インタ−ナシヨナル・ビジネス・マシ−ンズ・コ−ポレ−シヨン 音声認識装置
US4831550A (en) * 1986-03-27 1989-05-16 International Business Machines Corporation Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events
US4827521A (en) * 1986-03-27 1989-05-02 International Business Machines Corporation Training of markov models used in a speech recognition system
US4941178A (en) * 1986-04-01 1990-07-10 Gte Laboratories Incorporated Speech recognition using preclassification and spectral normalization
US4918733A (en) * 1986-07-30 1990-04-17 At&T Bell Laboratories Dynamic time warping using a digital signal processor
US4910669A (en) * 1987-04-03 1990-03-20 At&T Bell Laboratories Binary tree multiprocessor
DE3711348A1 (de) * 1987-04-03 1988-10-20 Philips Patentverwaltung Verfahren zum erkennen kontinuierlich gesprochener woerter
DE3711342A1 (de) * 1987-04-03 1988-10-20 Philips Patentverwaltung Verfahren zum erkennen zusammenhaengend gesprochener woerter
US5027408A (en) * 1987-04-09 1991-06-25 Kroeker John P Speech-recognition circuitry employing phoneme estimation
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
EP0316112A3 (fr) * 1987-11-05 1989-05-31 AT&T Corp. Utilisation d'informations spectrales instantanées et transitoires dans des systèmes pour la reconnaissance de la parole
US5168524A (en) * 1989-08-17 1992-12-01 Eliza Corporation Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation
US5119425A (en) * 1990-01-02 1992-06-02 Raytheon Company Sound synthesizer
EP0551374A4 (en) * 1990-10-02 1995-02-15 Dsp Group Inc Boundary relaxation for speech pattern recognition
DE19540859A1 (de) * 1995-11-03 1997-05-28 Thomson Brandt Gmbh Verfahren zur Entfernung unerwünschter Sprachkomponenten aus einem Tonsignalgemisch
GB9602691D0 (en) * 1996-02-09 1996-04-10 Canon Kk Word model generation
US5884259A (en) * 1997-02-12 1999-03-16 International Business Machines Corporation Method and apparatus for a time-synchronous tree-based search strategy
US6157731A (en) * 1998-07-01 2000-12-05 Lucent Technologies Inc. Signature verification method using hidden markov models
DE10015858C2 (de) * 2000-03-30 2002-03-28 Gunthard Born Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen
DE10015859C2 (de) * 2000-03-30 2002-04-04 Gunthard Born Verfahren zu einer auf grammatische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen
US7050973B2 (en) * 2002-04-22 2006-05-23 Intel Corporation Speaker recognition using dynamic time warp template spotting
US8521529B2 (en) * 2004-10-18 2013-08-27 Creative Technology Ltd Method for segmenting audio signals
US7567903B1 (en) * 2005-01-12 2009-07-28 At&T Intellectual Property Ii, L.P. Low latency real-time vocal tract length normalization
US20080189109A1 (en) * 2007-02-05 2008-08-07 Microsoft Corporation Segmentation posterior based boundary point determination
JP5024154B2 (ja) * 2008-03-27 2012-09-12 富士通株式会社 関連付け装置、関連付け方法及びコンピュータプログラム
US9202520B1 (en) 2012-10-17 2015-12-01 Amazon Technologies, Inc. Systems and methods for determining content preferences based on vocal utterances and/or movement by a user

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5938599B2 (ja) * 1975-03-12 1984-09-18 日本電気株式会社 連続音声認識装置
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
JPS5938600B2 (ja) * 1975-10-31 1984-09-18 日本電気株式会社 レンゾクオンセイニンシキソウチ
GB1557286A (en) * 1975-10-31 1979-12-05 Nippon Electric Co Speech recognition
JPS592040B2 (ja) * 1976-08-24 1984-01-17 日本電信電話株式会社 音声認織装置
US4092493A (en) * 1976-11-30 1978-05-30 Bell Telephone Laboratories, Incorporated Speech recognition system
US4156868A (en) * 1977-05-05 1979-05-29 Bell Telephone Laboratories, Incorporated Syntactic word recognizer
JPS552205A (en) * 1978-06-20 1980-01-09 Kogyo Gijutsuin Real time continuous sound discriminator
US4349700A (en) * 1980-04-08 1982-09-14 Bell Telephone Laboratories, Incorporated Continuous speech recognition system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ICASSP 79 (1979 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2-4 avril 1974, Washington, USA), IEEE New York (US) *
IEEE TRANSACTIONS ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. ASSP-27, no. 6, décembre 1979, New York (US) *
IEEE TRANSACTIONS ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. ASSP-29, no. 2, avril 1981, New York (US) *
IEEE TRANSACTIONS ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. ASSP-29, no. 3, juin 1981, New York (US) *
IEEE TRANSACTIONS ON INFORMATION THEORY, vol. IT-21, no. 4, juillet 1975, New York (US) *

Also Published As

Publication number Publication date
GB2095882A (en) 1982-10-06
JPS57169800A (en) 1982-10-19
JPH0416800B2 (fr) 1992-03-25
US4400788A (en) 1983-08-23
DE3211313A1 (de) 1982-11-11
CA1167967A (fr) 1984-05-22
GB2095882B (en) 1985-06-19
FR2502822B1 (fr) 1985-02-08
DE3211313C2 (fr) 1988-06-16

Similar Documents

Publication Publication Date Title
FR2502822A1 (fr) Dispositif et procede de reconnaissance de la parole
FR2579357A1 (fr) Procede et dispositif d&#39;analyse de la parole par modele de markov cache
FR2534719A1 (fr) Analyseur de parole a modele de markov cache
FR2743238A1 (fr) Dispositif de telecommunication reagissant a des ordres vocaux et procede d&#39;utilisation de celui-ci
FR2490369A1 (fr) Procede et circuit de reconnaissance d&#39;une chaine de caracteres
FR2520913A1 (fr) Procede et appareil de reconnaissance de mots-cles dans des paroles
FR2520912A1 (fr) Procede et appareil de reconnaissance de parole continue
FR2731548A1 (fr) Recherche profondeur d&#39;abord dans un repertoire algebrique pour un encodage rapide de la paroie
AU2003246894B2 (en) Speech dialogue systems with repair facility
BE898134A (fr) Equipement de traitement de donn es et syst&amp;me de reconnaissance de parole l&#39;utilisant.
EP1159737B9 (fr) Reconnaissance du locuteur
FR2520911A1 (fr) Procede et appareil d&#39;analyse pour la reconnaissance de parole
FR2744277A1 (fr) Procede de reconnaissance vocale en ambiance bruitee, et dispositif de mise en oeuvre
FR2544933A1 (fr) Procede et dispositif de reglage du coefficient d&#39;amplification d&#39;un amplificateur
EP0118484B1 (fr) Dispositif de reconnaissance de mot a coefficient de prediction lineaire (lpc) utilisant des caracteristiques d&#39;energie
EP0018861A1 (fr) Procédé et dispositif de saisie sous forme numérique d&#39;une information vidéo représentative d&#39;un produit en feuille
US4370521A (en) Endpoint detector
CN108831459A (zh) 语音识别方法及装置
FR2526199A1 (fr) Procede et dispositif d&#39;alignement temporel de signaux de parole
Barnard et al. Real-world speech recognition with neural networks
CN115472174A (zh) 声音降噪方法和装置、电子设备和存储介质
FR2554267A1 (fr) Appareil commande par la parole
CN116403564B (zh) 一种音频编辑方法及装置、电子设备及存储介质
CN111768764B (zh) 语音数据处理方法、装置、电子设备及介质
EP1741092B1 (fr) Reconnaissance vocale par modelisation contextuelle d&#39;unites vocales