FR2520539A1 - Procede et systeme de traitement des silences dans un signal de parole - Google Patents

Procede et systeme de traitement des silences dans un signal de parole Download PDF

Info

Publication number
FR2520539A1
FR2520539A1 FR8300907A FR8300907A FR2520539A1 FR 2520539 A1 FR2520539 A1 FR 2520539A1 FR 8300907 A FR8300907 A FR 8300907A FR 8300907 A FR8300907 A FR 8300907A FR 2520539 A1 FR2520539 A1 FR 2520539A1
Authority
FR
France
Prior art keywords
signal
silence
adaptive
threshold
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8300907A
Other languages
English (en)
Other versions
FR2520539B1 (fr
Inventor
James Loton Flanagan
James David Johnston
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of FR2520539A1 publication Critical patent/FR2520539A1/fr
Application granted granted Critical
Publication of FR2520539B1 publication Critical patent/FR2520539B1/fr
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/06Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
    • H04B14/066Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
    • H04B14/068Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

L'INVENTION CONCERNE LE TRAITEMENT DE LA PAROLE. UN SYSTEME DE TRAITEMENT DE LA PAROLE CONVERTIT UN CONFIGURATION DE PAROLE EN UNE SEQUENCE DE CODES NUMERIQUES ADAPTATIFS AU MOYEN D'UN CODEUR 110. UN DETECTEUR DE SILENCE 115 GENERE UN CODE NUMERIQUE REPRESENTATIF DE CHAQUE INTERVALLE DE SILENCE. UN CIRCUIT DE TRAITEMENT DE CODE 125 COMBINE LES CODES NUMERIQUES ADAPTATIFS ET LES CODES D'INTERVALLES DE SILENCE POUR FORMER UN SIGNAL CODE DE FACON NUMERIQUE QUI EST REPRESENTATIF DE LA CONFIGURATION DE PAROLE D'ENTREE ET DANS LEQUEL LES INTERVALLES DE SILENCE SONT REPRESENTES PAR UN CODE PARTICULIER SUIVI D'UN NOMBRE QUI INDIQUE LA DUREE DE CHAQUE INTERVALLE DE SILENCE. APPLICATION A LA COMPRESSION DE L'INFORMATION VOCALE.

Description

i La présente invention concerne le traitement de la
parole et elle porte plus particulièrement sur des disposi-
tifs de codage de signal de parole.
Comme il est bien connu, la parole normale contient des intervalles de silence qui font partie de l'information qui est transmise Des périodes de silence apparaissent entre
des phrases, des membres de phrases, des mots et à l'inté-
rieur des mots L'auditeur accepte normalement les inter-
valles de silence comme des attributs naturels de la parole.
Le silence représente cependant une partie importante de la configuration de parole Lorsqu'un signal de parole est codé pour être transmis sur une voie de télécommunication ou pour
être enregistré en mémoire, les séquences de code correspon-
dant au silence occupent des segments du signal codé qui peuvent être éliminés ou utilisés dans d'autres buts Il est
évidemment nécessaire de reproduire les intervalles de silen-
ce à leurs emplacements corrects dans la configuration de parole pour que le message soit compréhensible On peut cependant simplifier le codage du silence de façon à rendre plus compact le signal numérique enregistré ou transmis De
cette manière, on augmente l'efficacité du système de télé-
communication. Il existe de nombreuses techniques pour le codage
numérique de signaux de parole On peut employer la modula-
tion par impulsions et codage pour convertir directement sous
forme binaire la parole échantillonnée Le processus de con-
version comprend la quantification de chaque échantillon de parole en un niveau parmi un ensemble de niveaux discrets et
le codage du niveau quantifié sélectionné Des formes adapta-
tives de modulation par impulsions, dans lesquelles la quanti-
fication des échantillons de signal de parole est adaptée au
niveau du signal d'entrée, procurent de meilleures performan-
ces avec moins de bits par échantillon numérique Dans de tels dispositifs adaptatifs, on fait varier la taille de pas dans le quantificateur de façon à l'adapter aux caractéristiques statistiques du signal d'entrée Les systèmes de modulation par impulsions de type différentiel codent la différence
entre des échantillons d'entrée et non les échantillons eux-
mêmes, pour améliorer l'efficacité du codage Cependant, ces dispositifs de codage ne font pas une distinction précise
entre les parties actives et inactives du signal d'entrée.
Par conséquent, les périodes de silence dans le signal affec-
tent défavorablement l'efficacité de la transmission de l'in- formation. Le brevet U S 4 280 192 décrit un dispositif pour minimiser l'espace nécessaire à l'enregistrement numérique
d'une information analogique, dans lequel un signal analogi-
que d'entrée tel que de la parole est converti en un train de codes en modulation delta avec une pente variable de façon continue (modulation delta adaptative) Un interrupteur à commande vocale détecte le début d'un intervalle de pause lorsque le signal analogique tombe au-dessous d'un niveau prédéterminé La durée de la pause est mesurée par un compteur qui est arrêté lorsque le signal de parole s'élève au-dessus d'un niveau prédéterminé Un code de pause spécial comprenant une information de durée est alors intercalé dans le train de codes numériques L'interrupteur à commande vocale et le dispositif de mesure de durée suppriment les
codes répétitifs des intervalles de pause du signal analogi-
que. Comme il est bien connu dans la technique, les interrupteurs à commande vocale sont conçus pour fonctionner à une cadence faible, afin d'éviter une amputation des syllabes et ils comprennent un dispositif qui bloque la détection d'intervalles de silence courts Par conséquent, le système du brevet U S 4 280 192 utilise un retard de compensation pour faciliter l'insertion de codes de pause à
leurs emplacements corrects dans le train de données Cepen-
dant, le retard inhérent à l'interrupteur à commande vocale rend difficile la détection de périodes de silence courtes qui apparaissent à une cadence supérieure à la cadence de mots. Le brevet U S 4 053 712 décrit un codeur/décodeur numérique adaptatif dans lequel des configurations de bits codées spéciales sont substituées à des configurations de repos dans un train de bits de sortie en modulation delta avec une pente variable de façon continue, afin de réduire
le débit binaire global On effectue la détection des confi-
gurations de repos en convertissant en un signal analogique
le signal de sortie en modulation delta avec une pente varia-
ble de façon continue, et en comparant le signal analogique à des seuils d'amplitude fixes La régénération du signal de
parole analogique pour détecter les silences exige un déco-
deur supplémentaire qui augmente le coût du codage Bien que du fait de l'utilisation de seuils d'amplitude directs, le
dispositif soit relativement exempt de restrictions de caden-
ce dans la détection des silences, il présente une sensibili-
té accrue au bruit Il en résulte qu'il est difficile de dis-
tinguer les fricatives et le silence, et le dispositif est
davantage susceptible de produire une amputation de la paro-
le Un but de l'invention est de procurer un codage numérique
perfectionné capable d'éliminer économiquement les inter-
valles de silence, sans restriction de cadence.
Les problèmes des techniques d'élimination de silence de l'art antérieur sont résolus, conformément à l'invention, par l'utilisation de signaux liés à la taille
de pas, qui sont déjà générés dans des techniques de modula-
tion par impulsions de type adaptatif, pour détecter des intervalles de silence Ces signaux liés à la taille de pas sont représentatifs de l'énergie contenue dans le signal de
parole appliqué mais ils ne sont pas affectés par les méca-
nismes de retard présents dans les interrupteurs à commande
vocale Il en résulte que le traitement des signaux analogi-
ques est éliminé, la détection des intervalles de silence
n'est pas limitée à des cadences prédéterminées, et des dis-
positifs destinés à positionner correctement les codes d'in-
tervalle de silence deviennent inutiles.
L'invention porte sur un dispositif de traitement
de parole dans lequel une configuration de parole est conver-
tie en une séquence de codes numériques adaptatifs On détec-
te les intervalles de silence dans la configuration de parole
et on génère un code numérique représentatif de chaque inter-
valle de silence On combine les codes numériques adaptatifs et les codes d'intervalle de silence pour former un signal numérique représentatif de la configuration de parole La conversion de la configuration de parole en codes numériques adaptatifs comprend la formation d'un signal correspondant à la taille de pas adaptative pour chaque code numérique On génère des premier et second signaux de seuil La détection des intervalles de silence comprend la génération d'un signal d'intervalle de silence lorsque le signal correspondant à la taille de pas adaptative descend au-dessous du premier seuil, et la terminaison du signal d'intervalle de silence lorsque le signal lié à la taille de pas adaptative s'élève au-dessus
du second seuil pendant un intervalle de silence.
L'invention sera mieux comprise à la lecture de la
description qui va suivre d'un mode de réalisation et en se
référant aux dessins annexés sur lesquels: La figure 1 représente un schéma synoptique d'un circuit de transmission vocale numérique qui constitue un exemple d'application de l'invention
La figure 2 représente un schéma synoptique détail-
lé d'un codeur adaptatif utilisable dans le circuit de la figure 1;
La figure 3 représente un schéma synoptique détail-
lé d'un détecteur de silence utilisable dans le circuit de la figure 1;
La figure 4 représente un schéma synoptique détail-
lé d'un générateur de seuil adaptatif utilisable dans le cir-
cuit de la figure 1;
La figure 5 représente un schéma synoptique détail-
lé d'un dispositif compteur de silence utilisable dans le cir-
cuit de la figure 1;
La figure 6 représente un schéma synoptique détail-
lé d'un circuit modificateur de code utilisable dans le cir-
cuit de la figure 1 Les figures 7 et 10 montrent des organigrammes qui illustrent le fonctionnement du circuit de la figure 1; Les figures 8 et 11 montrent des organigrammes qui illustrent le fonctionnement du circuit de la figure 1; et
La figure 9 représente un schéma synoptique détail-
lé d'un dispositif détecteur et compteur de code de silence
utilisable dans le circuit de la figure 1.
La figure 1 représente un dispositif de transmis-
sion vocale numérique qui constitue un exemple d'application de l'invention Sur la figure 1, une configuration de parole est appliquée au microphone 101 et le signal de parole obte- nu par ce dernier est appliqué au circuit 103 consistant en un filtre passe-bas et un échantillonneur Comme il est bien connu dans la technique, le circuit 103 effectue un filtrage passe-bas du signal de parole appliqué et il échantillonne le signal filtré à une cadence prédéterminée qui est définie par le générateur d'horloge 107 La fréquence de coupure du filtre passe-bas peut être par exemple de 3,2 k Hz et la cadence d'échantillonnage peut être par exemple de 8 k Hz La séquence d'échantillons de parole provenant du circuit 103
est représentative de la forme du signal de parole.
Le convertisseur analogique-numérique 105 reçoit
les échantillons de parole successifs qui proviennent du cir-
cuit 103 et il convertit chaque échantillon de parole en un signal codé de façon numérique ayant une valeur qui correspond à l'amplitude de l'échantillon de parole Les signaux codés numériques qui proviennent du convertisseur 105 sont appliqués à l'entrée du codeur adaptatif 110 Comme il est bien connu dans la technique, un codeur adaptatif transforme un signal numérique provenant du convertisseur 105 en un signal codé plus efficacement qui présente de meilleures caractéristiques
de rapport signal à bruit.
Le schéma logique de la figure 2 montre un type de codeur adaptatif qui peut être utilisé dans le circuit de la figure 1 La figure 2 représente un codeur en modulation par impulsions et codage de type différentiel adaptatif Il faut noter qu'on peut utiliser d'autres formes de modulateurs à code adaptatif Dans la modulation par impulsions et codage
de type différentiel, on quantifie et on code pour la trans-
mission la différence entre chaque échantillon xn et une pré-
diction de cet échantillon (x n), basée sur des échantillons
passés En utilisant un certain nombre de niveaux de quanti-
ficateur, on obtient une approximation en escalier du signal de parole Dans le codage différentiel, on supprime du signal une redondance suffisante pour obtenir une diminution du débit binaire de deux bits par échantillon par rapport au
codage MIC classique.
De façon générale, le codage différentiel utilise une taille de pas de quantificateur fixe Une configuration adaptative comprend un dispositif qui contrôle le signal de sortie numérique du codeur La taille de pas effective du quantificateur est modifiée sous la dépendance de la valeur des signaux de différence à la sortie De cette manière, on
optimise la quantification du signal d'entrée.
En considérant la figure 2, on voit que la séquen-
ce de signaux numériques xn provenant du circuit convertis-
seur analogique-numérique 105 est appliquée à une entrée d'un additionneur 201 L'autre entrée de l'additionneur reçoit une estimation prédite du signal numérique courant xn, qui est basée sur la séquence de signaux précédents Xni 1 ' Xnn 2 ' La différence entre le signal courant xn et le signal prédit xn apparaît à la sortie de l'additionneur
201 et elle est appliquée au quantificateur 203 Le quantifi-
cateur compare le signal de différence provenant de l'addi-
tionneur 201 à un ensemble déterminé de niveaux de quantifi-
cateur, et il produit un signal qui correspond au niveau de
quantificateur qui est le plus proche Le signal de diffé-
rence quantifié qui appara t à la sortie du quantificateur 203 est appliqué au codeur 207 qui est conçu de façon à
former un code numérique Cn correspondant au niveau de quan-
tificateur appliqué.
Le signal de sortie du codeur 207 est une séquence de codes numériques représentant la différence quantifiée entre les échantillons de signal de parole et les valeurs
prédites de ceux-ci Le signal de différence quantifié pré-
sent à la sortie du quantificateur 203 est également appli-
qué à une entrée de l'additionneur 209, dans lequel il est sommé avec la valeur d'échantillon prédite qui provient du prédicteur 205 Le signal de somme provenant du circuit
additionneur 209 est appliqué à l'entrée du prédicteur 205.
Par conséquent, le signal de sortie du prédicteur est mis à jour de façon à être représentatif de la valeur prédite du
signal d'échantillon de parole suivant, xn+ 1.
Le circuit générateur de taille de pas 210 reçoit les codes de sortie du codeur C et, sous la dépendance de n ces derniers, il fournit un signal de taille de pas à N pour régler les niveaux dans le quantificateur 203 conformément à l'amplitude relative de Cn Lorsque Cn est grand, le signal
de taille de pas N dilate les tailles de pas dans le quan-
n tificateur 203, grâce à quoi le quantificateur s'adapte au
signal d'amplitude élevée Des valeurs faibles de Cn contrac-
tentlestailles de pas du quantificateur, afin de s'adapter
aux signaux de faible amplitude De cette manière, le quan-
tificateur est adapté au niveau attendu du signal d'entrée.
La construction et l'utilisation de codeurs adaptatifs et différentiels sont envisagées dans le livre intitulé Digital Processing of Speech Signals par L R Rabiner et R W. Schafer édité par Prentice Hall, Inc, Englewood Cliffs, New Jersey, et dont les droits d'auteur sont détenus par les
Bell Telephone Laboratories, Incorporated, 1978.
Selon une variante, le codeur adaptatif 110 peut comprendre un microprocesseur tel que celui du type 68000 de la firme Motorola, décrit dans le document MC 68000 Design
Module User's Guide, Motorola, Inc, 1980, fonctionnant con-
formément à un ensemble d'instructions prédéterminé qui est enregistré dans une mémoire morte L'annexe A donne la liste en langage FORTRAN des instructions enregistrées de façon permanente qui sont nécessaires pour coder en MIC de type
adaptatif et différentiel les signaux provenant du conver-
tisseur analogique-numérique 105.
Le générateur de taille de pas 210 de la figure 2 fonctionne conformément à la relation: dn = Pdn-1 + m Cn () pour former un signal dn correspondant au logarithme de la taille de pas, sous la dépendance du dernier signal de sortie
du codeur 207 (Cn) P est une constante liée à la dissi-
pation des erreurs et est par exemple:
= 1-2-6 ( 2)
dn-1 est le signal de taille de pas logarithmique précédent et m est un facteur multiplicatif destiné au réglage de la valeur de la taille de pas, qui est lié à la dynamique
prévue pour le signal et au nombre de niveaux du quantifica-
teur. Sur la figure 2, le signal codé numérique Cn est
appliqué à l'entrée d'adresse du générateur de facteur mul-
tiplicateur 211 qui peut consister en une mémoire morte pro-
grammable, bien connue dans la technique, qui est conçue de façon à fournir un signal de sortie défini à l'avance, m Cn, pour chaque signal d'entrée de code numérique Cn qui est
appliqué sur ses entrées d'adresse m est donné par la rela-
tion: m = log QM ( 3) dans laquelle: M = 0,85 pour les 4 plus bas niveaux M = 1,2 pour les niveaux 5 et 6 M = 1,6 pour le niveau 7 M = 2,4 pour le niveau 8 et Q = Dl/S D est la dynamique du signal d'entrée xn et S est le nombre
de tailles de pas.
Le registre de retard 215 conserve le signal de taille de pas logarithmique précédent dn 1 Sous l'effet du signal d'horloge CLT provenant du générateur d'horloge 107
pour le signal d'entrée de rang n, le signal dn-1 est appli-
qué au circuit de décalage 217 et à une entrée du soustrac-
teur 219 Le circuit de décalage 217 décale le signal codé dn-1 de six rangs vers la droite pour former le signal 2 d et il peut consister en un câblage conçu de façon
à réaffecter les bits du signal codé.
Le soustracteur 219 reçoit le signal dnî 1 prove-
nant du registre 215 et le signal 2 6 dn provenant du cir-
cuit de décalage 217, et il produit le signal de différence ( 1-2 6) dn 1 Le signal de sortie du soustracteur 219 est sommé dans l'additionneur 212 avec les signaux m Cn, et le signal résultant dn est placé dans le registre 215 par l'impulsion d'horloge CLT Le signal dn présent dans le registre 215 est représentatif du logarithme de la taille de
pas du codeur, à ny qui est appliquée au quantificateur 203.
Pour former le signal àn, le code numérique dn est appliqué aux entrées d'adresse du circuit de formation de signal de taille de pas 221 Le circuit de formation 221 est une mémoire morte programmable dans laquelle est enregistrée une table de correspondance entre dn et An Pour chaque signal d'entrée d'adresse dn, le signal de taille de pas à n
correspondant est appliqué sur les sorties de la mémoire mor-
te programmable.
Le signal de taille de pas logarithmique dn est représentatif de l'énergie de la séquence d'échantillons de
parole xn et on peut l'utiliser pour déterminer les inter-
valles de silence dans le signal de parole Contrairement aux interrupteurs à commande vocale et à d'autres détecteurs de signal de présence de parole, le signal de taille de pas logarithmique change à des cadences très supérieures aux cadences syllabiques sans introduire de bruit ou d'amputation de la parole dans le signal de parole codé résultant Par conséquent, la détection d'intervalles de silence sous la
dépendance de changements du signal de taille de pas loga-
rithmique est effectuée conformément à l'invention pratique-
ment sans restriction de cadence.
La détection de silence est effectuée dans le détecteur de silence 115 qui est représenté de façon plus détaillée sur la figure 3 En considérant la figure 3, on voit que le signal dn qui provient du codeur adaptatif 110 est appliqué à l'entrée a du comparateur de valeur 301 et à l'entrée c du comparateur de valeur 305 Le comparateur 305 est validé lorsque le signal dn tombe au-dessous du signal
de niveau de seuil TH 1 Le signal de sortie validé du compa-
rateur 305 positionne la bascule 320 par l'intermédiaire de la porte OU 315 Lorsque la bascule 320 est validée, elle fournit un signal SF valide qui indique qu'un intervalle de silence a commencé Le signal SF valide la porte ET 310 à
laquelle est appliqué le signal de sortie du comparateur 301.
Le signal de seuil TH 2 appliqué à l'entrée B du comparateur 301 correspond au niveau de début de la parole Lorsque le signal dn dépasse le signal de seuil TH 2, le ccmparateur 301 est validé La bascule 320 n'est validée par l'intermédiaire de la porte ET 310 et de la porte OU 315 que si le signal de taille de pas logarithmique dn s'élève au-dessus du seuil
TH 2 pendant un intervalle de silence.
Les signaux de seuil TH 1 et TH 2 peuvent être des niveaux de tension fixes si la dynamique du signal de parole d'entrée est fixée par un compresseur de signal qui est branché entre le microphone 101 et le circuit de filtre et d'échantillonneur 103 sur la figure 1 Cependant, une telle technique de compression modifie le signal de parole, ce qui fait que les caractéristiques de la voix du locuteur cessent
d'être naturelles Par conséquent, la configuration de paro-
le régénérée peut ne pas avoir la même sonorité que la parole
du locuteur Conformément à l'invention, on élimine le com-
presseur de signal de parole employé normalement, grâce à l'utilisation du générateur de seuil adaptatif 112 de la figure 1 Le générateur de seuil adaptatif modifie les signaux de seuil TH 1 et TH 2 sous l'effet du signal de taille de pas logarithmique, grâce à quoi les caractéristiques de
la voix du locuteur ne sont pas modifiées par le dispositif.
nécessaire pour l'élimination des silences.
Le générateur de seuil adaptatif 112 est représen-
té de façon plus détaillée sur la figure 4 En considérant
la figure 4, on note que le générateur de niveaux 401 pro-
duit un signal de limite fixé à l'avance, L, qui correspond au plus petit signal de taille de pas logarithmique prévu correspondant à un signal d'entrée de parole actif pour le circuit de la figure 1, et des signaux fixés à l'avance HW 1 et HW 2 correspondant à la différence attendue normalement entre dmax et les valeurs de seuil de silence dmax est en général le maximum de la séquence de signaux dn provenant
du codeur adaptatif 110 Le registre 427 est positionné ini-
tialement à L et il enregistre le maximum des signaux de taille de pas logarithmiques jusqu'à l'échantillon xn- 11 Le signal dmax provenant du registre 427 est comparé au signal
de taille de pas logarithmique courant dn dans le compara-
teur de valeur 403 Le comparateur est validé'si dn est
supérieur à d max Le signal de validation provenant du com-
parateur 403 provoque l'ouverture de l'élément de commuta-
tion à trois états 409 et la fermeture de l'élément de com-
mutation à trois états 405, ce qui fait que le dn supérieur à d Max est appliqué à l'entrée a du soustracteur 415 et au circuit de décalage 412 Dans le cas o le signal dmax est supérieur au signal dn 2 le comparateur 403 demeure invalidé
et le signal d Max provenant du registre 427 traverse l'élé-
ment de commutation à trois états 409 et il est appliqué à l'entrée a du soustracteur 415 et à l'entrée du circuit de
décalage 412.
Le circuit de décalage 412 décale de dix rangs vers la droite le signal d'entrée qui lui est appliqué, et le soustractreur 415 applique le signal d ( 1-2) max à l'entrée b du comparateur 418 et à l'entrée de l'élément de commutation à trois états 425 Le comparateur 418 est validé si le signal de limite L qui lui est appliqué est supérieur au signal de sortie du soustracteur 415 Dans ce cas, l'élément de commutation à trois états 420 est passant et le signal de limite L est placé dans le registre 427 Si le signal de sortie du soustracteur 415 est inférieur au
signal de limite L, le comparateur 418 demeure invalidé.
L'élément de commutation à trois états 425 est passant et le registre 427 reçoit le signal maximal parmi les signaux de taille de pas logarithmiques, jusqu'au signal de taille
de pas logarithmique dn, ce dernier inclus.
Le signal d Max provenant du registre 427 est
appliqué au soustracteur 430 qui forme le signal d Max-H Wl.
Ce niveau de seuil est modifié conformément a 2 gna JldetîL 2 eee pas logarithmique maximal dmax, pour faire varier le seuil de silence de façon adaptative Le soustracteur 440 forme le signal TH 2 = dmax HW 2, et le seuil de début de parole est modifié de façon adaptative sous la dépendance du signal de taille de pas logarithmique maximal De cette manière, les intervalles de silence de n'importe quel signal de parole sont détectés sans modifier les caractéristiques vocales du locuteur. Le signal de sortie SF du détecteur de silence 115 est appliqué au compteur de silence 120, représenté de façon plus détaillée sur la figure 5 En considérant la figure 5,
on voit que le signal SF est appliqué à une entrée de la por-
te ET 505 et à l'entrée de l'inverseur 507 Pendant la parole normale, le signal SF est invalidé et le signal de sortie de l'inverseur 507 prépositionne le compteur 510 à son état zéro Lorsqu'un intervalle de silence commence, le signal SF est validé et les signaux d'horloge de code CLT traversent la porte ET 505 en direction de l'entrée du compteur 510 Le compteur 510 est incrémenté jusqu'à la détection de la fin de l'intervalle de silence Le réseau de bascules 515 est validé à la fin de l'intervalle de silence, grâce à quoi le compte d'intervalle de silence est transféré du compteur 510 vers le réseau de bascules Le compte de silence SCT provenant du réseau de bascules 515 est appliqué à une entrée du circuit de traitement de code 125 qui reçoit également les codes Cn qui sont générés dans le codeur adaptatif 110 et le
signal SF qui provient du détecteur 115.
Le circuit de traitement de code 125 est conçu de façon à former un message constitué par la combinaison des codes de sortie Cn et des codes d'intervalles de silence, et à appliquer le message au réseau de télécommunication 140 de
la manière exigée Le circuit de traitement 125 peut consis-
ter en un microprocesseur tel que celui du type 68000 de la firme Mototola, décrit dans la brochure MC 68000 Design Module User's Guide, Motorola, Inc, 1980, précitée Le circuit de traitement 125 élabore des combinaisons de code conformément à un ensemble d'instructions fixe qui est enregistré dans une mémoire morte Ces instructions sont indiquées en langage FORTRAN à l'annexe B. Les intervalles de silence qui sont supprimés dans le signal de parole sont représentés par un code de silence
spécial SC suivi par le signal de compte de silence SCT pro-
venant du compteur de silence 120 Dans le circuit de la figu-
re 1, on sélectionne pour le code de silence le signal de sortie d'excursion maximale du codeur adaptatif Pour une configuration de code MIC de type adaptatif et différentiel
à quatre bits, la combinaison d'excursion maximale est 8716.
On sélectionne ce code du fait de sa faible probabilité
d'apparition Pour éviter une détection erronée d'inter-
valles de silence, on doit changer le code d'excursion maxi-
male qui apparaît dans C Le circuit modificateur de code de la figure 1 remplace la combinaison de code 87 par une
combinaison 9616 pour minimiser la distorsion du signal.
Le circuit modificateur de code est représenté de
façon plus détaillée sur la figure 6 En considérant la figu-
re 6, on voit que le signal de sortie du codeur adaptatif 110
est appliqué au registre 610 à chaque impulsion d'horloge CLT.
Le code Cn dans le registre 610 est normalement transféré à son tour vers le registre 625 par l'élément de commutation à
trois états 615, et le code Cn-1 qui se trouve dans le regis-
tre 625 apparaît à la sortie de l'élément de commutation à trois états 601 Les signaux de sortie des registres 610 et 625 représentant la paire de signaux courants du codeur sont
comparés dans le comparateur 635 à la combinaison codée 8716.
Ces codes sont fournis par le générateur de signal 632, comme
il est bien connu dans la technique Sous l'effet de la détec-
tion d'une séquence 8716 dans les registres 610 et 625, le signal de sortie du comparateur 635 est validé et le signal de sortie de l'inverseur637 est invalidé Sous l'effet du signal invalidé CC', les éléments de commutation à trois états 601 et 615 sont invalidés, tandis que les éléments de commutation à trois états 605 et 620 sont validés par le signal CC Le signal 916 qui provient du générateur 632 est
ainsi introduit dans le registre 625 et le signal 616 prove-
nant du générateur 632 est introduit dans le train de données par l'intermédiaire de l'élément de commutation à trois états 605 Le signal de sortie du modificateur de code 130 est
ainsi modifié de la manière exigée.
L'organigramme de la figure 7 illustre la séquence des opérations accomplies dans le circuit de la figure 1, et les signaux représentés sur la figure 8 illustrent les signaux et les codes à divers points dans le circuit de la figure 1 Avant la réception d'un signal de parole par le microphone 101, le compteur de silence 120 est restauré à
son état zéro Le signal SF provenant du détecteur de silen-
ce 115 est invalidé, et le signal de taille de pas loga- rithmique maximal enregistré dmax, dans le générateur de seuil 112, est fixé à zéro Ces opérations sont indiquées
dans la case d'index 701 Le signal de parole qui est indi-
qué entre les instants t et t sur le signal 801 ne corres-
0 i pond pas à un intervalle de silence Par conséquent, le signal de taille de pas logarithmique dn qui résulte du signal de parole (indiqué dans le signal 805) est supérieur au signal de seuil TH 1 du signal 809 Le signal d'indicateur
de silence SF provenant du détecteur de silence 115 est res-
-15 tauré, et les codes de sortie Cn sont appliqués au circuit de traitement de code 125 par l'intermédiaire du circuit
modificateur de code 130 Ces codes Ci, C 29 Cn correspon-
dent à la parole normale et ils sont indiqués dans le signal 813. En considérant la figure 7, on sort de la case d'attente 708 lorsqu'apparaît chaque impulsion d'horloge de code CLT Lorsqu'apparait l'impulsion d'horloge de code CLT, le codeur adaptatif 110 forme le signal de sortie de codeur adaptatif suivant, Cn, ce qui correspond à la case 710 Le signal de taille de pas logarithmique dn et le signal de taille de pas A N sont formés dans le codeur adaptatif à la case 712 et le signal dn est comparé au signal dmax dans le générateur de seuil adaptatif 112, à la case de décision 715 Dans le cas o le signal de taille de pas logarithmique dn est supérieur à dmax le signal dmax est remplacé par le
signal dn courant (case 718).
Le signal dn est ensuite testé dans le détecteur de silence 115 pour déterminer s'il est inférieur ou égal au signal de seuil inférieur qui provient du générateur de seuil 112 (case de décision 720) Entre les instants t et t 1 sur la figure 8, le signal de taille de pas logarithmique (signal 805 >-est supérieur au signal de seuil adaptatif TH 1 (signal 809), et en passe à la case de décision 723 pour déterminer
si le signal d'indicateur de silence SF a été positionné.
Du fait que le signal SF n'est pas validé entre t et ti, on passe à la case 725 pour chaque impulsion d'horloge CLT dans cet intervalle Le signal codé courant C est testé dans le modificateur de code 130, pour déterminer s'il est égal au code de silence SC, et ceci est effectué dans la case de décision 725 Dans le cas o le signal codé Cn est égal au code de silence réservé SC, Cn est changé dans la logique
de modificateur du circuit 130 (case 729) Dans le cas con-
traire, le code Cn non modifié est placé dans le circuit de
traitement de code 125 pour transmission ou enregistrement.
Lorsque l'instant t 1 est atteint, le fonctionne-
ment du codeur est changé Les signaux codés Cn, dn et A n
* sont générés aux cases 710 et 712 et le signal dn est compa-
ré au signal dmax enregistré dans le circuit de seuil adap-
tatif 112 (case de décision 715) Cependant, le signal dn à l'instant t 1 est inférieur au signal de seuil adaptatif TH 1,
ce qui fait qu'on passe à la case de positionnement d'indi-
cateur de silence 735, par l'intermédiaire de la case de décision 720 Le signal SF est validé dans le détecteur de silence 115, et le compteur de silence 120 est incrémenté à la case 738 On passe ensuite à la case d'attente 708 pour détecter l'impulsion d'horloge CL pour le code de signal de
parole suivant.
Entre les instants t 1 et t 2, le signal de taille de pas logaritmique d est inférieur au signal de seuil n TH 2 Par conséquent, on passe à la case d'augmentation du compteur de silence, 738, par l'intermédiaire de la case de positionnement d'indicateur de silence 735 ou des cases de décision 723 et 740, ce qui fait que l'intervalle de silence continue d'être mesuré, conformément à la case 738 Lorsque
l'instant t 2 est atteint, le signal de taille de pas loga-
rithmique dn dépasse le seuil de début de parole TH 2, à la case de décision 740 On passe à la case de restauration d'indicateur de silence 742 par le chemin qui comprend les cases de décision 720, 723 et 740 Le signal d'intervalle de silence SF présent dans le détecteur 115 est restauré pour mettre fin à l'intervalle de silence Les signaux d'en-tête de silence (SC= 87) et le signal de compte de silence (SCT) sont formés dans le circuit de traitement de code 125 (case 744) sous l'effet de la restauration du signal SF Le compteur de silence est ensuite remis à zéro à la case 746 Le code C courant est placé dans le circuit de traite- n ment de code 125 après le test du code de silence et la séquence de modification des cases 725 et 729 dans le circuit
modificateur de code 130.
Le code de silence SC et le compte de silence SCT sont placés dans le train de données qui est enregistré dans le circuit de traitement de code 125, comme il est indiqué dans le signal 813 entre les instants t 2 et t 3 * Ensuite, les
codes Cn provenant du modificateur de code 130 sont addi-
tionnés au train de données puisqe aucun intervalle de silen-
ce supplémentaire n'est détecté Les codes du train de données présent dans le circuit de traitement 125, comprenant
les codes de silence et de compte de silence, sont représen-
tés dans le signal 815.
Le circuit de la figure 1 peut consister en un système d'enregistrement vocal dans lequel le réseau 140 est un circuit de traitement numérique conçu pour enregistrer les codes avec modification des silences qui proviennent du circuit de traitement de code 125 Sous l'effet du signal de parole représenté en 801, la séquence de codes numériques représentée en 815 est placée dans le circuit de traitement
du réseau 140 Comme il est indiqué dans le signal 815, l'in-
tervalle de silence entre les instants t 1 et t 2 est remplacé par le code de silence SC suivi par le compte de silence SCT De cette manière, la capacité de mémoire exigée du
réseau 140 est notablement réduite.
Les codes numériques provenant du réseau 140 sont appliqués au décodeur 150 qui forme une version reproduite
de la configuration de parole appliquée à l'origine au micro-
phone 101 et comprenant les intervalles de silence Dans le décodeur 150, les signaux codés numériques adaptatifs sont appliqués à l'entrée du détecteur et compteur de codes de silence 152 et du circuit sélecteur 160, par l'intermédiaire du registre à décalage premier entré-premier sorti, 151 Le
registre à décalage 151 fonctionne sous la dépendance d'im-
pulsions d'horloge CLR provenant du générateur 153 de façon
à appliquer la séquence de signaux numériques codés au détec-
teur 152 et au sélecteur 160 Le sélecteur 160 transmet nor-
malement directement les codes Cn au décodeur adaptatif 165, pour la conversion en échantillons de parole Le décodeur 165 peut consister en un décodeur MIC différentiel et adaptatif du type décrit dans l'article intitulé "Adaptive Differential Pulse Code Modulation Coding" par J R Boddie et col paru
dans le Bell System Technical Journal, Vol 60, N O 7, septem-
bre 1981 Selon une variante, il peut consister en un micro-
processeur tel que le microprocesseur précité du type 68000
de la firme Motorola, fonctionnant conformément aux instruc-
tions enregistrées dans une mémoire morte L'annexe C donne la liste, en langage FORTRAN,des instructions enregistrées de façon permanente qui sont nécessaires pour décoder les signaux codés MIC de type différentiel et adaptatif Sous l'effet de la détection d'un code de silence dans le circuit décodeur 152, le sélecteur 160 connecte le générateur de code 155 au décodeur adaptatif 165 Le générateur 155 produit des codes Cn équivalents au silence pendant l'intervalle de temps qui est défini dans le code de compte de silence SCT La durée de l'intervalle de silence est mesurée dans le compteur de silence 152 De cette manière, les intervalles de silence sont réintroduits dans le train de codes La séquence de signaux échantillonnés provenant du décodeur adaptatif 165 correspond au signal de parole codé à l'origine, contenant des intervalles de silence Le signal de parole échantillonné
est converti sous forme analogique par le convertisseur numé-
rique-analogique 170 et le filtre passe-bas 175, et le trans-
ducteur 180 génère la configuration de parole.
Le circuit détecteur et compteur de codes de silence 152 est représenté de façon plus détaillée sur la figure 9 En considérant la figure 9, on note que la séquence de signaux
codés de façon adaptative, provenant du réseau 140, est appli-
quée à l'entrée du registre à décalage à plusieurs étages 905.
Les codes provenant du registre 905 sont appliqués aux entrées du comparateur 915 dans lequel ils sont comparés aux codes de
silence 8716 qui sont générés dans le générateur de code 920.
Le comparateur 915 est validé sous l'effet de la détection d'un code 8716 en sortie du registre à décalage 905 Le signal SL validé provenant du comparateur 915 valide la porte ET 930, de façon que le compteur 940 soit prépositionné au code de compte de silence présent sur la ligne 927 Le signal
SL validé positionne la bascule 925 et le signal SL 1 prcve-
nant de cette bascule déconnecte la ligne 181 par rapport à l'entrée du décodeur adaptatif 165 et connecte le générateur de code de silence 155 à l'entrée du décodeur adaptatif Le signal SL 1 invalide également la porte ET 156, de façon que le registre à décalage premier entré-premier sorti 151 ne
produise pas de signaux codés pendant le décomptage du silen-
ce Les impulsions d'horloge successives CLR décrémentent le compte du compteur 940 par l'intermédiaire de la porte ET 935 jusqu'à ce qu'un compte de zéro soit atteint A ce moment, la
sortie de retenue du compteur 940 restaure la bascule d'inter-
valle de silence 925 et le signal SL 1 est invalidé Le sélec-
teur 160 connecte maintenant la ligne 181 au décodeur adapta-
tif 165 et le train de codes adaptatifs provenant du registre
premier entré-premier sorti 151 est appliqué au décodeur 165.
La séquence des opérations du circuit décodeur 150 est représentée sur l'organigramme de la figure 10 et les signaux liés à son fonctionnement sont représentés sur la figure 11 Le signal 1101 de la figure 11 montre une séquence
de signaux codés adaptatifs qui proviennent du réseau 140.
Entre les instants t O et t 1, des codes numériques adaptatifs
C 1 à Cn, sont appliqués séquentiellement au décodeur 150.
Après le code Cn, un code de silence SC suivi par un code de compte de silence SCT apparaissent dans le train de données du signal 1101 Ces deux codes représentent un intervalle de silence dans le signal de parole A la suite de l'intervalle de silence, il apparaît une séquence de codes numériques adaptatifs commençant par le code Cn+l' Sur la figure 10, les registres, les bascules et
les réseaux de bascules du décodeur 150 sont restaurés ini-
tialement, ce qui correspond à la case d'opération 1001 On passe à la case 1007 à l'impulsion d'horloge CLR suivante,
par l'intermédiaire de la case 1005 qui correspond à l'atten-
te de l'impulsion d'horloge Entre les instants t et t 1 sur la figure 1, les codes de parole C 1, C 2 Cn sont reçus à
partir du réseau 140 Pour chaque impulsion reçue, un échan-
tillon de sortie est formé dans le décodeur 165, à la case d'opération 1007 A la case de décision 1009, le signal SL 1 provenant de la bascule 925 est examiné (case de décision 1009) Dans l'intervalle de parole qui va de t à t 1, le signal SL 1 n'est pas positionné, et le code d'entrée suivant provenant du registre premier entré-premier sorti 151 est reçu (case 1020) Du fait que le code d'entrée n'est pas le code de silence, on passe à la case 1029 par l'intermédiaire de la case de décision 1025, et l'échantillon d'entrée est décodé. Lorsque l'instant t est atteint, le code d'entrée i est le code de silence SC Le code SC est détecté dans le
comparateur 915, et on passe à la case 1034 par l'intermé-
diaire de la case de décision 1025 Le compteur 940 est char-
gé avec le compte de silence M (signal 1107) provenant du registre à décalage 905, à la case 1034 Le générateur de code de silence 155 est connecté au décodeur 165 par le signal SL 1
validé (signal 1105).
A l'apparition de l'impulsion d'horloge CL suivante, on passe à la case 1040 par l'intermédiaire de la case de décision 1009, et le compteur de silence est décrémenté à la case 1040 Le compte de silence est supérieur à zéro jusqu'à l'instant t 2 Par conséquent, on passe à la case 1036 par la case 1042, et la séquence de code de silence provenant du générateur 155 est appliquée au décodeur 165 A l'instant t 2, le compte de silence est décrémenté jusqu'à zéro (signal 1107), et la bascule 925 est restaurée à la case 1044, à laquelle on passe par la case 1042 Après l'instant t 2, le
fonctionnement normal sur les codes d'entrée reprend par l'in-
termédiaire du chemin comprenant les cases 1005, 1007, 1009, 1020, 1025 et 1029 Le signal d'entrée appliqué au décodeur , qui est représenté en 1109, comprend l'intervalle de silence entre t 1 et t 2, qui est reconstitué à partir des
codes SC et de compte de silence dans le signal 1101.
Il va de soi que de nombreuses modifications peuvent être apportées au mode de réalisation décrit et représenté, sans sortir du cadre de l'invention Par exemple, on peut remplacer le codeur et le décodeur MIC différentiels adaptatifs décrits ici par un autre type de dispositif de codage et de décodage numérique adaptatif connu dans la
technique, comme un dispositif MIC adaptatif.
(t T) IVKHOJ oui (I) Silam Leo=i ot, 01 0100 oc
01 0100 U
(t 7 j) IVNHOJ OCT (t 7 l) IVNUOJ 011
01 0100
(VIVOE) (OETIV) Slium (T=DV'IJO) 'GNV' (O=DV'Ii N) IT (O=D Vq JO) 'GNV' (I=D Vq JN) JI
(T=DV'IJO) 'GNV' (I=DVIJN) JI
(VIVOE) ( 01112) Mu (?,T) ivwuod 001
(DVIIJN) ( 00111) OEVSH,
DVIJN=D Vq JO 01 O=D Vq JN
SWII HSDSINI DNOI
VIVG'D Vq JN'D Vq JO USOSINI
SXSNNV
st, ot 7 OIOD (
00 OIOD (
U OIOD (
CENS
001 OIOD
IVHS SC In Dq VD
IVHS+IVHS=IVHS
Siiiimvnô unsamala IMOIS na qnoqvo
( 9 '+D)-OE=IVHR
SCOD sa ION na NOISSIWS
(D) ( 101 'E)SIIUM
SOEOD sa ION na Inoqvo NIKD=D (KIWD'lq'D) JI xvwo=o (XVWD'10 '0) JI ci/21 = O SM M S Iq IVI VI SG NOIIVNIWEZISQ (a) ( 101,2) aveu ansuusia qv NDIS na qnoqv D IVHS-S=a IVHS HG UIIU Vd V Mf ISIDIGS Ud SG Un Sq VA VI SC In DIVO
VISS-IVHS=IVHS
SnÈIHS Wn N-SnÈID Oq VNV Un SSSIIUSANOD na UIIU Vd V SSUIN Si G IVNDIS na Z Un IO Sq ( 91)IVWHOJ loi (S)(TOT'l) avzu 001 Un SIDIGS Ud SC En Sq VA VI ISS VISE (SIJIIN VnÈ) Hn IIISNOOSU Hn RHU Si C q VNDIS SI ISS IVHS Jilvidvav qail Nsusja Ig DIW Unsuusicl 'IVMOIS S'I J'sa 51 Sfl IIISMOOSU q VNDIS SI ISS IVHS
SZMINSIG IVNDIS SI ISS S
S Vd SC Sqq IVI SG En SIV Ua NHO na INVNSAO Hd S Vd SC Sq IIVI-VI IGS G JIIV Id VGV q SII Ng ESJIIG DIN SGOD SG ION SI ISS O Oe D 0 9 2 O
D 9 -1
0 1 D j af ISGOD na SKNVH Doud-sflos V axammv
6 úSOZSZ
READ ( 3,150) (TIME)
FORMAT ( 112)
WRITE ( 4,150) (TIME)
READ ( 2,110) (DATA)
WRITE( 4,130) (DATA)
GOTO 10
END
C TOUS LES NOMBRES COMMENCANT PAR UN ZERO "O", SONT EN
C OCTAL
C L'ACCES 1 EST L'ACCES D'INDICATEUR DE SILENCE, INDI-
C QUANT UN SILENCE
C L'ACCES 2 EST L'ACCES DE DONNEES
C L'ACCES 3 EST L'ACCES DE COMPTE DE SILENCE
C L'ACCES 4 EST L'ACCES DE SORTIE VERS LA MEMOIRE OU LE
C CANAL
ANNEXE C
SOUS-PROGRAMME DU DECODEUR
C C EST LE MOT DE CODE D'ENTREE
C D EST LA TAILLE DE PAS PROVENANT DU GENERATEUR DE
C TAILLE DE PAS
C SHAT EST LE SIGNAL DE SORTIE DU CODEUR
C BETA EST LA VAILETUR DU PREDICTEUR
READ ( 1,101) (C)
C DETERMINATION DU MOT DE CODE
READ ( 3,101) (D)
C DETERMINATION DE LA TAILLE DE PAS
EHAT=D-(C+ 5)
C CALCUL DE LA VALEUR QUANTIFIEE
SHAT=SHAT-BETA+EHAT
C CALCUL DU SIGNAL RECONSTITUE
WRITE ( 2,101) (SHAT)
C EMISSION DU SIGNAL DE SORTIE
GOTO 100
101 FORMAT ( 16)
END

Claims (7)

REVENDICATIONS
1 Système de traitement de la parole comprenant des moyens pour convertir une configuration de parole en une séquence de signaux codés numériques adaptatifs, et des moyens pour détecter des intervalles de silence dans cette configuration de parole, caractérisé en ce qu'il comprend des moyens qui réagissent à chaque intervalle de silence détecté en générant un signal codé numérique représentatif de cet intervalle, des moyens pour combiner les signaux codés numériques adaptatifs et les signaux codés numériques représentatifs de l'intervalle de silence pour former un signal correspondant à la configuration de parole, les moyens de conversion comprenant des moyens pour former un signal correspondant à la taille de pas adaptative pour chaque signal codé numérique adaptatif, des moyens pour générer des premier et second signaux de seuil, le second signal de seuil étant supérieur au premier signal de seuil, les moyens de détection d'intervalle de silence comprenant des moyens qui réagissent au fait que le signal correspondant à la taille de pas adaptative devient inférieur au premier signal de seuil en générant un signal qui indique un intervalle de silence,
et des moyens qui réagissent conjointement au signal d'inter-
valle de silence et au fait que le signal correspondant à la taille de pas adaptative s'élève au-dessus du second signal
de seuil en mettant fin au signal d'intervalle de silence.
2 Système selon la revendication 1, caractérisé en ce que les moyens de génération de signal d'intervalle de silence comprennent des moyens qui réagissent au fait que le premier signal de seuil dépasse le signal correspondant à la taille de pas en produisant un troisième signal, des moyens qui réagissent au troisième signal en faisant apparaître le signal d'intervalle de silence, des moyens qui réagissent au fait que le signal correspondant à la taille de pas dépasse le second signal de seuil en générant un quatrième signal, et
des moyens qui réagissent conjointement au signal d'inter-
valle de silence et au quatrième signal en mettant fin au
signal d'intervalle de silence.
3 Système selon l'une quelconque des revendica-
tions 1 ou 2, caractérisé en ce que les moyens destinés à former le signal correspondant à la taille de pas adaptative comprennent des moyens qui forment un signal représentatif du logarithme de la taille de pas pour chaque signal adapta-
tif codé de façon numérique.
4 Système selon l'une quelconque des revendica-
tions 1, 2 ou 3, caractérisé en ce que les moyens de généra-
tion de signal de seuil comprennent des moyens destinés à
générer des premier et second signaux de niveau prédétermi-
né, des moyens qui réagissent à la séquence de signaux correspondant à la taille de pas en produisant un signal représentatif du signal correspondant à la taille de pas qui
a la valeur maximale dans la séquence de signaux correspon-
dant à la taille de pas, des moyens qui réagissent conjoin-
tement au signal correspondant à la taille de pas de valeur
maximale et au premier signal de niveau prédéterminé en pro-
duisant un premier signal de niveau de seuil adaptatif, et
des moyens qui réagissent conjointement au signal correspon-
dant à la taille de pas de valeur maximale et au second signal de niveau prédéterminé en générant un second signal
de niveau de seuil adaptatif.
Système selon l'une quelconque des revendica- tions 1 à 4, caractérisé en ce qu'il comprend des moyens qui fonctionnent sous la dépendance des signaux codés numériques adaptatifs et des signaux codés d'intervalle de silence en enregistrant une séquence de signaux codés numériques qui
est représentative de la parole.
6 Système selon la revendication 5, caractérisé en ce qu'il comprend des moyens qui réagissent à la séquence
de codes numériques enregistrés en construisant la configu-
ration de parole qui correspond à la parole.
7 Procédé de traitement de la parole comprenant les opérations qui consistent à convertir une configuration
de parole en une séquence de signaux codés numériques adap-
tatifs et à détecter des intervalles de silence dans la con-
figuration de parole, caractérisé en ce que: on génère un signal codé numérique représentatif de chaque intervalle de silence détecté, et on combine les signaux codés numériques
adaptatifs et les signaux codés représentatifs de l'inter-
valle de silence pour former un signal numérique représenta-
tif de la configuration de parole, l'opération de conversion de la configuration de parole comprend la formation d'un
signal cor Zespondant à la taille de pas adaptative pour cha-
que signal codé numérique adaptatif, et la génération de premier et second signaux de seuil, le second signal de seuil étant supérieur au premier signal de seuil, et l'opératoon de détection d'intervalles de silence comprend la génération d'un signal indiquant l'intervalle de silence lorsque le signal correspondant à la taille de pas adaptative devient inférieur
au premier signal de seuil, et la terminaison du signal d'in-
tervalle de silence sous l'effet du signal d'intervalle de silence et du fait que le signal correspondant à la taille de
pas adaptative s'élève au-dessus du second signal de seuil.
8 Procédé selon la revendication 7, caractérisé en ce que l'opération de génération de signal d'intervalle de silence s'effectue en produisant un troisième signal lorsque le premier signai de seuil dépasse le signal correspondant à
la taille de pas, en faisant apparaître le signal d'inter-
valle de silence sous l'effet du troisième signal, en générant un quatrième signal lorsque le signal correspondant à la
taille de pas dépasse le second signal de seuil, et en termi-
nant le signal d'intervalle de silence sous la dépendance conjointe du signal d'intervalle de silence et du quatrième signal. 9 Procédé selon la revendication 8, caractérisé en ce que la formation du signal correspondant à la taille de pas adaptative comprend la formation d'un signal représentatif du logarithme de la taille de pas pour chaque signal codé
numérique adaptatif.
Procédé selon l'une quelconque des revendica-
tions 7 à 9, caractérisé en ce que l'opération de génération de signaux de seuil comprend les opérations suivantes: on génère des premier et second signaux de niveau prédéterminé, on produit un signal représentatif du signal correspondant à la taille de pas de valeur maximale, dans la séquence de
signaux correspondant à la taille de pas, on produit un pre-
mier signal de niveau de seuil sous la dépendance conjointe
du signal correspondant à la taille de pas de valeur maxima-
le et du premier signal de niveau prédéterminé, et on produit un second signal de niveau de seuil adaptatif sous la dépen- dance du signal correspondant à la taille de pas de valeur
maximale et du second signal de niveau prédéterminé.
FR8300907A 1982-01-27 1983-01-21 Procede et systeme de traitement des silences dans un signal de parole Expired FR2520539B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/343,238 US4449190A (en) 1982-01-27 1982-01-27 Silence editing speech processor

Publications (2)

Publication Number Publication Date
FR2520539A1 true FR2520539A1 (fr) 1983-07-29
FR2520539B1 FR2520539B1 (fr) 1986-07-04

Family

ID=23345266

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8300907A Expired FR2520539B1 (fr) 1982-01-27 1983-01-21 Procede et systeme de traitement des silences dans un signal de parole

Country Status (4)

Country Link
US (1) US4449190A (fr)
CA (1) CA1181857A (fr)
DE (1) DE3302503A1 (fr)
FR (1) FR2520539B1 (fr)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2545301A1 (fr) * 1983-04-29 1984-11-02 Telephonie Ind Commerciale Procede de compression-decompression d'un signal de type vocal
EP0238075A1 (fr) * 1986-03-18 1987-09-23 Siemens Aktiengesellschaft Méthode pour distinguer des signaux de parole de signaux de pauses de parole bruités
EP0283570A3 (fr) * 1984-04-26 1988-10-12 A.C. Nielsen Company Système d'identification d'un signal
FR2686183A1 (fr) * 1992-01-15 1993-07-16 Idms Sa Systeme de numerisation d'un signal audio, procede et dispositif de mise en óoeuvre pour constituer une base de donnees numeriques.
EP0652560A1 (fr) * 1993-04-21 1995-05-10 Kabushiki Kaisya Advance Appareil servant a enregistrer et a reproduire la voix

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58197918A (ja) * 1982-05-14 1983-11-17 Nec Corp 適応差分復号器
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
DE3425026C2 (de) * 1984-07-06 1987-01-08 Siemens AG, 1000 Berlin und 8000 München Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen
US4588979A (en) * 1984-10-05 1986-05-13 Dbx, Inc. Analog-to-digital converter
US4630302A (en) * 1985-08-02 1986-12-16 Acousis Company Hearing aid method and apparatus
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
CA1299750C (fr) * 1986-01-03 1992-04-28 Ira Alan Gerson Methode optimale de reduction de donnees pour systeme de reconnaissance vocale
US5023911A (en) * 1986-01-10 1991-06-11 Motorola, Inc. Word spotting in a speech recognition system without predetermined endpoint detection
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
DE3888547T2 (de) * 1987-01-16 1994-06-30 Sharp Kk Gerät zur Sprachanalyse und -synthese.
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
WO1989003573A1 (fr) * 1987-10-09 1989-04-20 Sound Entertainment, Inc. Synthese vocale a partir de segments des signaux vocaux coarticules et enregistres numeriquement
JP2551050B2 (ja) * 1987-11-13 1996-11-06 ソニー株式会社 有音無音判定回路
JPH04285765A (ja) * 1991-03-13 1992-10-09 Casio Comput Co Ltd デジタルレコーダ
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
CA2080862C (fr) * 1991-12-19 1996-11-26 Priya Jakatdar Dispositif de reconnaissance de messages vocaux dans les signaux modules par impulsions et codage
US5675778A (en) * 1993-10-04 1997-10-07 Fostex Corporation Of America Method and apparatus for audio editing incorporating visual comparison
US5594834A (en) * 1994-09-30 1997-01-14 Motorola, Inc. Method and system for recognizing a boundary between sounds in continuous speech
US5642464A (en) * 1995-05-03 1997-06-24 Northern Telecom Limited Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
ATE206859T1 (de) 1995-12-07 2001-10-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zur kodierung, übertragung und dekodierung eines nicht-pcm- bitstromes zwischen einer vorrichtung mit digitaler vielseitiger platte und einer mehrkanal-wiedergabevorrichtung
US5890109A (en) * 1996-03-28 1999-03-30 Intel Corporation Re-initializing adaptive parameters for encoding audio signals
FR2758676A1 (fr) * 1997-01-21 1998-07-24 Philips Electronics Nv Methode de reduction des clics dans un systeme de transmission de donnees
JP2000269821A (ja) * 1999-03-18 2000-09-29 Oki Micro Design Co Ltd 予測符号化信号復号化装置及び雑音除去方法
GB9912577D0 (en) * 1999-05-28 1999-07-28 Mitel Corp Method of detecting silence in a packetized voice stream
US6801894B2 (en) * 2000-03-23 2004-10-05 Oki Electric Industry Co., Ltd. Speech synthesizer that interrupts audio output to provide pause/silence between words
US7673223B2 (en) * 2001-06-15 2010-03-02 Qualcomm Incorporated Node processors for use in parity check decoders
US7072828B2 (en) * 2002-05-13 2006-07-04 Avaya Technology Corp. Apparatus and method for improved voice activity detection
US6957375B2 (en) * 2003-02-26 2005-10-18 Flarion Technologies, Inc. Method and apparatus for performing low-density parity-check (LDPC) code operations using a multi-level permutation
US20040225494A1 (en) * 2003-05-07 2004-11-11 Mayginnes Kevin B. Mitigation of interference on digital voice channels
US7346506B2 (en) * 2003-10-08 2008-03-18 Agfa Inc. System and method for synchronized text display and audio playback
GB0414420D0 (en) * 2004-06-28 2004-07-28 Cambridge Silicon Radio Ltd Speech activity detection
GB2416955B (en) * 2004-07-28 2009-03-18 Vodafone Plc Conference calls in mobile networks
US8411709B1 (en) 2006-11-27 2013-04-02 Marvell International Ltd. Use of previously buffered state information to decode in an hybrid automatic repeat request (H-ARQ) transmission mode
US8897393B1 (en) 2007-10-16 2014-11-25 Marvell International Ltd. Protected codebook selection at receiver for transmit beamforming
US8542725B1 (en) * 2007-11-14 2013-09-24 Marvell International Ltd. Decision feedback equalization for signals having unequally distributed patterns
US8565325B1 (en) 2008-03-18 2013-10-22 Marvell International Ltd. Wireless device communication in the 60GHz band
US8498342B1 (en) 2008-07-29 2013-07-30 Marvell International Ltd. Deblocking filtering
US8761261B1 (en) 2008-07-29 2014-06-24 Marvell International Ltd. Encoding using motion vectors
US8345533B1 (en) 2008-08-18 2013-01-01 Marvell International Ltd. Frame synchronization techniques
US8681893B1 (en) 2008-10-08 2014-03-25 Marvell International Ltd. Generating pulses using a look-up table
US8520771B1 (en) 2009-04-29 2013-08-27 Marvell International Ltd. WCDMA modulation
US8817771B1 (en) 2010-07-16 2014-08-26 Marvell International Ltd. Method and apparatus for detecting a boundary of a data frame in a communication network
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
US10832005B1 (en) 2013-11-21 2020-11-10 Soundhound, Inc. Parsing to determine interruptible state in an utterance by detecting pause duration and complete sentences

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4053712A (en) * 1976-08-24 1977-10-11 The United States Of America As Represented By The Secretary Of The Army Adaptive digital coder and decoder

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4280192A (en) * 1977-01-07 1981-07-21 Moll Edward W Minimum space digital storage of analog information
US4272810A (en) * 1978-12-21 1981-06-09 Bell Telephone Laboratories, Incorporated Arrangement for deleting trailing message portions
US4484344A (en) * 1982-03-01 1984-11-20 Rockwell International Corporation Voice operated switch

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4053712A (en) * 1976-08-24 1977-10-11 The United States Of America As Represented By The Secretary Of The Army Adaptive digital coder and decoder

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IBM TECHNICAL DISCLOSURE BULLETIN, vol. 19, no. 6, novembre 1976, pages 2357-2358, New York (USA); S.J.BOIES et al.: "Encoding and decoding of digital speech". *
IEEE 1976 INTERNATIONAL ZURICH SEMINAR ON DIGITAL COMMUNICATIONS, Z}rich 9-11 mars 1976, pages A7.1-A7.8, Long Beach (USA);A.M.MOLINARI et al.: "Bit rate per channel halving in PCM multiplexes by speech interpolation and adaptive quantization". *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2545301A1 (fr) * 1983-04-29 1984-11-02 Telephonie Ind Commerciale Procede de compression-decompression d'un signal de type vocal
EP0283570A3 (fr) * 1984-04-26 1988-10-12 A.C. Nielsen Company Système d'identification d'un signal
EP0238075A1 (fr) * 1986-03-18 1987-09-23 Siemens Aktiengesellschaft Méthode pour distinguer des signaux de parole de signaux de pauses de parole bruités
WO1987005734A1 (fr) * 1986-03-18 1987-09-24 Siemens Aktiengesellschaft Procede pour differentier les signaux de parole de signaux de pauses de parole exemptes ou comportant de bruit
FR2686183A1 (fr) * 1992-01-15 1993-07-16 Idms Sa Systeme de numerisation d'un signal audio, procede et dispositif de mise en óoeuvre pour constituer une base de donnees numeriques.
EP0652560A1 (fr) * 1993-04-21 1995-05-10 Kabushiki Kaisya Advance Appareil servant a enregistrer et a reproduire la voix
EP0652560A4 (fr) * 1993-04-21 1996-05-01 Advance Kk Appareil servant a enregistrer et a reproduire la voix.

Also Published As

Publication number Publication date
US4449190A (en) 1984-05-15
FR2520539B1 (fr) 1986-07-04
DE3302503C2 (fr) 1992-12-17
CA1181857A (fr) 1985-01-29
DE3302503A1 (de) 1983-08-04

Similar Documents

Publication Publication Date Title
FR2520539A1 (fr) Procede et systeme de traitement des silences dans un signal de parole
EP0768770B1 (fr) Procédé et dispositif de création d'un bruit de confort dans un système de transmission numérique de parole
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
EP2277172B1 (fr) Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique
EP0104963B1 (fr) Procédé de compression de débit de données successivement transmises entre un émetteur et un récepteur de télévision, et système mettant en oeuvre le procédé
FR2535854A1 (fr) Procede et dispositif d'evaluation du niveau de bruit sur une voie telephonique
FR2475264A1 (fr) Procede et systeme de transmission d'un signal de parole avec codage a prediction
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
FR2639459A1 (fr) Procede de traitement du signal et appareil de formation de donnees issues d'une source sonore
EP0127718A1 (fr) Procédé de détection d'activité dans un système de transmission de la voix
WO2004070705A1 (fr) Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage de bruit, la creation d’effets speciaux et dispositif pour la mise en oeuvre dudit procede
EP2080194B1 (fr) Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information
BRPI0015070B1 (pt) método para codificar frames de fala, e, codificador de fala para reduzir sensibilidade às condições de erro de frame
WO1998047134A1 (fr) Procede et dispositif de codage d'un signal audiofrequence par analyse lpc 'avant' et 'arriere'
EP1875465A1 (fr) Procede d'adaptation pour une interoperabilite entre modeles de correlation a cout terme de signaux numeriques
EP0195441A1 (fr) Procédé de codage à faible débit de la parole à signal multi-impulsionnel d'excitation
EP0685833A1 (fr) Procédé de codage de parole à prédiction linéaire
CA1165917A (fr) Dispositif de mesure de l'attenuation d'un trajet de transmission
EP0275751A1 (fr) Procédé et dispositif de transmission numériques de signaux vocaux par voie radio
EP0454552A2 (fr) ProcédÀ© et dispositif de codage bas débit de la parole
FR2760285A1 (fr) Procede et dispositif de generation d'un signal de bruit pour la sortie non vocale d'un signal decode de la parole
EP0291377A1 (fr) Dispositif de transcodage entre réseaux de transmission à débits différents, et son utilisation dans un système de transmission multidébits
JPH0467200B2 (fr)
FR2741743A1 (fr) Procede et dispositif pour l'amelioration de l'intelligibilite de la parole dans les vocodeurs a bas debit
EP0201401A1 (fr) Procédé de codage MIC différentiel et installation de transmission d'information utilisant un tel codage