WO1987003127A1

WO1987003127A1 - Systeme et procede de reconnaissance des sons avec selection de caracteres synchronisee a l'intonation de la voix

Info

Publication number: WO1987003127A1
Application number: PCT/US1985/002229
Authority: WO
Inventors: John Marley
Original assignee: John Marley
Priority date: 1985-11-08
Filing date: 1985-11-08
Publication date: 1987-05-21
Also published as: EP0245252A1

Abstract

Un système destiné à transformer les signaux du langage en des signaux d'identification de phonèmes comprend un circuit de détection des points d'inflexion simples (8) qui produit des "1" et des "0" durant les parties d'ondes de pression négative et positive du signal de parole analogue correspondant. En ce qui concerne les parties "parlées" des signaux de parole les pointes maximales de chaque cycle d'intonation de signal de parole sont détectées (13) pour produire des cycles d'intonation qui sont analysés par un micro-ordinateur (10), afin de détecter le départ de chaque cycle d'intonation et de détecter et enregistrer la durée des niveaux "1" et "0" successifs. Pour chaque cycle d'intonation un vecteur d'entrée est formé à partir des durées des niveaux "1" qui suivent le plus directement le départ du cycle d'intonation. Ce vecteur d'entrée est corrigée par une quantité dérivée par détermination de la disparité entre l'intonation présente de la voix de l'orateur et les fréquences de résonance dues à la configuration de la cavité bucale de l'orateur. La vitesse et l'accélération représentant la durée des deux niveaux "1" au commencement de chaque cycle d'intonation sont analysées par le micro-ordinateur (10), qui fixe une limite entre le début et la fin de chaque phonème. Pour les parties fricatives du signal de parole, un vector fricatif est calculé par ordinateur et comparé à un plan de son fricatif afin d'identifier une consonne fricative. Les intervalles silencieux sont marqués par la non-indication par le détecteur de points d'inflexion (8) d'un niveau "1" moyen en fonctionnement substantiel. Les phonèmes plausifs sont partiellement identifiés par les durées des intervalles silencieux précédents. Les phonèmes de longue durée utilisent la pente située entre les valeurs de durée des "1" et "0" mobiles, afin de contribuer à la procédure. Identification de tous les vecteurs de séquence-temps phonèmiques est obtenue en utilisant différents plans de domaines de vecteurs de référence dérivés de manière empirique.