DE2806920A1 - Stimmenidentifikationssystem - Google Patents

Stimmenidentifikationssystem

Info

Publication number
DE2806920A1
DE2806920A1 DE19782806920 DE2806920A DE2806920A1 DE 2806920 A1 DE2806920 A1 DE 2806920A1 DE 19782806920 DE19782806920 DE 19782806920 DE 2806920 A DE2806920 A DE 2806920A DE 2806920 A1 DE2806920 A1 DE 2806920A1
Authority
DE
Germany
Prior art keywords
pulse
circuit
sound
signal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19782806920
Other languages
English (en)
Inventor
Hiroyasu Prof Funakubo
Masataka Shiba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FUNAKUBO HIROYASU
Original Assignee
FUNAKUBO HIROYASU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP1714377A external-priority patent/JPS5945160B2/ja
Priority claimed from JP370278A external-priority patent/JPS5497304A/ja
Application filed by FUNAKUBO HIROYASU filed Critical FUNAKUBO HIROYASU
Publication of DE2806920A1 publication Critical patent/DE2806920A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Description

PATENTANWÄLTE m. GRÜNECKER
H. KINKELDEY
DR-ING.
W. STOCKMAlR
jt DR-ING. - Aee (CALTECH)
^ K. SCHUMANN
DR PERNAT.: DIPL-PHYS.. _ ..
P. H. JAKOB
Dl PL-ING.
G. BEZOLD
Hiroyasu FLTNAEUBO 8 München 22
■.-. ,-, „ r-i ι. ,-.... .... MAXIMIUANSTRASSE 43
Ho. 2-17-4 Nxshxogx-kxta
Suginami-ku, Tokyo Japan 167
17=Februar 1978.
Stimmenidentifikationssystem
Die Erfindung bezieht sich, auf ein Stimmenidentifxkatxonssystem zum Steuern einer mechanischen oder elektrischen Einrichtung, wie angetriebenen künstlichen Händen oder Manipulatoren, mit Hilfe codierter Stimmensignaleο
Bei derartigen, bisher vorgeschlagenen Systemen wurden verschiedene Stimmensignale von einer Person, die eine Stimmenquelle darstellt und nachfolgend als eine Quellenperson bezeichnet wird, einer Frequenzanalyse unterworfen, um als getrennte Muster in einem Speicher gespeichert zu werden, wobei ein anschließend von der Quellenperson erzeugtes Stimmensignal der gleichen Frequenzanalyse unterworfen wird, um mit den gespeicherten Mustern verglichen zu werden und zu bestimmen, welcher Art von Stimmensignal das letztere ist«. " Bei diesem zuvor beschriebenen bisherigen Verfahren treten bei dem Mustervergleich jedoch viele Schwierigkeiten auf, da die Stimmensignale von der gleichen Quellenperson sich von Tag zu Tag oder von Zeit zu Zeit hinsichtlich des Inter-
TELEFON (O8S) 22286Q TELEX OS-293SO TELEGRAMME MONAPAT TELEKOPIERER
' 4*
valls zwischen Silben oder der Betonung unterscheiden, wobei außerdem die für solche bisherigen Systeme benötigten Einrichtungen große Abmessungen haben und teuer in der Herstellung sind.
Die vorliegende Erfindung wurde geschaffen, um die vorstehenden Nachteile der bisherigen Systeme zu beseitigen.
Es ist daher ein Ziel* der Erfindung, ein neues Stimmenidentifikationssystem zu schaffen, das eine Sprachinförmation selbst dann erlaubt, wenn diese in geeigneter Weise zu identifizierende Summtöne wie auch gewöhnliche Vokaltöne enthält.
Ein weiteres Ziel der Erfindung ist es, ein solches Stimmenidentifikationssystem zu schaffen, bei dem eine höhere Geschwindigkeit der Stimmenerkennung erreicht werden kann, da es ein einfacheres Musteranpassungssystem benutzt.
Ein weiteres Ziel der Erfindung ist es, ein solches Stimmenidentifikationssystem zu schaffen, bei dem eine Vielzahl von Befehlsworten in geeigneter Weise durch eine vereinfachte Anordnung erkannt werden kann, da eine Kombination von musikalischen Intervallmustern und Bhythmusmustern oder eine weitere Kombination dieser Kombination mit der Geräuschstärke benutzt wird.
Gemäß einem bevorzugten Gedanken der Erfindung wird bei dem Stiinmenidentifikationssystem Sprachgeräusch in ein Impulssignal umgeformt, das seinerseits einer Wellentransformation, einer Zeitintervallanalyse und ähnlichen Wirkungen unterworfen wird. Dann wird (jeder Wert, der symbolisch für einen Laut (mora) ist, in dem Sprachgeräusch bestimmt. Diese Stimmenerkennung wird durch Benutzung einfacher Musteranpassungssysteme erreicht, die eine höhere Geschwindigkeit der Stimmenerkennung unabhängig davon sicherstellt, ob die Stimme gewöhnliche Töne oder Summtöne enthält.
808834/0780
Diese und andere Ziele sowie Merkmale der Erfindung ergeben sich aus der folgenden detaillierten Beschreibung einer bevorzugten Ausführungsform anhand der Zeichnungen » Im einzelnen zeigt:
Fig. 1 ein Blockschaltbild der Gesamtanordnung des erfindungsgemäßen Stimmenidentifikationssystems,
Pig. 2 einen Stromlaufplan der Zählerschaltung in Figo 1,
Fig. 3 einen Stromlaufplan der Symbolwert-Abtastschaltung der Fig. 1,
Fig. 4 einen Stromlaufplan der Tonänderungs-Erfassungsschaltung der Fig. 1,
Fig. 5 einen Stromlaufplan der Lautpausen-Erfassungsschaltung in Fig. 1,
Fig. 6 einen Stromlaufplan der Systemsteuereinheit der Fig..1,
Fig. 7 bis 11 Zeitdiagramme, die die zeitliche Beziehung der Arbeitsweise des erfindungsgemäßen Systems angeben,
Fig. 12 A bis 12 D die Änderung von Lauten angebende Diagramme ,
Fig. 13 einen Stromlaufplan einer weiteren bevorzugten Ausführungsform der in Fig. 4 gezeigten Tonänderungs-Erfassungsschaltung,
Fig. 14 ein Blockschaltbild einer weiteren Ausführungsform des erfindungsgemäßen Stimmenidentifikationssystems,
609834/0780
15 ein Signaldiagramm , das eine an jeder Bauteilschaltung der Stimmenerfassungsschaltung der 51Xg. 14- auftretende Signalform zeigt,
Fig. 16 bis 18 Elußdiagramme zur Erläuterung der Wirkungsweise der Einrichtung und
IPig. 19 ein Diagramm einer Musterform von Befehlsworten.
In dem in Fig. 1 gezeigten Blockschaltbild des gesamten Systems ist A eine Stimmenerfas sungs schaltung, die Stimmensignale von der Quellenperson in Impulssignale umformt. In dieser Stimmenerfassungsschaltung A bezeichnet 1 ein an der Außenseite des Kehlkopfes der Quellenperson vorgesehenes Mikrofon und 2 ein Bandpaßfilter von 50 bis 250 Hz, das ein Basisfrequenzband der Sprachstimmbandschwingung ist. Das Filter 2 tastet den Grundtonbestandteil des Stimmensignals ab,'das ein die Einteilung der Stimmge rausche angebender Parameter ist, wie sie von der Quellenperson abgegeben werden. Das Filter 2 weist einen Verstärker auf. Eine Schmitt-Trigger-Schaltung 3 formt das von dem Filter 2 abgetastete Sinussignal in ein Rechtecksignal um. Die Schmitt-Trigger-Schaltung 3 dient auch zum Beseitigen aller Wellenformen außer den Grundtonbestandteilen dirch ihre Hystereseeigenschaft.
Eine Zählerschaltung B mißt mit Hilfe eines ausgewählten Taktes die Periodendauer des Rechtecksignals am Ausgang der Schmitt-Trigger-Schaltung 3· Eine Verknüpfungsschaltung 4-steuert das Rechteck-Impuls signal von der Schmitt-Trigger-Schaltung 3 und wahlweise Takte. Ein Zähler 5 zählt wahlweise eine Vielzahl von TaktimpulsSignalen, die von einer Taktimpulsgeneratorschaltung 6 zugeführt werden, die später noch näher beschrieben wird, während der Dauer eines
809834/0760
Eingangssignals von der Stimmenerfassungsschaltung A. Die Taktimpulsgeneratorschaltung 6 erzeugt eine Vielzahl von Taktimpulssignalen von z.B. 10 KHz und 300 Hz.
Eine Symbolwert-Abtast schaltung C speichert die Anzahl von Impulsen in jeder Gruppe von Taktimpulsen von der Zählerschaltung B zur Bestimmung des Symbolwerts, der der zentrale Wert der Anzahl von Impulsen in der betrachteten bevorzugten Ausführungsform ist. In der Symbolwert-Abtastschaltung C ist eine Anordnung von "Verriegelungsschaltungen 7 zum Speichern der Anzahl von Taktimpulsen in jeder Gruppe und ein Vergleicher 8 vorgesehen, der die Anzahl der von den jeweiligen Verriegelungsschaltungen in dieser Anordnung 7 zugeführten Taktimpulse vergleicht, um den Symbolwert oder zentralen Wert der Anzahl von Taktimpulsen zu bestimmen.
Eine Tonänderungs-Erfassungsschaltung D speichert den Symbolwert für jeden Laut (mora),um den Ton für jeden Laut zu erfassen. In der Tonänderungs-Erfassungsschaltung D speichert eine Anordnung 9 von Verriegelungsschaltungen den Symbolwert für jeden Laut und ein Vergleicher 10 vergleicht die Anzahl der von den jeweiligen Verriegelungsschaltungen 9 zugeführten Taktimpulse, um die Änderung in der Anzahl von Taktimpulsen, d.h. den Ton für jeden Laut zu erfassen.
Eine Lautpausen-Erfassungsschaltung E erfaßt die Lautpausen unter Benutzung der Ausgangssignale der genannten Verriegelungsschaltungen in der Symbolwert-Abtastschaltung C0 In der Lautpausen-Erfassungsschaltung E vergleicht ein Vergleicher 11 die Ausgangssignale der Verriegelungsschaltungen 7 mit einem bestimmten Wert«
Eine System-Steuereinheit Έ gibt Impuls signale an die zuvor erwähnten jeweiligen Blöcke A bis E9 um eine aufeinanderfolgende Steuerfunktion dieser Blöcke zu bewirken=
'809-834/07SÖ
Die Grundarbeitsweise des erfindungsgemäßen Stimmenidentifikation ssystems wird in Verbindung mit Fig. 2 und den folgenden Zeichnungen anhand der in ihnen enthaltenen Zeitdiagramme näher erläutert.
Es wird angenommen, daß drei Laute, z.B. {ytsu3, [kai und [mel, was in der japanischen Sprache "greifen" heißt, wenn diese als ein einziges Wort ausgesprochen werden, von der Quellenperson erzeugt werden, wie dieses durch die Spracheingangshüllkurven in Fig. 7 gezeigt ist, wodurch das an der Außenseite des Kehlkopfes vorgesehene Mikrofon, das vorzugsweise an einer Stelle unmittelbar unterhalb des Adamsapfels angeordnet ist, wo höhere Frequenzkomponenten und Vokalgegendeigenschaften relativ geringe Wirkungen haben, nimmt die von der Quellenperson erzeugte Stimminformation auf. Dann wird die Stimminformation in das Filter 2 gegeben, wobei sie ein Frequenzband Von 50 bis 250 Hz durchläuft, damit die Grundtonbestandteile in ihr abgetastet und verstärkt werden. Das so abgetastete Sinussignal wird von der nachfolgenden Schmitt-Trigger-Schaltung 3 in ein Eechtecksignal umgeformt. Für eine weibliche Sprachquelle kann das Bandpaßfilter auf eine höhere Frequenz verstellt werden. Infolge der Hystereseeigenschaften der Schmitt-Trigger-Schaltung 3 wird das Eechtecksignal einer weiteren Beseitigung von Wellenanteilen unterworfen, die sich von den Grundtonbestandteilen unterscheiden. Dieses Eechtecksignal ist das Ausgangssignal eines Schmitt-Triggers in Fig. 7 und wird in den Fig. 9 bis 11 als eine vergrößerte Signalform (a) gezeigt.
Die Folge der Arbeitsweise des Gesamtsystems wird im einzelnen in Verbindung mit Fig. 7 erläutert. Zuerst bezeichnet CO} einen Eingangswartezyklus, bei dem alle Schaltungen auf ihren Anfangszustand zurückgesetzt sind. f1J j[53 und [9! bezeichnen einen Anfangsperioden-Beseitigungszyklus, der einer Aufbauperiode eines jeden Lautes entspricht, bei der
809834/0760
der instabile Teil der Impulssignale, d=lu der erste Impuls bei dem hier betrachteten bevorzugten Ausführungsbeispiel, beseitigt wird» £21 ? ^q] und£103 bezeichnen einen Zyklus, bei dem ein Impulssignal, d=h» ein Rechtecksignal, das aufgenommen werden soll, bestimmt ist und 9 bei dem hier betrachteten bevorzugten Ausführungsbeispiel, werden drei Impulssignale vom zweiten bis zum vierten*Impuls, dcho Rechtecksignale, bei jedem Laut der Messung einer Anzahl von Taktimpulsen in ihnen ausgesetzte
Beim durch C 33 > L 73 und C111 bezeichneten Zyklus wird ein Impulssignal, d.iu Rechtecksignal, das für jeden Laut symbolisch ist, aus den zuvor erwähnten drei ImpulsSignalen ausgewählt. Bei der hier betrachteten, bevorzugten Ausführungsform wird ein Impulssignal mit einem zentralen Wert in Ausdrucken der Anzahl von Taktimpulsen ausgewählt» Es kann jedoch auch der Mittelwert, der die letzten Rechtecke angebende Wert, der Maximalwert, der Minimalwert von dem n-ten größten Wert in Ausdrücken der Anzahl von Taktimpulsen ausgewählt werden. Mit anderen Worten, es kann irgendeine Anordnung benutzt werden, solange wie ein Impulssignal von drei bei jedem Laut unter der gleichen Bedingung erfaßt werden kann. L4-1» C83 undC-12"] bezeichnen einen Zyklus, bei dem jede Lautpause erfaßt wird. In dem durch Γ133 bezeichneten Zyklus wird das Tonänderungsmuster der zuvor erwähnten drei symbolischen Impulssignale bestimmt. Dieses Tonänderungsmuster wird benutzt, um die Sprachinformation von der Quelle-nperson zu identifizieren, damit die künstlichen Hände z.B. ihre "Greif"-Aktion beginnen»
Neben der Steuer funkt ion für die künstlichen Hände kann das Tonänderungsmuster auch für andere Anwendungen, wie eine Maschinenwerkzeugsteuerung, eine finanzielle AufZeichnungssteuerung oder eine Türbewegungssteuerung benutzt werden„
809834/07
28Ö6920
Die zuvor angegebenen Zyklen f1} bis L133bilden eine Folge von Steuerzyklen, nach denen eine weitere Informationsidentifikationsfolge, die auf einen Eingangswartezyklus \J3 '3 folgt, wiederholt wird.
Der zuvor erwähnte Folgesteuerungszyklus wird Jetzt näher erläutert.
Wenn der Netzschalter eingeschaltet wird, so wird ein Eiicksetzimpuls von einer ^peisung-Ein-Eücksetzschaltung 12a der Systemsteuereinheit F über ein ODER-Glied 12b an einen 4-Bit-Zähler 12c gegeben, um den Zähler 12c und die Schaltungssteuereinheit 12d zurückzusetzen. Das heißt, der 4—Bit-Zähler 12c gibt die zuvor erwähnten 13 Zyklen nacheinander an und wird durch den Rucksetzimpuls in den Zustand [03 zurückgesetzt. Die auf diese Weise zurückgesetzte Schaltungssteuereinheit 12d (I1Xg. 6) gibt gleichzeitig Impulse (c), (d), (e), Cd), Cd1). Cd"), (0), (O1), (0") und (1) ab, wie dieses in i"ig. 8 gezeigt ist.
Der Impuls (c) wird an den Rücksetzeingangsanschluß der Flip-Flopschaltung 4a der in Fig. 2 gezeigten Verknüpfungsschaltung 4 gegeben, um ein Ausgangssignal an ihrem Ausgangsanschluß Q zu erzeugen. Dadurch wird der Stimneingang abgeschaltet, bis die gesamte Schaltung des Systems gesetzt ist. Das heißt, ein UND-Glied 4b ist gesperrt, um den Hindurchgang von einem von der Schmitt-Trigger-Schaltung 3 zugeführten Impuls zu verhindern, der später als Sprachimpulssignal (a) bezeichnet ist, da ein Ausgangssignal von dem Ausgangsanschluß Q nicht abgegeben wird. Der Impuls (d) setzt den 8-Bit-Zähler 5 und die Flip-Flop-Schaltuig 4c zurück, so daß, wenn das Sprachimpulssignal (a) eingegeben wird, ein Ausgangssignal von dem Anschluß Q des Flip-Flop 4c abgegeben wird und der 10 EHz oder 300 Hz-Takt, der später beschrieben wird, an den Zähler 5 über das UITD-G-lied
809834/0780
-Sf-
-AA-
4d gegeben wird. Der Impuls (e;) setzt die Flip-Flop-Schaltung 4e, damit ein Ausgangssignal von dem Anschluß Q abgegeben wird, und das UND-Glied 4f zum Hindurchlassen der Taktimpulse von dem 10 KHz-Taktimpulsgenerator 6a leitend geschaltet wird« Dadurch., daß auch das UND-Glied 4d leitend ist, wird der 10 KHz-Takt impuls von der Taktimpuls gene ratorschaltung 6a über das UND-Glied 4f und das ODEH-Glied '4g an den 8-Bit-Zähler 5 gegeben, um von diesem gezählt zu werden» Die Impulse (j), (d1), (J"), (D, (0), (O1) und (0") setzen die 8-Bit-Yerriegelungen 7a, 7b, 7d und 7c sowie 9a, 9b und 9c jeweils in ihre Eingangswartezustände zurück, wie dieses in den J1Ig=. 3 "und 4 gezeigt ist=
Da die Steuerschaltungseinheit 12d den Impuls (b) in Fig» abgibt, wird die Flip-Flop-Schaltung 4a gesetzt und sein an dem Anschluß Q erscheinendes Ausgangssignal wird an das UND-Glied 4b und den Anschluß D der Flip-Flop-Schaltung 4c gegeben- Unter diesen Bedingungen wird, wenn der erste Impuls von dem Sprachimpulssignal (a) an den Eingang des UND-Gliedes 4b gegeben wird, dieser Impuls hindurchgelassen, um an den Anschluß T der Flip-Flop-Schaltung 4c zu gelangen» In diesem Fall, da das Ausgangssignal von dem Anschluß Q bei der Vorderflanke dieses Impulses (a) sich ändert, wird der Impuls (g5 von dem Anschluß Q (Fig„ 9) abgegeben. Gleichzeitig wird ein Inkrementimpuls an den 4-Bit-Zähler 12c gegeben, damit dieser vom Zyklus tÖl zum Zyklus CI3 fortschreitet- Dann wird der Impuls (d) erneut von der Schaltungssteuereinheit 12d abgegeben, um den 8-3it-Zähler 5 zurückzusetzen» Auch die Flip-Flop-Schaltung 4c wird zurückgesetzt, um ihr Aus gangs signal auf die Q-Seite zu ändern., Obwohl daher der 8-Bit-Zähler 5 mit der Zählung der Taktimpulse erneut beginnt, wird er von dem zweiten Impuls des Impulses (d) zurückgesetzt, ohne daß er sein Ausgangssignal an die nachfolgende Stufe weitergibt, selbst wenn der Impuls
(g) bei der Vorderflanke des zweiten Impulses des Impulses (a) erzeugt wird, da der erste Impuls fortgelassen wird. Nachdem der zweite Impuls des Impulses (a) eingegeben ist, nämlich nach dem Verstreichen der Aufbau- Übergangsperiode, wird das Ausgangssignal der Schaltung 4c erneut auf die Q-Seite geändert und dadurch beginnt der 8-Bit-Zähler 5 erneut mit der Zählung der lOEHz-Taktimpulse. Außerdem wird ein Inkrementimpuls von der Schaltungssteuereinheit 12 an den 4-Bit-Zähler 12c gegeben, um diesen vom Zyklus ΓΛ\\ zum Zyklus £2]] we iterzuzählen.
Danach erzeugt die Schaltungssteuereinheit 12d, wenn der dritte Impuls der Spracheingangsimpulse (a) auftritt und der dritte Impuls des Impulses (g) bei dessen Vorderflanke erzeugt wird, den Impuls (i), der an den Verteilungseingangsanschluß der in 31Xg- 3 gezeigten Verriegelung 7a gegeben wird. Daher wird das Zählsignal von dem 8-Bit-Zähler 5 in der Verriegelung 7a gespeichert. Außerdem wird der Ihpals (d) anschließend an den Impuls (i) abgegeben und der 8-Bitzähler 5 wird erneut zurückgesetzt, um seinen Zählvorgang zu beginnen, der fortgesetzt wird, bis der vierte Impuls der Spracheingangsimpulse (a) zugeführt wird. Der vierte Impuls des Impulses (g) wird bei der Vorderflanke des vierten Sprachimpulses (a) erzeugt, um den Impuls (i1) zu erzeugen wodurch eine Funktion ähnlich der zuvor beschriebenen fortgesetzt wird, so daß die Anzahl von dem dritten Sprach impuls-Singangssignal (a) entsprechende Anzahl von Taktimpulsen in der Verriegelung 7b "und die Anzahl von Taktimpulsen, die dem vierten Sprachimpulseingangssignal (a) entspricht, in der Verriegelung 7c jeweils gespeichert werden. Der anschließend erzeugte fünfte Impuls (d) bewirkt die Erzeugung eines Inkrementimpulses, um den Zyklus £23 zum Zyklus in I1Xg. 10 weiterzuschieben.
809834/0700
Beim dritten Zyklus £33 wird der zentrale Wert aus den AusgangsSignalen der Verriegelungen 7a? 7b und 7c , die vorab mit A, B und C bezeichnet sind, ausgewählt, der der Anzahl von in dem zweiten Zyklus [23 gespeicherten Impulsen entsprichtο Das heißt, die Vergleichsfunktions wie sie in der Tabelle 1 gezeigt ist, wird in einer Anordnung von 8-Bit~Vergleichern 8a ausgeführt«
Tabelle 1
Vergleicher-Ausgangssignal ΓΑΊ > ΓΒΐ [B] * [C] I Δ I
I "^^ I
^c] ausgepfählter
Kanal
ΓΒΊ < TCI
L=. -J rs t— —J
CA] [B]
CA] ^CC] Cc]
Γ Al < ΓΒ1
UJ = U-J
[B] > [G] CA] CA]
CA]
CB] t Cc] [G]
CB]
Mit anderen Worten, eines der Ausgangssignale A5 B und C wird aus dem Datenmultiplexer 8b (JTig. 3) ausgegeben, dessen Daten durch den Impuls (m) von der SchaltungsSteuereinheit 12d zugänglich gemacht werden, und gleichzeitig in der 8-Bit-Verriegelung 9a C^ig= 4) durch die Wirkung des Impulses (n) gespeichert, der von der Schaltungssteuereinheit 12d zugeführt wird. Da der Impuls (f) von der Schaltungssteuereinheit 12d gleichzeitig mit dem Impuls (n) ausgegeben wird, wird die in Fig» 2 gezeigte Plip-Plop-Schaltung 4-e
1834/0780
■Al*·
zurückgesetzt und ihr Ausgangssignal auf die Q-Anschlußseite geändert. Daher wird der JOO Hz-Taktimpuls von dem 300 Hz-Taktimpulsgenerator 6b über das UED-Glied 4h, das ODER-Glied 4g und das USD-Glied 4d an den 8-Bit-Zähler 5 gegeben. Dem Impuls (m) folgend, gibt die Schaltungssteuereinheit 12d einen Inkrementimpuls an den 4-Bit-Zähler 12c, um den Zyklus £3Ü auf den vierten Zyklus £4^ weiterzuschalten.
Bei diesem vierten Zyklus j^-J» bei dem die Iiaut-Pause erfaßt wird,zählt der 8-Bit-Zähler 5 die 300 Hz-Taktimpulse für jeden Impuls (d) und speichert die Anzahl der Taktimpulse in der Verriegelung (7d) für'jeden Impuls (k) von der Schaltungssteuereinheit 12d. Das Ausgangssignal der Verriegelung 7d wird an einen der Eingangsanschlüsse der Vergleicher schaltung 11a gegeben, deren anderer Singangsanschluß ein Signal erhält, das einer geeigneten Lautpause entspricht. Es wird angenommen, daß das Ausgangssignal A der Verriegelung 7d größer als das Vergleichsbezugsausgangssignal B ist (A > B), d.h. wenn das Ausgangs sign al 7d größer als das bestimmte Ausgangssignal ist, wie es für die Lautpause geeignet ist, so erzeugt die Vergleichsschaltung 11a den Lautpausen-Impuls (s). Im Fall von A<B gibt die Vergleicherschaltung 11a den Sprachimpuls (t) ab. 11b und 11c sind UED-Glieder zum Übertragen des Signals (s) oder (t) in Abhängigkeit von der Zuführung des Zeitgabeimpulses (r) von der Schaltungssteuereinheit 12d. Wird der Sprachimpuls (t) von der Vergleicherschaltung 11a abgegeben, so wird die zuvor erwähnte Wirkung wiederholt,bis ein Lautpausen-Impuls (s) erscheint. Wenn der erste Impuls (a) des nächsten Lautes erfaßt ist und der Impuls (s) erscheint, so erzeugt die Schaltungssteuereinheit 12d die Impulse (e), (1), (g)j (d1) und Cj") (Fig. 6). Daher wird die in S1Xg. 2 gezeigte Flip-llop-Schaltung 4e gesetzt und die Folge auf die 10 KETz-Taktimpulsgeneratorschaltung 6a umgeschaltet, wonach der 8-Bit-
809834/0760
Zähler 5 die 10 ΚΞζ-Taktimpulse zahlt ο Außerdem werden die Verriegelungen 7a bis 7d gelöschtο Wenn der erste Impuls (d) im zweiten Laut erzeugt wird, wird ein Inkrement impuls an den 4--Bit-Zähler 12c gegeben, um diesen vom vierten Zyklus £4-]auf den fünften Zyklus £53 weiterzuschalten»
Da die Arbeitsweisen bei dem fünften Zyklus bis zum zwölften Zyklus gleich den bereits beschriebenen sind, wird deren Beschreibung fortgelassen«. Die in I1Xg= 4- gezeigte Verriegelung 9b speichert den zentralen Wert des zweiten Laut und die Verriegelung 9c speichert den zentralen Wert des dritten Lautes. Außerdem erzeugt bei der Erfassung eines Lautpausenimpulses (h) (Fig* 11) beim dritten Laut die Schaltun gsSteuereinheit 12d den Impuls (c) als ein Wortendesignal, um den Sprachsignaleingang zu schalten=
Die höchstwertigen, d»h= oberen vier Bits der Ausgangssignale der Verriegelungen 9a bis 9c werden an die Eingänge von Addierern 10a bis 10c jeweils gegeben, um zu den ursprünglichen acht Bits hinzuaddiert zu werden, wodurch der zentrale Wert mit einer bestimmten Breite erzeugt wird., Dieses wird vorgenommen, da die Verriegelung 9a nicht immer mit der Verriegelung 9b infolge von der menschlichen Stimme eigenen Änderungen zusammenfällt, selbst wenn die Töne auf dem gleichen Pegel liegen= Es muß daher eine Tondifferenz vorgesehen sein, die breiter als ein Skalenwert ist, wenn eine Tonänderung in der erzeugten Sprache auftritt»
Dann vergleicht die erste Vergleicheranordnung 1Od das Signal £il der Verriegelung 9a mit dem Signal £2l von dem Addierer 10a und das Signal £3l von ώτ Verriegelung 9b mit dem Signal £4^ von dem Addierer 1Ob= Während die zweite Vergleicheranordnung 1Oe das Signal £1] von der Verriegelung 9b mit dem Signal £2] von dem Addierer 10b und das Signal £33 von der Verriegelung 9c mit dem Signal £4-3 von dem Addierer 10c
S08S34/07IÖ
vergleicht. Als Ergebnis dieser Vergleichsvorgänge werden die in Tabelle 2 gezeigten Zwei-Bit-Daten erzeugt. Wenn sich. z.B. der Ton eines aus drei Lauten gebildeten Wortes ändert, wie dieses in Pig. 12A gezeigt ist, so werden Ausgangssignale (11,01) erzeugt.
Tabelle 2
Vergleicherausgangssignal Eingang ^Eingang
(1) W
Eingang Eingang
(2) > (3)
2-Bit-Daten
Eingang^Eingang
(10 7 (3)
Eingang Eingang
(D < W
Eingang Eingang
(2) < (3)
11(Ton auf
wärts )
10 (Pegel
Ton)
Eingang Eingang
dl £ (3;
10(Pegel
Ton)
01 (Ton ab
wärts
Die in Pig. 12B gezeigte Tonänderung erzeugt Ausgangssignale (10,11). Neun Kombinationen dieser Aus gangs signale sind insgesamt möglich. Diese Kombinationen werden in der 4-Bit-Verriegelung 10f durch die Wirkung des Impulses (p) von der Schaltungssteuereinheit 12d gespeichert und zur Steuerung eines Elektromotors z.B. für eine "Greif"-Wirkung von künstlichen Händen benutzt. Each der Beendigung einer solchen "Greif-Wirkung erzeugt die Schaltungssteuereinheit 12d das Impulssignal (q) zum Löschen der 4-Bit-Verriegelung 10f unigibt dann Impulse (e), (1), (ά),(ό1), Cd"), (0), (O1) und (0"), um die Polge in ihren ursprünglichen Zustand zurückzuführen .
809834/0760
-yt- ■Λ\·
Obwohl die vorstehende Beschreibung der bevorzugten Ausführungsform in Verbindung mit der Erkennung eines aus drei Lauten gebildeten Wortes vorgenommen wurde, kann selbstverständlich ein Wort auch aus einem oder zwei Lauten gebildet sein. Anschließend wird die 51Ig. 13 erläutert.
Es wird angenommen, daß nur der erste Laut in das System eingegeben wird, die Folge bis zum dritten Zyklus in der gleichen Weise, wie zuvor beschrieben, fortgeführt wird , um den Symbolwert zu bestimmen, der in der Verriegelung Sagespeichert werden soll. Dann wird die Folge umgeschaltet auf die 300 Hz-Taktimpulsgeneratorschaltung 6b und der 8-Bit-Zähler 5 zählt die 300 Hz-Taktimpulse. In diesem Fall läuft der 8-Bit-Zähler 5 infolge des Fehlens des zweiten Lautes über, um den Impuls (h) abzugeben und die Schaltungssteuereinheit 12d überträgt den Impuls (c) zum Rücksetzen der Flip-Flop-Schaltung 4a zum Abschalten des Sprachimpulseinganges an sie. Unmittelbar danach wird der Impuls (q) zum Löschen der 4—Bit-Yerriegelung 1Of erzeugt. Gleichzeitig gibt die SchaitungsSteuereinheit 12d Impulse (u) und (v) in Fig. 13 ab, die nach ihrer Invertierung über Inverterschaltungen 10g und 10h die Ausgangssignale der Vergleicheranordnung 1Od und 1Oe an den UND-Gliedern 1Oi und 1Oj sperren. Dieses gibt den Impuls (p) an den Eingang der 4—Bit-Verriegelung 1Of und die letztere erzeugt Ausgangssignale (00,00), die das Ende des Wortes angeben, wie dieses in Fig. 12G gezeigt ist.
Im Fall, bei dem die ersten und zweiten Laute in das System eingegeben werden, jedoch der dritte Laut nicht eingegeben wird, wird die Folge bis zum siebten Zyklus in der gleichen Weise fortgeschaltet, wie dieses zuvor beschrieben wurde. Das heißt, die Symbolwerte der ersten und zweiten Laute werden in den Verriegelungen 9a und 9b jeweils gespeichert und der
809834/0760
8-Bit-Zähler 5 zälilt JOO Hz-Taktimpulse. In diesem Pail läuft der 8-Bit-Zähler 5 zum Aussenden des Impulses Ch) über, da der dritte Laut nicht erscheint. Die Elip-Flop-Schaltung 4a wird daher durch, den Impuls (c) zurückgesetzt. Dann wird die 4-Bit-Verriegelung 1Of durch, den Impuls Cq.) gelöscht und die Schaltungssteuereinheit 12d erzeugt nur den Impuls (v). Dadurch wird der Impuls Cp) zugeführt und nur das Ausgangssignal der Vergleicheranordnung 1Od wird über das TJHD-G-lied 10i an den Eingang der 4-Bit-Verriegelung 1Of gegeben. Dieses Eingangssignal weist z.B. CHjOO) auf, wie dieses in . 12D gezeigt ist.
Es ist darauf hinzuweisen, daß ein aus mehr als drei Lauten gebildetes Wort, erkannt werden kann, in dem die gleichen bisher beschriebenen Prinzipien angewendet werden. Außerdem kann ein Mikrocomputer zum Ausführen der Identifikation oder der Erfassungsverarbeitung der Tonänderung bei dem zuvor erwähnten bevorzugten Ausführungsbeispiel verwendet werden.
Auch die Klassifikation der Tonänderungen ist nicht auf die drei Muster, nämlich Ton aufwärts, Ton abwärts und Pegel Ton in Bezug auf den vorangegangenen Laut beschränkt , sondern die Klassifikation der Tonänderungen kann weiter unterteilt werden, indem die Tonänderungs-Erfassungsschaltung D modifiziert wird.
Die 51Ig. 14 bis 19 zeigen eine weitere Ausführungsform dsr Erfindung. Eine Stimmen-Erfassungsschaltung G- weist Bauteilschaltungen 51 bis 58 auf, wobei ein Mikrofon 51 an der Außenseite des Kehlkopfes der Quellenperson vorgesehen ist und ein einen logarithmischen Verstärker aufweisender Verstärker 52 zum Verstärken des Ausgangssignals des Mikrofons 51 auf einen geeigneten Pegel vorgesehen ist. Ein Bandpaßfilter 53 läßt Stimmen- oder Sprachsignale mit einem Frequenz-
809834/0780
band von etwa'50'bis 250 Hz "hindurch und bewirkt die Abtastung des Grundtonbestandteils des Sprachsignale, der ein den Skalenwert der Sprache darstellender Parameter ist, wie sie von der Quellenperson abgegeben wird- Eine Schmitt-Trigger-Schaltung 54· formt das Sinussignal, das in dem Bandpaßfilter abgetastet ist, in ein Rechtecksignal um und bewirkt außerdem die Beseitigung von Signalanteilen außer den Grundtonbestandteilen durch ihre Hystereseeigenschaft. Eine Folgesteuerung 55 bestimmt die zeitliche Wirkungsweise der gesamten Schaltung des Systems, an das ein Trigger-Signal gegeben wird, um seine Punktion als eine Aufbauzeit der Sprachen-Eingangssignalform zu betätigen. Ein Hülldetektor 56 zum Erfassen der Amplitude des Sprachensignals und ein Spitzendetektor 57 zum Erfassen des Maxim/alwerts der Amplitude des Signals, das von dem Hiilldetektor zugeführt wird und zum Festhalten dieses Maximalwertes sind ebenfalls vorgesehen. Ein Analog-Digital-Umformer 58 formt den analogen Wert des Ausgangssignals des Spitzendetektors 57 in einen digitalen Wert um»
Eine Zähle rs chal tun g H ist aus Schaltungen 59 bis 62 aufgebaut, die einen Taktimpulsgenerator 59 umfassen, der im wesentlichen genau Taktimpulse zum Messen der Periodendauer des Sprachensignals erzeugt. Ein Periodenzähler 60 zählt die Taktimpulse während der Dauer eines jeden Signalimpulses, der von der Schmitt-Trigger-Schaltung 54- nach Maßgabe des Steuersignals von der Folgesteuerung 55 zugeführt wird. Eine Frequenzteilerschaltung 61 teilt die Taktimpulsfrequenz um einen bestimmten Faktor, wie z.B. um 1/20. Ein Ehythmuszähler 62 wird von den Tasten mit einer von der Frequenzteilerschaltung 61 geteilten Frequenz betätigt, um das Zeitintervall zu zählen, während dem der Ton erzeugt wird.
09.Ϊ34/0760
Ein Digital-Bandpaß-Filter I ist aus Schaltungen 63 bis 66 aufgebaut. Die Schaltung 63 ist dabei ein Zähler-Puffer-Register zum zeitweiligen Speichern oder Verriegeln des Inhaltes des Periodenzählers 60. Ein Digitalvergleicher 64 vergleicht den Inhalt des Registers 63 mit den Inhalten eines Registers 65 für die obere Grundtongrenze und eines Registers 66 für die untere Grundtongrenze, die später noch beschrieben werden. Der Digitalvergleicher 64-erzeugt sein Ausgangssignal, wenn der Inhalt des Registers in einem Bereich liegt, der durch die Inhalte der die oberen und unteren Grenzen angebenden Register 65 und 66 bestimmt ist. Das Register 65 für die obere Grundtongrenze speichert eine bestimmte Anzahl von Zählerständen der oberen Grenze des Grundtons, während das Register 66 für die untere Grundtongrenze eine bestimmte Anzahl von Zählerständen der unteren Grenze des Grundtons speichert. Diese Grenzregister 65 und 66 arbeiten so, daß sie die Signale hindurchlassen, die eine frequenz innerhalb des Bereichs haben, der durch die Pegel cc und ß in dem Frequenz-Zeit-Diagramm (Fig. 15b) bestimmt ist, das die Ausgangssignalform des Bandpaßfilters 53 zeigt.
Eine Grundtonstabilisierungs- und Erfassungseinheit J weist Schaltungen 67 bis 70 auf, von denen die Schaltung 67 ein logarithmischer Umformer ist, der die Frequenz in musikalische Intervalle zur Handhabung der Grundtondifferenz als eine lineare Form umformt. Ein Datenstapel 68 speichert verschiedene Daten, d.h. vier Daten bei dem betrachteten bevorzugten Ausführungsbeispiel, die von dem logarithmischen Umformer zugeführt sind. Eine Symbolwert-Abtastschaltung 69 bestimmt einen Symbolwert aus verschiedenen Daten, die in dem Datenstapel 68 gespeichert sind. Ein Intervall-Vergleicher 70 bestimmt, ob jede der in dem Datenstapel 68 gespeicherten Daten innerhalb eines bestimmten Bereichs, z.B. einem Halbton, von dem Symbolwert liegen, der von der Symbolwert-
809834/0780
■ a>i.
Abtastschaltung 69 bestimmt ist.
Eine Muster-Erfassungseinheit K ist aus Schaltungen 71 bis 79 gebildet, von denen die Schaltung 71 ein Grundton-Datenstapel zum Stapeln eines Symbolwertes des Grundtons für * jeden Laut, der durch die Symbolwert-Abtastschaltung bestimmt ist. Eine musikalische Intervallmuster bildende Schaltung 72 bildet ein Muster von Grundtondaten, die in dem Grundtöndatenstapel 71 gestapelt sind, während ein Ehythmus-Datenstapel 73 die Daten der Tonlänge stapelt, die von dem zuvor erwähnten Rhythmuszähler 72 gezählt· sind* Eine ein Rhythmusmuster bildende Schaltung 7^ bildet ein Muster für die Rhythmusdaten, die in dem Rhythmusdatenstapel 73 gestapelt sind, und ein Stärke-Datenstapel 75 speichert Stärkedaten des Tons, die ein Ausgangssignal des Analog-Digital-Umformers 58 sind. Eine ein Stärkemuster bildende Schaltung 76 bildet ein Muster der Stärkedaten, die in dem Stärkedatenstapel 75 gespeichert sind» Eine Befehlswort-Datenbank 77 speichert vorbestimmte Musterdaten von Befehlsworten. Eine Muster-Anpassungsschaltung 78 synthetisiert die Muster, die von der das musikalische Intervallmuster bildenden Schaltung 72, der das Rhythmusmuster bildenden Schaltang 7^ und der das Stärkemuster bildenden Schaltung 76 zugeführt sindo Diese Muster-Anpassungsschaltung 78 vergleicht auch das synthetisierte Muster mit dem Muster des Befehlsworts, das in der Befehlswort-Datenbank gespeichert ist» Eine Ausgangssignal-Umformerschaltung 79 formt das Befehlswort-Ausgangssignal von der Anpassungsschaltung 78 in ein Signal um, das zum Steuern einer Maschine oder eines anderen, extern vorgesehenen Gerätes benutzt werden kannο
809834/0760
• aa·
Anschließend "wird die Wirkungsweise des erfindungsgemäßen Systems mit dem zuvor erläuterten Aufbau angegeben.
Es wird angenommen, daß die Quellenperson vier Laute abgegeben hat, wie dieses in der Sprachen- Eingangshüllkurve in Fig. 15a dargestellt ist, wobei diese Sprachinformation durch das Mikrofon 51 aufgenommen wird, das an der Außenseite des Kehlkopfes, vorzugsweise an einer Stelle unmittelbar unterhalb des Adamsapfels vorgesehen ist, wo höhere Frequenzkomponenten und Sprachzieheigensc&aften einen relativ geringen Einfluß haben, und wird dann su ihrer Verstärkung an den Verstärker 52 gegeben. Die Sprachinformation hat einen G-rundtonbestandteil, der von dem Bandpaßfilter 53 abgetastet ist, das das Frequenzband von z.B. 50 bis 2>O Hz hindurchläßt. In dem abgetasteten Sinussignal werden dann die sich von den Grundtonkomponenten unterscheidenden Signalanteile infolge der Kystereseeigenschaft der Schmitt-Triggerschaltung beseitigt, die dem Bandpaßfilter folgt, wobei das Sinussignal mit Hilfe der Schmitt-Trigger-Schaltung 54- in eine in Fig. 15c gezeigte Rechteckwelle umgewandelt wird. Für eine weibliche Stimmquelle kann das Bandpaßfilter auf eine höhere Frequenz umgeschaltet werden.
Das Ausgangssignal des Verstärkers 52 wird an den Hülld etektor 55 gegeben, der die Amplitude erfaßt. Der Spitzenwert der Amplitude wird durch den Spitzendetektor 57 (Fig. 15d) erfaßt und festgehalten. Dann wird dieser Spitzenwert in einen Digitalwert mit Hilfe des Analog-Digital-Umformers 58 umgeformt.
Bei der Anordnung des erfindungsgemäßen Systems beginnt die Folgesteuerung 55 ihre Arbeitsweise bei dem Aufbauteil des Ausgangsimpulses von der Schmitt-Trigger-Schaltung 54. Zu-
809834/0780
sätzlich zu dem vorerwähnten Beginn bei dem Aufbauteil des Spracheneingangssignals, das anschließend als erster Beginn bezeichnet wird, hat die !Folgesteuerung 55 zwei weitere Beginnweisen. So beginnt sie ebenfalls, wenn der Periodenzähler 60 überläuft, z.B. durch 50 ms, zwischen aufeinanderfolgenden Lauten, was nachfolgend als der.zweite Beginn bezeichnet wird, und wenn der Rhythmuszähler 62 überläuft, z.B. durch 500 ms, infolge des Endes des Befehlswortes, was anschließend als dritter Beginn bezeichnet wird. In diesem Fall ist die als ein Unterbrechungsintervall zu bestimmende Zeitdauer die, bei der der Periodenzähler 60 überläuft, jedoch der Ehythmuszähler 62 noch nicht überläuft.
Die Folge der Arbeitsweise wird jetzt in Verbindung mit den in Fig. 16 gezeigten Flußdiagrammen und der folgenden Figuren erläutert.
Wie in Fig. 16 gezeigt ist, nimmt das das erfindungsgemäße System aufweisende Gerät vier Zustände an, die einen Zustand, bei dem das System auf den Beginn eines Lautes wartet, einen Zustand, bei dem die Daten eingegeben werden, einen Zustand, bei dem das System auf eine Lautpause wartet, und einen Zustand umfaßt, bei dem die Daten keine Befehlsworte aufweisen und zurückgewiesen werden«, Diese vier Zustände sind als Phasen 0 bis 3 in dieser Reihenfolge jeweils bezeichnet.
Da der Zustand in der Phase 0 beim Start des ersten Beginns der Folgesteuerung 55 sich befindet, ist der Ehythmuszähler 62 zurückgesetzt. Dann erzeugt der Taktimpulsgenerator 69 sein Aus gangs signal und der Perioden zähler 60 und der Rhythmus zähl er 62 beginnen ihre Zählung«. Das Auftreten eines Spracheneingangs zu diesem Zeitpunkt bewirkt die Umschaltung des Zustandes von der Phase 0 auf die Phase 1, nämlich
809834/01
.au.
den Beginn-Warte zustand, und die Polgesteuerung 55 wird angehalten.
Wenn der Aufbauteil des nächsten Impulses von der Schmitt-Trigger-Schaltung 54- an die Folgesteuerung 55 gegeben wird, werden die in dem Periodenzähler 60 enthaltenen Daten in dem Zählerpufferregister 63 verriegelt oder gespeichert, da jetzt der Zustand sich nicht in der Phase O, sondern in der Phase 1 befindet. Wenn die Grundtondaten eingegeben sind, werden die Daten in dem Periodenzähler 60 in dem Zählerpufferregister 63 verriegelt und dann der Periodenzähler 60 zurückgesetzt, der erneut Taktimpulse zu zählen beginnt. Anschließend werden die in dem Zählerpufferregister 63 gespeicherten Daten in dem Digitalvergleicher 64 mit den Werten verglichen, die in den oberen und unteren Grundtongrenzen-Registern 65 und 66 gespeichert sind, nämlich die Werte bei den Pegeln <x und ß, wie dieses in IPig. 15b gezeigt ist. Befinden sich die von dem Register 63 zugeführten Daten außerhalb des durch die Daten in den Registern 65 und 66 bestimmten Bereiches, so nimmt das System einen V/arte zustand an, bis die nächsten Daten eingegeben werden. Befinden sich die von dem Register 63 zugeführten Daten in dem durch die voreingestellten Werte oo und ß bestimmten Bereich, so werden die Daten in dem Zählerpufferregister 63 einer logarithmischen Umformung in der logarithmischen Umformerschaltung 67 ausgesetzt und die umgeformten Daten in dem Datenstapel 68 gespeichert. Danach wird die zuvor erwähnte Arbeitsweise wiederholt, um zu bestimmen, ob die Anzahl der Daten in dem Datenstapel 68 einen bestimmten Wert erreicht hat oder nicht. Ist dieser bestimmte Wert nicht erreicht, so wird der Eingangswarte zustand angenommen und die Daten wiederholt eingegeben. Wenn eine bestimmte Anzahl von Daten, nämlich 4- Daten bei dem bevorzugten Ausführungsbeispiel, in dem Datenstapel 68 gespeichert sind, bestimmt die Symbolwert-Abtastschaltung 69 einen Mittelwert, der dann als ein
809834/Q7ßö
Symbolwert in den Intervallvergleicher 70 eingegeben wird. Dieser Intervallvergleicher 70 vergleicht jede der Daten von dem Datenstapel 68 mit dem in der vorstehend angegebenen Weise bestimmten Symbolwert« Befinden sich, irgendwelche der Daten in dem Datenstapel 68 außerhalb des Bereiches, so gibt der Datenstapel 68 die anfangs gestapelten Daten ab und nimmt den Eingangswartezustand an. Danach wird die zuvor erwähnte Arbeitsweise wiederholt und die Daten erneut eingegeben, wobei die Symbolwert-Abtastschaltung 69 den Mittelwert der eingegebenen Daten in der vorstehend beschriebenen Weise bestimmt. Der Intervallvergleicher 70 vergleicht alle Daten mit dem Symbolwert. Diese Arbeitsweise wird wiederholt, bis alle Daten in einen bestimmten Bereich von dem Symbolwert gebracht sind= Wenn alle Daten in einen bestimmten Bereich von dem Symbolwer-t gebracht sind, so wird der Symbolwert in den Datenstapel 7^ für das musitalische Intervall eingegeben und dort gespeichert» Unter diesen Bedingungen nimmt das System den Wartezustand auf eine Lairtpause an, nämlich die Phase 2, in der auf das nächste Eingangssignal gewartet wird»
Wird dann das Impulseingangssignal von der Schmitt-Trigger-Schaltung 5^ erzeugt, so wird der Periodenzähler 60 zurückgesetzt, jedoch werden die Daten nicht angenommen, wenn das System sich in dem Eingangswartezustand befindet, da der Zustand weder die Phase 0 noch die Phase 1 ist* Danach be-, wirkt die folgesteuerung 55 die Wiederholung der zuvor erwähnten Arbeitsweise, bis der zweite Beginn auftritt.
Wie in Figo 17 gezeigt ist, wird beim zweiten Beginn der Folgesteuerung 55? nämlich, wenn der Periodenzähler 60 überläuft? zuerst bestimmt, ob der Zustand die Phase 2 ist oder nicht. Liegt der Zustand in der Phase 1, was angibt, daß stabile Grundtondaten nicht erhalten wurden, wird
der Zustand auf die Phase 3 weitergeschaltet, um die eingegebenen Worte zurückzuweisen, wobei das System wieder den Eingangs warte zustand annimmt. Befindet sich, der Zustand in der Phase 3i so ist die Arbeitsweise identisch der unmittelbar zuvor beschriebenen.
Befindet sich der Zustand in der Phase 2, so werden die Daten in dem Rhythmuszähler 62 in dem Hhythmusdatenstapel 73 gespeichert und die Daten in dem Analog-Digital-Umformer 58 werden in dem Stärke-Datenstapel 75 gespeichert. Dann wird bestimmt, ob die Anzahl der Daten in dem Datenstapel 71 für das musikalische Intervall, in dem Rhythmusdatenstapel 73 und in dem Stärkedatenstapel 75 vier oder mehr ist. Ist die Anzahl der Daten geringer als 4-, wird der Periodenzähler 60 zurückgesetzt und seine Zählung beendet. Während der Rhythmuszähler 62 zurückgesetzt ist und die Zählung erneut beginnt, nimmt das System den Singangswartezustand an.
Danach wird die zuvor erwähnte Wirkungsweise erneut von dem ersten Beginn aus wiederholt und wenn vier oder mehr Daten in den Datenstapeln gespeichert sind, wird der Zustand auf die Phase 3 umgeschaltet, um das als Daten eingegebene Wort als ein JTichtbefehlswort zurückzuweisen. Dann nimmt das System wieder den 3ingangs-Wartezustand an.
Wie in S1Xg. 18 gezeigt ist, wird beim dritten Beginn der Folgesteuerung 555 nämlich, wenn der Rhythmuszähler 52 überläuft, bestimmt, ob der Zustand sich in der Phase 3 befindet oder nicht. Befindet sich der Zustand in der Phase 3» so wird das System allgemein zurückgesetzt. Mit anderen Worten, alle Register werden zurückgesetzt und die Zählerarbeitsweise beendet. Der Zustand wird auf dfe Phase 0 umgeschaltet und die Folgesteuerung 55 beendet ihre Arbeitsweise.
809834/0700
Befindet sich, der Zustand nicht in der Phase 3, so werden die Daten in dem Datenstapel 71 für das musikalische Intervall, in dem Rhythmusdatenstapel 73 und dem Stärkedatenstapel 75 in Muster in der das musikalische Intervallmuster bildenden Schaltung 72, in der das Rhythmusmuster bildenden Schaltung 74- und in der das Stärkemuster bildenden Schaltung 76 durch einen relativen Vergleich der jeweiligen Daten geformt und die so in Muster geformten Daten werden in der Musteranpassungsschaltung 78 in ein Muster synthetisiert, wie dieses in J1Ig. 19 gezeigt ist. Dann wird dieses Muster in der Mu st eranpas sungs schaltung 78 mit dem Muster von der Befehlswort-Datenbank 77 verglichen, um zu bestimmen, welchen Befehl das aus der Sprache erhaltene Muster angibt und welche ■^unktionsart das gesteuerte System, wie eine Maschine, ausführen soll. Dieser Ausgangsbefehl wird von der Ausgangssignalumformer schaltung 79 in ein Signal umgeformt, das eine bestimmte Funktion bei der gesteuerten Maschine bewirkt, lach der Beendigung dieser Funktion wird das System allgemein zurückgesetzt und in den Befehlswort-Wartezustand umgeschaltet, in der es auf ein Eingangssignal wartet.
Wie zuvor vollständig beschrieben wurde, schafft die Er3L ndung ein neues Stimmenidentifikationssystem,, bei dem ein Mikrofon an der Außenseite des Kehlkopfes der Quellenperson vorgesehen ist, wo der Rauschpegel relativ niedrig ist und die Stimme einer Erfassung unterworfen wird, indem sie in Laute unterteilt wird. Außerdem werden die Signalformen in den Anfangsperioden, die nicht als ein Stimmgeräusch stabilisiert werden, erfindungsgemäß beseitigt und die verbleibenden Perioden zur Bestimmung eines Wertes aufgenommen, der symbolisch für die Anzahl von Taktimpulsen in diesen ist. Das von einer Yielzahl von derart bestimmten Symbolwerten gezeigte Tonänderungsmuster wird einer Sortierung zum Bewirken einer bestimmten Steuerfunktion an einem zu steuernden Gerät unterworfen. Das mit Hilfe der zweiten Ausführungs-
form erläuterte System erfaßt den Grundton, die Dauer und die Stärke des Geräusches von jedem der Befehlsworte und synthetisiert diese Faktoren in musikalische !Toten. Auf diese Weise kann eine schnellere Geschwindigkeit bei der Spracherfassung unabhängig davon erreicht werden, ob die Stimme oder Sprache gewöhnliche Töne oder Summtöne enthält. Auch die Verwendung eines vereinfachten Musteranpassungssystems stellt eine höhere Geschwindigkeit der Spracherfassung sicher. Außerdem ermöglicht die Kombination von zwei oder drei Mustern, daß eine Vielzahl von Befehlsworten in geeigneter Weise identifiziert werden.
809834/0760
Leerseite

Claims (1)

  1. PATENTANWÄLTE A. QRUNECKER
    DIPU-IhXl
    H. KINKELDEY
    DR-ING.
    W. STOCKMAIR
    DR-ING. · Aa6 (CALTECHi
    K. SCHUMANN
    OR REa NAT. · DlPL-PHVS.
    P 12 394 . - ^
    "\ - G. BEZOLD
    = Da RER.NAT.· DIPL-CHEM.
    8 MÜNCHEN 22
    MAXIMILIANSTRASSE 43
    Patentansprüche
    Λ J Stimmenidentifikationssystem, gekennzeichnet durch eine Einrichtung (A,G) zum Erfassen von Geräuschen, die in einer in Lauten unterteilten Form erzeugt sind, über ein an der Außenseite des menschlichen Körpers vorgesehenes Mikrofon (1,51), durch eine Einrichtung (B, I) zum Abtasten einer Grundfrequenz aus dem bei jedem Laut erfaßten Geräusch, durch eine Einrichtung (D,K) zum Bilden eines bestimmten Musters aus der abgetasteten Frequenz und durch eine Einrichtung (78) zum Sortieren der bestimmten Muster.
    2. System nach Anspruch 1, dadurch gekennzeichnet, daß die Abtasteinrichtung (B,I) eine Einrichtung (65,66) zum Beseitigen verschiedener anfänglicher Perioden eines äeden Lautes und zum Bestimmen eines Wertes, der symbolisch für die Messungen der verbleibenden verschiedenen Perioden ist, die den beseitigten verschiedenen Perioden folgen, aufweist.
    5. System nach Anspruch 2, dadurch gekennzeichnet, daß die Musterbildungseinrichtung (D,K) eine Ein-
    809S34/07I0
    TELEFON (OSS) Qa SS SQ TELHX OS-QSSQO TELEGRAMME MONAPAT TELEKOPIERER
    ORIGINAL INSPECTED
    richtung (10) zum Bestimmen eines Küsters aus der Tonänderung in dem abgetasteten Grundger aus eh. aufweist.
    4-, System nach Anspruch. 2, dadurch. gekennzeichnet, daß die Musterbildungseinrichtung (E) eine Einrichtung (72,74-,76) zum Bestimmen jedes Musters aus mindestens zwei Tonänderungen des genannten Wertes, der symbolisch für jeden Laut, die Dauer des Geräusches in jedem Laut und die Änderung in der Stärke des Geräusches in jedem Laut ist, und eine Einrichtung (78,79) zum Synthetisieren der bestimmten Muster in ein durch eine musikalische Note dargestelltes Signal, aufweist.
    809834/0780
DE19782806920 1977-02-21 1978-02-17 Stimmenidentifikationssystem Ceased DE2806920A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1714377A JPS5945160B2 (ja) 1977-02-21 1977-02-21 音声識別方法
JP370278A JPS5497304A (en) 1978-01-19 1978-01-19 Voice identifying system

Publications (1)

Publication Number Publication Date
DE2806920A1 true DE2806920A1 (de) 1978-08-24

Family

ID=26337335

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19782806920 Ceased DE2806920A1 (de) 1977-02-21 1978-02-17 Stimmenidentifikationssystem

Country Status (5)

Country Link
US (1) US4178472A (de)
DE (1) DE2806920A1 (de)
FR (1) FR2381369A1 (de)
GB (1) GB1594412A (de)
NL (1) NL7801789A (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4388495A (en) * 1981-05-01 1983-06-14 Interstate Electronics Corporation Speech recognition microcomputer
US4468804A (en) * 1982-02-26 1984-08-28 Signatron, Inc. Speech enhancement techniques
ATE45831T1 (de) * 1983-05-18 1989-09-15 Speech Systems Inc Spracherkennungssystem.
GB2145864B (en) * 1983-09-01 1987-09-03 King Reginald Alfred Voice recognition
EP0248593A1 (de) * 1986-06-06 1987-12-09 Speech Systems, Inc. Vorverarbeitungssystem zur Spracherkennung
FR2622727A1 (fr) * 1987-10-29 1989-05-05 Feart Michel Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre
US5471527A (en) 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US20090222270A2 (en) * 2006-02-14 2009-09-03 Ivc Inc. Voice command interface device
US20080109227A1 (en) * 2006-11-06 2008-05-08 Aten International Co., Ltd. Voice Control System and Method for Controlling Computers
US8862476B2 (en) * 2012-11-16 2014-10-14 Zanavox Voice-activated signal generator
US11133004B1 (en) * 2019-03-27 2021-09-28 Amazon Technologies, Inc. Accessory for an audio output device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3197560A (en) * 1944-12-29 1965-07-27 Bell Telephone Labor Inc Frequency measuring system
US3102165A (en) * 1961-12-21 1963-08-27 Ibm Speech synthesis system
GB1435779A (en) * 1972-09-21 1976-05-12 Threshold Tech Word recognition
DE2536585C3 (de) * 1975-08-16 1981-04-02 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur statistischen Signalanalyse

Also Published As

Publication number Publication date
US4178472A (en) 1979-12-11
GB1594412A (en) 1981-07-30
FR2381369B1 (de) 1984-08-17
FR2381369A1 (fr) 1978-09-15
NL7801789A (nl) 1978-08-23

Similar Documents

Publication Publication Date Title
DE2918533C2 (de)
DE2953262C2 (de)
DE2753277C2 (de) Verfahren und Einrichtung zur Spracherkennung
DE3645118C2 (de)
DE2518561C3 (de) Einrichtung zur Erzeugung von Arpeggio-Effekten durch ein elektronisches Musikinstrument
DE2820645A1 (de) Vorrichtung und verfahren zur spracherkennung
DE2034623C2 (de) Verfahren für das Erkennen von Sprachsignalen in Rauschen
DE2326517A1 (de) Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern
DE3407078A1 (de) Elektronisches musikinstrument
DE2806920A1 (de) Stimmenidentifikationssystem
DE2659096A1 (de) Verfahren und vorrichtung zur spracherkennung
DE2650255A1 (de) Schaltungsanordnung zur automatischen erkennung kontinuierlicher sprachsignale, insbesondere eines oder mehrerer kontinuierlich gesprochener worte oder zahlen
DE4031638C2 (de)
DE3043516C2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE2836738C3 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtungen zur Durchführung des Verfahrens
DE2748422C2 (de) Polyphones elektronisches Musikinstrument
DE1422040A1 (de) Verfahren zum automatischen Erkennen gesprochener Worte
DE2836736A1 (de) System zum kodieren von tiefen- und hoehenausdruckseffekten bei der aufnahme von der tastatur eines elektronischen klaviers
DE2844703C2 (de) Elektronisches Musikinstrument mit einer Einrichtung zum Erzeugen unterschiedlicher Arten von Musiktönen
DE2854601C2 (de) Verfahren zur Tonaufbereitung und Ton-Synthesator zu seiner Durchführung
DE3246712C2 (de)
DE2901969A1 (de) Elektronisches musikinstrument mit einer einrichtung zur erzeugung variabler impulse
DE2431458A1 (de) Verfahren zur automatischen sprechererkennung
DE1547002A1 (de) Vorrichtung,die auf gesprochene Informationen anspricht,insbesondere phonetische Schreibmaschine
DE1202517B (de) Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern

Legal Events

Date Code Title Description
OAP Request for examination filed
OD Request for examination
8131 Rejection