DE2806920A1 - Stimmenidentifikationssystem - Google Patents
StimmenidentifikationssystemInfo
- Publication number
- DE2806920A1 DE2806920A1 DE19782806920 DE2806920A DE2806920A1 DE 2806920 A1 DE2806920 A1 DE 2806920A1 DE 19782806920 DE19782806920 DE 19782806920 DE 2806920 A DE2806920 A DE 2806920A DE 2806920 A1 DE2806920 A1 DE 2806920A1
- Authority
- DE
- Germany
- Prior art keywords
- pulse
- circuit
- sound
- signal
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 230000008859 change Effects 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 11
- 238000005259 measurement Methods 0.000 claims description 2
- 230000007261 regionalization Effects 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000033764 rhythmic process Effects 0.000 description 19
- 238000001514 detection method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 210000000867 larynx Anatomy 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 235000016838 Pomo dAdamo Nutrition 0.000 description 2
- 244000003138 Pomo dAdamo Species 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- RDZGDBJFHDKEDD-UHFFFAOYSA-N dcho Chemical compound C1C2=CC=CCC2=C2OC2=C2CC=CC=C21 RDZGDBJFHDKEDD-UHFFFAOYSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Description
PATENTANWÄLTE m. GRÜNECKER
H. KINKELDEY
DR-ING.
W. STOCKMAlR
jt DR-ING. - Aee (CALTECH)
^ K. SCHUMANN
DR PERNAT.: DIPL-PHYS.. _ ..
P. H. JAKOB
Dl PL-ING.
G. BEZOLD
Hiroyasu FLTNAEUBO 8 München 22
■.-. ,-, „ r-i ι. ,-.... .... MAXIMIUANSTRASSE 43
Ho. 2-17-4 Nxshxogx-kxta
Suginami-ku, Tokyo Japan 167
Suginami-ku, Tokyo Japan 167
17=Februar 1978.
Stimmenidentifikationssystem
Die Erfindung bezieht sich, auf ein Stimmenidentifxkatxonssystem
zum Steuern einer mechanischen oder elektrischen Einrichtung, wie angetriebenen künstlichen Händen oder Manipulatoren,
mit Hilfe codierter Stimmensignaleο
Bei derartigen, bisher vorgeschlagenen Systemen wurden verschiedene
Stimmensignale von einer Person, die eine Stimmenquelle darstellt und nachfolgend als eine Quellenperson bezeichnet
wird, einer Frequenzanalyse unterworfen, um als getrennte Muster in einem Speicher gespeichert zu werden,
wobei ein anschließend von der Quellenperson erzeugtes Stimmensignal der gleichen Frequenzanalyse unterworfen wird, um
mit den gespeicherten Mustern verglichen zu werden und zu bestimmen, welcher Art von Stimmensignal das letztere ist«. "
Bei diesem zuvor beschriebenen bisherigen Verfahren treten bei dem Mustervergleich jedoch viele Schwierigkeiten auf,
da die Stimmensignale von der gleichen Quellenperson sich von Tag zu Tag oder von Zeit zu Zeit hinsichtlich des Inter-
' 4*
valls zwischen Silben oder der Betonung unterscheiden, wobei
außerdem die für solche bisherigen Systeme benötigten Einrichtungen große Abmessungen haben und teuer in der Herstellung
sind.
Die vorliegende Erfindung wurde geschaffen, um die vorstehenden Nachteile der bisherigen Systeme zu beseitigen.
Es ist daher ein Ziel* der Erfindung, ein neues Stimmenidentifikationssystem
zu schaffen, das eine Sprachinförmation selbst dann erlaubt, wenn diese in geeigneter Weise zu identifizierende
Summtöne wie auch gewöhnliche Vokaltöne enthält.
Ein weiteres Ziel der Erfindung ist es, ein solches Stimmenidentifikationssystem
zu schaffen, bei dem eine höhere Geschwindigkeit der Stimmenerkennung erreicht werden kann, da
es ein einfacheres Musteranpassungssystem benutzt.
Ein weiteres Ziel der Erfindung ist es, ein solches Stimmenidentifikationssystem
zu schaffen, bei dem eine Vielzahl von Befehlsworten in geeigneter Weise durch eine vereinfachte
Anordnung erkannt werden kann, da eine Kombination von musikalischen Intervallmustern und Bhythmusmustern oder eine weitere
Kombination dieser Kombination mit der Geräuschstärke benutzt wird.
Gemäß einem bevorzugten Gedanken der Erfindung wird bei dem Stiinmenidentifikationssystem Sprachgeräusch in ein Impulssignal
umgeformt, das seinerseits einer Wellentransformation, einer Zeitintervallanalyse und ähnlichen Wirkungen unterworfen
wird. Dann wird (jeder Wert, der symbolisch für einen Laut (mora) ist, in dem Sprachgeräusch bestimmt. Diese
Stimmenerkennung wird durch Benutzung einfacher Musteranpassungssysteme erreicht, die eine höhere Geschwindigkeit
der Stimmenerkennung unabhängig davon sicherstellt, ob die
Stimme gewöhnliche Töne oder Summtöne enthält.
808834/0780
Diese und andere Ziele sowie Merkmale der Erfindung ergeben
sich aus der folgenden detaillierten Beschreibung einer bevorzugten
Ausführungsform anhand der Zeichnungen » Im einzelnen zeigt:
Fig. 1 ein Blockschaltbild der Gesamtanordnung des erfindungsgemäßen
Stimmenidentifikationssystems,
Pig. 2 einen Stromlaufplan der Zählerschaltung in Figo 1,
Fig. 3 einen Stromlaufplan der Symbolwert-Abtastschaltung
der Fig. 1,
Fig. 4 einen Stromlaufplan der Tonänderungs-Erfassungsschaltung
der Fig. 1,
Fig. 5 einen Stromlaufplan der Lautpausen-Erfassungsschaltung
in Fig. 1,
Fig. 6 einen Stromlaufplan der Systemsteuereinheit der Fig..1,
Fig. 7 bis 11 Zeitdiagramme, die die zeitliche Beziehung der
Arbeitsweise des erfindungsgemäßen Systems angeben,
Fig. 12 A bis 12 D die Änderung von Lauten angebende Diagramme
,
Fig. 13 einen Stromlaufplan einer weiteren bevorzugten Ausführungsform
der in Fig. 4 gezeigten Tonänderungs-Erfassungsschaltung,
Fig. 14 ein Blockschaltbild einer weiteren Ausführungsform
des erfindungsgemäßen Stimmenidentifikationssystems,
609834/0780
15 ein Signaldiagramm , das eine an jeder Bauteilschaltung
der Stimmenerfassungsschaltung der 51Xg. 14- auftretende
Signalform zeigt,
Fig. 16 bis 18 Elußdiagramme zur Erläuterung der Wirkungsweise
der Einrichtung und
IPig. 19 ein Diagramm einer Musterform von Befehlsworten.
In dem in Fig. 1 gezeigten Blockschaltbild des gesamten Systems ist A eine Stimmenerfas sungs schaltung, die Stimmensignale
von der Quellenperson in Impulssignale umformt. In dieser Stimmenerfassungsschaltung A bezeichnet 1 ein
an der Außenseite des Kehlkopfes der Quellenperson vorgesehenes Mikrofon und 2 ein Bandpaßfilter von 50 bis 250 Hz,
das ein Basisfrequenzband der Sprachstimmbandschwingung ist.
Das Filter 2 tastet den Grundtonbestandteil des Stimmensignals ab,'das ein die Einteilung der Stimmge rausche angebender Parameter
ist, wie sie von der Quellenperson abgegeben werden. Das Filter 2 weist einen Verstärker auf. Eine Schmitt-Trigger-Schaltung
3 formt das von dem Filter 2 abgetastete Sinussignal in ein Rechtecksignal um. Die Schmitt-Trigger-Schaltung
3 dient auch zum Beseitigen aller Wellenformen außer den Grundtonbestandteilen dirch ihre Hystereseeigenschaft.
Eine Zählerschaltung B mißt mit Hilfe eines ausgewählten
Taktes die Periodendauer des Rechtecksignals am Ausgang der Schmitt-Trigger-Schaltung 3· Eine Verknüpfungsschaltung 4-steuert
das Rechteck-Impuls signal von der Schmitt-Trigger-Schaltung
3 und wahlweise Takte. Ein Zähler 5 zählt wahlweise eine Vielzahl von TaktimpulsSignalen, die von einer
Taktimpulsgeneratorschaltung 6 zugeführt werden, die
später noch näher beschrieben wird, während der Dauer eines
809834/0760
Eingangssignals von der Stimmenerfassungsschaltung A. Die Taktimpulsgeneratorschaltung 6 erzeugt eine Vielzahl von
Taktimpulssignalen von z.B. 10 KHz und 300 Hz.
Eine Symbolwert-Abtast schaltung C speichert die Anzahl von
Impulsen in jeder Gruppe von Taktimpulsen von der Zählerschaltung B zur Bestimmung des Symbolwerts, der der zentrale
Wert der Anzahl von Impulsen in der betrachteten bevorzugten Ausführungsform ist. In der Symbolwert-Abtastschaltung C
ist eine Anordnung von "Verriegelungsschaltungen 7 zum Speichern
der Anzahl von Taktimpulsen in jeder Gruppe und ein Vergleicher 8 vorgesehen, der die Anzahl der von den jeweiligen
Verriegelungsschaltungen in dieser Anordnung 7 zugeführten Taktimpulse vergleicht, um den Symbolwert oder zentralen
Wert der Anzahl von Taktimpulsen zu bestimmen.
Eine Tonänderungs-Erfassungsschaltung D speichert den Symbolwert für jeden Laut (mora),um den Ton für jeden Laut
zu erfassen. In der Tonänderungs-Erfassungsschaltung D speichert eine Anordnung 9 von Verriegelungsschaltungen den Symbolwert
für jeden Laut und ein Vergleicher 10 vergleicht die Anzahl der von den jeweiligen Verriegelungsschaltungen 9 zugeführten
Taktimpulse, um die Änderung in der Anzahl von
Taktimpulsen, d.h. den Ton für jeden Laut zu erfassen.
Eine Lautpausen-Erfassungsschaltung E erfaßt die Lautpausen unter Benutzung der Ausgangssignale der genannten Verriegelungsschaltungen in der Symbolwert-Abtastschaltung C0 In
der Lautpausen-Erfassungsschaltung E vergleicht ein Vergleicher 11 die Ausgangssignale der Verriegelungsschaltungen 7
mit einem bestimmten Wert«
Eine System-Steuereinheit Έ gibt Impuls signale an die zuvor
erwähnten jeweiligen Blöcke A bis E9 um eine aufeinanderfolgende
Steuerfunktion dieser Blöcke zu bewirken=
'809-834/07SÖ
Die Grundarbeitsweise des erfindungsgemäßen Stimmenidentifikation
ssystems wird in Verbindung mit Fig. 2 und den folgenden Zeichnungen anhand der in ihnen enthaltenen Zeitdiagramme
näher erläutert.
Es wird angenommen, daß drei Laute, z.B. {ytsu3, [kai und [mel,
was in der japanischen Sprache "greifen" heißt, wenn diese als ein einziges Wort ausgesprochen werden, von der Quellenperson
erzeugt werden, wie dieses durch die Spracheingangshüllkurven in Fig. 7 gezeigt ist, wodurch das an der Außenseite des
Kehlkopfes vorgesehene Mikrofon, das vorzugsweise an einer Stelle unmittelbar unterhalb des Adamsapfels angeordnet ist,
wo höhere Frequenzkomponenten und Vokalgegendeigenschaften relativ geringe Wirkungen haben, nimmt die von der Quellenperson
erzeugte Stimminformation auf. Dann wird die Stimminformation in das Filter 2 gegeben, wobei sie ein Frequenzband
Von 50 bis 250 Hz durchläuft, damit die Grundtonbestandteile
in ihr abgetastet und verstärkt werden. Das so abgetastete Sinussignal wird von der nachfolgenden Schmitt-Trigger-Schaltung
3 in ein Eechtecksignal umgeformt. Für eine weibliche Sprachquelle
kann das Bandpaßfilter auf eine höhere Frequenz verstellt werden. Infolge der Hystereseeigenschaften der Schmitt-Trigger-Schaltung
3 wird das Eechtecksignal einer weiteren Beseitigung von Wellenanteilen unterworfen, die sich von den
Grundtonbestandteilen unterscheiden. Dieses Eechtecksignal ist das Ausgangssignal eines Schmitt-Triggers in Fig. 7 und
wird in den Fig. 9 bis 11 als eine vergrößerte Signalform (a) gezeigt.
Die Folge der Arbeitsweise des Gesamtsystems wird im einzelnen in Verbindung mit Fig. 7 erläutert. Zuerst bezeichnet
CO} einen Eingangswartezyklus, bei dem alle Schaltungen auf
ihren Anfangszustand zurückgesetzt sind. f1J j[53 und [9!
bezeichnen einen Anfangsperioden-Beseitigungszyklus, der einer Aufbauperiode eines jeden Lautes entspricht, bei der
809834/0760
der instabile Teil der Impulssignale, d=lu der erste Impuls
bei dem hier betrachteten bevorzugten Ausführungsbeispiel, beseitigt wird» £21 ? ^q] und£103 bezeichnen einen Zyklus,
bei dem ein Impulssignal, d=h» ein Rechtecksignal, das aufgenommen werden soll, bestimmt ist und 9 bei dem hier
betrachteten bevorzugten Ausführungsbeispiel, werden drei Impulssignale vom zweiten bis zum vierten*Impuls, dcho Rechtecksignale,
bei jedem Laut der Messung einer Anzahl von Taktimpulsen in ihnen ausgesetzte
Beim durch C 33 > L 73 und C111 bezeichneten Zyklus wird ein
Impulssignal, d.iu Rechtecksignal, das für jeden Laut symbolisch
ist, aus den zuvor erwähnten drei ImpulsSignalen ausgewählt.
Bei der hier betrachteten, bevorzugten Ausführungsform wird ein Impulssignal mit einem zentralen Wert in Ausdrucken
der Anzahl von Taktimpulsen ausgewählt» Es kann jedoch auch der Mittelwert, der die letzten Rechtecke angebende
Wert, der Maximalwert, der Minimalwert von dem n-ten größten Wert in Ausdrücken der Anzahl von Taktimpulsen ausgewählt
werden. Mit anderen Worten, es kann irgendeine Anordnung benutzt werden, solange wie ein Impulssignal von
drei bei jedem Laut unter der gleichen Bedingung erfaßt
werden kann. L4-1» C83 undC-12"] bezeichnen einen Zyklus, bei
dem jede Lautpause erfaßt wird. In dem durch Γ133 bezeichneten
Zyklus wird das Tonänderungsmuster der zuvor erwähnten drei symbolischen Impulssignale bestimmt. Dieses Tonänderungsmuster
wird benutzt, um die Sprachinformation von der Quelle-nperson zu identifizieren, damit die künstlichen Hände
z.B. ihre "Greif"-Aktion beginnen»
Neben der Steuer funkt ion für die künstlichen Hände kann das
Tonänderungsmuster auch für andere Anwendungen, wie eine Maschinenwerkzeugsteuerung, eine finanzielle AufZeichnungssteuerung oder eine Türbewegungssteuerung benutzt werden„
809834/07
28Ö6920
Die zuvor angegebenen Zyklen f1} bis L133bilden eine Folge
von Steuerzyklen, nach denen eine weitere Informationsidentifikationsfolge,
die auf einen Eingangswartezyklus \J3 '3
folgt, wiederholt wird.
Der zuvor erwähnte Folgesteuerungszyklus wird Jetzt näher
erläutert.
Wenn der Netzschalter eingeschaltet wird, so wird ein Eiicksetzimpuls
von einer ^peisung-Ein-Eücksetzschaltung 12a der
Systemsteuereinheit F über ein ODER-Glied 12b an einen 4-Bit-Zähler 12c gegeben, um den Zähler 12c und die Schaltungssteuereinheit 12d zurückzusetzen. Das heißt, der 4—Bit-Zähler
12c gibt die zuvor erwähnten 13 Zyklen nacheinander an und wird durch den Rucksetzimpuls in den Zustand [03 zurückgesetzt.
Die auf diese Weise zurückgesetzte Schaltungssteuereinheit 12d (I1Xg. 6) gibt gleichzeitig Impulse (c), (d),
(e), Cd), Cd1). Cd"), (0), (O1), (0") und (1) ab, wie dieses
in i"ig. 8 gezeigt ist.
Der Impuls (c) wird an den Rücksetzeingangsanschluß der
Flip-Flopschaltung 4a der in Fig. 2 gezeigten Verknüpfungsschaltung
4 gegeben, um ein Ausgangssignal an ihrem Ausgangsanschluß Q zu erzeugen. Dadurch wird der Stimneingang
abgeschaltet, bis die gesamte Schaltung des Systems gesetzt ist. Das heißt, ein UND-Glied 4b ist gesperrt, um
den Hindurchgang von einem von der Schmitt-Trigger-Schaltung 3 zugeführten Impuls zu verhindern, der später als Sprachimpulssignal
(a) bezeichnet ist, da ein Ausgangssignal von
dem Ausgangsanschluß Q nicht abgegeben wird. Der Impuls (d) setzt den 8-Bit-Zähler 5 und die Flip-Flop-Schaltuig 4c
zurück, so daß, wenn das Sprachimpulssignal (a) eingegeben
wird, ein Ausgangssignal von dem Anschluß Q des Flip-Flop 4c abgegeben wird und der 10 EHz oder 300 Hz-Takt, der
später beschrieben wird, an den Zähler 5 über das UITD-G-lied
809834/0780
-Sf-
-AA-
4d gegeben wird. Der Impuls (e;) setzt die Flip-Flop-Schaltung
4e, damit ein Ausgangssignal von dem Anschluß Q abgegeben wird, und das UND-Glied 4f zum Hindurchlassen der Taktimpulse von
dem 10 KHz-Taktimpulsgenerator 6a leitend geschaltet wird« Dadurch., daß auch das UND-Glied 4d leitend ist, wird der
10 KHz-Takt impuls von der Taktimpuls gene ratorschaltung 6a über das UND-Glied 4f und das ODEH-Glied '4g an den 8-Bit-Zähler
5 gegeben, um von diesem gezählt zu werden» Die Impulse (j), (d1), (J"), (D, (0), (O1) und (0") setzen die
8-Bit-Yerriegelungen 7a, 7b, 7d und 7c sowie 9a, 9b und 9c
jeweils in ihre Eingangswartezustände zurück, wie dieses in
den J1Ig=. 3 "und 4 gezeigt ist=
Da die Steuerschaltungseinheit 12d den Impuls (b) in Fig»
abgibt, wird die Flip-Flop-Schaltung 4a gesetzt und sein an dem Anschluß Q erscheinendes Ausgangssignal wird an das UND-Glied
4b und den Anschluß D der Flip-Flop-Schaltung 4c gegeben- Unter diesen Bedingungen wird, wenn der erste Impuls
von dem Sprachimpulssignal (a) an den Eingang des UND-Gliedes 4b gegeben wird, dieser Impuls hindurchgelassen, um an
den Anschluß T der Flip-Flop-Schaltung 4c zu gelangen» In diesem Fall, da das Ausgangssignal von dem Anschluß Q bei
der Vorderflanke dieses Impulses (a) sich ändert, wird der Impuls (g5 von dem Anschluß Q (Fig„ 9) abgegeben. Gleichzeitig
wird ein Inkrementimpuls an den 4-Bit-Zähler 12c
gegeben, damit dieser vom Zyklus tÖl zum Zyklus CI3 fortschreitet-
Dann wird der Impuls (d) erneut von der Schaltungssteuereinheit 12d abgegeben, um den 8-3it-Zähler 5
zurückzusetzen» Auch die Flip-Flop-Schaltung 4c wird zurückgesetzt, um ihr Aus gangs signal auf die Q-Seite zu ändern.,
Obwohl daher der 8-Bit-Zähler 5 mit der Zählung der Taktimpulse
erneut beginnt, wird er von dem zweiten Impuls des Impulses (d) zurückgesetzt, ohne daß er sein Ausgangssignal
an die nachfolgende Stufe weitergibt, selbst wenn der Impuls
(g) bei der Vorderflanke des zweiten Impulses des Impulses (a)
erzeugt wird, da der erste Impuls fortgelassen wird. Nachdem
der zweite Impuls des Impulses (a) eingegeben ist, nämlich nach dem Verstreichen der Aufbau- Übergangsperiode, wird das
Ausgangssignal der Schaltung 4c erneut auf die Q-Seite geändert
und dadurch beginnt der 8-Bit-Zähler 5 erneut mit der
Zählung der lOEHz-Taktimpulse. Außerdem wird ein Inkrementimpuls
von der Schaltungssteuereinheit 12 an den 4-Bit-Zähler
12c gegeben, um diesen vom Zyklus ΓΛ\\ zum Zyklus £2]]
we iterzuzählen.
Danach erzeugt die Schaltungssteuereinheit 12d, wenn der
dritte Impuls der Spracheingangsimpulse (a) auftritt und der dritte Impuls des Impulses (g) bei dessen Vorderflanke
erzeugt wird, den Impuls (i), der an den Verteilungseingangsanschluß
der in 31Xg- 3 gezeigten Verriegelung 7a gegeben
wird. Daher wird das Zählsignal von dem 8-Bit-Zähler 5 in
der Verriegelung 7a gespeichert. Außerdem wird der Ihpals
(d) anschließend an den Impuls (i) abgegeben und der 8-Bitzähler 5 wird erneut zurückgesetzt, um seinen Zählvorgang zu
beginnen, der fortgesetzt wird, bis der vierte Impuls der Spracheingangsimpulse (a) zugeführt wird. Der vierte Impuls
des Impulses (g) wird bei der Vorderflanke des vierten Sprachimpulses (a) erzeugt, um den Impuls (i1) zu erzeugen
wodurch eine Funktion ähnlich der zuvor beschriebenen fortgesetzt
wird, so daß die Anzahl von dem dritten Sprach impuls-Singangssignal
(a) entsprechende Anzahl von Taktimpulsen in der Verriegelung 7b "und die Anzahl von Taktimpulsen,
die dem vierten Sprachimpulseingangssignal (a) entspricht, in der Verriegelung 7c jeweils gespeichert werden. Der anschließend
erzeugte fünfte Impuls (d) bewirkt die Erzeugung eines Inkrementimpulses, um den Zyklus £23 zum Zyklus
in I1Xg. 10 weiterzuschieben.
809834/0700
Beim dritten Zyklus £33 wird der zentrale Wert aus den
AusgangsSignalen der Verriegelungen 7a? 7b und 7c , die
vorab mit A, B und C bezeichnet sind, ausgewählt, der der
Anzahl von in dem zweiten Zyklus [23 gespeicherten Impulsen
entsprichtο Das heißt, die Vergleichsfunktions wie
sie in der Tabelle 1 gezeigt ist, wird in einer Anordnung von 8-Bit~Vergleichern 8a ausgeführt«
Vergleicher-Ausgangssignal | ΓΑΊ > ΓΒΐ | [B] * [C] | I Δ I I "^^ I |
^c] | ausgepfählter Kanal |
ΓΒΊ < TCI L=. -J rs t— —J |
CA] | [B] | |||
CA] | ^CC] | Cc] | |||
Γ Al < ΓΒ1 UJ = U-J |
[B] > [G] | CA] | CA] | ||
CA] | |||||
CB] t Cc] | [G] | ||||
CB] |
Mit anderen Worten, eines der Ausgangssignale A5 B und C
wird aus dem Datenmultiplexer 8b (JTig. 3) ausgegeben, dessen
Daten durch den Impuls (m) von der SchaltungsSteuereinheit
12d zugänglich gemacht werden, und gleichzeitig in der 8-Bit-Verriegelung 9a C^ig= 4) durch die Wirkung des Impulses
(n) gespeichert, der von der Schaltungssteuereinheit 12d zugeführt wird. Da der Impuls (f) von der Schaltungssteuereinheit 12d gleichzeitig mit dem Impuls (n) ausgegeben
wird, wird die in Fig» 2 gezeigte Plip-Plop-Schaltung 4-e
1834/0780
■Al*·
zurückgesetzt und ihr Ausgangssignal auf die Q-Anschlußseite
geändert. Daher wird der JOO Hz-Taktimpuls von dem 300 Hz-Taktimpulsgenerator 6b über das UED-Glied 4h, das
ODER-Glied 4g und das USD-Glied 4d an den 8-Bit-Zähler 5
gegeben. Dem Impuls (m) folgend, gibt die Schaltungssteuereinheit 12d einen Inkrementimpuls an den 4-Bit-Zähler
12c, um den Zyklus £3Ü auf den vierten Zyklus £4^ weiterzuschalten.
Bei diesem vierten Zyklus j^-J» bei dem die Iiaut-Pause erfaßt
wird,zählt der 8-Bit-Zähler 5 die 300 Hz-Taktimpulse
für jeden Impuls (d) und speichert die Anzahl der Taktimpulse in der Verriegelung (7d) für'jeden Impuls (k) von der
Schaltungssteuereinheit 12d. Das Ausgangssignal der Verriegelung 7d wird an einen der Eingangsanschlüsse der Vergleicher
schaltung 11a gegeben, deren anderer Singangsanschluß
ein Signal erhält, das einer geeigneten Lautpause entspricht. Es wird angenommen, daß das Ausgangssignal A der
Verriegelung 7d größer als das Vergleichsbezugsausgangssignal
B ist (A > B), d.h. wenn das Ausgangs sign al 7d größer als das bestimmte Ausgangssignal ist, wie es für die Lautpause
geeignet ist, so erzeugt die Vergleichsschaltung 11a den Lautpausen-Impuls (s). Im Fall von A<B gibt die Vergleicherschaltung
11a den Sprachimpuls (t) ab. 11b und 11c sind UED-Glieder zum Übertragen des Signals (s) oder (t) in
Abhängigkeit von der Zuführung des Zeitgabeimpulses (r) von der Schaltungssteuereinheit 12d. Wird der Sprachimpuls (t)
von der Vergleicherschaltung 11a abgegeben, so wird die zuvor erwähnte Wirkung wiederholt,bis ein Lautpausen-Impuls (s)
erscheint. Wenn der erste Impuls (a) des nächsten Lautes erfaßt ist und der Impuls (s) erscheint, so erzeugt die Schaltungssteuereinheit
12d die Impulse (e), (1), (g)j (d1) und
Cj") (Fig. 6). Daher wird die in S1Xg. 2 gezeigte Flip-llop-Schaltung
4e gesetzt und die Folge auf die 10 KETz-Taktimpulsgeneratorschaltung
6a umgeschaltet, wonach der 8-Bit-
809834/0760
Zähler 5 die 10 ΚΞζ-Taktimpulse zahlt ο Außerdem werden die
Verriegelungen 7a bis 7d gelöschtο Wenn der erste Impuls (d)
im zweiten Laut erzeugt wird, wird ein Inkrement impuls an den 4--Bit-Zähler 12c gegeben, um diesen vom vierten Zyklus
£4-]auf den fünften Zyklus £53 weiterzuschalten»
Da die Arbeitsweisen bei dem fünften Zyklus bis zum zwölften Zyklus gleich den bereits beschriebenen sind, wird deren
Beschreibung fortgelassen«. Die in I1Xg= 4- gezeigte Verriegelung
9b speichert den zentralen Wert des zweiten Laut und die Verriegelung 9c speichert den zentralen Wert des dritten
Lautes. Außerdem erzeugt bei der Erfassung eines Lautpausenimpulses (h) (Fig* 11) beim dritten Laut die Schaltun
gsSteuereinheit 12d den Impuls (c) als ein Wortendesignal,
um den Sprachsignaleingang zu schalten=
Die höchstwertigen, d»h= oberen vier Bits der Ausgangssignale
der Verriegelungen 9a bis 9c werden an die Eingänge von
Addierern 10a bis 10c jeweils gegeben, um zu den ursprünglichen acht Bits hinzuaddiert zu werden, wodurch der zentrale
Wert mit einer bestimmten Breite erzeugt wird., Dieses
wird vorgenommen, da die Verriegelung 9a nicht immer mit
der Verriegelung 9b infolge von der menschlichen Stimme
eigenen Änderungen zusammenfällt, selbst wenn die Töne auf
dem gleichen Pegel liegen= Es muß daher eine Tondifferenz vorgesehen sein, die breiter als ein Skalenwert ist, wenn
eine Tonänderung in der erzeugten Sprache auftritt»
Dann vergleicht die erste Vergleicheranordnung 1Od das Signal
£il der Verriegelung 9a mit dem Signal £2l von dem Addierer
10a und das Signal £3l von ώτ Verriegelung 9b mit dem Signal
£4^ von dem Addierer 1Ob= Während die zweite Vergleicheranordnung
1Oe das Signal £1] von der Verriegelung 9b mit
dem Signal £2] von dem Addierer 10b und das Signal £33 von
der Verriegelung 9c mit dem Signal £4-3 von dem Addierer 10c
S08S34/07IÖ
vergleicht. Als Ergebnis dieser Vergleichsvorgänge werden
die in Tabelle 2 gezeigten Zwei-Bit-Daten erzeugt. Wenn sich. z.B. der Ton eines aus drei Lauten gebildeten
Wortes ändert, wie dieses in Pig. 12A gezeigt ist, so
werden Ausgangssignale (11,01) erzeugt.
Vergleicherausgangssignal | Eingang ^Eingang (1) W |
Eingang Eingang (2) > (3) |
2-Bit-Daten |
Eingang^Eingang (10 7 (3) |
Eingang Eingang (D < W |
Eingang Eingang (2) < (3) |
11(Ton auf wärts ) |
10 (Pegel Ton) |
|||
Eingang Eingang dl £ (3; |
10(Pegel Ton) |
||
01 (Ton ab wärts |
|||
Die in Pig. 12B gezeigte Tonänderung erzeugt Ausgangssignale
(10,11). Neun Kombinationen dieser Aus gangs signale sind insgesamt möglich. Diese Kombinationen werden in der 4-Bit-Verriegelung
10f durch die Wirkung des Impulses (p) von der Schaltungssteuereinheit 12d gespeichert und zur Steuerung
eines Elektromotors z.B. für eine "Greif"-Wirkung von künstlichen Händen benutzt. Each der Beendigung einer solchen
"Greif-Wirkung erzeugt die Schaltungssteuereinheit 12d das Impulssignal (q) zum Löschen der 4-Bit-Verriegelung
10f unigibt dann Impulse (e), (1), (ά),(ό1), Cd"), (0), (O1)
und (0"), um die Polge in ihren ursprünglichen Zustand zurückzuführen
.
809834/0760
-yt-
■Λ\·
Obwohl die vorstehende Beschreibung der bevorzugten Ausführungsform
in Verbindung mit der Erkennung eines aus drei Lauten gebildeten Wortes vorgenommen wurde, kann selbstverständlich
ein Wort auch aus einem oder zwei Lauten gebildet sein. Anschließend wird die 51Ig. 13 erläutert.
Es wird angenommen, daß nur der erste Laut in das System eingegeben wird, die Folge bis zum dritten Zyklus in der
gleichen Weise, wie zuvor beschrieben, fortgeführt wird , um den Symbolwert zu bestimmen, der in der Verriegelung Sagespeichert werden soll. Dann wird die Folge umgeschaltet
auf die 300 Hz-Taktimpulsgeneratorschaltung 6b und der 8-Bit-Zähler
5 zählt die 300 Hz-Taktimpulse. In diesem Fall
läuft der 8-Bit-Zähler 5 infolge des Fehlens des zweiten
Lautes über, um den Impuls (h) abzugeben und die Schaltungssteuereinheit 12d überträgt den Impuls (c) zum Rücksetzen
der Flip-Flop-Schaltung 4a zum Abschalten des Sprachimpulseinganges
an sie. Unmittelbar danach wird der Impuls (q) zum Löschen der 4—Bit-Yerriegelung 1Of erzeugt. Gleichzeitig
gibt die SchaitungsSteuereinheit 12d Impulse (u) und (v) in
Fig. 13 ab, die nach ihrer Invertierung über Inverterschaltungen 10g und 10h die Ausgangssignale der Vergleicheranordnung
1Od und 1Oe an den UND-Gliedern 1Oi und 1Oj sperren.
Dieses gibt den Impuls (p) an den Eingang der 4—Bit-Verriegelung
1Of und die letztere erzeugt Ausgangssignale (00,00), die das Ende des Wortes angeben, wie dieses in Fig. 12G
gezeigt ist.
Im Fall, bei dem die ersten und zweiten Laute in das System eingegeben werden, jedoch der dritte Laut nicht eingegeben
wird, wird die Folge bis zum siebten Zyklus in der gleichen Weise fortgeschaltet, wie dieses zuvor beschrieben wurde.
Das heißt, die Symbolwerte der ersten und zweiten Laute werden in den Verriegelungen 9a und 9b jeweils gespeichert und der
809834/0760
8-Bit-Zähler 5 zälilt JOO Hz-Taktimpulse. In diesem Pail läuft
der 8-Bit-Zähler 5 zum Aussenden des Impulses Ch) über, da
der dritte Laut nicht erscheint. Die Elip-Flop-Schaltung
4a wird daher durch, den Impuls (c) zurückgesetzt. Dann wird die 4-Bit-Verriegelung 1Of durch, den Impuls Cq.) gelöscht und
die Schaltungssteuereinheit 12d erzeugt nur den Impuls (v). Dadurch wird der Impuls Cp) zugeführt und nur das Ausgangssignal
der Vergleicheranordnung 1Od wird über das TJHD-G-lied
10i an den Eingang der 4-Bit-Verriegelung 1Of gegeben. Dieses Eingangssignal weist z.B. CHjOO) auf, wie dieses in
. 12D gezeigt ist.
Es ist darauf hinzuweisen, daß ein aus mehr als drei Lauten gebildetes Wort, erkannt werden kann, in dem die gleichen
bisher beschriebenen Prinzipien angewendet werden. Außerdem kann ein Mikrocomputer zum Ausführen der Identifikation
oder der Erfassungsverarbeitung der Tonänderung bei dem zuvor
erwähnten bevorzugten Ausführungsbeispiel verwendet werden.
Auch die Klassifikation der Tonänderungen ist nicht auf die drei Muster, nämlich Ton aufwärts, Ton abwärts und Pegel Ton
in Bezug auf den vorangegangenen Laut beschränkt , sondern die Klassifikation der Tonänderungen kann weiter unterteilt
werden, indem die Tonänderungs-Erfassungsschaltung D modifiziert
wird.
Die 51Ig. 14 bis 19 zeigen eine weitere Ausführungsform dsr
Erfindung. Eine Stimmen-Erfassungsschaltung G- weist Bauteilschaltungen
51 bis 58 auf, wobei ein Mikrofon 51 an der
Außenseite des Kehlkopfes der Quellenperson vorgesehen ist und ein einen logarithmischen Verstärker aufweisender Verstärker
52 zum Verstärken des Ausgangssignals des Mikrofons 51 auf einen geeigneten Pegel vorgesehen ist. Ein Bandpaßfilter
53 läßt Stimmen- oder Sprachsignale mit einem Frequenz-
809834/0780
band von etwa'50'bis 250 Hz "hindurch und bewirkt die Abtastung
des Grundtonbestandteils des Sprachsignale, der ein den Skalenwert der Sprache darstellender Parameter
ist, wie sie von der Quellenperson abgegeben wird- Eine Schmitt-Trigger-Schaltung 54· formt das Sinussignal, das
in dem Bandpaßfilter abgetastet ist, in ein Rechtecksignal um und bewirkt außerdem die Beseitigung von Signalanteilen
außer den Grundtonbestandteilen durch ihre Hystereseeigenschaft. Eine Folgesteuerung 55 bestimmt die zeitliche Wirkungsweise
der gesamten Schaltung des Systems, an das ein Trigger-Signal gegeben wird, um seine Punktion als eine
Aufbauzeit der Sprachen-Eingangssignalform zu betätigen.
Ein Hülldetektor 56 zum Erfassen der Amplitude des Sprachensignals und ein Spitzendetektor 57 zum Erfassen des Maxim/alwerts
der Amplitude des Signals, das von dem Hiilldetektor zugeführt wird und zum Festhalten dieses Maximalwertes sind
ebenfalls vorgesehen. Ein Analog-Digital-Umformer 58 formt
den analogen Wert des Ausgangssignals des Spitzendetektors
57 in einen digitalen Wert um»
Eine Zähle rs chal tun g H ist aus Schaltungen 59 bis 62 aufgebaut,
die einen Taktimpulsgenerator 59 umfassen, der im wesentlichen
genau Taktimpulse zum Messen der Periodendauer des Sprachensignals erzeugt. Ein Periodenzähler 60 zählt die
Taktimpulse während der Dauer eines jeden Signalimpulses, der von der Schmitt-Trigger-Schaltung 54- nach Maßgabe des
Steuersignals von der Folgesteuerung 55 zugeführt wird. Eine Frequenzteilerschaltung 61 teilt die Taktimpulsfrequenz
um einen bestimmten Faktor, wie z.B. um 1/20. Ein Ehythmuszähler 62 wird von den Tasten mit einer von der
Frequenzteilerschaltung 61 geteilten Frequenz betätigt, um das Zeitintervall zu zählen, während dem der Ton erzeugt
wird.
09.Ϊ34/0760
Ein Digital-Bandpaß-Filter I ist aus Schaltungen 63 bis 66
aufgebaut. Die Schaltung 63 ist dabei ein Zähler-Puffer-Register zum zeitweiligen Speichern oder Verriegeln des
Inhaltes des Periodenzählers 60. Ein Digitalvergleicher 64 vergleicht den Inhalt des Registers 63 mit den Inhalten
eines Registers 65 für die obere Grundtongrenze und eines Registers 66 für die untere Grundtongrenze, die später
noch beschrieben werden. Der Digitalvergleicher 64-erzeugt sein Ausgangssignal, wenn der Inhalt des Registers
in einem Bereich liegt, der durch die Inhalte der die oberen und unteren Grenzen angebenden Register 65 und 66 bestimmt
ist. Das Register 65 für die obere Grundtongrenze speichert eine bestimmte Anzahl von Zählerständen der oberen
Grenze des Grundtons, während das Register 66 für die untere Grundtongrenze eine bestimmte Anzahl von Zählerständen
der unteren Grenze des Grundtons speichert. Diese Grenzregister 65 und 66 arbeiten so, daß sie die Signale hindurchlassen,
die eine frequenz innerhalb des Bereichs haben, der durch die Pegel cc und ß in dem Frequenz-Zeit-Diagramm
(Fig. 15b) bestimmt ist, das die Ausgangssignalform des Bandpaßfilters 53 zeigt.
Eine Grundtonstabilisierungs- und Erfassungseinheit J weist
Schaltungen 67 bis 70 auf, von denen die Schaltung 67 ein
logarithmischer Umformer ist, der die Frequenz in musikalische Intervalle zur Handhabung der Grundtondifferenz als
eine lineare Form umformt. Ein Datenstapel 68 speichert verschiedene Daten, d.h. vier Daten bei dem betrachteten bevorzugten
Ausführungsbeispiel, die von dem logarithmischen Umformer zugeführt sind. Eine Symbolwert-Abtastschaltung 69
bestimmt einen Symbolwert aus verschiedenen Daten, die in dem Datenstapel 68 gespeichert sind. Ein Intervall-Vergleicher
70 bestimmt, ob jede der in dem Datenstapel 68 gespeicherten Daten innerhalb eines bestimmten Bereichs, z.B. einem Halbton,
von dem Symbolwert liegen, der von der Symbolwert-
809834/0780
■ a>i.
Abtastschaltung 69 bestimmt ist.
Eine Muster-Erfassungseinheit K ist aus Schaltungen 71 bis
79 gebildet, von denen die Schaltung 71 ein Grundton-Datenstapel
zum Stapeln eines Symbolwertes des Grundtons für * jeden Laut, der durch die Symbolwert-Abtastschaltung bestimmt
ist. Eine musikalische Intervallmuster bildende Schaltung 72 bildet ein Muster von Grundtondaten, die in
dem Grundtöndatenstapel 71 gestapelt sind, während ein
Ehythmus-Datenstapel 73 die Daten der Tonlänge stapelt, die von dem zuvor erwähnten Rhythmuszähler 72 gezählt· sind*
Eine ein Rhythmusmuster bildende Schaltung 7^ bildet ein
Muster für die Rhythmusdaten, die in dem Rhythmusdatenstapel
73 gestapelt sind, und ein Stärke-Datenstapel 75 speichert Stärkedaten des Tons, die ein Ausgangssignal des
Analog-Digital-Umformers 58 sind. Eine ein Stärkemuster
bildende Schaltung 76 bildet ein Muster der Stärkedaten,
die in dem Stärkedatenstapel 75 gespeichert sind» Eine Befehlswort-Datenbank 77 speichert vorbestimmte Musterdaten
von Befehlsworten. Eine Muster-Anpassungsschaltung 78
synthetisiert die Muster, die von der das musikalische Intervallmuster bildenden Schaltung 72, der das Rhythmusmuster
bildenden Schaltang 7^ und der das Stärkemuster
bildenden Schaltung 76 zugeführt sindo Diese Muster-Anpassungsschaltung
78 vergleicht auch das synthetisierte Muster mit dem Muster des Befehlsworts, das in der Befehlswort-Datenbank
gespeichert ist» Eine Ausgangssignal-Umformerschaltung
79 formt das Befehlswort-Ausgangssignal von der Anpassungsschaltung 78 in ein Signal um, das zum Steuern
einer Maschine oder eines anderen, extern vorgesehenen Gerätes benutzt werden kannο
809834/0760
• aa·
Anschließend "wird die Wirkungsweise des erfindungsgemäßen
Systems mit dem zuvor erläuterten Aufbau angegeben.
Es wird angenommen, daß die Quellenperson vier Laute abgegeben
hat, wie dieses in der Sprachen- Eingangshüllkurve in Fig. 15a dargestellt ist, wobei diese Sprachinformation
durch das Mikrofon 51 aufgenommen wird, das an der Außenseite des Kehlkopfes, vorzugsweise an einer Stelle unmittelbar
unterhalb des Adamsapfels vorgesehen ist, wo höhere Frequenzkomponenten
und Sprachzieheigensc&aften einen relativ geringen Einfluß haben, und wird dann su ihrer Verstärkung
an den Verstärker 52 gegeben. Die Sprachinformation hat
einen G-rundtonbestandteil, der von dem Bandpaßfilter 53
abgetastet ist, das das Frequenzband von z.B. 50 bis 2>O Hz
hindurchläßt. In dem abgetasteten Sinussignal werden dann die sich von den Grundtonkomponenten unterscheidenden Signalanteile
infolge der Kystereseeigenschaft der Schmitt-Triggerschaltung beseitigt, die dem Bandpaßfilter folgt, wobei das
Sinussignal mit Hilfe der Schmitt-Trigger-Schaltung 54- in
eine in Fig. 15c gezeigte Rechteckwelle umgewandelt wird.
Für eine weibliche Stimmquelle kann das Bandpaßfilter auf eine höhere Frequenz umgeschaltet werden.
Das Ausgangssignal des Verstärkers 52 wird an den Hülld etektor
55 gegeben, der die Amplitude erfaßt. Der Spitzenwert der
Amplitude wird durch den Spitzendetektor 57 (Fig. 15d) erfaßt
und festgehalten. Dann wird dieser Spitzenwert in einen Digitalwert mit Hilfe des Analog-Digital-Umformers
58 umgeformt.
Bei der Anordnung des erfindungsgemäßen Systems beginnt die Folgesteuerung 55 ihre Arbeitsweise bei dem Aufbauteil des
Ausgangsimpulses von der Schmitt-Trigger-Schaltung 54. Zu-
809834/0780
sätzlich zu dem vorerwähnten Beginn bei dem Aufbauteil des Spracheneingangssignals, das anschließend als erster Beginn
bezeichnet wird, hat die !Folgesteuerung 55 zwei weitere Beginnweisen. So beginnt sie ebenfalls, wenn der Periodenzähler
60 überläuft, z.B. durch 50 ms, zwischen aufeinanderfolgenden
Lauten, was nachfolgend als der.zweite Beginn bezeichnet wird, und wenn der Rhythmuszähler 62 überläuft,
z.B. durch 500 ms, infolge des Endes des Befehlswortes,
was anschließend als dritter Beginn bezeichnet wird. In diesem Fall ist die als ein Unterbrechungsintervall zu bestimmende
Zeitdauer die, bei der der Periodenzähler 60 überläuft, jedoch der Ehythmuszähler 62 noch nicht überläuft.
Die Folge der Arbeitsweise wird jetzt in Verbindung mit den in Fig. 16 gezeigten Flußdiagrammen und der folgenden Figuren
erläutert.
Wie in Fig. 16 gezeigt ist, nimmt das das erfindungsgemäße System aufweisende Gerät vier Zustände an, die einen
Zustand, bei dem das System auf den Beginn eines Lautes wartet, einen Zustand, bei dem die Daten eingegeben werden,
einen Zustand, bei dem das System auf eine Lautpause wartet, und einen Zustand umfaßt, bei dem die Daten keine Befehlsworte aufweisen und zurückgewiesen werden«, Diese vier Zustände
sind als Phasen 0 bis 3 in dieser Reihenfolge jeweils bezeichnet.
Da der Zustand in der Phase 0 beim Start des ersten Beginns der Folgesteuerung 55 sich befindet, ist der Ehythmuszähler
62 zurückgesetzt. Dann erzeugt der Taktimpulsgenerator 69 sein Aus gangs signal und der Perioden zähler 60 und der
Rhythmus zähl er 62 beginnen ihre Zählung«. Das Auftreten eines Spracheneingangs zu diesem Zeitpunkt bewirkt die Umschaltung
des Zustandes von der Phase 0 auf die Phase 1, nämlich
809834/01
.au.
den Beginn-Warte zustand, und die Polgesteuerung 55 wird angehalten.
Wenn der Aufbauteil des nächsten Impulses von der Schmitt-Trigger-Schaltung
54- an die Folgesteuerung 55 gegeben wird,
werden die in dem Periodenzähler 60 enthaltenen Daten in dem Zählerpufferregister 63 verriegelt oder gespeichert,
da jetzt der Zustand sich nicht in der Phase O, sondern in der Phase 1 befindet. Wenn die Grundtondaten eingegeben sind,
werden die Daten in dem Periodenzähler 60 in dem Zählerpufferregister 63 verriegelt und dann der Periodenzähler 60 zurückgesetzt,
der erneut Taktimpulse zu zählen beginnt. Anschließend
werden die in dem Zählerpufferregister 63 gespeicherten Daten in dem Digitalvergleicher 64 mit den Werten
verglichen, die in den oberen und unteren Grundtongrenzen-Registern 65 und 66 gespeichert sind, nämlich die
Werte bei den Pegeln <x und ß, wie dieses in IPig. 15b gezeigt
ist. Befinden sich die von dem Register 63 zugeführten Daten außerhalb des durch die Daten in den Registern 65 und
66 bestimmten Bereiches, so nimmt das System einen V/arte zustand an, bis die nächsten Daten eingegeben werden. Befinden
sich die von dem Register 63 zugeführten Daten in dem durch die voreingestellten Werte oo und ß bestimmten Bereich, so
werden die Daten in dem Zählerpufferregister 63 einer logarithmischen
Umformung in der logarithmischen Umformerschaltung 67 ausgesetzt und die umgeformten Daten in dem Datenstapel
68 gespeichert. Danach wird die zuvor erwähnte Arbeitsweise wiederholt, um zu bestimmen, ob die Anzahl der
Daten in dem Datenstapel 68 einen bestimmten Wert erreicht hat oder nicht. Ist dieser bestimmte Wert nicht erreicht,
so wird der Eingangswarte zustand angenommen und die Daten wiederholt eingegeben. Wenn eine bestimmte Anzahl von Daten,
nämlich 4- Daten bei dem bevorzugten Ausführungsbeispiel,
in dem Datenstapel 68 gespeichert sind, bestimmt die Symbolwert-Abtastschaltung 69 einen Mittelwert, der dann als ein
809834/Q7ßö
Symbolwert in den Intervallvergleicher 70 eingegeben wird.
Dieser Intervallvergleicher 70 vergleicht jede der Daten
von dem Datenstapel 68 mit dem in der vorstehend angegebenen Weise bestimmten Symbolwert« Befinden sich, irgendwelche der
Daten in dem Datenstapel 68 außerhalb des Bereiches, so gibt der Datenstapel 68 die anfangs gestapelten Daten ab
und nimmt den Eingangswartezustand an. Danach wird die zuvor
erwähnte Arbeitsweise wiederholt und die Daten erneut eingegeben, wobei die Symbolwert-Abtastschaltung 69 den Mittelwert
der eingegebenen Daten in der vorstehend beschriebenen Weise bestimmt. Der Intervallvergleicher 70 vergleicht
alle Daten mit dem Symbolwert. Diese Arbeitsweise wird wiederholt, bis alle Daten in einen bestimmten Bereich von dem
Symbolwert gebracht sind= Wenn alle Daten in einen bestimmten Bereich von dem Symbolwer-t gebracht sind, so wird
der Symbolwert in den Datenstapel 7^ für das musitalische
Intervall eingegeben und dort gespeichert» Unter diesen Bedingungen nimmt das System den Wartezustand auf eine Lairtpause
an, nämlich die Phase 2, in der auf das nächste Eingangssignal gewartet wird»
Wird dann das Impulseingangssignal von der Schmitt-Trigger-Schaltung
5^ erzeugt, so wird der Periodenzähler 60 zurückgesetzt,
jedoch werden die Daten nicht angenommen, wenn das System sich in dem Eingangswartezustand befindet, da der
Zustand weder die Phase 0 noch die Phase 1 ist* Danach be-,
wirkt die folgesteuerung 55 die Wiederholung der zuvor erwähnten
Arbeitsweise, bis der zweite Beginn auftritt.
Wie in Figo 17 gezeigt ist, wird beim zweiten Beginn der
Folgesteuerung 55? nämlich, wenn der Periodenzähler 60
überläuft? zuerst bestimmt, ob der Zustand die Phase 2
ist oder nicht. Liegt der Zustand in der Phase 1, was angibt, daß stabile Grundtondaten nicht erhalten wurden, wird
der Zustand auf die Phase 3 weitergeschaltet, um die eingegebenen
Worte zurückzuweisen, wobei das System wieder den Eingangs warte zustand annimmt. Befindet sich, der Zustand in
der Phase 3i so ist die Arbeitsweise identisch der unmittelbar
zuvor beschriebenen.
Befindet sich der Zustand in der Phase 2, so werden die Daten in dem Rhythmuszähler 62 in dem Hhythmusdatenstapel
73 gespeichert und die Daten in dem Analog-Digital-Umformer
58 werden in dem Stärke-Datenstapel 75 gespeichert. Dann
wird bestimmt, ob die Anzahl der Daten in dem Datenstapel 71 für das musikalische Intervall, in dem Rhythmusdatenstapel
73 und in dem Stärkedatenstapel 75 vier oder mehr ist. Ist die Anzahl der Daten geringer als 4-, wird der Periodenzähler
60 zurückgesetzt und seine Zählung beendet. Während der Rhythmuszähler 62 zurückgesetzt ist und die Zählung
erneut beginnt, nimmt das System den Singangswartezustand
an.
Danach wird die zuvor erwähnte Wirkungsweise erneut von dem
ersten Beginn aus wiederholt und wenn vier oder mehr Daten in den Datenstapeln gespeichert sind, wird der Zustand auf
die Phase 3 umgeschaltet, um das als Daten eingegebene Wort
als ein JTichtbefehlswort zurückzuweisen. Dann nimmt das
System wieder den 3ingangs-Wartezustand an.
Wie in S1Xg. 18 gezeigt ist, wird beim dritten Beginn der
Folgesteuerung 555 nämlich, wenn der Rhythmuszähler 52 überläuft,
bestimmt, ob der Zustand sich in der Phase 3 befindet oder nicht. Befindet sich der Zustand in der Phase 3» so
wird das System allgemein zurückgesetzt. Mit anderen Worten, alle Register werden zurückgesetzt und die Zählerarbeitsweise
beendet. Der Zustand wird auf dfe Phase 0 umgeschaltet und die Folgesteuerung 55 beendet ihre Arbeitsweise.
809834/0700
Befindet sich, der Zustand nicht in der Phase 3, so werden
die Daten in dem Datenstapel 71 für das musikalische Intervall,
in dem Rhythmusdatenstapel 73 und dem Stärkedatenstapel
75 in Muster in der das musikalische Intervallmuster
bildenden Schaltung 72, in der das Rhythmusmuster bildenden
Schaltung 74- und in der das Stärkemuster bildenden Schaltung
76 durch einen relativen Vergleich der jeweiligen Daten geformt und die so in Muster geformten Daten werden in der
Musteranpassungsschaltung 78 in ein Muster synthetisiert, wie dieses in J1Ig. 19 gezeigt ist. Dann wird dieses Muster
in der Mu st eranpas sungs schaltung 78 mit dem Muster von der
Befehlswort-Datenbank 77 verglichen, um zu bestimmen, welchen Befehl das aus der Sprache erhaltene Muster angibt und welche
■^unktionsart das gesteuerte System, wie eine Maschine, ausführen
soll. Dieser Ausgangsbefehl wird von der Ausgangssignalumformer schaltung 79 in ein Signal umgeformt, das
eine bestimmte Funktion bei der gesteuerten Maschine bewirkt, lach der Beendigung dieser Funktion wird das System allgemein
zurückgesetzt und in den Befehlswort-Wartezustand umgeschaltet,
in der es auf ein Eingangssignal wartet.
Wie zuvor vollständig beschrieben wurde, schafft die Er3L ndung
ein neues Stimmenidentifikationssystem,, bei dem ein Mikrofon
an der Außenseite des Kehlkopfes der Quellenperson vorgesehen ist, wo der Rauschpegel relativ niedrig ist und die
Stimme einer Erfassung unterworfen wird, indem sie in Laute unterteilt wird. Außerdem werden die Signalformen in den
Anfangsperioden, die nicht als ein Stimmgeräusch stabilisiert werden, erfindungsgemäß beseitigt und die verbleibenden
Perioden zur Bestimmung eines Wertes aufgenommen, der symbolisch für die Anzahl von Taktimpulsen in diesen ist.
Das von einer Yielzahl von derart bestimmten Symbolwerten gezeigte Tonänderungsmuster wird einer Sortierung zum Bewirken
einer bestimmten Steuerfunktion an einem zu steuernden
Gerät unterworfen. Das mit Hilfe der zweiten Ausführungs-
form erläuterte System erfaßt den Grundton, die Dauer und die Stärke des Geräusches von jedem der Befehlsworte und synthetisiert
diese Faktoren in musikalische !Toten. Auf diese Weise kann eine schnellere Geschwindigkeit bei der Spracherfassung
unabhängig davon erreicht werden, ob die Stimme oder Sprache gewöhnliche Töne oder Summtöne enthält. Auch die
Verwendung eines vereinfachten Musteranpassungssystems stellt eine höhere Geschwindigkeit der Spracherfassung sicher.
Außerdem ermöglicht die Kombination von zwei oder drei Mustern, daß eine Vielzahl von Befehlsworten in geeigneter
Weise identifiziert werden.
809834/0760
Leerseite
Claims (1)
- PATENTANWÄLTE A. QRUNECKERDIPU-IhXlH. KINKELDEYDR-ING.W. STOCKMAIRDR-ING. · Aa6 (CALTECHiK. SCHUMANNOR REa NAT. · DlPL-PHVS.P 12 394 . - ^"\ - G. BEZOLD= Da RER.NAT.· DIPL-CHEM.8 MÜNCHEN 22MAXIMILIANSTRASSE 43PatentansprücheΛ J Stimmenidentifikationssystem, gekennzeichnet durch eine Einrichtung (A,G) zum Erfassen von Geräuschen, die in einer in Lauten unterteilten Form erzeugt sind, über ein an der Außenseite des menschlichen Körpers vorgesehenes Mikrofon (1,51), durch eine Einrichtung (B, I) zum Abtasten einer Grundfrequenz aus dem bei jedem Laut erfaßten Geräusch, durch eine Einrichtung (D,K) zum Bilden eines bestimmten Musters aus der abgetasteten Frequenz und durch eine Einrichtung (78) zum Sortieren der bestimmten Muster.2. System nach Anspruch 1, dadurch gekennzeichnet, daß die Abtasteinrichtung (B,I) eine Einrichtung (65,66) zum Beseitigen verschiedener anfänglicher Perioden eines äeden Lautes und zum Bestimmen eines Wertes, der symbolisch für die Messungen der verbleibenden verschiedenen Perioden ist, die den beseitigten verschiedenen Perioden folgen, aufweist.5. System nach Anspruch 2, dadurch gekennzeichnet, daß die Musterbildungseinrichtung (D,K) eine Ein-809S34/07I0TELEFON (OSS) Qa SS SQ TELHX OS-QSSQO TELEGRAMME MONAPAT TELEKOPIERERORIGINAL INSPECTEDrichtung (10) zum Bestimmen eines Küsters aus der Tonänderung in dem abgetasteten Grundger aus eh. aufweist.4-, System nach Anspruch. 2, dadurch. gekennzeichnet, daß die Musterbildungseinrichtung (E) eine Einrichtung (72,74-,76) zum Bestimmen jedes Musters aus mindestens zwei Tonänderungen des genannten Wertes, der symbolisch für jeden Laut, die Dauer des Geräusches in jedem Laut und die Änderung in der Stärke des Geräusches in jedem Laut ist, und eine Einrichtung (78,79) zum Synthetisieren der bestimmten Muster in ein durch eine musikalische Note dargestelltes Signal, aufweist.809834/0780
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1714377A JPS5945160B2 (ja) | 1977-02-21 | 1977-02-21 | 音声識別方法 |
JP370278A JPS5497304A (en) | 1978-01-19 | 1978-01-19 | Voice identifying system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2806920A1 true DE2806920A1 (de) | 1978-08-24 |
Family
ID=26337335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19782806920 Ceased DE2806920A1 (de) | 1977-02-21 | 1978-02-17 | Stimmenidentifikationssystem |
Country Status (5)
Country | Link |
---|---|
US (1) | US4178472A (de) |
DE (1) | DE2806920A1 (de) |
FR (1) | FR2381369A1 (de) |
GB (1) | GB1594412A (de) |
NL (1) | NL7801789A (de) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4388495A (en) * | 1981-05-01 | 1983-06-14 | Interstate Electronics Corporation | Speech recognition microcomputer |
US4468804A (en) * | 1982-02-26 | 1984-08-28 | Signatron, Inc. | Speech enhancement techniques |
ATE45831T1 (de) * | 1983-05-18 | 1989-09-15 | Speech Systems Inc | Spracherkennungssystem. |
GB2145864B (en) * | 1983-09-01 | 1987-09-03 | King Reginald Alfred | Voice recognition |
EP0248593A1 (de) * | 1986-06-06 | 1987-12-09 | Speech Systems, Inc. | Vorverarbeitungssystem zur Spracherkennung |
FR2622727A1 (fr) * | 1987-10-29 | 1989-05-05 | Feart Michel | Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre |
US5471527A (en) | 1993-12-02 | 1995-11-28 | Dsc Communications Corporation | Voice enhancement system and method |
US20090222270A2 (en) * | 2006-02-14 | 2009-09-03 | Ivc Inc. | Voice command interface device |
US20080109227A1 (en) * | 2006-11-06 | 2008-05-08 | Aten International Co., Ltd. | Voice Control System and Method for Controlling Computers |
US8862476B2 (en) * | 2012-11-16 | 2014-10-14 | Zanavox | Voice-activated signal generator |
US11133004B1 (en) * | 2019-03-27 | 2021-09-28 | Amazon Technologies, Inc. | Accessory for an audio output device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3197560A (en) * | 1944-12-29 | 1965-07-27 | Bell Telephone Labor Inc | Frequency measuring system |
US3102165A (en) * | 1961-12-21 | 1963-08-27 | Ibm | Speech synthesis system |
GB1435779A (en) * | 1972-09-21 | 1976-05-12 | Threshold Tech | Word recognition |
DE2536585C3 (de) * | 1975-08-16 | 1981-04-02 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur statistischen Signalanalyse |
-
1978
- 1978-02-13 US US05/877,394 patent/US4178472A/en not_active Expired - Lifetime
- 1978-02-16 NL NL7801789A patent/NL7801789A/xx not_active Application Discontinuation
- 1978-02-17 DE DE19782806920 patent/DE2806920A1/de not_active Ceased
- 1978-02-20 FR FR7804744A patent/FR2381369A1/fr active Granted
- 1978-02-21 GB GB6753/78A patent/GB1594412A/en not_active Expired
Also Published As
Publication number | Publication date |
---|---|
US4178472A (en) | 1979-12-11 |
GB1594412A (en) | 1981-07-30 |
FR2381369B1 (de) | 1984-08-17 |
FR2381369A1 (fr) | 1978-09-15 |
NL7801789A (nl) | 1978-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2918533C2 (de) | ||
DE2953262C2 (de) | ||
DE2753277C2 (de) | Verfahren und Einrichtung zur Spracherkennung | |
DE3645118C2 (de) | ||
DE2518561C3 (de) | Einrichtung zur Erzeugung von Arpeggio-Effekten durch ein elektronisches Musikinstrument | |
DE2820645A1 (de) | Vorrichtung und verfahren zur spracherkennung | |
DE2034623C2 (de) | Verfahren für das Erkennen von Sprachsignalen in Rauschen | |
DE2326517A1 (de) | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern | |
DE3407078A1 (de) | Elektronisches musikinstrument | |
DE2806920A1 (de) | Stimmenidentifikationssystem | |
DE2659096A1 (de) | Verfahren und vorrichtung zur spracherkennung | |
DE2650255A1 (de) | Schaltungsanordnung zur automatischen erkennung kontinuierlicher sprachsignale, insbesondere eines oder mehrerer kontinuierlich gesprochener worte oder zahlen | |
DE4031638C2 (de) | ||
DE3043516C2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE2836738C3 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtungen zur Durchführung des Verfahrens | |
DE2748422C2 (de) | Polyphones elektronisches Musikinstrument | |
DE1422040A1 (de) | Verfahren zum automatischen Erkennen gesprochener Worte | |
DE2836736A1 (de) | System zum kodieren von tiefen- und hoehenausdruckseffekten bei der aufnahme von der tastatur eines elektronischen klaviers | |
DE2844703C2 (de) | Elektronisches Musikinstrument mit einer Einrichtung zum Erzeugen unterschiedlicher Arten von Musiktönen | |
DE2854601C2 (de) | Verfahren zur Tonaufbereitung und Ton-Synthesator zu seiner Durchführung | |
DE3246712C2 (de) | ||
DE2901969A1 (de) | Elektronisches musikinstrument mit einer einrichtung zur erzeugung variabler impulse | |
DE2431458A1 (de) | Verfahren zur automatischen sprechererkennung | |
DE1547002A1 (de) | Vorrichtung,die auf gesprochene Informationen anspricht,insbesondere phonetische Schreibmaschine | |
DE1202517B (de) | Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OAP | Request for examination filed | ||
OD | Request for examination | ||
8131 | Rejection |