-
Verfahren zum selbsttätigen Umsetzen von Lautschwingungen in Lauterkennungs-Signale
Die Erfindung betrifft ein Verfahren zur selbsttätigen Umsetzung von Lautschwingungen
in Lauterkennungs-Signale zum Zwecke der automatischen Spracherkennung, das gegebenenfalls
auch für die Auswertung anderer nicht gleichförmiger Schwingungen anwendbar ist.
In der Hauptsache ist dabei an die Umwandlung gesprochener Laute in elektrische
Zeichen gedacht, d. h. die Umwandlung gesprochener Wörter in geschriebenen Text
(automatisches Diktiergerät), ferner an die Erkennung gesprochener Ziffern (Ziffernerkennungsgerät)
und ihre Auswertung zur Steuerung von Einstellfunktionen an Automaten, weiterhin
an ihre Verwendung bei der Frequenzbandkompression in Übertragungssystemen, bei
der Sprachverständigung mit Gehörlosen, bei der Übersetzung in Fremdsprachen, bei
der Sprachforschung, bei Dopplereffekt, beim Radar, bei Rechenmaschinen usw.
-
Es ist bekannt, daß die bisherigen Verfahren in erster Linie auf Frequenzanalyse
beruhen. So werden bei einem Verfahren sechs Bandfilter verwendet und die Formen
der Hüllkurven ihrer Ausgangsspannungen, vor allem der Art des Anstieges und Abfalls
der den Silben und Worten eigentümlichen Impulse, die man nach Gleichrichtung gewinnt,
ausgenutzt. Ein anderes Verfahren zählt nach der Frequenzanalyse alle Nulldurchgänge
innerhalb eines ganzen Wortes. Andere Verfahren verwenden ebenfalls eine große Anzahl
von Filtern und stellen die spektrale Zusammensetzung fest. Auch werden Lautanalysatoren
und umfangreiche Speicher mit Korrelator verwendet.
-
Bei allen diesen Verfahren und Anordnungen wird eine befriedigende
Sicherheit der Erkennung nur dann erreicht, wenn ihr »Gedächtnis« individuell auf
den jeweiligen Sprecher geeicht wird. Durchweg ist der Aufwand sehr groß. Es gibt
gegenwärtig noch kein Gerät, welches auch nur annähernd die Eigenschaft hat, die
man von einem praktisch verwendbaren System zur automatischen Spracherkennung fordern
muß.
-
Erfindungsgemäß ist vorgesehen, daß amplitudenbewertete und/oder nach
der Schwingungsdauer bewertete Steuersignale zweier benachbarter Schwingungszüge
miteinander verglichen werden und die dabei erhaltenen Differenzwerte einen Umschlagspunkt
ergeben, der zur Bildung von Einteilungen benutzt wird.
-
Die Erfindung stützt sich auf die Erkenntnis, daß die Lautschwingungen
unterschiedliche Amplituden bzw. Anfangsfrequenzen und Endfrequenzen aufweisen.
Es ergibt sich so eine Folge von Schwingungen, die z. B. von höheren Frequenzen
ausgehend zu tieferen übergeht und dann plötzlich von den tieferen wieder zu höheren
umschlägt. Somit sind die Schwingungszüge in aufeinanderfolgende Abschnitte -aufgeteilt.
Eine Vorrichtung, die die Anfänge und Enden der Lautabschnitte feststellt, ermöglicht
damit die Abtrennung zur Unterscheidung der einzelnen Laute, wobei die Wellenform
weitere Erkennungsmerkmale liefert.
-
F i g. 2 zeigt ein Beispiel der bei Lautschwingungen auftretenden
Schwingungsformen, wobei ein Teil herausgegriffen ist, der zwei Abschnitte mit einem
dazwischenliegenden Umschlagspunkt ersehen läßt. Man erkennt über der Zeitachse
t einen ersten Abschnitt 1, welcher drei aufeinanderfolgende Schwingungen enthält,
deren Auslenkungen wie auch Schwingungsdauern kleiner werden (die Auslenkungen ergeben
positive und negative Amplituden, wenn man sich die Schwingung durch senkrechtes
Verschieben der Flankenhalbierungspunkte auf eine Nullachse symmetrisiert denkt,
die Schwingungsdauern werden dann durch den Zeitabstand der Nulldurchgänge und die
Anzahl der Schwingungen in einem Abschnitt durch die Häufigkeit der Nulldurchgänge
meßbar). Nach der dritten Schwingung des Abschnitts 1 wird der Umschlagpunkt P gegeben
durch ein plötzliches Größerwerden der Amplitude (Auslenkung) wie auch der Schwingungsdauer,
durch das Abschnitt 2 eingeleitet wird, in dem dann beide Größen fortlaufend wieder
kleiner werden und vier Schwingungen vorhanden sind, bei denen dies der Fall ist.
In F i g. 2 ist noch eine dem Abschnitt 1 vorausgehende und eine dem Abschnitt
2 nachfolgende Einzelschwingung dargestellt, um erkennbar zu machen, daß auch der
Anfang von Abschnitt 1 und
das Ende von Abschnitt 2 durch Umschlagspunkte
der genannten Art bestimmt werden. Bei Schwingungen dieser Art sind auch Gruppen
aufeinanderfolgender Einzelschwingungen gegeneinander vergleichbar, solche wie auch
Einzelschwingungen sind als »Schwingungszug« bezeichnet.
-
Der zur Kennzeichnung der Lautabschnitte benutzte Schwingungsumschlag
kann dabei durch ein Vergleichsverfahren ermittelt werden, indem jeder Schwingungszug
mit dem vorhergehenden verglichen wird. Durch einen solchen fortgesetzten Vergleich
der Schwingungszüge können die darin stattfindenden erwähnten Umschläge augenblicklich
ermittelt werden.
-
Die Erfindung ist an Hand der Zeichnung beschrieben. Es bedeutet F
i g.1 ein Blockschema der Eingangsschaltung, F i g. 2 einen Schwingungszug mit Umschlagspunkt,
F i g. 3 ein Blockschema der Steuerung.
-
Die Durchführung der fortgesetzten Vergleiche kann in der Weise geschehen,
daß bei zwei aufeinanderfolgenden Schwingungen jeweils die erste eine Meßgröße anwachsen
und die nachfolgende sie sich vermindern läßt, so daß die jeweilige Summe der Meßgrößen
ein Kriterium liefert. So kann, um Beispiele zu nennen, wobei eine Schwingung mit
1 und die nachfolgende mit 2 bezeichnet sein möge, 1 einen Kondensator aufladen,
2 ihn entladen, wobei der Ladungszustand des Kondensators ein Kriterium hergibt.
Schwingung 1 kann einen Flipflopzähler entsprechend ihrer Länge in einem
Sinne, also z. B. vorwärts, 2 ihn rückwärts zählen lassen, so daß der Zählerstand
ein Kriterium gibt. Oder es könnten Amplitudenveränderungen durch eine Hüllkurve
angezeigt werden. Bei FM mit einem C-Mikrophon kann 1 das C eines Schwingungskreises
verändern, z. B. laden, 2 es wieder entladen. Es kann auch 1 eine Magnetisierung
bewirken und 2 eine Wiederentmagnetisierung, so daß der Magnetisierungszustand das
Kriterium gibt.
-
Nimmt man etwa das Beispiel des Zählers, der während der Länge einer
Schwingung vorwärts und während der der nächsten rückwärts zählt, so ist es klar,
daß, wenn entsprechend dem oben Ausgeführten ein charakteristischer Abschnitt z.
B. von langen zu kürzer werdenden Schwingungen fortschreitet, der Zählerstand vom
Beginn der ersten Schwingung aus gerechnet langsam aufgebaut bzw. vom Beginn der
zweiten Schwingung aus langsam aufgebaut wird, während beim erneuten Auftreten einer
langen Schwingung (Umschlag in den nächsten Abschnitt) ein plötzlicher Sprung in
diesem Vorgang eintritt.
-
Die Figuren zeigen als Blockschaltbilder zwei Beispiele von Anordnungen
zur Durchführung des erfindungsgemäßen Verfahrens. Wie aus F i g.1 zu erkennen,
gelangen die am Eingang E eingehenden Frequenzen einmal auf eine Einrichtung 3,
die in der vorerläuterten Art ein Vergleichsverfahren durchführt. Die Eintragung
»1. aufl. 2. entl.« verweist auf die geschilderte Möglichkeit der wechselweisen
Auf-und Entladung eines Kondensators (an deren Stelle, wie erwähnt, auch Vorwärts-
und Rückwärtszählen, Magnetisieren und Entmagnetisieren usw. treten könnte). Ein
nachfolgendes Anzeigegerät 4 gibt über einen Impulsbildner 5 bei bestimmter Anzeige,
die entsprechend dem oben Gesagten bei einem Umschlag auftritt, einen Impuls JP
auf ein Tor6, von dem aus die Impulse JP zur eventuellen weiteren Auswertung auf
einen AusgangAi gelangen. Außerdem gelangen die die charakteristischen Abschnitte
des Frequenzzuges markierenden Impulse auf ein Meßgerät 7, in dem die Häufigkeit
bzw. Dauer von Vorgängen, also insbesondere Schwingungen innerhalb dieser Abschnitte
festgestellt wird (das Wort »Vorgänge« besagt, daß, wie physikalisch klar ist, z.
B. auch Wendepunkte, Nulldurchgänge, durch Beschneidung entstehende Impulse usw.
gezählt werden könnten). In Form von weiteren Impulsen werden diese Kriterien auf
einen zweiten Ausgang A2 gegeben.
-
Bei der Anordnung nach F i g. 3 gelangen die Eingangsfrequenzen, wie
ersichtlich, auf ein Hochpaßfilter 8 und ein Tiefpaßfilter 9, deren Ausgänge ein
Flipflop 10 jeweils umwerfen können, so daß dieses bei dem Umschlag von hohe auf
niedrige Frequenzen bzw. umgekehrt einen Abtrennimpuls JP abgibt. Gleichzeitig gehen
die Frequenzen durch weitere Filter 11, wobei bei jedem Buchstaben entsprechend
den auftretenden Frequenzen einige bestimmte Filter ansprechen. Ihre Ausgänge sind
mit Flipflops 12 verbunden, und zwar sind sie als mit der Mitte der Flipflops verbunden
dargestellt, was besagt, daß diese hin- und zurückgeschaltet werden. Hingegen werden
die Impulse JP jeweils einem Eingang der Flipflops zugeführt, bringen diese also
in eine bestimmte (Ausgangs-)Lage. Die mit den Filtern 11 verbundenen Flipflops
12 führen mithin eine Abzählung der gefilterten Schwingungen durch, und ihre
Ausgänge führen über Speicher 13 zu Toren 14, die andererseits von
den Abtrennimpulsen betätigt werden. Die Verknüpfungen 15 dieser Kriterien
können dann z. B. über jeweils ein weiteres Flipflop 16 Steuerimpulse etwa für eine
Schreibmaschine liefern.