DE3215868C2 - - Google Patents
Info
- Publication number
- DE3215868C2 DE3215868C2 DE19823215868 DE3215868A DE3215868C2 DE 3215868 C2 DE3215868 C2 DE 3215868C2 DE 19823215868 DE19823215868 DE 19823215868 DE 3215868 A DE3215868 A DE 3215868A DE 3215868 C2 DE3215868 C2 DE 3215868C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- sequence
- test signal
- address
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012360 testing method Methods 0.000 claims abstract description 146
- 230000015654 memory Effects 0.000 claims abstract description 60
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims description 11
- 230000001427 coherent effect Effects 0.000 claims description 5
- 238000013101 initial test Methods 0.000 claims 2
- 101150087426 Gnal gene Proteins 0.000 claims 1
- 230000007704 transition Effects 0.000 abstract description 22
- 230000006978 adaptation Effects 0.000 abstract description 3
- 230000001419 dependent effect Effects 0.000 abstract description 2
- 238000002955 isolation Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 241000143437 Aciculosporium take Species 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Die Erfindung betrifft ein Verfahren zum Erkennen der
Wörter einer zusammenhängenden Wortkette nach dem Ober
begriff des Anspruchs 1.
Ein derartiges Verfahren ist bekannt aus der Zeitschrift
"IEEE Transactions on Acoustics, Speech, and Signal
Processing", Vol. Assp-29, No. 2, April 1981, Seiten 284
bis 297. Dabei werden die aus dem Sprachsignal gewonnenen
Testsignale mit den Folgen der Referenzsignale für alle zu
erkennenden Wörter unter Anwendung von nichtlinearer
Zeitanpassung verglichen und der Weg der besten Überein
stimmung durch jedes Wort bis zu dessen Ende ermittelt und
dieser Endpunkt jeweils registriert. Nach dem Durchlaufen
aller Wörter werden ausgehend von diesen Endpunkten alle
Wörter nochmals mit wenigstens zum größten Teil denselben
Testsignalen durchlaufen und wieder für jeden vorher
gehenden Endpunkt und für jedes Wort der Weg der besten
Übereinstimmung ermittelt. Dieses Verfahren wird fort
gesetzt, wobei also dieselben Testsignale wiederholt
verwendet werden, bis Wege bester Übereinstimmung beim
letzten Testsignal enden. Ein Problem bei der Erkennung
der Wörter in einer zusammenhängenden Wortkette besteht
nämlich darin, daß zunächst die Wortgrenzen in dem
Sprachsignal nicht bekannt sind, so daß zunächst nicht
ohne weiteres bekannt ist, wann in dem Sprachsignal erneut
der Vergleich mit dem Anfang der einzelnen Folgen der
Referenzsignale durchgeführt werden muß. Das bekannte
Verfahren ermittelt daher mehrere Wege, die Kandidaten für
den insgesamt optimalen Weg sein könnten. Am Ende des
gesamten Sprachsignals wird ausgehend von der kleinsten
Unterschiedsumme, die sich an diesem Punkt ergeben hat,
der optimale Weg zurückverfolgt. Die zunächst unbekannten
Wortgrenzen ergeben sich dann automatisch durch das
Zurückverfolgen.
Das bekannte Verfahren ist jedoch sehr kompliziert und
aufwendig, da es mehrere "Ebenen" verwendet, d. h. erst
alle Wörter einmal vergleicht und danach von den
jeweiligen Endpunkten ausgehend erneut alle Wörter
vergleicht usw. Dadurch sind eine Anzahl Randbedingungen
notwendig, die möglicherweise verhindern können, daß der
optimale Weg wirklich gefunden wird. Außerdem erfordert
das bekannte Verfahren einen großen Speicherplatzbedarf.
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren,
mit dem auf einfache Weise bei geringem
Speicherplatzbedarf mit großer Wahrscheinlichkeit der
optimale Weg, d. h. die optimale Aufeinanderfolge von
Folgen von Referenzsignalen und damit die wahrschein
lichste Folge der Wörter der Wortkette ermittelt werden
kann und eine zugehörige Anordnung anzugeben.
Diese Aufgabe wird bezüglich des Verfahrens erfindungsgemäß durch die im Anspruch 1
angegebenen Merkmale und bezüglich der Anordnung
durch die im Anspruch 7 angegebenen Merkmale gelöst.
Bei dem erfindungsgemäßen Verfahren werden also keine
verschiedenen Ebenen gebildet, sondern jedes Testsignal
wird nur einmal mit allen Referenzsignalen aller Folgen
verglichen. Ferner wird eine mögliche Wortgrenze
automatisch an jeder Stelle angenommen, indem die kleinste
Unterschiedsumme am Ende der einzelnen Folgen von
Referenzsignalen beim vorhergehenden Testsignal gesucht
wird, denn der optimale Weg der Zeitanpassung kann nur,
muß jedoch nicht, durch einen solchen Punkt laufen. Ob
tatsächlich eine mögliche Wortgrenze vorliegt, wird durch
Vergleich mit den Anfängen jeweils neuer Folgen von
Referenzsignalen bestimmt. Bei jeder solchen möglichen
Wortgrenze wird die Testsignaladresse des Endpunktes der
vorhergehenden Folge von Referenzsignalen gespeichert,
damit später der optimale Weg zurückverfolgt werden kann,
wenn dieser tatsächlich durch die angenommene Wortgrenze
verläuft, und es wird ferner die Ordnungsnummer der
vorhergehenden Folge von Referenzsignalen gespeichert,
d. h. die Angabe des Wortes, für das zuletzt eine gute
Übereinstimmung mit dem Testsignal vorlag. Auf diese Weise
ergeben sich zwar eine Vielzahl von möglichen Wortgrenzen,
von denen durch Zurückverfolgen nach Verarbeitung des
letzten Testsignals nur wenige ausgewählt werden, nämlich
die auf dem optimalen Wege der Zeitanpassung liegenden,
jedoch ist der Speicherplatz dennoch sehr begrenzt. Es muß
lediglich für jedes Referenzsignal aller Folgen die
jeweilige Unterschiedsumme sowie eine Angabe über den
Anfang des Weges der Zeitanpassung in dieser Folge von
Referenzsignalen gespeichert werden, was mit jedem neuen
Testsignal überschrieben wird, und für jede Testsignal
adresse müssen zwei Speicherplätze vorgesehen werden,
nämlich einer für die Angabe des Wortes, das an dieser
Stelle möglicherweise gerade geendet hat, und die Angabe,
wo dieses Wort begonnen hat, damit das jeweils vorher
gehende Wort beim Zurückverfolgen aufgefunden werden kann.
Ausgestaltungen des erfindungsgemäßen Verfahrens sind in
den Unteransprüchen 2 bis 6 gekennzeichnet. Darin wird
u. a. berücksichtigt, daß die Ermittlung der kleinsten
Unterschiedsumme am Ende jeweils aller Folgen von
Referenzsignalen beim vorhergehenden Testsignal einen
gewissen Zeitaufwand erfordert, so daß die Wiederholung
dieses Vorgangs beim Anfang jeder neuen Folge von
Referenzsignalen ungünstig ist. Daher werden zweckmäßig
die Endpunkte der optimalen Folgen am Ende der Vergleiche
des Testsignals mit allen Referenzsignalen ermittelt. Auf
diese Weise erfolgt die Ermittlung der kleinsten
Unterschiedsumme für jedes Testsignal nur einmal, und es
ist am Anfang jeder Folge von Referenzsignalen nur ein
einfacher Vergleich notwendig, der schnell durchgeführt
werden kann.
Ferner werden zur Erhöhung der Erkennungssicherheit
syntaktische Regeln berücksichtigt, da bestimmte Wort
folgen sehr unwahrscheinlich und andere Wortfolgen dagegen
sehr wahrscheinlich sein können. Diese Berücksichtigung
erfolgt durch Addition eines Syntaxwertes, der abhängig
ist von der Kombination der Ordnungsnummer der endenden
Folge und der Ordnungsnummer der momentanen Folge. Durch
solche künstliche Erhöhung der Unterschiedsummen an Wort
grenzen werden also bestimmte Folgen von Wörtern
bevorzugt, da sie im normalen Sprachgebrauch auch mit
größerer Wahrscheinlichkeit vorkommen.
In vielen Fällen wird ein Sprachsignal nicht aus einer
vollständig zusammenhängend gesprochenen Kette von Worten
bestehen, sondern es können zwischen einzelnen Wörtern
auch Pausen auftreten. Solche Sprachpausen können mit
bekannten Anordnungen erkannt werden, die jedoch zusätz
lichen Aufwand erfordern und nicht immer zuverlässig
arbeiten. Eine einfachere Möglichkeit besteht darin, daß
eine der Folgen von Referenzsignalen einer Sprachpause
entspricht. Auf diese Weise wird eine Sprachpause
praktisch wie ein bestimmtes Wort behandelt und wird
automatisch miterkannt.
Da das Vokabular grundsätzlich nur begrenzt sein kann, ist
es möglich, daß im Sprachsignal ein Wort auftritt, das in
diesem Vokabular nicht vorhanden ist. Um ein solches Wort
einschließlich seiner Grenzen dann zumindest als nicht
erkennbar angeben zu können, ohne die Erkennung der
erkennbaren Wörter zu beeinflussen, wird als Unterschied
wert ein konstanter Wert verwendet. Damit wird ein Wort,
das nicht dem vorgesehenen Vokabular angehört und einen
vorgegebenen Unterschied zu den Wörtern des Vokabulars
überschreitet, automatisch als Sprachpause erkannt. Statt
dessen kann auch zusätzlich zu einer Folge von Referenz
signalen, die einer Sprachpause entspricht, eine Folge von
Referenzsignalen verwendet werden, die einem nicht
erkennbaren Wort entspricht.
Eine Anordnung zur Durchführung des erfindungsgemäßen
Verfahrens entsprechend dem Oberbegriff des Anspruchs 7
geht aus von einer Anordnung gemäß der DE-OS 30 35 565,
die gemäß den Merkmalen im Kennzeichen des Anspruchs 7
ausgestaltet ist. Eine solche Anordnung enthält außer den
unbedingt erforderlichen Speichern nur wenige zusätzliche
Teile und ist daher einfach und preiswert aufgebaut.
Wenn das zu erkennende Vokabular nicht zu umfangreich ist
bzw. sehr schnelle elektronische Schaltungen verwendet und
Verarbeitungsvorgänge möglichst parallel ausgeführt
werden, ist es möglich, die Testsignale in Echtzeit zu
verarbeiten. Bei Anwendungsfällen, bei denen eine gewisse
Reaktionszeit zulässig ist und die eher etwas preiswerter
aufgebaut sein sollen, kann es dagegen erforderlich sein,
die Testsignale eines Sprachsignals zwischenzuspeichern.
Um den dafür erforderlichen Aufwand gering zu halten, ist
es zweckmäßig, nach einer Weiterbildung der erfindungs
gemäßen Anordnung, bei der
die Testsignale in einem Testsignalspeicher gespeichert
sind, der von der zweiten Adressiervorrichtung adressiert
wird, den Testsignalspeicher als vierten Speicher zu ver
wenden. Die Speicherung der Angabe des Wortes, das bei einer
möglichen Wortgrenze gerade aufgrund der kleinsten Unter
schiedsumme die beste Übereinstimmung gezeigt hat, sowie die
Speicherung des Anfangspunktes dieses Wortes erfolgt nämlich
erst, wenn das zugehörige Testsignal vollständig verarbeitet
ist und somit nicht mehr benötigt wird.
Ausführungsbeispiele der Erfindung werden nachstehend anhand
der Zeichnungen näher erläutert. Es zeigt
Fig. 1 ein Beispiel eines optimalen Weges nach Zeitanpassung
für ein Sprachsignal,
Fig. 2a die Bildung eines optimalen Weges der Zeitanpassung
innerhalb einer Folge von Referenzsignalen,
Fig. 2b die Bildung des Weges der Zeitanpassung an einer
möglichen Wortgrenze,
Fig. 3 ein Diagramm zur Erläuterung der Notwendigkeit der
Speicherung jeweils des Anfangspunktes eines Weges
der Zeitanpassung innerhalb einer Folge von
Referenzsignalen,
Fig. 4a nochmals das Beispiel des optimalen Weges nach
Fig. 1 mit der Erläuterung der dafür notwendigen
Speicherplätze,
Fig. 4b ein Diagramm zur Erläuterung, daß für die
Speicherung der Unterschiedsummen und der
Anfangspunkte für jedes Referenzsignal aller Folgen
nur ein Speicherplatz notwendig ist,
Fig. 5a und b ein Flußdiagramm des erfindungsgemäßen
Verfahrens,
Fig. 6 ein Blockschaltbild einer Anordnung zur Durchführung
des erfindungsgemäßen Verfahrens.
Aus dem Test-Sprachsignal, das untersucht werden soll,
werden in allgemein regelgemäßigen Zeitpunkten, die einen
Abstand von 10 ms bis 20 ms haben, Testsignale gewonnen.
Diese können beispielsweise das Kurzzeitspektrum des Sprach
signals, die Sprachgrundfrequenz, die Lautstärke oder ähn
liche Werte sein, die für die Worterkennung speziell aufbe
reitet sein können. Die Gewinnung solcher Testsignale ist
bekannt und nicht Gegenstand der Erfindung.
Von dem Test-Sprachsignal ist bekannt, daß es aus einzelnen
Wörtern zusammengesetzt ist, die aus einem vorgegebenen
Vokabular gewählt sind. Die Wörter des Vokabulars ent
sprechen einem Satz von K Folgen von Referenzsignalen, die
aus einzeln gesprochenen Worten gewonnen werden. Die Folgen
der Referenzsignale und damit die Wörter werden mit dem
Index k=1, . . . K bezeichnet. Die einzelnen Referenz
signale innerhalb einer Folge k werden mit j=1, . . . J(k)
bezeichnet, wobei J(k) die Länge der Folge k von Referenz
signalen ist.
Das endgültige Ziel der Erkennung der Wörter in einer
zusammenhängenden Wortkette ist die Bestimmung der Auf
einanderfolge von Folgen von Referenzsignalen, die am besten
mit der Folge der aus dem Test-Sprachsignal gewonnenen Test
signalen übereinstimmt, wobei noch näher zu erläutern ist,
was mit "Übereinstimmung" gemeint ist. Diese Aufeinander
folge der Folgen von Referenzsignalen wird als "Super"-Refe
renzmuster bezeichnet. Das Super-Referenzmuster, das am
besten mit dem Test-Sprachsignal übereinstimmt, wird als die
gesuchte Wortkette angenommen. Da dieses unbekannte Super-
Referenzmuster wie ein einzelnes Wortmuster behandelt werden
kann, ist das Prinzip der Anpassung des unbekannten Musters
an die bekannten Referenzmuster das gleiche wie im Falle der
Erkennung isolierter Wörter.
Dieses Prinzip soll anhand der Fig. 1 näher erläutert
werden. Die Testsignale i des Test-Sprachmusters und die
Referenzsignale j der einzelnen Folgen k (es sind hier
beispielsweise fünf Folgen für fünf Wörter angenommen, die
von 1 bis 5 numeriert sind) bestimmen ein Netz von Raster
punkten i, j, k. Jedem Rasterpunkt ist ein lokaler Unter
schiedswert d(i, j, k) zugeordnet, der ein Maß für die Ab
weichung bzw. den Unterschied zwischen den entsprechenden
akustischen Ereignissen angibt. Das Problem der Erkennung
von zusammenhängenden Wortketten kann darauf zurückgeführt
werden, den Weg durch das Netz von Rasterpunkten i, j, k zu
finden, der die beste Übereinstimmung zwischen den Testsig
nalen und der unbekannten Aufeinanderfolge von Folgen von
Referenzsignalen angibt. Dies kann auch so ausgedrückt
werden, daß die Summe der Unterschiedswerte d(i, j, k) für
alle Rasterpunkte auf diesem Wege ein Minimum ist. Ausgehend
von diesem optimalen Weg kann die Aufeinanderfolge der Fol
gen von Referenzsignalen eindeutig ermittelt werden, wie aus
Fig. 1 hervorgeht.
Zusätzlich zu der Forderung, daß die Gesamtsumme der lokalen
Unterschiedswerte ein Minimum bildet, müssen noch einige
andere Beschränkungen berücksichtigt werden. Dazu gehört,
daß die Zeit entlang den beiden Achsen nur in einer Richtung
läuft, d. h. der optimale Weg kann nur von links unten nach
rechts oben in jeder Folge von Referenzsignalen verlaufen,
und es darf kein Testsignal oder Referenzsignal übersprungen
werden, da die zugrundeliegenden Schallereignisse grundsätz
lich kontinuierlich sind. Die Beschränkungen aufgrund der
Kontinuität bestimmen außerdem den möglichen vorausgehenden
Punkt für einen gegebenen Punkt i, j, k auf dem momentan
verfolgten Weg und werden daher auch als Übergangsregeln
bezeichnet.
Aufgrund der Aneinanderreihung von einzelnen Folgen von
Referenzsignalen zu einem Super-Referenzmuster ist es zweck
mäßig, zwei Arten von Übergangsregeln festzulegen: Über
gangsregeln innerhalb einer Folge von Referenzsignalen und
Übergangsregeln an den Grenzen der einzelnen Folgen. Diese
beiden Übergangsregeln sind in Fig. 2a und Fig. 2b ange
deutet. Daraus ist zu erkennen, daß innerhalb einer Folge
von Referenzsignalen der Punkt i, j, k nur von einem der
Punkte i-1, j, k; i-1, j-1, k; i, j-1, k erreicht werden
kann, wie aus Fig. 2a hervorgeht. Die Übergangsregel für die
Übergänge von einer Folge von Referenzsignalen auf eine neue
Folge bestimmen, daß am Anfang der neuen Folge der Punkt i,
1, k entweder nur von dem Punkt, der zu dem gleichen Refe
renzsignal und dem vorhergehenden Testsignal gehört, oder
von irgendeinem Ende einer Folge, einschließlich derselben
Folge, erreicht werden kann. Die Übergangsregeln für den
Übergang vom Ende einer Folge von Referenzsignalen auf den
Anfang einer neuen Folge können auch noch syntaktische Be
schränkungen berücksichtigen, die auf der Wahrscheinlichkeit
der Aufeinanderfolge bestimmter Wörter beruhen.
Außerdem bestehen natürlich Endpunkt-Beschränkungen in der
Form, daß der optimale Weg beim ersten Testsignal und bei
dem ersten Referenzsignal einer der Folgen beginnen und beim
letzten Testsignal und beim letzten Referenzsignal irgend
einer Folge enden muß.
Die Bestimmung des optimalen Weges erfolgt über die nicht
lineare Zeitanpassung der Folge der Testsignale an die
einzelnen Folgen der Referenzsignale. Dabei wird die
Tatsache ausgenutzt, daß der optimale Weg durch einen
Rasterpunkt i, j, k auch als Teil den diesem Rasterpunkt
vorhergehenden Teilweg umfaßt. Dafür wird die minimale
Unterschiedsumme D(i, j, k) entlang aller Wege zu dem
Rasterpunkt i, j und k bestimmt. Da diese Unterschiedsumme
die Summe der lokalen Unterschiedswerte ist, kann sie ein
fach schrittweise als die Summe der Unterschiede entlang dem
optimalen Weg zu einem vorhergehenden Punkt und dem lokalen
Unterschiedswert des Rasterpunktes i, j, k bestimmt werden.
Für den optimalen Weg muß dann der vorhergehende Punkt mit
der minimalen Unterschiedsumme bestimmt werden. Auf diese
Weise ergibt sich als Übergangsregel für Übergänge innerhalb
einer Folge von Referenzsignalen gemäß Fig. 2a
D(i, j, k) = d(i, j, k) + min {D(i-1, j, k), D(i-1, j-1, k), D(i, j-1, k) }.
An den Grenzen der Folgen von Referenzsignalen bei jeweils
j=1 ergibt die Übergangsregel für Übergänge zwischen
Folgen gemäß Fig. 2b
D(i, 1, k) = d(i, 1, k) + min {D(i-1, 1, k); D(i-1, J(k*) : k*=1, . . ., K }.
Bei Berücksichtigung syntaktischer Regeln kann zu dem Mini
mum der Unterschiedsummen der letzten Referenzsignale aller
Folgen beim vorhergehenden Testsignal noch ein Wert S(k, k*)
addiert werden, dessen Wert von der Wahrscheinlichkeit der
Kombination des vorhergehenden Wortes k* und des momentanen
Wortes k abhängt. Beim ersten Testsignal müssen im übrigen
die Regeln etwas modifiziert werden, da es keine vorher
gehenden Testsignale gibt, so daß ein Rasterpunkt 1, j, k
nur von einem Rasterpunkt 1, j-1, k erreicht werden kann.
Die technische Realisierung der vorstehenden Gleichungen
kann auf verschiedene Weise erfolgen, beispielsweise wie in
der bereits erwähnten DE-OS 30 35 565 für die Bestimmung der
optimalen Übereinstimmung zwischen einem Testwort und einem
Referenzwort beschrieben wurde.
Um für ein Testsignal die Unterschiedsummen für alle Refe
renzsignale zu bestimmen, ist nur ein kleiner Teil der voll
ständigen Matrix von Unterschiedsummen der vorhergehenden
Punkte notwendig, nämlich die zu dem vorhergehenden Test
signal i-1 gehörenden Unterschiedsummen. Die zu diesen Ele
menten gehörenden Rasterpunkte bilden eine senkrechte Spal
te durch die Zeitebene der Fig. 1, wie dies bei der bereits
erwähnten DE-OS 30 35 565 beschrieben wurde, allerdings dort
als waagerechte Zeile.
Gegenüber diesem bekannten Verfahren ist jedoch noch zusätz
lich eine Möglichkeit der Zurückverfolgung des optimalen
Weges notwendig, und zwar für die Punkte des Weges an den
Übergängen von jeweils einer Folge von Referenzsignalen auf
eine andere, d. h. an den Wortgrenzen. Da
die unbekannte
Aufeinanderfolge von Wörtern bzw. Folgen von Referenzsigna
len in dem Test-Sprachsignal bestimmt werden soll, ist es aus
reichend zu ermitteln, bei welchem Testsignal ein beim End
punkt einer Folge von Referenzsignalen endender Teilweg des
optimalen Gesamtweges begonnen hat, da beim unmittelbar vor
hergehenden Testsignal die vorhergehende Folge geendet hat.
Die Einzelheiten des Teilweges innerhalb der Folge von Refe
renzsignalen ist dagegen für die Worterkennung in einer
Wortkette nicht von Bedeutung. Der Endpunkt des Teilweges
des optimalen Weges am Ende jeweils einer Folge von Refe
renzsignalen ist zunächst jedoch noch nicht bekannt, daher
muß die Information zur Zurückverfolgung während des
ganzen Zeitanpassungsvorgangs aufgezeichnet werden. Für
jeden Rasterpunkt i, j, k gibt es einen eindeutigen Start
punkt beim ersten Referenzsignal j=1 innerhalb dieser
Folge k. Daher kann für jeden Rasterpunkt ein Rückwärts
zeiger (Ausgangs-Testsignaladresse) B(i, j, k) bestimmt werden als die Adresse des Test
signals, von dem der beste Weg zu diesem Rasterpunkt i, j, k
begonnen hat. In Fig. 3 ist ein Beispiel für die Rückwärts
zeiger von drei Rasterpunkten gezeigt, die mögliche Vor
gänger für einen vierten, ausgefüllten Rasterpunkt dar
stellen. Wenn die beiden zu dem vorhergehenden Testsignal
gehörenden Rasterpunkte sich nicht in einem Rasterpunkt des
momentanen Testsignals i fortsetzen, kann der optimale Weg
auch nicht durch einen solchen Punkt gehen, und dessen Rück
wärtszeiger braucht dann nicht mehr länger gespeichert zu
werden. Auf diese Weise ist wie bei den Unterschiedsummen
anstelle der ganzen Matrix von Rückwärtszeigern nur jeweils
die Speicherung einer Spalte von Rückwärtszeigern notwendig,
d. h. für jedes Referenzsignal j aller Folgen k ist nur ein
Speicherplatz für die Unterschiedsumme und ein Speicherplatz
für den Rückwärtszeiger erforderlich. Dies ist in Fig. 4a
links dargestellt, wobei Fig. 4b den Übergang der Werte für
das vorhergehende Testsignal i-1 auf das Testsignal i mit
fortschreitender Verarbeitung andeutet. Bei der Verarbeitung
des Referenzsignals j wird der zu diesem Referenzsignal und
dem vorhergehenden Testsignal i-1 gehörende Unterschiedsum
menwert bzw. Rückwärtszeiger z ausgelesen, der zum vorher
gehenden Referenzsignal j-1 gehörende Unterschiedsummenwert
bzw. Rückwärtszeiger y liegt zwischengespeichert vor, und
ebenso kann der einfachen Verarbeitung halber der unmit
telbar vorhergehend ermittelte Unterschiedsummenwert bzw.
Rückwärtszeiger x zwischengespeichert sein. Dann können für
den Rasterpunkt i und j die neuen Werte berechnet und an
stelle des Wertes z in den jeweiligen Speicher eingeschrie
ben werden, während z zwischengespeichert und y gelöscht
wird. Es ist daraus zu erkennen, daß auf diese Weise wirk
lich nur die Werte einer Spalte gespeichert sein müssen.
Für die Zurückverfolgung muß jedoch nicht der Anfang des
Teilweges in der jeweiligen Folge, sondern das Ende des
vorhergehenden Teilweges ermittelt werden, das jedoch, wie
bereits erwähnt, unmittelbar vor dem Anfang des letzten
Teilweges liegt. Das Verfahren kann daher vereinfacht
werden, wenn im Rückwärtszeiger B(i, j, k) nicht die Test
signaladresse des Anfangs, sondern gleich direkt die Test
signaladresse des vorhergehenden Endpunktes gespeichert
wird.
Wie vorher bereits erwähnt, sind nur die Rückwärtszeiger an
den Endpunkten, d. h. den letzten Referenzsignalen J(k) der
einzelnen Folgen k von Interesse, damit die Folge der Wörter
entlang des optimalen Weges zurückverfolgt werden kann, denn
die Rückwärtszeiger an den Endpunkten geben wiederum den
Endpunkt der jeweils vorhergehenden Folge an. Die Rückwärts
zeiger an diesen Endpunkten werden jedoch bei der Verarbei
tung des nächsten Testsignals wieder überschrieben, so daß
ein gesonderter Speicher notwendig ist, der die Rückwärts
zeiger an den Endpunkten der einzelnen Folgen von Referenz
signalen speichert. Da solche Endpunkte bei jedem Test
muster auftreten, muß dieser gesonderte Speicher für jedes
Testsignal Speicherplätze für die Rückwärtszeiger haben.
Eine Einsparung von Speicherplatz ergibt sich aus der Tat
sache, daß nicht die Rückwärtszeiger der Endpunkte aller
Folgen k gespeichert werden müssen, sondern nur der Rück
wärtszeiger des Endpunktes derjenigen Folge, durch den auch
der optimale Weg verläuft, und dies kann nur der Endpunkt
sein, bei dem auch die Unterschiedsumme gegenüber allen an
deren Endpunkten beim gleichen Testsignal ein Minimum ist.
Noch genauer ausgedrückt, braucht auch nur der Rückwärtszei
ger des Endproduktes einer Folge gespeichert zu werden, der
als Ausgangspunkt für eine neue Folge verwendet wird. Diese
letztere Einschränkung ergibt jedoch keine Einsparung an
Speicherplatz, da wie bereits erwähnt für jedes Testsignal
ein Speicherplatz vorgesehen sein muß, so daß diese Ein
schränkung unberücksichtigt bleiben kann, wodurch auch eine
Vereinfachung des Ablaufs des Verfahrens möglich ist. Es
wird daher immer der Rückwärtszeiger B(J(k)) als Testsignal
adresse F(i) des vorhergehenden Endpunktes gespeichert, bei
dem die Unterschiedsumme D(j, k) am kleinsten ist.
Da aber nicht die Endpunkte selbst der einzelnen Teilwege
des optimalen Weges innerhalb jeweils einer Folge von Refe
renzsignalen von Interesse sind, sondern die der jeweiligen
Folgen zugeordneten Wörtern, müssen die diese Wörter an
gebenden Ordnungsnummern der Folgen der Referenzsignale
ebenfalls gespeichert werden, und zwar zusammen mit den
jeweiligen Anfangsadressen F(i). Die so gespeicherten Ord
nungsnummern der Folgen werden mit T(i) bezeichnet und sind
die Ordnungsnummern derjenigen Folgen k, an deren Endpunkten
J(k) die gegenüber allen anderen Folgen beim gleichen Test
signal die kleinste Unterschiedsumme D(J(k), k) auftritt.
Aus Fig. 4a ist dann zu erkennen, daß sich aus den beim
letzten Testsignal N gespeicherten Werten die Testsignal
adresse i(l-1) des Endprodukts der vorhergehenden Folge und
die Ordnungsnummer k(l) der letzten Folge ergibt. In
gleicher Weise ergeben die anderen gespeicherten Testsignal
adressen F(i) unmittelbar die Adressen, an denen die Ord
nungsnummer k(l-1), k(l-2) . . . der jeweils vorhergehenden
Folge sowie die Testsignaladresse i(l-2), i(l-3) . . . des
Endes der davor endenden Folge enthalten sind, wie durch die
Pfeile angedeutet ist, die die Speicherplätze i(l-1),
i(l-2), i(l-3) usw. des Speichers F(i) verbinden.
Der vollständige Ablauf der bisher beschriebenen Verfahrens
schritte ist als Flußdiagramm in den Fig. 5a und 5b darge
stellt. Mit der Auslösung des Starts im Block 101, der bei
spielsweise durch die Detektion des Beginns eines Sprachsig
nals oder durch eine Tastenbetätigung des Sprechers verur
sacht wird, wird im Block 102 die Testsignaladresse i auf 1
gesetzt und das erste Testsignal empfangen. Dieses erste
Testsignal wird gemäß dem Block 103 anders verarbeitet als
die folgenden Testsignale, nämlich es werden die Unterschie
de zu den einzelnen Referenzsignalen jeder Folge aufsummiert
und die aufsummierten Unterschiede als Unterschiedsummen
D(j, k) abgespeichert. Als Rückwärtszeiger B(j, k) wird für
alle Referenzsignale j, k der Wert 1 abgespeichert.
Im Block 104 wird geprüft, ob alle Folgen k verarbeitet
sind, d. h. ob die letzte Folge K von Referenzsignalen mit
dem ersten Testsignal verarbeitet worden ist. Solange dies
nicht der Fall ist, wird der Block 103 wiederholt.
Nach Verarbeitung aller Folgen von Referenzsignalen wird der
Block 105 durchlaufen. Darin wird die minimale Unterschied
summe der letzten Referenzsignale aller Folgen bestimmt und
als Unterschiedsminimum D 0 abgespeichert. Dieser Schritt hat
für das erste Testsignal ebenso wie die folgenden Schritte
im Block 105 zwar noch keinen Sinn, sondern diese Schritte
sind erst für die späteren Testsignale von Bedeutung, da die
Schritte sich auf die Wortgrenzen beziehen, jedoch werden
sie aus Gründen der Systematik und der Einfachheit auch beim
ersten Testsignal bereits durchlaufen.
Der zweite Schritt im Block 105 speichert für die spätere
Zurückverfolgung des optimalen Weges die Testsignaladresse
F(i) ab, wobei der Ausdruck cormin bedeuten soll, daß als
Testsignaladresse F(i) derjenige Rückwärtszeiger B(j(k), k)
verwendet wird, der zu der minimalen Unterschiedsumme
D(J(k), k) gehört. Ferner wird die Ordnungsnummer T(i)
derjenigen Folge abgespeichert, bei der dieses Minimum der
Unterschiedsumme aufgetreten ist, was durch den Ausdruck
argmin angedeutet wird.
Damit ist die Verarbeitung des ersten bzw. jeweils eines
Testsignals abgeschlossen, und im Block 106 wird die nächste
Testsignaladresse i eingestellt. Im Block 107 wird geprüft,
ob die damit erreichte Testsignaladresse nicht über dem
letzten vorgesehenen Testsignal N liegt. Wenn dies nicht der
Fall ist, d. h. die damit erreichte Testsignaladresse liegt
über der höchsten Adresse N, so daß alle vorgesehenen Test
signale verarbeitet sind, wird auf den Block 120 des den Ab
schluß bildenden Flußdiagrammteils übergegangen, der später
erläutert wird.
Solange noch ein Testsignal verarbeitet wird, wird auf dem
Block 108 übergegangen, bei dem die erste Folge k=1 ein
gestellt wird. Danach folgt der Block 109, mit dem das erste
Referenzsignal j=1 dieser Folge adressiert und mit dem
momentanen Testsignal verarbeitet wird.
Diese Verarbeitung erfolgt im Block 110, wo zunächst die für
dieses Referenzsignal ermittelte und gespeicherte Unter
schiedsumme D(1, k) als Zwischenwert D 1 und der dazugehörige
Rückwärtszeiger B(1, k) als Zwischenwert B 1 gespeichert
wird. Nun wird die neue Unterschiedsumme D(1, k) aus der
Summe des lokalen Unterschiedswertes D (i, 1, k) des Unter
schiedswertes an dieser Stelle und dem Minimum aus der im
Block 105 gespeicherten minimalen Unterschiedsumme D 0 und
der Unterschiedsumme D 1 im vorhergehenden Punkt gebildet und
abgespeichert, wie rechts oben im Block 110 angedeutet ist,
und ferner wird als Rückwärtszeiger B(1, k) im ersteren Fall
die vorhergehende Testsignaladresse i-1 und im zweiten Falle
der zum vorhergehenden Punkt gehörende Rückwärtszeiger B 1
abgespeichert. Damit ist für den ersteren Fall, der eine
mögliche Wortgrenze angibt, der Endpunkt der vorhergehenden
Folge bzw. des vorhergehenden Wortes festgehalten und wird
bis zum Endpunkt des momentan begonnenden Teilweges weiter
gegeben.
Dies folgt über den Weg 3 im Block 112, nachdem im Block 111
die Adresse des nächsten Referenzsignals eingestellt wurde.
Im Block 112 werden wieder zunächst die für dieses Referenz
signal ermittelten Werte der Unterschiedsumme D(j, k) und
des Rückwärtszeigers B(j, k) für das vorhergehende Testsig
nal als weitere Zwischenwerte D 2 bzw. B 2 zwischenge
speichert. Danach wird die neue Unterschiedsumme D(j, k) aus
der Summe des kolalen Abstandswertes d(i, j, k) und dem
Minimum des ersten Zwischenwertes D 1, des zweiten Zwischen
wertes D 2 und der beim unmittelbar vorhergehenden Referenz
signal j-1 ermittelten Unterschiedsumme D(j-1, k), wie auch
hier rechts oben im Block 112 angegeben ist, bestimmt und
abgespeichert, und ebenso der dazugehörige neue Rückwärts
zeiger B(j, k). Der Block 110 entspricht somit der Fig. 2b
bzw. der zugehörigen Gleichung, während der Block 112 der
Fig. 2a bzw. der zugehörigen Gleichung entspricht. Schließ
lich werden die weiteren Zwischenwerte D 2 bzw. B 2 als erste
Zwischenwerte D 1 bzw. B 1 umgespeichert, damit anschließend
neue weitere Zwischenwerte gespeichert werden können, da der
Block 112 nun wiederholt in einer Schleife aus den Blöcken
113, 111 und 112 wiederholt durchlaufen wird.
Dabei prüft der Block 113, ob das letzte Referenzsignal J(k)
der Folge k verarbeitet worden ist. Solange dies nicht der
Fall ist, wird die Schleife erneut durchlaufen. Wenn jedoch
das letzte Referenzsignal J(k) verarbeitet wurde, wird der
Block 144 durchlaufen, bei dem die Adresse der nächsten Fol
ge k eingestellt wird. Danach wird im letzten Block 115 ge
prüft, ob damit eine Adresse über der letzten Folge K er
reicht ist und damit alle Folgen von Referenzsignalen verar
beitet wurden. Wenn dies nicht der Fall ist, wird über den
Weg 2 auf den Block 109 zurückgegangen, bei dem wieder das
erste Referenzsignal der nächsten Folge verarbeitet wird,
usw. Wenn jedoch die letzte Folge verarbeitet wurde, wird
über den Weg 1 auf den Block 105 zurückgegangen, der bereits
beschrieben wurde.
Nachdem das letzte Testsignal verarbeitet worden ist, wird
ausgehend von dem Abfrageblock 107 über den Weg 4 der Block
120 durchlaufen, bei dem eine Adresse n, die die Aufeinan
derfolge der erkannten Wörter angibt, auf Null gesetzt wird.
Anschließend wird im Block 121 diese Adresse um 1 erhöht.
Danach wird im Block 122 die im Block 105 zuletzt erreichte
Ordnungsnummer T(i) als das letzte erkannte Wort Q(n) in
einem Schieberegister abgespeichert und anschließend die an
dieser Adresse enthaltene Testsignaladresse F(i) als neue
Adresse i ausgelesen und zwischengespeichert. Im Block 123
wird geprüft, ob dabei die Adresse 1, die im Block 103 für
den Rückwärtszeiger B(j, k) gespeichert wurde, erreicht ist
und somit das erste erkannte Wort im Schieberegister abge
speichert wurde. Wenn dies nicht der Fall ist, werden die
Blöcke 121, 122 und 123 erneut durchlaufen. Wenn schließlich
die Adresse i=1 erreicht ist, ist das erste erkannte Wort
im Schieberegister abgespeichert, und es wird der Block 124
durchlaufen, bei dem die erkannten Wörter Q(n) in der rich
tigen Reihenfolge ausgegeben werden. Nach Ausgabe des
letzten Wortes wird der Block 125 erreicht, womit die Er
kennung der Wortkette im zugeführten Sprachsignal abge
schlossen ist und ein neues Sprachsignal zugeführt werden
kann.
In Fig. 6 ist ein Blockschaltbild einer möglichen Anordnung
zur Durchführung des erfindungsgemäßen Verfahrens darge
stellt. Darin enthält der Referenzspeicher 2 alle Folgen der
Referenzsignale, die nacheinander durch die Adressiervor
richtung aus den beiden Zählern 4 und 6 adressiert werden.
Dabei adressiert der Zähler 4 die Referenzsignale j inner
halb der Folge, und der Zähler 6 adressiert die einzelnen
Folgen k. In der dargestellten Stellung der Schalter 4 a und
4 b erhält der Zähler 4 das Taktsignal Cl und durchläuft
nacheinander alle Zählerstellungen, die auf der Ausgangs
leitung 5 abgegeben werden, und nach der letzten Zähler
stellung wird ein Übertragsimpuls erzeugt, der über den
Schalter 4 b den Zähler 6 um eine Stellung weiterschaltet,
wobei dessen Zählerstellungen auf der Ausgangsleitung 7
abgegeben werden. Dabei ist der Einfachheit halber ange
nommen, daß alle Folgen k gleich viele Referenzsignale j
enthalten. Anderenfalls kann der Zähler 6 über die Ausgangs
leitung 7 einen nicht dargestellten Festwertspeicher an
steuern, der an den einzelnen Speicherplätzen die Anzahl der
Referenzsignale J(k) der einzelnen Folgen k enthält und
dessen Ausgang mit einem ebenfalls nicht dargestellten Ver
gleicher verbunden ist, dessen anderer Eingang mit der Aus
gangsleitung 5 verbunden ist und dessen Ausgang das Fort
schaltsignal für den Zähler 6 liefert.
Der Ausgang des Speichers 2 ist mit dem einen Eingang eines
Subtrahierers 14 verbunden, dessen anderer Eingang über die
Leitung 9 jeweils ein Testsignal erhält. Dieses Testsignal
kann von einem Speicher 8 geliefert werden, der von einem
Zähler 10 adressiert wird, dessen über die Ausgangsleitung
11 abgegebenen Zählerstellungen die Adresse i des jeweiligen
Testsignals angeben. Falls die dargestellte Anordnung jedoch
so schnell arbeitet, daß ein zugeführtes Sprachsignal in
Echtzeit verarbeitet werden kann, ist die Leitung 9 mit dem
Ausgang einer Anordnung zum Extrahieren der Testsignale aus
dem Sprachsignal verbunden, die an sich bekannt ist und da
rum hier nicht weiter dargestellt ist. Es ist klar, daß so
wohl die vom Speicher 2 gelieferten Referenzsignale wie auch
die über die Leitung 9 zugeführten Testsignale aus Datenwör
tern bestehen, die eine Anzahl binärer Bits enthalten, so
daß die entsprechenden Leitungen wie die Leitung 9 tatsäch
lich aus einer Anzahl entsprechend der Anzahl Bits paral
leler einzelner Verbindungen bestehen, die hier nur der Ein
fachheit halber als eine Leitung dargestellt sind. Dies gilt
auch für die übrigen Leitungen mit Ausnahme einiger Steuer
leitungen wie die Leitung 13, 41, 43 und 53, die tatsächlich
nur aus einer einzelnen Verbindung bestehen.
Dem Subtrahierer 14 werden für jedes über die Leitung 9 zu
geführte Testsignal nacheinander aus dem Speicher 2 alle Re
ferenzsignale zugeführt und deren Differenzen einem Addierer
16 zugeleitet, dessen anderer Eingang mit einem Umschalter
28 verbunden ist. Die vom Addierer 16 gebildeten Summen
stellen die Unterschiedsummen D(j, k) dar und werden in
einem Zwischenregister 20 aufgenommen und anschließend in
einen Speicher 22 abgespeichert, der ebenfalls von den
Zählern 4 und 6 über die Vielfachleitungen 5 und 7
adressiert wird.
Der Ausgang des Zwischenregisters 20, das also die zuletzt
ermittelte Unterschiedsumme D(j-1, k) entsprechend dem Punkt
x in Fig. 4b enthält, ist mit einem Eingang eines Minimumbe
stimmers 26 verbunden. Der Ausgang 23 des Speichers 22, der
also die für das vorhergehende Testsignal i-1 und das momen
tane Referenzsignal j ermittelte Unterschiedsumme ent
sprechend dem Punkt z in Fig. 4b bzw. entsprechend dem Wert
D 1 im Block 110 ind Fig. 5a enthält, ist direkt mit einem
weiteren Eingang des Minimumbestimmers 26 verbunden, da
dieser Wert wegen der Verwendung des Zwischenregisters 20
nicht unbedingt zwischengespeichert werden muß. Ein dritter
Eingang des Minimumbestimmers 26 ist mit dem Ausgang eines
Registers 24 verbunden, das die beim vorherigen Refe
renzsignal am Ausgang 23 abgegebene Unterschiedsumme ent
sprechend dem Punkt y in Fig. 4b bzw. entsprechend dem Wert
D 2 im Block 112 in Fig. 5b enthält. Der Ausgang 27 gibt den
kleinsten der an den drei Eingängen zugeführten Werte ab und
führt diesen über den Schalter 28 dem anderen Eingang des
Addierers 16 zu. Auf diese Weise werden die Unterschied
summen innerhalb der einzelnen Folgen von Referenzsignalen
gebildet. Gleichzeitig werden in einem Speicher 32, der
ebenfalls von den Zählern 4 und 6 über die Leitungen 5 und 7
adressiert wird, der zu dem minimalen der drei vom Minimum
bestimmer 26 ausgewählten Unterschiedsummen gehörende Rück
wärtszeiger gespeichert, indem der Minimumbestimmter über
die Leitung 27 a einen Selektor 36 steuert, der entweder den
am Ausgang des Speichers 32 vorhandenen Rückwärtszeiger, den
im Register 34 vorhandenen, vorher vom Speicher 32 geliefer
ten Rückwärtszeiger oder den im Zwischenregister 30 vor
handenen, zuletzt eingespeicherten Rückwärtszeiger über den
Umschalter 38 einspeichert. Der Selektor 36 wird dabei vom
Minimumbestimmer 26 so gesteuert, daß jeweils die gleichen
Eingänge auf den Ausgang durchgeschaltet werden.
Bevor die Bildung der Unterschiedsummen und der Rückwärts
zeiger am Übergang von jeweils einer Folge Referenzsignalen
auf eine neue Folge beschrieben werden, wird zunächst ange
nommen, daß alle Folgen von Referenzsignalen im Speicher 2
adressiert worden sind und der Folgenzähler 6 ein Übertrag
signal abgibt, das eine bistabile Kippstufe 12 umschaltet,
so daß die Steuerleitung 13 ein Signal führt. Gleichzeitig
werden die Schalter 4 a und 4 b umgeschaltet, so daß der
Folgenzähler 6 nun direkt mit dem Taktsignal Cl weiterschal
tet, während der Zähler 4 auf seinem maximalen Wert ent
sprechend dem letzten Referenzsignale in jeder Folge fest
gehalten wird. Bei verschiedenen Anzahlen je Folge von
Referenzsignalen kann die Leitung 5 von dem Ausgang des
Zählers 4 auf den bereits erwähnten, nicht dargestellten,
über die Leitung 7 adressierten Festwertspeicher umgeschal
tet werden, der die maximale Anzahl von Referenzsignalen
jeder Folge enthält. Damit werden aus dem Speicher 22 die
Unterschiedsummen für das letzte Referenzsignal aller Folgen
nacheinander ausgelesen und über die Ausgangsleitung 23 dem
einen Eingang eines Vergleichers 40 zugeführt, dessen
anderer Eingang mit dem Ausgang 45 eines Minimum-Registers
44 verbunden ist, das zunächst einen Wert entsprechend der
maximal möglichen Unterschiedsumme enthält. Jedes Mal wenn
die Unterschiedsumme am Ausgang 23 kleiner ist als der In
halt des Minimum-Registers 44, gibt der Vergleicher 40 auf
der Ausgangsleitung 41 ein Signal ab, und da gleichzeitig
die Leitung 13 ein Signal führt, erzeugt dann das UND-Glied
42 auf der Ausgangsleitung 43 ein Signal, das die auf der
Ausgangsleitung 23 vorhandene kleinere Unterschiedsumme in
das Minimum-Register 44 einschreibt und gleichzeitig den
zugehörigen, aus dem Speicher 32 ausgelesenen Rückwärts
zeiger in ein erstes Pufferregister 46 sowie die zugehörige
Ordnungsnummer bzw. Adresse der Folge k, die über die Lei
tung 7 einem zweiten Pufferregister 48 zugeführt wird, in
dieses einschreibt. Wenn danach auf der Ausgangsleitung 23
eine noch kleinere Unterschiedsumme erscheint, wird diese
wiederum in das Minimum-Register 44 und der zugehörige
Rückwärtszeiger in das erste Pufferregister 46 und die zuge
hörige Ordnungsnummer der Folge in das zweite Pufferregister
48 eingeschrieben, wobei jeweils der vorhergehende Inhalt
gelöscht wird. Wenn auf diese Weise die Adressen aller Fol
gen k erzeugt worden sind, enthält das Minimum-Register 44
die kleinste Unterschiedsumme D 0 und die beiden Puffer
register 46 und 48 die zugeordneten Werte, nämlich die
Testsignal-Adresse F(i) des Endes der vorhergehenden Folge
und die Ordnungsnummer T(i) der Folge mit der kleinsten
Unterschiedsumme, und der Zähler 6 erzeugt wieder ein Über
tragsignal, das die bistabile Kippstufe 12 wieder zurück
schaltet. Mit dem Verschwinden des Signals auf der Leitung
13 wird einem Speicher 50 ein Schreibsignal zugeführt, so
daß die Inhalte der beiden Pufferregister 46 und 48 an einer
Adresse eingeschrieben werden, die vom Zähler 10 über die
Leitung 11 und dem Umschalter 56 dem Speicher 50 zugeführt
wird. Anschließend wird der Zähler 10 von der bistabilen
Kippstufe 12 um eine Stellung weitergeschaltet, so daß nun
das nächste Testsignal verarbeitet wird. Ferner werden
wieder die Schalter 4 a und 4 b in die gezeichnete Stellung
zurückgeschaltet.
Nun werden wieder die Referenzsignale der Folgen nach
einander aus dem Speicher 2 ausgelesen und mit den zuge
hörigen Unterschiedsummen aus dem Speicher 22 verarbeitet.
Bei jedem ersten Referenzsignal j=1 wird auf einer von dem
Zähler 4 abgeleiteten Leitung 5 a ein Signal erzeugt, das den
Minimumbestimmer 26 so schaltet, daß der Ausgang 23 des
Speichers 22 auf den Ausgang 27 des Minimumbestimmers 26
durchgeschaltet wird, unabhängig von den Werten an den an
deren beiden Eingängen. Ferner vergleicht der Vergleicher
40 die Unterschiedsumme auf der Leitung 23 mit der im Mini
mum-Register 44 gespeicherten minimalen Unterschiedsumme D 0
der Enden aller Folgen beim vorhergehenden Testsignal, und
wenn nun der Inhalt des Minimum-Registers 44 kleiner ist als
die gleichzeitig auf der Ausgangsleitung 23 anstehende
Unterschiedsumme, erzeugt der Vergleicher 40 auf der Aus
gangsleitung 41 kein Signal, so daß durch die Invertierung
an diesem entsprechenden Eingang eines UND-Gliedes 52 dieses
auf der Ausgangsleitung 53 ein Steuersignal erzeugt, das die
Umschalter 28 und 38 in die entsprechende andere Stellung
umschaltet. Damit wird nun das Ausgangssignal des Minimum-
Registers 44 dem anderen Eingang des Addierers 16 zugeführt,
was dem Übergang von einer Folge von Referenzsignalen auf
eine andere Folgen entspricht, und in den Speicher 32 wird
über das Zwischenregister 30 das Ausgangssignal eines Adres
senpufferregisters 18 eingeschrieben, das mit der Adresslei
tung 11 für die Testsignaladressen i verungen ist und somit
die vorhergehende Testsignaladresse i-1 enthält. Auf diese
Weise wird in den Speicher 32 also die Testsignaladresse des
Endpunktes der vorhergehenden Folge eingeschrieben, und an
dieser Adresse war vorher in den Speicher 50 die Ordnungs
nummer T(i) der zugehörigen Folge k und die Adresse F(i) des
Endpunktes der davor endenden Folge eingeschrieben worden.
Wenn das zweite oder die folgenden Referenzsignale jeder
Folge verarbeitet werden, ist das Signal auf der Leitung 5 a
verschwunden, und die Schalter 28 und 38 stehen in der ge
zeichneten Stellung und der Minimumbestimmer 26 arbeitet in
der vorher beschriebenen Weise, indem er die kleinste an den
drei Eingängen anstehende Unterschiedsumme an den Ausgangs 27
abgibt.
Wenn syntaktische Regeln an den Wortübergängen berücksichtigt
werden sollen, kann in die Leitung 45 vor dem Umschalter 28
ein Addierer eingefügt werden, dessen anderer Eingang mit
dem Ausgang eines weiteren, ebenfalls nicht dargestellten
Festwertspeichers verbunden ist, der von der momentanen, auf
der Leitung 7 vorhandenen Adresse der Folge k und der Adres
se der am Ausgang des zweiten Pufferregisters 48 vorhan
denen, vorher gespeicherten Folgeadresse adressiert wird.
Nachdem das letzte Testsignal N einer vorgegebenen Anzahl
von Testsignalen verarbeitet und im Speicher 50 die Ord
nungsnummer T(i) der Folge k von Referenzsignalen, deren
Endpunkt die kleinste Unterschiedsumme geliefert hat, und
die Testsignaladresse F(i) des Endpunktes der vorhergehenden
Summe gespeichert worden ist, wird der Schalter 56 umge
schaltet, so daß der Speicher 50 nunmehr von einem Adreß
register 54, das zunächst die letzte Adresse i enthält,
adressiert wird. Damit wird aus dem Speicher 50 über den
Ausgang 51 die zuletzt eingeschriebene Ordnungsnummer T(i)
ausgelesen, die das letzte Wort der Wortkette angibt, und
mit dem nächsten Taktsignal Cl in ein Schieberegister 58
eingeschrieben. Gleichzeitig wird die an dieser Adresse ge
speicherte Adresse F(i) des Endpunktes der vorhergehenden
Folge in das Adressregister 54 eingeschrieben, so daß diese
Endpunktadresse im Speicher nun adressiert wird. An dieser
Endpunktadresse ist die Ordnungsnummer der vorhergehenden
Folge sowie die Endpunktadresse der davor endenden Folge ge
speichert, usw., so daß in das Schieberegister 58 nacheinan
der die erkannten Worte in der umgekehrten Reihenfolge wie
im Sprachsignal eingeschrieben werden. Dieser Vorgang endet,
wenn der Dekoder 60 erkennt, daß das Adressregister 54 den
Wert 1 enthält, d. h. wenn der Anfang der Wortfolge erreicht
ist. Damit wird die Schieberichtung des Schieberegisters 58
umgekehrt, und am Ausgang erscheint die erkannte Wortkette
in der richtigen Reihenfolge. Nach Ausgabe aller Worte, was
durch einen parallel laufenden Zähler oder durch Prüfung der
am Ausgang 59 auftretenden Signale erfolgen kann, ist die
Ausgabe der erkannten Wortkette abgeschlossen.
Vorstehend sind stets Worte als kleinste Erkennungseinheiten
betrachtet worden. Statt dessen ist es jedoch auch möglich,
statt ganzer Worte auch kleinere Erkennungseinheiten wie
Silben, Halbsilben oder gar Phoneme zu betrachten, deren
Aufeinanderfolge in einem Sprachsignal erkannt werden soll.
Dabei sind jedoch die den syntaktischen Regeln bei der Wort
erkennung entsprechenden Übergangsregeln für die einzelnen
Erkennungseinheiten von größerer Bedeutung, wobei diese
Übergangsregeln dann den gewählten Erkennungseinheiten mög
lichst gut angepaßt sein müssen.
Claims (9)
1. Verfahren zum Erkennen der Wörter einer zusammen
hängenden Wortkette in einem Sprachsignal, aus dem in
aufeinanderfolgenden Zeitpunkten Testsignale (i) mit den
Zeitpunkten entsprechenden Testsignaladressen (i)
abgeleitet werden, die mit den einzelnen Wörtern zugeord
neten Folgen (k) von Referenzsignalen (j, k) derart ver
glichen werden, daß für jedes neue Testsignal (i) ein
Unterschiedswert (d(i, j, k)) zwischen diesem und jedem
dieser Referenzsignale (j, k) gebildet und jeder Unter
schiedswert (d(i, j, k)) zur kleinsten von denjenigen Unter
schiedsummen (D(i-1, j, k); D(i-1, j-1, j-1, k); D(i, j-1, k)), die
zu Referenzsignalen (j-1, k; j, k) in vorgegebener Nachbar
schaft des jeweiligen Referenzsignals (j, k) einschließlich
diesem selbst gebildet wurden, addiert und dadurch für
jedes Referenzsignal (j, k) eine neue Unterschied
summe (D(j, k)) gebildet wird, die für das betreffende
Referenzsignal (j, k) gespeichert wird und zu der
wenigstens beim folgenden Testsignal (i+1) entsprechende
Unterschiedswerte (d(i+1, j, k) addierbar sind, so daß für
jedes Referenzsignal (j, k) eine Folge von Unterschied
summen entsteht, die jeweils mit dem ersten Referenz
signal (1, k) jeder Folge (k) von Referenzsignalen (j, k)
beginnt,
wobei für jedes Referenzsignal (j, k) mit jeder neuen Unterschiedsumme (D(j, k)) außerdem diejenige Testsignal adresse (i), von der die jeweilige Folge von Unterschied summen ausgegangen ist, als Ausgangs-Testsignal adresse (B(j, k))
und für das letzte Referenzsignal (J, k) derjenigen Folge (k), bei der die Unterschiedsumme (D(I, k) bei demselben momentanen Testsignal (i) am kleinsten ist, außerdem bei der momentanen Testsignaladresse (i) die für dieses Referenzsignal (J, k) gespeicherte Ausgangs-Test signaladresse (B(J, k)) als Rückverfolgungsadresse (F(i)) und ein Hinweis auf die Ordnungsnummer (k) dieser Folge als möglicherweise erkanntes Wort (T(i)) gespeichert wird und ausgehend von der Folge (k) von Referenz signalen (i, j), bei der die Unterschiedsumme (D(J, k)) für das letzte Testsignal (N) am kleinsten ist, durch Zurückverfolgen der gespeicherten Rückverfolgungs adressen (F(i)) die dabei gespeicherten Wörter (T(i)) ausgegeben werden, dadurch gekennzeichnet
daß bei jedem Testsignal (i) für jeweils das erste Referenzsignal (1, k) jeder Folge (k) die zu diesem Referenzsignal (1, k) beim vorhergehenden Testsignal (i-1) ermittelte Unterschiedsumme (D(1, k)) mit den Unterschied summen (D(J, k)) des jeweils letzten Referenzsignals (J, k) aller Folgen (k) beim vorhergehenden Testsignal (i-1) verglichen wird,
daß, falls bei einem solchen Vergleich die kleinste Unter schiedsumme die bei einem letzten Referenzsignal (J, k) einer Folge (k) aufgetretene (D min (J, k)) war, für das momentane erste Referenzsignal (1, k) die neue Unterschiedsumme (D(1, k)) und die Testsignaladresse (i-1) des unmittelbar vorhergehenden Testsignals (i-1) als Ausgangs-Testsignaladresse (B(j, k))
und bei der momentanen Testsignaladresse (i) der Hinweis auf die Ordnungsnummer (k) der Folge mit der kleinsten Unterschiedsumme (D min (J, k)) als möglicherweise erkanntes Wort (T(i)) sowie die dem letzten Referenzsignal dieser Folge zugeordnete Ausgangs-Testsignal adresse (B(j, k)) als Rückverfolgungsadresse (F(i)) gespeichert wird oder,
falls die kleinste Unterschiedsumme die beim vorher gehenden Testsignal (i-1) und diesem ersten Referenz signal (1, k) aufgetretene (D(1, k)) war, für dieses erste Referenzsignal (1, k) die beim unmittelbar vorhergehenden Testsignal (i-1) gespeicherte Anfangs-Testsignal adresse (B(j, k)) übernommen und gespeichert wird, und daß ausgehend von demjenigen letzten Referenz signal (J, k(l)) aller Folgen (k), bei dem für das letzte Testsignal (N) die kleinste Unterschied summe (D min (J, k(l))) aufgetreten ist, die Ordnungs nummer (k(l)) der zugehörigen Folge als tatsächlich erkanntes letztes Wort ausgegeben und die für dieses letzte Referenzsignal (J, k(l)) gespeicherte Anfangs- Testsignaladresse (B(j, k)) angesteuert und die dabei gespeicherte Ordnungsnummer (k(l-1)) ausgegeben und die dafür gespeicherte Testsignaladresse (F(i(l-2))) angesteuert wird usw., bis die erste Testsignaladresse (1) erreicht ist, wobei die ausgegebenen Ordnungsnummern die erkannten Wörter in umgekehrter Reihenfolge wie im Sprachsignal angeben.
wobei für jedes Referenzsignal (j, k) mit jeder neuen Unterschiedsumme (D(j, k)) außerdem diejenige Testsignal adresse (i), von der die jeweilige Folge von Unterschied summen ausgegangen ist, als Ausgangs-Testsignal adresse (B(j, k))
und für das letzte Referenzsignal (J, k) derjenigen Folge (k), bei der die Unterschiedsumme (D(I, k) bei demselben momentanen Testsignal (i) am kleinsten ist, außerdem bei der momentanen Testsignaladresse (i) die für dieses Referenzsignal (J, k) gespeicherte Ausgangs-Test signaladresse (B(J, k)) als Rückverfolgungsadresse (F(i)) und ein Hinweis auf die Ordnungsnummer (k) dieser Folge als möglicherweise erkanntes Wort (T(i)) gespeichert wird und ausgehend von der Folge (k) von Referenz signalen (i, j), bei der die Unterschiedsumme (D(J, k)) für das letzte Testsignal (N) am kleinsten ist, durch Zurückverfolgen der gespeicherten Rückverfolgungs adressen (F(i)) die dabei gespeicherten Wörter (T(i)) ausgegeben werden, dadurch gekennzeichnet
daß bei jedem Testsignal (i) für jeweils das erste Referenzsignal (1, k) jeder Folge (k) die zu diesem Referenzsignal (1, k) beim vorhergehenden Testsignal (i-1) ermittelte Unterschiedsumme (D(1, k)) mit den Unterschied summen (D(J, k)) des jeweils letzten Referenzsignals (J, k) aller Folgen (k) beim vorhergehenden Testsignal (i-1) verglichen wird,
daß, falls bei einem solchen Vergleich die kleinste Unter schiedsumme die bei einem letzten Referenzsignal (J, k) einer Folge (k) aufgetretene (D min (J, k)) war, für das momentane erste Referenzsignal (1, k) die neue Unterschiedsumme (D(1, k)) und die Testsignaladresse (i-1) des unmittelbar vorhergehenden Testsignals (i-1) als Ausgangs-Testsignaladresse (B(j, k))
und bei der momentanen Testsignaladresse (i) der Hinweis auf die Ordnungsnummer (k) der Folge mit der kleinsten Unterschiedsumme (D min (J, k)) als möglicherweise erkanntes Wort (T(i)) sowie die dem letzten Referenzsignal dieser Folge zugeordnete Ausgangs-Testsignal adresse (B(j, k)) als Rückverfolgungsadresse (F(i)) gespeichert wird oder,
falls die kleinste Unterschiedsumme die beim vorher gehenden Testsignal (i-1) und diesem ersten Referenz signal (1, k) aufgetretene (D(1, k)) war, für dieses erste Referenzsignal (1, k) die beim unmittelbar vorhergehenden Testsignal (i-1) gespeicherte Anfangs-Testsignal adresse (B(j, k)) übernommen und gespeichert wird, und daß ausgehend von demjenigen letzten Referenz signal (J, k(l)) aller Folgen (k), bei dem für das letzte Testsignal (N) die kleinste Unterschied summe (D min (J, k(l))) aufgetreten ist, die Ordnungs nummer (k(l)) der zugehörigen Folge als tatsächlich erkanntes letztes Wort ausgegeben und die für dieses letzte Referenzsignal (J, k(l)) gespeicherte Anfangs- Testsignaladresse (B(j, k)) angesteuert und die dabei gespeicherte Ordnungsnummer (k(l-1)) ausgegeben und die dafür gespeicherte Testsignaladresse (F(i(l-2))) angesteuert wird usw., bis die erste Testsignaladresse (1) erreicht ist, wobei die ausgegebenen Ordnungsnummern die erkannten Wörter in umgekehrter Reihenfolge wie im Sprachsignal angeben.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß für jedes auf das erste
Referenzsignal (1, k) folgende Referenzsignal (j, k) aller
Folgen (k) der zu dem jeweiligen Referenzsignal (j, k) und
dem momentanen Testsignal (i) gehörende Unterschied
wert (d(i, j, k)) zu der kleinsten der Unterschied
summen (D(j, k)) bei dem vorhergehenden Referenz
signal (j-1, k), bei dem vorhergehenden Referenz
signal (j-1, k) und dem vorhergehenden Testsignal (i-1) und
bei dem gleichen Referenzsignal (j, k) und dem vorher
gehenden Testsignal (i-1) addiert und die so gebildete
neue Unterschiedsumme (D(j, k)) und die zu dieser kleinsten
Unterschiedsumme gehörende Testsignaladresse (B(j, k)) für
das jeweilige Referenzsignal (j, k) wird.
3. Verfahren nach Anspruch 1 oder 2,
dadurch gekennzeichnet, daß jeweils am Ende der Vergleiche
eines Testsignals (i) mit allen Referenzsignalen (j, k) die
Unterschiedsummen (D(J, k)) bei den letzten Referenz
signalen (J, k) aller Folgen (k) miteinander verglichen
werden und die kleinste Unterschiedsumme (D min (J, k))
für die Verarbeitung des folgenden Testsignals (i+1)
zwischengespeichert und bei der momentanen Testsignal
adresse (i) die Ordnungsnummer der zugehörigen Folge (k)
als möglicherweise erkanntes Wort (T(i)) und die zu dem
betreffenden letzten Referenzsignal (J, k) gehörende
Ausgangs-Testsignaladresse (B(i)) als Rückverfolgungs
adresse (F(i)) gespeichert wird.
4. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet, daß vor dem Vergleich der Unter
schiedsummen (D(1, k)) beim ersten Referenzsignal (1, k)
einer Folge (k) mit den Unterschiedsummen (D min (J, k*))
des jeweils letzten Referenzsignals (J(k*)) aller
Folgen (k*) beim unmittelbar vorhergehenden Test
signal (i-1) ein Syntaxwert (S(k, k*)) zu der jeweiligen
Unterschiedsumme (D(J, k*)) addiert wird, der abhängig ist
von der Kombination der Ordnungsnummer (k*) der Folge, bei
der die kleinste Unterschiedsumme (D, J(k*)) aufgetreten
ist, und der Ordnungsnummer (k) der Folge, zu der das
betreffende erste Referenzsignal (1, k) gehört.
5. Verfahren nach einem der Ansprüche 1 bis 4,
dadurch gekennzeichnet, daß eine der Folgen von
Referenzsignalen (j, k) einer Sprachpause entspricht.
6. Verfahren nach Anspruch 5,
dadurch gekennzeichnet, daß beim Vergleich mit den
Referenzsignalen (j, k) der die Sprachpause darstellenden
Folge (k) als Unterschiedwert (d(i, j, k)) statt der
tatsächlichen Differenz zwischen dem Testsignal (i) und dem
Referenzsignal (j, k) ein konstanter Wert verwendet wird.
7. Anordnung zur Durchführung des Verfahrens nach einem
der vorhergehenden Ansprüche mit einem ersten
Speicher (2), der die Referenzsignale (j, k) enthält, und
einer ersten Adressiervorrichtung (4, 6), die den ersten
Speicher (2) adressiert und die Referenzsignale (j, k)
nacheinander ausliest, und mit einer Anordnung mit einem
Minimumbestimmer (26), die aus dem ausgelesenen Referenz
signal (j, k) und dem gerade verarbeiteten Testsignal (i)
sowie der vom Minimumbestimmer (26) ermittelten kleinsten
benachbarten Unterschiedsumme (D(j, k)) eine neue Unter
schiedsumme (D(j, k)) bildet und in einem ebenfalls von der
ersten Adressiervorrichtung adressierten zweiten
Speicher (22) abspeichert, der für jedes Referenz
signal (j, k) mindestens die zuletzt gebildete Unterschied
summe (D(j, k)) enthält, sowie mit einem ebenfalls von der
ersten Adressiervorrichtung (4, 6) adressierten dritten
Speicher (32) und einem Selektor (36), der vom Minimum
bestimmer (26) gesteuert den zuletzt im dritten
Speicher (32) gespeicherten, den an der momentanen Adresse
gespeicherten oder den davor gespeichert gewesenen Wert
dem Dateneingang des dritten Speichers (32) zuführt, und
einer zweiten Adressiervorrichtung (10), die bei jedem
neuen Testsignal um eine Adresse weiterschaltet,
dadurch gekennzeichnet, daß ein Minimum-Register (44)
vorgesehen ist, dessen Ausgang mit dem einen Eingang eines
Vergleichers (40) und dessen Eingang gemeinsam mit dem
anderen Eingang des Vergleichers (49) mit dem Ausgang des
zweiten Speichers (22) verbunden ist, daß der
Vergleicher (40) ein Ausgangssignal erzeugt, wenn das
Signal am Ausgang des zweiten Speichers (22) kleiner ist
als das Signal am Ausgang des Minimum-Registers (44), daß
die erste Adressiervorrichtung (4, 6) bei jeder Adresse
des ersten Referenzsignals (1, k) jeder Folge (k) das
Ausgangssignal des Vergleichers (40) freigibt zum
Umschalten des Dateneingangs des zweiten Speichers (22)
auf den Ausgang des Minimum-Registers (44) und des
Dateneingangs des dritten Speichers (32) auf ein die
vorhergehende Testsignaladresse (i-1) lieferndes Adressen
pufferregister (18), daß die erste Adressiervorrich
tung (4, 6) außerdem jeweils nach Adressierung aller
Referenzsignale (j, k) vor dem Zuführen des nächsten
Testsignals (i+1) nacheinander die Adressen der letzten
Referenzsignale (J, k) aller Folgen (k) erzeugt und das
Ausgangssignal des Vergleichers (40) freigibt zum
Einschreiben des Minimum-Registers (44), eines mit dem
Ausgang des dritten Speichers (32) verbundenen ersten
Pufferregisters (46) und eines den die Ordnungsnummer (k)
der Folge angebenden Teil der Adresse erhaltenden zweiten
Pufferregister (48), von denen die Ausgänge der beiden
Pufferregister (46, 48) mit den Dateneingängen eines
vierten Speichers (50) verbunden sind, der während der
Verarbeitung der Testsignale (i) von der zweiten
Adressiervorrichtung (10) adressiert wird und der nach
Erzeugung aller Adressen der letzten Referenzsignale (J, k)
aller Folgen (k) ein Schreibsignal erhält und der nach der
Verarbeitung des letzten Testsignals (N) der Wortkette von
einem Adreßregister (54) adressiert wird, das an den
Datenausgang des vierten Speichers (50) angeschlossen ist,
der zu dem ersten Pufferregister (46) gehört, und daß der
Datenausgang des vierten Speichers (50), der zu dem
zweiten Pufferregister (48) gehört, mit einer Ausgabe
einrichtung (58) verbunden ist, die die Reihenfolge der
zugeführten Signale umkehrt und nach Auftreten der Adresse
des ersten Testsignals (1) am Ausgang des Adressen
registers (54) die als Ordnungsnummern (k) kodierte Folge
der in der Wortkette enthaltenen Wörter abgibt.
8. Anordnung nach Anspruch 7,
dadurch gekennzeichnet, daß die Weiterschaltimpulse der
zweiten Adressiervorrichtung (10) und das Schreibsignal
des vierten Speichers (50) von der ersten Adressier
vorrichtung (4, 6) abgeleitet sind.
9. Anordnung nach Anspruch 7 oder 8, bei der die Test
signale (i) in einem Testsignalspeicher (8) gespeichert
sind, der von der zweiten Adressiervorrichtung (10)
adressiert wird,
dadurch gekennzeichnet, daß der vierte Speicher (50) der
Testsignalspeicher (8) ist.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19823215868 DE3215868A1 (de) | 1982-04-29 | 1982-04-29 | Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19823215868 DE3215868A1 (de) | 1982-04-29 | 1982-04-29 | Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3215868A1 DE3215868A1 (de) | 1983-11-03 |
DE3215868C2 true DE3215868C2 (de) | 1990-10-25 |
Family
ID=6162184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19823215868 Granted DE3215868A1 (de) | 1982-04-29 | 1982-04-29 | Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE3215868A1 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0703569A1 (de) | 1994-09-20 | 1996-03-27 | Philips Patentverwaltung GmbH | System zum Ermitteln von Wörtern aus einem Sprachsignal |
DE10006937C2 (de) * | 1999-02-23 | 2003-02-13 | Motorola Inc | Verfahren für einen Rückverfolgungsmatrixspeicher in einem Sprachwiedererkennungssystem |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3710507A1 (de) * | 1987-03-30 | 1988-10-20 | Philips Patentverwaltung | Verfahren zum erkennen kontinuierlich gesprochener woerter |
DE3723078A1 (de) * | 1987-07-11 | 1989-01-19 | Philips Patentverwaltung | Verfahren zur erkennung von zusammenhaengend gesprochenen woertern |
JPH0673080B2 (ja) * | 1987-11-25 | 1994-09-14 | 日本電気株式会社 | 連続音声認識方式 |
DE4106346C2 (de) * | 1991-02-28 | 1997-04-10 | Philips Patentverwaltung | Anordnung zur Erkennung von Wörtern in einem Sprachsignal |
DE4130631A1 (de) * | 1991-09-14 | 1993-03-18 | Philips Patentverwaltung | Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal |
DE4130632A1 (de) * | 1991-09-14 | 1993-03-18 | Philips Patentverwaltung | Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1557286A (en) * | 1975-10-31 | 1979-12-05 | Nippon Electric Co | Speech recognition |
DE3035565A1 (de) * | 1980-09-20 | 1982-05-06 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen |
US4400788A (en) * | 1981-03-27 | 1983-08-23 | Bell Telephone Laboratories, Incorporated | Continuous speech pattern recognizer |
-
1982
- 1982-04-29 DE DE19823215868 patent/DE3215868A1/de active Granted
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0703569A1 (de) | 1994-09-20 | 1996-03-27 | Philips Patentverwaltung GmbH | System zum Ermitteln von Wörtern aus einem Sprachsignal |
DE10006937C2 (de) * | 1999-02-23 | 2003-02-13 | Motorola Inc | Verfahren für einen Rückverfolgungsmatrixspeicher in einem Sprachwiedererkennungssystem |
Also Published As
Publication number | Publication date |
---|---|
DE3215868A1 (de) | 1983-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0299572B1 (de) | Verfahren zur Erkennung von zusammenhängend gesprochenen Wörtern | |
DE3317325C2 (de) | ||
EP0285221B1 (de) | Verfahren zum Erkennen kontinuierlich gesprochener Wörter | |
DE2536640C3 (de) | Anordnung zur Erkennung von Geräuschen | |
EP0614172B1 (de) | Verfahren und Anordnung zum Ermitteln von Wörtern in einem Sprachsignal | |
DE4130632A1 (de) | Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
EP0533260A2 (de) | Verfahren und Anordnung zum Erkennen der gesprochenen Wörter in einem Sprachsignal | |
EP0836175B1 (de) | Verfahren und Anordnung zum Ableiten wenigstens einer Folge von Wörtern aus einem Sprachsignal | |
EP0533259B1 (de) | Verfahren und Anordnung zum Erkennen einer Folge von Wörtern | |
DE3215868C2 (de) | ||
DE1965480A1 (de) | Geraet fuer kuenstliche Erzeugung von Worten durch Umwandlung eines in Buchstaben gedruckten Textes in Aussprache | |
EP0285222B1 (de) | Verfahren zum Erkennen zusammenhängend gesprochener Wörter | |
EP0285211B1 (de) | Verfahren zum Erkennen kontinuierlich gesprochener Wörter | |
DE69028021T2 (de) | Einrichtung zur Erkennung von kontinuierlicher Sprache | |
DE3750199T2 (de) | System zur Erkennung kontinuierlicher Sprache. | |
EP0145805A1 (de) | Korrekturverfahren für Fehler in Zeichensignalen von Video/Teletextsignalen | |
EP0272723B1 (de) | Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens | |
EP0677835B1 (de) | Verfahren zum Ermitteln einer Folge von Wörtern | |
EP0814457A2 (de) | Verfahren zur automatischen Erkennung eines gesprochenen Textes | |
EP0417854B1 (de) | Verfahren zur Erkennung von N unterschiedlichen Wortketten in einem Sprachsignal | |
DE4412309C2 (de) | Verfahren zur Verbesserung der Spracherkennung unter Berücksichtigung verschiedener digitaler Codierbedingungen | |
DE19804603A1 (de) | Verfahren zum Ermitteln von Wörtern in einem Sprachsignal | |
DE3417816A1 (de) | Programmierbares schaltnetz | |
EP0833303A2 (de) | Verfahren und Anordnung zum Durchführen von Datenbankanfragen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: PHILIPS CORPORATE INTELLECTUAL PROPERTY GMBH, 2233 |