-
Die Erfindung bezieht sich auf ein
Produkt mit mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit,
bei der mindestens ein Betriebszustand aktivierbar ist, und mit
einer Spracherkennungseinrichtung zum Steuern mindestens einer Verarbeitungseinheit
bezüglich
ihres mindestens einen Betriebszustandes unter Verwendung eines
inhaltsmäßig von
mindestens einem aktivierten Betriebszustand mindestens einer in
ihrem Aktivzustand befindlichen Verarbeitungseinheit abhängigen, Befehle
umfassenden Befehlslexikons, welche Spracherkennungseinrichtung
einen Befehlslexikonspeicher enthält, in dem Befehle des Befehlslexikons
in Form von Befehlsinformationen und diesen Befehlsinformationen
zugeordneten Kenninformationen gespeichert werden können, und
Spracherkennungsmittel enthält,
denen mindestens eine von einem Sprecher gesprochene, einen Befehl
repräsentierende
Sprachinformation zugeführt
werden kann und die zum Ermitteln einer einer solchen Sprachinformation zuzuordnenden
Befehlsinformation unter Verwendung von in dem Befehlslexikonspeicher
gespeicherten Kenninformationen eingerichtet sind und welche Spracherkennungsmittel
zum Übertragen
einer ermittelten Befehlsinformation an eine Verarbeitungseinheit
ausgebildet sind, wobei mit einer an diese Verarbeitungseinheit
abgegebenen ermittelten Befehlsinformation ein dem gesprochenen
Befehl entsprechender Betriebszustand dieser Verarbeitungseinheit
aktiviert werden kann.
-
Die Erfindung bezieht sich weiterhin
auf eine Spracherkennungseinrichtung, die zum Zusammenwirken mit
mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit
ausgebildet ist, bei der mindestens ein Betriebszustand aktivierbar
ist, und mit einer Spracherkennungseinrichtung zum Steuern mindestens
einer Verarbeitungseinheit bezüglich
ihres mindestens einen Betriebszustandes unter Verwendung eines
inhaltsmäßig von
mindestens einem aktivierten Betriebszustand mindestens einer in
ihrem Aktivzustand befindlichen Verarbeitungseinheit abhängigen,
Befehle umfassenden Befehlslexikons, welche Spracherkennungseinrichtung einen
Befehlslexikonspeicher enthält,
in dem Befehle des Befehlslexikons in Form von Befehlsinformationen
und diesen Befehlsinformationen zugeordneten Kenninformationen gespeichert
werden können,
und Spracherkennungsmittel enthält,
denen mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentieren de
Sprachinformation zugeführt
werden kann und die zum Ermitteln einer einer solchen Sprachinformation
zuzuordnenden Befehlsinformation unter Verwendung von in dem Befehlslexikonspeicher
gespeicherten Kenninformationen eingerichtet sind und welche Spracherkennungsmittel
zum Übertragen
einer ermittelten Befehlsinformation an eine Verarbeitungseinheit
ausgebildet sind, wobei mit einer an diese Verarbeitungseinheit
abgegebenen ermittelten Befehlsinformation BI ein dem gesprochenen
Befehl entsprechender Betriebszustand dieser Verarbeitungseinheit
aktiviert werden kann.
-
Die Erfindung bezieht sich weiterhin
auf ein Verfahren zum Erzeugen eines Befehlslexikons für eine Spracherkennungseinrichtung,
welche Spracherkennungseinrichtung zum Steuern mindestens einer
in einen Aktivzustand steuerbaren Verarbeitungseinheit – bei der
mindestens ein Betriebszustand aktivierbar ist – bezüglich ihres mindestens einen
Betriebszustandes unter Verwendung des Befehlslexikons ausgebildet
ist, wobei das Befehlslexikon Befehle enthält, die in Form von Befehlsinformationen
und den Befehlsinformationen zugeordneten Kenninformationen gespeichert
werden können,
und wobei die Befehlsinformationen und die zugeordneten Kenninformationen
in einem Befehlslexikonspeicher gespeichert werden und wobei mindestens
eine von einem Sprecher gesprochene, einen Befehl repräsentierende
Sprachinformation Spracherkennungsmitteln zugeführt wird und wobei mit den
Spracherkennungsmitteln unter Verwendung der in dem Befehlslexikonspeicher
gespeicherten Kenninformationen für eine solche Sprachinformation
eine Befehlsinformation ermittelt wird und wobei die ermittelte Befehlsinformation
einer Verarbeitungseinheit zum Aktivieren des einem gesprochenen
Befehl entsprechenden Betriebszustandes der Verarbeitungseinheit zugeführt werden
kann.
-
Eine solches Produkt und eine solche
Spracherkennungseinrichtung und ein solches Verfahren sind beispielsweise
aus dem Dokument
EP
0 607 615 A1 bekannt. Bei dem bekannten Produkt ist die Spracherkennungseinrichtung
zum Zusammenwirken mit mehreren Verarbeitungseinheiten ausgebildet
und dient die Spracherkennungseinrichtung zum Eingeben von Textelementen
zum Erstellen von Texten und zum Eingeben von Befehlen zum Steuern
einer Verarbeitungseinheit hinsichtlich ihrer Betriebszustände. Eine
solche Verarbeitungseinheit kann zum Beispiel durch eine Text-Verarbeitungseinheit unter
Verwendung des Programms „Word
for Windows
®" oder des Programms
WordPerfect
® oder durch
eine Tabellen-Verarbeitungseinheit unter Verwendung des Programms
Excel
® gebildet
sein. An die Spracherkennungseinrichtung ist ein Mikrofon anschließbar, mit
dem eine von einem Benutzer der Spracherkennungseinrichtung gesprochene
Sprachinformation in einem Befehlseingabemodus als Befehl oder in
einem Texteingabemodus als Textelement für eine Verarbeitungseinheit
eingegeben werden kann. Die Spracherkennungseinrichtung weist Spracherkennungsmittel
auf, die einen Befehlslexikonspeicher enthalten, in dem die ein
Befehlslexikon bildenden Befehle gespeichert werden können, und zwar
in Form von Befehlsinformationen zum Steuern einer Verarbeitungseinheit
und diesen Befehlsinformationen zugeordneten Kenninformationen,
die durch sogenannte Phoneme gebildet sind. Eine von einem Benutzer
als Befehl eingegebene Sprachinformation wird in den Spracherkennungsmitteln
verarbeitet und in dem Befehlseingabemodus mit in dem Befehlslexikonspeicher
gespeicherten Kenninformationen verglichen, wobei eine der als Befehl
eingegebenen Sprachinformation zugeordnete Befehlsinformation erzeugt
wird und an eine Verarbeitungseinheit zum Aktivieren eines dem Befehl
entsprechenden Betriebszustandes der Verarbeitungseinheit abgegeben
wird.
-
Vor der Inbetriebnahme der bekannten
Spracherkennungseinrichtung zur Steuerung einer Verarbeitungseinheit
muß die
Spracherkennungseinrichtung in einem Trainingsmodus an diese Verarbeitungseinheit
angepaßt
werden und müssen
dieser Verarbeitungseinheit Sprachbefehlsverarbeitungsmittel hinzugefügt werden.
Die bekannte Spracherkennungseinrichtung kann in dem Trainingsmodus an
unterschiedliche Verarbeitungseinheiten und zusätzlich an unterschiedliche
Betriebszustände
von je einer Verarbeitungseinheit angepaßt werden, um einen größeren Erkennungserfolg
der Spracherkennungsmittel zu erreichen. Hierfür werden in dem Trainingsmodus
von einem Benutzer der Spracherkennungseinrichtung Befehle für einen
Betriebszustand einer Verarbeitungseinheit ausgewählt, die
in diesem Betriebszustand verwendet werden können und die zum Verändern des
Betriebszustandes der Verarbeitungseinheit geeignet sind. Diese
Befehle werden als Befehlsinformationen in einem diesem Betriebszustand
dieser Verarbeitungseinheit zugeordneten Befehlslexikon-Sammelspeicher
gespeichert. Anschließend
kann der Benutzer in dem Trainingsmodus diese Befehle als Sprachinformation
in das Mikrofon sprechen und die Spracherkennungsmittel für diese Befehle
trainieren, wobei Kenninformationen erzeugt werden, die in dem Befehlslexikon-Sammelspeicher zu
den Befehlsinformationen zugeordnet gespeichert werden. Sämtliche
auf die angegebene Weise für
jeden Betriebszustand erzeugten Befehlslexika werden in dem Befehlslexikon-Sammelspeicher
der Spracherkennungseinrichtung gespeichert und in einer Verarbeitungseinheitstabelle
den Verarbeitungseinheiten und deren Betriebszuständen zugeordnet.
-
Wenn der Betriebszustand einer Verarbeitungseinheit – die zum
Zusammenwirken mit der Spracherkennungseinrichtung durch Hinzufügen von Sprachbefehlsverarbeitungsmitteln
vorbereitet wurde und für
die die bekannte Spracherkennungseinrichtung in dem Trainingsmodus
vorbereitet wurde – verändert wird,
dann gibt die Verarbeitungseinheit an die Spracherkennungseinrichtung
eine Information darüber
ab, welcher Betriebszustand der Verarbeitungseinheit vorliegt. Die
Spracherkennungseinrichtung ermittelt hierauf unter Verwendung der
Verarbeitungseinheitstabelle das für den vorliegenden Betriebszustand
geeignete, in dem Trainingsmodus gemeinsam mit allen anderen Befehlslexika
erzeugte Befehlslexikon und speichert dieses Befehlslexikon von
dem Befehlslexikon-Sammelspeicher
in den Befehlslexikonspeicher um. Wenn ein Benutzer einen Befehl
zum Verändern
des Betriebszustandes der Verarbeitungseinheit als Sprachinformation
in das Mikrofon spricht, dann ist der Erfolg des Erkennens des gesprochenen
Befehls relativ hoch, da nur eine sehr geringe Anzahl von Befehlen,
die von dem Benutzer für
diesen Betriebszustand ausgewählt
wurden, zur Spracherkennung verwendet werden. Eine von den Spracherkennungsmitteln
ermittelte, einer einen Befehl darstellenden Sprachinformation zugeordnete
Befehlsinformation wird als Textelement an die Sprachbefehlsverarbeitungsmittel
der Verarbeitungseinheit übermittelt.
Die Sprachbefehlsverarbeitungsmittel der Verarbeitungseinheit ordnen
dem übermittelten
Textelement eine Steuerinformation zu, die die Abarbeitung des der
Befehlsinformation, also dem Textelement, entsprechenden Befehls
in der Verarbeitungseinheit bewirkt, worauf der Betriebszustand
der Verarbeitungseinheit entsprechend dem abgearbeiteten Befehl
verändert
wird.
-
Bei der bekannten Spracherkennungseinrichtung
hat sich allerdings gezeigt, daß das
Erzeugen eines Befehlslexikons für
jeden Betriebszustand einer Vielzahl von Verarbeitungseinheiten
sehr zeitaufwendig und teuer ist. Weiterhin ist die Verwendung der
bekannten Spracherkennungseinrichtung auf solche Verarbeitungseinheiten
beschränkt,
denen Sprachbefehlsverarbeitungsmittel hinzugefügt wurden und für die Befehlslexika
erzeugt wurden. Weiterhin müssen
in der bekannten Spracherkennungseinrichtung alle erzeugten Befehlslexika
in dem Befehlslexikon-Sammelspeicher gespeichert und verwaltet werden,
weshalb die bekannte Spracherkennungseinrichtung hierfür sowohl
einen relativ großen
Speicher aufweist als auch relativ komplexe Steuerungsmittel enthält.
-
Die Erfindung hat sich zur Aufgabe
gestellt, die vorstehend angeführten
Schwierigkeiten zu vermeiden und ein verbessertes Produkt mit einer
Spracherkennungs einrichtung und eine verbesserte Spracherkennungseinrichtung
und ein verbessertes Verfahren zum Erzeugen eines Befehlslexikons
für eine Spracherkennungseinrichtung
zu schaffen.
-
Diese Aufgabe wird bei einem Produkt
der eingangs im ersten Absatz angeführten Art erfindungsgemäß dadurch
gelöst,
daß Erzeugungsmittel vorgesehen
sind, die – nach
einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit – zum Erzeugen
eines nur diesem einen aktivierten Betriebszustand zugeordneten
Befehlslexikons ausgebildet sind.
-
Diese Aufgabe wird bei einer Spracherkennungseinrichtung
der eingangs im zweiten Absatz angeführten Art erfindungsgemäß dadurch
gelöst, daß Erzeugungsmittel
vorgesehen sind, die – nach einem
Aktivieren eines Betriebszustandes einer Verarbeitungseinheit – zum Erzeugen
eines nur diesem einen aktivierten Betriebszustand zugeordneten
Befehlslexikons ausgebildet sind.
-
Diese Aufgabenstellung wird bei einem
Verfahren der eingangs im dritten Absatz angeführten Art erfindungsgemäß dadurch
gelöst,
daß – nach einem
Aktivieren eines Betriebszustandes einer Verarbeitungseinheit – mit Erzeugungsmitteln
ein nur diesem einen aktivierten Betriebszustand zugeordnetes Befehlslexikon
erzeugt wird.
-
Hierdurch wird vorteilhafterweise
erreicht, daß ein
nur jeweils einem einzigen Betriebszustand einer Verarbeitungseinheit
zugeordnetes und diesem Betriebszustand genau angepaßtes Befehlslexikon jeweils
nach dem Auftreten eines neuen Betriebszustandes einer Verarbeitungseinheit
erzeugt wird und daher kein Trainingsmodus vorgesehen sein muß, in dem
die Spracherkennungseinrichtung erst zum Zusammenwirken mit der
Verarbeitungseinheit vorbereitet werden muß. Weiterhin kann auf einen
Befehlslexikon-Sammelspeicher
zum Speichern einer Vielzahl von Befehlslexika für unterschiedliche Betriebszustände von
Verarbeitungseinheiten verzichtet werden. Weiterhin kann auch auf
Steuerungsmittel zum Verwalten einer Vielzahl von Befehlslexika
verzichtet werden. Als Folge aller dieser Sachverhalte ist ein preiswertes
Produkt bzw. eine kostengünstige
Spracherkennungseinrichtung realisierbar.
-
Bei einem erfindungsgemäßen Produkt
gemäß Anspruch
1 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 2 vorzusehen. Bei einer
erfindungsgemäßen Spracherkennungseinrichtung
gemäß Anspruch
6 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 7 vorzusehen. Bei
einem erfindungsgemäßen Verfahren
gemäß Anspruch
11 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß An spruch 12 vorzusehen. Diese
Maßnahmen
haben sich im Hinblick auf eine möglichst einfache und betriebssichere
Realisierung als sehr vorteilhaft erwiesen.
-
Bei einem erfindungsgemäßen Produkt
gemäß Anspruch
2 hat es sich als vorteilhaf erwiesen, die Maßnahmen gemäß Anspruch 3 vorzusehen. Bei einer
erfindungsgemäßen Spracherkennungseinrichtung
gemäß Anspruch
7 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 8 vorzusehen. Bei
einem erfindungsgemäßen Verfahren
gemäß Anspruch
12 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 13 vorzusehen. Hierdurch
wird vorteilhafterweise erreicht, daß auf Sprachbefehlsverarbeitungsmittel
in den zum Zusammenwirken mit der Spracherkennungseinrichtung des
Produktes vorgesehenen Verarbeitungseinheiten verzichtet werden
kann, da beim Auftreten einer von einem Benutzer gesprochenen, einen
Befehl repräsentierenden
Sprachinformation von der Spracherkennungseinrichtung eine Steuerinformation
an die Verarbeitungseinheit übermittelt
wird, welche Steuerinformation die in der Verarbeitungseinheit unmittelbar
zur Abarbeitung des gesprochenen Befehls führt. So können nicht nur Kosten, sondern
auch Zeit gespart werden, die aufgewendet werden müßten, um
bei allen zum Zusammenwirken mit der Spracherkennungseinrichtung
vorgesehenen Verarbeitungseinheiten Sprachbefehlsverarbeitungsmittel
vorzusehen.
-
Bei einem erfindungsgemäßen Produkt
gemäß Anspruch
2 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 4 vorzusehen. Bei einer
erfindungsgemäßen Spracherkennungseinrichtung
gemäß Anspruch
7 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 9 vorzusehen. Bei
einem erfindungsgemäßen Verfahren
gemäß Anspruch
12 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß dem Anspruch 14 vorzusehen.
Hierdurch wird vorteilhafterweise erreicht, daß die Spracherkennungseinrichtung
des Produktes zum Zusammenwirken mit mehreren Verarbeitungseinheiten
ausgebildet ist, die in einem Zeitfensterverfahren oder in einem
Parallelverarbeitungsverfahren jeweils separat in einen Aktivzustand
gebracht werden können,
und daß geeignete
Befehlsinformationen nur aus einem in einen Bearbeitungszustand
gesteuerten Bearbeitungsfenster ermittelt werden.
-
Bei einem erfindungsgemäßen Produkt
gemäß Anspruch
2 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 5 vorzusehen. Bei einer
erfindungsgemäßen Spracherkennungseinrichtung
gemäß Anspruch
7 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 10 vorzusehen. Bei
einem erfindungsgemäßen Verfahren
gemäß Anspruch
12 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß An spruch 15 vorzusehen. Durch
die Maßnahme
bei einem erfindungsgemäßen Produkt,
die Spracherkennungseinrichtung zum Zusammenwirken mit einer Windows-Verarbeitungseinheit
auszubilden – die
beispielsweise mit Hilfe eines der Programme Windows95®, Windows
NT® oder X-Windows® realisiert
ist – wird
vorteilhafterweise erreicht, daß die
Erkennmittel und die Ermittlungsmittel besonders einfach ausgebildet
sein können,
so daß eine
einfache Spracherkennungseinrichtung erhalten wird, die mit einer
Vielzahl von für
das Zusammenwirken mit der Windows-Verarbeitungseinheit vorgesehenen
Verarbeitungseinheiten zusammenwirken kann.
-
Ausführungsbeispiele der Erfindung
sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben.
-
Es zeigen:
-
1 schematisch
in Form eines Blockschaltbildes als erfindungsgemäßes Produkt
einen Personalcomputer, in dem ein erfindungsgemäßes Verfahren durchführbar ist
und in dem eine erfindungsgemäße Spracherkennungseinrichtung
enthalten ist, die zum Steuern von drei Verarbeitungseinheiten vorgesehen
ist und die mit Erzeugungsmitteln zum Erzeugen eines Befehlslexikons
nach einem Wechsel von einem Betriebszustand einer Verarbeitungseinheit
zu einem anderen Betriebszustand einer Verarbeitungseinheit versehen
ist,
-
2 eine
Bearbeitungsfenstertabelle, die in Bearbeitungsfenster-Verwaltungsmitteln
einer Windows-Verarbeitungseinheit des Personalcomputers von 1 gespeichert ist,
-
3 eine
Schaltflächentabelle,
die in Schaltflächen-Verwaltungsmitteln
der Windows-Verarbeitungseinheit des Personalcomputers von 1 gespeichert ist,
-
4 ein
Flußdiagramm,
anhand dessen zumindest ein wesentlicher Teil eines erfindungsgemäßen Verfahrens
erläutert
werden kann, das in dem Personalcomputer von 1 unter Nutzung seiner Spracherkennungseinrichtung
zum Erzeugen eines Befehlslexikons angewendet wird,
-
5 ein
weiteres Flußdiagramm,
anhand dessen ein Teil eines erfindungsgemäßen Verfahrens erläutert werden
kann, das in dem Personalcomputer von 1 unter
Nutzung einer Spracherkennungseinrichtung zum Erkennen von – von einem
Sprecher gesprochenen – Sprachinformationen
unter Verwendung eines erzeugten Befehlslexikons und zum Abgeben
von Steuerinformationen an eine Verarbeitungseinheit zum Um steuern
dieser Verarbeitungseinheit von einem Betriebszustand in einen anderen Betriebszustand
angewendet wird.
-
In 1 ist
ein Personalcomputer 1 dargestellt, der eine Spracherkennungseinrichtung 2 und eine
PC-Verarbeitungseinheit 3 aufweist und der mit einem Monitor 4 ausgerüstet ist
und an den ein Mikrofon 5, eine Tastatur 6 und
ein Lautsprecher 7 angeschlossen sind.
-
Die Spracherkennungseinrichtung 2 des Personalcomputers 1 dient
im vorliegenden Fall unter anderem zum Steuern von mindestens einer
Verarbeitungseinheit bezüglich
ihrer Betriebszustände unter
Verwendung eines inhaltsmäßig von
einem aktivierten Betriebszustand einer in ihrem Aktivzustand befindlichen
Verarbeitungseinheit abhängigen,
Befehle umfassenden Befehlslexikons, worauf nachfolgend noch näher eingegangen
werden soll.
-
Von dem Mikrofon 5 kann
eine von einem Sprecher gesprochene, entweder aus mehreren zusammenhängenden
Wörtern
oder auch aus einzelnen Wörtern
bestehende analoge Sprachinformation SI an eine Analog/Digital-Wandlerstufe 8 der
Spracherkennungseinrichtung 2 abgegeben werden. Von der
Analog/Digital-Wandlerstufe 8 kann eine digitale Sprachinformation
SI an Speichermittel 9 abgegeben werden und in diesen gespeichert
werden.
-
Eine aus den Speichermitteln 9 ausgelesene digitale
Sprachinformation SI kann in einem auf nicht näher angegebene Weise aktivierbaren
Sprachwiedergabemodus an eine Digital/Analog-Wandlerstufe 12 und
von dieser als analoge Sprachinformation SI an den Lautsprecher 7 abgegeben
werden.
-
Eine aus den Speichermitteln 9 ausgelesene digitale
Sprachinformation SI kann aber auch an Spracherkennungsmittel 10 der
Spracherkennungseinrichtung 2 abgegeben werden, und zwar
an eine in den Spracherkennungsmitteln 10 enthaltene Spracherkennungsstufe 11.
Den Spracherkennungsmitteln 10 können von einem Sprecher gesprochene,
je durch eine Sprachinformation repräsentierte Befehle zugeführt werden.
Diese Spracherkennungsmittel 10 sind unter anderem dazu
ausgebildet, unter Verwendung von in einem Befehlslexikonspeicher
gespeicherten Kenninformationen PI eine einem zugeführten Befehl
zuzuordnende und einen solchen Befehl repräsentierende Befehlsinformation
BI und damit eigentlich einen Befehl zu ermitteln und die einen
Befehl repräsentierende
ermittelte Befehlsinformation BI an eine Verarbeitungseinheit abzugeben,
wobei mit der – an
die Ver arbeitungseinheit abgegebenen, einen Befehl repräsentierenden – ermittelten
Befehlsinformation BI ein dem gesprochenen Befehl entsprechender
gewünschter
Betriebszustand der Verarbeitungseinheit aktivierbar ist.
-
Das Mikrofon 5 weist eine
Taste 13 auf, die von einem Sprecher zum Abgeben einer
Befehlseingabemodus-Aktivierungsinformation CMI betätigt werden
kann, mit der in der Spracherkennungseinrichtung 2 ein
Befehlseingabemodus aktiviert wird. Eine solche Befehlseingabemodus-Aktivierungsinformation
CMI kann von der Taste 13 an die Spracherkennungsstufe 11 abgegeben
werden.
-
Die Spracherkennungsmittel 10 weisen
zum Erkennen einer ihnen zugeführten
digitalen Sprachinformation SI und zum Zuordnen einer Textinformation
TI zu einer erkannten Sprachinformation SI die Spracherkennungsstufe 11 sowie
einen Lexikonspeicher 14, einen Sprachmodellspeicher 15 und
einen Referenzenspeicher 16 auf. Diese drei Speicher 14, 15 und 16 sind
mit der Spracherkennungsstufe 11 verbunden.
-
Der Lexikonspeicher 14 weist
einen Befehlslexikonspeicher 17 und einen Textlexikonspeicher 18 auf.
Der Befehlslexikonspeicher 17 weist seinerseits einen Befehlswortschatzspeicher 19 und
einen Basiswortschatzspeicher 20 auf. Der Textlexikonspeicher 18 enthält in diesem
Fall auch den Basiswortschatzspeicher 20 – was aber
nicht unbedingt der Fall sein muß – und einen Textwortschatzspeicher 21.
-
In dem Lexikonspeicher 14 sind
zum Zweck des Speicherns von Wörtern
Textinformationen TI und den Textinformationen TI zugeordnete Kenninformation
PI speicherbar bzw. gespeichert. Dieses Speichern ist in diesem
Fall in der Weise organisiert, daß für jedes Wort eine Textinformation
TI, nämlich ein
sogenannter Graphem, und eine der Textinformation TI zugeordnete
Kenninformation PI, nämlich
eine sogenannte Phonemfolge, gespeichert ist. Es sei erwähnt, daß das Organisieren
des Speicherns von Wörtern
auch auf andere Art und Weise möglich
ist.
-
In dem Basiswortschatzspeicher 20 ist
eine mehr oder weniger hohe Anzahl von Wörtern gespeichert, die Basisausdrücke darstellen
und einen Basiswortschatz bilden und die in einem auf nicht näher angegebene
Weise aktivierbaren Texteingabemodus Basiswörter sind, die einen Teil eines
mit den Spracherkennungsmitteln 10 erkennbaren Gesamttextwortschatzes
bilden, und die in dem Befehlseingabemodus Basisbefehle sind, die
einen Teil eines mit den Spracherkennungsmitteln 10 erkennbaren
Gesamtbefehlswortschatzes bilden. In dem Basiswortschatzspeicher 20 kann
zum Beispiel das Wort „Hilfe" gespeichert sein,
das in dem Texteingabemodus von einer hierfür vorgesehenen geeigneten Verarbeitungseinheit
als Basiswort bei einer Textverarbeitung und in dem Befehlseingabemodus
von einer hierfür
geeigneten Verarbeitungseinheit als Basisbefehl zum Anzeigen eines
Hilfe-Menüs
verarbeitet werden kann.
-
In dem Textwortschatzspeicher 21 ist
eine Vielzahl von Wörtern
gespeichert, die einen Textwortschatz bilden, der gemeinsam mit
den Basisausdrücken
den mit den Spracherkennungsmitteln 10 in dem Texteingabemodus
der Spracherkennungseinrichtung 2 erkennbaren Gesamttextwortschatz
bildet.
-
In dem Befehlswortschatzspeicher 19 sind Wörter gespeichert,
die einen Befehlswortschatz bilden, der gemeinsam mit den Basisausdrücken den mit
den Spracherkennungsmitteln 10 in dem Befehlseingabemodus
der Spracherkennungseinrichtung 2 erkennbaren Gesamtbefehlswortschatz
bildet. Dies heißt
mit anderen Worten, daß in
dem Befehlseingabemodus der durch die Basisausdrücke gebildete Basisbefehlswortschatz
um die in dem Befehlswortschatzspeicher 19 gespeicherten
Befehle zur Bildung des Gesamtbefehlswortschatzes erweiterbar ist.
Mit einem solchen Befehl ist in dem Befehlseingabemodus beispielsweise
ein Wechsel von einem Betriebszustand einer Verarbeitungseinheit
zu einem anderen Betriebszustand einer Verarbeitungseinheit aktivierbar,
also beispielsweise mindestens eine Verarbeitungseinheit von einem
bisherigen Betriebszustand in einen gewünschten neuen Betriebszustand
umsteuerbar bzw. umschaltbar. Diese Befehle sind sowohl zum Aktivieren
eines gewünschten Betriebszustandes
einer Verarbeitungseinheit als auch zum Umsteuern mindestens einer
Verarbeitungseinheit bezüglich
ihrer Betriebszustände
zum Zwecke des Aktivierens eines gewünschten Betriebszustandes geeignet.
-
Wie bereits erwähnt, wird eine mit der Taste 13 erzeugte
Befehlseingabemodus-Aktivierungsinformation CMI der Spracherkennungsstufe 11 zugeführt. Von
der Spracherkennungsstufe 11 aus wird sie dem Lexikonspeicher 14 zugeführt. Beim
Auftreten einer Befehlseingabemodus-Aktivierungsinformation CMI
in dem Befehlseingabemodus wird der Befehlslexikonspeicher 17 des
Lexikonspeichers 14 mit der Spracherkennungsstufe 11 verbunden.
Beim Fehlen einer Befehlseingabemodus-Aktivierungsinformation CMI
in dem Texteingabemodus wird der Textlexikonspeicher 18 des
Lexikonspeichers 14 mit der Spracherkennungsstufe 11 verbunden.
Auf diese Weise ist gewährleistet,
daß die
je einen Befehl bildenden Wörter
in dem Befehlslexikonspeicher 17 gespeichert werden. Zum
Zweck des Speicherns dieser Wörter,
die Befehle bilden, werden Befehlsinformationen BI als Textinformationen
und diesen Befehlsinformationen BI zugeordnete Kenninformationen PI
in dem Befehlslexikonspeicher 17 gespeichert, und zwar
für jedes
Wort eine Befehlsinformation BI und eine zugeordnete Kenninformation
PI.
-
In dem Sprachmodellspeicher 15 sind Sprachmodellinformationen
SMI gespeichert, die die Wahrscheinlichkeit des Auftretens eines
Wortes nach dem Auftreten einer bestimmten Kombination bzw. Aufeinanderfolge
von mit der Spracherkennungsstufe 11 erkannten Wörtern angeben.
Wenn bei einem Spracherkennungsvorgang das nächste in einer aus mehreren
aufeinanderfolgenden Wörtern
bestehenden Sprachinformation SI enthaltene Wort gemäß den in
dem Lexikonspeicher 14 und dem Referenzenspeicher 16 gespeicherten
Informationen mit gleicher Wahrscheinlichkeit eines von zwei Wörtern sein kann,
dann erkennt die Spracherkennungsstufe 11 jenes Wort, das
entsprechend der Sprachmodellinformation SMI eine größere Wahrscheinlichkeit
des Auftretens aufweist.
-
In dem Referenzenspeicher 16 sind
Referenzinformationen RI gespeichert, die Informationen darüber repräsentieren,
wie ein Sprecher ein Phonem einer Phonemfolge ausspricht. Mit Hilfe
der Referenzinformationen RI wird die Spracherkennungsstufe 11 an
einen Sprecher angepaßt.
-
Die PC-Verarbeitungseinheit 3 des
Personalcomputers 1 weist eine Windows-Verarbeitungseinheit 22 sowie
eine erste Verarbeitungseinheit 23, eine zweite Verarbeitungseinheit 24 und
eine dritte Verarbeitungseinheit 25 auf. Bei aktiviertem
Personalcomputer 1 ist die Windows-Verarbeitungseinheit 22 stets in
ihren Aktivzustand gesteuert. Jede der drei anderen Verarbeitungseinheiten 23, 24 und 25 kann
in einen Aktivzustand gebracht bzw. gesteuert werden und ist in
ihrem Aktivzustand bezüglich
ihrer Betriebszustände
steuerbar bzw. umschaltbar.
-
Die Windows-Verarbeitungseinheit 22,
die im wesentlichen eine Programm-Verarbeitungseinheit zum Verarbeiten
eines sogenannten Windows-Programms darstellt und die in diesem
Fall mit Hilfe des bekannten Programms Windows 95® gebildet
ist, dient hauptsächlich
zum Verwalten der drei Verarbeitungseinheiten 23, 24 und 25 und
enthält
Bearbeitungsfenster-Verwaltungsmittel 26, Schaltflächen-Verwaltungsmittel 27 und
Befehls-Verwaltungsmittel 28. In den Bearbeitungsfenster-Verwaltungsmitteln 26 kann
eine Bearbeitungsfenstertabelle 29 gespeichert werden,
die in 2 dargestellt
ist. In den Schaltflächen-Verwaltungsmitteln 27 kann
eine Schaltflächentabelle 30 gespeichert
werden, die in 3 dargestellt
ist. Die Befehls-Verwaltungsmittel 28 sind zum Verwalten
und Ausführen
eines mit der Tastatur 6 oder mit der Spracherkennungseinrichtung 2 in
Form einer Steuerinformation CI eingegebenen Befehls für die Windows-Verarbeitungs einheit 22 oder
zum Weiterleiten des eingegebenen Befehls in Form der Steuerinformation
CI an eine der drei Verarbeitungseinheiten 23, 24 und 25 ausgebildet.
-
Die drei Verarbeitungseinheiten 23, 24 und 25,
die ebenso im wesentlichen Programm-Verarbeitungseinheiten darstellen,
dienen hauptsächlich
zum Ansteuern von vier Bearbeitungsfenstern W1, W2, W3 und W4 und
zum Aufbereiten und Erzeugen von Grafikinformationen und Textinformationen,
um ein Anzeigen der Grafikinformationen und Textinformationen in
den Bearbeitungsfenstern W1, W2, W3 und W4 zu ermöglichen.
Bei jeder der drei Verarbeitungseinheiten 23, 24 und 25 sind
bei aktiviertem Aktivzustand unterschiedliche Betriebszustände einschaltbar.
Je nach Verarbeitungseinheit 23, 24 bzw. 25 handelt
es sich hierbei um unterschiedliche Betriebszustände, beispielsweise um einen
Entscheidungsbetriebszustand, auf den nachfolgend noch näher eingegangen
werden soll, oder um einen Druckvorbereitungsbetriebszustand oder
um einen Betriebszustand zum Zweck des Öffnens mindestens einer Datei
oder um einen Texteingabebetriebszustand.
-
Mit dem Monitor 4 sind den
drei Verarbeitungseinheiten 23, 24 und 25 zugeordnete
Bearbeitungsfenster Wn anzeigbar, wobei
in 1 ein erstes Bearbeitungsfenster
W1, ein zweites Bearbeitungsfenster W2, ein drittes Bearbeitungsfenster
W3 und ein viertes Bearbeitungsfenster W4 angedeutet sind. Jedes
dieser vier Bearbeitungsfenster W1, W2, W3 und W4 ist zu seiner
Bearbeitung in einen Bearbeitungszustand steuerbar, und zwar mit
Hilfe der Verarbeitungseinheiten 23, 24 und 25.
-
Das vierte Bearbeitungsfenster W4
ist ein sogenanntes Entscheidungs-Bearbeitungsfenster, das nicht zur Texteingabe,
sondern zur Eingabe von Befehlen vorgesehen ist, und das hierbei
eine erste Schaltfläche 31 mit
der Textinformation „OK" und eine zweite
Schaltfläche 32 mit
der Textinformation „CANCEL" und eine dritte
Schaltfläche 33 mit
der Textinformation „BACK" aufweist. Die drei
Verarbeitungseinheiten 23, 24 und 25 sind über vier
Verbindungen 23A, 24A, 25A und 25B mit
den ihnen zugeordneten Bearbeitungsfenstern W1, W2, W3 und W4 verbunden,
und zwar zum Abgeben von Grafikinformationen und Textinformationen
zum Anzeigen dieser Informationen in den Bearbeitungsfenstern W1, W2,
W3 und W4. Mit der dritten Verarbeitungseinheit 25 sind
hierbei sowohl das dritte Bearbeitungsfenster W3 als auch das vierte
Bearbeitungsfenster W4 verbunden, und zwar über die beiden Verbindungen 25A und 25B.
-
Eine in dem Texteingabemodus von
der Spracherkennungsstufe 11 erkannte Textinformation TI
kann von der Spracherkennungsstufe 11 über eine Verbindung 11A an
die Windows-Verarbeitungseinheit 22 und von dieser über eine
von drei weiteren Verbin dungen 22A, 22B und 22C an
eine in ihren Aktivzustand gesteuerte Verarbeitungseinheit 23, 24 bzw. 25 abgegeben
werden, wobei diese eine Verarbeitungseinheit 23, 24 bzw. 25 dafür sorgt,
daß in dem
von ihr über
eine der Verbindungen 23A, 24A und 25A ansprechbaren
Bearbeitungsfenster W1, W2 bzw. W3 ein der erkannten Textinformation
TI entsprechender Text angezeigt wird. Es sei erwähnt, daß immer
nur eine der drei Verarbeitungseinheiten 23, 24 und 25 in
ihren Aktivzustand gesteuert werden kann und immer nur eines der
vier Bearbeitungsfenster W1, W2, W3 und W4 in seinen Bearbeitungszustand
gesteuert werden kann.
-
Die Spracherkennungseinrichtung 2 weist nunmehr
Erzeugungsmittel 34 zum Erzeugen eines – nur dem einen – beispielsweise
einem gesprochenen oder einem mit einer Taste der Tastatur 6 eingegebenen
Befehl entsprechenden – gewünschten
Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25 zugeordneten – Befehlslexikons
auf. Die Erzeugungsmittel 34 sind durch Informationsverarbeitungsmittel
gebildet und enthalten Erkennmittel 35 und Ermittlungsmittel 36 und
weiterhin Zuordnungsmittel 37.
-
Die Erkennmittel 35 sind
zum Erkennen eines Bearbeitungszustands eines Bearbeitungsfensters
W1, W2, W3 und. W4 einer in der Spracherkennungseinrichtung 2 enthaltenen
Verarbeitungseinheit 23, 24 und. 25 vorgesehen.
Hierfür
sind die Erkennmittel 35 zum Abgeben einer Anmeldeinformation
AI an die Bearbeitungsfenster-Verwaltungsmittel 26 ausgebildet.
Die Erkennmittel 35 sind weiterhin zum Empfangen einer
von den Bearbeitungsfenster-Verwaltungsmitteln 26 abgegebenen
Bearbeitungsfenster-Information WI ausgebildet, die dann abgegeben wird,
wenn in einer in ihren Aktivzustand gesteuerten Verarbeitungseinheit 23, 24 bzw. 25 von
einem Betriebszustand zu einem anderen Betriebszustand umgeschaltet
wird. Hierbei enthält
die Bearbeitungsfenster-Information WI eine Information darüber, welches
der vier Bearbeitungsfenster W1, W2, W3 und W4 sich in seinem Bearbeitungszustand
befindet und daher aktiv ist, welcher Sachverhalt mit den Erkennmitteln 35 anhand
der Bearbeitungsfenster-Information WI erkannt bzw. festgestellt
werden kann. Eine solche Bearbeitungsfenster-Infonmation WI kann
von den Erkennmitteln 35 an die Ermittlungsmittel 36 abgegeben
werden.
-
Die Ermittlungsmittel 36 sind – beispielsweise
nach einem Wechsel von einem Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25 zu
einem anderen Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25,
also nach einem Aktivieren eines gewünschten Betriebszustandes einer
Verarbeitungseinheit 23, 24, 25, was
beispielsweise mit Hilfe einer anhand eines gesprochenen Befehls
ermittelten Befehlsinformation, aber auch durch Betätigen einer Taste
der Tastatur 6 erfolgen kann – zum Ermitteln von – zum Aktivieren
mindestens eines weiteren Betriebszustandes mindestens einer Verarbeitungseinheit 23, 24 bzw. 25 – geeigneten
Befehlsinformationen ausgebildet, die in diesem Fall durch Textinformationen
TI(CI) gebildet sind. Die Ermittlungsmittel 36 sind weiterhin
zum Abgeben der empfangenen Textinformationen TI(CI) an die Zuordnungsmittel 37 ausgebildet.
-
Die Zuordnungsmittel 37,
denen die mit den Ermittlungsmitteln 36 ermittelten geeigneten
Befehlsinformationen TI(CI) zugeführt werden können, sind zum
Zuordnen von Kenninformationen PI zu den ermittelten geeigneten
Befehlsinformationen TI(CI) ausgebildet, wobei die Kenninformationen
PI, die hierbei ebenso durch Phonemfolgen gebildet sind, entweder
im vorliegenden Fall aus dem Textlexikonspeicher 18 ausgelesen
sind oder mit Hilfe der Zuordnungsmittel 37 erzeugt werden
können.
Weiterhin sind die Zuordnungsmittel 37 selber zum Speichern der
ermittelten geeigneten Befehlsinformationen TI(CI) und der Kenninformationen
PI in dem Befehlswortschatzspeicher 19 und damit in dem
Befehlslexikonspeicher 17 und hierdurch zum Erzeugen eines nur
dem jeweils aktivierten Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25 zugeordneten Befehlslexikons
ausgebildet.
-
Wie vorstehend bereits erwähnt ist,
kann von den Erkennmitteln 35 eine Bearbeitungsfenster-Information
WI an die Ermittlungsmittel 36 abgegeben werden. Beim Auftreten
einer solchen Bearbeitungsfenster-Information WI sind die Ermittlungsmittel 36 zum
Abgeben einer Abfrageinformation GI(Wn)
an die Schaltflächen-Verwaltungsmittel 27 und
zum Empfangen von Steuerinformationen CI und von ermittelten geeigneten
Textinformationen TI(CI) von den Schaltflächen-Verwaltungsmitteln 27 und
zum Speichern dieser Informationen ausgebildet, worauf nachfolgend
noch näher
eingegangen werden soll. In den Ermittlungsmitteln 36 sind
die in dem Basiswortschatzspeicher 20 gespeicherten Textinformationen TI
ebenfalls gespeichert. Hierzu ist festzuhalten, daß in einer
Initialisierungsroutine diesen Textinformationen TI Steuerinformationen
CI zugeordnet wurden und weiterhin die Textinformationen TI und
die Steuerinformationen CI auf einander zugeordnete Weise in den
Ermittlungsmitteln 36 gespeichert wurden.
-
Die Zuordnungsmittel 37 sind
zum Vergleichen der empfangenen Textinformationen TI(CI) mit in
dem Textlexikonspeicher 18 gespeicherten Textinformationen
TI und im Fall einer Übereinstimmung zum
Auslesen der Textinformation TI und der zugeordneten Kenninformation
PI, also der zugeordneten Phonemfolge, aus dem Textlexikonspeicher 18 ausgebildet.
Wenn die empfangene Textinformation TI(CI) in dem Textlexi konspeicher 18 nicht
gefunden wird, dann sorgen die Zuordnungsmittel 37 selber
für ein
Erzeugen von den Textinformationen TI(CI) zuzuordnenden Zuordnungsinformationen
PI, also der Phonemfolgen. Hierbei wird Textteilen einer Textinformation
TI(CI) eine Phonem-Teilfolge
zugeordnet, die in dem Textlexikonspeicher 18 einem gleich
oder ähnlich
lautenden Textteil einer Textinformation TI zugeordnet ist. Dieses
Verfahren zum Erzeugen von einer Textinformation TI(CI) zugeordneten
Phonemfolgen ist dem Fachmann bereits seit längerer Zeit bekannt. Die Textinformationen
TI(CI) und die zugeordneten Phonemfolgen, also die zugeordneten
Kenninformationen PI, sind in dem Befehlswortschatzspeicher 19 speicherbar.
-
Eine in dem Befehlseingabemodus von
der Spracherkennungsstufe 11 erkannte Textinformation, die
hierbei eine Befehlsinformation BI bildet, kann von der Spracherkennungsstufe 11 über eine
weitere Verbindung 11B an die Ermittlungsmittel 36 abgegeben
werden. Die Ermittlungsmittel 36 sind zum Vergleichen der über die
weitere Verbindung 11B an sie abgegebenen Befehlsinformation
BI mit den in den Ermittlungsmitteln 36 gespeicherten ermittelten
geeigneten Textinformationen TI(CI) ausgebildet. Bei einem positiven
Vergleichsergebnis geben die Ermittlungsmittel 36 eine
in den Ermittlungsmitteln 36 gespeicherte, der Befehlsinformation
BI zugeordnete Steuerinformation CI an die Befehls-Verwaltungsmittel 28 ab,
worauf nachfolgend noch näher
eingegangen werden soll. Mit den Steuerinformationen CI kann ein
Aktivieren eines Betriebszustandes einer Verarbeitungseinheit 23, 24 bzw. 25 ausgelöst werden.
-
Ein in dem Personalcomputer 1 unter
Nutzung der Spracherkennungseinrichtung 2 ablaufender Programmablauf
der zum Erzeugen und Speichern eines an einen Betriebszustand einer
in ihren Aktivzustand gesteuerten Verarbeitungseinheit 23, 24, 25 angepaßten, also
diesem Betriebszustand zugeordneten Befehlslexikons abgearbeitet
wird, wird nachfolgend anhand eines in 4 dargestellten Flußdiagramms 38 beschrieben.
-
Der Programmablauf beginnt bei einem Block 39,
wenn die Spracherkennungseinrichtung 2 zur Eingabe von
Sprachinformationen SI in dem Personalcomputer 1 aktiviert
wird. Bei einem nachfolgenden Block 40 wird von den Erkennmitteln 35 eine Anmeldeinformation
AI an die Bearbeitungsfenster-Verwaltungsmittel 26 abgegeben.
Die Anmeldeinformation AI enthält
eine Information darüber,
welche von den in den Bearbeitungsfenster-Verwaltungsmitteln 26 auftretenden
Informationen während
der weiteren Verarbeitung an die Erkennmittel 35 übermittelt werden
sollen. Insbesondere enthält
die An meldeinformation AI eine Information darüber, daß eine in den Bearbeitungsfenster-Verarbeitungsmitteln 26 auftretende
Bearbeitungsfenster-Information WI während des weiteren Prozesses
immer an die Erkennmittel 35 weitergeleitet werden soll.
-
In den Bearbeitungsfenster-Verwaltungsmitteln 26 ist
die Bearbeitungsfenstertabelle 29 gespeichert, die in 2 dargestellt ist. In einer
Spalte AP der Bearbeitungsfenstertabelle 29 sind Programme angeführt, die
in den Verarbeitungseinheiten 23, 24 und 25,
denen Bearbeitungsfenster Wn zugeordnet sind,
abgearbeitet werden können.
Die erste Verarbeitungseinheit 23 ist mit Hilfe des Programms „Excel for
Windows®" gebildet, dem in
einer Spalte Wn der Bearbeitungsfenstertabelle 29 ein
erstes Bearbeitungsfenster W1 zugeordnet ist. Die zweite Verarbeitungseinheit 24 ist
mit Hilfe des Programms „Internet Explorer®" gebildet, dem in
der Spalte Wn der Bearbeitungsfenstertabelle 29 ein
zweites Bearbeitungsfenster W2 zugeordnet ist. Die dritte Verarbeitungseinheit 25 ist
mit Hilfe eines Programms „Word
for Windows®" gebildet, dem in
der Spalte Wn der Bearbeitungsfenstertabelle 29 ein
drittes Bearbeitungsfenster W3 und ein viertes Bearbeitungsfenster
W4 zugeordnet sind. Es sei angenommen, daß die dritte Verarbeitungseinheit 25 in
ihren Aktivzustand gesteuert ist. Das vierte Bearbeitungsfenster
W4 ist in der Bearbeitungsfenstertabelle 29 in einer Spalte
AK mit Hilfe eines Pfeiles als aktives Bearbeitungsfenster für eine Texteingabe
in dem Texteingabemodus oder für
eine Befehlseingabe in dem Befehlseingabemodus gekennzeichnet. Da
das vierte Bearbeitungsfenster W4 ein Entscheidungs-Bearbeitungsfenster ist,
ist nur eine Befehlseingabe in dem Befehlseingabemodus möglich. In
dem Aktivzustand der dritten Verarbeitungseinheit 25 wird
von dem Benutzer des Personalcomputers 1 eine Eingabe eines
Befehls erwartet, ob eine bestimmte Verarbeitung durchgeführt werden
soll, was durch Aktivieren der ersten Schaltfläche 31 mit der Textinformation „OK" erfolgen kann. Eine
solche bestimmte Verarbeitung kann beispielsweise das Laden eines
Dokumentes in den Arbeitsspeicher des Personalcomputers 1 zur
weiteren Bearbeitung des Textes dieses Dokumentes sein. Als Befehlseingabe
ist auch das Aktivieren der zweiten Schaltfläche 32 mit der Textinformation „CANCEL" möglich, wodurch
die bestimmte Verarbeitung abgebrochen wird. Auch ist als Befehlseingabe
das Aktivieren der dritten Schaltfläche 33 mit der Textinformation „BACK" möglich, wodurch
die bestimmte Verarbeitung nicht durchgeführt wird und in einen vorhergehenden
Betriebszustand der dritten Verarbeitungseinheit 25 zurückgekehrt
wird.
-
Bei einem auf den Block 40 folgenden
Block 41 wird mit den Erkennmitteln 35 geprüft, ob eine
Bearbeitungsfenster-Information WI von den Bearbeitungsfenster- Verwaltungsmitteln 26 abgegeben
wurde. Solange dies nicht der Fall ist, verbleibt der Programmablauf
bei dem Block 41. Die Bearbeitungsfenster-Verwaltungsmittel 26 geben
beim Auftreten einer Anmeldeinformation AI und im hier beschriebenen
Fall bei einem Umsteuern der in ihren Aktivzustand gesteuerten dritten
Verarbeitungseinheit 25 von einem Betriebszustand zu einem
anderen Betriebszustand eine Bearbeitungsfenster-Information WI
ab. Es sei erwähnt,
daß die
Bearbeitungsfenster-Verwaltungsmittel 26 auch dann eine
Bearbeitungsfenster-Information WI abgeben, wenn eine der beiden
anderen Verarbeitungseinheiten 23 oder 24 in ihren
Aktivzustand gesteuert wird. Beim Auftreten einer Bearbeitungsfenster-Information
WI wird der Programmablauf bei einem Block 42 fortgesetzt.
-
Bei dem Block 42 wird die
Bearbeitungsfenster-Information WI des in seinen Bearbeitungszustand
gesteuerten und folglich aktiven vierten Bearbeitungsfensters W4
von den Erkennmitteln 35 an die Ermittlungsmittel 36 abgegeben.
Die Ermittlungsmittel 36 geben beim Auftreten einer Bearbeitungsfenster-Information
WI eine Abfrageinformation GI(Wn) bezüglich des
jeweils aktiven Bearbeitungsfensters Wn,
also im vorliegenden Fall eine Abfrageinformation GI(W4) des aktiven
vierten Bearbeitungsfensters W4, an die Schaltflächen-Verwaltungsmittel 27 ab.
In den Schaltflächen-Verwaltungsmitteln 27 ist
die Schaltflächentabelle 30 gespeichert,
die in 3 dargestellt
ist. In einer Spalte Wn der Schaltflächentabelle 30 sind
die von den Schaltflächen-Verwaltungsmitteln 27 verwalteten
Bearbeitungsfenster W1, W2, W3 und W4 der mit der Windows-Verarbeitungseinheit 22 zusammenwirkenden
Verarbeitungseinheiten 23, 24 und 25 angeführt. In
einer Spalte TI(CI) der Schaltflächentabelle 30 sind
zu den Bearbeitungsfenstern W1, W2, W3 und W4 Textinformationen TI(CI)
angegeben, die Schaltflächen,
welche auch als Controlls bekannt sind, und anderen Elementen der
Bearbeitungsfenster W1, W2, W3 und W4, wie beispielsweise einer
Menüleiste
oder einem sogenannten Pulldown-Menü, zugeordnet sind. Jeder Textinformation
TI(CI) ist in der Schaltflächentabelle 30 einer
Steuerinformation CI zugeordnet, die bei einer Aktivierung einer
Schaltfläche
durch den Benutzer an die dem betreffenden Bearbeitungsfenster Wn zugeordnete Verarbeitungseinheit abgegeben
wird und zur Abarbeitung des Befehls der aktivierten Schaltfläche führt. Wie
aus der Schaltflächentabelle 30 ersichtlich
ist, ist der ersten Schaltfläche 31 mit der
Textinformation „OK" eine Steuerinformation „30" zugeordnet. Wenn
ein Benutzer des Personalcomputers 1 beispielsweise eine
zur Aktivierung der ersten Schaltfläche 31 geeignete Taste
der Tastatur 6 betätigt,
dann wird die Steuerinformation „30" von den Befehls-Verwaltungsmitteln 28 an
die dritte Verarbeitungseinheit 25 zum Verändern des
Betriebszustandes in der dritten Verarbeitungseinheit 25 abgegeben.
-
Bei einem auf den Block 42 folgenden
Block 43 werden von den Schaltflächen-Verwaltungsmitteln 27 beim
Auftreten der Abfrageinformation GI(W4) die Textinformationen TI(CI)
und die zugeordneten Steuerinformationen CI des vierten Bearbeitungsfensters W4
aus der Schaltflächentabelle 30 ermittelt
und an die Ermittlungsmittel 36 abgegeben. Die an die Ermittlungsmittel 36 abgegebenen
und zum Aktivieren eines weiteren Betriebszustandes der dritten
Verarbeitungseinheit 25 geeigneten ermittelten Textinformationen
TI(CI) und die zugeordneten Steuerinformationen CI werden in den
Ermittlungsmitteln 36 gespeichert und die ermittelten geeigneten
Textinformationen TI(CI) werden an die Zuordnungsmittel 37 abgegeben.
Somit werden in diesem Fall die Textinformationen „OK", „CANCEL" und „BACK" an die Zuordnungsmittel 37 abgegeben.
-
Bei einem auf den Block 43 folgenden
Block 44 werden den ermittelten geeigneten Textinformationen
TI(CI) Kenninformationen PI, also Phonemfolgen, zugeordnet. In einem
ersten Schritt wird geprüft, ob
eine ermittelte geeignete Textinformation TI(CI) bereits in dem
Textlexikonspeicher 18 gespeichert ist. Wenn eine solche
Textinformation TI(CI) in dem Textlexikonspeicher 18 bereits
gespeichert ist und daher gefunden wird, dann wird die in dem Textlexikonspeicher 18 der
Textinformation TI zugeordnete, eine Phonemfolge repräsentierende
Kenninformation PI aus dem Textlexikonspeicher 18 ausgelesen
und der gefundenen Textinformation TI(CI) zugeordnet. Wenn eine
solche Textinformation TI(CI) in dem Textlexikonspeicher 18 nicht
gefunden wird, dann wird mittels der Zuordnungsmittel 37 selber
eine Kenninformation PI, die eine Phonemfolge repräsentiert,
erzeugt und der nicht gefundenen Textinformation TI(CI) zugeordnet,
wie dies bereits vorstehend erläutert
wurde.
-
Bei einem auf den Block 44 folgenden
Block 45 werden die ermittelten geeigneten Textinformationen
TI(CI) und die diesen Textinformationen TI(CI) bei dem Block 44 zugeordneten
Kenninformationen PI in dem Befehlswortschatzspeicher 19 und
damit in dem Befehlslexikonspeicher 17 gespeichert. Auf
diese Weise wird das mit den Erzeugungsmitteln 34 im hier
beschriebenen Fall einzig und allein nur für den aktivierten Betriebszustand
der dritten Verarbeitungseinheit 25 erzeugte Befehlslexikon
in dem Befehlswortschatzspeicher 19 gespeichert, wodurch der
Inhalt des Befehlslexikonspeichers 17 an den aktivierten
Betriebszustand der dritten Verarbeitungseinheit 25 angepaßt wird.
Nach der Abarbeitung des Blocks 45 wird der Programmablauf
bei dem Block 41 fortgesetzt.
-
Gemäß dem beschriebenen erfindungsgemäßen Verfahren
wird mit Hilfe einer erfindungsgemäßen Spracherkennungseinrichtung 2 ein
an den aktivierten Betriebszustand einer in ihren Aktivzustand gesteuerten
Verarbeitungseinheit angepaßtes Befehlslexikon
jeweils unmittelbar nach dem Auftreten eines Betriebszustandes dieser
Verarbeitungseinheit automatisch erzeugt. Ein solches angepaßtes Befehlslexikon
wird vorteilhafterweise auch bei einem Wechsel von einem Betriebszustand
einer in ihrem Aktivzustand gewesenen Verarbeitungseinheit zu einem
Betriebszustand einer anderen in ihren Aktivzustand gebrachten Verarbeitungseinheit
automatisch erzeugt. Hierdurch ist der in dem Befehlswortschatzspeicher
gespeicherte Befehlswortschatz an das jeweils aktive Bearbeitungsfenster
Wn angepaßt, weshalb bei einem nachfolgenden
Spracherkennungsvorgang zum Erkennen einer als Sprachinformation
SI eingegebenen Befehlsinformation BI in dem Befehlseingabemodus
eine besonders hohe Erkennungsrate erzielt wird.
-
Ein in dem Personalcomputer 1 unter
Nutzung der Spracherkennungseinrichtung 2 ablaufender Programmablauf
zur Durchführung
eines Spracherkennungsvorganges in dem Befehlseingabemodus wird
nachfolgend anhand eines in 5 dargestellten
Flußdiagramms 46 beschrieben.
-
Der Programmablauf beginnt bei einem Block 47,
wenn durch Betätigen
der Taste 13 durch einen Sprecher eine Befehlseingabemodus-Aktivierungsinformation
CMI in der Spracherkennungseinrichtung 2 auftritt, wodurch
der Befehlseingabemodus aktiviert wird. Bei einem auf den Block 47 folgenden
Block 48 wird in der Spracherkennungsstufe 11 geprüft, ob bereits
eine Sprachinformation SI aufgetreten ist und in den Speichermitteln 9 gespeichert wurde.
Solange dies nicht der Fall ist, verbleibt der Programmablauf bei
dem Block 48. Wenn hingegen eine Sprachinformation SI aufgetreten
ist und in den Speichermitteln 9 gespeichert wurde, dann
wird der Programmablauf bei einem Block 49 fortgesetzt.
Bei dem Block 49 wird mit der Spracherkennungsstufe 11 einer
aus den Speichermitteln 9 ausgelesenen Sprachinformation
SI unter Verwendung von in dem Referenzenspeicher 16 gespeicherten
Referenzinformationen RI mindestens eine Phonemfolge zugeordnet. Diese
mindestens eine zugeordnete Phonemfolge wird mit Phonemfolgen verglichen,
die in dem – in dem
Befehlseingabemodus mit der Spracherkennungsstufe 11 verbundenen – Befehlslexikonspeicher 17 in
Form von Kenninformationen PI gespeichert sind. Bei einer Übereinstimmung
einer anhand der Sprachinformation SI ermittelten Phonemfolge mit
einer in dem Befehlslexikonspeicher 17 gespeicherten Phonemfolge
wird die der gespeicherten Phonemfolge zugeordnete und ebenso in
dem Befehlslexikonspeicher 17 gespeicherte Text information mit
Hilfe der Spracherkennungsstufe 11 aus dem Befehlslexikonspeicher 17 als
erkannte Textinformation ausgelesen. Eine solche erkannte Textinformation bildet
eine Befehlsinformation BI, die in dem Befehlseingabemodus von der
Spracherkennungsstufe 11 über die weitere Verbindung 11B an
die Ermittlungsmittel 36 abgegeben wird.
-
Bei einem Block 50 vergleichen
die Ermittlungsmittel 36 die erkannte Befehlsinformation
BI mit den in den Ermittlungsmitteln 36 gespeicherten Textinformationen.
Hierbei wird die ermittelte Befehlsinformation BI mit allen in den
Ermittlungsmitteln 36 gespeicherten Textinformationen verglichen,
also sowohl mit den ermittelten geeigneten Textinformationen TI(CI),
die an dem aktiven vierten Bearbeitungsfenster W4 angezeigt wurden,
als auch mit den bei einer Initialisierungsroutine in den Ermittlungsmitteln 36 gespeicherten
Textinformationen TI. Wenn eine Übereinstimmung
der erkannten Befehlsinformation BI mit einer in den Ermittlungsmitteln 36 gespeicherten
Textinformation festgestellt wurde, dann wird der Programmablauf
bei einem Block 51 fortgesetzt.
-
Bei dem Block 51 wird die
der gespeicherten Textinformation zugeordnete Steuerinformation
CI von den Ermittlungsmitteln 36 an die Befehls-Verwaltungsmittel 28 zur
Abarbeitung der Steuerinformation CI abgegeben. Die Befehls-Verwaltungsmittel 28 geben
die Steuerinformation CI an die in ihren Aktivzustand gesteuerte
dritte Verarbeitungseinheit 25 ab, um die dritte Verarbeitungseinheit 25 von
einem Betriebszustand zu einem anderen Betriebszustand umzusteuern
bzw. umzuschalten. Der Programmablauf wird nach dem Block 51 bei
dem Block 48 fortgesetzt.
-
Wenn ein Sprecher die Taste 13 betätigt und das
Wort „OK" in das Mikrofon 5 spricht,
dann vergleicht die Spracherkennungsstufe 11 die von ihr
zu dieser Sprachinformation SI erzeugte Phonemfolge mit Phonemfolgen
, die in dem Befehlswortschatzspeicher 19 und dem Basiswortschatzspeicher 20, also
in dem Befehlslexikonspeicher 17, in Form von Kenninformationen
PI gespeichert sind. In dem Befehlswortschatzspeicher 19 sind
die Phonemfolgen zu den Befehlen „OK", „CANCEL" und „BACK" gespeichert. Durch
die nur sehr geringe Anzahl von in dem Befehlslexikonspeicher 17 gespeicherten,
von der Spracherkennungsstufe 11 erkennbaren Befehlsinformationen
BI ist die Erkennungsrate sehr hoch, weshalb die Spracherkennungsstufe 11 die
Phonemfolge zu dem Wort „OK" als mit der ermittelten
Phonemfolge übereinstimmend
sehr rasch und sicher erkennt. Die dieser Phonemfolge zugeordnete
Textinformation „OK" wird von der Spracherkennungsstufe 11 an
die Ermittlungsmittel 36 abgegeben. Ein Vergleich in den
Ermittlungsmitteln 36 ergibt, daß die Befehlsinformation BI
entsprechend der Textinformation „OK" mit der in den Ermittlungsmitteln 36 gespeicherten
Textinformation TI(CI) der ersten Schaltfläche 31 des aktiven
vierten Bearbeitungsfensters W4 übereinstimmt.
Die der Textinformation TI(CI) zugeordnete Steuerinformation „30" wird daraufhin von
den Ermittlungsmitteln 36 an die Befehls-Verwaltungsmittel 28 zur
Abarbeitung der Steuerinformation „30" abgegeben. Die Befehls-Verwaltungsmittel 28 geben
die Steuerinformation „30" an die dritte Verarbeitungseinheit 25 ab,
in der der durch die Steuerinformation „30" repräsentierte
Befehl „OK" ausgeführt wird.
Hierbei macht es für
die dritte Verarbeitungseinheit 25 keinen Unterschied,
ob das Zuführen
der Steuerinformation „30" zu der dritten Verarbeitungseinheit 25 durch
ein Betätigen
der ersten Schaltfläche 31,
durch ein Betätigen
mindestens einer Taste der Tastatur 6 oder durch eine Spracheingabe
durch einen Sprecher bewirkt wurde.
-
Hierdurch wird vorteilhafterweise
erreicht, daß die
Spracherkennungseinrichtung 2 eine Steuerinformation CI
als Befehlsinformation BI zur Steuerung einer Verarbeitungseinheit
an diese Verarbeitungseinheit abgibt, welche Steuerinformation in
der Verarbeitungseinheit unmittelbar zur Ausführung des von einem Sprecher
gesprochenen Befehls führt.
Daher ist es nicht erforderlich, eine Verarbeitungseinheit zum Zusammenwirken
mit einer erfindungsgemäßen Spracherkennungseinrichtung 2 durch
Vorsehen von Sprachbefehlsverarbeitungsmitteln vorzubereiten, wie
dies bei Verarbeitungseinheiten zum Zusammenwirken mit bekannten
Spracherkennungseinrichtungen in vielen Fällen erforderlich ist. Dies
ermöglicht den
Einsatz einer erfindungsgemäßen Spracherkennungseinrichtung 2 bei
beliebigen Windows-Verarbeitungseinheiten.
-
Die erfindungsgemäße Spracherkennungseinrichtung 2 ist
vorteilhafterweise zum Zusammenwirken mit einer Vielzahl von Verarbeitungseinheiten 23, 24 und 25 ausgebildet,
wobei mit den Erkennmitteln 35 jeweils das aktive Bearbeitungsfenster
Wn einer in ihren Aktivzustand gesteuerten
Verarbeitungseinheit 23, 24 bzw. 25 ermittelt
wird und eine als Sprachinformation SI eingegebene Befehlsinformation
BI nur für
eine in ihren Aktivzustand gesteuerte Verarbeitungseinheit 23, 24 bzw. 25 wirksam
wird.
-
Die Erzeugungsmittel 34 einer
erfindungsgemäßen Spracherkennungseinrichtung 2 können besonders
einfach aufgebaut sein, wie dies in 1 dargestellt
ist, wenn sie zum Zusammenwirken mit einer Windows-Verarbeitungseinheit 22 ausgebildet sind,
die zum Beispiel mit Hilfe des Programms Windows95® realisiert
sein kann. Dies deshalb, weil das Programm Windows95® die
für die
Erzeugung eines Befehlslexikons erforderliche Bearbeitungsfenster-Information
WI sowie Textinformationen TI(CI) und zugeordnete Steuerinformationen
CI des aktiven Bearbeitungsfensters Wn zur
Verfügung
stellt.
-
Gemäß einem zweiten Ausführungsbeispiel der
Erfindung ist eine Spracherkennungseinrichtung zum Steuern einer
durch einen sogenannten Internet-Browser gebildeten Verarbeitungseinheit
ausgebildet. Hierbei weist die Spracherkennungseinrichtung gemäß dem zweiten
Ausführungsbeispiel
den gleichen Aufbau auf, wie die Spracherkennungseinrichtung gemäß dem ersten,
in 1 dargestellten Ausführungsbeispiel
der Erfindung, wobei aber ein die Spracherkennungseinrichtung gemäß dem zweiten
Ausführungsbeispiel
und den Internet-Browser enthaltender Personalcomputer mit dem Computernetz
Internet verbunden ist.
-
Der Internet-Browser wird zum Ermitteln
von in – mit
dem Internet verbundenen – Speichereinrichtungen,
sogenannten Servern, gespeicherten Informationen, sogenannten Internet-Homepages,
verwendet. Eine Internet-Homepage enthält Textinformationen und Grafikinformationen
und gegebenenfalls auch Videoinformationen. Der Internet-Browser ist zum Ermitteln
einer Internet-Homepage ausgebildet, die durch eine bestimmte Internet-Adresse – eine sogenannte
URL – gekennzeichnet
ist. Der Internet-Browser ist bei dem zweiten Ausführungsbeispiel der
Erfindung mit Hilfe des bekannten Windows-Programms „Microsoft Internet Explorer®" realisiert. Eine Vielzahl
weiterer zur Realisierung eines Internet-Browsers geeigneter Programme,
wie beispielsweise „Netscape®", sind ebenfalls
bekannt.
-
Eine Textinformation einer Internet-Homepage
kann eine Befehlsinformation bilden, wenn der Textinformation eine
Internet-Adresse einer weiteren Internet-Homepage zugeordnet ist. Eine solche
Textinformation kann in einer Internet-Homepage, wenn sie auf einem
mit dem Personalcomputer verbundenen Monitor wiedergegeben wird,
in einer bestimmten An – beispielsweise
unterstrichen – dargestellt sein,
um den Benutzer darauf aufmerksam zu machen, daß durch Aktivieren dieser Textinformation eine
weitere Internet-Homepage von dem Internet-Browser ermittelt werden
kann. Eine einer Textinformation zugeordnete Internet-Adresse bildet
hierbei eine Steuerinformation, die -wenn sie an den Internet-Browser
abgegeben wird – zum
Ermitteln der dieser Internet-Adresse zugeordneten Internet-Homepage
durch den Internet-Browser führt
und hierbei den Bearbeitungszustand des Internet-Browsers verändert.
-
Die Spracherkennungseinrichtung gemäß dem zweiten
Ausführungsbeispiel
der Erfindung weist Ermittlungsmittel auf, die nach dem Ermitteln einer
Internet nomepage mir dem Internet-Browser in der Internet-Homepage
enthaltene, Befehlsinformationen bildende Textinformationen ermittelt.
Da der Internet-Browser mit Hilfe des Windows-Programms „Microsoft
Internet Explorer®" gebildet ist, sind die Ermittlungsmittel
der Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel
und auch die Ermittlungsmittel der Spracherkennungseinrichtung gemäß dem ersten
Ausführungsbeispiel
zum Ermitteln der Befehlsinformationen einer Windows-Verarbeitungseinheit
ausgebildet.
-
Die Spracherkennungseinrichtung gemäß dem zweiten
Ausführungsbeispiel
weist weiterhin Zuordungsmittel auf, die den Zuordnungsmitteln der Sprachererkennungsmittel
gemäß dem ersten
Ausführungsbeispiel
entsprechen, welche in der Spracherkennungseinrichtung gemäß dem zweiten
Ausführungsbeispiel
Zuordungsinformationen zu den je eine Befehlsinformation bildenden
Textinformationen ermitteln oder erzeugen, wodurch die Spracherkennungseinrichtung
gemäß dem zweiten
Ausführungsbeispiel
zum Erzeugen eines an eine von einem Internet-Browser ermittelte
Internet-Homepage angepaßten
Befehlslexikons ausgebildet ist.
-
Die Ermittlungsmittel sind weiterhin
zum Ermitteln einer Internet-Adresse ausgebildet, die in einer zuletzt
vor dem Internet-Browser ermittelten Internet-Homepage einer eine
Befehlsinformation bildenden Textinformation zugeordnet ist. Weiterhin sind
die Ermittlungsmittel auch noch zum Vergleichen einer von Spracherkennungsmitteln
der Spracherkennungseinrichtung einer Sprachinformation entsprechend
dem ersten Ausführungsbeispiel
der Erfindung zugeordneten, einen auszuführenden Befehl repräsentierenden
Textinformation mit von den Ermitaungsmitteln ermittelten Textformationen
und bei einem positiven Vergleichsergebnis zum Abgeben einer der
einen auszuführenden
Befehl repräsentierenden
Textinformation zugeordneten Internet-Adresse – welche Internet-Adresse zum
Ermitteln einer der Internet-Adresse zugeordneten Internet-Homepage
mit dem Internet-Browser verwendet wird – an den Internet-Browser ausgebildet.
-
Hierdurch werden die vorstehend anhand des
ersten Ausführungsbeispiels
erläuterten
Vorteile auch bei der Steuerung eines Internet-Browsers durch von
einem Sprecher gesprochene Sprachbefehle erhalten.
-
Es sei erwähnt, daß eine erfindungsgemäße Spracherkennungseinrichtung
auch zum Steuern einer Verarbeitungseinheit ausgebildet sein kann,
die nicht zum Zusammenwirken mit einer Windows-Verarbeitungseinheit
ausgebildet ist. Hierbei sei auf Verarbeitungseinheiten verwiesen,
die mit einem Unix-Betriebssystem oder einem DOS-Betriebssystem zusammenwirken.
-
Es sei weiterhin erwähnt, daü ermittelte
geeignete Textinformationen TI(CI) nicht nur von einer sogenannten
Menüleiste
oder einem sogenannten Pulldown-Menü, sondern auch von anderen ähnlichen
Befehlsanzeigen ermittelt werden können.
-
Text in der
Zeichnung
-
2
-
- Excel for Windows®
- Internet Explorer
- Word for Windows®
- Entscheidungsfenster
(Word for Windows®)
-
3
-
- FORMAT (Format)
- PASTE (einfügen)
- VIEW (Ansicht)
- HOME (Startseite)
- REFRESH (aktualisieren)
- FORWARD (vorwärts)
- HELP (Hilfe)
- OK (ok)
- CANCEL (abbrechen)
- BACK (zurück)
-
4, 5
-