DE69819690T2 - Spracherkennungsvorrichtung unter verwendung eines befehlslexikons - Google Patents

Spracherkennungsvorrichtung unter verwendung eines befehlslexikons Download PDF

Info

Publication number
DE69819690T2
DE69819690T2 DE69819690T DE69819690T DE69819690T2 DE 69819690 T2 DE69819690 T2 DE 69819690T2 DE 69819690 T DE69819690 T DE 69819690T DE 69819690 T DE69819690 T DE 69819690T DE 69819690 T2 DE69819690 T2 DE 69819690T2
Authority
DE
Germany
Prior art keywords
command
processing unit
information
processing
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69819690T
Other languages
English (en)
Other versions
DE69819690D1 (de
Inventor
Gabor Janek
Heribert Wutte
Manfred Grabherr
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Austria GmbH
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE69819690D1 publication Critical patent/DE69819690D1/de
Publication of DE69819690T2 publication Critical patent/DE69819690T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Description

  • Die Erfindung bezieht sich auf ein Produkt mit mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit, bei der mindestens ein Betriebszustand aktivierbar ist, und mit einer Spracherkennungseinrichtung zum Steuern mindestens einer Verarbeitungseinheit bezüglich ihres mindestens einen Betriebszustandes unter Verwendung eines inhaltsmäßig von mindestens einem aktivierten Betriebszustand mindestens einer in ihrem Aktivzustand befindlichen Verarbeitungseinheit abhängigen, Befehle umfassenden Befehlslexikons, welche Spracherkennungseinrichtung einen Befehlslexikonspeicher enthält, in dem Befehle des Befehlslexikons in Form von Befehlsinformationen und diesen Befehlsinformationen zugeordneten Kenninformationen gespeichert werden können, und Spracherkennungsmittel enthält, denen mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentierende Sprachinformation zugeführt werden kann und die zum Ermitteln einer einer solchen Sprachinformation zuzuordnenden Befehlsinformation unter Verwendung von in dem Befehlslexikonspeicher gespeicherten Kenninformationen eingerichtet sind und welche Spracherkennungsmittel zum Übertragen einer ermittelten Befehlsinformation an eine Verarbeitungseinheit ausgebildet sind, wobei mit einer an diese Verarbeitungseinheit abgegebenen ermittelten Befehlsinformation ein dem gesprochenen Befehl entsprechender Betriebszustand dieser Verarbeitungseinheit aktiviert werden kann.
  • Die Erfindung bezieht sich weiterhin auf eine Spracherkennungseinrichtung, die zum Zusammenwirken mit mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit ausgebildet ist, bei der mindestens ein Betriebszustand aktivierbar ist, und mit einer Spracherkennungseinrichtung zum Steuern mindestens einer Verarbeitungseinheit bezüglich ihres mindestens einen Betriebszustandes unter Verwendung eines inhaltsmäßig von mindestens einem aktivierten Betriebszustand mindestens einer in ihrem Aktivzustand befindlichen Verarbeitungseinheit abhängigen, Befehle umfassenden Befehlslexikons, welche Spracherkennungseinrichtung einen Befehlslexikonspeicher enthält, in dem Befehle des Befehlslexikons in Form von Befehlsinformationen und diesen Befehlsinformationen zugeordneten Kenninformationen gespeichert werden können, und Spracherkennungsmittel enthält, denen mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentieren de Sprachinformation zugeführt werden kann und die zum Ermitteln einer einer solchen Sprachinformation zuzuordnenden Befehlsinformation unter Verwendung von in dem Befehlslexikonspeicher gespeicherten Kenninformationen eingerichtet sind und welche Spracherkennungsmittel zum Übertragen einer ermittelten Befehlsinformation an eine Verarbeitungseinheit ausgebildet sind, wobei mit einer an diese Verarbeitungseinheit abgegebenen ermittelten Befehlsinformation BI ein dem gesprochenen Befehl entsprechender Betriebszustand dieser Verarbeitungseinheit aktiviert werden kann.
  • Die Erfindung bezieht sich weiterhin auf ein Verfahren zum Erzeugen eines Befehlslexikons für eine Spracherkennungseinrichtung, welche Spracherkennungseinrichtung zum Steuern mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit – bei der mindestens ein Betriebszustand aktivierbar ist – bezüglich ihres mindestens einen Betriebszustandes unter Verwendung des Befehlslexikons ausgebildet ist, wobei das Befehlslexikon Befehle enthält, die in Form von Befehlsinformationen und den Befehlsinformationen zugeordneten Kenninformationen gespeichert werden können, und wobei die Befehlsinformationen und die zugeordneten Kenninformationen in einem Befehlslexikonspeicher gespeichert werden und wobei mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentierende Sprachinformation Spracherkennungsmitteln zugeführt wird und wobei mit den Spracherkennungsmitteln unter Verwendung der in dem Befehlslexikonspeicher gespeicherten Kenninformationen für eine solche Sprachinformation eine Befehlsinformation ermittelt wird und wobei die ermittelte Befehlsinformation einer Verarbeitungseinheit zum Aktivieren des einem gesprochenen Befehl entsprechenden Betriebszustandes der Verarbeitungseinheit zugeführt werden kann.
  • Eine solches Produkt und eine solche Spracherkennungseinrichtung und ein solches Verfahren sind beispielsweise aus dem Dokument EP 0 607 615 A1 bekannt. Bei dem bekannten Produkt ist die Spracherkennungseinrichtung zum Zusammenwirken mit mehreren Verarbeitungseinheiten ausgebildet und dient die Spracherkennungseinrichtung zum Eingeben von Textelementen zum Erstellen von Texten und zum Eingeben von Befehlen zum Steuern einer Verarbeitungseinheit hinsichtlich ihrer Betriebszustände. Eine solche Verarbeitungseinheit kann zum Beispiel durch eine Text-Verarbeitungseinheit unter Verwendung des Programms „Word for Windows®" oder des Programms WordPerfect® oder durch eine Tabellen-Verarbeitungseinheit unter Verwendung des Programms Excel® gebildet sein. An die Spracherkennungseinrichtung ist ein Mikrofon anschließbar, mit dem eine von einem Benutzer der Spracherkennungseinrichtung gesprochene Sprachinformation in einem Befehlseingabemodus als Befehl oder in einem Texteingabemodus als Textelement für eine Verarbeitungseinheit eingegeben werden kann. Die Spracherkennungseinrichtung weist Spracherkennungsmittel auf, die einen Befehlslexikonspeicher enthalten, in dem die ein Befehlslexikon bildenden Befehle gespeichert werden können, und zwar in Form von Befehlsinformationen zum Steuern einer Verarbeitungseinheit und diesen Befehlsinformationen zugeordneten Kenninformationen, die durch sogenannte Phoneme gebildet sind. Eine von einem Benutzer als Befehl eingegebene Sprachinformation wird in den Spracherkennungsmitteln verarbeitet und in dem Befehlseingabemodus mit in dem Befehlslexikonspeicher gespeicherten Kenninformationen verglichen, wobei eine der als Befehl eingegebenen Sprachinformation zugeordnete Befehlsinformation erzeugt wird und an eine Verarbeitungseinheit zum Aktivieren eines dem Befehl entsprechenden Betriebszustandes der Verarbeitungseinheit abgegeben wird.
  • Vor der Inbetriebnahme der bekannten Spracherkennungseinrichtung zur Steuerung einer Verarbeitungseinheit muß die Spracherkennungseinrichtung in einem Trainingsmodus an diese Verarbeitungseinheit angepaßt werden und müssen dieser Verarbeitungseinheit Sprachbefehlsverarbeitungsmittel hinzugefügt werden. Die bekannte Spracherkennungseinrichtung kann in dem Trainingsmodus an unterschiedliche Verarbeitungseinheiten und zusätzlich an unterschiedliche Betriebszustände von je einer Verarbeitungseinheit angepaßt werden, um einen größeren Erkennungserfolg der Spracherkennungsmittel zu erreichen. Hierfür werden in dem Trainingsmodus von einem Benutzer der Spracherkennungseinrichtung Befehle für einen Betriebszustand einer Verarbeitungseinheit ausgewählt, die in diesem Betriebszustand verwendet werden können und die zum Verändern des Betriebszustandes der Verarbeitungseinheit geeignet sind. Diese Befehle werden als Befehlsinformationen in einem diesem Betriebszustand dieser Verarbeitungseinheit zugeordneten Befehlslexikon-Sammelspeicher gespeichert. Anschließend kann der Benutzer in dem Trainingsmodus diese Befehle als Sprachinformation in das Mikrofon sprechen und die Spracherkennungsmittel für diese Befehle trainieren, wobei Kenninformationen erzeugt werden, die in dem Befehlslexikon-Sammelspeicher zu den Befehlsinformationen zugeordnet gespeichert werden. Sämtliche auf die angegebene Weise für jeden Betriebszustand erzeugten Befehlslexika werden in dem Befehlslexikon-Sammelspeicher der Spracherkennungseinrichtung gespeichert und in einer Verarbeitungseinheitstabelle den Verarbeitungseinheiten und deren Betriebszuständen zugeordnet.
  • Wenn der Betriebszustand einer Verarbeitungseinheit – die zum Zusammenwirken mit der Spracherkennungseinrichtung durch Hinzufügen von Sprachbefehlsverarbeitungsmitteln vorbereitet wurde und für die die bekannte Spracherkennungseinrichtung in dem Trainingsmodus vorbereitet wurde – verändert wird, dann gibt die Verarbeitungseinheit an die Spracherkennungseinrichtung eine Information darüber ab, welcher Betriebszustand der Verarbeitungseinheit vorliegt. Die Spracherkennungseinrichtung ermittelt hierauf unter Verwendung der Verarbeitungseinheitstabelle das für den vorliegenden Betriebszustand geeignete, in dem Trainingsmodus gemeinsam mit allen anderen Befehlslexika erzeugte Befehlslexikon und speichert dieses Befehlslexikon von dem Befehlslexikon-Sammelspeicher in den Befehlslexikonspeicher um. Wenn ein Benutzer einen Befehl zum Verändern des Betriebszustandes der Verarbeitungseinheit als Sprachinformation in das Mikrofon spricht, dann ist der Erfolg des Erkennens des gesprochenen Befehls relativ hoch, da nur eine sehr geringe Anzahl von Befehlen, die von dem Benutzer für diesen Betriebszustand ausgewählt wurden, zur Spracherkennung verwendet werden. Eine von den Spracherkennungsmitteln ermittelte, einer einen Befehl darstellenden Sprachinformation zugeordnete Befehlsinformation wird als Textelement an die Sprachbefehlsverarbeitungsmittel der Verarbeitungseinheit übermittelt. Die Sprachbefehlsverarbeitungsmittel der Verarbeitungseinheit ordnen dem übermittelten Textelement eine Steuerinformation zu, die die Abarbeitung des der Befehlsinformation, also dem Textelement, entsprechenden Befehls in der Verarbeitungseinheit bewirkt, worauf der Betriebszustand der Verarbeitungseinheit entsprechend dem abgearbeiteten Befehl verändert wird.
  • Bei der bekannten Spracherkennungseinrichtung hat sich allerdings gezeigt, daß das Erzeugen eines Befehlslexikons für jeden Betriebszustand einer Vielzahl von Verarbeitungseinheiten sehr zeitaufwendig und teuer ist. Weiterhin ist die Verwendung der bekannten Spracherkennungseinrichtung auf solche Verarbeitungseinheiten beschränkt, denen Sprachbefehlsverarbeitungsmittel hinzugefügt wurden und für die Befehlslexika erzeugt wurden. Weiterhin müssen in der bekannten Spracherkennungseinrichtung alle erzeugten Befehlslexika in dem Befehlslexikon-Sammelspeicher gespeichert und verwaltet werden, weshalb die bekannte Spracherkennungseinrichtung hierfür sowohl einen relativ großen Speicher aufweist als auch relativ komplexe Steuerungsmittel enthält.
  • Die Erfindung hat sich zur Aufgabe gestellt, die vorstehend angeführten Schwierigkeiten zu vermeiden und ein verbessertes Produkt mit einer Spracherkennungs einrichtung und eine verbesserte Spracherkennungseinrichtung und ein verbessertes Verfahren zum Erzeugen eines Befehlslexikons für eine Spracherkennungseinrichtung zu schaffen.
  • Diese Aufgabe wird bei einem Produkt der eingangs im ersten Absatz angeführten Art erfindungsgemäß dadurch gelöst, daß Erzeugungsmittel vorgesehen sind, die – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit – zum Erzeugen eines nur diesem einen aktivierten Betriebszustand zugeordneten Befehlslexikons ausgebildet sind.
  • Diese Aufgabe wird bei einer Spracherkennungseinrichtung der eingangs im zweiten Absatz angeführten Art erfindungsgemäß dadurch gelöst, daß Erzeugungsmittel vorgesehen sind, die – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit – zum Erzeugen eines nur diesem einen aktivierten Betriebszustand zugeordneten Befehlslexikons ausgebildet sind.
  • Diese Aufgabenstellung wird bei einem Verfahren der eingangs im dritten Absatz angeführten Art erfindungsgemäß dadurch gelöst, daß – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit – mit Erzeugungsmitteln ein nur diesem einen aktivierten Betriebszustand zugeordnetes Befehlslexikon erzeugt wird.
  • Hierdurch wird vorteilhafterweise erreicht, daß ein nur jeweils einem einzigen Betriebszustand einer Verarbeitungseinheit zugeordnetes und diesem Betriebszustand genau angepaßtes Befehlslexikon jeweils nach dem Auftreten eines neuen Betriebszustandes einer Verarbeitungseinheit erzeugt wird und daher kein Trainingsmodus vorgesehen sein muß, in dem die Spracherkennungseinrichtung erst zum Zusammenwirken mit der Verarbeitungseinheit vorbereitet werden muß. Weiterhin kann auf einen Befehlslexikon-Sammelspeicher zum Speichern einer Vielzahl von Befehlslexika für unterschiedliche Betriebszustände von Verarbeitungseinheiten verzichtet werden. Weiterhin kann auch auf Steuerungsmittel zum Verwalten einer Vielzahl von Befehlslexika verzichtet werden. Als Folge aller dieser Sachverhalte ist ein preiswertes Produkt bzw. eine kostengünstige Spracherkennungseinrichtung realisierbar.
  • Bei einem erfindungsgemäßen Produkt gemäß Anspruch 1 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 2 vorzusehen. Bei einer erfindungsgemäßen Spracherkennungseinrichtung gemäß Anspruch 6 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 7 vorzusehen. Bei einem erfindungsgemäßen Verfahren gemäß Anspruch 11 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß An spruch 12 vorzusehen. Diese Maßnahmen haben sich im Hinblick auf eine möglichst einfache und betriebssichere Realisierung als sehr vorteilhaft erwiesen.
  • Bei einem erfindungsgemäßen Produkt gemäß Anspruch 2 hat es sich als vorteilhaf erwiesen, die Maßnahmen gemäß Anspruch 3 vorzusehen. Bei einer erfindungsgemäßen Spracherkennungseinrichtung gemäß Anspruch 7 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 8 vorzusehen. Bei einem erfindungsgemäßen Verfahren gemäß Anspruch 12 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 13 vorzusehen. Hierdurch wird vorteilhafterweise erreicht, daß auf Sprachbefehlsverarbeitungsmittel in den zum Zusammenwirken mit der Spracherkennungseinrichtung des Produktes vorgesehenen Verarbeitungseinheiten verzichtet werden kann, da beim Auftreten einer von einem Benutzer gesprochenen, einen Befehl repräsentierenden Sprachinformation von der Spracherkennungseinrichtung eine Steuerinformation an die Verarbeitungseinheit übermittelt wird, welche Steuerinformation die in der Verarbeitungseinheit unmittelbar zur Abarbeitung des gesprochenen Befehls führt. So können nicht nur Kosten, sondern auch Zeit gespart werden, die aufgewendet werden müßten, um bei allen zum Zusammenwirken mit der Spracherkennungseinrichtung vorgesehenen Verarbeitungseinheiten Sprachbefehlsverarbeitungsmittel vorzusehen.
  • Bei einem erfindungsgemäßen Produkt gemäß Anspruch 2 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 4 vorzusehen. Bei einer erfindungsgemäßen Spracherkennungseinrichtung gemäß Anspruch 7 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 9 vorzusehen. Bei einem erfindungsgemäßen Verfahren gemäß Anspruch 12 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß dem Anspruch 14 vorzusehen. Hierdurch wird vorteilhafterweise erreicht, daß die Spracherkennungseinrichtung des Produktes zum Zusammenwirken mit mehreren Verarbeitungseinheiten ausgebildet ist, die in einem Zeitfensterverfahren oder in einem Parallelverarbeitungsverfahren jeweils separat in einen Aktivzustand gebracht werden können, und daß geeignete Befehlsinformationen nur aus einem in einen Bearbeitungszustand gesteuerten Bearbeitungsfenster ermittelt werden.
  • Bei einem erfindungsgemäßen Produkt gemäß Anspruch 2 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 5 vorzusehen. Bei einer erfindungsgemäßen Spracherkennungseinrichtung gemäß Anspruch 7 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß Anspruch 10 vorzusehen. Bei einem erfindungsgemäßen Verfahren gemäß Anspruch 12 hat es sich als vorteilhaft erwiesen, die Maßnahmen gemäß An spruch 15 vorzusehen. Durch die Maßnahme bei einem erfindungsgemäßen Produkt, die Spracherkennungseinrichtung zum Zusammenwirken mit einer Windows-Verarbeitungseinheit auszubilden – die beispielsweise mit Hilfe eines der Programme Windows95®, Windows NT® oder X-Windows® realisiert ist – wird vorteilhafterweise erreicht, daß die Erkennmittel und die Ermittlungsmittel besonders einfach ausgebildet sein können, so daß eine einfache Spracherkennungseinrichtung erhalten wird, die mit einer Vielzahl von für das Zusammenwirken mit der Windows-Verarbeitungseinheit vorgesehenen Verarbeitungseinheiten zusammenwirken kann.
  • Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben.
  • Es zeigen:
  • 1 schematisch in Form eines Blockschaltbildes als erfindungsgemäßes Produkt einen Personalcomputer, in dem ein erfindungsgemäßes Verfahren durchführbar ist und in dem eine erfindungsgemäße Spracherkennungseinrichtung enthalten ist, die zum Steuern von drei Verarbeitungseinheiten vorgesehen ist und die mit Erzeugungsmitteln zum Erzeugen eines Befehlslexikons nach einem Wechsel von einem Betriebszustand einer Verarbeitungseinheit zu einem anderen Betriebszustand einer Verarbeitungseinheit versehen ist,
  • 2 eine Bearbeitungsfenstertabelle, die in Bearbeitungsfenster-Verwaltungsmitteln einer Windows-Verarbeitungseinheit des Personalcomputers von 1 gespeichert ist,
  • 3 eine Schaltflächentabelle, die in Schaltflächen-Verwaltungsmitteln der Windows-Verarbeitungseinheit des Personalcomputers von 1 gespeichert ist,
  • 4 ein Flußdiagramm, anhand dessen zumindest ein wesentlicher Teil eines erfindungsgemäßen Verfahrens erläutert werden kann, das in dem Personalcomputer von 1 unter Nutzung seiner Spracherkennungseinrichtung zum Erzeugen eines Befehlslexikons angewendet wird,
  • 5 ein weiteres Flußdiagramm, anhand dessen ein Teil eines erfindungsgemäßen Verfahrens erläutert werden kann, das in dem Personalcomputer von 1 unter Nutzung einer Spracherkennungseinrichtung zum Erkennen von – von einem Sprecher gesprochenen – Sprachinformationen unter Verwendung eines erzeugten Befehlslexikons und zum Abgeben von Steuerinformationen an eine Verarbeitungseinheit zum Um steuern dieser Verarbeitungseinheit von einem Betriebszustand in einen anderen Betriebszustand angewendet wird.
  • In 1 ist ein Personalcomputer 1 dargestellt, der eine Spracherkennungseinrichtung 2 und eine PC-Verarbeitungseinheit 3 aufweist und der mit einem Monitor 4 ausgerüstet ist und an den ein Mikrofon 5, eine Tastatur 6 und ein Lautsprecher 7 angeschlossen sind.
  • Die Spracherkennungseinrichtung 2 des Personalcomputers 1 dient im vorliegenden Fall unter anderem zum Steuern von mindestens einer Verarbeitungseinheit bezüglich ihrer Betriebszustände unter Verwendung eines inhaltsmäßig von einem aktivierten Betriebszustand einer in ihrem Aktivzustand befindlichen Verarbeitungseinheit abhängigen, Befehle umfassenden Befehlslexikons, worauf nachfolgend noch näher eingegangen werden soll.
  • Von dem Mikrofon 5 kann eine von einem Sprecher gesprochene, entweder aus mehreren zusammenhängenden Wörtern oder auch aus einzelnen Wörtern bestehende analoge Sprachinformation SI an eine Analog/Digital-Wandlerstufe 8 der Spracherkennungseinrichtung 2 abgegeben werden. Von der Analog/Digital-Wandlerstufe 8 kann eine digitale Sprachinformation SI an Speichermittel 9 abgegeben werden und in diesen gespeichert werden.
  • Eine aus den Speichermitteln 9 ausgelesene digitale Sprachinformation SI kann in einem auf nicht näher angegebene Weise aktivierbaren Sprachwiedergabemodus an eine Digital/Analog-Wandlerstufe 12 und von dieser als analoge Sprachinformation SI an den Lautsprecher 7 abgegeben werden.
  • Eine aus den Speichermitteln 9 ausgelesene digitale Sprachinformation SI kann aber auch an Spracherkennungsmittel 10 der Spracherkennungseinrichtung 2 abgegeben werden, und zwar an eine in den Spracherkennungsmitteln 10 enthaltene Spracherkennungsstufe 11. Den Spracherkennungsmitteln 10 können von einem Sprecher gesprochene, je durch eine Sprachinformation repräsentierte Befehle zugeführt werden. Diese Spracherkennungsmittel 10 sind unter anderem dazu ausgebildet, unter Verwendung von in einem Befehlslexikonspeicher gespeicherten Kenninformationen PI eine einem zugeführten Befehl zuzuordnende und einen solchen Befehl repräsentierende Befehlsinformation BI und damit eigentlich einen Befehl zu ermitteln und die einen Befehl repräsentierende ermittelte Befehlsinformation BI an eine Verarbeitungseinheit abzugeben, wobei mit der – an die Ver arbeitungseinheit abgegebenen, einen Befehl repräsentierenden – ermittelten Befehlsinformation BI ein dem gesprochenen Befehl entsprechender gewünschter Betriebszustand der Verarbeitungseinheit aktivierbar ist.
  • Das Mikrofon 5 weist eine Taste 13 auf, die von einem Sprecher zum Abgeben einer Befehlseingabemodus-Aktivierungsinformation CMI betätigt werden kann, mit der in der Spracherkennungseinrichtung 2 ein Befehlseingabemodus aktiviert wird. Eine solche Befehlseingabemodus-Aktivierungsinformation CMI kann von der Taste 13 an die Spracherkennungsstufe 11 abgegeben werden.
  • Die Spracherkennungsmittel 10 weisen zum Erkennen einer ihnen zugeführten digitalen Sprachinformation SI und zum Zuordnen einer Textinformation TI zu einer erkannten Sprachinformation SI die Spracherkennungsstufe 11 sowie einen Lexikonspeicher 14, einen Sprachmodellspeicher 15 und einen Referenzenspeicher 16 auf. Diese drei Speicher 14, 15 und 16 sind mit der Spracherkennungsstufe 11 verbunden.
  • Der Lexikonspeicher 14 weist einen Befehlslexikonspeicher 17 und einen Textlexikonspeicher 18 auf. Der Befehlslexikonspeicher 17 weist seinerseits einen Befehlswortschatzspeicher 19 und einen Basiswortschatzspeicher 20 auf. Der Textlexikonspeicher 18 enthält in diesem Fall auch den Basiswortschatzspeicher 20 – was aber nicht unbedingt der Fall sein muß – und einen Textwortschatzspeicher 21.
  • In dem Lexikonspeicher 14 sind zum Zweck des Speicherns von Wörtern Textinformationen TI und den Textinformationen TI zugeordnete Kenninformation PI speicherbar bzw. gespeichert. Dieses Speichern ist in diesem Fall in der Weise organisiert, daß für jedes Wort eine Textinformation TI, nämlich ein sogenannter Graphem, und eine der Textinformation TI zugeordnete Kenninformation PI, nämlich eine sogenannte Phonemfolge, gespeichert ist. Es sei erwähnt, daß das Organisieren des Speicherns von Wörtern auch auf andere Art und Weise möglich ist.
  • In dem Basiswortschatzspeicher 20 ist eine mehr oder weniger hohe Anzahl von Wörtern gespeichert, die Basisausdrücke darstellen und einen Basiswortschatz bilden und die in einem auf nicht näher angegebene Weise aktivierbaren Texteingabemodus Basiswörter sind, die einen Teil eines mit den Spracherkennungsmitteln 10 erkennbaren Gesamttextwortschatzes bilden, und die in dem Befehlseingabemodus Basisbefehle sind, die einen Teil eines mit den Spracherkennungsmitteln 10 erkennbaren Gesamtbefehlswortschatzes bilden. In dem Basiswortschatzspeicher 20 kann zum Beispiel das Wort „Hilfe" gespeichert sein, das in dem Texteingabemodus von einer hierfür vorgesehenen geeigneten Verarbeitungseinheit als Basiswort bei einer Textverarbeitung und in dem Befehlseingabemodus von einer hierfür geeigneten Verarbeitungseinheit als Basisbefehl zum Anzeigen eines Hilfe-Menüs verarbeitet werden kann.
  • In dem Textwortschatzspeicher 21 ist eine Vielzahl von Wörtern gespeichert, die einen Textwortschatz bilden, der gemeinsam mit den Basisausdrücken den mit den Spracherkennungsmitteln 10 in dem Texteingabemodus der Spracherkennungseinrichtung 2 erkennbaren Gesamttextwortschatz bildet.
  • In dem Befehlswortschatzspeicher 19 sind Wörter gespeichert, die einen Befehlswortschatz bilden, der gemeinsam mit den Basisausdrücken den mit den Spracherkennungsmitteln 10 in dem Befehlseingabemodus der Spracherkennungseinrichtung 2 erkennbaren Gesamtbefehlswortschatz bildet. Dies heißt mit anderen Worten, daß in dem Befehlseingabemodus der durch die Basisausdrücke gebildete Basisbefehlswortschatz um die in dem Befehlswortschatzspeicher 19 gespeicherten Befehle zur Bildung des Gesamtbefehlswortschatzes erweiterbar ist. Mit einem solchen Befehl ist in dem Befehlseingabemodus beispielsweise ein Wechsel von einem Betriebszustand einer Verarbeitungseinheit zu einem anderen Betriebszustand einer Verarbeitungseinheit aktivierbar, also beispielsweise mindestens eine Verarbeitungseinheit von einem bisherigen Betriebszustand in einen gewünschten neuen Betriebszustand umsteuerbar bzw. umschaltbar. Diese Befehle sind sowohl zum Aktivieren eines gewünschten Betriebszustandes einer Verarbeitungseinheit als auch zum Umsteuern mindestens einer Verarbeitungseinheit bezüglich ihrer Betriebszustände zum Zwecke des Aktivierens eines gewünschten Betriebszustandes geeignet.
  • Wie bereits erwähnt, wird eine mit der Taste 13 erzeugte Befehlseingabemodus-Aktivierungsinformation CMI der Spracherkennungsstufe 11 zugeführt. Von der Spracherkennungsstufe 11 aus wird sie dem Lexikonspeicher 14 zugeführt. Beim Auftreten einer Befehlseingabemodus-Aktivierungsinformation CMI in dem Befehlseingabemodus wird der Befehlslexikonspeicher 17 des Lexikonspeichers 14 mit der Spracherkennungsstufe 11 verbunden. Beim Fehlen einer Befehlseingabemodus-Aktivierungsinformation CMI in dem Texteingabemodus wird der Textlexikonspeicher 18 des Lexikonspeichers 14 mit der Spracherkennungsstufe 11 verbunden. Auf diese Weise ist gewährleistet, daß die je einen Befehl bildenden Wörter in dem Befehlslexikonspeicher 17 gespeichert werden. Zum Zweck des Speicherns dieser Wörter, die Befehle bilden, werden Befehlsinformationen BI als Textinformationen und diesen Befehlsinformationen BI zugeordnete Kenninformationen PI in dem Befehlslexikonspeicher 17 gespeichert, und zwar für jedes Wort eine Befehlsinformation BI und eine zugeordnete Kenninformation PI.
  • In dem Sprachmodellspeicher 15 sind Sprachmodellinformationen SMI gespeichert, die die Wahrscheinlichkeit des Auftretens eines Wortes nach dem Auftreten einer bestimmten Kombination bzw. Aufeinanderfolge von mit der Spracherkennungsstufe 11 erkannten Wörtern angeben. Wenn bei einem Spracherkennungsvorgang das nächste in einer aus mehreren aufeinanderfolgenden Wörtern bestehenden Sprachinformation SI enthaltene Wort gemäß den in dem Lexikonspeicher 14 und dem Referenzenspeicher 16 gespeicherten Informationen mit gleicher Wahrscheinlichkeit eines von zwei Wörtern sein kann, dann erkennt die Spracherkennungsstufe 11 jenes Wort, das entsprechend der Sprachmodellinformation SMI eine größere Wahrscheinlichkeit des Auftretens aufweist.
  • In dem Referenzenspeicher 16 sind Referenzinformationen RI gespeichert, die Informationen darüber repräsentieren, wie ein Sprecher ein Phonem einer Phonemfolge ausspricht. Mit Hilfe der Referenzinformationen RI wird die Spracherkennungsstufe 11 an einen Sprecher angepaßt.
  • Die PC-Verarbeitungseinheit 3 des Personalcomputers 1 weist eine Windows-Verarbeitungseinheit 22 sowie eine erste Verarbeitungseinheit 23, eine zweite Verarbeitungseinheit 24 und eine dritte Verarbeitungseinheit 25 auf. Bei aktiviertem Personalcomputer 1 ist die Windows-Verarbeitungseinheit 22 stets in ihren Aktivzustand gesteuert. Jede der drei anderen Verarbeitungseinheiten 23, 24 und 25 kann in einen Aktivzustand gebracht bzw. gesteuert werden und ist in ihrem Aktivzustand bezüglich ihrer Betriebszustände steuerbar bzw. umschaltbar.
  • Die Windows-Verarbeitungseinheit 22, die im wesentlichen eine Programm-Verarbeitungseinheit zum Verarbeiten eines sogenannten Windows-Programms darstellt und die in diesem Fall mit Hilfe des bekannten Programms Windows 95® gebildet ist, dient hauptsächlich zum Verwalten der drei Verarbeitungseinheiten 23, 24 und 25 und enthält Bearbeitungsfenster-Verwaltungsmittel 26, Schaltflächen-Verwaltungsmittel 27 und Befehls-Verwaltungsmittel 28. In den Bearbeitungsfenster-Verwaltungsmitteln 26 kann eine Bearbeitungsfenstertabelle 29 gespeichert werden, die in 2 dargestellt ist. In den Schaltflächen-Verwaltungsmitteln 27 kann eine Schaltflächentabelle 30 gespeichert werden, die in 3 dargestellt ist. Die Befehls-Verwaltungsmittel 28 sind zum Verwalten und Ausführen eines mit der Tastatur 6 oder mit der Spracherkennungseinrichtung 2 in Form einer Steuerinformation CI eingegebenen Befehls für die Windows-Verarbeitungs einheit 22 oder zum Weiterleiten des eingegebenen Befehls in Form der Steuerinformation CI an eine der drei Verarbeitungseinheiten 23, 24 und 25 ausgebildet.
  • Die drei Verarbeitungseinheiten 23, 24 und 25, die ebenso im wesentlichen Programm-Verarbeitungseinheiten darstellen, dienen hauptsächlich zum Ansteuern von vier Bearbeitungsfenstern W1, W2, W3 und W4 und zum Aufbereiten und Erzeugen von Grafikinformationen und Textinformationen, um ein Anzeigen der Grafikinformationen und Textinformationen in den Bearbeitungsfenstern W1, W2, W3 und W4 zu ermöglichen. Bei jeder der drei Verarbeitungseinheiten 23, 24 und 25 sind bei aktiviertem Aktivzustand unterschiedliche Betriebszustände einschaltbar. Je nach Verarbeitungseinheit 23, 24 bzw. 25 handelt es sich hierbei um unterschiedliche Betriebszustände, beispielsweise um einen Entscheidungsbetriebszustand, auf den nachfolgend noch näher eingegangen werden soll, oder um einen Druckvorbereitungsbetriebszustand oder um einen Betriebszustand zum Zweck des Öffnens mindestens einer Datei oder um einen Texteingabebetriebszustand.
  • Mit dem Monitor 4 sind den drei Verarbeitungseinheiten 23, 24 und 25 zugeordnete Bearbeitungsfenster Wn anzeigbar, wobei in 1 ein erstes Bearbeitungsfenster W1, ein zweites Bearbeitungsfenster W2, ein drittes Bearbeitungsfenster W3 und ein viertes Bearbeitungsfenster W4 angedeutet sind. Jedes dieser vier Bearbeitungsfenster W1, W2, W3 und W4 ist zu seiner Bearbeitung in einen Bearbeitungszustand steuerbar, und zwar mit Hilfe der Verarbeitungseinheiten 23, 24 und 25.
  • Das vierte Bearbeitungsfenster W4 ist ein sogenanntes Entscheidungs-Bearbeitungsfenster, das nicht zur Texteingabe, sondern zur Eingabe von Befehlen vorgesehen ist, und das hierbei eine erste Schaltfläche 31 mit der Textinformation „OK" und eine zweite Schaltfläche 32 mit der Textinformation „CANCEL" und eine dritte Schaltfläche 33 mit der Textinformation „BACK" aufweist. Die drei Verarbeitungseinheiten 23, 24 und 25 sind über vier Verbindungen 23A, 24A, 25A und 25B mit den ihnen zugeordneten Bearbeitungsfenstern W1, W2, W3 und W4 verbunden, und zwar zum Abgeben von Grafikinformationen und Textinformationen zum Anzeigen dieser Informationen in den Bearbeitungsfenstern W1, W2, W3 und W4. Mit der dritten Verarbeitungseinheit 25 sind hierbei sowohl das dritte Bearbeitungsfenster W3 als auch das vierte Bearbeitungsfenster W4 verbunden, und zwar über die beiden Verbindungen 25A und 25B.
  • Eine in dem Texteingabemodus von der Spracherkennungsstufe 11 erkannte Textinformation TI kann von der Spracherkennungsstufe 11 über eine Verbindung 11A an die Windows-Verarbeitungseinheit 22 und von dieser über eine von drei weiteren Verbin dungen 22A, 22B und 22C an eine in ihren Aktivzustand gesteuerte Verarbeitungseinheit 23, 24 bzw. 25 abgegeben werden, wobei diese eine Verarbeitungseinheit 23, 24 bzw. 25 dafür sorgt, daß in dem von ihr über eine der Verbindungen 23A, 24A und 25A ansprechbaren Bearbeitungsfenster W1, W2 bzw. W3 ein der erkannten Textinformation TI entsprechender Text angezeigt wird. Es sei erwähnt, daß immer nur eine der drei Verarbeitungseinheiten 23, 24 und 25 in ihren Aktivzustand gesteuert werden kann und immer nur eines der vier Bearbeitungsfenster W1, W2, W3 und W4 in seinen Bearbeitungszustand gesteuert werden kann.
  • Die Spracherkennungseinrichtung 2 weist nunmehr Erzeugungsmittel 34 zum Erzeugen eines – nur dem einen – beispielsweise einem gesprochenen oder einem mit einer Taste der Tastatur 6 eingegebenen Befehl entsprechenden – gewünschten Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25 zugeordneten – Befehlslexikons auf. Die Erzeugungsmittel 34 sind durch Informationsverarbeitungsmittel gebildet und enthalten Erkennmittel 35 und Ermittlungsmittel 36 und weiterhin Zuordnungsmittel 37.
  • Die Erkennmittel 35 sind zum Erkennen eines Bearbeitungszustands eines Bearbeitungsfensters W1, W2, W3 und. W4 einer in der Spracherkennungseinrichtung 2 enthaltenen Verarbeitungseinheit 23, 24 und. 25 vorgesehen. Hierfür sind die Erkennmittel 35 zum Abgeben einer Anmeldeinformation AI an die Bearbeitungsfenster-Verwaltungsmittel 26 ausgebildet. Die Erkennmittel 35 sind weiterhin zum Empfangen einer von den Bearbeitungsfenster-Verwaltungsmitteln 26 abgegebenen Bearbeitungsfenster-Information WI ausgebildet, die dann abgegeben wird, wenn in einer in ihren Aktivzustand gesteuerten Verarbeitungseinheit 23, 24 bzw. 25 von einem Betriebszustand zu einem anderen Betriebszustand umgeschaltet wird. Hierbei enthält die Bearbeitungsfenster-Information WI eine Information darüber, welches der vier Bearbeitungsfenster W1, W2, W3 und W4 sich in seinem Bearbeitungszustand befindet und daher aktiv ist, welcher Sachverhalt mit den Erkennmitteln 35 anhand der Bearbeitungsfenster-Information WI erkannt bzw. festgestellt werden kann. Eine solche Bearbeitungsfenster-Infonmation WI kann von den Erkennmitteln 35 an die Ermittlungsmittel 36 abgegeben werden.
  • Die Ermittlungsmittel 36 sind – beispielsweise nach einem Wechsel von einem Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25 zu einem anderen Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25, also nach einem Aktivieren eines gewünschten Betriebszustandes einer Verarbeitungseinheit 23, 24, 25, was beispielsweise mit Hilfe einer anhand eines gesprochenen Befehls ermittelten Befehlsinformation, aber auch durch Betätigen einer Taste der Tastatur 6 erfolgen kann – zum Ermitteln von – zum Aktivieren mindestens eines weiteren Betriebszustandes mindestens einer Verarbeitungseinheit 23, 24 bzw. 25 – geeigneten Befehlsinformationen ausgebildet, die in diesem Fall durch Textinformationen TI(CI) gebildet sind. Die Ermittlungsmittel 36 sind weiterhin zum Abgeben der empfangenen Textinformationen TI(CI) an die Zuordnungsmittel 37 ausgebildet.
  • Die Zuordnungsmittel 37, denen die mit den Ermittlungsmitteln 36 ermittelten geeigneten Befehlsinformationen TI(CI) zugeführt werden können, sind zum Zuordnen von Kenninformationen PI zu den ermittelten geeigneten Befehlsinformationen TI(CI) ausgebildet, wobei die Kenninformationen PI, die hierbei ebenso durch Phonemfolgen gebildet sind, entweder im vorliegenden Fall aus dem Textlexikonspeicher 18 ausgelesen sind oder mit Hilfe der Zuordnungsmittel 37 erzeugt werden können. Weiterhin sind die Zuordnungsmittel 37 selber zum Speichern der ermittelten geeigneten Befehlsinformationen TI(CI) und der Kenninformationen PI in dem Befehlswortschatzspeicher 19 und damit in dem Befehlslexikonspeicher 17 und hierdurch zum Erzeugen eines nur dem jeweils aktivierten Betriebszustand einer Verarbeitungseinheit 23, 24 bzw. 25 zugeordneten Befehlslexikons ausgebildet.
  • Wie vorstehend bereits erwähnt ist, kann von den Erkennmitteln 35 eine Bearbeitungsfenster-Information WI an die Ermittlungsmittel 36 abgegeben werden. Beim Auftreten einer solchen Bearbeitungsfenster-Information WI sind die Ermittlungsmittel 36 zum Abgeben einer Abfrageinformation GI(Wn) an die Schaltflächen-Verwaltungsmittel 27 und zum Empfangen von Steuerinformationen CI und von ermittelten geeigneten Textinformationen TI(CI) von den Schaltflächen-Verwaltungsmitteln 27 und zum Speichern dieser Informationen ausgebildet, worauf nachfolgend noch näher eingegangen werden soll. In den Ermittlungsmitteln 36 sind die in dem Basiswortschatzspeicher 20 gespeicherten Textinformationen TI ebenfalls gespeichert. Hierzu ist festzuhalten, daß in einer Initialisierungsroutine diesen Textinformationen TI Steuerinformationen CI zugeordnet wurden und weiterhin die Textinformationen TI und die Steuerinformationen CI auf einander zugeordnete Weise in den Ermittlungsmitteln 36 gespeichert wurden.
  • Die Zuordnungsmittel 37 sind zum Vergleichen der empfangenen Textinformationen TI(CI) mit in dem Textlexikonspeicher 18 gespeicherten Textinformationen TI und im Fall einer Übereinstimmung zum Auslesen der Textinformation TI und der zugeordneten Kenninformation PI, also der zugeordneten Phonemfolge, aus dem Textlexikonspeicher 18 ausgebildet. Wenn die empfangene Textinformation TI(CI) in dem Textlexi konspeicher 18 nicht gefunden wird, dann sorgen die Zuordnungsmittel 37 selber für ein Erzeugen von den Textinformationen TI(CI) zuzuordnenden Zuordnungsinformationen PI, also der Phonemfolgen. Hierbei wird Textteilen einer Textinformation TI(CI) eine Phonem-Teilfolge zugeordnet, die in dem Textlexikonspeicher 18 einem gleich oder ähnlich lautenden Textteil einer Textinformation TI zugeordnet ist. Dieses Verfahren zum Erzeugen von einer Textinformation TI(CI) zugeordneten Phonemfolgen ist dem Fachmann bereits seit längerer Zeit bekannt. Die Textinformationen TI(CI) und die zugeordneten Phonemfolgen, also die zugeordneten Kenninformationen PI, sind in dem Befehlswortschatzspeicher 19 speicherbar.
  • Eine in dem Befehlseingabemodus von der Spracherkennungsstufe 11 erkannte Textinformation, die hierbei eine Befehlsinformation BI bildet, kann von der Spracherkennungsstufe 11 über eine weitere Verbindung 11B an die Ermittlungsmittel 36 abgegeben werden. Die Ermittlungsmittel 36 sind zum Vergleichen der über die weitere Verbindung 11B an sie abgegebenen Befehlsinformation BI mit den in den Ermittlungsmitteln 36 gespeicherten ermittelten geeigneten Textinformationen TI(CI) ausgebildet. Bei einem positiven Vergleichsergebnis geben die Ermittlungsmittel 36 eine in den Ermittlungsmitteln 36 gespeicherte, der Befehlsinformation BI zugeordnete Steuerinformation CI an die Befehls-Verwaltungsmittel 28 ab, worauf nachfolgend noch näher eingegangen werden soll. Mit den Steuerinformationen CI kann ein Aktivieren eines Betriebszustandes einer Verarbeitungseinheit 23, 24 bzw. 25 ausgelöst werden.
  • Ein in dem Personalcomputer 1 unter Nutzung der Spracherkennungseinrichtung 2 ablaufender Programmablauf der zum Erzeugen und Speichern eines an einen Betriebszustand einer in ihren Aktivzustand gesteuerten Verarbeitungseinheit 23, 24, 25 angepaßten, also diesem Betriebszustand zugeordneten Befehlslexikons abgearbeitet wird, wird nachfolgend anhand eines in 4 dargestellten Flußdiagramms 38 beschrieben.
  • Der Programmablauf beginnt bei einem Block 39, wenn die Spracherkennungseinrichtung 2 zur Eingabe von Sprachinformationen SI in dem Personalcomputer 1 aktiviert wird. Bei einem nachfolgenden Block 40 wird von den Erkennmitteln 35 eine Anmeldeinformation AI an die Bearbeitungsfenster-Verwaltungsmittel 26 abgegeben. Die Anmeldeinformation AI enthält eine Information darüber, welche von den in den Bearbeitungsfenster-Verwaltungsmitteln 26 auftretenden Informationen während der weiteren Verarbeitung an die Erkennmittel 35 übermittelt werden sollen. Insbesondere enthält die An meldeinformation AI eine Information darüber, daß eine in den Bearbeitungsfenster-Verarbeitungsmitteln 26 auftretende Bearbeitungsfenster-Information WI während des weiteren Prozesses immer an die Erkennmittel 35 weitergeleitet werden soll.
  • In den Bearbeitungsfenster-Verwaltungsmitteln 26 ist die Bearbeitungsfenstertabelle 29 gespeichert, die in 2 dargestellt ist. In einer Spalte AP der Bearbeitungsfenstertabelle 29 sind Programme angeführt, die in den Verarbeitungseinheiten 23, 24 und 25, denen Bearbeitungsfenster Wn zugeordnet sind, abgearbeitet werden können. Die erste Verarbeitungseinheit 23 ist mit Hilfe des Programms „Excel for Windows®" gebildet, dem in einer Spalte Wn der Bearbeitungsfenstertabelle 29 ein erstes Bearbeitungsfenster W1 zugeordnet ist. Die zweite Verarbeitungseinheit 24 ist mit Hilfe des Programms „Internet Explorer®" gebildet, dem in der Spalte Wn der Bearbeitungsfenstertabelle 29 ein zweites Bearbeitungsfenster W2 zugeordnet ist. Die dritte Verarbeitungseinheit 25 ist mit Hilfe eines Programms „Word for Windows®" gebildet, dem in der Spalte Wn der Bearbeitungsfenstertabelle 29 ein drittes Bearbeitungsfenster W3 und ein viertes Bearbeitungsfenster W4 zugeordnet sind. Es sei angenommen, daß die dritte Verarbeitungseinheit 25 in ihren Aktivzustand gesteuert ist. Das vierte Bearbeitungsfenster W4 ist in der Bearbeitungsfenstertabelle 29 in einer Spalte AK mit Hilfe eines Pfeiles als aktives Bearbeitungsfenster für eine Texteingabe in dem Texteingabemodus oder für eine Befehlseingabe in dem Befehlseingabemodus gekennzeichnet. Da das vierte Bearbeitungsfenster W4 ein Entscheidungs-Bearbeitungsfenster ist, ist nur eine Befehlseingabe in dem Befehlseingabemodus möglich. In dem Aktivzustand der dritten Verarbeitungseinheit 25 wird von dem Benutzer des Personalcomputers 1 eine Eingabe eines Befehls erwartet, ob eine bestimmte Verarbeitung durchgeführt werden soll, was durch Aktivieren der ersten Schaltfläche 31 mit der Textinformation „OK" erfolgen kann. Eine solche bestimmte Verarbeitung kann beispielsweise das Laden eines Dokumentes in den Arbeitsspeicher des Personalcomputers 1 zur weiteren Bearbeitung des Textes dieses Dokumentes sein. Als Befehlseingabe ist auch das Aktivieren der zweiten Schaltfläche 32 mit der Textinformation „CANCEL" möglich, wodurch die bestimmte Verarbeitung abgebrochen wird. Auch ist als Befehlseingabe das Aktivieren der dritten Schaltfläche 33 mit der Textinformation „BACK" möglich, wodurch die bestimmte Verarbeitung nicht durchgeführt wird und in einen vorhergehenden Betriebszustand der dritten Verarbeitungseinheit 25 zurückgekehrt wird.
  • Bei einem auf den Block 40 folgenden Block 41 wird mit den Erkennmitteln 35 geprüft, ob eine Bearbeitungsfenster-Information WI von den Bearbeitungsfenster- Verwaltungsmitteln 26 abgegeben wurde. Solange dies nicht der Fall ist, verbleibt der Programmablauf bei dem Block 41. Die Bearbeitungsfenster-Verwaltungsmittel 26 geben beim Auftreten einer Anmeldeinformation AI und im hier beschriebenen Fall bei einem Umsteuern der in ihren Aktivzustand gesteuerten dritten Verarbeitungseinheit 25 von einem Betriebszustand zu einem anderen Betriebszustand eine Bearbeitungsfenster-Information WI ab. Es sei erwähnt, daß die Bearbeitungsfenster-Verwaltungsmittel 26 auch dann eine Bearbeitungsfenster-Information WI abgeben, wenn eine der beiden anderen Verarbeitungseinheiten 23 oder 24 in ihren Aktivzustand gesteuert wird. Beim Auftreten einer Bearbeitungsfenster-Information WI wird der Programmablauf bei einem Block 42 fortgesetzt.
  • Bei dem Block 42 wird die Bearbeitungsfenster-Information WI des in seinen Bearbeitungszustand gesteuerten und folglich aktiven vierten Bearbeitungsfensters W4 von den Erkennmitteln 35 an die Ermittlungsmittel 36 abgegeben. Die Ermittlungsmittel 36 geben beim Auftreten einer Bearbeitungsfenster-Information WI eine Abfrageinformation GI(Wn) bezüglich des jeweils aktiven Bearbeitungsfensters Wn, also im vorliegenden Fall eine Abfrageinformation GI(W4) des aktiven vierten Bearbeitungsfensters W4, an die Schaltflächen-Verwaltungsmittel 27 ab. In den Schaltflächen-Verwaltungsmitteln 27 ist die Schaltflächentabelle 30 gespeichert, die in 3 dargestellt ist. In einer Spalte Wn der Schaltflächentabelle 30 sind die von den Schaltflächen-Verwaltungsmitteln 27 verwalteten Bearbeitungsfenster W1, W2, W3 und W4 der mit der Windows-Verarbeitungseinheit 22 zusammenwirkenden Verarbeitungseinheiten 23, 24 und 25 angeführt. In einer Spalte TI(CI) der Schaltflächentabelle 30 sind zu den Bearbeitungsfenstern W1, W2, W3 und W4 Textinformationen TI(CI) angegeben, die Schaltflächen, welche auch als Controlls bekannt sind, und anderen Elementen der Bearbeitungsfenster W1, W2, W3 und W4, wie beispielsweise einer Menüleiste oder einem sogenannten Pulldown-Menü, zugeordnet sind. Jeder Textinformation TI(CI) ist in der Schaltflächentabelle 30 einer Steuerinformation CI zugeordnet, die bei einer Aktivierung einer Schaltfläche durch den Benutzer an die dem betreffenden Bearbeitungsfenster Wn zugeordnete Verarbeitungseinheit abgegeben wird und zur Abarbeitung des Befehls der aktivierten Schaltfläche führt. Wie aus der Schaltflächentabelle 30 ersichtlich ist, ist der ersten Schaltfläche 31 mit der Textinformation „OK" eine Steuerinformation „30" zugeordnet. Wenn ein Benutzer des Personalcomputers 1 beispielsweise eine zur Aktivierung der ersten Schaltfläche 31 geeignete Taste der Tastatur 6 betätigt, dann wird die Steuerinformation „30" von den Befehls-Verwaltungsmitteln 28 an die dritte Verarbeitungseinheit 25 zum Verändern des Betriebszustandes in der dritten Verarbeitungseinheit 25 abgegeben.
  • Bei einem auf den Block 42 folgenden Block 43 werden von den Schaltflächen-Verwaltungsmitteln 27 beim Auftreten der Abfrageinformation GI(W4) die Textinformationen TI(CI) und die zugeordneten Steuerinformationen CI des vierten Bearbeitungsfensters W4 aus der Schaltflächentabelle 30 ermittelt und an die Ermittlungsmittel 36 abgegeben. Die an die Ermittlungsmittel 36 abgegebenen und zum Aktivieren eines weiteren Betriebszustandes der dritten Verarbeitungseinheit 25 geeigneten ermittelten Textinformationen TI(CI) und die zugeordneten Steuerinformationen CI werden in den Ermittlungsmitteln 36 gespeichert und die ermittelten geeigneten Textinformationen TI(CI) werden an die Zuordnungsmittel 37 abgegeben. Somit werden in diesem Fall die Textinformationen „OK", „CANCEL" und „BACK" an die Zuordnungsmittel 37 abgegeben.
  • Bei einem auf den Block 43 folgenden Block 44 werden den ermittelten geeigneten Textinformationen TI(CI) Kenninformationen PI, also Phonemfolgen, zugeordnet. In einem ersten Schritt wird geprüft, ob eine ermittelte geeignete Textinformation TI(CI) bereits in dem Textlexikonspeicher 18 gespeichert ist. Wenn eine solche Textinformation TI(CI) in dem Textlexikonspeicher 18 bereits gespeichert ist und daher gefunden wird, dann wird die in dem Textlexikonspeicher 18 der Textinformation TI zugeordnete, eine Phonemfolge repräsentierende Kenninformation PI aus dem Textlexikonspeicher 18 ausgelesen und der gefundenen Textinformation TI(CI) zugeordnet. Wenn eine solche Textinformation TI(CI) in dem Textlexikonspeicher 18 nicht gefunden wird, dann wird mittels der Zuordnungsmittel 37 selber eine Kenninformation PI, die eine Phonemfolge repräsentiert, erzeugt und der nicht gefundenen Textinformation TI(CI) zugeordnet, wie dies bereits vorstehend erläutert wurde.
  • Bei einem auf den Block 44 folgenden Block 45 werden die ermittelten geeigneten Textinformationen TI(CI) und die diesen Textinformationen TI(CI) bei dem Block 44 zugeordneten Kenninformationen PI in dem Befehlswortschatzspeicher 19 und damit in dem Befehlslexikonspeicher 17 gespeichert. Auf diese Weise wird das mit den Erzeugungsmitteln 34 im hier beschriebenen Fall einzig und allein nur für den aktivierten Betriebszustand der dritten Verarbeitungseinheit 25 erzeugte Befehlslexikon in dem Befehlswortschatzspeicher 19 gespeichert, wodurch der Inhalt des Befehlslexikonspeichers 17 an den aktivierten Betriebszustand der dritten Verarbeitungseinheit 25 angepaßt wird. Nach der Abarbeitung des Blocks 45 wird der Programmablauf bei dem Block 41 fortgesetzt.
  • Gemäß dem beschriebenen erfindungsgemäßen Verfahren wird mit Hilfe einer erfindungsgemäßen Spracherkennungseinrichtung 2 ein an den aktivierten Betriebszustand einer in ihren Aktivzustand gesteuerten Verarbeitungseinheit angepaßtes Befehlslexikon jeweils unmittelbar nach dem Auftreten eines Betriebszustandes dieser Verarbeitungseinheit automatisch erzeugt. Ein solches angepaßtes Befehlslexikon wird vorteilhafterweise auch bei einem Wechsel von einem Betriebszustand einer in ihrem Aktivzustand gewesenen Verarbeitungseinheit zu einem Betriebszustand einer anderen in ihren Aktivzustand gebrachten Verarbeitungseinheit automatisch erzeugt. Hierdurch ist der in dem Befehlswortschatzspeicher gespeicherte Befehlswortschatz an das jeweils aktive Bearbeitungsfenster Wn angepaßt, weshalb bei einem nachfolgenden Spracherkennungsvorgang zum Erkennen einer als Sprachinformation SI eingegebenen Befehlsinformation BI in dem Befehlseingabemodus eine besonders hohe Erkennungsrate erzielt wird.
  • Ein in dem Personalcomputer 1 unter Nutzung der Spracherkennungseinrichtung 2 ablaufender Programmablauf zur Durchführung eines Spracherkennungsvorganges in dem Befehlseingabemodus wird nachfolgend anhand eines in 5 dargestellten Flußdiagramms 46 beschrieben.
  • Der Programmablauf beginnt bei einem Block 47, wenn durch Betätigen der Taste 13 durch einen Sprecher eine Befehlseingabemodus-Aktivierungsinformation CMI in der Spracherkennungseinrichtung 2 auftritt, wodurch der Befehlseingabemodus aktiviert wird. Bei einem auf den Block 47 folgenden Block 48 wird in der Spracherkennungsstufe 11 geprüft, ob bereits eine Sprachinformation SI aufgetreten ist und in den Speichermitteln 9 gespeichert wurde. Solange dies nicht der Fall ist, verbleibt der Programmablauf bei dem Block 48. Wenn hingegen eine Sprachinformation SI aufgetreten ist und in den Speichermitteln 9 gespeichert wurde, dann wird der Programmablauf bei einem Block 49 fortgesetzt. Bei dem Block 49 wird mit der Spracherkennungsstufe 11 einer aus den Speichermitteln 9 ausgelesenen Sprachinformation SI unter Verwendung von in dem Referenzenspeicher 16 gespeicherten Referenzinformationen RI mindestens eine Phonemfolge zugeordnet. Diese mindestens eine zugeordnete Phonemfolge wird mit Phonemfolgen verglichen, die in dem – in dem Befehlseingabemodus mit der Spracherkennungsstufe 11 verbundenen – Befehlslexikonspeicher 17 in Form von Kenninformationen PI gespeichert sind. Bei einer Übereinstimmung einer anhand der Sprachinformation SI ermittelten Phonemfolge mit einer in dem Befehlslexikonspeicher 17 gespeicherten Phonemfolge wird die der gespeicherten Phonemfolge zugeordnete und ebenso in dem Befehlslexikonspeicher 17 gespeicherte Text information mit Hilfe der Spracherkennungsstufe 11 aus dem Befehlslexikonspeicher 17 als erkannte Textinformation ausgelesen. Eine solche erkannte Textinformation bildet eine Befehlsinformation BI, die in dem Befehlseingabemodus von der Spracherkennungsstufe 11 über die weitere Verbindung 11B an die Ermittlungsmittel 36 abgegeben wird.
  • Bei einem Block 50 vergleichen die Ermittlungsmittel 36 die erkannte Befehlsinformation BI mit den in den Ermittlungsmitteln 36 gespeicherten Textinformationen. Hierbei wird die ermittelte Befehlsinformation BI mit allen in den Ermittlungsmitteln 36 gespeicherten Textinformationen verglichen, also sowohl mit den ermittelten geeigneten Textinformationen TI(CI), die an dem aktiven vierten Bearbeitungsfenster W4 angezeigt wurden, als auch mit den bei einer Initialisierungsroutine in den Ermittlungsmitteln 36 gespeicherten Textinformationen TI. Wenn eine Übereinstimmung der erkannten Befehlsinformation BI mit einer in den Ermittlungsmitteln 36 gespeicherten Textinformation festgestellt wurde, dann wird der Programmablauf bei einem Block 51 fortgesetzt.
  • Bei dem Block 51 wird die der gespeicherten Textinformation zugeordnete Steuerinformation CI von den Ermittlungsmitteln 36 an die Befehls-Verwaltungsmittel 28 zur Abarbeitung der Steuerinformation CI abgegeben. Die Befehls-Verwaltungsmittel 28 geben die Steuerinformation CI an die in ihren Aktivzustand gesteuerte dritte Verarbeitungseinheit 25 ab, um die dritte Verarbeitungseinheit 25 von einem Betriebszustand zu einem anderen Betriebszustand umzusteuern bzw. umzuschalten. Der Programmablauf wird nach dem Block 51 bei dem Block 48 fortgesetzt.
  • Wenn ein Sprecher die Taste 13 betätigt und das Wort „OK" in das Mikrofon 5 spricht, dann vergleicht die Spracherkennungsstufe 11 die von ihr zu dieser Sprachinformation SI erzeugte Phonemfolge mit Phonemfolgen , die in dem Befehlswortschatzspeicher 19 und dem Basiswortschatzspeicher 20, also in dem Befehlslexikonspeicher 17, in Form von Kenninformationen PI gespeichert sind. In dem Befehlswortschatzspeicher 19 sind die Phonemfolgen zu den Befehlen „OK", „CANCEL" und „BACK" gespeichert. Durch die nur sehr geringe Anzahl von in dem Befehlslexikonspeicher 17 gespeicherten, von der Spracherkennungsstufe 11 erkennbaren Befehlsinformationen BI ist die Erkennungsrate sehr hoch, weshalb die Spracherkennungsstufe 11 die Phonemfolge zu dem Wort „OK" als mit der ermittelten Phonemfolge übereinstimmend sehr rasch und sicher erkennt. Die dieser Phonemfolge zugeordnete Textinformation „OK" wird von der Spracherkennungsstufe 11 an die Ermittlungsmittel 36 abgegeben. Ein Vergleich in den Ermittlungsmitteln 36 ergibt, daß die Befehlsinformation BI entsprechend der Textinformation „OK" mit der in den Ermittlungsmitteln 36 gespeicherten Textinformation TI(CI) der ersten Schaltfläche 31 des aktiven vierten Bearbeitungsfensters W4 übereinstimmt. Die der Textinformation TI(CI) zugeordnete Steuerinformation „30" wird daraufhin von den Ermittlungsmitteln 36 an die Befehls-Verwaltungsmittel 28 zur Abarbeitung der Steuerinformation „30" abgegeben. Die Befehls-Verwaltungsmittel 28 geben die Steuerinformation „30" an die dritte Verarbeitungseinheit 25 ab, in der der durch die Steuerinformation „30" repräsentierte Befehl „OK" ausgeführt wird. Hierbei macht es für die dritte Verarbeitungseinheit 25 keinen Unterschied, ob das Zuführen der Steuerinformation „30" zu der dritten Verarbeitungseinheit 25 durch ein Betätigen der ersten Schaltfläche 31, durch ein Betätigen mindestens einer Taste der Tastatur 6 oder durch eine Spracheingabe durch einen Sprecher bewirkt wurde.
  • Hierdurch wird vorteilhafterweise erreicht, daß die Spracherkennungseinrichtung 2 eine Steuerinformation CI als Befehlsinformation BI zur Steuerung einer Verarbeitungseinheit an diese Verarbeitungseinheit abgibt, welche Steuerinformation in der Verarbeitungseinheit unmittelbar zur Ausführung des von einem Sprecher gesprochenen Befehls führt. Daher ist es nicht erforderlich, eine Verarbeitungseinheit zum Zusammenwirken mit einer erfindungsgemäßen Spracherkennungseinrichtung 2 durch Vorsehen von Sprachbefehlsverarbeitungsmitteln vorzubereiten, wie dies bei Verarbeitungseinheiten zum Zusammenwirken mit bekannten Spracherkennungseinrichtungen in vielen Fällen erforderlich ist. Dies ermöglicht den Einsatz einer erfindungsgemäßen Spracherkennungseinrichtung 2 bei beliebigen Windows-Verarbeitungseinheiten.
  • Die erfindungsgemäße Spracherkennungseinrichtung 2 ist vorteilhafterweise zum Zusammenwirken mit einer Vielzahl von Verarbeitungseinheiten 23, 24 und 25 ausgebildet, wobei mit den Erkennmitteln 35 jeweils das aktive Bearbeitungsfenster Wn einer in ihren Aktivzustand gesteuerten Verarbeitungseinheit 23, 24 bzw. 25 ermittelt wird und eine als Sprachinformation SI eingegebene Befehlsinformation BI nur für eine in ihren Aktivzustand gesteuerte Verarbeitungseinheit 23, 24 bzw. 25 wirksam wird.
  • Die Erzeugungsmittel 34 einer erfindungsgemäßen Spracherkennungseinrichtung 2 können besonders einfach aufgebaut sein, wie dies in 1 dargestellt ist, wenn sie zum Zusammenwirken mit einer Windows-Verarbeitungseinheit 22 ausgebildet sind, die zum Beispiel mit Hilfe des Programms Windows95® realisiert sein kann. Dies deshalb, weil das Programm Windows95® die für die Erzeugung eines Befehlslexikons erforderliche Bearbeitungsfenster-Information WI sowie Textinformationen TI(CI) und zugeordnete Steuerinformationen CI des aktiven Bearbeitungsfensters Wn zur Verfügung stellt.
  • Gemäß einem zweiten Ausführungsbeispiel der Erfindung ist eine Spracherkennungseinrichtung zum Steuern einer durch einen sogenannten Internet-Browser gebildeten Verarbeitungseinheit ausgebildet. Hierbei weist die Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel den gleichen Aufbau auf, wie die Spracherkennungseinrichtung gemäß dem ersten, in 1 dargestellten Ausführungsbeispiel der Erfindung, wobei aber ein die Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel und den Internet-Browser enthaltender Personalcomputer mit dem Computernetz Internet verbunden ist.
  • Der Internet-Browser wird zum Ermitteln von in – mit dem Internet verbundenen – Speichereinrichtungen, sogenannten Servern, gespeicherten Informationen, sogenannten Internet-Homepages, verwendet. Eine Internet-Homepage enthält Textinformationen und Grafikinformationen und gegebenenfalls auch Videoinformationen. Der Internet-Browser ist zum Ermitteln einer Internet-Homepage ausgebildet, die durch eine bestimmte Internet-Adresse – eine sogenannte URL – gekennzeichnet ist. Der Internet-Browser ist bei dem zweiten Ausführungsbeispiel der Erfindung mit Hilfe des bekannten Windows-Programms „Microsoft Internet Explorer®" realisiert. Eine Vielzahl weiterer zur Realisierung eines Internet-Browsers geeigneter Programme, wie beispielsweise „Netscape®", sind ebenfalls bekannt.
  • Eine Textinformation einer Internet-Homepage kann eine Befehlsinformation bilden, wenn der Textinformation eine Internet-Adresse einer weiteren Internet-Homepage zugeordnet ist. Eine solche Textinformation kann in einer Internet-Homepage, wenn sie auf einem mit dem Personalcomputer verbundenen Monitor wiedergegeben wird, in einer bestimmten An – beispielsweise unterstrichen – dargestellt sein, um den Benutzer darauf aufmerksam zu machen, daß durch Aktivieren dieser Textinformation eine weitere Internet-Homepage von dem Internet-Browser ermittelt werden kann. Eine einer Textinformation zugeordnete Internet-Adresse bildet hierbei eine Steuerinformation, die -wenn sie an den Internet-Browser abgegeben wird – zum Ermitteln der dieser Internet-Adresse zugeordneten Internet-Homepage durch den Internet-Browser führt und hierbei den Bearbeitungszustand des Internet-Browsers verändert.
  • Die Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel der Erfindung weist Ermittlungsmittel auf, die nach dem Ermitteln einer Internet nomepage mir dem Internet-Browser in der Internet-Homepage enthaltene, Befehlsinformationen bildende Textinformationen ermittelt. Da der Internet-Browser mit Hilfe des Windows-Programms „Microsoft Internet Explorer®" gebildet ist, sind die Ermittlungsmittel der Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel und auch die Ermittlungsmittel der Spracherkennungseinrichtung gemäß dem ersten Ausführungsbeispiel zum Ermitteln der Befehlsinformationen einer Windows-Verarbeitungseinheit ausgebildet.
  • Die Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel weist weiterhin Zuordungsmittel auf, die den Zuordnungsmitteln der Sprachererkennungsmittel gemäß dem ersten Ausführungsbeispiel entsprechen, welche in der Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel Zuordungsinformationen zu den je eine Befehlsinformation bildenden Textinformationen ermitteln oder erzeugen, wodurch die Spracherkennungseinrichtung gemäß dem zweiten Ausführungsbeispiel zum Erzeugen eines an eine von einem Internet-Browser ermittelte Internet-Homepage angepaßten Befehlslexikons ausgebildet ist.
  • Die Ermittlungsmittel sind weiterhin zum Ermitteln einer Internet-Adresse ausgebildet, die in einer zuletzt vor dem Internet-Browser ermittelten Internet-Homepage einer eine Befehlsinformation bildenden Textinformation zugeordnet ist. Weiterhin sind die Ermittlungsmittel auch noch zum Vergleichen einer von Spracherkennungsmitteln der Spracherkennungseinrichtung einer Sprachinformation entsprechend dem ersten Ausführungsbeispiel der Erfindung zugeordneten, einen auszuführenden Befehl repräsentierenden Textinformation mit von den Ermitaungsmitteln ermittelten Textformationen und bei einem positiven Vergleichsergebnis zum Abgeben einer der einen auszuführenden Befehl repräsentierenden Textinformation zugeordneten Internet-Adresse – welche Internet-Adresse zum Ermitteln einer der Internet-Adresse zugeordneten Internet-Homepage mit dem Internet-Browser verwendet wird – an den Internet-Browser ausgebildet.
  • Hierdurch werden die vorstehend anhand des ersten Ausführungsbeispiels erläuterten Vorteile auch bei der Steuerung eines Internet-Browsers durch von einem Sprecher gesprochene Sprachbefehle erhalten.
  • Es sei erwähnt, daß eine erfindungsgemäße Spracherkennungseinrichtung auch zum Steuern einer Verarbeitungseinheit ausgebildet sein kann, die nicht zum Zusammenwirken mit einer Windows-Verarbeitungseinheit ausgebildet ist. Hierbei sei auf Verarbeitungseinheiten verwiesen, die mit einem Unix-Betriebssystem oder einem DOS-Betriebssystem zusammenwirken.
  • Es sei weiterhin erwähnt, daü ermittelte geeignete Textinformationen TI(CI) nicht nur von einer sogenannten Menüleiste oder einem sogenannten Pulldown-Menü, sondern auch von anderen ähnlichen Befehlsanzeigen ermittelt werden können.
  • Text in der Zeichnung
  • 2
    • Excel for Windows®
    • Internet Explorer
    • Word for Windows®
    • Entscheidungsfenster (Word for Windows®)
  • 3
    • FORMAT (Format)
    • PASTE (einfügen)
    • VIEW (Ansicht)
    • HOME (Startseite)
    • REFRESH (aktualisieren)
    • FORWARD (vorwärts)
    • HELP (Hilfe)
    • OK (ok)
    • CANCEL (abbrechen)
    • BACK (zurück)
  • 4, 5
    • 39, 47 Start

Claims (15)

  1. Produkt (1) mit mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit (23, 24, 25), bei der mindestens ein Betriebszustand aktivierbar ist, und mit einer Spracherkennungseinrichtung (2) zum Steuern mindestens einer Verarbeitungseinheit (23, 24, 25) bezüglich ihres mindestens einen Betriebszustandes unter Verwendung eines inhaltsmäßig von mindestens einem aktivierten Betriebszustand mindestens einer in ihrem Aktivzustand befindlichen Verarbeitungseinheit (23, 24, 25) abhängigen, Befehle umfassenden Befehlslexikons, welche Spracherkennungseinrichtung einen Befehlslexikonspeicher (17) enthält, in dem Befehle des Befehlslexikons in Form von Befehlsinformationen (TI(CI)) und diesen Befehlsinformationen (TI(CI)) zugeordneten Kenninformationen (PI) gespeichert werden können, und Spracherkennungsmittel (10) enthält, denen mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentierende Sprachinformation (SI) zugeführt werden kann und die zum Ermitteln einer einer solchen Sprachinformation (SI) zuzuordnenden Befehlsinformation (BI) unter Verwendung von in dem Befehlslexikonspeicher (17) gespeicherten Kenninformationen (PI) eingerichtet sind und welche Spracherkennungsmittel (10) zum Übertragen einer ermittelten Befehlsinformation (BI) an eine Verarbeitungseinheit (23, 24, 25) ausgebildet sind, wobei mit einer an diese Verarbeitungseinheit (23, 24, 25) abgegebenen ermittelten Befehlsinformation (BI) ein dem gesprochenen Befehl entsprechender Betriebszustand dieser Verarbeitungseinheit aktiviert werden kann, dadurch gekennzeichnet, daß Erzeugungsmittel (34) vorgesehen sind, die – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) – zum Erzeugen eines nur diesem einen aktivierten Betriebszustand zugeordneten Befehlslexikons ausgebildet sind.
  2. Produkt (1) nach Anspruch 1, dadurch gekennzeichnet, daß Ermittlungsmittel (36) vorgesehen sind, die einen Teil der Erzeugungsmittel (34) bilden und die – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) – zum Ermitteln von – zum Aktivieren mindestens eines weiteren Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) – geeigneten Befehlsinformationen (TI(CI)) ausgebildet sind, und daß Zuordnungsmittel (37) vorgesehen sind, die einen Teil der Erzeugungsmittel (34) bilden und denen die mit den Ermittlungsmitteln (36) ermittelten geeigneten Befehlsinformationen (TI(CI)) zugeführt werden können und die zum Zuordnen von Kenninformationen (PI) zu den ermittelten geeigneten Befehlsinformationen (TI(CI)) ausgebildet sind, wobei die Kenninformationen entweder aus einem Speicher (18) auslesbar oder mit Hilfe der Zuordnungsmittel (37) erzeugbar sind, und die weiterhin zum Speichern der ermittelten geeigneten Befehlsinformationen (TI(CI)) und der Kenninformationen (PI) in dem Befehlslexikonspeicher (17) und hierdurch zum Erzeugen eines nur diesem einen aktivierten Betriebszustand einer Verarbeitungseinheit (23, 24, 25) zugeordneten Befehlslexikons ausgebildet sind.
  3. Produkt (1) nach Anspruch 2, dadurch gekennzeichnet, daß die Ermittlungsmittel (36) zum Ermitteln von Steuerinformationen (CI) ausgebildet sind, die den ermittelten geeigneten Befehlsinformationen (TI(CI)) in einer Verarbeitungseinheit (23, 24, 25) zugeordnet sind und mit denen ein Betriebszustand einer Verarbeitungseinheit aktiviert werden kann, und daß die Ermittlungsmittel (36) zum Vergleichen einer mit Hilfe der Spracherkennungsmittel (10) einer einen Befehl repräsentierenden Sprachinformation SI zugeordneten Befehlsinformation mit den mit Hilfe der Ermittlungsmittel ermittelten geeigneten Befehlsinformationen (TI(CI)) und weiterhin, bei einem positiven Vergleichsergebnis, zum Abgeben einer der genannten zugeordneten Befehlsinformation (BI) zugeordneten Steuerinformation CI an eine Verarbeitungseinheit (23, 24, 25) ausgebildet sind.
  4. Produkt (1) nach Anspruch 2 mit einer Spracherkennungseinrichtung (2), die zum Zusammenwirken mit einer Verarbeitungseinheit (25), die zumindest zwei Bearbeitungsfenster (W3, W4) aufweist, von denen jedes zur Bearbeitung in einen Bearbeitungszustand steuerbar ist, und/oder zum Zusammenwirken mit zumindest zwei Verarbeitungseinheiten (23, 24) vorgesehen ist, die je zumindest ein Bearbeitungsfenster (W1, W2) aufweisen, von denen jedes zur Bearbeitung in einen Bearbeitungszustand steuerbar ist, wobei Erkennmittel (35) vorgesehen sind, die einen Teil der Erzeugungsmittel (34) bilden und die zum Erkennen eines in den Bearbeitungszustand gesteuerten Bearbeitungsfensters (W1, W2, W3, W4) einer durch die Spracherkennungseinrichtung (2) gesteuerten Verarbeitungseinheit (23, 24, 25) ausgebildet sind, und wobei die Ermittlungsmittel (36) Befehlsinformationen (TI(CI)) ermitteln , die zum Aktivieren eines Betriebszustandes jener Verarbeitungs einheit (23, 24, 25) geeignet sind, deren Bearbeitungsfenster (W1, W2, W3, W4) in den Bearbeitungszustand gesteuert ist.
  5. Produkt (1) nach Anspruch 2, dadurch gekennzeichnet, daß die Spracherkennungseinrichtung (2) zum Zusammenwirken mit einer Windows-Verarbeitungseinheit (22) ausgebildet ist und daß die Ermittlungsmittel (36) zum Ermitteln von von der Windows-Verarbeitungseinheit (22) verwalteten Befehlsinformationen (TI(CI)) und den Befehlsinformationen zugeordneten Steuerinformationen (CI) ausgebildet sind, welche Steuerinformationen sich auf Schaltflächen (31, 32, 33) eines in seinen Bearbeitungszustand gesteuerten Bearbeitungsfensters (W4) einer mit der Windows-Verarbeitungseinheit (25) zusammenwirkenden Verarbeitungseinheit (22) beziehen.
  6. Spracherkennungseinrichtung (2), die zum Zusammenwirken mit mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit (23, 24, 25) ausgebildet ist, bei der mindestens ein Betriebszustand aktivierbar ist, und mit einer Spracherkennungseinrichtung (2) zum Steuern mindestens einer Verarbeitungseinheit (23, 24, 25) bezüglich ihres mindestens einen Betriebszustandes unter Verwendung eines inhaltsmäßig von mindestens einem aktivierten Betriebszustand mindestens einer in ihrem Aktivzustand befindlichen Verarbeitungseinheit (23, 24, 25) abhängigen, Befehle umfassenden Befehlslexikons, welche Spracherkennungseinrichtung einen Befehlslexikonspeicher (17) enthält, in dem Befehle des Befehlslexikons in Form von Befehlsinformationen (TI(CI)) und diesen Befehlsinformationen(TI(CI)) zugeordneten Kenninformationen (PI) gespeichert werden können, und Spracherkennungsmittel (10) enthält, denen mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentierende Sprachinformation (SI) zugeführt werden kann und die zum Ermitteln einer einer solchen Sprachinformation (SI) zuzuordnenden Befehlsinformation (BI) unter Verwendung von in dem Befehlslexikonspeicher gespeicherten Kenninformationen PI eingerichtet sind und welche Spracherkennungsmittel zum Übertragen einer ermittelten Befehlsinformation BI an eine Verarbeitungseinheit (23, 24, 25) ausgebildet sind, wobei mit einer an diese Verarbeitungseinheit (23, 24, 25) abgegebenen ermittelten Befehlsinformation BI ein dem gesprochenen Befehl entsprechender Betriebszustand dieser Verarbeitungseinheit aktiviert werden kann, dadurch gekennzeichnet, daß Erzeugungsmittel (34) vorgesehen sind, die – nach einem Aktivieren eines Betriebszustan des einer Verarbeitungseinheit (23, 24, 25) – zum Erzeugen eines nur diesem einen aktivierten Betriebszustand zugeordneten Befehlslexikons ausgebildet sind.
  7. Spracherkennungseinrichtung (2) nach Anspruch 6, dadurch gekennzeichnet, daß Ermittlungsmittel vorgesehen sind, die einen Teil der Erzeugungsmittel (34) bilden und die – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) – zum Ermitteln von – zum Aktivieren mindestens eines weiteren Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) – geeigneten Befehlsinformationen (TI(CI)) ausgebildet sind, und daß Zuordnungsmittel (37) vorgesehen sind, die einen Teil der Erzeugungsmittel (34) bilden und denen die mit den Ermittlungsmitteln (36) ermittelten geeigneten Befehlsinformationen (TI(CI)) zugeführt werden können und die zum Zuordnen von Kenninformationen (PI) zu den ermittelten geeigneten Befehlsinformationen (TI(CI)) ausgebildet sind, wobei die Kenninformationen entweder aus einem Speicher (18) auslesbar oder mit Hilfe der Zuordnungsmittel (37) erzeugbar sind, und die weiterhin zum Speichern der ermittelten geeigneten Befehlsinformationen (TI(CI)) und der Kenninformationen (PI) in dem Befehlslexikonspeicher (17) und hierdurch zum Erzeugen eines nur diesem einen aktivierten Betriebszustand einer Verarbeitungseinheit (23, 24, 25) zugeordneten Befehlslexikons ausgebildet sind.
  8. Spracherkennungseinrichtung (2) nach Anspruch 7, dadurch gekennzeichnet, daß die Ermittlungsmittel zum Ermitteln von Steuerinformationen (CI) ausgebildet sind, die den ermittelten geeigneten Befehlsinformationen (TI(CI)) in einer Verarbeitungseinheit (23, 24, 25) zugeordnet sind und mit denen ein Betriebszustand einer Verarbeitungseinheit aktiviert werden kann, und daß die Ermittlungsmittel (36) zum Vergleichen einer mit Hilfe der Spracherkennungsmittel (10) einer einen Befehl repräsentierenden Sprachinformation SI zugeordneten Befehlsinformation mit den mit Hilfe der Ermittlungsmittel ermittelten geeigneten Befehlsinformationen (TI(CI)) und weiterhin, bei einem positiven Vergleichsergebnis, zum Abgeben einer der genannten zugeordneten Befehlsinformation BI zugeordneten Steuerinformation (CI) an eine Verarbeitungseinheit (23, 24, 25) ausgebildet sind.
  9. Spracherkennungseinrichtung (2) nach Anspruch 7, die die zum Zusammenwirken mit einer Verarbeitungseinheit (25), die zumindest zwei Bearbeitungsfenster (W3, W4) aufweist, von denen jedes zur Bearbeitung in einen Bearbeitungszustand steuer bar ist, und/oder zum Zusammenwirken mit zumindest zwei Verarbeitungseinheiten (23, 24) vorgesehen ist, die je zumindest ein Bearbeitungsfenster (W1, W2) aufweisen, von denen jedes zur Bearbeitung in einen Bearbeitungszustand steuerbar ist, wobei Erkennmittel (35) vorgesehen sind, die einen Teil der Erzeugungsmittel (34) bilden und die zum Erkennen eines in den Bearbeitungszustand gesteuerten Bearbeitungsfensters (W1, W2, W3, W4) einer durch die Spracherkennungseinrichtung (2) gesteuerten Verarbeitungseinheit (23, 24, 25) ausgebildet sind, und wobei die Ermittlungsmittel (36) Befehlsinformationen (TI(CI)) ermitteln, die zum Aktivieren eines Betriebszustandes jener Verarbeitungseinheit (23, 24, 25) geeignet sind, deren Bearbeitungsfenster (W1, W2, W3, W4) in den Bearbeitungszustand gesteuert ist.
  10. Spracherkennungseinrichtung (2) nach Anspruch 7, dadurch gekennzeichnet, daß die Spracherkennungseinrichtung zum Zusammenwirken mit einer Windows-Verarbeitungseinheit (22) ausgebildet ist und daß die Ermittlungsmittel (36) zum Ermitteln von von der Windows-Verarbeitungseinheit (22) verwalteten Befehlsinformationen (TI(CI)) und den Befehlsinformationen zugeordneten Steuerinformationen (CI) ausgebildet sind, welche Steuerinformationen sich auf Schaltflächen (31, 32, 33) eines in seinen Bearbeitungszustand gesteuerten Bearbeitungsfensters (W4) einer mit der Windows-Verarbeitungseinheit (25) zusammenwirkenden Verarbeitungseinheit (22) beziehen.
  11. Verfahren zum Erzeugen eines Befehlslexikons für eine Spracherkennungseinrichtung, welche Spracherkennungseinrichtung (2) zum Steuern mindestens einer in einen Aktivzustand steuerbaren Verarbeitungseinheit (23, 24, 25) – bei der mindestens ein Betriebszustand aktivierbar ist – bezüglich ihres mindestens einen Betriebszustandes unter Verwendung des Befehlslexikons ausgebildet ist, wobei das Befehlslexikon Befehle enthält, die in Form von Befehlsinformationen (TI(CI)) und den Befehlsinformationen zugeordneten Kenninformationen (PI) gespeichert werden können, und wobei die Befehlsinformationen (TI(CI)) und die zugeordneten Kenninformationen (PI) in einem Befehlslexikonspeicher (17) gespeichert werden und wobei mindestens eine von einem Sprecher gesprochene, einen Befehl repräsentierende Sprachinformation SI Spracherkennungsmitteln (10) zugeführt wird und wobei mit den Spracherkennungsmitteln (10) unter Verwendung der in dem Befehlslexikonspeicher (17) gespeicherten Kenninformationen PI für eine solche Sprachinformation SI eine Befehlsinformation (BI) ermittelt wird und wobei die ermittelte Befehls information (BI) einer Verarbeitungseinheit (23, 24, 25) zum Aktivieren des einem gesprochenen Befehl entsprechenden Betriebszustandes der Verarbeitungseinheit (23, 24, 25) zugeführt werden kann, dadurch gekennzeichnet, daß – nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) – mit Erzeugungsmitteln (34) ein nur diesem einen aktivierten Betriebszustand zugeordnetes Befehlslexikon erzeugt wird.
  12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß nach einem Aktivieren eines Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) mit Ermittlungsmitteln (36) der Erzeugungsmittel 34 geeignete Befehlsinformationen (TI(CI)) ermittelt werden, die zum Aktivieren mindestens eines weiteren Betriebszustandes einer Verarbeitungseinheit (23, 24, 25) geeignet sind, und daß den ermittelten geeigneten Befehlsinformationen (TI(CI)) mittels Zuordnungsmitteln 37 der Erzeugungsmittel (34) Kenninformationen (PI) zugeordnet werden, welche Kenninformationen entweder aus einem Speicher (18) ausgelesen oder mit den Zuordnungsmitteln (37) erzeugt werden, und daß die ermittelten geeigneten Befehlsinformationen (TI(CI)) und die zugeordneten Kenninformationen PI in dem Befehlslexikonspeicher (17) gespeichert werden und hierdurch ein nur diesem einen aktivierten Betriebszustand zugeordnetes Befehlslexikon erzeugt wird.
  13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß mit Hilfe der Ermittlungsmittel (36) Steuerinformationen (CI) ermittelt werden, die den ermittelten geeigneten Befehlsinformationen in einer Verarbeitungseinheit (23, 24, 25) zugeordnet sind und mit denen je ein Betriebszustand einer Verarbeitungseinheit (23, 24, 25) aktiviert werden kann, wenn sie an eine solche Verarbeitungseinheit (23, 24, 25) abgegeben werden, und daß eine einer Sprachinformation (SI), die einen Befehl repräsentiert, mit Hilfe der Spracherkennungsmittel (10) zugeordnete Befehlsinformation (BI) mit den in dem Befehlslexikonspeicher (17) gespeicherten Befehlsinformationen (TI(CI)) verglichen wird und daß bei einem positiven Vergleichsergebnis die der oben erwähnten zugeordneten Befehlsinformation BI zugeordnete Steuerinformation (CI) an eine Verarbeitungseinheit (23, 24, 25) abgegeben wird und ein Betriebszustand dieser Verarbeitungseinheit (23, 24, 25) entsprechend der oben erwähnten zugeordneten Befehlsinformation (BI) aktiviert wird.
  14. Verfahren nach Anspruch 12, wobei die Spracherkennungseinrichtung (2) mit einer Verarbeitungseinheit (25), die zumindest zwei Bearbeitungsfenster (W3, W4) aufweist, von denen jedes zur Bearbeitung in einen Bearbeitungszustand gesteuert wird, und/oder mit zumindest zwei Verarbeitungseinheiten (23, 24) zusammenwirkt, die je zumindest ein Bearbeitungsfenster (W1, W2) aufweisen, von denen jedes zur Bearbeitung in einen Bearbeitungszustand gesteuert wird, wobei ein in den Bearbeitungszustand gesteuertes Bearbeitungsfenster (W1, W2, W3, W4) einer zur Steuerung durch die Spracherkennungseinrichtung (2) vorgesehenen Verarbeitungseinheit (23, 24, 25) mit Hilfe von Erkennmitteln (35) der Erzeugungsmittel (34) erkannt wird und wobei die Befehlsinformationen (TI(CI)) ermittelt werden, die zum Aktivieren eines Betriebszustandes jener Verarbeitungseinheit (23, 24, 25) geeignet sind, deren Bearbeitungsfenster (W1, W2, W3, W4) als in seinen Bearbeitungszustand gesteuertes Bearbeitungsfenster (W1, W2, W3, W4) erkannt wurde.
  15. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß eine mit der Spracherkennungseinrichtung (2) zusammenwirkende Windows-Verarbeitungseinheit (22) verwendet wird und daß von der Windows-Verarbeitungseinheit (22) verwaltete Befehlsinformationen (TI(CI)) und letzteren zugeordnete Steuerinformationen (CI) von Schaltflächen (31, 32, 33) eines in seinen Bearbeitungszustand gesteuerten Bearbeitungsfensters (W1, W2, W3, W4) einer mit der Windows-Verarbeitungseinheit (22) zusammenwirkenden Verarbeitungseinheit (23, 24, 25) ermittelt werden.
DE69819690T 1997-12-30 1998-12-14 Spracherkennungsvorrichtung unter verwendung eines befehlslexikons Expired - Lifetime DE69819690T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP97890259 1997-12-30
EP97890259 1997-12-30
PCT/IB1998/002038 WO1999035640A2 (en) 1997-12-30 1998-12-14 Speech recognition device using a command lexicon

Publications (2)

Publication Number Publication Date
DE69819690D1 DE69819690D1 (de) 2003-12-18
DE69819690T2 true DE69819690T2 (de) 2004-08-12

Family

ID=8231130

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69819690T Expired - Lifetime DE69819690T2 (de) 1997-12-30 1998-12-14 Spracherkennungsvorrichtung unter verwendung eines befehlslexikons

Country Status (7)

Country Link
US (1) US6253176B1 (de)
EP (1) EP0962014B1 (de)
JP (1) JP4827274B2 (de)
KR (1) KR20000075828A (de)
AT (1) ATE254327T1 (de)
DE (1) DE69819690T2 (de)
WO (1) WO1999035640A2 (de)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4810044B2 (ja) 2000-01-27 2011-11-09 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 2つのスイッチオフ規準を持つ音声検出装置
EP1185976B1 (de) 2000-02-25 2006-08-16 Philips Electronics N.V. Vorrichtung zur spracherkennung mit referenztransformationsmitteln
GB2365189A (en) * 2000-07-26 2002-02-13 Canon Kk Voice-controlled machine
JP2002123283A (ja) * 2000-10-12 2002-04-26 Nissan Motor Co Ltd 音声認識操作装置
US20030069733A1 (en) * 2001-10-02 2003-04-10 Ryan Chang Voice control method utilizing a single-key pushbutton to control voice commands and a device thereof
US7184960B2 (en) * 2002-06-28 2007-02-27 Intel Corporation Speech recognition command via an intermediate mobile device
DE10337823A1 (de) * 2003-08-18 2005-03-17 Siemens Ag Sprachsteuerung von Audio- und Videogeräten
JP4377718B2 (ja) * 2004-02-27 2009-12-02 富士通株式会社 対話制御システム及び方法
KR100657059B1 (ko) * 2004-07-19 2006-12-13 삼성전자주식회사 음성인식구동방법
JP4282590B2 (ja) * 2004-11-29 2009-06-24 株式会社東芝 音声移動制御装置および音声移動制御方法
KR101073154B1 (ko) * 2005-01-07 2011-10-12 주식회사 현대오토넷 윈도우 환경에서의 음성인식을 이용한 사용자 인터페이스장치 및 그 제어 방법
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8219407B1 (en) 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
US9368107B2 (en) * 2011-04-20 2016-06-14 Nuance Communications, Inc. Permitting automated speech command discovery via manual event to command mapping
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
KR20220002750A (ko) 2011-12-07 2022-01-06 퀄컴 인코포레이티드 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
CN103247290A (zh) * 2012-02-14 2013-08-14 富泰华工业(深圳)有限公司 通信装置及其控制方法
KR101944414B1 (ko) * 2012-06-04 2019-01-31 삼성전자주식회사 음성 인식 서비스를 제공하기 위한 방법 및 그 전자 장치
WO2013188540A1 (en) * 2012-06-12 2013-12-19 Grant Street Group, Inc. Practical natural-language human-machine interfaces
WO2015144536A1 (en) * 2014-03-27 2015-10-01 Sony Corporation Electronic device and method for identifying input commands of a user
US10515632B2 (en) 2016-11-15 2019-12-24 At&T Intellectual Property I, L.P. Asynchronous virtual assistant
CN108022586B (zh) 2017-11-30 2019-10-18 百度在线网络技术(北京)有限公司 用于控制页面的方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63153597A (ja) * 1986-12-17 1988-06-25 日本電信電話株式会社 検索照合型認識システム
JPH03163623A (ja) * 1989-06-23 1991-07-15 Articulate Syst Inc 音声制御コンピュータ・インターフェース
US5386494A (en) * 1991-12-06 1995-01-31 Apple Computer, Inc. Method and apparatus for controlling a speech recognition function using a cursor control device
JP3286339B2 (ja) * 1992-03-25 2002-05-27 株式会社リコー ウインドウ画面制御装置
US5920837A (en) * 1992-11-13 1999-07-06 Dragon Systems, Inc. Word recognition system which stores two models for some words and allows selective deletion of one such model
JP3725566B2 (ja) * 1992-12-28 2005-12-14 株式会社東芝 音声認識インターフェース
US5632002A (en) * 1992-12-28 1997-05-20 Kabushiki Kaisha Toshiba Speech recognition interface system suitable for window systems and speech mail systems
US5890122A (en) * 1993-02-08 1999-03-30 Microsoft Corporation Voice-controlled computer simulateously displaying application menu and list of available commands
CA2115210C (en) * 1993-04-21 1997-09-23 Joseph C. Andreshak Interactive computer system recognizing spoken commands
JPH07219586A (ja) * 1994-01-31 1995-08-18 Canon Inc 情報処理方法及び装置
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
JP2924717B2 (ja) * 1995-06-12 1999-07-26 日本電気株式会社 プレゼンテーション装置
US5873064A (en) * 1996-11-08 1999-02-16 International Business Machines Corporation Multi-action voice macro method

Also Published As

Publication number Publication date
KR20000075828A (ko) 2000-12-26
EP0962014B1 (de) 2003-11-12
DE69819690D1 (de) 2003-12-18
JP4827274B2 (ja) 2011-11-30
US6253176B1 (en) 2001-06-26
ATE254327T1 (de) 2003-11-15
WO1999035640A3 (en) 1999-09-16
WO1999035640A2 (en) 1999-07-15
EP0962014A2 (de) 1999-12-08
JP2001515611A (ja) 2001-09-18

Similar Documents

Publication Publication Date Title
DE69819690T2 (de) Spracherkennungsvorrichtung unter verwendung eines befehlslexikons
DE69634239T2 (de) Erkennung kontinuierlich gesprochener Texte und Befehle
DE69728811T2 (de) Datenprozessor
DE4015905C2 (de) Sprachanalyseeinrichtung, -verfahren und -programm
DE60306701T2 (de) Verfahren und Vorrichtung zur Steuerung von Geräten, die mit einem Hauswerknetz verbunden sind
EP1964110B1 (de) Verfahren zur ansteuerung von zumindest einer ersten und zweiten hintergrundapplikation über ein universelles sprachdialogsystem
DE69722652T2 (de) System und verfahren zum ferngruppieren des inhalts eines historischen kellerspeichers
DE3317325C2 (de)
DE4440598C1 (de) Durch gesprochene Worte steuerbares Hypertext-Navigationssystem, Hypertext-Dokument für dieses Navigationssystem und Verfahren zur Erzeugung eines derartigen Dokuments
DE69628374T2 (de) Datenverwaltungssystem
DE2808577A1 (de) Elektronischer rechner mit synthetischer sprachanzeige
DE4109785C2 (de) Verfahren zur Aufbereitung von Wörterbuchdateien und zur Erstellung von Anwendungsprogrammen sowie System zur Durchführung dieses Verfahrens
DE60024727T2 (de) Analyse von heruntergeladenen Dokumenten für einen Browser mit Sprachsynthese-Fähigkeit
DE4027348C2 (de) Einheitliche Benutzeroberfläche
EP1168302B1 (de) Spracherkennungssytem mit einem aktiven Bereitschaftszustand
DE60201907T2 (de) Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen
EP1240775B1 (de) Kommunikationssystem und verfahren zum bereitstellen eines internet-zugangs über ein telefon
DE602004011041T2 (de) Hinzufügen von Fragezeichen zu elektronischen Nachrichten
WO2020126217A1 (de) Verfahren, anordnung und verwendung zum erzeugen einer antwortausgabe in reaktion auf eine spracheingabeinformation
WO1989003083A1 (en) Systems architecture for an acoustic man/machine dialogue system
EP0855075B1 (de) Verfahren und vorrichtung zur steuerung von braille-elementen eines braille-feldes
DE69928022T2 (de) Funktionstaste zur computer-databearbeitung
AT403220B (de) Datenverarbeitungssystem
DE102017103533A1 (de) Verfahren und Vorrichtung zur textbezogenen Vorschau von Inhalten von Audiodateien
EP0960378B1 (de) Verfahren zur generierung eines verbundes von in einer seitenauszeichnungssprache formatierten seitendateien

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: NUANCE COMMUNICATIONS AUSTRIA GMBH, WIEN, AT