EP0621531B1

EP0621531B1 - Interaktives Rechnersystem, das gesprochene Befehle erkennt

Info

Publication number: EP0621531B1
Application number: EP94105293A
Authority: EP
Inventors: Joseph Charles Andreshak; Gregg H. Daggett; John Karat; John Lucassen; Stephen Eric Levy; Robert Lawrence Mack
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1993-04-21
Filing date: 1994-04-06
Publication date: 1999-09-29
Anticipated expiration: 2014-04-06
Also published as: ATE185203T1; KR970006403B1; DE69420888T2; JP2856671B2; DE69420888D1; CA2115210C; CA2115210A1; US5664061A; EP0621531A1; JPH06348452A; CN1105464A; CN1086484C

Claims

Interaktives Rechnersystem, das folgendes umfasst:

einen Prozessor (10), der ein Zielrechnerprogramm ausführt, das eine Reihe von aktiven Programmzuständen hat, die über eine Folge von Zeiträumen auftreten, wobei das Zielrechnerprogramm Datensignale eines Bildes eines aktiven Zustands erzeugt, die ein Bild des aktiven Zustands für einen aktiven Zustand des Zielrechnerprogramms darstellen, der während eines jeden Zeitraums auftritt, wobei jedes Bild des aktiven Zustands ein oder mehrere Objekte enthält;

ein Mittel (12), um mindestens ein Bild des ersten aktiven Zustands für einen ersten aktiven Zustand anzuzeigen, der während eines ersten Zeitraums auftritt;

ein Mittel (26), um ein Objekt zu kennzeichnen, das in dem Bild des ersten aktiven Zustands angezeigt wird, und um von einem gekennzeichneten Objekt, das in dem Bild des ersten aktiven Zustands angezeigt wird, eine Liste von einem oder mehreren Befehlen des ersten aktiven Zustands zu erzeugen, die eine Funktion des ersten aktiven Zustands kennzeichnen, welche in dem ersten aktiven Zustand des Zielrechnerprogramms ausgeführt werden kann;

ein Mittel (28), um ein Systemvokabular von akustischen Befehlsmodellen zu speichern, wobei jedes akustische Befehlsmodell eine oder mehrere Reihen von akustischen Merkmalswerten darstellt, die eine Äußerung von einem oder mehreren Wörtern darstellen, welche zu dem akustischen Befehlsmodell gehören;

ein Mittel (30), um ein Vokabular von akustischen Befehlsmodellen eines ersten aktiven Zustands für den ersten aktiven Zustand zu kennzeichnen, wobei das Vokabular des ersten aktiven Zustands die akustischen Befehlsmodelle von dem Systemvokabular umfasst, das die Befehle des ersten aktiven Zustands darstellt, wobei sich das Vokabular des ersten aktiven Zustands in Abhängigkeit von sowohl der Kennung des Zielrechnerprogramms als auch der Datensignale des Bildes des aktiven Zustands dynamisch ändert, die einen aktiven Zustand des Zielrechnerprogramms kennzeichnen; und

eine Spracherkennungseinheit (32), um einen Wert von mindestens einem Merkmal einer Äußerung während eines jeden einer ersten Folge von aufeinanderfolgenden Zeitintervallen innerhalb des ersten Zeitraums zu messen, um eine erste Reihe von Merkmalssignalen zu erzeugen, wobei die Spracherkennungseinheit die erste Reihe der Merkmalssignale mit jedem der akustischen Befehlsmodelle in dem Vokabular des ersten aktiven Zustands vergleicht, um ein Übereinstimmungsergebnis für die Äußerung und jedes akustische Befehlsmodell zu erzeugen, und wobei die Spracherkennungseinheit ein Befehlssignal ausgibt, das dem Befehlsmodell von dem Vokabular des ersten aktiven Zustands entspricht, welches das beste Übereinstimmungsergebnis aufweist.
Interaktives Rechnersystem nach Anspruch 1, dadurch gekennzeichnet, dass:

das Vokabular des ersten aktiven Zustands wesentlich weniger als alle der akustischen Befehlsmodelle von dem Systemvokabular umfasst; und

die Spracherkennungseinheit die gemessenen Merkmalssignale für den ersten Zeitraum nicht mit einem akustischen Befehlsmodell vergleicht, das sich nicht im Vokabular des ersten aktiven Zustands befindet.
Interaktives Rechnersystem nach Anspruch 2, dadurch gekennzeichnet, dass:

das Anzeigemittel mindestens ein Bild eines zweiten aktiven Zustands, das sich von dem Bild des ersten aktiven Zustands unterscheidet, für einen zweiten aktiven Zustand anzeigt, der während eines zweiten Zeitraums auftritt, welcher sich von dem ersten Zeitraum unterscheidet;

das Mittel zur Kennzeichnung eines Objekts ein Objekt kennzeichnet, das in dem Bild des zweiten aktiven Zustands angezeigt wird, und von einem gekennzeichneten Objekt, das in dem Bild des zweiten aktiven Zustands angezeigt wird, einen Katalog von einem oder mehreren Befehlen des zweiten aktiven Zustands erzeugt, die eine Funktion des zweiten aktiven Zustands kennzeichnen, welche in dem zweiten aktiven Zustand des Zielrechnerprogramms ausgeführt werden kann;

das Mittel zur Kennzeichnung eines Vokabulars eines ersten aktiven Zustands ein Vokabular von akustischen Befehlsmodellen eines zweiten aktiven Zustands für den zweiten aktiven Zustand kennzeichnet, wobei das Vokabular des zweiten aktiven Zustands die akustischen Befehlsmodelle von dem Systemvokabular umfasst, das die Befehle des zweiten aktiven Zustands darstellt, wobei sich das Vokabular des zweiten aktiven Zustands mindestens teilweise von dem Vokabular des ersten aktiven Zustands unterscheidet; und

die Spracherkennungseinheit den Wert von mindestens einem Merkmal einer Äußerung während eines jeden einer zweiten Folge von Zeitintervallen innerhalb des zweiten Zeitraums misst, um eine zweite Reihe von Merkmalssignalen zu erzeugen, wobei die Spracherkennungseinheit die zweite Reihe der Merkmalssignale für den zweiten Zeitraum mit jedem der akustischen Befehlsmodelle in dem Vokabular des zweiten aktiven Zustands vergleicht, um das Übereinstimmungsergebnis für die Äußerung und jedes akustische Befehlsmodell zu erzeugen, und wobei die Spracherkennungseinheit das Befehlssignal ausgibt, das dem Befehlsmodell von dem Vokabular des zweiten aktiven Zustands entspricht, welches das beste Übereinstimmungsergebnis aufweist.
Interaktives Rechnersystem nach Anspruch 3, dadurch gekennzeichnet, dass bei dem Zielrechnerprogramm während eines jeden Zeitraums nur ein aktiver Zustand auftritt.
Interaktives Rechnersystem nach Anspruch 4, dadurch gekennzeichnet, dass das Zielrechnerprogramm ein Betriebssystemprogramm umfasst.
Interaktives Rechnersystem nach Anspruch 5, dadurch gekennzeichnet, dass das Zielrechnerprogramm ein Anwendungsprogramm und ein Betriebssystemprogramm umfasst.
Interaktives Rechnersystem nach Anspruch 6, dadurch gekennzeichnet, dass das Zielrechnerprogramm zwei oder mehr Anwendungsprogramme und ein Betriebssystemprogramm umfasst.
Interaktives Rechnersystem nach Anspruch 6, dadurch gekennzeichnet, dass mindestens einige Befehle für den aktiven Zustand Funktionen kennzeichnen, die an dem gekennzeichneten Objekt in dem Bild des aktiven Zustands für den aktiven Zustand ausgeführt werden können.
Interaktives Rechnersystem nach Anspruch 8, dadurch gekennzeichnet, dass das gekennzeichnete Objekt in einem Bild eines aktiven Zustands ein oder mehrere Zeichen, Wörter, Symbole, Schaltflächen, Schiebeleisten, Schiebefelder, Listenfenster, Menüs, Markierungsfelder, Behälter oder Notizbücher umfasst.
Interaktives Rechnersystem nach Anspruch 9, dadurch gekennzeichnet, dass die Spracherkennungseinheit zwei oder mehr Befehlssignale ausgibt, die den Befehlsmodellen von dem Vokabular des aktiven Zustands entsprechen, welche die besten Übereinstimmungsergebnisse für einen bestimmten Zeitraum aufweisen.
Interaktives Rechnersystem nach Anspruch 10, dadurch gekennzeichnet, dass das Vokabular von akustischen Befehlsmodellen des aktiven Zustands für jeden aktiven Zustand des Weiteren eine Gruppe von globalen akustischen Befehlsmodellen umfasst, die globale Befehle darstellen, welche Funktionen kennzeichnen, die in jedem aktiven Zustand des Zielrechnerprogramms ausgeführt werden können.
Interaktives Rechnersystem nach Anspruch 11, dadurch gekennzeichnet, dass das Anzeigemittel einen Bildschirm umfasst.
Interaktives Rechnersystem nach Anspruch 11, dadurch gekennzeichnet, dass das Anzeigemittel sowohl das Bild des aktiven Zustands für den aktiven Zustand, der während eines Zeitraums auftritt, als auch mindestens einen Teil von einem oder mehreren Bildern für Programmzustände, die während des Zeitraums nicht auftreten, anzeigt.
Verfahren zur Interaktion mit einem Rechner, das folgendes umfasst:

Ausführen eines Zielrechnerprogramms auf einem Prozessor, das eine Reihe von aktiven Programmzuständen hat, die über eine Folge von Zeiträumen auftreten, wobei das Zielrechnerprogramm Datensignale eines Bildes eines aktiven Zustands erzeugt, die ein Bild des aktiven Zustands für einen aktiven Zustand des Zielrechnerprogramms darstellen, der während eines jeden Zeitraums auftritt, wobei jedes Bild des aktiven Zustands ein oder mehrere Objekte enthält;

Anzeigen von mindestens einem Bild des ersten aktiven Zustands für einen ersten aktiven Zustand, der während eines ersten Zeitraums auftritt;

Kennzeichnen eines Objekts, das in dem Bild des ersten aktiven Zustands angezeigt wird, und Erzeugen einer Liste von einem oder mehreren Befehlen des ersten aktiven Zustands von einem gekennzeichneten Objekt, die eine Funktion des ersten aktiven Zustands kennzeichnen, welche in dem ersten aktiven Zustand des Zielrechnerprogramms ausgeführt werden kann;

Speichern eines Systemvokabulars von akustischen Befehlsmodellen, wobei jedes akustische Befehlsmodell eine oder mehrere Reihen von akustischen Merkmalswerten darstellt, die eine Äußerung von einem oder mehreren Wörtern darstellen, welche zu dem akustischen Befehlsmodell gehören;

Kennzeichnen eines Vokabulars von akustischen Befehlsmodellen des ersten aktiven Zustands für den ersten aktiven Zustand, wobei das Vokabular des ersten aktiven Zustands die akustischen Befehlsmodelle von dem Systemvokabular umfasst, das die Befehle des ersten aktiven Zustands darstellt, wobei sich das Vokabular des ersten aktiven Zustands in Abhängigkeit von sowohl der Kennung des Zielrechnerprogramms als auch der Datensignale des Bildes des aktiven Zustands dynamisch ändert, die einen aktiven Zustand des Zielrechnerprogramms kennzeichnen; und

Messen eines Werts von mindestens einem Merkmal einer Äußerung während eines jeden einer ersten Folge von Zeitintervallen innerhalb des ersten Zeitraums, um eine erste Reihe von Merkmalssignalen zu erzeugen;

Vergleichen der ersten Reihe der Merkmalssignale mit jedem der akustischen Befehlsmodelle in dem Vokabular des ersten aktiven Zustands, um ein Übereinstimmungsergebnis für die Äußerung und jedes akustische Befehlsmodell zu erzeugen; und

Ausgeben eines Befehlssignals, das dem Befehlsmodell von dem Vokabular des ersten aktiven Zustands entspricht, welches das beste Übereinstimmungsergebnis aufweist.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 14, dadurch gekennzeichnet, dass:

das Vokabular des ersten aktiven Zustands wesentlich weniger als alle der akustischen Befehlsmodelle von dem Systemvokabular umfasst; und

der Vergleichsschritt die gemessenen Merkmalssignale für den ersten Zeitraum nicht mit einem akustischen Befehlsmodell vergleicht, das sich nicht im Vokabular des ersten aktiven Zustands befindet.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 15, das des Weiteren die folgenden Schritte umfasst:

Anzeigen von mindestens einem Bild eines zweiten aktiven Zustands, das sich von dem Bild des ersten aktiven Zustands unterscheidet, für einen zweiten aktiven Zustand, der während eines zweiten Zeitraums auftritt, welcher sich von dem ersten Zeitraum unterscheidet;

Kennzeichnen eines Objekts, das in dem Bild des zweiten aktiven Zustands angezeigt wird, und Erzeugen eines Katalogs von einem oder mehreren Befehlen des zweiten aktiven Zustands von einem gekennzeichneten Objekt, die eine Funktion des zweiten aktiven Zustands kennzeichnen, welche in dem zweiten aktiven Zustand des Zielrechnerprogramms ausgeführt werden kann;

Kennzeichnen eines Vokabulars von akustischen Befehlsmodellen eines zweiten aktiven Zustands für den zweiten aktiven Zustand, wobei das Vokabular des zweiten aktiven Zustands die akustischen Befehlsmodelle von dem Systemvokabular umfasst, das die Befehle des zweiten aktiven Zustands darstellt, wobei sich das Vokabular des zweiten aktiven Zustands mindestens teilweise von dem Vokabular des ersten aktiven Zustands unterscheidet;

Messen des Werts von mindestens einem Merkmal einer Äußerung während eines jeden einer zweiten Folge von Zeitintervallen innerhalb des zweiten Zeitraums, um eine zweite Reihe von Merkmalssignalen zu erzeugen;

Vergleichen der zweiten Reihe der Merkmalssignale für den zweiten Zeitraum mit jedem der akustischen Befehlsmodelle in dem Vokabular des zweiten aktiven Zustands, um das Übereinstimmungsergebnis für die Äußerung und jedes akustische Befehlsmodell zu erzeugen; und

Ausgeben eines Befehlssignals, das dem Befehlsmodell von dem Vokabular des zweiten aktiven Zustands entspricht, welches das beste Übereinstimmungsergebnis aufweist.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 16, dadurch gekennzeichnet, dass bei dem Zielrechnerprogramm während eines jeden Zeitraums nur ein aktiver Zustand auftritt.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 17, dadurch gekennzeichnet, dass das Zielrechnerprogramm ein Betriebssystemprogramm umfasst.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 18, dadurch gekennzeichnet, dass das Zielrechnerprogramm ein Anwendungsprogramm und ein Betriebssystemprogramm umfasst.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 19, dadurch gekennzeichnet, dass das Zielrechnerprogramm zwei oder mehr Anwendungsprogramme und ein Betriebssystemprogramm umfasst.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 19, dadurch gekennzeichnet, dass mindestens einige Befehle für den aktiven Zustand Funktionen kennzeichnen, die an den gekennzeichneten Objekten in dem Bild des aktiven Zustands für den aktiven Zustand ausgeführt werden können.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 21, dadurch gekennzeichnet, dass das gekennzeichnete Objekt in dem Bild des aktiven Zustands ein oder mehrere Zeichen, Wörter, Symbole, Schaltflächen, Schiebeleisten, Schiebefelder, Listenfenster, Menüs, Markierungsfelder, Behälter oder Notizbücher umfasst.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 22, dadurch gekennzeichnet, dass der Schritt der Ausgabe eines Befehlssignals die Ausgabe von zwei oder mehr Befehlssignalen umfasst, die den Befehlsmodellen von dem Vokabular des aktiven Zustands entsprechen, welche die besten Übereinstimmungsergebnisse für einen bestimmten Zeitraum aufweisen.
Verfahren zur Interaktion mit einem Rechner nach Anspruch 23, dadurch gekennzeichnet, dass das Vokabular von akustischen Befehlsmodellen für jeden aktiven Zustand des Weiteren eine Gruppe von globalen akustischen Befehlsmodellen umfasst, die globale Befehle darstellen, welche Funktionen kennzeichnen, die in jedem aktiven Zustand des Zielrechnerprogramms ausgeführt werden können.
Vorfahren zur Interaktion mit einem Rechner nach Anspruch 24, das des Weiteren den Schritt der Anzeige von sowohl dem Bild des aktiven Zustands für den aktiven Zustand, der während eines Zeitraums auftritt, als auch von mindestens einem Teil von einem oder mehreren Bildern für Programmzustände, die während des Zeitraums nicht auftreten, umfasst.