DE4243181C2

DE4243181C2 - Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb

Info

Publication number: DE4243181C2
Application number: DE4243181A
Authority: DE
Inventors: Peter A Tinsley
Original assignee: Mitel Corp
Current assignee: Microsemi Semiconductor ULC
Priority date: 1991-12-31
Filing date: 1992-12-19
Publication date: 1996-12-19
Anticipated expiration: 2012-12-20
Also published as: IT1256746B; GB2263042B; DE4243181A1; CA2149012C; GB2263042A; CA2149012A1; CA2058644A1; MX9207608A; CA2058644C; ITMI922888A0; GB9227115D0; ITMI922888A1

Description

Die Erfindung bezieht sich auf eine sprachgesteuerte Vorrichtung nach dem Ober begriff des Anspruches 15 sowie auf ein Verfahren zu deren Betrieb nach dem Ober begriff des Anspruches 1.

Spracherkennungssysteme, welche dazu verwendet werden können, Schaltvorrich tungen oder stationäre Geräte, wie Computer und Telefoneinheiten, zu betätigen, sind seit einiger Zeit bekannt. Bei einem Verfahren zum Betrieb derartiger Anla gen werden die gesprochenen Worte analysiert und das Ergebnis dieser Analyse mit einer standardisierten Datenbank, welche sich auf einem Massenspeichermedium be findet, verglichen. Bei einer anderen Methode wird ein Lernprozeß eingesetzt, bei welchem aufeinanderfolgende korrekte Vergleiche (Treffer) die Detektion üblicher Laute verschiedener Benutzer verbessern, welche zur Erzeugung einer bestimmten Systemantwort gesprochen werden. Während das System lernt, findet es die einzel nen "Treffer" mit zunehmender Geschwindigkeit.

Beide genannten Methoden setzen, unabhängig davon ob sie einzeln oder in Kombi nation miteinander angewendet werden, eine detaillierte Analyse der gesprochenen Worte voraus und bedingen daher teure Gerätschaften und viel Zeit für die Ana lyse. Aus diesem Grund wurden sie in zentralisierten Systemen eingesetzt, wo sie von vielen Benutzern verwendet werden können. Die Komplexität und die Kosten derartiger Systeme sind außerordentlich hoch.

Ein anderes, bereits bekanntes System ist jedem einzelnen Telefonapparat zuge ordnet, wobei bei jedem Telefonapparat Sprachsignale gespeichert sind. Die von den Benutzern gesprochenen Befehle werden von dem Spracherkennungssystem im Telefonapparat durch Vergleich des Signals des gesprochenen Befehls mit dem ge speicherten Audiosignal erkannt.

Derartige Systeme müssen an jedem einzelnen Telefonapparat vorhanden sein, wo durch die Telefonapparate sehr teuer werden.

In dem Artikel von Klaus Sickert "Automatische Spracheingabe und Sprachausgabe, Verlag Markt & Technik (1983), Seite 424-426" werden zwei Spracherkennungssy steme, genannt ADES und V 5000, beschrieben. Diesen Systemen ist der Vergleich von gesprochenen Befehlen mit abgelegten Betriebsbefehlen entnehmbar, um einen bestimmten Befehl auszuführen. Dem Spracherkennungssystem V 5000 ist ferner die Möglichkeit einer Datenkompression entnehmbar. Allerdings zeigt weder das System ADES, noch das System V 5000 noch eine Kombination beider Systeme, wie und zu welchem Zeitpunkt eine Datenkompression erfolgen soll. Beide Verfah ren dauern lange, da im einen Fall zunächst das gesprochene Wort komprimiert werden muß und im anderen Fall der gesamte Speicherinhalt, in welchem für jedes Wort mehrere Sprachmuster enthalten sind, dekomprimiert werden muß.

Ferner ist aus der US 4,827,520 ein sprachgesteuertes Kontrollsystem für ein Fahr zeug zu entnehmen, in welchem jedoch Datenkompressions- und -dekompressionstechniken keine Rolle spielen.

Es stellt sich daher die Aufgabe, ein Verfahren zum Betrieb einer sprachgesteuerten Vorrichtung so weiterzubilden, daß es mit relativ billigen Geräten und bei geringem Rechneraufwand durchgeführt werden kann und eine zugehörige sprachgesteuerte Vorrichtung anzugeben.

Gelöst wird diese Aufgabe durch die kennzeichnenden Merkmale der Ansprüche 1 bzw. 15. Vorteilhafte Ausgestaltungen sind den jeweiligen Unteransprüchen entnehm bar.

Die vorliegende Erfindung besteht aus einem zentralisierten System, in welchem die Stimmen der potentiellen Benutzer in digitalisierter Form zentral gespeichert wer den. Die Worte eines begrenzten Befehlsvokabulars werden einzeln abgespeichert. Jedes Sprachsignal wird digitalisiert, die digitalisierten Befehle werden gruppiert, mit einem dem Telefon des Benutzers zugeordneten Code verbunden, komprimiert und als Daten in einem zentralen Massenspeicher abgespeichert.

Wenn ein Benutzer sein Telefon aktiviert, wird die diesem Telefon zugeordnete Da tengruppe aus dem Speicher gelesen, dekomprimiert und in einem virtuellen Spei cher abgespeichert. Wenn der Benutzer einen der Systembefehle ausspricht, wird dieser gesprochene Befehl digitalisiert und mit den in dem virtuellen Speicher ab gespeicherten Befehlen verglichen. Wenn eine Übereinstimmung festgestellt wird, wird die zugeordnete Systemfunktion ausgeführt. Typischerweise werden bis zu 20 Systembefehle verwendet.

Die vorliegende Erfindung weist gegenüber den bekannten Systemen verschiedene Vorteile auf. Die Vorrichtung ist zentral angeordnet und wird von allen Benutzern gemeinsam verwendet. Hierdurch ist es nicht mehr nötig, daß jeder einzelne Telefo napparat sein eigenes Spracherkennungssystem und seinen eigenen Sprachspeicher aufweist. Weil nur eine bestimmte Gruppe von Befehlen gespeichert wird, welche be stimmten Benutzern zugeordnet sind, werden keine komplizierten Spracherkennungs- und Sprachanalysevorrichtungen für alle möglichen Stimmen und alle möglichen Worte benötigt. Nachdem eine Stimme identifiziert wurde, ist diese nur mit einer geringen Anzahl von Befehlen, beispielsweise 20, zu vergleichen. Die Bestimmung von Worten aus einem großen Wortschatz zur Anzeige auf einer Anzeigevorrichtung oder zum Ausdruck ist nicht notwendig. Die Feststellung eines Befehls-"Treffers" aus einer kleinen Anzahl von Befehlen führt dazu, daß die Vorrichtung den Befehl ausführt.

Zur Erläuterung soll die vorliegende Erfindung mit einem Spracherkennungssystem verglichen werden, welches zum automatischen Schreiben oder zur automatischen Anzeige von Worten verwendet wird. Bei einem derartigen System muß jedes Wort analysiert werden, sodann muß ein Vergleich mit einem auf einem Massenspeicher befindlichen Wörterbuch durchgeführt werden und schließlich wird das Wort auf einem Bildschirm oder einem Drucker ausgegeben. Ein derartiges System muß in der Lage sein, die von allen möglichen Benutzern gesprochenen Worte zu unterscheiden, wobei die Benutzer im allgemeinen verschiedene Stimmen, verschiedene Akzente usw. haben. Hierbei ist jeder potentielle Sprecher der Sprache zu berücksichtigen, im allgemeinen also viele Millionen Stimmen. Es ist offensichtlich, daß eine derartige Vorrichtung sehr kompliziert und teuer in der Herstellung ist.

Auf der anderen Seite werden bei der vorliegenden Erfindung bestimmte spezifische Kommandos gespeichert, welche einem einzelnen Benutzer zugeordnet sind. Die Vergleichsvorrichtung muß nur eine Übereinstimmung zwischen einem gesprochenen Befehl und einem vom selben Benutzer abgespeicherten Befehl finden. Es ist offen sichtlich, daß der Vergleich zwischen dem gesprochenen und dem abgespeicherten Befehl und das Auffinden eines Treffers erheblich einfacher ist. Die Ausrüstung wird gemeinsam für alle potentiellen Benutzer ihrer entsprechenden Telefone eingesetzt, was die Kosten für jeden einzelnen Benutzer weiter senkt.

Nachdem sich ein einzelner Benutzer identifiziert hat, werden alle potentiellen Be fehle dieses Benutzers im virtuellen Speicher abgespeichert, wo sie zum Vergleich mit dem aktuellen Befehl bereitstehen. Gemäß der vorliegenden Erfindung setzt sich der Datenzugriffsprozeß aus zwei Schritten zusammen, nämlich der Erkennung eines bestimmten Benutzers, worauf alle abgespeicherten Befehle dieses Benutzers in einem virtuellen Speicher abgelegt werden und der darauffolgenden Erkennung eines bestimmten Wortes, welches einem Befehl entspricht. Im Ergebnis ist das Ver fahren zur Erkennung der einzelnen gesprochenen Befehle erheblich einfacher als die Verfahren nach dem oben genannten Stand der Technik.

Ein Ausführungsbeispiel der Erfindung wird im folgenden unter Bezugnahme auf die Zeichnungen näher beschrieben. Diese zeigen:

Fig. 1 ein Blockdiagramm der vorliegenden Erfindung,

Fig. 2 ein Blockdiagramm zur Darstellung des Verfahrens und der Hardware einer Ausführungsform der vorliegenden Erfindung,

Fig. 3 ein Blockdiagramm zur Darstellung der Vorbereitung des Systems für einen bestimmten Benutzer,

Fig. 4 ein Blockdiagramm wie in Fig. 3 zur Erläuterung eines anderen Aspekts dieses Verfahrens,

Fig. 5 ein Blockdiagramm zur Darstellung des Betriebs des Systems beim Wähl vorgang und

Fig. 6 ein Blockdiagramm zur Darstellung des Betriebs des Systems bei der Imple mentierung eines Sonderfunktionsrufs.

In Fig. 1 ist das Blockdiagramm einer Vorrichtung dargestellt, welche zur Imple mentierung einer Ausführungsform der vorliegenden Erfindung geeignet ist. Ein Telefonapparat 1 ist über eine Teilnehmerleitung an eine Schaltvorrichtung 3 ange schlossen, welche von einem Prozessor 5 gesteuert wird. An die Schaltvorrichtung 3 sind in bekannter Weise verschiedene Amtsleitungen und andere Peripherieeinheiten angeschlossen.

An die Schaltvorrichtung 3 ist als Peripherieeinheit ein Digitalisierer 11 in einer Weise angeschlossen, in der er über die Schaltvorrichtung mit jedem der Telefonappa rate verbindbar ist. Der Ausgang eines Sprachgenerators 9 ist an denselben Periphe rieausgang angeschlossen wie der Digitalisierer 11. An den Ausgang des Digitalisie rers 11 ist ein Speicher angeschlossen, welcher ein Verzeichnis 13 enthält. Weiterhin sind an den Ausgang des Digitalisierers 11 ein Speicher 15 und eine Komprimier- /Dekomprimiereinheit 17 angeschlossen. Zusätzliche Speicher, welche als Sprachbo xen 19A-19N bezeichnet werden, sind an die Komprimier-/Dekomprimiereinheit 17 angeschlossen. Der Eingang des Sprachgenerators 9 ist mit dem Speicher 15 zum Empfang von Signalen verbunden, welche in künstliche Sprache umsetzbar und den peripheren Terminals der Schaltvorrichtung 3 zuführbar sind.

Der Sprachgenerator und sämtliche Speicher sind zur Steuerung an den Prozessor 5 angeschlossen. Alternativ hierzu kann ein eigener Prozessor verwendet werden.

Die Schaltvorrichtung 3 kann bespielsweise unter Verwendung der Mittel SX 2000, einem System wie es im US-Patent 4,615,028 beschrieben ist, implementiert werden. Bei derartigen Systemen kann jede der Peripherieeinheiten Zugang zu anderen Peri pherieeinheiten haben zur Übersetzung von Schaltkreissignalen oder Nachrichtensi gnalen, beispielsweise Information, welche Nachrichten- und Steuersignale enthält. Es können jedoch auch andere Schaltvorrichtungen verwendet werden.

Der Ablauf des erfindungsgemäßen Verfahrens wird im folgenden unter Bezugnahme auf die Fig. 2 bis 6 näher beschrieben.

Zur Inbetriebnahme des erfindungsgemäßen Verfahrens setzt der Benutzer das Sy stem durch Drücken einer bestimmten Taste an seinem Telefonapparat 1 in Betrieb. Die von dem Prozessor 5 gesteuerte Schaltvorrichtung baut eine Verbindung zwi schen dem Telefonapparat 1, dem Digitalisierer 11 und dem Verzeichnis 13 auf. Unter der Steuerung des Prozessors wird die Identität des Telefonapparats (und damit des Benutzers) im Verzeichnis 13 gespeichert.

Wie man aus Fig. 3 erkennen kann, setzt das System, nachdem es wie oben be schrieben in Betrieb genommen wurde, in dem Verzeichnis die Identität des ent sprechenden Benutzers ein. Die Identitäten von drei Benutzern, welche als Benut zercode A, Benutzercode B und Benutzercode C identifiziert sind, sind gespeichert dargestellt. Wenn der Benutzer B das System wie dargestellt in Betrieb nimmt, wird für den Benutzer B eine "Sprachbox" (Speicheraufnahmeraum) im Speicher 15 aufgebaut. Nachdem dies erfolgt ist, erzeugt eine Reihe gespeicherter Eingabeauf forderungen einen Code, welcher dem Sprachgenerator 9 zugeführt wird, der darauf hin Sprache generiert, die dem Telefonapparat über die Schaltvorrichtung zugeführt wird. Die Eingabeaufforderungen fordern den Benutzer auf, sie zu wiederholen, bei spielsweise wie es in Fig. 3 dargestellt ist, die Worte "Wählen", "Eins", "Zwei", . . . sowie eine Reihe angebotener Funktionsnamen, beispielsweise "Rufumleitung".

Der Benutzer wiederholt die Eingabeaufforderungen, worauf die wiederholten Ein gabeaufforderungen durch den Digitalisierer 11 geleitet und als digitale Signale in der Sprachbox für den Benutzer B im Systemspeicher abgespeichert werden. Die Sprachbox des Benutzers B enthält weiterhin bei jeder digitalisierten wiederholten Eingabeaufforderung einen Zeiger auf ein Systembefehlssignal, welches dem jewei ligen Wort entspricht, beispielsweise einen "Wählen"-Zeiger, einen "Eins"-Zeiger, einen "Zwei"-Zeiger, einen besonderen Funktionsnamenzeiger, usw. Diese Zeiger werden zur Erzeugung des Befehlssignals benötigt, beispielsweise zur Erzeugung der Ziffer "1", usw.

Wie in Fig. 4 dargestellt, werden die digitalisierte Sprache und die digitalisierten Zeiger (die Sprachbox des Benutzers) nach Abspeicherung der wiederholten Ein gabeaufforderungen in dem System in einer Komprimier-/Dekomprimiereinheit 17 komprimiert und als Gruppe auf einem Massenspeicher mit einer Verbindung zu dem Systemverzeichnis abgespeichert. Dies wird für jeden einzelnen Benutzer der Reihe nach wiederholt.

In dem Systemspeicher enthält also ein Verzeichnis 13 eine Verbindung zu jedem Benutzer mit Hilfe von Zeigern. In dem Massenspeicher befindet sich für jeden Be nutzer eine abgespeicherte Sprachbox, wobei jede dieser Sprachboxen komprimierte Eingabeaufforderungen der Stimme des entsprechenden Benutzers für jeden Befehl enthält. Jede Sprachbox enthält eine Verbindung für den Verzeichniszugang für den entsprechenden Benutzer.

Wie man aus Fig. 5 erkennen kann, nimmt der Benutzer, beispielsweise Benutzer B, das System durch Drücken einer Taste auf seinem Telefonapparat in Betrieb, wodurch ein Mehrfrequenzton erzeugt wird oder indem er seinen Namen ausspricht, worauf die Schaltvorrichtung 3 den Telefonapparat 1 auf die Peripherieleitung schal tet, an welche der Digitalisierer 11 angeschlossen ist. Das sich aus dem Tastendruck oder der Namensaussprache ergebende Signal wird im Digitalisierer 11 digitalisiert und wird unter der Steuerung des Prozessors 5 mit den im Systemverzeichnis 13 gespeicherten Daten verglichen. Diese Aufgabe ist einfach, weil nur diese Namen, in den Stimmen der einzelnen Benutzer im Verzeichnis 13 abgespeichert sind. Bei Auffinden einer Übereinstimmung führt die mit der übereinstimmenden Stimme kor respondierende Verbindung zur Sprachbox zum Zugang zu der korrekten Sprachbox. Die Signale der Sprachbox werden dekomprimiert und in einem Speicher 15 abge speichert, und zwar zur Minimierung der Speicheranforderungen vorzugsweise in einem virtuellen Speicher. Nach dem Auffinden der Sprachbox wird das System auf den Empfang gesprochener Befehle umgestellt und der Mikroprozessor 5 belegt den Telefonapparat des Benutzers mit dem Wählton, nachdem er erkannt hat, daß die Sprachbox dieses Benutzers im Speicher 15 abgespeichert wurde.

Der Benutzer spricht dann die gewünschten Worte oder Sätze, beispielsweise "Wählen", "Sieben", "Zwei", . . ., also beispielsweise einen Befehl zum Wählen einer bestimmten Telefonnummer. Die Sprachsignale werden im Digitalisierer 11 digitalisiert und mit Hilfe des Mikroprozessors 5 mit den Daten verglichen, welche in der dekomprimier ten Sprachbox im Speicher 15 für den aktuellen Benutzer abgespeichert sind, im dargestellten Beispiel Benutzer B. Weil die einzelnen Befehle in der Sprachbox in der Stimme des aktuellen Benutzers abgespeichert wurden, ist der Vergleich der di gitalisierten Befehlssignale mit den in der Sprachbox enthaltenen Signalen erheblich einfacher und schneller durchzuführen als ein eventueller Vergleich einer beliebigen Stimme mit beliebigen Worten. Die einzige Stimme, mit welcher verglichen werden muß, ist die aktuelle Stimme, welche die Befehle erteilt.

Bei Auffinden einer Übereinstimmung mit einem Befehl erhält man den Zeiger, der dem als übereinstimmend festgestellten Wort entspricht, beispielsweise zum Beginn des Wählvorgangs und der darauffolgenden Bezeichnung der zu wählenden Ziffern. Die mit den Sprachboxbefehlen gespeicherten Befehlszeiger werden über den Mikroprozessor 5 aufgefunden und steuern die Schaltvorrichtung zur Ausführung der gewünschten Operation.

In Fig. 6, welche dem unteren Teil von Fig. 5 entspricht, ist der Betrieb des erfindungsgemäßen Verfahrens beim Aufruf einer Funktion dargestellt. In der Figur ist dargestellt, daß ein gewählter Ton dem Benutzer zurückgeführt wird, wie es oben beschrieben ist.

Anstelle der Angabe des Befehls "Wählen" oder einer Ziffer kann der Benutzer auch eine Funktion aufrufen, beispielsweise "Rufumleitung". Nach der Digitalisierung wird ein Vergleich durchgeführt, bei dem die Funktion "Rufumleitung", welche in der Sprachbox des Benutzers B abgespeichert ist, aufgefunden wird. In diesem Fall zeigt der Zeiger auf eine Funktionsoperation und die Beschreibungsliste 21 in dem Massenspeicher und ruft entsprechende Befehlsdatensignale für die Rufumleitung ab, welche darin gespeichert sind. Die entsprechenden Datensignale werden dem Speicher 15 zugeführt. Unter der Steuerung des Mikroprozessors 5, welcher Zugang zu der Rufumleitungsoperation und den Beschreibungsdatensignalen hat, wird der Benutzer interaktiv durch die notwendigen Schritte zur Ausführung der Funktion geführt. Beispielsweise können die Worte "Geben Sie die Nummer an, zu welcher die Rufumleitung erfolgen soll und sagen Sie dann das Wort TRANSFER" aus dem Speicher 15 abgerufen und dem Sprachgenerator 9 zugeführt werden, welcher den Satz analogisiert und ihn über die Teilnehmerleitung dem Telefon 1 des Benutzers zuführt. Der Benutzer gibt dann die Ziffern an, welche mit den abgespeicherten Nummern in der Sprachbox im Speicher 15 verglichen werden. Die sich hieraus er gebenden Zeiger und die Funktion der oben beschriebenen Rufumleitung verwendet das System, um die Schaltvorrichtung so zu steuern, daß zukünftige Anrufe an die gewünschte Teilnehmerleitung umgeleitet werden.

Auf diese Weise ahmt das vorliegende Telefonsystem die benutzerfreundliche Be triebsweise altmodischer Vermittlungsstellen nach, bei denen der Benutzer mit dem "Fräulein vom Amt" sprechen kann. Wenn komplizierte Funktionen ausgeführt wer den sollen, hört der Benutzer in einer freundlichen und verständlichen Stimme An leitungen darüber, wie die Funktion auszuführen ist, wobei diese Anweisungen in Form einer Konversation erfolgen können.

Weil in dem System vorher festgelegte Befehlsworte von bestimmten Benutzern ge speichert sind, ist die Aufgabe, die gesprochenen Befehle mit den zugehörigen abge speicherten Sprachsignalen zu vergleichen, relativ einfach. Das System kann daher sehr schnell arbeiten und für eine große Anzahl von Benutzern kann ein zentrales System verwendet werden. Weil die abgespeicherten Signale in den beschriebenen Sprachboxen in einer komprimierten Form vorhanden sind, kann ein derartiges Sy stem bei relativ geringen Kosten für eine große Anzahl von Benutzern verwendet werden.

Claims

1. Verfahren zum Betrieb einer sprachgesteuerten Vorrichtung, umfassend in einer Lernphase

(a) das Abspeichern von Steuerungssignalen für die Vorrichtung,
(b) das Abspeichern von vorbestimmten, von den Benutzern gesprochenen und nach den Benutzern gruppierten Betriebsbefehlen, und während des laufenden Betriebs
(c) das Indizieren der Identifikation eines bestimmten Benutzers nach Emp fang eines Anfragesignals,
(d) das Empfangen gesprochener Befehle von einem Benutzer,
(e) das Vergleichen dieser gesprochenen Befehle mit den abgespeicherten Be triebsbefehlen dieses Benutzers zur Auffindung von Übereinstimmungen,
(f) das Erzeugen von Steuersignalen für die Vorrichtung, welche den aufge fundenen Übereinstimmungen zwischen den Befehlen entsprechen,
dadurch gekennzeichnet, daß
in der Lernphase
(g) die Identifikation jedes Benutzers (1 . . . N) in einem Verzeichnis (13) abgespeichert wird,
(h) die von den Benutzern gesprochenen und nach diesen gruppierten Befehle in digitalisierter und komprimierter Form abgespeichert werden und jede Gruppe einen Zeiger zu einer korrespondierenden Identifikation in dem Verzeichnis (13) aufweist,
und während des laufenden Betriebs
(i) nach dem Indizieren der Identifikation eines bestimmten Benutzers in dem Verzeichnis (13) das Abrufen der korrespondierenden Gruppe von Betriebsbefehlen erfolgt, welche über den Zeiger mit dieser Identifikation verbunden sind sowie die Dekomprimierung der darin enthaltenen Be triebsbefehle, und
(j) das Vergleichen der gesprochenen Befehle mit diesen dekomprimierten Betriebsbefehlen erfolgt.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Identifikation jedes Benutzers ein aus einem oder mehreren Mehrfrequenztönen bestehender Code ist.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß in der Lernphase das Abspeichern der vorbestimmten, von den Benutzern gesproche nen und nach den Benutzern gruppierten Betriebsbefehle durch eine automa tische, mit Hilfe einer künstlichen Stimme erzeugte Eingabeaufforderung an den Benutzer zum Sprechen einer Reihe von Betriebsbefehlen veranlaßt wird.

4. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß die sprachgesteuerte Vorrichtung eine zentrale Rufsteuerungsvorrich tung ist.

5. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß die Identifikation jedes Benutzers die digitalisierte Form eines vorbe stimmten Worts ist.

6. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß der Verfahrensschritt des Indizierens der Identifikation eines ein An fragesignal ausgebenden Benutzers den Empfang eines vorbestimmten Anfra gesignals von dem Benutzer sowie des Vergleichs dieses Anfragesignals mit den Benutzeridentifikationen in dem Verzeichnis (13) umfaßt und die Identifikation nach Auffinden einer Korrespondenz zwischen beiden liefert.

7. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß die aufgerufenen Befehle umfassen: das Abrufen von Signalen aus ei nem Speicher entsprechend einer Funktion, das Abarbeiten dieser Signale unter Ausgabe gesprochener Eingabeaufforderungen an den Benutzer zur Ausführung einer vorbestimmten Prozedur, das Empfangen von Signalen, welche sich aus der Abarbeitung dieser Prozedur ergeben, von dem Benutzer und das Ausführen einer Befehlsfolge, welche sich aus dem Empfang dieser Signale ergibt.

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die sich bei der Abarbeitung der Prozedur ergebenden Signale vom Benutzer gesprochene Worte umfassen und das Verfahren als weitere Schritte den Vergleich dieser Worte mit der dekomprimierten Gruppe von Befehlen sowie die Ausführung der Befehlsfolge bei Feststellung einer Korrespondenz zwischen beiden auf weist.

9. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß die Gruppen von Befehlen in einem Massenspeicher abgespeichert sind.

10. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß vor dem Abspeichern der Gruppe digitalisierter und komprimierter Betriebsbefehle auch die Zeiger digitalisiert und komprimiert werden und nach dem Dekomprimieren dieser Gruppe von Betriebsbefehlen auch die Zeiger de komprimiert werden.

11. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß in der automatischen Eingabeaufforderung die Aufforderung an den Benutzer enthalten ist, seinen Identifizierer auszusprechen sowie die Digitali sierung dieses Identifizierers erfolgt und zusätzlich vor dem Abspeichern der Gruppe von digitalisierten Betriebsbefehlen und Zeigern der von dem Benut zer gesprochene Identifizierer für diesen Benutzer empfangen und digitalisiert wird.

12. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß es zusätzlich den folgenden Verfahrensschritt umfaßt: Empfangen eines von dem Benutzer gesprochenen Identifizierers für diesen Benutzer und Umsetzung dieses gesprochenen Identifizierers in ein dem Benutzer zugeord netes Identifizierungssignal und das Vergleichen dieses Identifizierungssignals mit der Gruppe von Identifizierern von Benutzern zur Auffindung einer Über einstimmung vor dem Abrufen der Gruppe von Betriebsbefehlen aus dem Spei cher.

13. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich net, daß es zusätzlich das Abspeichern des Identifizierers des Benutzers in einer Gruppe von Identifizierern von Benutzern in einem Speicher umfaßt.

14. Verfahren nach einem der Ansprüche 3 bis 13, dadurch gekennzeichnet, daß die automatische Ausgabe einer Eingabeaufforderung den folgenden Ver fahrensschritt umfaßt: Generierung einer Stimme, welche den Benutzer in teraktiv zum Sprechen jedes Betriebsbefehls der Reihe von Betriebsbefehlen auffordert.

15. Sprachgesteuerte Vorrichtung mit

(a) einem Speicher zum Abspeichern von Steuerungssignalen für die Vorrich tung,
(b) einer Einrichtung zum Abspeichern von Betriebsbefehlen in einem ersten Speicher mit einem Zeiger auf ein korrespondierendes Steuerungssignal für die Vorrichtung,
(c) einer Einrichtung zum Abspeichern einer Gruppe von Betriebsbefehlen und Zeiger in einem Speicher mit einer Verbindung zu einem Identifizierer für den Benutzer,
(d) einer Einrichtung zum Empfang eines dem Benutzer zugeordneten Iden tifizierungssignals und zum darauffolgenden Abrufen der Gruppe von Be triebsbefehlen aus dem Speicher,
(e) einer Einrichtung zum Vergleichen der gesprochenen Befehle mit den im zweiten Speicher gespeicherten Betriebsbefehlen zur Auffindung von Übe reinstimmungen und
(f) einer Einrichtung zur Erzeugung aufeinanderfolgender und zu den als übereinstimmend herausgefundenen Befehlen korrespondierender Steuer signale für die Vorrichtung unter Verwendung zugeordneter Zeiger zum Betrieb der Vorrichtung,
gekennzeichnet durch
(g) eine Einrichtung zur automatischen Aufforderung an den Benutzer zum Sprechen einer Reihe von Betriebsbefehlen,
(h) eine Digitalisierungsvorrichtung (11) zur Digitalisierung jedes gesproche nen Betriebsbefehls,
(i) eine Einrichtung zum Abspeichern der Gruppe von Betriebsbefehlen und Zeiger mit einem Komprimierer (17) zum Komprimieren dieser Gruppe von Betriebsbefehlen und Zeiger,
(j) eine Einrichtung zum Abrufen der Gruppe von Betriebsbefehlen und Zei ger und zu deren Abspeichern in dem zweiten Speicher mit einem Dekom primierer (17) zum Dekomprimieren dieser Gruppe von Betriebsbefehlen und Zeiger.

16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, daß die Einrich tung zur automatischen Ausgabe von Eingabeaufforderungen einen Sprach generator (9) umfaßt, welcher eine Stimme generiert, die den Benutzer auf fordert, jeden der Betriebsbefehle der genannten Reihe von Betriebsbefehlen auszusprechen.