DE4243181C2 - Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb - Google Patents

Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb

Info

Publication number
DE4243181C2
DE4243181C2 DE4243181A DE4243181A DE4243181C2 DE 4243181 C2 DE4243181 C2 DE 4243181C2 DE 4243181 A DE4243181 A DE 4243181A DE 4243181 A DE4243181 A DE 4243181A DE 4243181 C2 DE4243181 C2 DE 4243181C2
Authority
DE
Germany
Prior art keywords
user
commands
operating
spoken
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Revoked
Application number
DE4243181A
Other languages
English (en)
Other versions
DE4243181A1 (de
Inventor
Peter A Tinsley
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsemi Semiconductor ULC
Original Assignee
Mitel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitel Corp filed Critical Mitel Corp
Publication of DE4243181A1 publication Critical patent/DE4243181A1/de
Application granted granted Critical
Publication of DE4243181C2 publication Critical patent/DE4243181C2/de
Anticipated expiration legal-status Critical
Revoked legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42204Arrangements at the exchange for service or number selection by voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Description

Die Erfindung bezieht sich auf eine sprachgesteuerte Vorrichtung nach dem Ober­ begriff des Anspruches 15 sowie auf ein Verfahren zu deren Betrieb nach dem Ober­ begriff des Anspruches 1.
Spracherkennungssysteme, welche dazu verwendet werden können, Schaltvorrich­ tungen oder stationäre Geräte, wie Computer und Telefoneinheiten, zu betätigen, sind seit einiger Zeit bekannt. Bei einem Verfahren zum Betrieb derartiger Anla­ gen werden die gesprochenen Worte analysiert und das Ergebnis dieser Analyse mit einer standardisierten Datenbank, welche sich auf einem Massenspeichermedium be­ findet, verglichen. Bei einer anderen Methode wird ein Lernprozeß eingesetzt, bei welchem aufeinanderfolgende korrekte Vergleiche (Treffer) die Detektion üblicher Laute verschiedener Benutzer verbessern, welche zur Erzeugung einer bestimmten Systemantwort gesprochen werden. Während das System lernt, findet es die einzel­ nen "Treffer" mit zunehmender Geschwindigkeit.
Beide genannten Methoden setzen, unabhängig davon ob sie einzeln oder in Kombi­ nation miteinander angewendet werden, eine detaillierte Analyse der gesprochenen Worte voraus und bedingen daher teure Gerätschaften und viel Zeit für die Ana­ lyse. Aus diesem Grund wurden sie in zentralisierten Systemen eingesetzt, wo sie von vielen Benutzern verwendet werden können. Die Komplexität und die Kosten derartiger Systeme sind außerordentlich hoch.
Ein anderes, bereits bekanntes System ist jedem einzelnen Telefonapparat zuge­ ordnet, wobei bei jedem Telefonapparat Sprachsignale gespeichert sind. Die von den Benutzern gesprochenen Befehle werden von dem Spracherkennungssystem im Telefonapparat durch Vergleich des Signals des gesprochenen Befehls mit dem ge­ speicherten Audiosignal erkannt.
Derartige Systeme müssen an jedem einzelnen Telefonapparat vorhanden sein, wo­ durch die Telefonapparate sehr teuer werden.
In dem Artikel von Klaus Sickert "Automatische Spracheingabe und Sprachausgabe, Verlag Markt & Technik (1983), Seite 424-426" werden zwei Spracherkennungssy­ steme, genannt ADES und V 5000, beschrieben. Diesen Systemen ist der Vergleich von gesprochenen Befehlen mit abgelegten Betriebsbefehlen entnehmbar, um einen bestimmten Befehl auszuführen. Dem Spracherkennungssystem V 5000 ist ferner die Möglichkeit einer Datenkompression entnehmbar. Allerdings zeigt weder das System ADES, noch das System V 5000 noch eine Kombination beider Systeme, wie und zu welchem Zeitpunkt eine Datenkompression erfolgen soll. Beide Verfah­ ren dauern lange, da im einen Fall zunächst das gesprochene Wort komprimiert werden muß und im anderen Fall der gesamte Speicherinhalt, in welchem für jedes Wort mehrere Sprachmuster enthalten sind, dekomprimiert werden muß.
Ferner ist aus der US 4,827,520 ein sprachgesteuertes Kontrollsystem für ein Fahr­ zeug zu entnehmen, in welchem jedoch Datenkompressions- und -dekompressionstechniken keine Rolle spielen.
Es stellt sich daher die Aufgabe, ein Verfahren zum Betrieb einer sprachgesteuerten Vorrichtung so weiterzubilden, daß es mit relativ billigen Geräten und bei geringem Rechneraufwand durchgeführt werden kann und eine zugehörige sprachgesteuerte Vorrichtung anzugeben.
Gelöst wird diese Aufgabe durch die kennzeichnenden Merkmale der Ansprüche 1 bzw. 15. Vorteilhafte Ausgestaltungen sind den jeweiligen Unteransprüchen entnehm­ bar.
Die vorliegende Erfindung besteht aus einem zentralisierten System, in welchem die Stimmen der potentiellen Benutzer in digitalisierter Form zentral gespeichert wer­ den. Die Worte eines begrenzten Befehlsvokabulars werden einzeln abgespeichert. Jedes Sprachsignal wird digitalisiert, die digitalisierten Befehle werden gruppiert, mit einem dem Telefon des Benutzers zugeordneten Code verbunden, komprimiert und als Daten in einem zentralen Massenspeicher abgespeichert.
Wenn ein Benutzer sein Telefon aktiviert, wird die diesem Telefon zugeordnete Da­ tengruppe aus dem Speicher gelesen, dekomprimiert und in einem virtuellen Spei­ cher abgespeichert. Wenn der Benutzer einen der Systembefehle ausspricht, wird dieser gesprochene Befehl digitalisiert und mit den in dem virtuellen Speicher ab­ gespeicherten Befehlen verglichen. Wenn eine Übereinstimmung festgestellt wird, wird die zugeordnete Systemfunktion ausgeführt. Typischerweise werden bis zu 20 Systembefehle verwendet.
Die vorliegende Erfindung weist gegenüber den bekannten Systemen verschiedene Vorteile auf. Die Vorrichtung ist zentral angeordnet und wird von allen Benutzern gemeinsam verwendet. Hierdurch ist es nicht mehr nötig, daß jeder einzelne Telefo­ napparat sein eigenes Spracherkennungssystem und seinen eigenen Sprachspeicher aufweist. Weil nur eine bestimmte Gruppe von Befehlen gespeichert wird, welche be­ stimmten Benutzern zugeordnet sind, werden keine komplizierten Spracherkennungs- und Sprachanalysevorrichtungen für alle möglichen Stimmen und alle möglichen Worte benötigt. Nachdem eine Stimme identifiziert wurde, ist diese nur mit einer geringen Anzahl von Befehlen, beispielsweise 20, zu vergleichen. Die Bestimmung von Worten aus einem großen Wortschatz zur Anzeige auf einer Anzeigevorrichtung oder zum Ausdruck ist nicht notwendig. Die Feststellung eines Befehls-"Treffers" aus einer kleinen Anzahl von Befehlen führt dazu, daß die Vorrichtung den Befehl ausführt.
Zur Erläuterung soll die vorliegende Erfindung mit einem Spracherkennungssystem verglichen werden, welches zum automatischen Schreiben oder zur automatischen Anzeige von Worten verwendet wird. Bei einem derartigen System muß jedes Wort analysiert werden, sodann muß ein Vergleich mit einem auf einem Massenspeicher befindlichen Wörterbuch durchgeführt werden und schließlich wird das Wort auf einem Bildschirm oder einem Drucker ausgegeben. Ein derartiges System muß in der Lage sein, die von allen möglichen Benutzern gesprochenen Worte zu unterscheiden, wobei die Benutzer im allgemeinen verschiedene Stimmen, verschiedene Akzente usw. haben. Hierbei ist jeder potentielle Sprecher der Sprache zu berücksichtigen, im allgemeinen also viele Millionen Stimmen. Es ist offensichtlich, daß eine derartige Vorrichtung sehr kompliziert und teuer in der Herstellung ist.
Auf der anderen Seite werden bei der vorliegenden Erfindung bestimmte spezifische Kommandos gespeichert, welche einem einzelnen Benutzer zugeordnet sind. Die Vergleichsvorrichtung muß nur eine Übereinstimmung zwischen einem gesprochenen Befehl und einem vom selben Benutzer abgespeicherten Befehl finden. Es ist offen­ sichtlich, daß der Vergleich zwischen dem gesprochenen und dem abgespeicherten Befehl und das Auffinden eines Treffers erheblich einfacher ist. Die Ausrüstung wird gemeinsam für alle potentiellen Benutzer ihrer entsprechenden Telefone eingesetzt, was die Kosten für jeden einzelnen Benutzer weiter senkt.
Nachdem sich ein einzelner Benutzer identifiziert hat, werden alle potentiellen Be­ fehle dieses Benutzers im virtuellen Speicher abgespeichert, wo sie zum Vergleich mit dem aktuellen Befehl bereitstehen. Gemäß der vorliegenden Erfindung setzt sich der Datenzugriffsprozeß aus zwei Schritten zusammen, nämlich der Erkennung eines bestimmten Benutzers, worauf alle abgespeicherten Befehle dieses Benutzers in einem virtuellen Speicher abgelegt werden und der darauffolgenden Erkennung eines bestimmten Wortes, welches einem Befehl entspricht. Im Ergebnis ist das Ver­ fahren zur Erkennung der einzelnen gesprochenen Befehle erheblich einfacher als die Verfahren nach dem oben genannten Stand der Technik.
Ein Ausführungsbeispiel der Erfindung wird im folgenden unter Bezugnahme auf die Zeichnungen näher beschrieben. Diese zeigen:
Fig. 1 ein Blockdiagramm der vorliegenden Erfindung,
Fig. 2 ein Blockdiagramm zur Darstellung des Verfahrens und der Hardware einer Ausführungsform der vorliegenden Erfindung,
Fig. 3 ein Blockdiagramm zur Darstellung der Vorbereitung des Systems für einen bestimmten Benutzer,
Fig. 4 ein Blockdiagramm wie in Fig. 3 zur Erläuterung eines anderen Aspekts dieses Verfahrens,
Fig. 5 ein Blockdiagramm zur Darstellung des Betriebs des Systems beim Wähl­ vorgang und
Fig. 6 ein Blockdiagramm zur Darstellung des Betriebs des Systems bei der Imple­ mentierung eines Sonderfunktionsrufs.
In Fig. 1 ist das Blockdiagramm einer Vorrichtung dargestellt, welche zur Imple­ mentierung einer Ausführungsform der vorliegenden Erfindung geeignet ist. Ein Telefonapparat 1 ist über eine Teilnehmerleitung an eine Schaltvorrichtung 3 ange­ schlossen, welche von einem Prozessor 5 gesteuert wird. An die Schaltvorrichtung 3 sind in bekannter Weise verschiedene Amtsleitungen und andere Peripherieeinheiten angeschlossen.
An die Schaltvorrichtung 3 ist als Peripherieeinheit ein Digitalisierer 11 in einer Weise angeschlossen, in der er über die Schaltvorrichtung mit jedem der Telefonappa­ rate verbindbar ist. Der Ausgang eines Sprachgenerators 9 ist an denselben Periphe­ rieausgang angeschlossen wie der Digitalisierer 11. An den Ausgang des Digitalisie­ rers 11 ist ein Speicher angeschlossen, welcher ein Verzeichnis 13 enthält. Weiterhin sind an den Ausgang des Digitalisierers 11 ein Speicher 15 und eine Komprimier- /Dekomprimiereinheit 17 angeschlossen. Zusätzliche Speicher, welche als Sprachbo­ xen 19A-19N bezeichnet werden, sind an die Komprimier-/Dekomprimiereinheit 17 angeschlossen. Der Eingang des Sprachgenerators 9 ist mit dem Speicher 15 zum Empfang von Signalen verbunden, welche in künstliche Sprache umsetzbar und den peripheren Terminals der Schaltvorrichtung 3 zuführbar sind.
Der Sprachgenerator und sämtliche Speicher sind zur Steuerung an den Prozessor 5 angeschlossen. Alternativ hierzu kann ein eigener Prozessor verwendet werden.
Die Schaltvorrichtung 3 kann bespielsweise unter Verwendung der Mittel SX 2000, einem System wie es im US-Patent 4,615,028 beschrieben ist, implementiert werden. Bei derartigen Systemen kann jede der Peripherieeinheiten Zugang zu anderen Peri­ pherieeinheiten haben zur Übersetzung von Schaltkreissignalen oder Nachrichtensi­ gnalen, beispielsweise Information, welche Nachrichten- und Steuersignale enthält. Es können jedoch auch andere Schaltvorrichtungen verwendet werden.
Der Ablauf des erfindungsgemäßen Verfahrens wird im folgenden unter Bezugnahme auf die Fig. 2 bis 6 näher beschrieben.
Zur Inbetriebnahme des erfindungsgemäßen Verfahrens setzt der Benutzer das Sy­ stem durch Drücken einer bestimmten Taste an seinem Telefonapparat 1 in Betrieb. Die von dem Prozessor 5 gesteuerte Schaltvorrichtung baut eine Verbindung zwi­ schen dem Telefonapparat 1, dem Digitalisierer 11 und dem Verzeichnis 13 auf. Unter der Steuerung des Prozessors wird die Identität des Telefonapparats (und damit des Benutzers) im Verzeichnis 13 gespeichert.
Wie man aus Fig. 3 erkennen kann, setzt das System, nachdem es wie oben be­ schrieben in Betrieb genommen wurde, in dem Verzeichnis die Identität des ent­ sprechenden Benutzers ein. Die Identitäten von drei Benutzern, welche als Benut­ zercode A, Benutzercode B und Benutzercode C identifiziert sind, sind gespeichert dargestellt. Wenn der Benutzer B das System wie dargestellt in Betrieb nimmt, wird für den Benutzer B eine "Sprachbox" (Speicheraufnahmeraum) im Speicher 15 aufgebaut. Nachdem dies erfolgt ist, erzeugt eine Reihe gespeicherter Eingabeauf­ forderungen einen Code, welcher dem Sprachgenerator 9 zugeführt wird, der darauf­ hin Sprache generiert, die dem Telefonapparat über die Schaltvorrichtung zugeführt wird. Die Eingabeaufforderungen fordern den Benutzer auf, sie zu wiederholen, bei­ spielsweise wie es in Fig. 3 dargestellt ist, die Worte "Wählen", "Eins", "Zwei", . . . sowie eine Reihe angebotener Funktionsnamen, beispielsweise "Rufumleitung".
Der Benutzer wiederholt die Eingabeaufforderungen, worauf die wiederholten Ein­ gabeaufforderungen durch den Digitalisierer 11 geleitet und als digitale Signale in der Sprachbox für den Benutzer B im Systemspeicher abgespeichert werden. Die Sprachbox des Benutzers B enthält weiterhin bei jeder digitalisierten wiederholten Eingabeaufforderung einen Zeiger auf ein Systembefehlssignal, welches dem jewei­ ligen Wort entspricht, beispielsweise einen "Wählen"-Zeiger, einen "Eins"-Zeiger, einen "Zwei"-Zeiger, einen besonderen Funktionsnamenzeiger, usw. Diese Zeiger werden zur Erzeugung des Befehlssignals benötigt, beispielsweise zur Erzeugung der Ziffer "1", usw.
Wie in Fig. 4 dargestellt, werden die digitalisierte Sprache und die digitalisierten Zeiger (die Sprachbox des Benutzers) nach Abspeicherung der wiederholten Ein­ gabeaufforderungen in dem System in einer Komprimier-/Dekomprimiereinheit 17 komprimiert und als Gruppe auf einem Massenspeicher mit einer Verbindung zu dem Systemverzeichnis abgespeichert. Dies wird für jeden einzelnen Benutzer der Reihe nach wiederholt.
In dem Systemspeicher enthält also ein Verzeichnis 13 eine Verbindung zu jedem Benutzer mit Hilfe von Zeigern. In dem Massenspeicher befindet sich für jeden Be­ nutzer eine abgespeicherte Sprachbox, wobei jede dieser Sprachboxen komprimierte Eingabeaufforderungen der Stimme des entsprechenden Benutzers für jeden Befehl enthält. Jede Sprachbox enthält eine Verbindung für den Verzeichniszugang für den entsprechenden Benutzer.
Wie man aus Fig. 5 erkennen kann, nimmt der Benutzer, beispielsweise Benutzer B, das System durch Drücken einer Taste auf seinem Telefonapparat in Betrieb, wodurch ein Mehrfrequenzton erzeugt wird oder indem er seinen Namen ausspricht, worauf die Schaltvorrichtung 3 den Telefonapparat 1 auf die Peripherieleitung schal­ tet, an welche der Digitalisierer 11 angeschlossen ist. Das sich aus dem Tastendruck oder der Namensaussprache ergebende Signal wird im Digitalisierer 11 digitalisiert und wird unter der Steuerung des Prozessors 5 mit den im Systemverzeichnis 13 gespeicherten Daten verglichen. Diese Aufgabe ist einfach, weil nur diese Namen, in den Stimmen der einzelnen Benutzer im Verzeichnis 13 abgespeichert sind. Bei Auffinden einer Übereinstimmung führt die mit der übereinstimmenden Stimme kor­ respondierende Verbindung zur Sprachbox zum Zugang zu der korrekten Sprachbox. Die Signale der Sprachbox werden dekomprimiert und in einem Speicher 15 abge­ speichert, und zwar zur Minimierung der Speicheranforderungen vorzugsweise in einem virtuellen Speicher. Nach dem Auffinden der Sprachbox wird das System auf den Empfang gesprochener Befehle umgestellt und der Mikroprozessor 5 belegt den Telefonapparat des Benutzers mit dem Wählton, nachdem er erkannt hat, daß die Sprachbox dieses Benutzers im Speicher 15 abgespeichert wurde.
Der Benutzer spricht dann die gewünschten Worte oder Sätze, beispielsweise "Wählen", "Sieben", "Zwei", . . ., also beispielsweise einen Befehl zum Wählen einer bestimmten Telefonnummer. Die Sprachsignale werden im Digitalisierer 11 digitalisiert und mit Hilfe des Mikroprozessors 5 mit den Daten verglichen, welche in der dekomprimier­ ten Sprachbox im Speicher 15 für den aktuellen Benutzer abgespeichert sind, im dargestellten Beispiel Benutzer B. Weil die einzelnen Befehle in der Sprachbox in der Stimme des aktuellen Benutzers abgespeichert wurden, ist der Vergleich der di­ gitalisierten Befehlssignale mit den in der Sprachbox enthaltenen Signalen erheblich einfacher und schneller durchzuführen als ein eventueller Vergleich einer beliebigen Stimme mit beliebigen Worten. Die einzige Stimme, mit welcher verglichen werden muß, ist die aktuelle Stimme, welche die Befehle erteilt.
Bei Auffinden einer Übereinstimmung mit einem Befehl erhält man den Zeiger, der dem als übereinstimmend festgestellten Wort entspricht, beispielsweise zum Beginn des Wählvorgangs und der darauffolgenden Bezeichnung der zu wählenden Ziffern. Die mit den Sprachboxbefehlen gespeicherten Befehlszeiger werden über den Mikroprozessor 5 aufgefunden und steuern die Schaltvorrichtung zur Ausführung der gewünschten Operation.
In Fig. 6, welche dem unteren Teil von Fig. 5 entspricht, ist der Betrieb des erfindungsgemäßen Verfahrens beim Aufruf einer Funktion dargestellt. In der Figur ist dargestellt, daß ein gewählter Ton dem Benutzer zurückgeführt wird, wie es oben beschrieben ist.
Anstelle der Angabe des Befehls "Wählen" oder einer Ziffer kann der Benutzer auch eine Funktion aufrufen, beispielsweise "Rufumleitung". Nach der Digitalisierung wird ein Vergleich durchgeführt, bei dem die Funktion "Rufumleitung", welche in der Sprachbox des Benutzers B abgespeichert ist, aufgefunden wird. In diesem Fall zeigt der Zeiger auf eine Funktionsoperation und die Beschreibungsliste 21 in dem Massenspeicher und ruft entsprechende Befehlsdatensignale für die Rufumleitung ab, welche darin gespeichert sind. Die entsprechenden Datensignale werden dem Speicher 15 zugeführt. Unter der Steuerung des Mikroprozessors 5, welcher Zugang zu der Rufumleitungsoperation und den Beschreibungsdatensignalen hat, wird der Benutzer interaktiv durch die notwendigen Schritte zur Ausführung der Funktion geführt. Beispielsweise können die Worte "Geben Sie die Nummer an, zu welcher die Rufumleitung erfolgen soll und sagen Sie dann das Wort TRANSFER" aus dem Speicher 15 abgerufen und dem Sprachgenerator 9 zugeführt werden, welcher den Satz analogisiert und ihn über die Teilnehmerleitung dem Telefon 1 des Benutzers zuführt. Der Benutzer gibt dann die Ziffern an, welche mit den abgespeicherten Nummern in der Sprachbox im Speicher 15 verglichen werden. Die sich hieraus er­ gebenden Zeiger und die Funktion der oben beschriebenen Rufumleitung verwendet das System, um die Schaltvorrichtung so zu steuern, daß zukünftige Anrufe an die gewünschte Teilnehmerleitung umgeleitet werden.
Auf diese Weise ahmt das vorliegende Telefonsystem die benutzerfreundliche Be­ triebsweise altmodischer Vermittlungsstellen nach, bei denen der Benutzer mit dem "Fräulein vom Amt" sprechen kann. Wenn komplizierte Funktionen ausgeführt wer­ den sollen, hört der Benutzer in einer freundlichen und verständlichen Stimme An­ leitungen darüber, wie die Funktion auszuführen ist, wobei diese Anweisungen in Form einer Konversation erfolgen können.
Weil in dem System vorher festgelegte Befehlsworte von bestimmten Benutzern ge­ speichert sind, ist die Aufgabe, die gesprochenen Befehle mit den zugehörigen abge­ speicherten Sprachsignalen zu vergleichen, relativ einfach. Das System kann daher sehr schnell arbeiten und für eine große Anzahl von Benutzern kann ein zentrales System verwendet werden. Weil die abgespeicherten Signale in den beschriebenen Sprachboxen in einer komprimierten Form vorhanden sind, kann ein derartiges Sy­ stem bei relativ geringen Kosten für eine große Anzahl von Benutzern verwendet werden.

Claims (16)

1. Verfahren zum Betrieb einer sprachgesteuerten Vorrichtung, umfassend in einer Lernphase
  • (a) das Abspeichern von Steuerungssignalen für die Vorrichtung,
  • (b) das Abspeichern von vorbestimmten, von den Benutzern gesprochenen und nach den Benutzern gruppierten Betriebsbefehlen, und während des laufenden Betriebs
  • (c) das Indizieren der Identifikation eines bestimmten Benutzers nach Emp­ fang eines Anfragesignals,
  • (d) das Empfangen gesprochener Befehle von einem Benutzer,
  • (e) das Vergleichen dieser gesprochenen Befehle mit den abgespeicherten Be­ triebsbefehlen dieses Benutzers zur Auffindung von Übereinstimmungen,
  • (f) das Erzeugen von Steuersignalen für die Vorrichtung, welche den aufge­ fundenen Übereinstimmungen zwischen den Befehlen entsprechen,
    dadurch gekennzeichnet, daß
    in der Lernphase
  • (g) die Identifikation jedes Benutzers (1 . . . N) in einem Verzeichnis (13) abgespeichert wird,
  • (h) die von den Benutzern gesprochenen und nach diesen gruppierten Befehle in digitalisierter und komprimierter Form abgespeichert werden und jede Gruppe einen Zeiger zu einer korrespondierenden Identifikation in dem Verzeichnis (13) aufweist,
    und während des laufenden Betriebs
  • (i) nach dem Indizieren der Identifikation eines bestimmten Benutzers in dem Verzeichnis (13) das Abrufen der korrespondierenden Gruppe von Betriebsbefehlen erfolgt, welche über den Zeiger mit dieser Identifikation verbunden sind sowie die Dekomprimierung der darin enthaltenen Be­ triebsbefehle, und
  • (j) das Vergleichen der gesprochenen Befehle mit diesen dekomprimierten Betriebsbefehlen erfolgt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Identifikation jedes Benutzers ein aus einem oder mehreren Mehrfrequenztönen bestehender Code ist.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß in der Lernphase das Abspeichern der vorbestimmten, von den Benutzern gesproche­ nen und nach den Benutzern gruppierten Betriebsbefehle durch eine automa­ tische, mit Hilfe einer künstlichen Stimme erzeugte Eingabeaufforderung an den Benutzer zum Sprechen einer Reihe von Betriebsbefehlen veranlaßt wird.
4. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß die sprachgesteuerte Vorrichtung eine zentrale Rufsteuerungsvorrich­ tung ist.
5. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß die Identifikation jedes Benutzers die digitalisierte Form eines vorbe­ stimmten Worts ist.
6. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß der Verfahrensschritt des Indizierens der Identifikation eines ein An­ fragesignal ausgebenden Benutzers den Empfang eines vorbestimmten Anfra­ gesignals von dem Benutzer sowie des Vergleichs dieses Anfragesignals mit den Benutzeridentifikationen in dem Verzeichnis (13) umfaßt und die Identifikation nach Auffinden einer Korrespondenz zwischen beiden liefert.
7. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß die aufgerufenen Befehle umfassen: das Abrufen von Signalen aus ei­ nem Speicher entsprechend einer Funktion, das Abarbeiten dieser Signale unter Ausgabe gesprochener Eingabeaufforderungen an den Benutzer zur Ausführung einer vorbestimmten Prozedur, das Empfangen von Signalen, welche sich aus der Abarbeitung dieser Prozedur ergeben, von dem Benutzer und das Ausführen einer Befehlsfolge, welche sich aus dem Empfang dieser Signale ergibt.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die sich bei der Abarbeitung der Prozedur ergebenden Signale vom Benutzer gesprochene Worte umfassen und das Verfahren als weitere Schritte den Vergleich dieser Worte mit der dekomprimierten Gruppe von Befehlen sowie die Ausführung der Befehlsfolge bei Feststellung einer Korrespondenz zwischen beiden auf­ weist.
9. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß die Gruppen von Befehlen in einem Massenspeicher abgespeichert sind.
10. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß vor dem Abspeichern der Gruppe digitalisierter und komprimierter Betriebsbefehle auch die Zeiger digitalisiert und komprimiert werden und nach dem Dekomprimieren dieser Gruppe von Betriebsbefehlen auch die Zeiger de­ komprimiert werden.
11. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß in der automatischen Eingabeaufforderung die Aufforderung an den Benutzer enthalten ist, seinen Identifizierer auszusprechen sowie die Digitali­ sierung dieses Identifizierers erfolgt und zusätzlich vor dem Abspeichern der Gruppe von digitalisierten Betriebsbefehlen und Zeigern der von dem Benut­ zer gesprochene Identifizierer für diesen Benutzer empfangen und digitalisiert wird.
12. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß es zusätzlich den folgenden Verfahrensschritt umfaßt: Empfangen eines von dem Benutzer gesprochenen Identifizierers für diesen Benutzer und Umsetzung dieses gesprochenen Identifizierers in ein dem Benutzer zugeord­ netes Identifizierungssignal und das Vergleichen dieses Identifizierungssignals mit der Gruppe von Identifizierern von Benutzern zur Auffindung einer Über­ einstimmung vor dem Abrufen der Gruppe von Betriebsbefehlen aus dem Spei­ cher.
13. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich­ net, daß es zusätzlich das Abspeichern des Identifizierers des Benutzers in einer Gruppe von Identifizierern von Benutzern in einem Speicher umfaßt.
14. Verfahren nach einem der Ansprüche 3 bis 13, dadurch gekennzeichnet, daß die automatische Ausgabe einer Eingabeaufforderung den folgenden Ver­ fahrensschritt umfaßt: Generierung einer Stimme, welche den Benutzer in­ teraktiv zum Sprechen jedes Betriebsbefehls der Reihe von Betriebsbefehlen auffordert.
15. Sprachgesteuerte Vorrichtung mit
  • (a) einem Speicher zum Abspeichern von Steuerungssignalen für die Vorrich­ tung,
  • (b) einer Einrichtung zum Abspeichern von Betriebsbefehlen in einem ersten Speicher mit einem Zeiger auf ein korrespondierendes Steuerungssignal für die Vorrichtung,
  • (c) einer Einrichtung zum Abspeichern einer Gruppe von Betriebsbefehlen und Zeiger in einem Speicher mit einer Verbindung zu einem Identifizierer für den Benutzer,
  • (d) einer Einrichtung zum Empfang eines dem Benutzer zugeordneten Iden­ tifizierungssignals und zum darauffolgenden Abrufen der Gruppe von Be­ triebsbefehlen aus dem Speicher,
  • (e) einer Einrichtung zum Vergleichen der gesprochenen Befehle mit den im zweiten Speicher gespeicherten Betriebsbefehlen zur Auffindung von Übe­ reinstimmungen und
  • (f) einer Einrichtung zur Erzeugung aufeinanderfolgender und zu den als übereinstimmend herausgefundenen Befehlen korrespondierender Steuer­ signale für die Vorrichtung unter Verwendung zugeordneter Zeiger zum Betrieb der Vorrichtung,
    gekennzeichnet durch
  • (g) eine Einrichtung zur automatischen Aufforderung an den Benutzer zum Sprechen einer Reihe von Betriebsbefehlen,
  • (h) eine Digitalisierungsvorrichtung (11) zur Digitalisierung jedes gesproche­ nen Betriebsbefehls,
  • (i) eine Einrichtung zum Abspeichern der Gruppe von Betriebsbefehlen und Zeiger mit einem Komprimierer (17) zum Komprimieren dieser Gruppe von Betriebsbefehlen und Zeiger,
  • (j) eine Einrichtung zum Abrufen der Gruppe von Betriebsbefehlen und Zei­ ger und zu deren Abspeichern in dem zweiten Speicher mit einem Dekom­ primierer (17) zum Dekomprimieren dieser Gruppe von Betriebsbefehlen und Zeiger.
16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, daß die Einrich­ tung zur automatischen Ausgabe von Eingabeaufforderungen einen Sprach­ generator (9) umfaßt, welcher eine Stimme generiert, die den Benutzer auf­ fordert, jeden der Betriebsbefehle der genannten Reihe von Betriebsbefehlen auszusprechen.
DE4243181A 1991-12-31 1992-12-19 Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb Revoked DE4243181C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CA002058644A CA2058644C (en) 1991-12-31 1991-12-31 Voice activated telephone set

Publications (2)

Publication Number Publication Date
DE4243181A1 DE4243181A1 (de) 1993-07-01
DE4243181C2 true DE4243181C2 (de) 1996-12-19

Family

ID=4149012

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4243181A Revoked DE4243181C2 (de) 1991-12-31 1992-12-19 Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb

Country Status (5)

Country Link
CA (2) CA2149012C (de)
DE (1) DE4243181C2 (de)
GB (1) GB2263042B (de)
IT (1) IT1256746B (de)
MX (1) MX9207608A (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10143292A1 (de) * 2001-09-04 2003-03-20 Deutsche Telekom Ag Sprachfenster

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4315947C2 (de) * 1993-05-12 1995-11-16 Siemens Ag Anordnung zur Signalübertragung zwischen einer Audioeinrichtung und einer Fernsprecheinrichtung
JPH08274858A (ja) * 1995-03-30 1996-10-18 Kokusai Denshin Denwa Co Ltd <Kdd> ダイヤレス発信装置
SE513993C2 (sv) * 1995-05-22 2000-12-11 Telia Ab Anordning och metod vid röststyrning av funktioner i ett telekommunikationssystem
US5960395A (en) 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
DE19730920A1 (de) * 1997-07-18 1999-01-21 Ise Interactive Systems Entwic Computeranlage
US9232037B2 (en) 1999-10-20 2016-01-05 Curo Interactive Incorporated Single action sensory prompt interface utilising binary state time domain selection protocol
US6804539B2 (en) 1999-10-20 2004-10-12 Curo Interactive Incorporated Single action audio prompt interface utilizing binary state time domain multiple selection protocol
US6771982B1 (en) 1999-10-20 2004-08-03 Curo Interactive Incorporated Single action audio prompt interface utlizing binary state time domain multiple selection protocol

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10143292A1 (de) * 2001-09-04 2003-03-20 Deutsche Telekom Ag Sprachfenster
DE10143292B4 (de) * 2001-09-04 2015-06-03 Deutsche Telekom Ag Sprachfenster

Also Published As

Publication number Publication date
IT1256746B (it) 1995-12-15
GB2263042B (en) 1995-06-28
DE4243181A1 (de) 1993-07-01
CA2149012C (en) 1997-09-02
GB2263042A (en) 1993-07-07
CA2149012A1 (en) 1993-07-01
CA2058644A1 (en) 1993-07-01
MX9207608A (es) 1994-05-31
CA2058644C (en) 1996-06-18
ITMI922888A0 (it) 1992-12-18
GB9227115D0 (en) 1993-02-24
ITMI922888A1 (it) 1994-06-18

Similar Documents

Publication Publication Date Title
EP1466317B1 (de) Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner
DE2953262C2 (de)
EP0802522B1 (de) Anordnung und Verfahren zur Aktionsermittlung, sowie Verwendung der Anordnung und des Verfahrens
EP0994461A2 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung
EP0925578A1 (de) Sprachverarbeitungssystem und verfahren zur sprachverarbeitung
DE4225200A1 (de) Elektronisches woerterbuch
DE4243181C2 (de) Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb
DE3103805C2 (de) Verfahren und Einrichtung zur Datenerfassung
DE2946856C2 (de) Wortspeichergerät
EP1884924A1 (de) Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem
DE10054583A1 (de) Verfahren und Vorrichtung zur Behandlung von Sprachinformationen
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE69636731T2 (de) System und Verfahren zur Aufnahme von Namen in einer Spracherkennungsdatenbank
DE19532114C2 (de) Sprachdialog-System zur automatisierten Ausgabe von Informationen
EP1340169B1 (de) Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine
EP1125278B1 (de) Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte
DE102015212650B4 (de) Verfahren und System zum rechnergestützten Verarbeiten einer Spracheingabe
WO2001067435A9 (de) Verfahren zum sprachgesteuerten initiieren von in einem gerät ausführbaren aktionen durch einen begrenzten benutzerkreis
EP0814457B1 (de) Verfahren zur automatischen Erkennung eines gesprochenen Textes
DE60201907T2 (de) Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen
EP1214704B1 (de) Verfahren zum erfassen und auswerten von ein wort darstellenden wortsprachsignalen eines benutzers eines spracherkennungssystems
DE4111781A1 (de) Computersystem zur spracherkennung
DE19514849A1 (de) Verfahren zur Fernsteuerung und Vorrichtung dafür
EP1240775B1 (de) Kommunikationssystem und verfahren zum bereitstellen eines internet-zugangs über ein telefon
WO1989003083A1 (en) Systems architecture for an acoustic man/machine dialogue system

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: G10L 7/08

D2 Grant after examination
8363 Opposition against the patent
8339 Ceased/non-payment of the annual fee
8325 Change of the main classification

Ipc: G10L 15/22

8331 Complete revocation