DE4243181C2 - Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb - Google Patents
Sprachgesteuerte Vorrichtung und Verfahren zu deren BetriebInfo
- Publication number
- DE4243181C2 DE4243181C2 DE4243181A DE4243181A DE4243181C2 DE 4243181 C2 DE4243181 C2 DE 4243181C2 DE 4243181 A DE4243181 A DE 4243181A DE 4243181 A DE4243181 A DE 4243181A DE 4243181 C2 DE4243181 C2 DE 4243181C2
- Authority
- DE
- Germany
- Prior art keywords
- user
- commands
- operating
- spoken
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Revoked
Links
- 238000000034 method Methods 0.000 title claims description 37
- 230000015654 memory Effects 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 7
- 230000006837 decompression Effects 0.000 claims description 5
- 238000011022 operating instruction Methods 0.000 claims 6
- 240000001879 Digitalis lutea Species 0.000 claims 1
- 235000010678 Paulownia tomentosa Nutrition 0.000 claims 1
- 244000153888 Tung Species 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 7
- 230000002093 peripheral effect Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000003825 pressing Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42204—Arrangements at the exchange for service or number selection by voice
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
Description
Die Erfindung bezieht sich auf eine sprachgesteuerte Vorrichtung nach dem Ober
begriff des Anspruches 15 sowie auf ein Verfahren zu deren Betrieb nach dem Ober
begriff des Anspruches 1.
Spracherkennungssysteme, welche dazu verwendet werden können, Schaltvorrich
tungen oder stationäre Geräte, wie Computer und Telefoneinheiten, zu betätigen,
sind seit einiger Zeit bekannt. Bei einem Verfahren zum Betrieb derartiger Anla
gen werden die gesprochenen Worte analysiert und das Ergebnis dieser Analyse mit
einer standardisierten Datenbank, welche sich auf einem Massenspeichermedium be
findet, verglichen. Bei einer anderen Methode wird ein Lernprozeß eingesetzt, bei
welchem aufeinanderfolgende korrekte Vergleiche (Treffer) die Detektion üblicher
Laute verschiedener Benutzer verbessern, welche zur Erzeugung einer bestimmten
Systemantwort gesprochen werden. Während das System lernt, findet es die einzel
nen "Treffer" mit zunehmender Geschwindigkeit.
Beide genannten Methoden setzen, unabhängig davon ob sie einzeln oder in Kombi
nation miteinander angewendet werden, eine detaillierte Analyse der gesprochenen
Worte voraus und bedingen daher teure Gerätschaften und viel Zeit für die Ana
lyse. Aus diesem Grund wurden sie in zentralisierten Systemen eingesetzt, wo sie
von vielen Benutzern verwendet werden können. Die Komplexität und die Kosten
derartiger Systeme sind außerordentlich hoch.
Ein anderes, bereits bekanntes System ist jedem einzelnen Telefonapparat zuge
ordnet, wobei bei jedem Telefonapparat Sprachsignale gespeichert sind. Die von
den Benutzern gesprochenen Befehle werden von dem Spracherkennungssystem im
Telefonapparat durch Vergleich des Signals des gesprochenen Befehls mit dem ge
speicherten Audiosignal erkannt.
Derartige Systeme müssen an jedem einzelnen Telefonapparat vorhanden sein, wo
durch die Telefonapparate sehr teuer werden.
In dem Artikel von Klaus Sickert "Automatische Spracheingabe und Sprachausgabe,
Verlag Markt & Technik (1983), Seite 424-426" werden zwei Spracherkennungssy
steme, genannt ADES und V 5000, beschrieben. Diesen Systemen ist der Vergleich
von gesprochenen Befehlen mit abgelegten Betriebsbefehlen entnehmbar, um einen
bestimmten Befehl auszuführen. Dem Spracherkennungssystem V 5000 ist ferner
die Möglichkeit einer Datenkompression entnehmbar. Allerdings zeigt weder das
System ADES, noch das System V 5000 noch eine Kombination beider Systeme,
wie und zu welchem Zeitpunkt eine Datenkompression erfolgen soll. Beide Verfah
ren dauern lange, da im einen Fall zunächst das gesprochene Wort komprimiert
werden muß und im anderen Fall der gesamte Speicherinhalt, in welchem für jedes
Wort mehrere Sprachmuster enthalten sind, dekomprimiert werden muß.
Ferner ist aus der US 4,827,520 ein sprachgesteuertes Kontrollsystem für ein Fahr
zeug zu entnehmen, in welchem jedoch Datenkompressions- und -dekompressionstechniken
keine Rolle spielen.
Es stellt sich daher die Aufgabe, ein Verfahren zum Betrieb
einer sprachgesteuerten Vorrichtung so weiterzubilden,
daß es mit relativ billigen Geräten und bei geringem Rechneraufwand durchgeführt
werden kann und eine zugehörige sprachgesteuerte Vorrichtung anzugeben.
Gelöst wird diese Aufgabe durch die kennzeichnenden Merkmale der Ansprüche 1
bzw. 15. Vorteilhafte Ausgestaltungen sind den jeweiligen Unteransprüchen entnehm
bar.
Die vorliegende Erfindung besteht aus einem zentralisierten System, in welchem die
Stimmen der potentiellen Benutzer in digitalisierter Form zentral gespeichert wer
den. Die Worte eines begrenzten Befehlsvokabulars werden einzeln abgespeichert.
Jedes Sprachsignal wird digitalisiert, die digitalisierten Befehle werden gruppiert,
mit einem dem Telefon des Benutzers zugeordneten Code verbunden, komprimiert
und als Daten in einem zentralen Massenspeicher abgespeichert.
Wenn ein Benutzer sein Telefon aktiviert, wird die diesem Telefon zugeordnete Da
tengruppe aus dem Speicher gelesen, dekomprimiert und in einem virtuellen Spei
cher abgespeichert. Wenn der Benutzer einen der Systembefehle ausspricht, wird
dieser gesprochene Befehl digitalisiert und mit den in dem virtuellen Speicher ab
gespeicherten Befehlen verglichen. Wenn eine Übereinstimmung festgestellt wird,
wird die zugeordnete Systemfunktion ausgeführt. Typischerweise werden bis zu 20
Systembefehle verwendet.
Die vorliegende Erfindung weist gegenüber den bekannten Systemen verschiedene
Vorteile auf. Die Vorrichtung ist zentral angeordnet und wird von allen Benutzern
gemeinsam verwendet. Hierdurch ist es nicht mehr nötig, daß jeder einzelne Telefo
napparat sein eigenes Spracherkennungssystem und seinen eigenen Sprachspeicher
aufweist. Weil nur eine bestimmte Gruppe von Befehlen gespeichert wird, welche be
stimmten Benutzern zugeordnet sind, werden keine komplizierten Spracherkennungs-
und Sprachanalysevorrichtungen für alle möglichen Stimmen und alle möglichen
Worte benötigt. Nachdem eine Stimme identifiziert wurde, ist diese nur mit einer
geringen Anzahl von Befehlen, beispielsweise 20, zu vergleichen. Die Bestimmung
von Worten aus einem großen Wortschatz zur Anzeige auf einer Anzeigevorrichtung
oder zum Ausdruck ist nicht notwendig. Die Feststellung eines Befehls-"Treffers"
aus einer kleinen Anzahl von Befehlen führt dazu, daß die Vorrichtung den Befehl
ausführt.
Zur Erläuterung soll die vorliegende Erfindung mit einem Spracherkennungssystem
verglichen werden, welches zum automatischen Schreiben oder zur automatischen
Anzeige von Worten verwendet wird. Bei einem derartigen System muß jedes Wort
analysiert werden, sodann muß ein Vergleich mit einem auf einem Massenspeicher
befindlichen Wörterbuch durchgeführt werden und schließlich wird das Wort auf
einem Bildschirm oder einem Drucker ausgegeben. Ein derartiges System muß in der
Lage sein, die von allen möglichen Benutzern gesprochenen Worte zu unterscheiden,
wobei die Benutzer im allgemeinen verschiedene Stimmen, verschiedene Akzente
usw. haben. Hierbei ist jeder potentielle Sprecher der Sprache zu berücksichtigen,
im allgemeinen also viele Millionen Stimmen. Es ist offensichtlich, daß eine derartige
Vorrichtung sehr kompliziert und teuer in der Herstellung ist.
Auf der anderen Seite werden bei der vorliegenden Erfindung bestimmte spezifische
Kommandos gespeichert, welche einem einzelnen Benutzer zugeordnet sind. Die
Vergleichsvorrichtung muß nur eine Übereinstimmung zwischen einem gesprochenen
Befehl und einem vom selben Benutzer abgespeicherten Befehl finden. Es ist offen
sichtlich, daß der Vergleich zwischen dem gesprochenen und dem abgespeicherten
Befehl und das Auffinden eines Treffers erheblich einfacher ist. Die Ausrüstung wird
gemeinsam für alle potentiellen Benutzer ihrer entsprechenden Telefone eingesetzt,
was die Kosten für jeden einzelnen Benutzer weiter senkt.
Nachdem sich ein einzelner Benutzer identifiziert hat, werden alle potentiellen Be
fehle dieses Benutzers im virtuellen Speicher abgespeichert, wo sie zum Vergleich
mit dem aktuellen Befehl bereitstehen. Gemäß der vorliegenden Erfindung setzt
sich der Datenzugriffsprozeß aus zwei Schritten zusammen, nämlich der Erkennung
eines bestimmten Benutzers, worauf alle abgespeicherten Befehle dieses Benutzers
in einem virtuellen Speicher abgelegt werden und der darauffolgenden Erkennung
eines bestimmten Wortes, welches einem Befehl entspricht. Im Ergebnis ist das Ver
fahren zur Erkennung der einzelnen gesprochenen Befehle erheblich einfacher als die
Verfahren nach dem oben genannten Stand der Technik.
Ein Ausführungsbeispiel der Erfindung wird im folgenden unter Bezugnahme auf
die Zeichnungen näher beschrieben. Diese zeigen:
Fig. 1 ein Blockdiagramm der vorliegenden Erfindung,
Fig. 2 ein Blockdiagramm zur Darstellung des Verfahrens und der Hardware einer
Ausführungsform der vorliegenden Erfindung,
Fig. 3 ein Blockdiagramm zur Darstellung der Vorbereitung des Systems für einen
bestimmten Benutzer,
Fig. 4 ein Blockdiagramm wie in Fig. 3 zur Erläuterung eines anderen Aspekts
dieses Verfahrens,
Fig. 5 ein Blockdiagramm zur Darstellung des Betriebs des Systems beim Wähl
vorgang und
Fig. 6 ein Blockdiagramm zur Darstellung des Betriebs des Systems bei der Imple
mentierung eines Sonderfunktionsrufs.
In Fig. 1 ist das Blockdiagramm einer Vorrichtung dargestellt, welche zur Imple
mentierung einer Ausführungsform der vorliegenden Erfindung geeignet ist. Ein
Telefonapparat 1 ist über eine Teilnehmerleitung an eine Schaltvorrichtung 3 ange
schlossen, welche von einem Prozessor 5 gesteuert wird. An die Schaltvorrichtung 3
sind in bekannter Weise verschiedene Amtsleitungen und andere Peripherieeinheiten
angeschlossen.
An die Schaltvorrichtung 3 ist als Peripherieeinheit ein Digitalisierer 11 in einer
Weise angeschlossen, in der er über die Schaltvorrichtung mit jedem der Telefonappa
rate verbindbar ist. Der Ausgang eines Sprachgenerators 9 ist an denselben Periphe
rieausgang angeschlossen wie der Digitalisierer 11. An den Ausgang des Digitalisie
rers 11 ist ein Speicher angeschlossen, welcher ein Verzeichnis 13 enthält. Weiterhin
sind an den Ausgang des Digitalisierers 11 ein Speicher 15 und eine Komprimier-
/Dekomprimiereinheit 17 angeschlossen. Zusätzliche Speicher, welche als Sprachbo
xen 19A-19N bezeichnet werden, sind an die Komprimier-/Dekomprimiereinheit
17 angeschlossen. Der Eingang des Sprachgenerators 9 ist mit dem Speicher 15 zum
Empfang von Signalen verbunden, welche in künstliche Sprache umsetzbar und den
peripheren Terminals der Schaltvorrichtung 3 zuführbar sind.
Der Sprachgenerator und sämtliche Speicher sind zur Steuerung an den Prozessor 5
angeschlossen. Alternativ hierzu kann ein eigener Prozessor verwendet werden.
Die Schaltvorrichtung 3 kann bespielsweise unter Verwendung der Mittel SX 2000,
einem System wie es im US-Patent 4,615,028 beschrieben ist, implementiert werden.
Bei derartigen Systemen kann jede der Peripherieeinheiten Zugang zu anderen Peri
pherieeinheiten haben zur Übersetzung von Schaltkreissignalen oder Nachrichtensi
gnalen, beispielsweise Information, welche Nachrichten- und Steuersignale enthält.
Es können jedoch auch andere Schaltvorrichtungen verwendet werden.
Der Ablauf des erfindungsgemäßen Verfahrens wird im folgenden unter Bezugnahme
auf die Fig. 2 bis 6 näher beschrieben.
Zur Inbetriebnahme des erfindungsgemäßen Verfahrens setzt der Benutzer das Sy
stem durch Drücken einer bestimmten Taste an seinem Telefonapparat 1 in Betrieb.
Die von dem Prozessor 5 gesteuerte Schaltvorrichtung baut eine Verbindung zwi
schen dem Telefonapparat 1, dem Digitalisierer 11 und dem Verzeichnis 13 auf.
Unter der Steuerung des Prozessors wird die Identität des Telefonapparats (und
damit des Benutzers) im Verzeichnis 13 gespeichert.
Wie man aus Fig. 3 erkennen kann, setzt das System, nachdem es wie oben be
schrieben in Betrieb genommen wurde, in dem Verzeichnis die Identität des ent
sprechenden Benutzers ein. Die Identitäten von drei Benutzern, welche als Benut
zercode A, Benutzercode B und Benutzercode C identifiziert sind, sind gespeichert
dargestellt. Wenn der Benutzer B das System wie dargestellt in Betrieb nimmt,
wird für den Benutzer B eine "Sprachbox" (Speicheraufnahmeraum) im Speicher 15
aufgebaut. Nachdem dies erfolgt ist, erzeugt eine Reihe gespeicherter Eingabeauf
forderungen einen Code, welcher dem Sprachgenerator 9 zugeführt wird, der darauf
hin Sprache generiert, die dem Telefonapparat über die Schaltvorrichtung zugeführt
wird. Die Eingabeaufforderungen fordern den Benutzer auf, sie zu wiederholen, bei
spielsweise wie es in Fig. 3 dargestellt ist, die Worte "Wählen", "Eins", "Zwei", . . .
sowie eine Reihe angebotener Funktionsnamen, beispielsweise "Rufumleitung".
Der Benutzer wiederholt die Eingabeaufforderungen, worauf die wiederholten Ein
gabeaufforderungen durch den Digitalisierer 11 geleitet und als digitale Signale in
der Sprachbox für den Benutzer B im Systemspeicher abgespeichert werden. Die
Sprachbox des Benutzers B enthält weiterhin bei jeder digitalisierten wiederholten
Eingabeaufforderung einen Zeiger auf ein Systembefehlssignal, welches dem jewei
ligen Wort entspricht, beispielsweise einen "Wählen"-Zeiger, einen "Eins"-Zeiger,
einen "Zwei"-Zeiger, einen besonderen Funktionsnamenzeiger, usw. Diese Zeiger
werden zur Erzeugung des Befehlssignals benötigt, beispielsweise zur Erzeugung der
Ziffer "1", usw.
Wie in Fig. 4 dargestellt, werden die digitalisierte Sprache und die digitalisierten
Zeiger (die Sprachbox des Benutzers) nach Abspeicherung der wiederholten Ein
gabeaufforderungen in dem System in einer Komprimier-/Dekomprimiereinheit 17
komprimiert und als Gruppe auf einem Massenspeicher mit einer Verbindung zu
dem Systemverzeichnis abgespeichert. Dies wird für jeden einzelnen Benutzer der
Reihe nach wiederholt.
In dem Systemspeicher enthält also ein Verzeichnis 13 eine Verbindung zu jedem
Benutzer mit Hilfe von Zeigern. In dem Massenspeicher befindet sich für jeden Be
nutzer eine abgespeicherte Sprachbox, wobei jede dieser Sprachboxen komprimierte
Eingabeaufforderungen der Stimme des entsprechenden Benutzers für jeden Befehl
enthält. Jede Sprachbox enthält eine Verbindung für den Verzeichniszugang für den
entsprechenden Benutzer.
Wie man aus Fig. 5 erkennen kann, nimmt der Benutzer, beispielsweise Benutzer
B, das System durch Drücken einer Taste auf seinem Telefonapparat in Betrieb,
wodurch ein Mehrfrequenzton erzeugt wird oder indem er seinen Namen ausspricht,
worauf die Schaltvorrichtung 3 den Telefonapparat 1 auf die Peripherieleitung schal
tet, an welche der Digitalisierer 11 angeschlossen ist. Das sich aus dem Tastendruck
oder der Namensaussprache ergebende Signal wird im Digitalisierer 11 digitalisiert
und wird unter der Steuerung des Prozessors 5 mit den im Systemverzeichnis 13
gespeicherten Daten verglichen. Diese Aufgabe ist einfach, weil nur diese Namen,
in den Stimmen der einzelnen Benutzer im Verzeichnis 13 abgespeichert sind. Bei
Auffinden einer Übereinstimmung führt die mit der übereinstimmenden Stimme kor
respondierende Verbindung zur Sprachbox zum Zugang zu der korrekten Sprachbox.
Die Signale der Sprachbox werden dekomprimiert und in einem Speicher 15 abge
speichert, und zwar zur Minimierung der Speicheranforderungen vorzugsweise in
einem virtuellen Speicher. Nach dem Auffinden der Sprachbox wird das System auf
den Empfang gesprochener Befehle umgestellt und der Mikroprozessor 5 belegt den
Telefonapparat des Benutzers mit dem Wählton, nachdem er erkannt hat, daß die
Sprachbox dieses Benutzers im Speicher 15 abgespeichert wurde.
Der Benutzer spricht dann die gewünschten Worte oder Sätze, beispielsweise "Wählen",
"Sieben", "Zwei", . . ., also beispielsweise einen Befehl zum Wählen einer bestimmten
Telefonnummer. Die Sprachsignale werden im Digitalisierer 11 digitalisiert und mit
Hilfe des Mikroprozessors 5 mit den Daten verglichen, welche in der dekomprimier
ten Sprachbox im Speicher 15 für den aktuellen Benutzer abgespeichert sind, im
dargestellten Beispiel Benutzer B. Weil die einzelnen Befehle in der Sprachbox in
der Stimme des aktuellen Benutzers abgespeichert wurden, ist der Vergleich der di
gitalisierten Befehlssignale mit den in der Sprachbox enthaltenen Signalen erheblich
einfacher und schneller durchzuführen als ein eventueller Vergleich einer beliebigen
Stimme mit beliebigen Worten. Die einzige Stimme, mit welcher verglichen werden
muß, ist die aktuelle Stimme, welche die Befehle erteilt.
Bei Auffinden einer Übereinstimmung mit einem Befehl erhält man den Zeiger, der
dem als übereinstimmend festgestellten Wort entspricht, beispielsweise zum Beginn
des Wählvorgangs und der darauffolgenden Bezeichnung der zu wählenden Ziffern.
Die mit den Sprachboxbefehlen gespeicherten Befehlszeiger werden über den
Mikroprozessor 5 aufgefunden und steuern die Schaltvorrichtung zur Ausführung der
gewünschten Operation.
In Fig. 6, welche dem unteren Teil von Fig. 5 entspricht, ist der Betrieb des
erfindungsgemäßen Verfahrens beim Aufruf einer Funktion dargestellt. In der Figur
ist dargestellt, daß ein gewählter Ton dem Benutzer zurückgeführt wird, wie es oben
beschrieben ist.
Anstelle der Angabe des Befehls "Wählen" oder einer Ziffer kann der Benutzer auch
eine Funktion aufrufen, beispielsweise "Rufumleitung". Nach der Digitalisierung
wird ein Vergleich durchgeführt, bei dem die Funktion "Rufumleitung", welche in
der Sprachbox des Benutzers B abgespeichert ist, aufgefunden wird. In diesem Fall
zeigt der Zeiger auf eine Funktionsoperation und die Beschreibungsliste 21 in dem
Massenspeicher und ruft entsprechende Befehlsdatensignale für die Rufumleitung
ab, welche darin gespeichert sind. Die entsprechenden Datensignale werden dem
Speicher 15 zugeführt. Unter der Steuerung des Mikroprozessors 5, welcher Zugang
zu der Rufumleitungsoperation und den Beschreibungsdatensignalen hat, wird der
Benutzer interaktiv durch die notwendigen Schritte zur Ausführung der Funktion
geführt. Beispielsweise können die Worte "Geben Sie die Nummer an, zu welcher
die Rufumleitung erfolgen soll und sagen Sie dann das Wort TRANSFER" aus dem
Speicher 15 abgerufen und dem Sprachgenerator 9 zugeführt werden, welcher den
Satz analogisiert und ihn über die Teilnehmerleitung dem Telefon 1 des Benutzers
zuführt. Der Benutzer gibt dann die Ziffern an, welche mit den abgespeicherten
Nummern in der Sprachbox im Speicher 15 verglichen werden. Die sich hieraus er
gebenden Zeiger und die Funktion der oben beschriebenen Rufumleitung verwendet
das System, um die Schaltvorrichtung so zu steuern, daß zukünftige Anrufe an die
gewünschte Teilnehmerleitung umgeleitet werden.
Auf diese Weise ahmt das vorliegende Telefonsystem die benutzerfreundliche Be
triebsweise altmodischer Vermittlungsstellen nach, bei denen der Benutzer mit dem
"Fräulein vom Amt" sprechen kann. Wenn komplizierte Funktionen ausgeführt wer
den sollen, hört der Benutzer in einer freundlichen und verständlichen Stimme An
leitungen darüber, wie die Funktion auszuführen ist, wobei diese Anweisungen in
Form einer Konversation erfolgen können.
Weil in dem System vorher festgelegte Befehlsworte von bestimmten Benutzern ge
speichert sind, ist die Aufgabe, die gesprochenen Befehle mit den zugehörigen abge
speicherten Sprachsignalen zu vergleichen, relativ einfach. Das System kann daher
sehr schnell arbeiten und für eine große Anzahl von Benutzern kann ein zentrales
System verwendet werden. Weil die abgespeicherten Signale in den beschriebenen
Sprachboxen in einer komprimierten Form vorhanden sind, kann ein derartiges Sy
stem bei relativ geringen Kosten für eine große Anzahl von Benutzern verwendet
werden.
Claims (16)
1. Verfahren zum Betrieb einer sprachgesteuerten Vorrichtung, umfassend
in einer Lernphase
- (a) das Abspeichern von Steuerungssignalen für die Vorrichtung,
- (b) das Abspeichern von vorbestimmten, von den Benutzern gesprochenen und nach den Benutzern gruppierten Betriebsbefehlen, und während des laufenden Betriebs
- (c) das Indizieren der Identifikation eines bestimmten Benutzers nach Emp fang eines Anfragesignals,
- (d) das Empfangen gesprochener Befehle von einem Benutzer,
- (e) das Vergleichen dieser gesprochenen Befehle mit den abgespeicherten Be triebsbefehlen dieses Benutzers zur Auffindung von Übereinstimmungen,
- (f) das Erzeugen von Steuersignalen für die Vorrichtung, welche den aufge
fundenen Übereinstimmungen zwischen den Befehlen entsprechen,
dadurch gekennzeichnet, daß
in der Lernphase - (g) die Identifikation jedes Benutzers (1 . . . N) in einem Verzeichnis (13) abgespeichert wird,
- (h) die von den Benutzern gesprochenen und nach diesen gruppierten Befehle
in digitalisierter und komprimierter Form abgespeichert werden und jede
Gruppe einen Zeiger zu einer korrespondierenden Identifikation in dem
Verzeichnis (13) aufweist,
und während des laufenden Betriebs - (i) nach dem Indizieren der Identifikation eines bestimmten Benutzers in dem Verzeichnis (13) das Abrufen der korrespondierenden Gruppe von Betriebsbefehlen erfolgt, welche über den Zeiger mit dieser Identifikation verbunden sind sowie die Dekomprimierung der darin enthaltenen Be triebsbefehle, und
- (j) das Vergleichen der gesprochenen Befehle mit diesen dekomprimierten Betriebsbefehlen erfolgt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Identifikation
jedes Benutzers ein aus einem oder mehreren Mehrfrequenztönen bestehender
Code ist.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß in der
Lernphase das Abspeichern der vorbestimmten, von den Benutzern gesproche
nen und nach den Benutzern gruppierten Betriebsbefehle durch eine automa
tische, mit Hilfe einer künstlichen Stimme erzeugte Eingabeaufforderung an
den Benutzer zum Sprechen einer Reihe von Betriebsbefehlen veranlaßt wird.
4. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß die sprachgesteuerte Vorrichtung eine zentrale Rufsteuerungsvorrich
tung ist.
5. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß die Identifikation jedes Benutzers die digitalisierte Form eines vorbe
stimmten Worts ist.
6. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß der Verfahrensschritt des Indizierens der Identifikation eines ein An
fragesignal ausgebenden Benutzers den Empfang eines vorbestimmten Anfra
gesignals von dem Benutzer sowie des Vergleichs dieses Anfragesignals mit den
Benutzeridentifikationen in dem Verzeichnis (13) umfaßt und die Identifikation
nach Auffinden einer Korrespondenz zwischen beiden liefert.
7. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß die aufgerufenen Befehle umfassen: das Abrufen von Signalen aus ei
nem Speicher entsprechend einer Funktion, das Abarbeiten dieser Signale unter
Ausgabe gesprochener Eingabeaufforderungen an den Benutzer zur Ausführung
einer vorbestimmten Prozedur, das Empfangen von Signalen, welche sich aus
der Abarbeitung dieser Prozedur ergeben, von dem Benutzer und das Ausführen
einer Befehlsfolge, welche sich aus dem Empfang dieser Signale ergibt.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die sich bei
der Abarbeitung der Prozedur ergebenden Signale vom Benutzer gesprochene
Worte umfassen und das Verfahren als weitere Schritte den Vergleich dieser
Worte mit der dekomprimierten Gruppe von Befehlen sowie die Ausführung
der Befehlsfolge bei Feststellung einer Korrespondenz zwischen beiden auf
weist.
9. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß die Gruppen von Befehlen in einem Massenspeicher abgespeichert
sind.
10. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß vor dem Abspeichern der Gruppe digitalisierter und komprimierter
Betriebsbefehle auch die Zeiger digitalisiert und komprimiert werden und nach
dem Dekomprimieren dieser Gruppe von Betriebsbefehlen auch die Zeiger de
komprimiert werden.
11. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß in der automatischen Eingabeaufforderung die Aufforderung an den
Benutzer enthalten ist, seinen Identifizierer auszusprechen sowie die Digitali
sierung dieses Identifizierers erfolgt und zusätzlich vor dem Abspeichern der
Gruppe von digitalisierten Betriebsbefehlen und Zeigern der von dem Benut
zer gesprochene Identifizierer für diesen Benutzer empfangen und digitalisiert
wird.
12. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß es zusätzlich den folgenden Verfahrensschritt umfaßt: Empfangen
eines von dem Benutzer gesprochenen Identifizierers für diesen Benutzer und
Umsetzung dieses gesprochenen Identifizierers in ein dem Benutzer zugeord
netes Identifizierungssignal und das Vergleichen dieses Identifizierungssignals
mit der Gruppe von Identifizierern von Benutzern zur Auffindung einer Über
einstimmung vor dem Abrufen der Gruppe von Betriebsbefehlen aus dem Spei
cher.
13. Verfahren nach einem der voranstehenden Ansprüche, dadurch gekennzeich
net, daß es zusätzlich das Abspeichern des Identifizierers des Benutzers in einer
Gruppe von Identifizierern von Benutzern in einem Speicher umfaßt.
14. Verfahren nach einem der Ansprüche 3 bis 13, dadurch gekennzeichnet,
daß die automatische Ausgabe einer Eingabeaufforderung den folgenden Ver
fahrensschritt umfaßt: Generierung einer Stimme, welche den Benutzer in
teraktiv zum Sprechen jedes Betriebsbefehls der Reihe von Betriebsbefehlen
auffordert.
15. Sprachgesteuerte Vorrichtung mit
- (a) einem Speicher zum Abspeichern von Steuerungssignalen für die Vorrich tung,
- (b) einer Einrichtung zum Abspeichern von Betriebsbefehlen in einem ersten Speicher mit einem Zeiger auf ein korrespondierendes Steuerungssignal für die Vorrichtung,
- (c) einer Einrichtung zum Abspeichern einer Gruppe von Betriebsbefehlen und Zeiger in einem Speicher mit einer Verbindung zu einem Identifizierer für den Benutzer,
- (d) einer Einrichtung zum Empfang eines dem Benutzer zugeordneten Iden tifizierungssignals und zum darauffolgenden Abrufen der Gruppe von Be triebsbefehlen aus dem Speicher,
- (e) einer Einrichtung zum Vergleichen der gesprochenen Befehle mit den im zweiten Speicher gespeicherten Betriebsbefehlen zur Auffindung von Übe reinstimmungen und
- (f) einer Einrichtung zur Erzeugung aufeinanderfolgender und zu den als
übereinstimmend herausgefundenen Befehlen korrespondierender Steuer
signale für die Vorrichtung unter Verwendung zugeordneter Zeiger zum
Betrieb der Vorrichtung,
gekennzeichnet durch - (g) eine Einrichtung zur automatischen Aufforderung an den Benutzer zum Sprechen einer Reihe von Betriebsbefehlen,
- (h) eine Digitalisierungsvorrichtung (11) zur Digitalisierung jedes gesproche nen Betriebsbefehls,
- (i) eine Einrichtung zum Abspeichern der Gruppe von Betriebsbefehlen und Zeiger mit einem Komprimierer (17) zum Komprimieren dieser Gruppe von Betriebsbefehlen und Zeiger,
- (j) eine Einrichtung zum Abrufen der Gruppe von Betriebsbefehlen und Zei ger und zu deren Abspeichern in dem zweiten Speicher mit einem Dekom primierer (17) zum Dekomprimieren dieser Gruppe von Betriebsbefehlen und Zeiger.
16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, daß die Einrich
tung zur automatischen Ausgabe von Eingabeaufforderungen einen Sprach
generator (9) umfaßt, welcher eine Stimme generiert, die den Benutzer auf
fordert, jeden der Betriebsbefehle der genannten Reihe von Betriebsbefehlen
auszusprechen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002058644A CA2058644C (en) | 1991-12-31 | 1991-12-31 | Voice activated telephone set |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4243181A1 DE4243181A1 (de) | 1993-07-01 |
DE4243181C2 true DE4243181C2 (de) | 1996-12-19 |
Family
ID=4149012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4243181A Revoked DE4243181C2 (de) | 1991-12-31 | 1992-12-19 | Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb |
Country Status (5)
Country | Link |
---|---|
CA (2) | CA2149012C (de) |
DE (1) | DE4243181C2 (de) |
GB (1) | GB2263042B (de) |
IT (1) | IT1256746B (de) |
MX (1) | MX9207608A (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10143292A1 (de) * | 2001-09-04 | 2003-03-20 | Deutsche Telekom Ag | Sprachfenster |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4315947C2 (de) * | 1993-05-12 | 1995-11-16 | Siemens Ag | Anordnung zur Signalübertragung zwischen einer Audioeinrichtung und einer Fernsprecheinrichtung |
JPH08274858A (ja) * | 1995-03-30 | 1996-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | ダイヤレス発信装置 |
SE513993C2 (sv) * | 1995-05-22 | 2000-12-11 | Telia Ab | Anordning och metod vid röststyrning av funktioner i ett telekommunikationssystem |
US5960395A (en) | 1996-02-09 | 1999-09-28 | Canon Kabushiki Kaisha | Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming |
DE19730920A1 (de) * | 1997-07-18 | 1999-01-21 | Ise Interactive Systems Entwic | Computeranlage |
US9232037B2 (en) | 1999-10-20 | 2016-01-05 | Curo Interactive Incorporated | Single action sensory prompt interface utilising binary state time domain selection protocol |
US6804539B2 (en) | 1999-10-20 | 2004-10-12 | Curo Interactive Incorporated | Single action audio prompt interface utilizing binary state time domain multiple selection protocol |
US6771982B1 (en) | 1999-10-20 | 2004-08-03 | Curo Interactive Incorporated | Single action audio prompt interface utlizing binary state time domain multiple selection protocol |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4827520A (en) * | 1987-01-16 | 1989-05-02 | Prince Corporation | Voice actuated control system for use in a vehicle |
-
1991
- 1991-12-31 CA CA002149012A patent/CA2149012C/en not_active Expired - Lifetime
- 1991-12-31 CA CA002058644A patent/CA2058644C/en not_active Expired - Lifetime
-
1992
- 1992-12-18 IT ITMI922888A patent/IT1256746B/it active IP Right Grant
- 1992-12-19 DE DE4243181A patent/DE4243181C2/de not_active Revoked
- 1992-12-29 MX MX9207608A patent/MX9207608A/es unknown
- 1992-12-30 GB GB9227115A patent/GB2263042B/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10143292A1 (de) * | 2001-09-04 | 2003-03-20 | Deutsche Telekom Ag | Sprachfenster |
DE10143292B4 (de) * | 2001-09-04 | 2015-06-03 | Deutsche Telekom Ag | Sprachfenster |
Also Published As
Publication number | Publication date |
---|---|
IT1256746B (it) | 1995-12-15 |
GB2263042B (en) | 1995-06-28 |
DE4243181A1 (de) | 1993-07-01 |
CA2149012C (en) | 1997-09-02 |
GB2263042A (en) | 1993-07-07 |
CA2149012A1 (en) | 1993-07-01 |
CA2058644A1 (en) | 1993-07-01 |
MX9207608A (es) | 1994-05-31 |
CA2058644C (en) | 1996-06-18 |
ITMI922888A0 (it) | 1992-12-18 |
GB9227115D0 (en) | 1993-02-24 |
ITMI922888A1 (it) | 1994-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1466317B1 (de) | Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner | |
DE2953262C2 (de) | ||
EP0802522B1 (de) | Anordnung und Verfahren zur Aktionsermittlung, sowie Verwendung der Anordnung und des Verfahrens | |
EP0994461A2 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung | |
EP0925578A1 (de) | Sprachverarbeitungssystem und verfahren zur sprachverarbeitung | |
DE4225200A1 (de) | Elektronisches woerterbuch | |
DE4243181C2 (de) | Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb | |
DE3103805C2 (de) | Verfahren und Einrichtung zur Datenerfassung | |
DE2946856C2 (de) | Wortspeichergerät | |
EP1884924A1 (de) | Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem | |
DE10054583A1 (de) | Verfahren und Vorrichtung zur Behandlung von Sprachinformationen | |
EP1282897B1 (de) | Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems | |
DE69636731T2 (de) | System und Verfahren zur Aufnahme von Namen in einer Spracherkennungsdatenbank | |
DE19532114C2 (de) | Sprachdialog-System zur automatisierten Ausgabe von Informationen | |
EP1340169B1 (de) | Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine | |
EP1125278B1 (de) | Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte | |
DE102015212650B4 (de) | Verfahren und System zum rechnergestützten Verarbeiten einer Spracheingabe | |
WO2001067435A9 (de) | Verfahren zum sprachgesteuerten initiieren von in einem gerät ausführbaren aktionen durch einen begrenzten benutzerkreis | |
EP0814457B1 (de) | Verfahren zur automatischen Erkennung eines gesprochenen Textes | |
DE60201907T2 (de) | Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen | |
EP1214704B1 (de) | Verfahren zum erfassen und auswerten von ein wort darstellenden wortsprachsignalen eines benutzers eines spracherkennungssystems | |
DE4111781A1 (de) | Computersystem zur spracherkennung | |
DE19514849A1 (de) | Verfahren zur Fernsteuerung und Vorrichtung dafür | |
EP1240775B1 (de) | Kommunikationssystem und verfahren zum bereitstellen eines internet-zugangs über ein telefon | |
WO1989003083A1 (en) | Systems architecture for an acoustic man/machine dialogue system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G10L 7/08 |
|
D2 | Grant after examination | ||
8363 | Opposition against the patent | ||
8339 | Ceased/non-payment of the annual fee | ||
8325 | Change of the main classification |
Ipc: G10L 15/22 |
|
8331 | Complete revocation |