DE4427444B4 - Einrichtung und Verfahren zur Sprachsteuerung eines Geräts - Google Patents
Einrichtung und Verfahren zur Sprachsteuerung eines Geräts Download PDFInfo
- Publication number
- DE4427444B4 DE4427444B4 DE19944427444 DE4427444A DE4427444B4 DE 4427444 B4 DE4427444 B4 DE 4427444B4 DE 19944427444 DE19944427444 DE 19944427444 DE 4427444 A DE4427444 A DE 4427444A DE 4427444 B4 DE4427444 B4 DE 4427444B4
- Authority
- DE
- Germany
- Prior art keywords
- memory
- signals
- commands
- comparison
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Revoked
Links
- 238000000034 method Methods 0.000 title claims description 20
- 230000015654 memory Effects 0.000 claims abstract description 37
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuits Of Receivers In General (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Einrichtung zur Sprachsteuerung eines Geräts, mit Hilfe von den Betrieb des Geräts beeinflussenden Befehlen, wobei auf einer Anzeigevorrichtung (9) in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, gekennzeichnet durch einen Speicher (12) zur Speicherung von jeweils über ein Mikrofon (10) empfangenen Sprachsignalen oder davon abgeleiteten Signalen, wobei die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils auf der Anzeigevorrichtung (9) dargestellten Befehlen entsprechen, verglichen werden und wobei derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
Description
- Die Erfindung betrifft eine Einrichtung und ein Verfahren zur Sprachsteuerung eines Geräts mit Hilfe von den Betrieb des Gerätes beeinflussenden Befehlen.
- Zur Steuerung von Anlagen und Geräten werden in zunehmendem Maße Spracheingaben verwendet, wobei über ein Mikrofon aufgenommene Befehle des Benutzers mit Hilfe von Spracherkennungsverfahren erkannt werden. Hierbei wird zwischen sprecherabhängigen und sprecherunabhängigen Spracherkennungsverfahren unterschieden, wobei die sprecherabhängige Spracherkennung einen begrenzten, festen Befehlssatz aufweist, der durch den Benutzer trainiert werden muss. Dazu wird in einer Lernphase jeder Befehl durch den Benutzer mehrmals wiederholt, damit sich die Spracherkennungseinrichtung auf die Phonetik des Benutzers einstellen kann.
- Die sprecherunabhängige Spracherkennung arbeitet ebenfalls mit einem begrenzten, fest definierten Befehlssatz, wobei allerdings das Spracherkennungsverfahren so "intelligent" ist, dass kein Training mehr erforderlich ist.
- Beiden Verfahren ist gemeinsam, dass nur ein begrenzter, fest vorgegebener Befehlsvorrat erkannt werden kann. Diesen muss der Benutzer in der Regel auswendig lernen. Je größer die Anzahl der Befehle ist,, je höhere Anforderungen werden an das Spracherkennungsverfahren und an das Gedächtnis des Benutzers gestellt.
- Diese Nachteile der bekannten Spracherkennungsverfahren erschweren die Sprachsteuerung, beispielsweise eines Autoradios, besonders stark. Bei diesen Geräten ist nämlich die Anzahl der erforderlichen Befehle relativ groß, unter anderem durch die Vielzahl der Sender, auf die ein Autoradio, insbesordere während einer längeren Fahrt, einzustellen ist.
- Aus der
DE 3636678 A1 ist eine Röntgendiagnostikeinrichtung bekannt, die zur Steuerung eine Anzeige und eine Spracheingabe und -ausgabe aufweist. In der Anzeige sind Buchstaben dargestellt, die bestimmte Befehle der Steuereinrichtung kennzeichnen. Durch die Aussprache eines der Buchstaben wird ein entsprechender Befehl entweder simuliert oder ausgeführt. - Aufgabe der vorliegenden Erfindung ist, eine Einrichtung und ein Verfahren zur Sprachsteuerung eines Geräts unter Vermeidung der obengenannten Nachteile vorzuschlagen, um insbesondere dem Benutzer ein Auswendiglernen vieler Befehle zu ersparen und eine Spracherkennung zu verbessern und zu beschleunigen.
- Diese Aufgabe wird erfindungsgemäß dadurch gelöst, dass auf einer Anzeigevorrichtung in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, dass ein Speicher zur Speicherung von jeweils über ein Mikrofon empfangenen Sprachsignalen oder davon abgeleiteten Signalen vorgesehen ist, wobei die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils in der Anzeigevorrichtung dargestellten Befehlen entsprechen, verglichen werden und dass derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
- Die erfindungsgemäße Einrichtung und das erfindungsgemäße Verfahren haben einerseits den Vorteil, daß dem Benutzer angezeigt wird, welche Befehle bei dem jeweils vorhandenen Betriebszustand der Anlage und des Gerätes eingegeben werden können. Dabei ist nicht nur die Auswahl als solche von Vorteil, sondern auch die Sichtbarmachung der einzelnen Befehle, wodurch der Benutzer gehalten wird, die vorgegebenen Wörter zu verwenden. So wird beispielsweise die versehentliche Benutzung eines für das Spracherkennungssystem nicht erkennbaren Synonyms durch den Benutzer vermieden. Andererseits haben die erfindungsgemäße Einrichtung und das erfindungsgemäße Verfahren den Vorteil, daß die Spracherkennungseinrichtung die empfangenen Sprachsignale trotz einer großen Anzahl von insgesamt möglichen Befehlen nur mit jeweils wenigen im Menü dargestellten Befehlen vergleichen muß. Dadurch kann ein einfaches und sicheres Spracherkennungsverfahren gewählt werden.
- Eine Weiterbildung der erfindungsgemäßen Einrichtung und des erfindungsgemäßen Verfahrens besteht darin, daß die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher abgelegt werden. Dieses hat den Vorteil, daß der Hersteller der Anlagen und Geräte und gegebenenfalls auch der Benutzer bei Änderungen der Befehlsauswahllisten (Menüs) bzw. der einzelnen Befehle neue Befehle lediglich in Form von Text, beispielsweise sogenannten ASCII-Zeichen, eingeben kann, die dann in die zu vergleichenden sprachrelevanten Signale umgewandelt werden.
- Bei der erfindungsgemäßen Einrichtung und dem erfindungsgemäßen Verfahren kann ferner vorgesehen sein, daß der Speicher und der weitere Speicher Analogspeicher sind und daß der Vergleich mit Analogsignalen erfolgt oder daß der Speicher und der weitere Speicher digitale Speicher sind und daß der Vergleich mit digitalen Signalen erfolgt.
- Je nach Voraussetzungen im einzelnen kann auch eine Ausführungsform vorteilhafter sein, die darin besteht, daß die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem Speicher abgelegt sind und daß der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
- Eine weitere vorteilhafte Ausgestaltung der erfindungsgemäßen Einrichtung besteht darin, daß die sprachrelevanten Signale die Grundmodulation beim Sprechen des jeweiligen Befehls darstellen. Hierdurch ist ein einfacher Vergleich der gespeicherten mit den sprachrelevanten Signalen möglich.
- Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt und in der nachfolgenden Beschreibung näher erläutert.
- Bei dem dargestellten Ausführungsbeispiel wird mit einer erfindungsgemäßen Einrichtung ein Autoradio sprachgesteuert, das schematisch durch einen Empfangsteil
1 mit einer Antenne2 , einen Signalverarbeitungsteil3 , zwei Endstufen4 ,5 und Lautsprecher6 ,7 dargestellt ist. Der Signalverarbeitungsteil3 kann in an sich bekannter Weise beispielsweise einen Stereodecoder, einen Radio-Datensignal-Decoder, einen Verkehrsfunkdecoder sowie Lautstärke- und Klangsteller enthalten. - Das Empfangsteil
1 und das Signalverarbeitungsteil3 werden von einem Mikrocomputer8 gesteuert, der von dem Signalverarbeitungsteil3 auch verschiedene Daten, wie beispielsweise decodierte Radio-Datensignale erhält. Ein Ausgang des Mikrocomputers8 ist mit einer Anzeigevorrichtung (Display)9 verbunden, die ein Menü mit, den im jeweiligen Betriebszustand des Autoradios ausführbaren Befehlen zeigt. Dieses kann beispielsweise eine Liste von Einstellungen wie "Kassette", "UKW", "Mittelwelle", "Verkehrsfunk" oder eine Auswahl der jweils zu empfangenden Sender sein. Bei bekannten Eingabeeinrichtungen, die nicht sprachgesteuert sind, wird die Einstellung eines der Sender durch einen Druck auf eine Taste, die neben dem Namen des Senders angeordnet ist, bewirkt. - Bei der erfindungsgemäßen Einrichtung zur Sprachsteuerung ist ein Mikrofon
10 vorgesehen, dessen Ausgangssignale über einen Verstärker11 einem Speicher12 zugeführt werden. Außer der Anzeigevorrichtung9 ist an dem Mikrocomputer8 ein Sprachcodierer13 angeschlossen, dessen Ausgangssignale synthetische Sprachsignale darstellen und in einen Speicher14 einschreibbar sind. Verfahren zur Sprachcodierung sind an sich bekannt, beispielsweise durch das Computerprogramm SAY für den Computer Amiga. Die Inhalte der Speicher12 und des Speichers14 können in einer Vergleichseinrichtung15 verglichen werden. Stimmt eines der im Sprachcodierer13 erzeugten Signale mit dem im Speicher12 vorhandenen Signal überein – einschließlich eines Toleranzbereichs – wird dem Mikrocomputer8 gemeldet, welches der sprachrelevanten Signale, das heißt, welcher Befehl aus dem dargestellten Menü, mit dem eingegebenen Befehl übereinstimmt. Die entsprechende Funktion wird dann vom Mikrocomputer8 ausgeführt. - Danach kann dann gegebenenfalls ein anderes Menü mit Hilfe der Anzeigevorrichtung
9 sichtbar gemacht werden, wobei die im Menü aufgeführten Daten dem Sprachcodierer13 zugeführt werden, worauf eine neue Spracheingabe möglich ist.
Claims (11)
- Einrichtung zur Sprachsteuerung eines Geräts, mit Hilfe von den Betrieb des Geräts beeinflussenden Befehlen, wobei auf einer Anzeigevorrichtung (
9 ) in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, gekennzeichnet durch einen Speicher (12 ) zur Speicherung von jeweils über ein Mikrofon (10 ) empfangenen Sprachsignalen oder davon abgeleiteten Signalen, wobei die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils auf der Anzeigevorrichtung (9 ) dargestellten Befehlen entsprechen, verglichen werden und wobei derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird. - Einrichtung nach Anspruch 1, dadurch gekennzeichnet, dass die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher (
14 ) abgelegt werden. - Einrichtung nach Anspruch 2, dadurch gekennzeichnet, dass der Speicher (
12 ) und der weitere Speicher (14 ) Analogspeicher sind und dass der Vergleich mit Analogsignalen erfolgt. - Einrichtung nach Anspruch 2, dadurch gekennzeichnet, dass der Speicher (
12 ) und der weitere Speicher (14 ) digitale Speicher sind und dass der Vergleich mit digitalen Signalen erfolgt. - Einrichtung nach Anspruch 1, dadurch gekennzeichnet, dass die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem. Speicher abgelegt sind und dass der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
- Einrichtung nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die sprachrelevanten Signale die Grundmodulation beim Sprechen des jeweiligen Befehls darstellen.
- Verfahren zur Sprachsteuerung eines Geräts mit Hilfe von den Betrieb des Geräts beeinflussenden Befehlen, wobei auf einer Anzeigevorrichtung in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehlen dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, dadurch gekennzeichnet, dass in einem Speicher über ein Mikrofon empfangene Sprachsignale oder davon abgeleitete Signale gespeichert werden, dass die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils in der Anzeigevorrichtung dargestellten Befehlen entsprechen, verglichen werden und dass derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
- Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher, abgelegt werden.
- Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der Speicher und der weitere Speicher Analogspeicher sind und dass der Vergleich mit Analogsignalen durchgeführt wird.
- Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der Speicher und der weitere Speicher digitale Speicher sind und dass der Vergleich mit digitalen Signalen durchgeführt wird.
- Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem Speicher abgelegt sind und dass der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19944427444 DE4427444B4 (de) | 1994-08-03 | 1994-08-03 | Einrichtung und Verfahren zur Sprachsteuerung eines Geräts |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19944427444 DE4427444B4 (de) | 1994-08-03 | 1994-08-03 | Einrichtung und Verfahren zur Sprachsteuerung eines Geräts |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4427444A1 DE4427444A1 (de) | 1996-02-08 |
DE4427444B4 true DE4427444B4 (de) | 2004-07-29 |
Family
ID=6524814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19944427444 Revoked DE4427444B4 (de) | 1994-08-03 | 1994-08-03 | Einrichtung und Verfahren zur Sprachsteuerung eines Geräts |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE4427444B4 (de) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE29509089U1 (de) | 1995-06-01 | 1995-11-16 | Eschenbach, Wolfram, 80687 München | Akustischer Wandlichtschalter mit Spracherkennungssystem |
DE19646634A1 (de) * | 1996-11-12 | 1998-05-14 | Bosch Gmbh Robert | Verfahren zur Befehlseingabe mit Sprache |
EP1342605B1 (de) | 2002-03-04 | 2006-07-26 | Ford Global Technologies, LLC | Vorrichtung zur Steuerung einer Bildschirmanzeige |
DE10360656A1 (de) * | 2003-12-23 | 2005-07-21 | Daimlerchrysler Ag | Bediensystem für ein Fahrzeug |
DE102005002474A1 (de) | 2005-01-19 | 2006-07-27 | Obstfelder, Sigrid | Handy und Verfahren zur Spracheingabe in ein solches sowie Spracheingabebaustein und Verfahren zur Spracheingabe in einen solchen |
DE102005059630A1 (de) * | 2005-12-14 | 2007-06-21 | Bayerische Motoren Werke Ag | Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl |
DE102008033441B4 (de) * | 2008-07-16 | 2020-03-26 | Volkswagen Ag | Verfahren zum Betrieb eines Bediensystems für ein Fahrzeug und Bediensystem für ein Fahrzeug |
DE102011109932B4 (de) * | 2011-08-10 | 2014-10-02 | Audi Ag | Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3636678A1 (de) * | 1986-10-28 | 1988-05-11 | Siemens Ag | Roentgendiagnostikeinrichtung |
-
1994
- 1994-08-03 DE DE19944427444 patent/DE4427444B4/de not_active Revoked
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3636678A1 (de) * | 1986-10-28 | 1988-05-11 | Siemens Ag | Roentgendiagnostikeinrichtung |
Also Published As
Publication number | Publication date |
---|---|
DE4427444A1 (de) | 1996-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69117014T2 (de) | Methode und Einrichtung zur Spracherkennung | |
EP1031456B1 (de) | Verfahren und Vorrichtung zur Unterstützung eines Benutzers eines Kraftfahrzeugs bei der Bedienung von Fahrzeugkomponenten | |
DE3238855A1 (de) | Spracherkennungseinrichtung | |
DE102011109932B4 (de) | Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung | |
WO2005022511A1 (de) | Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen | |
DE4427444B4 (de) | Einrichtung und Verfahren zur Sprachsteuerung eines Geräts | |
DE69704785T2 (de) | Interaktives sprachgesteuertes abstimmsystem für funkgerät | |
EP1041362A2 (de) | Eingabeverfahren in ein Fahrerinformationssystem | |
EP0793819B1 (de) | Verfahren zur sprachsteuerung von anlagen und geräten | |
EP0467157B1 (de) | Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder | |
EP0312778B1 (de) | Rundfunkempfangseinrichtung für Kraftfahrzeuge | |
EP1125278A1 (de) | Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte | |
DE19942869A1 (de) | Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen | |
DE69619020T2 (de) | Verkehrsinformationsgerät mit verbessertem Sprachsynthesegenerator | |
EP1040585B1 (de) | Rundfunkempfänger mit eingebauter bedienungsanleitung | |
DE102006035780A1 (de) | Verfahren zur Unterstützung des Bedieners eines Spracheingabesystems | |
DE19839466A1 (de) | Verfahren und Steuereinrichtung zur Bedienung technischer Einrichtungen eines Fahrzeugs | |
EP0568532B1 (de) | Verfahren zum übertragen digitalisierter, blockcodierter tonsignale unter verwendung von skalenfaktoren | |
DE3300053A1 (de) | Auf sprache ansprechende mobile statuseinheit | |
DE102016004287A1 (de) | Verfahren zur Spracherkennung in einem Kraftfahrzeug | |
EP2051242B1 (de) | Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl | |
WO2002050815A1 (de) | Vorrichtung und verfahren zur differenzierten sprachausgabe | |
DE19514849A1 (de) | Verfahren zur Fernsteuerung und Vorrichtung dafür | |
DE10063331C2 (de) | Sprachsteuerungssystem | |
EP1064639A1 (de) | Gerät zur wiedergabe von informationen bzw. zur ausführung von funktionen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8127 | New person/name/address of the applicant |
Owner name: ROBERT BOSCH GMBH, 70469 STUTTGART, DE |
|
8363 | Opposition against the patent | ||
R037 | Decision of examining division/fpc revoking patent now final | ||
R107 | Publication of grant of european patent rescinded |
Effective date: 20111103 |