DE4427444A1 - Einrichtung zur Sprachsteuerung von Anlagen und Geräten - Google Patents

Einrichtung zur Sprachsteuerung von Anlagen und Geräten

Info

Publication number
DE4427444A1
DE4427444A1 DE19944427444 DE4427444A DE4427444A1 DE 4427444 A1 DE4427444 A1 DE 4427444A1 DE 19944427444 DE19944427444 DE 19944427444 DE 4427444 A DE4427444 A DE 4427444A DE 4427444 A1 DE4427444 A1 DE 4427444A1
Authority
DE
Germany
Prior art keywords
commands
memory
signals
comparison
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19944427444
Other languages
English (en)
Other versions
DE4427444B4 (de
Inventor
Volker Lauke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Blaupunkt Werke GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=6524814&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE4427444(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Blaupunkt Werke GmbH filed Critical Blaupunkt Werke GmbH
Priority to DE19944427444 priority Critical patent/DE4427444B4/de
Publication of DE4427444A1 publication Critical patent/DE4427444A1/de
Application granted granted Critical
Publication of DE4427444B4 publication Critical patent/DE4427444B4/de
Anticipated expiration legal-status Critical
Revoked legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuits Of Receivers In General (AREA)
  • User Interface Of Digital Computer (AREA)

Description

Die Erfindung betrifft eine Einrichtung zur Sprachsteuerung von Anlagen und Geräten mit Hilfe von den Betrieb der Anlage oder des Gerätes beeinflussenden Befehlen.
Zur Steuerung von Anlagen und Geräten werden in zunehmendem Maße Spracheingaben verwendet, wobei über ein Mikrofon aufgenommene Befehle des Benutzers mit Hilfe von Spracherkennungsverfahren erkannt werden. Hierbei wird zwischen sprecherabhängigen und sprecherunabhängigen Spracherkennungsverfahren unterschieden, wobei die sprecherabhängige Spracherkennung einen begrenzten, festen Befehlssatz aufweist, der durch den Benutzer trainiert werden muß. Dazu wird in einer Lernphase jeder Befehl durch den Benutzer mehrmals wiederholt, damit sich die Spracherkennungseinrichtung auf die Phonetik des Benutzers einstellen kann.
Die sprecherunabhängige Spracherkennung arbeitet ebenfalls mit einem begrenzten, fest definierten Befehlssatz, wobei allerdings das Spracherkennungsverfahren so "intelligent" ist, daß kein Training mehr erforderlich ist.
Beiden Verfahren ist gemeinsam, daß nur ein begrenzter, fest vorgegebener Befehlsvorrat erkannt werden kann. Diesen muß der Benutzer in der Regel auswendig lernen. Je größer die Anzahl der Befehle ist, je höhere Anforderungen werden an das Spracherkennungsverfahren und an das Gedächtnis des Benutzers gestellt.
Diese Nachteile der bekannten Spracherkennungsverfahren erschweren die Sprachsteuerung beispielsweise eines Autoradios besonders stark. Bei diesen Geräten ist nämlich die Anzahl der erforderlichen Befehle relativ groß, unter anderem durch die Vielzahl der Sender, auf die ein Autoradio, insbesondere während einer längeren Fahrt, einzustellen ist.
Aufgabe der vorliegenden Erfindung ist es, eine Einrichtung zur Sprachsteuerung von Anlagen und Geräten unter Vermeidung der obengenannten Nachteile vorzuschlagen, insbesondere dem Benutzer ein Auswendiglernen vieler Befehle zu ersparen.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß auf einer Anzeigevorrichtung in Abhängigkeit vom jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, daß ein Speicher zur Speicherung von jeweils über ein Mikrofon empfangenen Sprachsignalen oder davon abgeleiteter Signale vorgesehen ist, daß die gespeicherten Signale mit sprachrelevanten Signalen, welche den jeweils dargestellten Befehlen entsprechen, verglichen werden und daß derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
Die erfindungsgemäße Einrichtung hat einerseits den Vorteil, daß dem Benutzer angezeigt wird, welche Befehle bei dem jeweils vorhandenen Betriebszustand der Anlage und des Gerätes eingegeben werden können. Dabei ist nicht nur die Auswahl als solche von Vorteil, sondern auch die Sichtbarmachung der einzelnen Befehle, wodurch der Benutzer gehalten wird, die vorgegebenen Wörter zu verwenden. So wird beispielsweise die versehentliche Benutzung eines für das Spracherkennungssystem nicht erkennbaren Synonyms durch den Benutzer vermieden. Andererseits hat die erfindungsgemäße Einrichtung den Vorteil, daß die Spracherkennungseinrichtung die empfangenen Sprachsignale trotz einer großen Anzahl von insgesamt möglichen Befehlen nur mit jeweils wenigen im Menü dargestellten Befehlen vergleichen muß. Dadurch kann ein einfaches und sicheres Spracherkennungsverfahren gewählt werden.
Eine Weiterbildung der erfindungsgemäßen Einrichtung besteht darin, daß die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher abgelegt werden. Dieses hat den Vorteil, daß der Hersteller der Anlagen und Geräte und gegebenenfalls auch der Benutzer bei Änderungen der Befehlsauswahllisten (Menüs) bzw. der einzelnen Befehle neue Befehle lediglich in Form von Text, beispielsweise sogenannten ASCI-Zeichen, eingeben kann, die dann in die zu vergleichenden sprachrelevanten Signale umgewandelt werden.
Bei der erfindungsgemäßen Einrichtung kann ferner vorgesehen sein, daß der Speicher und der weitere Speicher Analogspeicher sind und daß der Vergleich mit Analogsignalen erfolgt oder daß der Speicher und der weitere Speicher digitale Speicher sind und daß der Vergleich mit digitalen Signalen erfolgt.
Je nach Voraussetzungen im einzelnen kann auch eine Ausführungsform vorteilhafter sein, die darin besteht, daß die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem Speicher abgelegt sind und daß der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
Eine weitere vorteilhafte Ausgestaltung der erfindungsgemäßen Einrichtung besteht darin, daß die sprachrelevanten Signale die Grundmodulation beim Sprechen des jeweiligen Befehls darstellen. Hierdurch ist ein einfacher Vergleich der gespeicherten mit den sprachrelevanten Signalen möglich.
Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt und in der nachfolgenden Beschreibung näher erläutert.
Bei dem dargestellten Ausführungsbeispiel wird mit einer erfindungsgemäßen Einrichtung ein Autoradio sprachgesteuert, das schematisch durch einen Empfangsteil 1 mit einer Antenne 2, einen Signalverarbeitungsteil 3, zwei Endstufen 4, 5 und Lautsprecher 6, 7 dargestellt ist. Der Signalverarbeitungsteil 3 kann in an sich bekannter Weise beispielsweise einen Stereodecoder, einen Radio-Datensignal-Decoder, einen Verkehrsfunkdecoder sowie Lautstärke- und Klangsteller enthalten.
Das Empfangsteil 1 und das Signalverarbeitungsteil 3 werden von einem Mikrocomputer 8 gesteuert, der von dem Signalverarbeitungsteil 3 auch verschiedene Daten, wie beispielsweise decodierte Radio-Datensignale erhält. Ein Ausgang des Mikrocomputers 8 ist mit einer Anzeigevorrichtung (Display) 9 verbunden, die ein Menü mit den im jeweiligen Betriebszustand des Autoradios ausführbaren Befehlen zeigt. Dieses kann beispielsweise eine Liste von Einstellungen wie "Kassette", "UKW", "Mittelwelle", "Verkehrsfunk" oder eine Auswahl der jeweils zu empfangenden Sender sein. Bei bekannten Eingabeeinrichtungen, die nicht sprachgesteuert sind, wird die Einstellung eines der Sender durch einen Druck auf eine Taste, die neben dem Namen des Senders angeordnet ist, bewirkt.
Bei der erfindungsgemäßen Einrichtung zur Sprachsteuerung ist ein Mikrofon 10 vorgesehen, dessen Ausgangssignale über einen Verstärker 11 einem Speicher 12 zugeführt werden. Außer der Anzeigevorrichtung 9 ist an dem Mikrocomputer 8 ein Sprachcodierer 13 angeschlossen, dessen Ausgangssignale synthetische Sprachsignale darstellen und in einen Speicher 14 einschreibbar sind. Verfahren zur Sprachcodierung sind an sich bekannt, beispielsweise durch das Computerprogramm SAY für den Computer Amiga. Die Inhalte der Speicher 12 und des Speichers 14 können in einer Vergleichseinrichtung 15 verglichen werden. Stimmt eines der im Sprachcodierer 13 erzeugten Signale mit dem im Speicher 12 vorhandenen Signal überein - einschließlich eines Toleranzbereichs - wird dem Mikrocomputer 8 gemeldet, welches der sprachrelevanten Signale, das heißt, welcher Befehl aus dem dargestellten Menü, mit dem eingegebenen Befehl übereinstimmt. Die entsprechende Funktion wird dann vom Mikrocomputer 8 ausgeführt.
Danach kann dann gegebenenfalls ein anderes Menü mit Hilfe der Anzeigevorrichtung 9 sichtbar gemacht werden, wobei die im Menü aufgeführten Daten dem Sprachcodierer 13 zugeführt werden, worauf eine neue Spracheingabe möglich ist.

Claims (6)

1. Einrichtung zur Sprachsteuerung von Anlagen und Geräten, mit Hilfe von den Betrieb der Anlage oder des Gerätes beeinflussenden Befehlen, dadurch gekennzeichnet, daß auf einer Anzeigevorrichtung (9) in Abhängigkeit vom jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, daß ein Speicher (12) zur Speicherung von jeweils über ein Mikrofon (10) empfangenen Sprachsignalen oder davon abgeleiteter Signale vorgesehen ist, daß die gespeicherten Signale mit sprachrelevanten Signalen, welche den jeweils dargestellten Befehlen entsprechen, verglichen werden und daß derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher (14) abgelegt werden.
3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, daß der Speicher (12) und der weitere Speicher Analogspeicher sind und daß der Vergleich mit Analogsignalen erfolgt.
4. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, daß der Speicher (12) und der weitere Speicher (14) digitale Speicher sind und daß der Vergleich mit digitalen Signalen erfolgt.
5. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem Speicher abgelegt sind und daß der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
6. Einrichtung nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die sprachrelevanten Signale die Grundmodulation beim Sprechen des jeweiligen Befehls darstellen.
DE19944427444 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts Revoked DE4427444B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19944427444 DE4427444B4 (de) 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19944427444 DE4427444B4 (de) 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Publications (2)

Publication Number Publication Date
DE4427444A1 true DE4427444A1 (de) 1996-02-08
DE4427444B4 DE4427444B4 (de) 2004-07-29

Family

ID=6524814

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19944427444 Revoked DE4427444B4 (de) 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Country Status (1)

Country Link
DE (1) DE4427444B4 (de)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE29509089U1 (de) 1995-06-01 1995-11-16 Eschenbach, Wolfram, 80687 München Akustischer Wandlichtschalter mit Spracherkennungssystem
WO1998021711A1 (de) * 1996-11-12 1998-05-22 Robert Bosch Gmbh Verfahren zur befehlseingabe mit sprache
EP1342605A1 (de) 2002-03-04 2003-09-10 Ford Global Technologies, Inc., A subsidiary of Ford Motor Company Vorrichtung zur Steuerung einer Bildschirmanzeige
WO2005064438A2 (de) * 2003-12-23 2005-07-14 Daimlerchrysler Ag Bediensystem für ein fahrzeug
EP1684264A1 (de) 2005-01-19 2006-07-26 Obstfelder, Sigrid Handy und Verfahren zur Spracheingabe von text in ein solches
DE102005059630A1 (de) * 2005-12-14 2007-06-21 Bayerische Motoren Werke Ag Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
DE102008033441A1 (de) * 2008-07-16 2010-01-21 Volkswagen Ag Verfahren zum Betrieb eines Bediensystems für ein Fahrzeug und Bediensystem für ein Fahrzeug
DE102011109932A1 (de) * 2011-08-10 2013-02-14 Audi Ag Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3636678A1 (de) * 1986-10-28 1988-05-11 Siemens Ag Roentgendiagnostikeinrichtung

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE29509089U1 (de) 1995-06-01 1995-11-16 Eschenbach, Wolfram, 80687 München Akustischer Wandlichtschalter mit Spracherkennungssystem
WO1998021711A1 (de) * 1996-11-12 1998-05-22 Robert Bosch Gmbh Verfahren zur befehlseingabe mit sprache
EP1342605A1 (de) 2002-03-04 2003-09-10 Ford Global Technologies, Inc., A subsidiary of Ford Motor Company Vorrichtung zur Steuerung einer Bildschirmanzeige
WO2005064438A2 (de) * 2003-12-23 2005-07-14 Daimlerchrysler Ag Bediensystem für ein fahrzeug
WO2005064438A3 (de) * 2003-12-23 2007-07-05 Daimler Chrysler Ag Bediensystem für ein fahrzeug
EP1684264A1 (de) 2005-01-19 2006-07-26 Obstfelder, Sigrid Handy und Verfahren zur Spracheingabe von text in ein solches
DE102005059630A1 (de) * 2005-12-14 2007-06-21 Bayerische Motoren Werke Ag Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
EP2051242A1 (de) 2005-12-14 2009-04-22 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
DE102008033441A1 (de) * 2008-07-16 2010-01-21 Volkswagen Ag Verfahren zum Betrieb eines Bediensystems für ein Fahrzeug und Bediensystem für ein Fahrzeug
DE102008033441B4 (de) * 2008-07-16 2020-03-26 Volkswagen Ag Verfahren zum Betrieb eines Bediensystems für ein Fahrzeug und Bediensystem für ein Fahrzeug
DE102011109932A1 (de) * 2011-08-10 2013-02-14 Audi Ag Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung
US9466314B2 (en) 2011-08-10 2016-10-11 Audi Ag Method for controlling functional devices in a vehicle during voice command operation

Also Published As

Publication number Publication date
DE4427444B4 (de) 2004-07-29

Similar Documents

Publication Publication Date Title
DE69624383T2 (de) Verfahren zum kodieren und dekodieren von audiosignalen
EP0248063B1 (de) Verfahren oder einrichtung zum programmieren eines videorecorders
DE69117014T2 (de) Methode und Einrichtung zur Spracherkennung
DE4135070C1 (de)
EP1031456B1 (de) Verfahren und Vorrichtung zur Unterstützung eines Benutzers eines Kraftfahrzeugs bei der Bedienung von Fahrzeugkomponenten
DE2755633C2 (de) Fernsteuerung zum Steuern, Ein- und Umschalten von variablen und festen Gerätefunktionen und Funktionsgrößen in nachrichtentechn. Geräten
DE19756829A1 (de) Fernsteuerung für die Kraftfahrzeugunterhaltungselektronik und Verfahren zu ihrem Betrieb
EP0002434A1 (de) Fernsteuerung zum Steuern, Ein- und Umschalten von variablen und festen Gerätefunktionen und Funktionsgrössen in nachrichtentechnischen Geräten
DE602004010054T2 (de) Betätigung eines Sprachdialogsystems
DE19903434A1 (de) Verfahren zur Steuerung individueller Einstellungen in einem Kraftfahrzeug
DE69515996T2 (de) Sprachbetätigte steuerungssystem für gebrauch mit einem konsumerprodukt
DE19848491A1 (de) Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
DE69704785T2 (de) Interaktives sprachgesteuertes abstimmsystem für funkgerät
DE4427444A1 (de) Einrichtung zur Sprachsteuerung von Anlagen und Geräten
EP0686525A1 (de) Multifunktionseinrichtung zur Betätigung unterschiedlicher Stellglieder in einem Kraftfahrzeug
EP0793819B1 (de) Verfahren zur sprachsteuerung von anlagen und geräten
DE4310475A1 (de) Fernwirkanlage
DE4436734A1 (de) Bedienprotokolliergerät für ein elektrisches Gerät
EP0467157B1 (de) Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder
EP0312778B1 (de) Rundfunkempfangseinrichtung für Kraftfahrzeuge
EP1040585B1 (de) Rundfunkempfänger mit eingebauter bedienungsanleitung
DE19500618A1 (de) Vorrichtung mit Rechnersteuerung und Sprachwiederholung digitaler Einstellungsnachrichten
DE4025302A1 (de) Programmiereinrichtung zur programmierung eines fernsteuersenders
EP0881115B1 (de) Sitzeinstellvorrichtung und Audiogerät.
DE19750736A1 (de) Steuerungssystem und -verfahren für mehrere durch den Fahrer aktivierbare Module in einem Fahrzeug

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8127 New person/name/address of the applicant

Owner name: ROBERT BOSCH GMBH, 70469 STUTTGART, DE

8363 Opposition against the patent
R037 Decision of examining division/fpc revoking patent now final
R107 Publication of grant of european patent rescinded

Effective date: 20111103