DE4427444B4 - Einrichtung und Verfahren zur Sprachsteuerung eines Geräts - Google Patents

Einrichtung und Verfahren zur Sprachsteuerung eines Geräts Download PDF

Info

Publication number
DE4427444B4
DE4427444B4 DE19944427444 DE4427444A DE4427444B4 DE 4427444 B4 DE4427444 B4 DE 4427444B4 DE 19944427444 DE19944427444 DE 19944427444 DE 4427444 A DE4427444 A DE 4427444A DE 4427444 B4 DE4427444 B4 DE 4427444B4
Authority
DE
Germany
Prior art keywords
memory
signals
commands
comparison
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Revoked
Application number
DE19944427444
Other languages
English (en)
Other versions
DE4427444A1 (de
Inventor
Volker Lauke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=6524814&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE4427444(B4) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE19944427444 priority Critical patent/DE4427444B4/de
Publication of DE4427444A1 publication Critical patent/DE4427444A1/de
Application granted granted Critical
Publication of DE4427444B4 publication Critical patent/DE4427444B4/de
Anticipated expiration legal-status Critical
Revoked legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuits Of Receivers In General (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Einrichtung zur Sprachsteuerung eines Geräts, mit Hilfe von den Betrieb des Geräts beeinflussenden Befehlen, wobei auf einer Anzeigevorrichtung (9) in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, gekennzeichnet durch einen Speicher (12) zur Speicherung von jeweils über ein Mikrofon (10) empfangenen Sprachsignalen oder davon abgeleiteten Signalen, wobei die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils auf der Anzeigevorrichtung (9) dargestellten Befehlen entsprechen, verglichen werden und wobei derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.

Description

  • Die Erfindung betrifft eine Einrichtung und ein Verfahren zur Sprachsteuerung eines Geräts mit Hilfe von den Betrieb des Gerätes beeinflussenden Befehlen.
  • Zur Steuerung von Anlagen und Geräten werden in zunehmendem Maße Spracheingaben verwendet, wobei über ein Mikrofon aufgenommene Befehle des Benutzers mit Hilfe von Spracherkennungsverfahren erkannt werden. Hierbei wird zwischen sprecherabhängigen und sprecherunabhängigen Spracherkennungsverfahren unterschieden, wobei die sprecherabhängige Spracherkennung einen begrenzten, festen Befehlssatz aufweist, der durch den Benutzer trainiert werden muss. Dazu wird in einer Lernphase jeder Befehl durch den Benutzer mehrmals wiederholt, damit sich die Spracherkennungseinrichtung auf die Phonetik des Benutzers einstellen kann.
  • Die sprecherunabhängige Spracherkennung arbeitet ebenfalls mit einem begrenzten, fest definierten Befehlssatz, wobei allerdings das Spracherkennungsverfahren so "intelligent" ist, dass kein Training mehr erforderlich ist.
  • Beiden Verfahren ist gemeinsam, dass nur ein begrenzter, fest vorgegebener Befehlsvorrat erkannt werden kann. Diesen muss der Benutzer in der Regel auswendig lernen. Je größer die Anzahl der Befehle ist,, je höhere Anforderungen werden an das Spracherkennungsverfahren und an das Gedächtnis des Benutzers gestellt.
  • Diese Nachteile der bekannten Spracherkennungsverfahren erschweren die Sprachsteuerung, beispielsweise eines Autoradios, besonders stark. Bei diesen Geräten ist nämlich die Anzahl der erforderlichen Befehle relativ groß, unter anderem durch die Vielzahl der Sender, auf die ein Autoradio, insbesordere während einer längeren Fahrt, einzustellen ist.
  • Aus der DE 3636678 A1 ist eine Röntgendiagnostikeinrichtung bekannt, die zur Steuerung eine Anzeige und eine Spracheingabe und -ausgabe aufweist. In der Anzeige sind Buchstaben dargestellt, die bestimmte Befehle der Steuereinrichtung kennzeichnen. Durch die Aussprache eines der Buchstaben wird ein entsprechender Befehl entweder simuliert oder ausgeführt.
  • Aufgabe der vorliegenden Erfindung ist, eine Einrichtung und ein Verfahren zur Sprachsteuerung eines Geräts unter Vermeidung der obengenannten Nachteile vorzuschlagen, um insbesondere dem Benutzer ein Auswendiglernen vieler Befehle zu ersparen und eine Spracherkennung zu verbessern und zu beschleunigen.
  • Diese Aufgabe wird erfindungsgemäß dadurch gelöst, dass auf einer Anzeigevorrichtung in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, dass ein Speicher zur Speicherung von jeweils über ein Mikrofon empfangenen Sprachsignalen oder davon abgeleiteten Signalen vorgesehen ist, wobei die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils in der Anzeigevorrichtung dargestellten Befehlen entsprechen, verglichen werden und dass derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
  • Die erfindungsgemäße Einrichtung und das erfindungsgemäße Verfahren haben einerseits den Vorteil, daß dem Benutzer angezeigt wird, welche Befehle bei dem jeweils vorhandenen Betriebszustand der Anlage und des Gerätes eingegeben werden können. Dabei ist nicht nur die Auswahl als solche von Vorteil, sondern auch die Sichtbarmachung der einzelnen Befehle, wodurch der Benutzer gehalten wird, die vorgegebenen Wörter zu verwenden. So wird beispielsweise die versehentliche Benutzung eines für das Spracherkennungssystem nicht erkennbaren Synonyms durch den Benutzer vermieden. Andererseits haben die erfindungsgemäße Einrichtung und das erfindungsgemäße Verfahren den Vorteil, daß die Spracherkennungseinrichtung die empfangenen Sprachsignale trotz einer großen Anzahl von insgesamt möglichen Befehlen nur mit jeweils wenigen im Menü dargestellten Befehlen vergleichen muß. Dadurch kann ein einfaches und sicheres Spracherkennungsverfahren gewählt werden.
  • Eine Weiterbildung der erfindungsgemäßen Einrichtung und des erfindungsgemäßen Verfahrens besteht darin, daß die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher abgelegt werden. Dieses hat den Vorteil, daß der Hersteller der Anlagen und Geräte und gegebenenfalls auch der Benutzer bei Änderungen der Befehlsauswahllisten (Menüs) bzw. der einzelnen Befehle neue Befehle lediglich in Form von Text, beispielsweise sogenannten ASCII-Zeichen, eingeben kann, die dann in die zu vergleichenden sprachrelevanten Signale umgewandelt werden.
  • Bei der erfindungsgemäßen Einrichtung und dem erfindungsgemäßen Verfahren kann ferner vorgesehen sein, daß der Speicher und der weitere Speicher Analogspeicher sind und daß der Vergleich mit Analogsignalen erfolgt oder daß der Speicher und der weitere Speicher digitale Speicher sind und daß der Vergleich mit digitalen Signalen erfolgt.
  • Je nach Voraussetzungen im einzelnen kann auch eine Ausführungsform vorteilhafter sein, die darin besteht, daß die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem Speicher abgelegt sind und daß der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
  • Eine weitere vorteilhafte Ausgestaltung der erfindungsgemäßen Einrichtung besteht darin, daß die sprachrelevanten Signale die Grundmodulation beim Sprechen des jeweiligen Befehls darstellen. Hierdurch ist ein einfacher Vergleich der gespeicherten mit den sprachrelevanten Signalen möglich.
  • Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt und in der nachfolgenden Beschreibung näher erläutert.
  • Bei dem dargestellten Ausführungsbeispiel wird mit einer erfindungsgemäßen Einrichtung ein Autoradio sprachgesteuert, das schematisch durch einen Empfangsteil 1 mit einer Antenne 2, einen Signalverarbeitungsteil 3, zwei Endstufen 4, 5 und Lautsprecher 6, 7 dargestellt ist. Der Signalverarbeitungsteil 3 kann in an sich bekannter Weise beispielsweise einen Stereodecoder, einen Radio-Datensignal-Decoder, einen Verkehrsfunkdecoder sowie Lautstärke- und Klangsteller enthalten.
  • Das Empfangsteil 1 und das Signalverarbeitungsteil 3 werden von einem Mikrocomputer 8 gesteuert, der von dem Signalverarbeitungsteil 3 auch verschiedene Daten, wie beispielsweise decodierte Radio-Datensignale erhält. Ein Ausgang des Mikrocomputers 8 ist mit einer Anzeigevorrichtung (Display) 9 verbunden, die ein Menü mit, den im jeweiligen Betriebszustand des Autoradios ausführbaren Befehlen zeigt. Dieses kann beispielsweise eine Liste von Einstellungen wie "Kassette", "UKW", "Mittelwelle", "Verkehrsfunk" oder eine Auswahl der jweils zu empfangenden Sender sein. Bei bekannten Eingabeeinrichtungen, die nicht sprachgesteuert sind, wird die Einstellung eines der Sender durch einen Druck auf eine Taste, die neben dem Namen des Senders angeordnet ist, bewirkt.
  • Bei der erfindungsgemäßen Einrichtung zur Sprachsteuerung ist ein Mikrofon 10 vorgesehen, dessen Ausgangssignale über einen Verstärker 11 einem Speicher 12 zugeführt werden. Außer der Anzeigevorrichtung 9 ist an dem Mikrocomputer 8 ein Sprachcodierer 13 angeschlossen, dessen Ausgangssignale synthetische Sprachsignale darstellen und in einen Speicher 14 einschreibbar sind. Verfahren zur Sprachcodierung sind an sich bekannt, beispielsweise durch das Computerprogramm SAY für den Computer Amiga. Die Inhalte der Speicher 12 und des Speichers 14 können in einer Vergleichseinrichtung 15 verglichen werden. Stimmt eines der im Sprachcodierer 13 erzeugten Signale mit dem im Speicher 12 vorhandenen Signal überein – einschließlich eines Toleranzbereichs – wird dem Mikrocomputer 8 gemeldet, welches der sprachrelevanten Signale, das heißt, welcher Befehl aus dem dargestellten Menü, mit dem eingegebenen Befehl übereinstimmt. Die entsprechende Funktion wird dann vom Mikrocomputer 8 ausgeführt.
  • Danach kann dann gegebenenfalls ein anderes Menü mit Hilfe der Anzeigevorrichtung 9 sichtbar gemacht werden, wobei die im Menü aufgeführten Daten dem Sprachcodierer 13 zugeführt werden, worauf eine neue Spracheingabe möglich ist.

Claims (11)

  1. Einrichtung zur Sprachsteuerung eines Geräts, mit Hilfe von den Betrieb des Geräts beeinflussenden Befehlen, wobei auf einer Anzeigevorrichtung (9) in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehle dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, gekennzeichnet durch einen Speicher (12) zur Speicherung von jeweils über ein Mikrofon (10) empfangenen Sprachsignalen oder davon abgeleiteten Signalen, wobei die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils auf der Anzeigevorrichtung (9) dargestellten Befehlen entsprechen, verglichen werden und wobei derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
  2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, dass die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher (14) abgelegt werden.
  3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, dass der Speicher (12) und der weitere Speicher (14) Analogspeicher sind und dass der Vergleich mit Analogsignalen erfolgt.
  4. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, dass der Speicher (12) und der weitere Speicher (14) digitale Speicher sind und dass der Vergleich mit digitalen Signalen erfolgt.
  5. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, dass die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem. Speicher abgelegt sind und dass der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
  6. Einrichtung nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die sprachrelevanten Signale die Grundmodulation beim Sprechen des jeweiligen Befehls darstellen.
  7. Verfahren zur Sprachsteuerung eines Geräts mit Hilfe von den Betrieb des Geräts beeinflussenden Befehlen, wobei auf einer Anzeigevorrichtung in Abhängigkeit von einem jeweiligen Betriebszustand ein Teil der insgesamt vorgesehenen Befehlen dargestellt wird, wobei eine Eingabe durch Aussprache jeweils eines der dargestellten Befehle erfolgt, dadurch gekennzeichnet, dass in einem Speicher über ein Mikrofon empfangene Sprachsignale oder davon abgeleitete Signale gespeichert werden, dass die gespeicherten Signale nur mit den sprachrelevanten Signalen, welche den jeweils in der Anzeigevorrichtung dargestellten Befehlen entsprechen, verglichen werden und dass derjenige Befehl, bei welchem der Vergleich positiv ausfällt, als ausgewählt angenommen wird.
  8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die sprachrelevanten Signale durch Sprachsynthese der jeweils dargestellten Befehle erzeugt und in einem weiteren Speicher, abgelegt werden.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der Speicher und der weitere Speicher Analogspeicher sind und dass der Vergleich mit Analogsignalen durchgeführt wird.
  10. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der Speicher und der weitere Speicher digitale Speicher sind und dass der Vergleich mit digitalen Signalen durchgeführt wird.
  11. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die zu vergleichenden sprachrelevanten Signale aller insgesamt vorgesehenen Befehle in einem Speicher abgelegt sind und dass der Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend den jeweils dargestellten Befehlen gesteuert wird.
DE19944427444 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts Revoked DE4427444B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19944427444 DE4427444B4 (de) 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19944427444 DE4427444B4 (de) 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Publications (2)

Publication Number Publication Date
DE4427444A1 DE4427444A1 (de) 1996-02-08
DE4427444B4 true DE4427444B4 (de) 2004-07-29

Family

ID=6524814

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19944427444 Revoked DE4427444B4 (de) 1994-08-03 1994-08-03 Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Country Status (1)

Country Link
DE (1) DE4427444B4 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE29509089U1 (de) 1995-06-01 1995-11-16 Eschenbach, Wolfram, 80687 München Akustischer Wandlichtschalter mit Spracherkennungssystem
DE19646634A1 (de) * 1996-11-12 1998-05-14 Bosch Gmbh Robert Verfahren zur Befehlseingabe mit Sprache
EP1342605B1 (de) 2002-03-04 2006-07-26 Ford Global Technologies, LLC Vorrichtung zur Steuerung einer Bildschirmanzeige
DE10360656A1 (de) * 2003-12-23 2005-07-21 Daimlerchrysler Ag Bediensystem für ein Fahrzeug
DE102005002474A1 (de) 2005-01-19 2006-07-27 Obstfelder, Sigrid Handy und Verfahren zur Spracheingabe in ein solches sowie Spracheingabebaustein und Verfahren zur Spracheingabe in einen solchen
DE102005059630A1 (de) * 2005-12-14 2007-06-21 Bayerische Motoren Werke Ag Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
DE102008033441B4 (de) * 2008-07-16 2020-03-26 Volkswagen Ag Verfahren zum Betrieb eines Bediensystems für ein Fahrzeug und Bediensystem für ein Fahrzeug
DE102011109932B4 (de) * 2011-08-10 2014-10-02 Audi Ag Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3636678A1 (de) * 1986-10-28 1988-05-11 Siemens Ag Roentgendiagnostikeinrichtung

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3636678A1 (de) * 1986-10-28 1988-05-11 Siemens Ag Roentgendiagnostikeinrichtung

Also Published As

Publication number Publication date
DE4427444A1 (de) 1996-02-08

Similar Documents

Publication Publication Date Title
DE69117014T2 (de) Methode und Einrichtung zur Spracherkennung
EP1031456B1 (de) Verfahren und Vorrichtung zur Unterstützung eines Benutzers eines Kraftfahrzeugs bei der Bedienung von Fahrzeugkomponenten
DE3238855A1 (de) Spracherkennungseinrichtung
DE102011109932B4 (de) Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung
WO2005022511A1 (de) Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen
DE4427444B4 (de) Einrichtung und Verfahren zur Sprachsteuerung eines Geräts
DE69704785T2 (de) Interaktives sprachgesteuertes abstimmsystem für funkgerät
EP1041362A2 (de) Eingabeverfahren in ein Fahrerinformationssystem
EP0793819B1 (de) Verfahren zur sprachsteuerung von anlagen und geräten
EP0467157B1 (de) Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder
EP0312778B1 (de) Rundfunkempfangseinrichtung für Kraftfahrzeuge
EP1125278A1 (de) Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte
DE19942869A1 (de) Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen
DE69619020T2 (de) Verkehrsinformationsgerät mit verbessertem Sprachsynthesegenerator
EP1040585B1 (de) Rundfunkempfänger mit eingebauter bedienungsanleitung
DE102006035780A1 (de) Verfahren zur Unterstützung des Bedieners eines Spracheingabesystems
DE19839466A1 (de) Verfahren und Steuereinrichtung zur Bedienung technischer Einrichtungen eines Fahrzeugs
EP0568532B1 (de) Verfahren zum übertragen digitalisierter, blockcodierter tonsignale unter verwendung von skalenfaktoren
DE3300053A1 (de) Auf sprache ansprechende mobile statuseinheit
DE102016004287A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug
EP2051242B1 (de) Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
WO2002050815A1 (de) Vorrichtung und verfahren zur differenzierten sprachausgabe
DE19514849A1 (de) Verfahren zur Fernsteuerung und Vorrichtung dafür
DE10063331C2 (de) Sprachsteuerungssystem
EP1064639A1 (de) Gerät zur wiedergabe von informationen bzw. zur ausführung von funktionen

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8127 New person/name/address of the applicant

Owner name: ROBERT BOSCH GMBH, 70469 STUTTGART, DE

8363 Opposition against the patent
R037 Decision of examining division/fpc revoking patent now final
R107 Publication of grant of european patent rescinded

Effective date: 20111103