DE10017717B4 - Voice input controlled controller - Google Patents

Voice input controlled controller Download PDF

Info

Publication number
DE10017717B4
DE10017717B4 DE2000117717 DE10017717A DE10017717B4 DE 10017717 B4 DE10017717 B4 DE 10017717B4 DE 2000117717 DE2000117717 DE 2000117717 DE 10017717 A DE10017717 A DE 10017717A DE 10017717 B4 DE10017717 B4 DE 10017717B4
Authority
DE
Germany
Prior art keywords
control unit
phoneme
mobile device
reader
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE2000117717
Other languages
German (de)
Other versions
DE10017717A1 (en
Inventor
Frank Dipl.-Ing. Bläsing
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Leopold Kostal GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leopold Kostal GmbH and Co KG filed Critical Leopold Kostal GmbH and Co KG
Priority to DE2000117717 priority Critical patent/DE10017717B4/en
Publication of DE10017717A1 publication Critical patent/DE10017717A1/en
Application granted granted Critical
Publication of DE10017717B4 publication Critical patent/DE10017717B4/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams

Abstract

Spracheingabe gesteuertes Steuergerät zum Ansteuern von elektrischen/elektronischen Aktoren (7–9) mit einer Spracherkennungseinrichtung (2) mit einem Mikrophon (3), über das die Spracheingabe erfolgt, und mit einem Speichermodul (4), in dem ein in seine Phonemsequenzen zerlegter Wortschatz umfassend diejenigen Wörter hinterlegt ist, die durch das Steuergerät (1) bei einer Spracheingabe zu erkennen sind, wobei das Steuergerät (1) ein Lesegerät (10) sowie einen Phonemsequenzer (11) umfaßt und das Lesegerät (10), der Phonemsequenzer (11) und das Speichermodul (4) miteinander verbunden sind, dadurch gekennzeichnet, dass das Lesegerät (10) zum Auslesen von in elektronischer Form gespeicherten Wörtern aus einem mobilen, an das Lesegerät (10) angeschlossenen Speichermedium konzipiert ist, der Ausgang des Lesegerätes (10) an den Eingang des Phonemsequenzers (11) und dieser mit seinem Ausgang an einen Eingang des Speichermoduls (4) angeschlossen ist und das Speichermodul (4) in zwei Bereiche (5, 6) unterteilt ist, wobei in einem Bereich (5) Standardphonemsequenzen und in dem weiteren Bereich (6) von...voice input controlled control unit for controlling electric / electronic actuators (7-9) with a speech recognition device (2) with a microphone (3) via which the voice input is made, and with a memory module (4) in which a vocabulary broken up into its phoneme sequences, including those words deposited by the control unit (1) in a voice input can be seen, wherein the control device (1) a reader (10) and a phoneme sequencer (11) and the reader (10), the phoneme sequencer (11) and the memory module (4) with each other are connected, characterized in that the reading device (10) for Reading out words stored in electronic form a mobile, to the reader (10) connected storage medium is designed, the output of the reader (10) to the input of the phoneme sequencer (11) and this with his Output to an input of the memory module (4) is connected and the memory module (4) is divided into two areas (5, 6), wherein in one area (5) standard phoneme sequences and in the other Area (6) of ...

Figure 00000001
Figure 00000001

Description

Die Erfindung betrifft ein Spracheingabe gesteuertes Steuergerät zum Ansteuern von elektrischen/elektronischen Aktoren mit einer Spracherkennungseinrichtung mit einem Mikrophon, über das die Spracheingabe erfolgt, und mit einem Speichermodul, in dem ein in seine Phonemsequenzen zerlegter Wortschatz umfassend diejenigen Wörter hinterlegt ist, die durch das Steuergerät bei einer Spracheingabe zu erkennen sind, wobei das Steuergerät ein Lesegerät sowie einen Phonemsequenzer umfasst und das Lesegerät, der Phonemsequenzer und das Speichermodul miteinander verbunden sind. Ferner betrifft die Erfindung ein Verfahren zum Bedienen eines ein Speichermedium mit einer Textdatenbank enthaltenden, an ein spracheingabegesteuertes Steuergerät angeschlossenen mobilen Gerätes, etwa eines Mobiltelefons, wobei der zur Spracheingabesteuerung notwendige Standardwortschatz in einem Speicher des Steuergerätes hinterlegt ist.The The invention relates to a speech input controlled control device for driving of electrical / electronic actuators with a speech recognition device with a microphone, over the voice input is made, and with a memory module in which a vocabulary broken up into its phoneme sequences, including those words is deposited by the control unit at a voice input to are recognizable, whereby the control device a reader as well a phoneme sequencer and the reader, the phoneme sequencer and the memory module are interconnected. Furthermore, the Invention a method for operating a storage medium with a text database containing a language input control unit connected mobile device, such as a mobile phone, the voice input control necessary Standard vocabulary stored in a memory of the control unit is.

Bei Spracherkennungssystemen kann unterschieden werden in sprecherabhängige und sprecherunabhängige Systeme. Bei sprecherabhängigen Systemen ist es grundsätzlich notwendig, daß das System im Hinblick auf die Klangfarbe der sprechenden Person angelernt werden muß, so daß vor einem tatsächlichen Einsatz eines solchen System eine Trainings- bzw. Anlernphase durchgeführt werden muß. Vorteilhaft ist bei einem solchen System, daß dieses lernfähig nicht nur im Hinblick auf die Klangfar be eines Benutzers sondern auch im Hinblick auf den Wortschatz ist, welches dem Spracherkennungssystem bekannt ist. Sprecherunabhängige Systeme dienen dagegen zumeist der Einzelworterkennung und arbeiten mit einem standardisierten, vorgegebenen Wortschatz, der in einem Speichermodul hinterlegt ist. Die Einzelwörter des vorgegebenen Wortschatzes sind zerlegt in ihre Phoneme als die kleinsten klanglichen Einheiten der Wörter gespeichert. Diese Systeme sind jedoch nicht selbstlernend, so daß beim Einrichten des Systems der für die vorgesehene Anwendung zu verwendende Wortschatz vorbekannt sein muß. Ein späteres Anpassen eines solchen Spracherkennungssystems an individuelle, sich ändernde Bedürfnisse ist dagegen nicht möglich.at Speech recognition systems can be distinguished in speaker-dependent and speaker independent Systems. For speaker-dependent systems it is basically necessary for the system trained with regard to the timbre of the person speaking must become, so that before an actual one Use of such a system a training or learning phase must be performed. Advantageous is in such a system that this is not learning only with regard to the tonal color of a user but also in terms of vocabulary, which is the language recognition system is known. speaker-independent By contrast, systems are mostly used for single-word recognition and work with a standardized, predefined vocabulary in one Memory module is deposited. The single words of the given vocabulary are decomposed into their phonemes as the smallest tonal units of the words saved. However, these systems are not self-learning, so when setting up of the system of the intended application vocabulary to be used should be previously known got to. One later Adapting such a speech recognition system to individual, changing needs is not possible.

Aus der WO 97/37311 A1 ist eine Anordnung und ein Verfahren zum Erstellen eines digitalen Wörterbuches. Das Problem, welches dem Gegenstand dieses Dokumentes zugrunde liegt, ist, dass bei einer Spracherkennung in aller Regel nicht ein solcher Wortschatz in einem Speicher abgelegt ist, der für bestimmte Anwendungen relevant ist. Da die Verarbeitungszeit für eine Spracherkennung mit steigendem Wortschatz ansteigt und auch die Spracherkennungsgenauigkeit mit steigendem Wortschatz nachlässt, ist in diesem Dokument eine Anordnung und ein Verfahren beschrieben, mit denen diese Nachteile vermieden werden sollen. Dazu wird vorgeschlagen, neben einem Festspeicher mit Standardworten einen temporären Speicher mit Phonemsequenzen und den Phonemsequenzen zugehörigen Wörtern vorzusehen, welcher temporäre Speicher mit dem anwendungsspezifischen Vokabular bestückt ist. Um den temporären Speicher mit dem gewünschten Vokabular zu bestücken, ist ein Dokumentenlesegerät der Anordnung zugeordnet, über welches Lesegerät die gewünschten Begriffe eingelesen und über einen Text-Phonem-Konverter in seine Phonemsequenzen zerlegt werden können. Bei einem Wechsel der Anwendung wird der temporäre Speicher mit einem anderen Wortschatz belegt. Die einzulesenden Daten sind individuell abgelegt. Somit verfügt diese Anordnung über mehrere Speicher, in denen unterschiedliche Daten abgelegt sind. Die Benutzung des ein oder anderen Speichers erfolgt hierarchisch in Abhängigkeit von dem jeweiligen Anwendungsfall, damit für die gewünschte Spracherkennung bei dem in diesem Dokument beschriebenen System nicht der gesamte Daten- bzw. Dokumentenbestand sondern ein kleinerer, auf die jeweilig spezifische Anwendung bezogener für die Worterkennung durchsucht zu werden braucht. Dieser anwendungsspezifische Zusatzwortschatz ist in seine Phoneme zerlegt in einem temporären Speicher abgelegt. Bei einer Änderung der Anwendung wird der temporäre Speicher insgesamt neu mit den anderen Anwendungsdaten bzw. -dokumenten beschrieben. Um dieses zu ermöglichen, sind die einzelnen Speicher und das Lesegerät dieser Anordnung über einen BUS verbunden.Out WO 97/37311 A1 is an arrangement and a method for creating a digital dictionary. The problem underlying the subject of this document is that in a speech recognition usually not such a vocabulary stored in a memory that is relevant to certain applications is. Since the processing time for Speech recognition increases with increasing vocabulary and also the speech recognition accuracy decreases with increasing vocabulary is this document describes an arrangement and a method, with which these disadvantages should be avoided. It is suggested in addition to a permanent memory with standard words a temporary memory provide with phoneme sequences and words associated with the phoneme sequences, which temporary Memory is equipped with the application-specific vocabulary. To the temporary Memory with the desired To equip vocabulary, is a document reader of Assigned arrangement over which reader the desired Words are read in and over a text-to-phoneme converter into its phoneme sequences can. When changing the application, the temporary memory becomes one with another Vocabulary occupied. The data to be imported are stored individually. Thus features this arrangement over several memories in which different data are stored. The use of one or the other memory is hierarchical dependent on of the particular application, thus for the desired speech recognition the system described in this document does not cover all the data or document stock but a smaller one, to each specific Application related for the word recognition needs to be searched. This application specific Additional vocabulary is decomposed into its phonemes in a temporary memory stored. In case of a change the application becomes the temporary one Total memory new with the other application data or documents described. To make this possible are the individual memory and the reader of this arrangement over a BUS connected.

Die in diesem Dokument beschriebene Anordnung und das in diesem Dokument beschriebene Verfahren beziehen sich jedoch ausschließlich auf eine Spracherkennung als solche, nicht jedoch auf Anwendungen bei denen es darum geht, ein mobiles Gerät, beispielsweise ein Mobiltelefon durch ein spracheingabegesteuertes Steuergerät, das nicht Teil des Mobiltelefones ist, zu bedienen. Ferner befasst sich der Inhalt dieses Dokuments auch nicht mit dem Abgleich von Daten, die in dem Speicher eines mobilen Gerätes, beispielsweise eines Mobiltelefones enthalten sind mit solchen, die in einem spracheingabegesteuerten Steuergerät abgelegt sind.The described in this document and in this document However, the methods described relate exclusively to one Speech recognition as such, but not in applications where it comes to a mobile device, for example, a mobile phone through a voice input Controller, that is not part of the mobile phone, to use. It also deals Also, the content of this document does not match the Data stored in the memory of a mobile device, such as a mobile phone are included with those that are in a language input control unit are stored.

Aus DE 197 43 367 A1 ist eine sprachgesteuerte Fernprogrammierung und Fernsteuerung eines Videorekorders bekannt. Diese Einrichtung verfügt über einen Speicher in der Sprachsteuereinheit, in dem die für die Spracherkennung, die Sprachausgabe, die Ansteuerung und/oder Menüführung erforderlichen Daten gespeichert werden. Hingewiesen wird in diesem Dokument darauf, dass ein Austausch dieses Speichers – also ein vollständiger Ersatz der ursprünglich hinterlegten Daten durch einen neuen Datensatz – denkbar ist, um eine Menüführung zu verbessern oder das Steuergerät an ein anderes elektrisches Gerät anzupassen. Dieser neue Datensatz kann von einem auf einer Chipkarte befindlichen Speicher ausgelesen oder über das Telekommunikationsnetz überfragen werden. Beim Gegenstand dieses Dokumentes kann somit ein in dem Speicher befindlicher Datensatz durch einen neuen ersetzt werden. Bei den neu in dem Speicher abgelegten Datensatz handelt es sich um Programmdateien, die notwendig sind, um beispielsweise eine Menüführung realisieren zu können. Diese eingelesenen Daten benötigen keine Aufbereitung und insbesondere handelt es sich bei diesen eingelesenen Daten nicht um solche, die innerhalb des Steuergerätes über einen Phonemsequenzer geleitet werden. Beschrieben ist somit ausschließlich ein sprachgesteuertes Steuergerät zum Programmieren eines Videorekorders, der auch über eine Telekommunikationsleitung sprachansteuerbar ist.Out DE 197 43 367 A1 is a voice-controlled remote programming and remote control of a video recorder known. This device has a memory in the voice control unit, in which the data required for the speech recognition, the voice output, the control and / or menu management are stored. It is pointed out in this document that an exchange of this memory - ie a complete replacement of the originally deposited data with a new one Record - is conceivable to improve menu navigation or to adapt the control unit to another electrical device. This new data record can be read out by a memory located on a chip card or transmitted via the telecommunications network. Thus, in the subject matter of this document, a record in the memory can be replaced with a new one. The data records newly stored in the memory are program files which are necessary in order, for example, to be able to implement menu navigation. These read data do not require any processing and, in particular, these read-in data are not those that are routed within the control unit via a phoneme sequencer. Described is thus exclusively a voice-controlled controller for programming a video recorder, which is also language controllable via a telecommunication line.

In zunehmendem Maße werden Spracheingabe gesteuerte Steuergeräte zum Bedienen unterschiedlicher Aktoren eingesetzt. Mittels einer solchen Sprachsteuerung können beispielsweise Maschinen oder auch elektrische/elektronische Geräte bedient werden. Bei diesen Einsätzen bedient man sich sprecherunabhängiger Systeme, da mitunter nur eine geringe Rechenleistung zur Verfügung steht und im allgemeinen nur bestimmte Begriffe bzw. Befehle erkannt werden müssen. Derartige Steuergeräte finden beispielsweise auch Einsatz in Kraftfahrzeugen und dienen dort etwa zum Bedienen eines Telefons. Gerade im Kraftfahrzeugbereich ist der Einsatz derartiger Steuergeräte sinnvoll, da dann zur Bedienung der Aktoren der Fahrer seine Hände nicht vom Lenkrad entfernen muß. Überdies brauchen Lenkräder dann auch nicht mehr mit bestimmten Bedienungsschaltern überlastet zu sein.In increasing Voice input controlled controllers are used to operate different Actuators used. By means of such a voice control, for example Machines or even electrical / electronic devices are operated. In these operations you use speaker independent Systems, since sometimes only a small amount of computing power is available and in general only certain terms or commands are recognized have to. Such controllers for example, find use in motor vehicles and serve there for example to operate a telephone. Especially in the automotive sector is the use of such control units makes sense, since then to operate the actors of the drivers his hands does not have to remove from the steering wheel. moreover need steering wheels then no longer overloaded with certain control switches to be.

Ausgehend von diesem diskutierten Stand der Technik liegt der Erfindung daher die Aufgabe zugrunde, ein vorbekanntes spracheingabegesteuertes Steuergerät, beispielsweise in einem Kraftfahrzeug installiert, dergestalt weiterzubilden, dass dieses grundsätzlich nicht nur eingesetzt werden kann, um ein mobiles Gerät, beispielsweise ein Mobiltelefon bedienen zu können, sondern mit dem auch ein Abgleich von in dem dem mobilen Gerät zugeordneten Speichr hinterlegten Daten mit solchen, die in einem Speicher des Steuergerätes liegen vorgenommen werden kann.outgoing from this discussed prior art, the invention therefore lies the task is based, a previously known voice input controlled control device, for example Installed in a motor vehicle, educate in such a way that this basically not only can be used to a mobile device, for example to be able to operate a mobile phone but also a match of the memory assigned to the mobile device deposited data with those that are located in a memory of the control unit can be made.

Diese Aufgabe wird erfindungsgemäß durch ein eingangs genanntes Spracheingabe gesteuertes Steuergerät gelöst, bei dem das Lesegerät zum Auslesen von in elektronischer Form gespeicherten Wörtern aus einem mobilen, an das Lesegerät angeschlossenen Speichermedium konzipiert ist, der Ausgang des Lesegerätes an den Eingang des Phonemsequenzers und dieser mit seinem Ausgang an einen Eingang des Speichermoduls angeschlossen ist und das Speichermodul in zwei Bereiche unterteilt ist, wobei in einem Bereich Standardphonemsequenzen und in dem weiteren Bereich von dem Phonemsequenzer nach Auslesen von Wörtern durch das Lesegerät umgesetzte Phonemsequenzen abgelegt sind.These The object is achieved by a at the beginning said voice input controlled control unit solved at the reader for reading out words stored in electronic form a mobile, to the reader connected storage medium, the output of the reader to the Input of the phoneme sequencer and this with its output to an input the memory module is connected and the memory module in two Areas is divided, wherein in one area standard phoneme sequences and in the wider area of the phoneme sequencer after reading out words through the reader converted phoneme sequences are stored.

Ferner wird diese Aufgabe durch ein eingangs genanntes Verfahren mit den Merkmalen des Anspruchs 8 gelöst.Further This object is achieved by an initially mentioned method with the Characteristics of claim 8 solved.

Das erfindungsgemäße Steuergerät umfaßt ein Lesegerät, mit dem in elektronischer Form gespeicherte Wörter, beispielsweise in einer Textdatenbank ausgelesen werden können. Der Ausgang des Lesegerätes beaufschlagt den Eingang eines Phonemsequenzers, mit dem eine Umsetzung des oder der ausgelesenen Wörter in ihre Phoneme erfolgt. Die Phoneme werden in dem Speichermodul der Spracherkennungseinrichtung abrufbar gespeichert. Die Implementierung eines Lesegerätes und eines Phonemsequenzers in ein Spracheingabe gesteuertes Steuergerät mit einem sprecherunabhängigen, phonembasierten Spracherkennungssystem gibt einem Benutzer nunmehr die Möglichkeit, den standardisiert in dem Speichermodul hinterlegten Wortschatz durch weitere Wörter zu ergänzen. In Abhängigkeit von der Ausgestaltung des Speichers und der Ausgestaltung des Systems kann vorgesehen sein, daß bestimmte, als Phoneme in dem Speichermodul hinterlegte Wörter auch gelöscht werden können. Besonders geeignet ist ein solches Steuergerät, wenn mit dem Lesegerät eine Textdatenbank mit den in das Phonemspeichermodul abzulegenden Wörtern oder Zahlen eines solchen Speichermediums ausgelesen werden kann. Bei dem Einlesen der über den Phonemsequenzer transformierten Worte in das Speichermodul kann eine Überprüfung dahingehend erfolgen, ob in dem Speichermodul bereits identische Begriffe gespeichert sind. Das Speichermodul umfasst zumindest zwei Speicherbereiche, wobei in dem einen Speicherbereich der notwendige Standardwortschatz und in einem anderen Speicherbereich ein variabler, in seine Phonemsequenzen zerlegter Wortschatz abgelegt ist. Auf diese Weise kann ohne weiteres beispielsweise der variable Wortschatz gelöscht und durch einen neuen aus demselben oder einem anderen mobilen Gerät eingelesenen ersetzt werden.The Control unit according to the invention comprises a reader, with the stored in electronic form words, for example in a Text database can be read. The output of the reader is applied the input of a phoneme sequencer, with the implementation of the or read out words into their phonemes. The phonemes are in the memory module the voice recognition device stored retrievable. The implementation a reader and a phoneme sequencer in a voice input controlled controller with a speaker-independent, phoneme-based Speech recognition system now gives a user the ability to the standardized vocabulary stored in the memory module through more words to complete. Dependent on the design of the memory and the design of the system it may be provided that certain as phonemes deposited in the memory module words are also deleted can. Such a control unit is particularly suitable if the reader is a text database with the words or numbers to be put into the phoneme memory module such a storage medium can be read. When reading the over the phoneme sequencer transformed words in the memory module can a check to that effect take place whether already stored in the memory module identical terms are. The memory module comprises at least two memory areas, wherein in the one memory area, the necessary standard vocabulary and in another memory area a variable, in its phoneme sequences decomposed vocabulary is stored. This way can easily For example, the variable vocabulary is deleted and replaced by a new one be read from the same or another mobile device read.

Besonders zweckmäßig ist der Einsatz eines solchen Steuergerätes, wenn dieses in Verbindung mit mobilen Geräten eingesetzt wird. Beispielsweise können bei einem solchen Steuergerät über das Lesegerät die auf einer Telefonkarte eines Mobiltelefons abgespeicherten Telefonnummern sowie die den Telefonnummern zugeordneten Namen ausgelesen und in dem Speichermodul hinterlegt werden. Ein an das Steuergerät angeschlossenes Telefon kann anschließend Spracheingabe gesteuert bedient werden. Eine solche Einrichtung ist zweckmäßig zum Einsatz in einem Kraftfahrzeug, wenn die außerhalb des Kraftfahrzeuges mit dem Mobiltelefon aufgenommenen Telefonnummern auch im Kraftfahrzeug genutzt werden sollen. Auf diese Weise ist das kraftfahrzeugseitige Telefon immer aktualisierbar.Particularly useful is the use of such a control device when used in conjunction with mobile devices. For example, the telephone numbers stored on a telephone card of a mobile telephone and the names assigned to the telephone numbers can be read out in such a control unit via the reading device sen and stored in the memory module. A telephone connected to the control unit can then be controlled using voice input. Such a device is expedient for use in a motor vehicle when the outside of the motor vehicle recorded with the mobile phone numbers are to be used in the vehicle. In this way, the vehicle-side phone is always updateable.

Nachfolgend ist der Gegenstand der Erfindung anhand eines Ausführungsbeispieles unter Bezugnahme auf die beigefügte 1 beschrie ben.Hereinafter, the subject matter of the invention with reference to an embodiment with reference to the accompanying 1 described ben.

In dieser Figur ist in einem schematisierten Blockschaltbild ein Spracheingabe gesteuertes Steuergerät 1 wiedergegeben. Das Steuergerät 1 umfaßt eine Spracherkennungseinrichtung 2, an welche ein Mikrophon 3 angeschlossen ist. Das Mikrophon 3 dient zur Aufnahme der von einem Benutzer gesprochenen Steuerbefehle. Die Spracherkennungseinrichtung 2 umfaßt ferner ein Speichermodul 4, welches in einen Speicherbereich 5 und in einen Speicherbereich 6 unterteilt ist. Das Speichermodul 4 dient als Speicher von Phonemsequenzen, wobei der Speicherbereich 5 denjenigen Speicherbereich darstellt, in dem die standardmäßig zum Bedienen des Steuergerätes 1 notwendigen Wörter abgespeichert sind. Der Speicherbereich 6, der ebenfalls unterteilt sein kann, dient als Speichermöglichkeit, zum Ablegen von benutzerspezifischen Phonemsequenzen. An das Steuergerät 1 sind ausgangsseitig mehrere Aktoren 7, 8, 9 angeschlossen, die durch das Steuergerät 1 Spracheingabe gesteuert betätigt werden können.In this figure, in a schematic block diagram is a voice input controlled controller 1 played. The control unit 1 comprises a speech recognition device 2 to which a microphone 3 connected. The microphone 3 serves to receive the commands spoken by a user. The speech recognition device 2 further comprises a memory module 4 which is in a storage area 5 and in a storage area 6 is divided. The memory module 4 serves as a memory of phoneme sequences, the memory area 5 represents that memory area in which the standard for operating the control unit 1 necessary words are stored. The storage area 6 , which can also be divided, serves as a storage option for storing user-specific phoneme sequences. To the control unit 1 On the output side, there are several actuators 7 . 8th . 9 connected by the control unit 1 Voice input controlled can be operated.

Der Spracherkennungseinrichtung 2 vorgeschaltet ist ein Lesegerät 10 sowie ein Phonemsequenzer 11. An einen weiteren Eingang des Phonemsequenzers 11 ist eine sprachtypische Phonemdatenbank 11' angeschlossen, anhand der die ausgelesenen Worte in ihre Phoneme zerlegt werden. Das Lesegerät 10 ist bei dem dargestellten Ausführungsbeispiel als Halter eines Mobiltelefons 12 konzipiert. Teil des Lesegerätes 10 ist eine in der Figur nicht näher dargestellte Schnittstelle, über die die in dem Mobiltelefon 12 enthaltene Chipkarte bezüglich der auf der Chipkarte in einer Textdatenbank enthaltenen Rufnummern und Namen auslesbar ist. Der Phonemsequenzer 11 ist mit seinem Eingang an den Ausgang des Lesegerätes 10 angeschlossen. Demzufolge werden die von dem Lesegerät 10 ausgelesenen Wörter bzw. Zahlen von dem Phonemsequenzer 11 in die den Wörtern bzw. Zahlen eigenen Phoneme umgesetzt. Diese von dem Phonemsequenzer 11 umgesetzten Phonemsequenzen werden abgespeichert in dem Bereich 6 des Speichermoduls 4. Durch eine Steuerleitung 13 ist ein Ausgang des Steuergerätes 1 mit einem Eingang des Lesegerätes 10 verbunden, so daß nunmehr das in das Lesegerät 10 eingesetzte Mobiltelefon sprachgesteuert bedient werden kann.The speech recognition device 2 upstream is a reader 10 as well as a phoneme sequencer 11 , To another input of the phoneme sequencer 11 is a language-typical phoneme database 11 ' connected, are decomposed by the words read into their phonemes. The reader 10 is in the illustrated embodiment as a holder of a mobile phone 12 designed. Part of the reader 10 is an interface not shown in the figure, on the in the mobile phone 12 contained chip card with respect to the call numbers and names contained in the smart card in a text database is readable. The phoneme sequencer 11 is with its input to the output of the reader 10 connected. Consequently, those of the reader 10 read out words or numbers from the phoneme sequencer 11 translated into the phonemes own phonemes. This from the phoneme sequencer 11 converted phoneme sequences are stored in the range 6 of the memory module 4 , Through a control line 13 is an output of the control unit 1 with an input of the reader 10 connected so that now in the reader 10 used mobile phone can be operated voice-controlled.

Besonders zweckmäßig ist ein solches Steuergerät 1, wenn dieses in ei nem Kraftfahrzeug eingesetzt ist, da in einem solchen Anwendungsfall eine Spracheingabe gesteuerte Bedienung von Aktoren besonders sinnvoll ist, insbesondere auch um auf diese Weise ein im Kraftfahrzeug eingebautes Telefonsystem mit den Daten eines Mobiltelefons zu versorgen. Anstelle eines Mobiltelefons kann in eine solches Lesegerät auch ein anderer mobiler Speicher eingesetzt werden.Particularly useful is such a controller 1 if this is used in egg nem motor vehicle, since in such an application, a voice input controlled operation of actuators is particularly useful, especially to provide in this way a built-in motor vehicle telephone system with the data of a mobile phone. Instead of a mobile phone, another mobile memory can also be used in such a reading device.

In einer weiteren Ausgestaltung ist vorgesehen, daß einem solchen Steuergerät als Lesegerät ein Diskettenlaufwerk oder ein CD-Rom-Laufwerk zugeordnet ist, um dem Steuergerät einen weiteren, auf einem solchen Datenträger enthaltenen Wortschatz zuzuführen.In A further embodiment provides that such a controller as a reading device, a floppy disk drive or a CD-ROM drive is assigned to the controller other vocabulary contained on such a medium supply.

11
Steuergerätcontrol unit
22
SpracherkennungseinrichtungSpeech recognition device
33
Mikrophonmicrophone
44
Speichermodulmemory module
55
Speicherbereichstorage area
66
Speicherbereichstorage area
77
Aktoractuator
88th
Aktoractuator
99
Aktoractuator
1010
Lesegerätreader
1111
PhonemsequenzerPhonemsequenzer
11'11 '
Phonemdatenbankphoneme
1212
Mobiltelefonmobile phone
1313
Steuerleitungcontrol line

Claims (8)

Spracheingabe gesteuertes Steuergerät zum Ansteuern von elektrischen/elektronischen Aktoren (79) mit einer Spracherkennungseinrichtung (2) mit einem Mikrophon (3), über das die Spracheingabe erfolgt, und mit einem Speichermodul (4), in dem ein in seine Phonemsequenzen zerlegter Wortschatz umfassend diejenigen Wörter hinterlegt ist, die durch das Steuergerät (1) bei einer Spracheingabe zu erkennen sind, wobei das Steuergerät (1) ein Lesegerät (10) sowie einen Phonemsequenzer (11) umfaßt und das Lesegerät (10), der Phonemsequenzer (11) und das Speichermodul (4) miteinander verbunden sind, dadurch gekennzeichnet, dass das Lesegerät (10) zum Auslesen von in elektronischer Form gespeicherten Wörtern aus einem mobilen, an das Lesegerät (10) angeschlossenen Speichermedium konzipiert ist, der Ausgang des Lesegerätes (10) an den Eingang des Phonemsequenzers (11) und dieser mit seinem Ausgang an einen Eingang des Speichermoduls (4) angeschlossen ist und das Speichermodul (4) in zwei Bereiche (5, 6) unterteilt ist, wobei in einem Bereich (5) Standardphonemsequenzen und in dem weiteren Bereich (6) von dem Phonemsequenzer (11) nach Auslesen von Wörtern durch das Lesegerät (10) umgesetzte Phonemsequenzen abgelegt sind.Voice input controlled control device for controlling electrical / electronic actuators ( 7 - 9 ) with a speech recognition device ( 2 ) with a microphone ( 3 ), via which the voice input takes place, and with a memory module ( 4 ), in which a vocabulary broken down into its phoneme sequences is comprehensively stored those words which are output by the control unit ( 1 ) can be recognized in a voice input, wherein the control unit ( 1 ) a reader ( 10 ) as well as a phoneme sequencer ( 11 ) and the reader ( 10 ), the phoneme sequencer ( 11 ) and the memory module ( 4 ), characterized in that the reading device ( 10 ) for reading out words stored in electronic form from a mobile to the reading device ( 10 ) connected storage medium, the output of the reader ( 10 ) to the input of the phoneme sequencer ( 11 ) and this with its output to an input of the memory module ( 4 ) and the memory module ( 4 ) into two areas ( 5 . 6 ), where in one area ( 5 ) Standard phoneme sequences and in the broader field ( 6 ) of the phoneme sequencer ( 11 ) after reading out words by the reader ( 10 ) converted phoneme sequences are stored. Steuergerät nach Anspruch 1, dadurch gekennzeichnet, dass auf dem mobilen Speichermedium eine Textdatenbank gespeichert ist.control unit according to claim 1, characterized in that on the mobile storage medium a text database is stored. Steuergerät nach Anspruch 2, dadurch gekennzeichnet, dass die Textdatenbank auf einer Chip-Karte gespeichert ist.control unit according to claim 2, characterized in that the text database stored on a chip card. Steuergerät nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass das Steuergerät (1) Teil einer Einrichtung ist, die neben dem Steuergerät (1) ein mobiles Gerät (12) mit einem Speichermedium umfasst, in dem eine zum Bedienen des mobilen Gerätes vorgesehene Textdatenbank abgelegt ist und das Lesegerät (10) eine Schnittstelle zum Anschließen des mobilen Gerätes (12) zum Auslesen der in seinem Speichermedium enthaltenen Textdatenbank aufweist.Control unit according to one of claims 1 to 3, characterized in that the control unit ( 1 ) Is part of a device next to the control unit ( 1 ) a mobile device ( 12 ) comprising a storage medium in which a text database provided for operating the mobile device is stored and the reading device ( 10 ) an interface for connecting the mobile device ( 12 ) for reading out the text database contained in its storage medium. Steuergerät nach Anspruch 4, dadurch gekennzeichnet, dass das mobile Gerät über eine Steuerleitung (13) an die Spracherkennungseinrichtung (2) zum Bedienen des mobilen Gerätes (12) angeschlossen ist.Control device according to claim 4, characterized in that the mobile device via a control line ( 13 ) to the speech recognition device ( 2 ) for operating the mobile device ( 12 ) connected. Steuergerät nach Anspruch 4 oder 5, dadurch gekennzeichnet, dass das mobile Gerät ein Mobiltelefon (12) ist.Control unit according to Claim 4 or 5, characterized in that the mobile device is a mobile telephone ( 12 ). Verwendung eines Steuergerätes nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass dieses als Steuergerät in ein Kraftfahrzeug zum Ansteuern von benutzerzugänglichen Aktoren integriert ist.Use of a control device according to one of claims 1 to 6, characterized in that this as a control device in a Integrated motor vehicle for driving user-accessible actuators is. Verfahren zum Bedienen eines ein Speichermedium mit einer Textdatenbank enthaltenden, an ein spracheingabegesteuertes Steuergerät (2) angeschlossenen mobilen Gerätes, etwa eines Mobiltelefons, wobei der zur Spracheingabesteuerung notwendige Standardwortschatz in einem Speicher (4) des Steuergerätes (2) hinterlegt ist, dadurch gekennzeichnet, dass nach Anschließen des mobilen Gerätes (12) an das Steuergerät (1) die Textdatenbank des Speichermediums des mobilen Gerätes (12) ausgelesen wird und anschließend die ausgelesenen Worte in ihre Phonemsequenzen zerlegt und diese in einem separaten, von dem Speicherbereich (5) mit dem Standardwortschatz unterschiedlichen Speicherbereich (6) des Speichers (4) des Steuergerätes (1) abgelegt werden, so dass anschließend das mobile Gerät (12) über das Steuergerät (1) spracheingabegesteuert unter Nutzung der in dem mobilen Gerät abgelegten Datenbank mit dem Standardwortschatz bedient werden kann.Method for operating a speech-input-controlled control unit containing a storage medium with a text database ( 2 ) connected mobile device, such as a mobile phone, the necessary for voice input control standard vocabulary in a memory ( 4 ) of the control unit ( 2 ), characterized in that after connecting the mobile device ( 12 ) to the control unit ( 1 ) the text database of the storage medium of the mobile device ( 12 ) and then decomposes the read-out words into their phoneme sequences and stores them in a separate memory area ( 5 ) with the standard vocabulary different memory area ( 6 ) of the memory ( 4 ) of the control unit ( 1 ), then the mobile device ( 12 ) via the control unit ( 1 ) can be operated with the standard vocabulary using the database stored in the mobile device.
DE2000117717 2000-04-11 2000-04-11 Voice input controlled controller Expired - Lifetime DE10017717B4 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2000117717 DE10017717B4 (en) 2000-04-11 2000-04-11 Voice input controlled controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2000117717 DE10017717B4 (en) 2000-04-11 2000-04-11 Voice input controlled controller

Publications (2)

Publication Number Publication Date
DE10017717A1 DE10017717A1 (en) 2001-10-18
DE10017717B4 true DE10017717B4 (en) 2006-01-05

Family

ID=7638190

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2000117717 Expired - Lifetime DE10017717B4 (en) 2000-04-11 2000-04-11 Voice input controlled controller

Country Status (1)

Country Link
DE (1) DE10017717B4 (en)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3931638A1 (en) * 1989-09-22 1991-04-04 Standard Elektrik Lorenz Ag METHOD FOR SPEAKER ADAPTIVE RECOGNITION OF LANGUAGE
DE4111781A1 (en) * 1991-04-11 1992-10-22 Ibm COMPUTER SYSTEM FOR VOICE RECOGNITION
EP0602296A1 (en) * 1992-12-17 1994-06-22 International Business Machines Corporation Adaptive method for generating field dependant models for intelligent systems
EP0661688A2 (en) * 1993-12-30 1995-07-05 International Business Machines Corporation System and method for location specific speech recognition
DE19533541C1 (en) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Method for the automatic control of one or more devices by voice commands or by voice dialog in real time and device for executing the method
WO1997037311A1 (en) * 1996-04-02 1997-10-09 Siemens Aktiengesellschaft Device for compiling a digital dictionary and process for compiling a digital dictionary by means of a computer
DE19743367A1 (en) * 1997-09-30 1999-03-04 Siemens Ag Video tape recorder with remote speech control over telecommunication channel
DE19907854A1 (en) * 1998-02-26 1999-09-02 Tech Physikalische Systeme Ges Speaker verification system using spoken password

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3931638A1 (en) * 1989-09-22 1991-04-04 Standard Elektrik Lorenz Ag METHOD FOR SPEAKER ADAPTIVE RECOGNITION OF LANGUAGE
DE4111781A1 (en) * 1991-04-11 1992-10-22 Ibm COMPUTER SYSTEM FOR VOICE RECOGNITION
EP0602296A1 (en) * 1992-12-17 1994-06-22 International Business Machines Corporation Adaptive method for generating field dependant models for intelligent systems
EP0661688A2 (en) * 1993-12-30 1995-07-05 International Business Machines Corporation System and method for location specific speech recognition
DE19533541C1 (en) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Method for the automatic control of one or more devices by voice commands or by voice dialog in real time and device for executing the method
WO1997037311A1 (en) * 1996-04-02 1997-10-09 Siemens Aktiengesellschaft Device for compiling a digital dictionary and process for compiling a digital dictionary by means of a computer
DE19743367A1 (en) * 1997-09-30 1999-03-04 Siemens Ag Video tape recorder with remote speech control over telecommunication channel
DE19907854A1 (en) * 1998-02-26 1999-09-02 Tech Physikalische Systeme Ges Speaker verification system using spoken password

Also Published As

Publication number Publication date
DE10017717A1 (en) 2001-10-18

Similar Documents

Publication Publication Date Title
EP2176858B1 (en) Method for voice recognition
DE19709518C5 (en) Method and device for voice input of a destination address in a real-time route guidance system
DE19533541C1 (en) Method for the automatic control of one or more devices by voice commands or by voice dialog in real time and device for executing the method
DE102006039126A1 (en) Method for speech recognition and speech reproduction
EP1649450A1 (en) Speech recognition method, and communication device
DE102018113034A1 (en) VOICE RECOGNITION SYSTEM AND VOICE RECOGNITION METHOD FOR ANALYZING A COMMAND WHICH HAS MULTIPLE INTENTIONS
DE10054583C2 (en) Method and apparatus for recording, searching and playing back notes
DE102006006069A1 (en) A distributed speech processing system and method for outputting an intermediate signal thereof
DE102015211101A1 (en) Speech recognition system and method for operating a speech recognition system with a mobile unit and an external server
EP3095114B1 (en) Method and system for generating a control command
EP1606794B1 (en) Speaker-dependent voice recognition method and voice recognition system
EP1282897B1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
DE10127559A1 (en) User group-specific pattern processing system, e.g. for telephone banking systems, involves using specific pattern processing data record for the user group
WO2015185464A1 (en) Assistance system that can be controlled by means of voice inputs, having a functional device and a plurality of voice recognition modules
EP2068123A2 (en) Method for operating a navigation device
EP1321851B1 (en) Method and system for the usage of user selectable markers as entry points in the structure of a menu of a speech dialogue system
DE10017717B4 (en) Voice input controlled controller
DE10011178A1 (en) Speech-activated control method for electrical device
WO2000028527A1 (en) Data processing system or communications terminal with a device for recognising speech and method for recognising certain acoustic objects
DE60222413T2 (en) VOICE RECOGNITION
EP1344211B1 (en) Device and method for differentiated speech output
EP0414238B1 (en) Voice controlled archival system
EP1251491A2 (en) Method for querying database records by speech input
EP1302928A1 (en) Method for speech recognition, particularly of names, and speech recognizer
DE10060295A1 (en) Method for storing acoustic information and method for selecting information stored using this method

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R084 Declaration of willingness to licence
R084 Declaration of willingness to licence
R085 Willingness to licence withdrawn
R081 Change of applicant/patentee

Owner name: NUANCE COMMUNICATIONS, INC., BURLINGTON, US

Free format text: FORMER OWNER: LEOPOLD KOSTAL GMBH & CO. KG, 58513 LUEDENSCHEID, DE

R082 Change of representative

Representative=s name: HOGAN LOVELLS INTERNATIONAL LLP, DE

R071 Expiry of right