DE10329546A1 - Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias - Google Patents

Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias Download PDF

Info

Publication number
DE10329546A1
DE10329546A1 DE10329546A DE10329546A DE10329546A1 DE 10329546 A1 DE10329546 A1 DE 10329546A1 DE 10329546 A DE10329546 A DE 10329546A DE 10329546 A DE10329546 A DE 10329546A DE 10329546 A1 DE10329546 A1 DE 10329546A1
Authority
DE
Germany
Prior art keywords
lexicon
speech recognition
application
words
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10329546A
Other languages
German (de)
Inventor
Klaus Dipl.-Ing. Bader
Fritz Dr. Class
Udo Dr. Haiber
Harald Dr. Hüning
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mercedes Benz Group AG
Original Assignee
DaimlerChrysler AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DaimlerChrysler AG filed Critical DaimlerChrysler AG
Priority to DE10329546A priority Critical patent/DE10329546A1/en
Publication of DE10329546A1 publication Critical patent/DE10329546A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

The method involves recognizing pure phonetic inputs. The phonetic inputs are compared for the respective application and or the respective user relevant words against specific encyclopedias. During the recognition, a base encyclopedia is accessed, where all words of the application and or user specific encyclopedias are deposited. By means of references in the application the encyclopedia entries in the encyclopedia are accessed. An independent claim is included for a speech recognition system.

Description

Die Erfindung betrifft ein Verfahren zum Betrieb eines automatischen Spracherkennungssystems sowie ein Spracherkennungssystem für die automatische Spracherkennung.The The invention relates to a method for operating an automatic Speech recognition system and a voice recognition system for automatic Voice recognition.

Erste am Markt erhältliche Spracherkennungssysteme sind für den Einsatz in unterschiedlichen Anwendungsgebieten vorgesehen. Beispielsweise werden Spracherkennungssysteme in Verbindung mit Büroapplikationen zur Erfassung von Texten oder in Verbindung mit technischen Einrichtungen zu deren Steuerung und Befehlseingabe eingesetzt. Im Fahrzeugbereich werden Spracherkennungssysteme hauptsächlich zur Steuerung von Informations- und Kommunikationsgeräten wie z.B. Radio, Telefon und Navigationssystemen eingesetzt. Dabei werden die durch den Benutzer geäußerten Spracheingaben bei der Spracherkennung mit Wörtern verglichen, welche im Spracherkennungssystem hinterlegt sind. Hierbei hängt die Leistungsfähigkeit von Spracherkennungssystemen wesentlich von der Anzahl der hinterlegten Wörter sowie der Struktur, in der diese Wörter hinterlegt sind, ab.First available on the market Speech recognition systems are for intended for use in different fields of application. For example, speech recognition systems are associated with office applications for capturing texts or in connection with technical facilities used for their control and command input. In the vehicle area Speech recognition systems are mainly used to control information and communication devices such as. Radio, telephone and navigation systems used. there become the voice inputs uttered by the user in speech recognition with words compared, which are stored in the speech recognition system. in this connection depends on that Efficiency of Speech recognition systems significantly on the number of deposited words and the structure in which these words are deposited.

JP 2000352992 beschreibt ein Spracherkennungssystem, welches Spracheingaben erkennt, indem diese mit hinterlegten Wörtern verglichen werden. Dabei sind die Wörter als Lexikoneinträge in einem Wörterlexikon hinterlegt, welches mehrere Universallexika (ROM-Speicher) und ein Anwenderlexikon (RAM- Speicher) umfasst. Damit die Lexikoneinträge des Wörterlexikons im Rahmen des Erkennungsvorgangs zum Vergleich herangezogen werden können, werden diese mittels einer Mikrocomputereinheit ausgewählt und in einem Erkenner-Lexikon als Lexikoneintrag hinterlegt. Hierbei umfasst das Spracherkennungssystem weitere Lexika, beispielsweise ein Phoneme-Lexikon sowie ein Sprachlexikon. JP 2000352992 describes a speech recognition system that recognizes speech input by comparing it with stored words. The words are stored as lexicon entries in a dictionary of words, which comprises several universal lexicons (ROM memory) and a user lexicon (RAM memory). So that the lexicon entries of the dictionary of words can be used in the context of the recognition process for comparison, they are selected by means of a micro-computer unit and stored in a recognizer lexicon as lexicon entry. In this case, the speech recognition system comprises further lexicons, for example a phoneme lexicon and a lexicon.

Die US 6112174 A beschreibt ein Spracherkennungssystem für umfangreiches Vokabular. Dabei umfasst das Spracherkennungssystem in einem ersten Speicher (ROM-Speicher) mehrere Lexika. In diesen Lexika sind Wörter in der Form von Lexikoneinträgen hinterlegt, welche bei einem Spracherkennungsvorgang zum Vergleich herangezogen werden können. In einem zweiten Speicher (RAM-Speicher) umfasst das Spracherkennungssystem eine Kopie desjenigen Lexikon aus dem ROM-Speicher, welches im Rahmen des Spracherkennungsvorgangs aktuell verwendet wird. Wobei das aktuell verwendete Lexikon alle Wörter von einem der im ROM-Speicher abgelegten Lexika in der Form von Lexikoneinträgen umfasst. Weiterhin umfasst das Spracherkennungssystem eine Lexikon-Wechseleinheit, womit während eines Spracherkennungsvorgangs ein Wechsel zwischen einzelnen Lexika des ROM-Speichers vollzogen werden kann. Bei einem im Zusammenhang mit einem Fahrzeug-Navigationssystem durchgeführten Spracherkennungsvorgang kann beispielsweise in Abhängigkeit von der aktuellen Fahrzeugposition zwischen unterschiedlichen Lexika des ROM-Speichers gewechselt werden, wobei in den unterschiedlichen Lexika Lexikoneinträge unterschiedlicher Gebiete hinterlegt sind. Ein wesentlicher Nachteil ist hierbei, dass identische Lexikoneinträge teilweise in mehreren Lexika abgelegt sein müssen, da sich z.B. Gebiete überlappen können. Zudem umfasst das aktuell verwendete Lexikon alle Lexikoneinträge eines Lexikons des ROM-Speichers und nicht nur eine Teilinformation davon.The US 6112174 A describes a speech recognition system for extensive vocabulary. In this case, the speech recognition system comprises several lexicons in a first memory (ROM memory). In these dictionaries words in the form of dictionary entries are deposited, which can be used in a speech recognition process for comparison. In a second memory (RAM), the speech recognition system comprises a copy of the lexicon from the ROM which is currently used in the speech recognition process. Wherein the lexicon currently used comprises all the words of one of the encyclopedias stored in the ROM memory in the form of lexicon entries. Furthermore, the speech recognition system comprises a lexicon exchange unit, with which a change between individual lexica of the ROM memory can be performed during a speech recognition process. In a voice recognition process carried out in connection with a vehicle navigation system, it is possible, for example, to switch between different lexicons of the ROM memory as a function of the current vehicle position, wherein lexicon entries of different areas are stored in the different lexicon. A major disadvantage here is that identical lexicon entries must be partially stored in several lexicons, since, for example, areas may overlap. In addition, the lexicon currently used includes all lexicon entries of a lexicon of the ROM memory and not just partial information thereof.

Der Erfindung liegt daher die Aufgabe zu Grunde, ein Verfahren zum Betrieb eines automatischen Spracherkennungssystems gemäß dem Oberbegriff des Patentanspruch 1 sowie einem Spracherkennungssystem für die automatische Spracherkennung gemäß dem Oberbegriff 8 zu schaffen, welches einen geringen Speicherbedarf bei gleichzeitig hoher Erkennungsrate aufweist und dabei flexibel einsetzbar ist.Of the The invention is therefore based on the object, a method for operation an automatic speech recognition system according to the preamble of claim 1 and a speech recognition system for automatic speech recognition according to the generic term 8 to create, which requires a small memory at the same time has high recognition rate and is flexible to use.

Die Aufgabe wird gemäß der Erfindung durch ein Verfahren mit den Merkmalen des Patentanspruchs 1 und einem Spracherkennungssystem mit den Merkmalen des Anspruchs 8 gelöst. Vorteilhafte Ausgestaltungen und Weiterbildungen werden in den Unteransprüchen aufgezeigt.The Task is according to the invention by a method having the features of claim 1 and a speech recognition system with the features of claim 8 solved. Advantageous embodiments and further developments are shown in the subclaims.

Gemäß der Erfindung wird ein Verfahren zum Betrieb eines automatischen Spracherkennungssystems vorgeschlagen. Das Spracherkennungssystem umfasst dabei eine Erkennereinheit, womit Spracheingaben erkannt werden. Hierbei werden Spracheingaben mit den für die jeweilige Applikation und/oder den jeweiligen Benutzer relevanten Wörtern verglichen. Die relevanten Wörter sind hierzu in mehreren applikations- und/oder benutzerspezifischen Lexika hinterlegt. In einer erfinderischen Weise wird bei der Erkennung auf ein Basislexikon zugegriffen, worin alle Wörter der applikations- und/oder benutzerspezifischen Lexika als Lexikoneinträge hinterlegt sind. Wobei mittels Verweisen in den applikations- und/oder benutzerspezifischen Lexika auf die Lexikoneinträge des Basislexikon zugegriffen wird. Mit der Erfindung wird ein Verfahren zum Betrieb eines automatischen Spracherkennungssystem geschaffen, welches aufgrund der Verwendung eines einzigen Basislexikon einen geringen Speicherbedarf besitzt. Insbesondere ist dabei der Speicherbedarf gering, da hierbei Lexikoneinträge in den applikations- und benutzerdefinierten Lexika nicht mehrfach hinterlegt sein müssen. Zudem weist das erfindungsgemäße Verfahren eine hohe Erkennungsrate auf. Insbesondere wird es durch die Verwendung von Verweisen zum Zugriff auf Lexikoneinträge möglich, kleinere Wortmengen zum Vergleich von Spracheingaben mit hinterlegten Wörtern heranzuziehen, wobei dabei die Verwechslungshäufigkeit geringer ist als bei einem Vergleich mit großen Wortmengen. Hierbei ist das Spracherkennungssystem flexibel für unterschiedliche Benutzer und/oder Applikationen einsetzbar.According to the invention, a method for operating an automatic speech recognition system is proposed. The speech recognition system comprises a recognizer unit, with which voice inputs are detected. Speech inputs are compared with the relevant words for the respective application and / or the respective user. The relevant words are stored for this purpose in several application and / or user-specific lexica. In an inventive manner, a base dictionary is accessed in the recognition, wherein all words of the application and / or user-specific lexica are stored as lexicon entries. The references to the lexicon entries of the base lexicon are accessed by means of references in the application and / or user-specific lexica. With the invention, a method for operating an automatic speech recognition system is created, which has a small memory requirement due to the use of a single base lexicon. In particular, the memory requirement is low because this lexicon entries in the application and user-defined dictionaries do not need to be multiple times deposited. In addition, the method according to the invention has a high recognition rate. In particular, by using references to access lexicon entries, it becomes possible to use smaller sets of words for comparison of speech input with deposited words, whereby the likelihood of confusion is lower than in comparison with large word sets. In this case, the speech recognition system can be used flexibly for different users and / or applications.

Indem bei der Erkennung ein einziges Basislexikon verwendet wird, ist es möglich, hiermit eine oder auch mehrere Applikationen umfassend abzudecken. Je größer dabei die Menge an Lexikoneinträgen im Basislexikon ist, umso höher ist die Freiheit des Benutzers bei der Wahl seiner Sprachäußerungen. Jedoch nimmt mit steigender Anzahl an Lexikoneinträgen im Basislexikon die Erkennungsrate des Spracherkennungssystems ab. Insbesondere da bei einem großen Lexikon die Verwechslungsmöglichkeiten im Rahmen des Vergleichs von Spracheingaben mit hinterlegten Wörtern höher sind als bei einem kleinen Lexikon mit wenigen Lexikoneinträgen. Bei einer besonders vorteilhaften Ausgestaltung der Erfindung werden die Lexikoneinträge wenigstens einer definierten Wortgruppe zugeordnet, welche in Verbindung mit dem Basislexikon steht. Beispielsweise wird sodann für jeden Benutzer und/oder jede Teilapplikation nur der zu diesem Dialogschritt gehörige Teilwortschatz aktiviert, wobei dieser Teilwortschatz durch die entsprechende Definition von Wortgruppen repräsentiert wird. Aufgrund der Definition von Wortgruppen wird der Umfang an Lexikoneinträgen, die zum Vergleich mit Spracheingaben herangezogen werden reduziert und dadurch die Erkennungsrate des Spracherkennungssystems in vorteilhafter Weise verbessert. Beispielsweise können dabei Wortgruppen für Füllwörter, Ortsnamen, Geräte, Spezifikationen, Steuerwörter, Aktionen, Buchstaben, Ziffern usw. definiert werden. Wobei es auch möglich ist, dass ein Lexikoneintrag mehreren unterschiedlichen Wortgruppen zugeordnet ist. Die Definition der Wortgruppen kann hierbei sowohl innerhalb des Basislexikons als auch außerhalb, beispielsweise in den applikations- und benutzerdefinierten Lexika erfolgen. Besonders vorteilhaft ist es dabei, wenn die Verweise in den applikations- und/oder benutzerdefinierten Lexika nicht direkt auf das Basislexikon sondern auf die einzelnen Wortgruppen verweisen.By doing in the detection of a single base lexicon is used is it is possible hereby cover one or more applications comprehensively. The bigger there the amount of lexicon entries in the basic lexicon, the higher is the freedom of the user in the choice of his utterances. However, as the number of dictionary entries in the base dictionary increases, so does the number the recognition rate of the speech recognition system. Especially there at a big one Encyclopedia the possibility of confusion are higher in the context of comparison of speech input with deposited words than a small lexicon with a few lexicon entries. At a Particularly advantageous embodiment of the invention, the lexicon entries are at least associated with a defined phrase associated with the basic lexicon stands. For example, then for each User and / or each subapplication only to this dialog step associated Partial vocabulary activated, this partial vocabulary by the corresponding definition of phrases is represented. Due to the Definition of phrases is the scope of lexicon entries used for Comparison with voice inputs are reduced and thereby the recognition rate of the speech recognition system in an advantageous Way improved. For example, word groups for filler words, place names, Equipment, Specifications, control words, Actions, letters, numbers, etc. are defined. And it too is possible, that a dictionary entry is assigned to several different phrases is. The definition of the word groups can be found both within of the basic lexicon as well as outside, for example, in the application and user-defined dictionaries respectively. It is particularly advantageous if the references not directly in the application and / or user-defined dictionaries refer to the basic lexicon but to the individual word groups.

In einer vorteilhaften Weise der Erfindung erfolgt die Zuordnung von Lexikoneinträgen zu Wortgruppen vor dem Betrieb und/oder zur Laufzeit des Spracherkennungssystems. Hierbei können beispielsweise Zuordnungen von Lexikoneinträgen zu Wortgruppen in Abhängigkeit eines oder mehrerer Benutzer getroffen werden. Auch ist eine Zuordnung von Lexikoneinträgen zu Wortgruppen in Abhängigkeit der jeweiligen Applikation möglich. Z.B. kann es im Zusammenhang mit einem Spracherkennungssystem zur Eingabe von Telefonnummern sinnvoll sein, Wortgruppen für Ziffern, Namen sowie für Steuerwörter zu definieren. Dabei kann beispielsweise eine Zuordnung von Lexikoneinträgen zu Wortgruppen in Abhängigkeit eines oder mehrerer Benutzer und/oder Applikationen getroffen werden, welche vor dem Betrieb des Spracherkennungssystems bereits bekannt sind. Auch ist es möglich, dass eine Zuordnung von Lexikoneinträgen zu Wortgruppen zur Laufzeit des Spracherkennungssystems getroffen wird. Beispielsweise falls es sich um neue, dem Spracherkennungssystem bisher unbekannte Benutzer und/oder Applikationen handelt. Z.B. können im Zusammenhang mit dem o.g. Dialogsystem zur Eingabe von Telefonnummern die Namen neuer Personen der Wortgruppe "Namen" hinzugefügt werden. Hierbei sind dem Fachmann Methoden bekannt, um automatisch zwischen denjenigen Wörtern zu unterscheiden welche Telefonnummern, Namen oder Steuerbefehle beschreiben.In an advantageous manner of the invention, the assignment of lexicon entries to phrases before operation and / or at runtime of the speech recognition system. Here you can For example, assignments of lexicon entries to groups of words depending on one or more users are taken. Also is an assignment of lexicon entries depending on phrases the respective application possible. For example, It may be related to a speech recognition system for Entering phone numbers make sense, phrases for digits, Name as well as for control words define. In this case, for example, an assignment of dictionary entries to groups of words dependent on one or more users and / or applications are taken, which is already known prior to the operation of the speech recognition system are. It is also possible that an assignment of lexicon entries to phrases at runtime of the speech recognition system. For example, if it is about new, the speech recognition system previously unknown users and / or Applications is. For example, can in connection with the o.g. Dialogue system for entering telephone numbers the names of new people are added to the phrase "names". Here are the Professional methods are known to automatically switch between those words distinguish which telephone numbers, names or control commands describe.

Bei einer weiteren vorteilhaften Ausgestaltung der Erfindung wird jeder Wortgruppe ein Gewicht zugeteilt, welches vor dem Betrieb und/oder zur Laufzeit des Spracherkennungssystems veränderbar ist. Wobei einer Wortgruppe beispielsweise in Abhängigkeit des aktuellen Benutzers und/oder der aktuellen Applikation ein höheres oder geringes Gewicht zuteilbar ist. In vorteilhafter Weise drückt sich in dieser Gewichtung die Wahrscheinlichkeit aus, mit der Wörter einer Wortgruppe von einem bestimmten Benutzer verwendet werden und/oder bei einer bestimmten Applikation vorkommen. Aufgrund der Gewichtung von Wortgruppen kann das Basislexikon in besonders vorteilhafter Weise in Haupt- und Nebengruppen unterteilt werden, wodurch sich in besonders vorteilhafter Weise eine höhere Erkennungsrate erreichen lässt.at a further advantageous embodiment of the invention, everyone Word group assigned a weight, which before the operation and / or is changeable at runtime of the speech recognition system. Where a phrase for example, depending on of the current user and / or the current application a higher or Low weight is allocable. In an advantageous way expresses itself in this weighting the probability of having the words one Phrase can be used by a specific user and / or occur in a particular application. Due to the weighting of word groups, the basic lexicon in particularly advantageous Be divided into main and subgroups, resulting in achieve a higher detection rate in a particularly advantageous manner leaves.

In besonderem Maße hat es sich bewährt, mittels der Erkennereinheit für erkannte Wörter und/oder Wortfolgen eine Erkennungswahrscheinlichkeit zu ermitteln. Die Erkennereinheit vergleicht zur Erkennung von Spracheingaben akustische Eingangssignale mit hinterlegten Wörtern unter Verwendung von Verfahren der Signalverarbeitung und der Mustererkennung. Wobei mittels der im Rahmen dieses Vergleichs verwendeten Mustererkennungsverfahren für erkannte Wörter ein Klassifikationsergebnis erzeugt wird. Neben einer eindeutigen Klassenzuordnung zu dem am besten passenden Wort und/oder der am besten passenden Wortfolge, liefern die dabei eingesetzten Mustererkennungsverfahren auch ein Glaubwürdigkeitsmaß zum Klassifikationsergebnis. Wobei die Erkennungswahrscheinlichkeit des Spracherkennungssystems in vorteilhafter Weise direkt diesem Glaubwürdigkeitsmaß entspricht oder beispielsweise auch weitere Gewichtungen in Abhängigkeit von Benutzern und Applikationen möglich sind.In special size it proved itself, by means of the recognizer unit for recognized words and / or Word sequences to determine a recognition probability. The recognizer unit compares acoustic input signals to detect speech input with deposited words using methods of signal processing and pattern recognition. Using the pattern recognition method used in this comparison for recognized words a classification result is generated. In addition to a clear Class assignment to the most appropriate word and / or am best matching word order, also provide the pattern recognition method used a measure of credibility to the classification result. Where the recognition probability of the speech recognition system advantageously corresponds directly to this measure of credibility or example also further weightings in dependence of users and applications are possible.

Auch hat es sich bewährt, im Rahmen einer Plausibilitätskontrolle mittels einer Sprachmodelleinheit für kontrollierte Wörter und/oder Wortfolgen eine Sprachmodellwahrscheinlichkeit zu ermitteln. Idealerweise handelt es sich hierbei um eine einzige Sprachmodelleinheit, jedoch besteht auch die Möglichkeit, dass die Sprachmodelleinheit in wenigstens zwei Teilsprachmodelleinheiten unterteilt ist. Die Aufgabe der Sprachmodelleinheit ist es hierbei, die mittels der Erkennereinheit erkannten Wörter und/oder Wortfolgen hinsichtlich ihrer Plausibilität zu kontrollieren. Als Plausibilitätskriterium wird dabei beispielsweise eine Wortfolgenstatistik eingesetzt, welche z.B. anhand großer Textkorpora berechnet und mit in die Sprachmodelleinheit integriert wird. Wobei im Rahmen dieser Plausibilitätskontrolle für Wörter und/oder Wortfolgen ein Glaubwürdigkeitsmaß vergeben wird. Die Sprachmodellwahrscheinlichkeit des Spracherkennungssystems entspricht dabei direkt diesem Glaubwürdigkeitsmaß. Jedoch ist es im Zusammenhang mit der Sprachmodellwahrscheinlichkeit auch möglich, dass das Glaubwürdigkeitsmaß zusätzlich einer Gewichtung unterzogen wird, beispielsweise in Abhängigkeit von Benutzern und/oder Applikationen.It has also proven itself in the context of a plausibility check by means of a language models for controlled words and / or phrases to determine a language model probability. Ideally, this is a single language model unit, but there is also the possibility that the language model unit is divided into at least two partial language model units. The task of the language model unit here is to check the plausibility of the words and / or word sequences recognized by the recognizer unit. As a plausibility criterion, for example, a word sequence statistics is used, which is calculated, for example, based on large text corpora and integrated into the language model unit. As part of this plausibility check for words and / or phrases awarded a measure of credibility. The language model probability of the speech recognition system corresponds directly to this measure of credibility. However, in the context of the language model likelihood, it is also possible for the credibility measure to be additionally weighted, for example as a function of users and / or applications.

Bei einer gewinnbringenden Ausführung der Erfindung wird aus einer Kombination von Erkennungs- und Sprachmodellwahrscheinlichkeit eine Gesamtwahrscheinlichkeit gebildet. Die Gesamtwahrscheinlichkeit wird sodann herangezogen, um daraus ein Gesamt-Erkennungsergebnis abzuleiten. Dabei kann es aufgrund der Sprachmodellwahrscheinlichkeit durchaus vorkommen, dass das Spracherkennungssystem nicht die von dessen Erkennungseinheit gelieferte am besten passende Wortfolge als Ergebnis ausgibt, sondern eine der aus Sicht der Erkennungseinheit schlechteren Alternativen.at a profitable execution The invention will be a combination of recognition and language model probability a total probability formed. The overall probability is then used to make it a total recognition result derive. It may be due to the language model probability It may happen that the speech recognition system does not match that of its recognition unit supplied best matching phrase as a result, but one from the point of view of the recognition unit worse alternatives.

Weitere Merkmale und Vorteile der Erfindung ergeben sich aus der folgenden Beschreibung von bevorzugten Ausführungsbeispielen anhand der Figuren. Dabei zeigen:Further Features and advantages of the invention will become apparent from the following Description of preferred embodiments with reference to Characters. Showing:

1 den prinzipiellen Aufbau des Spracherkennungssystems 1 the basic structure of the speech recognition system

2 das Prinzip der Verweisung applikationsspezifischer Lexika auf Lexikoneinträge eines Basislexikons 2 the principle of the reference of application-specific lexica to lexicon entries of a basic lexicon

3 Zuweisung von Wörtern zu Wortgruppen anhand ihrer semantischen Bedeutung 3 Assignment of words to phrases based on their semantic meaning

4 Zuweisung von Wörtern zu Wortgruppen anhand von Teilapplikationen 4 Assign words to phrases based on subapplications

1 zeigt beispielhaft den schematischen Aufbau des erfindungsgemäßen Spracherkennungssystems (1). Wobei das Spracherkennungssystem (1) im wesentlichen eine Erkennungseinheit (2) und eine Sprachmodelleinheit (4) umfasst. Wobei die Erkennereinheit (2) ein einziges Basislexikon (3) umfasst und das Basislexikon (3) aus einer Liste von Lexikoneinträgen der Wörter W1 bis Wn besteht. Die mit dem Mikrofon (6) aufgenommenen Spracheingaben werden der Erkennungseinheit (2) zugeführt, wobei mittels einem Erkennungsalgorithmus das am besten zur Spracheingabe passende Wort oder die Wortfolge ausgewählt wird. Hierbei wird nicht nur das am besten passende Wort oder die Wortfolge ausgegeben, sondern auch die nächst besten Alternativen. Der Vorteil bei der Verwendung eines einzigen Basislexikon (3) ist es, dass damit umfassend eine oder mehrere Teilapplikationen abgedeckt werden und der Benutzer dabei eine hohe Freiheit bei der Wahl seiner Äußerungen hat sowie ein geringer Speicherbedarf besteht. In vorteilhafter Weise wird zur Erhöhung der Erkennungsrate des Spracherkennungssystems (1) das Basislexikon (3) eingeschränkt. Wobei die für eine bestimmte Teilapplikation relevanten Wörter des Basislexikons (3) in Wortgruppen 1 bis n eingegliedert sind. Dabei sind die Lexikoneinträge des Basislexikon (3) mehreren unterschiedlichen Wortgruppen zugeordnet. Besonders vorteilhaft hat sich hierbei erwiesen, die Zuordnung von Wortgruppen zu Lexikoneinträgen mittels Bitmasken vorzunehmen. Durch setzen entsprechender Bitkombinationen ist eine Zuordnung eines Lexikoneintrags zu verschiedenen Wortgruppen möglich. Bei jedem Dialogschritt werden sodann mittels eines Steuerprogramms für eine bestimmte Teilapplikation und/oder einen bestimmten Benutzer die relevanten Wortgruppen aktiviert. Beim Erkennungsprozess werden dann die jeweiligen Lexikoneinträge in die Suche einbezogen, welche auf die aktuell aktivierten Wortgruppen verweisen. Nur diese Lexikoneinträge können dann erkannt werden und nur für diese Lexikoneinträge wird dann mittels der Sprachmodelleinheit (4) im Rahmen einer Plausibilitätskontrolle eine bestpassende Wortfolge zusammengestellt. Damit ist implizit auch das Sprachmodell auf eine bestimmte Teilapplikation eingeschränkt. Wobei die Sprachmodelleinheit (4) zur Minimierung des Speicheraufwands nur ein einziges Gesamtsprachmodell (5) umfasst. 1 shows by way of example the schematic structure of the speech recognition system according to the invention ( 1 ). Where the speech recognition system ( 1 ) essentially a recognition unit ( 2 ) and a language model unit ( 4 ). Where the recognizer unit ( 2 ) a single basic lexicon ( 3 ) and the basic lexicon ( 3 ) consists of a list of lexicon entries of the words W1 to Wn. The with the microphone ( 6 ) are input to the recognition unit ( 2 ), wherein by means of a recognition algorithm the most suitable word for speech input or the word sequence is selected. Here, not only the best matching word or phrase is output, but also the next best alternatives. The advantage of using a single base dictionary ( 3 ) is that it comprehensively covers one or more sub-applications and the user has a high degree of freedom in the choice of his utterances and there is a small memory requirement. Advantageously, to increase the recognition rate of the speech recognition system ( 1 ) the basic lexicon ( 3 ). Whereby the words of the basic lexicon relevant for a particular subapplication ( 3 ) in phrases 1 to n are incorporated. The lexicon entries of the basic lexicon ( 3 ) associated with several different word groups. It has proved particularly advantageous to carry out the assignment of word groups to lexicon entries by means of bit masks. By setting appropriate bit combinations, it is possible to assign a lexicon entry to different word groups. At each dialog step, the relevant word groups are then activated by means of a control program for a specific subapplication and / or a specific user. During the recognition process, the respective lexicon entries are then included in the search, which refer to the currently activated word groups. Only these lexicon entries can then be recognized and only for these lexicon entries is the language model unit ( 4 ) in the context of a plausibility check a best fitting phrase. This implicitly restricts the language model to a specific subapplication. Where the language model unit ( 4 ) to minimize the memory overhead, only a single overall language model ( 5 ).

In der 2 ist das Prinzip der Verweisung applikations- und benutzerspezifischer Lexika (2) bis (5) auf die Lexikoneinträge W1 bis Wn des Basislexikon (1) dargestellt. Die applikations- und benutzerspezifischen Lexika (2) bis (5) verweisen hierbei direkt auf die Lexikoneinträge W1 bis Wn des Basislexikon (1). Zusätzlich sind dabei innerhalb des Basislexikon (1) sowie in den applikations- und benutzerspezifischen Lexika (2) bis (5) Wortgruppen definiert. Alternativ dazu ist es auch möglich, die Definition von Wortgruppen außerhalb des Basislexikons (1) und der applikations- und benutzerspezifischen Lexika (2) bis (5) vorzunehmen. Hierzu wird beispielsweise eine weitere Ebene mit Wortgruppendefinitionen zwischen dem Basislexikon (1) und den applikations- und benutzerspezifischen Lexika (2) bis (5) eingeführt. Wobei unterschiedliche applikations- und benutzerspezifische Lexika (2) bis (5) auf einen oder mehrere Lexikoneinträge im Basislexikon (1) verweisen. Bei den Applikationen (6) und (7) kann es sich beispielsweise um die Bedienung eines Radios und Navigationssystems handeln. Jede Teilapplikation (6) und (7) hat dabei einen oder mehrere Verweise auf eines oder mehrere der applikations- und benutzerspezifischen Lexika (2) bis (5).In the 2 is the principle of the reference of application- and user-specific dictionaries ( 2 ) to ( 5 ) to the dictionary entries W1 to Wn of the basic lexicon ( 1 ). The application and user-specific lexica ( 2 ) to ( 5 ) refer directly to the lexicon entries W1 to Wn of the basic lexicon ( 1 ). Additionally, within the basic lexicon ( 1 ) as well as in the application and user-specific dictionaries ( 2 ) to ( 5 ) Word groups defined. Alternatively, it is also possible to use the definition of phrases outside the basic lexicon ( 1 ) and the application and user-specific lexica ( 2 ) to ( 5 ). For this purpose, for example, another level with word group definitions between the base lexicon ( 1 ) and the application and user-specific dictionaries ( 2 ) to ( 5 ) leads. Whereby different application- and user-specific lexica ( 2 ) to ( 5 ) to one or more dictionary entries in the basic lexicon ( 1 ) refer. In the applications ( 6 ) and ( 7 ) may be, for example, the operation of a radio and navigation system. Each subapplication ( 6 ) and ( 7 ) has one or more references to one or more of the application and user-specific lexica ( 2 ) to ( 5 ).

Die in der 3 dargestellte Tabelle zeigt beispielhaft die Zuweisung von Wörtern zu Wortgruppen anhand ihrer semantischen Bedeutung. Beispielhaft wird dabei als Teilapplikation die Bedienung eines CD-Spielers, insbesondere die Titelauswahl einer CD betrachtet. Beispielsweise könnte von einem Benutzer hierbei folgende Spracheingabe durchgeführt werden: "Bitte CD 1 Titel 5 abspielen". Die im Basislexikon als Lexikoneintrag hinterlegten Wörter sind insgesamt acht definierten Wortgruppen zugeordnet, wobei jede der acht Wortgruppen eine eindeutige Bezeichnung besitzt. Für die Teilapplikation der Bedienung eines CD-Spielers sind dabei die Wortgruppen: 1, 2, 5, 6 und 7 von Relevanz. Durch die Definition der Wortgruppen anhand der semantischen Bedeutung der Wörter gibt es keine Überlappungen, d.h. jedes Wort des Basislexikon ist genau einer Wortgruppe zugeordnet. Zur Aktivierung einer Teilapplikation müssen sodann mehrere Wortgruppen aktiviert werden, um alle Wörter zu aktivieren, mit denen diese Teilapplikation abgedeckt werden kann.The in the 3 The table shown shows, by way of example, the assignment of words to phrases based on their semantic meaning. By way of example, the operation of a CD player, in particular the title selection of a CD, is considered as a subapplication. For example, the following voice input could be performed by a user: "Please play CD 1 track 5". The words stored in the base lexicon as a lexicon entry are associated with a total of eight defined word groups, each of the eight word groups having a unique name. For the subapplication of the operation of a CD player, the phrases: 1, 2, 5, 6 and 7 are relevant. By defining the word groups based on the semantic meaning of the words, there are no overlaps, ie each word of the base lexicon is associated with exactly one word group. To activate a subapplication, several phrases must then be activated in order to activate all the words with which this subapplication can be covered.

In der 4 ist eine Tabelle zur Zuweisung von Wörtern zu Wortgruppen anhand von Teilapplikationen dargestellt. Beispielhaft wird dabei als Teilapplikation die Bedienung eines CD-Spielers, insbesondere die Titelauswahl einer CD betrachtet. Beispielsweise könnte dabei von einem Benutzer folgende Spracheingabe durchgeführt werden: "Bitte CD 1 Titel 5 abspielen". Die im Basislexikon als Lexikoneintrag hinterlegten Wörter sind hierbei insgesamt drei definierten Wortgruppen zugeordnet, wobei jede der drei Wortgruppen jeweils alle relevanten Wörter für eine Teilapplikation umfassen und eine eindeutige Bezeichnung besitzen. Hierbei ist für die Teilapplikation der Bedienung eines CD-Spielers insbesondere die Wortgruppe 1 von Relevanz. Dieser Wortgruppe sind alle Wörter zugeordnet, die für diese Teilapplikation benötigt werden. Zur Aktivierung der CD-Bedienung muss daher nur diese eine Wortgruppe aktivieren werden. Bei dieser Art der Wortgruppendefinition gibt es Überlappungen, d.h. Lexikoneinträge sind teilweise mehreren Wortgruppen zugeordnet.In the 4 is a table for assigning words to phrases based on subapplications. By way of example, the operation of a CD player, in particular the title selection of a CD, is considered as a subapplication. For example, the following voice input could be performed by a user: "Please play CD 1 track 5". The words stored in the base lexicon as a lexicon entry are hereby associated with a total of three defined word groups, each of the three word groups each including all relevant words for a subapplication and having a unique name. In this case, in particular the word group 1 is of relevance for the subapplication of the operation of a CD player. This phrase is assigned all the words needed for this subapplication. To activate the CD operation, therefore, only this one phrase must be activated. In this type of word group definition, there are overlaps, ie lexicon entries are partially assigned to several phrases.

Neben den in den 3 und 4 dargestellten Möglichkeiten zur Zuweisung von Wörtern zu Wortgruppen sind beliebige Kombinationen und Mischungen über die Bitmaskentechnik möglich. Wobei hierbei jedes Wort nur einmal im Basislexikon hinterlegt ist und im Rahmen der Erkennung beliebig aktivierbar ist.In addition to those in the 3 and 4 Possible ways of assigning words to word groups are possible combinations and mixtures using the bitmask technique. Where each word is stored only once in the base lexicon and can be activated as desired within the scope of recognition.

Claims (12)

Verfahren zum Betrieb eines automatischen Spracherkennungssystems, wobei mittels einer Erkennereinheit Spracheingaben erkannt werden, und wobei Spracheingaben mittels für die jeweilige Applikation und/oder den jeweiligen Benutzer relevanten Wörtern verglichen werden, welche in mehreren applikations- und/oder benutzerspezifischen Lexika hinterlegt sind, dadurch gekennzeichnet, dass bei der Erkennung auf ein Basislexikon zugegriffen wird, worin alle Wörter der applikations- und/oder benutzerspezifischen Lexika als Lexikoneinträge hinterlegt sind, wobei mittels Verweisen in den applikations- und/oder benutzerspezifischen Lexika auf die Lexikoneinträge des Basislexikons zugegriffen wird.Method for operating an automatic speech recognition system, wherein voice inputs are recognized by means of a recognizer unit, and wherein speech inputs are compared by means of words relevant to the respective application and / or the respective user, which are stored in a plurality of application and / or user-specific lexicons, characterized that in the recognition of a base lexicon is accessed, wherein all words of the application and / or user-specific lexica are stored as lexicon entries, by means of references in the application and / or user-specific lexica on the lexicon entries of the base lexicon is accessed. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Lexikoneinträge wenigstens einer definierten Wortgruppe zugeordnet sind, welche in Verbindung mit dem Basislexikon steht, wobei die Verweise in den applikations- und/oder benutzerdefinierten Lexika nicht direkt auf das Basislexikon sondern auf die Wortgruppen verweisen.Method according to claim 1, characterized in that that the dictionary entries associated with at least one defined phrase which is in connection with the basic lexicon, the references not directly in the application and / or user-defined dictionaries refer to the basic lexicon but to the phrases. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass eine Zuordnung von Lexikoneinträgen zu Wortgruppen vor dem Betrieb und/oder zur Laufzeit des Spracherkennungssystems erfolgt.Method according to claim 2, characterized in that that an assignment of lexicon entries to phrases before Operation and / or at runtime of the speech recognition system takes place. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, dass jeder Wortgruppe ein Gewicht zugeteilt wird, welches vor dem Betrieb und/oder zur Laufzeit des Spracherkennungssystems veränderbar ist, wobei auf Grundlage des Gewichtes das Basislexikon in Haupt- und Nebengruppen unterteilt wird.Method according to one of the preceding claims, characterized in that each phrase assigned a weight which is prior to the operation and / or runtime of the speech recognition system variable is based on the weight of the base lexicon in Main and subgroups is divided. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, dass mittels der Erkennereinheit für erkannte Wörter und/oder Wortfolgen eine Erkennungswahrscheinlichkeit ermittelt wird.Method according to one of the preceding claims, characterized characterized in that by means of the recognizer unit for recognized words and / or word sequences a recognition probability is determined. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, dass im Rahmen einer Plausibilitätskontrolle mittels einer Sprachmodelleinheit für kontrollierte Wörter und/oder Wortfolgen eine Sprachmodellwahrscheinlichkeit ermittelt wird.Method according to one of the preceding claims, characterized characterized in that in the context of a plausibility check by means of a language model unit for controlled words and / or word sequences a language model probability is determined. Verfahren nach den Ansprüchen 5 und 6, dadurch gekennzeichnet, dass aus einer Kombination von Erkennungs- und Sprachmodellwahrscheinlichkeit eine Gesamtwahrscheinlichkeit gebildet wird.Method according to claims 5 and 6, characterized in that a combination of recognition and language model is likely an overall probability is formed. Spracherkennungssystem für die automatische Spracherkennung, umfassend eine Erkennereinheit zur Erkennung von Spracheingaben, wobei die Erkennereinheit mehrere applikations- und/oder benutzerspezifische Lexika umfasst, die für die jeweilige Applikation und/oder den jeweiligen Benutzer relevanten Wörter umfassen, dadurch gekennzeichnet, dass ein Basislexikon vorhanden ist, welches die Gesamtheit aller Wörter der applikations- und/oder benutzerspezifischen Lexika als Lexikoneinträge umfasst, wobei die Lexikoneinträge der applikations- und/oder benutzerspezifischen Lexika aus Verweisen auf die Lexikoneinträge des Basislexikons bestehen.Speech recognition system for automatic speech recognition, full a recognizer unit for recognizing voice input, in which the recognizer unit several application and / or user-specific Encyclopedia covers that for the relevant application and / or the respective user relevant words include, characterized, that a basic lexicon is present, which the entirety of all words of application and / or includes user-specific lexica as lexicon entries, the lexical entries the application and / or user specific lexica of references to the dictionary entries of the basic lexicon. Spracherkennungssystem nach Anspruch 8, dadurch gekennzeichnet, dass definierte Wortgruppen vorhanden sind, welche in Verbindung mit dem Basislexikon stehen, wobei die Wörter der applikations- und/oder benutzerspezifischen Lexika nicht aus direkten Verweisen auf das Basislexikon sondern aus Verweisen auf die Wortgruppen bestehen.Speech recognition system according to claim 8, characterized in that that defined word groups are present, which in conjunction with the basic lexicon stand, where the words of the application and / or user-specific lexicons not from direct references to the Basic lexicon but consist of references to the phrases. Spracherkennungssystem nach Anspruch 9, dadurch gekennzeichnet, dass die Wortgruppen vor dem Betrieb und/oder zur Laufzeit des Spracherkennungssystems definiert werden.Speech recognition system according to claim 9, characterized characterized in that the phrases prior to operation and / or to the Term of the speech recognition system are defined. Spracherkennungssystem nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, dass eine Sprachmodelleinheit vorhanden ist, welche in Verbindung mit der Erkennereinheit steht.Speech recognition system according to one of the preceding Claims, characterized in that a language model unit exists which is in connection with the recognizer unit. Spracherkennungssystem nach Anspruch 11, dadurch gekennzeichnet, dass die Sprachmodelleinheit in wenigstens zwei Teilsprachmodelleinheiten unterteilt ist.Speech recognition system according to claim 11, characterized characterized in that the language model unit in at least two Partial language model units is divided.
DE10329546A 2003-06-30 2003-06-30 Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias Withdrawn DE10329546A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10329546A DE10329546A1 (en) 2003-06-30 2003-06-30 Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10329546A DE10329546A1 (en) 2003-06-30 2003-06-30 Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias

Publications (1)

Publication Number Publication Date
DE10329546A1 true DE10329546A1 (en) 2005-01-20

Family

ID=33521225

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10329546A Withdrawn DE10329546A1 (en) 2003-06-30 2003-06-30 Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias

Country Status (1)

Country Link
DE (1) DE10329546A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015213722A1 (en) 2015-07-21 2017-01-26 Volkswagen Aktiengesellschaft A method of operating a speech recognition system in a vehicle and speech recognition system
DE102016009196A1 (en) 2016-07-27 2018-02-01 Audi Ag Method for operating a plurality of speech recognizers and speech recognition apparatus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4109785A1 (en) * 1990-03-26 1991-10-02 Ricoh Kk Standard pattern comparator for speech recognition - has dictionary system with normal dictionaries and single master dictionary with preset data types
US6112174A (en) * 1996-11-13 2000-08-29 Hitachi, Ltd. Recognition dictionary system structure and changeover method of speech recognition system for car navigation
US20020032568A1 (en) * 2000-09-05 2002-03-14 Pioneer Corporation Voice recognition unit and method thereof
EP1209662A2 (en) * 2000-11-27 2002-05-29 Canon Kabushiki Kaisha Client-server based speech recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4109785A1 (en) * 1990-03-26 1991-10-02 Ricoh Kk Standard pattern comparator for speech recognition - has dictionary system with normal dictionaries and single master dictionary with preset data types
US6112174A (en) * 1996-11-13 2000-08-29 Hitachi, Ltd. Recognition dictionary system structure and changeover method of speech recognition system for car navigation
US20020032568A1 (en) * 2000-09-05 2002-03-14 Pioneer Corporation Voice recognition unit and method thereof
EP1209662A2 (en) * 2000-11-27 2002-05-29 Canon Kabushiki Kaisha Client-server based speech recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015213722A1 (en) 2015-07-21 2017-01-26 Volkswagen Aktiengesellschaft A method of operating a speech recognition system in a vehicle and speech recognition system
DE102015213722B4 (en) 2015-07-21 2020-01-23 Volkswagen Aktiengesellschaft Method for operating a voice recognition system in a vehicle and voice recognition system
DE102016009196A1 (en) 2016-07-27 2018-02-01 Audi Ag Method for operating a plurality of speech recognizers and speech recognition apparatus

Similar Documents

Publication Publication Date Title
DE69922104T2 (en) Speech recognizer with vocabulary adaptable by spelled word input
DE60016722T2 (en) Speech recognition in two passes with restriction of the active vocabulary
DE69908047T2 (en) Method and system for the automatic determination of phonetic transcriptions in connection with spelled words
DE69923379T2 (en) Non-interactive registration for speech recognition
DE69937176T2 (en) Segmentation method to extend the active vocabulary of speech recognizers
DE60215272T2 (en) Method and apparatus for inputting linguistic data under unfavorable conditions
EP0994461A2 (en) Method for automatically recognising a spelled speech utterance
EP1264302B1 (en) Method for the speech input of a destination into a destination guiding system by means of a defined input dialogue
DE102014201676B4 (en) Methods for controlling the dialogue of speech systems
DE602005000308T2 (en) Device for voice-controlled applications
DE102007033472A1 (en) Method for speech recognition
EP1649450A1 (en) Speech recognition method, and communication device
WO1998010413A1 (en) Speech-processing system and method
DE102008017993A1 (en) Voice search device
EP1071075A2 (en) Method for speech recognition using confidence measures
DE102006036338A1 (en) Method for generating a context-based speech dialog output in a speech dialogue system
WO2006111230A1 (en) Method for the targeted determination of a complete input data set in a voice dialogue system
DE10040063A1 (en) Procedure for assigning phonemes
DE19532114C2 (en) Speech dialog system for the automated output of information
WO2001067435A9 (en) Method for the voice-controlled initiation of actions by means of a limited circle of users, whereby said actions can be carried out in an appliance
EP1125278B1 (en) Data processing system or communications terminal with a device for recognising speech and method for recognising certain acoustic objects
DE60029456T2 (en) Method for online adjustment of pronunciation dictionaries
DE102004055230B3 (en) Method for speech recognition from a predefinable vocabulary
DE10329546A1 (en) Lexicon driver past language model mechanism e.g. for automatic language detection, involves recognizing pure phonetic inputs which are compared for respective application and or respective user relevant words against specific encyclopedias
DE10129005B4 (en) Method for speech recognition and speech recognition system

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8127 New person/name/address of the applicant

Owner name: DAIMLERCHRYSLER AG, 70327 STUTTGART, DE

8127 New person/name/address of the applicant

Owner name: DAIMLER AG, 70327 STUTTGART, DE

8141 Disposal/no request for examination