DE102004029873B3 - Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process - Google Patents
Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process Download PDFInfo
- Publication number
- DE102004029873B3 DE102004029873B3 DE200410029873 DE102004029873A DE102004029873B3 DE 102004029873 B3 DE102004029873 B3 DE 102004029873B3 DE 200410029873 DE200410029873 DE 200410029873 DE 102004029873 A DE102004029873 A DE 102004029873A DE 102004029873 B3 DE102004029873 B3 DE 102004029873B3
- Authority
- DE
- Germany
- Prior art keywords
- recognition
- user
- hypothesis
- confirmation dialog
- recognizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Abstract
Description
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur intelligenten Eingabekorrektur für Sprachdialogsysteme.The The invention relates to a method and a device for intelligent Input correction for speech dialogue systems.
Gebiet der Erfindung:Field of the invention:
Derartige Vorrichtungen dienen vorwiegend zur Analyse von Spracheingaben und zur Steuerung von Systemen durch die Sprache. Technische Spracherkennungseinrichtungen arbeiten aus verschiedenen Gründen nicht absolut fehlerfrei. Somit kann es notwendig sein, in einem nachfolgenden Dialogschritt das gewonnene Erkennungsergebnis durch den Nutzer verifizieren zu lassen. Eine besondere Rolle spielt hierbei der so genannte Confidence-Wert des Erkennungsergebnisses. Liegt dieser Wert hoch, kann u. U. ganz auf eine Verifizierung verzichtet werden, was die Dialoggeschwindigkeit erhöht. Liegt dieser Wert hingegen niedrig, muss davon ausgegangen werden, dass das Erkennungsergebnis auch falsch sein kann. Dann wird in einer Bestätigungsfrage an den Nutzer das Erkennungsergebnis akustisch wiederholt und der Nutzer durch eine Ja/Nein-Entscheidung gezwungen, das Erkennungsergebnis zu bestätigen oder zu verwerfen.such Devices are used primarily for the analysis of voice input and for controlling systems through the language. Technical speech recognition devices work for different reasons not absolutely faultless. Thus, it may be necessary in one following dialogue step the obtained recognition result by the To have users verified. A special role plays here the so-called confidence value of the recognition result. Lies this value can be high, u. U. completely waived verification which increases the dialogue speed. If this value is on the other hand low, it must be assumed that the recognition result can also be wrong. Then in a confirmation question to the user the recognition result acoustically repeated and the user through a yes / no decision forced to confirm or reject the recognition result.
Besonders kritisch sind solche Erkennungssituationen, in denen Sprachkommandos großer Ähnlichkeit, für die auch keine Umschreibungen (sog. Alias) existieren, erkannt werden müssen. Städtenamen wie Dillingen und Illingen sind hierfür ein treffendes Beispiel. Zur Lösung dieses Konfliktes wird beim Stand der Technik das N-Best-Verfahren eingesetzt: Spracherkenner geben meist nicht nur ein Erkennungsergebnis (1. Hypothese) sondern nach der Erkennungswahrscheinlichkeit sortiert weitere Erkennungsergebnisse aus. Die Tiefe des Angebotes ist dabei über einen Parameter frei wählbar. Wird nun in einer Erkennungssession der nicht zutreffende Ortsname erkannt, kann der Reihe nach jede Erkennerhypothese dem Nutzer vorgelegt und durch eine Ja/Nein-Frage entschieden werden. Ohne N-Best besteht die Gefahr, dass der Nutzer auch bei einer erneuten Eingabe immer wieder auf das falsche Erkennungsergebnis stößt. In der Regel wird insbesondere bei ähnlich lautenden Namen schon die zweite Hypothese zutreffend sein, sodass mit einem hohen Gesamterfolg gerechnet werden kann.Especially Critical are those recognition situations in which voice commands great similarity, for the also no paraphrases (so-called alias) exist, be recognized have to. city names like Dillingen and Illingen are an apt example. To the solution This conflict becomes the N-Best method in the prior art used: Speech recognizers usually give not only a recognition result (1st hypothesis) but sorted by the recognition probability further recognition results. The depth of the offer is about one Parameter freely selectable. Now, in a recognition session, the non-correct place name becomes recognized, each Erkennerhypothese can be presented to the user in turn and be decided by a yes / no question. Without N-Best exists the danger that the user always with a re-entry again encounters the wrong recognition result. In general, in particular, will be similar Name already the second hypothesis be true, so with one high overall success can be expected.
Nachteilig bei der Anwendung des N-Best-Verfahrens ist, dass das Dialogverhalten menschlicher Nutzer anders ist als für das Verfahren notwendig. Im Regelfall beschränkt sich der Nutzer nicht einfach auf eine Ja/Nein-Antwort, wenn z.B. der falsche Ortsname vom Spracherkenner zur Bestätigung vorgelegt wird, sondern er verbindet die Verneinung automatisch mit der Nennung des richtigen Ortsnamens: „Sie haben Dillingen gesagt?" – „Nein, Illingen". Aus der Sicht des Spracherkenners liegt hier eine Neueingabe des Ortsnamens vor, die wiederum die erste Hypothese zur Bestätigung liefert. Damit kann eine frustrierende Endlosschleife, wie bereits oben beschrieben, gestartet werden. Das im technischen Sinne richtige Verhalten wäre, dass der Nutzer nur „Nein" antwortet, dann wird das nach dem Ausschließungsprinzip arbeitende N-Best-Verfahren aktiv, weil die N-Best-Liste nicht durch neue Erkennungsergebnisse überschrieben wird.adversely In applying the N-Best method, the dialogue behavior is more human User is different than for the procedure necessary. As a rule, the user is not simply limited to a yes / no answer, if e.g. the wrong place name of the speech recognizer for confirmation but it connects the negation automatically with the name of the correct place name: "You said Dillingen?" - "No, Illingen". From the perspective of Speech recognizer here is a new input of the place name, the again provides the first hypothesis for confirmation. So that can a frustrating infinite loop, as described above, to be started. That in the technical sense correct behavior would be that the user only answers "no", then This will be the exclusion principle working N-Best procedure active because the N-Best list is not through overwrite new recognition results becomes.
Eine andere Quelle für Fehlerkennungen, die korrekturbedürftig sind, ist der Nutzer selbst, nämlich dann, wenn er versehentlich ein falsches Kommando eingegeben hat und dieses berichtigen möchte. Im Beispiel der Ortsnamen könnte der Dialog unter Benutzung des N-Best-Verfahrens wie folgt ablaufen: „Sie haben Dillingen gesagt?" – „Nein", „Haben Sie Illingen gesagt?" – „Nein" usw.. Richtig wäre die Antwort in diesem Fall gewesen: „Nein, Bexbach". Denn mit der Nein-Antwort wird das N-Best-Verfahren aktiviert und es werden alle Hypothesen abgearbeitet. Hier hätte mit der ergänzenden Eingabe des wirklich gewollten Ortsnamens der Erkennungsvorgang neu gestartet werden müssen, damit sich die Erkenner-Hypothesen am Wollen des Nutzers orientieren können.A another source for Error detections that need correction are the user itself, then, if he accidentally entered a wrong command and corrected it would like to. In the example of the place names could the dialog using the N-Best method proceeds as follows: "You have Dillingen said? "-" No, "" Did You illingen said? "-" No "etc .. Right would be the answer in this case, "No, Bexbach "because with the no answer the N-Best method is activated and all hypotheses are processed. Would have here with the supplementary Enter the really wanted place name of the recognition process need to be restarted, so that the Erkenner hypotheses at the user's will.
Noch komplizierter gestaltet sich der Korrekturprozess, wenn mehrere zu erkennende Einheiten (sog. Slots) je Nutzeräußerung erkannt bzw. korrigiert werden müssen. Dann verwirft ein ohne Zusatz ausgesprochenes „Nein" die gesamte Satzhypothese, weil nicht erkennbar ist, welcher Slot zu korrigieren ist. So wird die 3-Slot-Erkennerhypothese "Sie möchten die Rufnummer des Bürgeramtes von Dillingen wissen?" erst durch die eindeutige Antwort „Nein, die Fax-Nummer" korrigierbar. Das N-Best-Verfahren ist klassisch gar nicht anwendbar, weil im ersten Fall nicht klar ist, für welchen Slot die Hypothese zu korrigieren ist und im zweiten Fall, weil die alternativen Slot-Hypothesen durch den korrigierenden Nachsatz überschrieben werden.Yet The correction process is more complicated if several recognized units (so-called slots) per user statement recognized or corrected Need to become. Then a "no" pronounced without an addition rejects the entire sentence hypothesis, because not it can be seen which slot is to be corrected. So is the 3-slot recognizer hypothesis "You want the Telephone number of the Bürgeramt from Dillingen? " by the clear answer "No, the fax number "correctable. The N-Best procedure is not applicable classically, because in the first case not clear is for which slot the hypothesis is to be corrected and in the second case, because the alternative slot hypotheses are overwritten by the correcting last sentence become.
Es zeigt sich also, dass die Anwendung des N-Best-Verfahrens auf das Nutzerverhalten Einfluss nehmen muss, um richtig wirken zu können. Dies ist aber insbesondere bei Anwendungen mit einer hohen Nutzerfrequenz eine nicht durchsetzbare Anforderung. Weiterhin versagt das N-Best-Verfahren bei komplexen Satzstrukturen.It Thus it turns out that the application of the N-Best method to the User behavior must take influence in order to be able to work properly. This but is especially in applications with a high user frequency an unenforceable requirement. Furthermore, the N-Best method fails in complex sentence structures.
Aus
der
Aus
der
Die Druckschrift US 2002/0055841 betrifft eine Lösung zur Entscheidungsfindung, ob ein Erkennungsergebnis akzeptiert, zurückgewiesen oder durch ein N-Best-Verfahren verifiziert werden muss. In der Schrift werden allgemein Bedingungen zur Klassifizierung genannt, aber nicht ausgeführt. Die Lösung bezieht sich ausschließlich auf den primären Erkennungsprozess und nimmt nicht Bezug auf einen Nutzerdialog.The US 2002/0055841 relates to a solution for decision-making, whether a recognition result is accepted, rejected or by an N-Best method must be verified. The scriptures generally become conditions called for classification, but not executed. The solution refers exclusively to the primary recognition process and does not refer to a user dialog.
Die
Das
Verfahren aus der
Das
Verfahren
Das
in der
Das
Ziel der Erfindung aus der
Das
Verfahren aus der
In der US 2002/0052742 A1 wird ebenfalls auf eine N-Best-Liste zurückgegriffen, allerdings erfolgt die Kennzeichnung inkorrekter Teile der Erkennungssequenz per Maus durch den User (z. B. bei Diktiersystemen). Die Korrektur des so als fehlerhaft gekennzeichneten Abschnittes erfolgt durch die nächst wahrscheinliche Hypothese, die nach dem N-Best-Verfahren gefunden wird. Es wird aber nicht die sprachliche Korrekturmöglichkeit erwähnt. Der Fall, dass die Unterscheidung zwischen Maschinenfehler und Nutzerirrtum erforderlich ist, wird nicht behandelt. Eine Historie von Erkennungsresultaten wird ebenfalls nicht berücksichtigt, was bei einer Mauseingabe auch nicht erforderlich ist.In US 2002/0052742 A1 also uses an N-Best list, however, the labeling of incorrect parts of the recognition sequence occurs per mouse by the user (eg in dictation systems). The correction of the so marked as defective section is made by the next probable hypothesis found by the N-Best method. It will, however not the language correction option mentioned. The case that the distinction between machine error and user error is required is not treated. A history of recognition results is also not taken into account which is not necessary for a mouse input.
Die
Schrift
Die
Druckschrift
Aufgabe der Erfindung ist es, ein Verfahren und eine Einrichtung zur intelligenten Eingabekorrektur für automatische Sprachdialogsysteme unter Vermeidung der Nachteile des Standes der Technik bereitzustellen.task The invention is a method and a device for intelligent Input correction for automatic speech dialogue systems while avoiding the disadvantages of the prior art.
Diese Aufgabe wird durch die Erfindungen mit den Merkmalen der unabhängigen Ansprüche gelöst. Vorteilhafte Weiterbildungen der Erfindungen sind in den Unteransprüchen gekennzeichnet.This object is achieved by the inventions having the features of the independent claims solves. Advantageous developments of the inventions are characterized in the subclaims.
Nach dem Stand der Technik erfolgt die Modellierung der zu erkennenden Sprachkommandos, insbesondere für Systeme mit natürlichem Sprachverstehen (natural language understanding – NLU), in sog. Grammatiken (Grammar). Diese bestehen neben den bedeutungstragenden Slots auch aus Fillern (z. B. ich hätte gern ...), die in der menschlichen Kommunikation unerlässlich sind, aber an sich keine Informationen beinhalten. Nach Abschluss eines jeden Erkennungsschrittes liefert der Spracherkenner Slot bezogene Erkennungsergebnisse geordnet nach den zugehörigen Erkennungswahrscheinlichkeiten. Dies wird für jede einzelne Hypothese ausgeführt.To In the prior art, the modeling of the to be recognized Speech commands, especially for Systems with natural Natural language understanding (NLU), in so-called grammars (Grammar). These exist beside the meaningful Slots also from fillers (eg I would have like ...), which are essential in human communication, but in itself contain no information. After completing a Each recognition step, the speech recognizer provides slot-related Recognition results ordered according to the associated detection probabilities. This will be for every single hypothesis is executed.
Ein erfindungsgemäßer Gedanke beruht auf der Zwischenspeicherung aller Slot-Hypothesen in der bevorzugten Ausführungsform in einem virtuellen Speicherwürfel. Die Dimensionen des Würfels werden bestimmt durch:
- • Historie t (wie viele Korrekturschritte werden in die Vergangenheit zurückverfolgt)
- • Slot-Anzahl n und
- • Anzahl der maximal möglichen Hypothesen je Slot m.
- • History t (how many correction steps are traced back to the past)
- • Slot number n and
- • Number of maximum possible hypotheses per slot m.
Weiterhin benutzt die erfindungsgemäße Lösung einen Vergleicher, der Slot bezogen die Hypothesen auf gleiche Einträge unabhängig von ihrer Position zwischen verschiedenen Zeitpunkten (d. h. Erkennungsschritten) prüft und als ähnlich (true) oder unähnlich (false) kennzeichnet.Farther uses the solution of the invention a Comparator, the slot related the hypotheses to the same entries regardless of their position between different points in time (that is, recognition steps) checks and as similar (true) or dissimilar (false).
Der hier betrachtete Dialogschritt beginnt mit einer situationsgerechten Nutzeräußerung. Das Spracherkennungsergebnis wird einerseits für die Konfirmation an den Dialog (Sprachausgabe) geleitet, andererseits aber im Zwischenspeicher unter t = 1 zu späterer Verwendung abgelegt. In der Konfirmationsphase werden alle im aktuellen Dialogschritt gefundenen ersten Hypothesen (m = 1) dem Nutzer zur Bestätigung angeboten. Folgend sind drei Situationen denkbar:
- 1. der Nutzer bestätigt die Satzhypothese mit „Ja" (oder die Erkennungswahrscheinlichkeiten sind so hoch, dass eine Rückfrage entfallen kann.). Dann ist der aktuelle Dialogschritt erfolgreich beendet worden.
- 2. der Nutzer verneint die gesamte Satzhypothese. Dann muss in weiteren Dialogschritten das Füllen der offenen Slots vorgenommen werden. Diese Situation wird von der erfindungsgemäßen Lösung nicht betroffen.
- 3. der Nutzer verneint bei gleichzeitiger Nennung des korrigierenden Kommandos. Das ist die Situation, die vorzugsweise erfindungsgemäß gelöst werden soll.
- 1. the user confirms the sentence hypothesis with "yes" (or the recognition probabilities are so high that a query can be omitted.) Then the current dialog step has been successfully completed.
- 2. the user negates the entire sentence hypothesis. Then in further dialog steps, the filling of the open slots must be made. This situation is not affected by the solution according to the invention.
- 3. the user denies with simultaneous mention of the corrective command. This is the situation that is preferably to be solved according to the invention.
Erfindungsgemäß wird in Situation 3 ein neuer Erkennungsprozess bezüglich des korrigierten Kommandos gestartet. Slot bezogen wird bzw. werden nun die neue(n) Hypothese(n) in den Zwischenspeicher unter t = 2 abgelegt. Jetzt erfolgen Vergleiche der 2. und folgenden Hypothesen aus dem ersten Erkennungsschritt (t = 1) mit allen Hypothesen des zweiten Erkennungsschrittes (t = 2). Die erste Hypothese aus dem ersten Erkennungsschritt nimmt am Vergleich nicht mehr teil, weil sie bereits durch die Nutzerentscheidung ausgeschieden ist. In Abhängigkeit vom Ausgang des Vergleichs sind zwei weitere Pfade möglich:
- 1. Der Vergleich war nicht erfolgreich. D. h., es liegt keinerlei Ähnlichkeit zwischen der ersten und der zweiten Nutzereingabe vor. Es ist zu vermuten, dass sich der Nutzer selbst korrigiert hat. Es wird die erste Hypothese des zweiten Erkennungsschrittes als Erkennungsergebnis ausgegeben.
- 2. Der Vergleich war erfolgreich. Es ist zu vermuten, dass der Nutzer ähnlich klingende Kommandos korrigieren will (klassisches N-Best). Es wird die zweitwahrscheinliche Hypothese des ersten Erkennungsschrittes als Erkennungsergebnis ausgegeben.
- 1. The comparison was unsuccessful. That is, there is no similarity between the first and second user input. It can be assumed that the user has corrected himself. The first hypothesis of the second recognition step is output as the recognition result.
- 2. The comparison was successful. It can be assumed that the user wants to correct similar sounding commands (classic N-Best). The second probable hypothesis of the first recognition step is output as the recognition result.
Nun können in beiden Fällen immer noch falsche Resultate vorliegen, sodass die Prozedur wiederholt werden muss. Dann verneint der Nutzer wieder das angebotene Erkennungsergebnis und eine neue Hypothese wird aufgestellt. Diese wird dann unter t = 3 abgespeichert. Für den Vergleich wird nun auch die zweite Hypothese des ersten Erkennungsschrittes gestrichen:
- 1. Im positiven Fall (Ähnlichkeit vorhanden) wird dem Nutzer die dritte Hypothese des ersten Erkennungsschrittes zur Beurteilung angeboten.
- 2. Im Negativfall (keine Ähnlichkeit zu einer der Hypothesen des ersten Erkennungsschrittes vorhanden) wird nunmehr die erste Hypothese des zweiten Erkennungsschrittes gestrichen und mit den Hypothesen des dritten Erkennungsschrittes verglichen. Wird eine Ähnlichkeit festgestellt, so kann wieder im N-Best-Verfahren die zutreffende Alternative ermittelt werden. Tritt erneut eine Nichtähnlichkeit auf, ist davon auszugehen, dass der Nutzer erneut seinen Willen geändert hat.
- 1. In the affirmative case (similarity exists), the user is offered the third hypothesis of the first recognition step for evaluation.
- 2. In the negative case (no similarity to one of the hypotheses of the first recognition step), the first hypothesis of the second recognition step is now deleted and compared with the hypotheses of the third recognition step. If a similarity is established, the appropriate alternative can be determined again in the N-Best method. If a non-similarity occurs again, it can be assumed that the user has changed his will again.
Wie zu sehen ist, arbeitet dieses Verfahren rekursiv. Aus praktischen Erwägungen ist es jedoch sinnvoll, die Anzahl möglicher Schritte geeignet zu begrenzen.As can be seen, this procedure works recursively. From practical considerations However, it makes sense to limit the number of possible steps suitable.
Zu Beginn des Dialoges, nach Abschluss jeder erfolgreichen Erkennungsprozedur und nach Dialog-Resets werden alle Speicherinhalte zurückgesetzt (Löschen der Historie).At the beginning of the dialogue, after completing each successful recognition procedure and after Tue alog-resets resets all memory contents (deleting the history).
Im Folgenden wird die Erfindung anhand von Ausführungsbeispielen näher erläutert, die in den Figuren schematisch dargestellt sind. Gleiche Bezugsziffern in den einzelnen Figuren bezeichnen dabei gleiche Elemente. Im Einzelnen zeigt:in the The invention will be explained in more detail below with reference to exemplary embodiments which are shown schematically in the figures. Same reference numbers in the individual figures designate the same elements. In detail shows:
Im Rahmen der Erfindung sind zahlreiche Abwandlungen und Weiterbildungen der beschriebenen Ausführungsbeispiele verwirklichbar.in the The scope of the invention are numerous modifications and developments the described embodiments realizable.
Ein
erfindungsgemäßer Gedanke
beruht gemäß
- • Historie t (wie viele Korrekturschritte werden in die Vergangenheit zurückverfolgt)
- • Slot-Anzahl n und
- • Anzahl der maximal möglichen Hypothesen je Slot m.
- • History t (how many correction steps are traced back to the past)
- • Slot number n and
- • Number of maximum possible hypotheses per slot m.
Weiterhin
benutzt die erfindungsgemäße Lösung einen
Vergleicher, der Slot bezogen die Hypothesen auf Gleichheit zwischen
verschiedenen Zeitpunkten (d. h. Erkennungsschritten) prüft und als ähnlich (true)
oder unähnlich
(false) kennzeichnet (
Es versteht sich jedoch, dass die Erfindung auch nur mit einem Slot für die Einzelworterkennung genutzt werden kann.It it is understood, however, that the invention also only with a slot for the Single word recognition can be used.
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE200410029873 DE102004029873B3 (en) | 2004-06-16 | 2004-06-16 | Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE200410029873 DE102004029873B3 (en) | 2004-06-16 | 2004-06-16 | Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102004029873B3 true DE102004029873B3 (en) | 2005-12-29 |
Family
ID=35455226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE200410029873 Active DE102004029873B3 (en) | 2004-06-16 | 2004-06-16 | Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102004029873B3 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102006058758A1 (en) * | 2006-12-12 | 2008-06-19 | Deutsche Telekom Ag | Method for controlling telecommunication transmitter, involves registering input signal generated by input device and generating data set from input signal |
WO2010000322A1 (en) * | 2008-07-03 | 2010-01-07 | Mobiter Dicta Oy | Method and device for converting speech |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5241619A (en) * | 1991-06-25 | 1993-08-31 | Bolt Beranek And Newman Inc. | Word dependent N-best search method |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US5799065A (en) * | 1996-05-06 | 1998-08-25 | Matsushita Electric Industrial Co., Ltd. | Call routing device employing continuous speech |
DE69229124T2 (en) * | 1991-12-20 | 1999-09-16 | Kurzweil Applied Intelligence | MULTI-PIECE EXPERT SYSTEM |
DE10008502A1 (en) * | 1999-02-26 | 2000-09-07 | Atr Interpreting Telecommunica | Anaphora analysis device has analyzer, analysis result memory, predecessor candidate generator, candidate rejection device, preference allocation device, candidate decision device |
US6173266B1 (en) * | 1997-05-06 | 2001-01-09 | Speechworks International, Inc. | System and method for developing interactive speech applications |
US6233553B1 (en) * | 1998-09-04 | 2001-05-15 | Matsushita Electric Industrial Co., Ltd. | Method and system for automatically determining phonetic transcriptions associated with spelled words |
US6272462B1 (en) * | 1999-02-25 | 2001-08-07 | Panasonic Technologies, Inc. | Supervised adaptation using corrective N-best decoding |
US6374220B1 (en) * | 1998-08-05 | 2002-04-16 | Texas Instruments Incorporated | N-best search for continuous speech recognition using viterbi pruning for non-output differentiation states |
US20020052742A1 (en) * | 2000-07-20 | 2002-05-02 | Chris Thrasher | Method and apparatus for generating and displaying N-best alternatives in a speech recognition system |
US20020055841A1 (en) * | 1999-02-08 | 2002-05-09 | Ning Bi | Voice recognition rejection scheme |
DE60000134T2 (en) * | 1999-01-25 | 2002-12-12 | Matsushita Electric Ind Co Ltd | Unsupervised adaptation of a speech recognizer using reliable information from the best N computational hypotheses |
EP1302928A1 (en) * | 2001-10-16 | 2003-04-16 | Siemens Aktiengesellschaft | Method for speech recognition, particularly of names, and speech recognizer |
EP1376999A1 (en) * | 2002-06-21 | 2004-01-02 | BRITISH TELECOMMUNICATIONS public limited company | Spoken alpha-numeric sequence entry system with repair mode |
DE10251112A1 (en) * | 2002-11-02 | 2004-05-19 | Philips Intellectual Property & Standards Gmbh | Voice recognition involves generating alternative recognition results during analysis with next highest probability of match to detected voice signal for use to correct output recognition result |
-
2004
- 2004-06-16 DE DE200410029873 patent/DE102004029873B3/en active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5241619A (en) * | 1991-06-25 | 1993-08-31 | Bolt Beranek And Newman Inc. | Word dependent N-best search method |
DE69229124T2 (en) * | 1991-12-20 | 1999-09-16 | Kurzweil Applied Intelligence | MULTI-PIECE EXPERT SYSTEM |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
US5799065A (en) * | 1996-05-06 | 1998-08-25 | Matsushita Electric Industrial Co., Ltd. | Call routing device employing continuous speech |
US6173266B1 (en) * | 1997-05-06 | 2001-01-09 | Speechworks International, Inc. | System and method for developing interactive speech applications |
US6374220B1 (en) * | 1998-08-05 | 2002-04-16 | Texas Instruments Incorporated | N-best search for continuous speech recognition using viterbi pruning for non-output differentiation states |
US6233553B1 (en) * | 1998-09-04 | 2001-05-15 | Matsushita Electric Industrial Co., Ltd. | Method and system for automatically determining phonetic transcriptions associated with spelled words |
DE60000134T2 (en) * | 1999-01-25 | 2002-12-12 | Matsushita Electric Ind Co Ltd | Unsupervised adaptation of a speech recognizer using reliable information from the best N computational hypotheses |
US20020055841A1 (en) * | 1999-02-08 | 2002-05-09 | Ning Bi | Voice recognition rejection scheme |
US6272462B1 (en) * | 1999-02-25 | 2001-08-07 | Panasonic Technologies, Inc. | Supervised adaptation using corrective N-best decoding |
DE10008502A1 (en) * | 1999-02-26 | 2000-09-07 | Atr Interpreting Telecommunica | Anaphora analysis device has analyzer, analysis result memory, predecessor candidate generator, candidate rejection device, preference allocation device, candidate decision device |
US20020052742A1 (en) * | 2000-07-20 | 2002-05-02 | Chris Thrasher | Method and apparatus for generating and displaying N-best alternatives in a speech recognition system |
EP1302928A1 (en) * | 2001-10-16 | 2003-04-16 | Siemens Aktiengesellschaft | Method for speech recognition, particularly of names, and speech recognizer |
EP1376999A1 (en) * | 2002-06-21 | 2004-01-02 | BRITISH TELECOMMUNICATIONS public limited company | Spoken alpha-numeric sequence entry system with repair mode |
DE10251112A1 (en) * | 2002-11-02 | 2004-05-19 | Philips Intellectual Property & Standards Gmbh | Voice recognition involves generating alternative recognition results during analysis with next highest probability of match to detected voice signal for use to correct output recognition result |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102006058758A1 (en) * | 2006-12-12 | 2008-06-19 | Deutsche Telekom Ag | Method for controlling telecommunication transmitter, involves registering input signal generated by input device and generating data set from input signal |
DE102006058758B4 (en) * | 2006-12-12 | 2018-02-22 | Deutsche Telekom Ag | Method and device for controlling a telecommunication terminal |
WO2010000322A1 (en) * | 2008-07-03 | 2010-01-07 | Mobiter Dicta Oy | Method and device for converting speech |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69829235T2 (en) | Registration for speech recognition | |
DE60016722T2 (en) | Speech recognition in two passes with restriction of the active vocabulary | |
EP1927980B1 (en) | Method for classifying spoken language in spoken dialogue systems | |
DE69827988T2 (en) | Speech models for speech recognition | |
EP1466317B1 (en) | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer | |
DE60115738T2 (en) | Speech models for speech recognition | |
DE60207742T2 (en) | CORRECTION OF A TEXT RECOGNIZED BY A LANGUAGE RECOGNITION BY COMPARING THE PHONES OF THE RECOGNIZED TEXT WITH A PHONETIC TRANSCRIPTION OF A MANUALLY ENTERED CORRECTION WRITING | |
DE60215272T2 (en) | Method and apparatus for inputting linguistic data under unfavorable conditions | |
DE19847419A1 (en) | Procedure for the automatic recognition of a spoken utterance | |
DE602005000308T2 (en) | Device for voice-controlled applications | |
EP3224831B1 (en) | Motor vehicle operating device with a correction strategy for voice recognition | |
DE102005030963B4 (en) | Method and device for confirming and / or correcting a speech input supplied to a speech recognition system | |
EP1264302A1 (en) | Device and method for the speech input of a destination into a destination guiding system by means of a defined input dialogue | |
WO2006111230A1 (en) | Method for the targeted determination of a complete input data set in a voice dialogue system | |
DE60318385T2 (en) | LANGUAGE PROCESSING APPARATUS AND METHOD, RECORDING MEDIUM AND PROGRAM | |
EP1058235B1 (en) | Reproduction method for voice controlled systems with text based speech synthesis | |
DE60026366T2 (en) | SPEECH RECOGNITION WITH A COMPLEMENTARY LANGUAGE MODEL FOR TYPICAL ERRORS IN THE LANGUAGE DIALOGUE | |
WO2015185464A1 (en) | Assistance system that can be controlled by means of voice inputs, having a functional device and a plurality of voice recognition modules | |
DE10304460B3 (en) | Speech recognition method e.g. for mobile telephone, identifies which spoken variants of same word can be recognized with analysis of recognition difficulty for limiting number of acceptable variants | |
DE102004029873B3 (en) | Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process | |
DE102005030965B4 (en) | Extension of the dynamic vocabulary of a speech recognition system by further voice enrollments | |
DE60029456T2 (en) | Method for online adjustment of pronunciation dictionaries | |
DE60025687T2 (en) | Speech recognition device with execution of a syntactic permutation rule | |
DE60119643T2 (en) | Homophone choice in speech recognition | |
DE102007042971A1 (en) | Speech recognition method and speech recognition device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8100 | Publication of the examined application without publication of unexamined application | ||
8364 | No opposition during term of opposition |