DE102008021954A1 - A method for operating an electronic assistance system - Google Patents

A method for operating an electronic assistance system

Info

Publication number
DE102008021954A1
DE102008021954A1 DE102008021954A DE102008021954A DE102008021954A1 DE 102008021954 A1 DE102008021954 A1 DE 102008021954A1 DE 102008021954 A DE102008021954 A DE 102008021954A DE 102008021954 A DE102008021954 A DE 102008021954A DE 102008021954 A1 DE102008021954 A1 DE 102008021954A1
Authority
DE
Germany
Prior art keywords
data
phoneme
characterized
method according
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102008021954A
Other languages
German (de)
Inventor
Mathias Mühlfelder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Garmin Wurzburg GmbH
Original Assignee
Garmin Wurzburg GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to DE102008012067 priority Critical
Priority to DE102008012067.7 priority
Application filed by Garmin Wurzburg GmbH filed Critical Garmin Wurzburg GmbH
Priority to DE102008021954A priority patent/DE102008021954A1/en
Publication of DE102008021954A1 publication Critical patent/DE102008021954A1/en
Application status is Withdrawn legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

Die Erfindung betrifft ein Verfahren zum Betrieb eines elektronischen Assistenzsystems mit einer akustischen Aufnahmeeinrichtung, an der gesprochene Bedieneranweisungen aufgenommen werden können und mit einem Spracherkennungsmodul weiterverarbeitet werden, wobei in einer ersten Verarbeitungsstufe des Spracherkennungsmoduls die gesprochenen Bedieneranweisungen mit in einer Datenbank gespeicherten Phonem-Datensätzen verglichen werden, und wobei die Phonem-Datensätze entsprechend ihrer jeweiligen akustischen Übereinstimmungsrate mit einem Übereinstimmungswert bewertet werden, wobei in einer zweiten Verarbeitungsstufe des Spracherkennungsmoduls zumindest für einen Teil der Phonem-Datensätze die Inhalte der Phonem-Datensätze mit den in zumindest einer Kontextdatenbank gespeicherten Kontextdaten verglichen werden, wobei der in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert der Phonem-Datensätze in Abhängigkeit vom Ergebnis des inhaltlichen Kontextvergleichs modifizi The invention relates to a method for operating an electronic assistance system with an acoustic pick-up device may be added to the spoken user instructions and be further processed by a speech recognition module, the spoken user instructions are compared with stored in a database phoneme data records in a first processing stage of the speech recognition module, and wherein the phoneme data records are rated according to their respective acoustic matching rate with a matching value, are compared in a second processing stage of the voice recognition module at least for a part of the phoneme records the contents of the phoneme data records with the data stored in at least one context database context data, wherein the match value of the phoneme data sets determined in the first processing stage modified a function of the result of the content of the context comparison ert wird, und wobei zumindest der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert zur Weiterverarbeitung weitergegeben wird. ERT, and wherein at least the phoneme data is transmitted with the best modified match value for further processing.

Description

  • Die Erfindung betrifft ein Verfahren zum Betrieb eines elektronischen Assistenzsystems mit Spracherkennungsmodul nach dem Oberbegriff des Anspruchs 1. The invention relates to a method for operating an electronic assistance system with speech recognition module according to the preamble of claim 1.
  • Zur Eingabe von Eingabedaten an elektronischen Assistenzsystemen werden üblicherweise Tastaturen benutzt, an denen der Benutzer die Eingabedaten in alphanumerischer Form eingibt. To enter input data to electronic assistance systems keyboards are used typically in which the user enters the input data in alphanumeric form. Seit einigen Jahren finden auch Assistenzsysteme mit Spracherkennungsmodulen immer breitere Verwendung. For several years, assistance systems ever more widely used with voice recognition modules. Bei diesen Assistenzsystemen mit Spracherkennungsmodul ist die Eingabeschnittstelle mit einer Spracherkennung ausgestattet. These assistance systems with voice recognition module, the input interface is equipped with a voice recognition. Dies bedeutet, dass der Benutzer seine Bedieneranweisungen, dh seine Eingabedaten ganz allgemein, in eine Aufnahmeeinrichtung, beispielsweise ein Mikrofon des Assistenzsystems, hineinspricht, und diese Bedieneranweisung dort aufgenommen wird. This means that the user, ie its input data in general, in a recording device such as a microphone of the assistance system, in his talks operator instructions, and this operator instruction is received there. Im Spracherkennungsmodul werden die gesprochenen Bedieneranweisungen dann weiterverarbeitet und interpretiert, um den Inhalt der gesprochenen Bedieneranweisung zu erkennen und in elektronischer Form weiterverarbeiten zu können. In the speech recognition module spoken operator instructions are then processed and interpreted to identify the content of the spoken user instructions and be able to process electronically. Die bekannten Spracherkennungsmodule von elektro nischen Assistenzsystemen beschränken sich gemäß dem vorbekannten Stand der Technik darauf, in einer ersten Verarbeitungsstufe die gesprochene und mit der Aufnahmeeinrichtung aufgenommene Bedieneranweisung mit in einer Datenbank gespeicherten Phonem-Datensätzen zu vergleichen. The known speech recognition modules of electromagnetic African assistance systems are limited in accordance with the prior art, on comparing, in a first stage of processing the spoken and recorded by the recording device operator command with data stored in a database phoneme data sets. Bei den Phonem-Datensätzen kann es sich beispielsweise um Akustikdateien, insbesondere WAV-Dateien oder Phonem-Vektoren, handeln. The phoneme data sets may, for example, acoustic files, especially WAV files or phoneme vectors act.
  • In jedem Phonem-Datensatz ist dabei zugleich auch noch ein bestimmter Inhalt in elektronischer Form gespeichert. In each phoneme data while at the same time certain content is also stored in electronic form. Bei ausreichender Übereinstimmung zwischen der aufgenommenen Bedieneranweisung und dem Phonem-Datensatz wird dieser Inhalt dann zur Weiterverarbeitung weitergegeben. With a sufficient match between the received operator command and the phoneme record this content is then passed on for further processing.
  • Dies bedeutet mit anderen Worten, dass bei den bekannten Spracherkennungsmodulen immer der Phonem-Datensatz mit dem darin gespeicherten Inhalt zur Weiterverarbeitung ausgewählt wird, der in der ersten Verarbeitungsstufe die höchste akustische Übereinstimmung ergeben hat. This means in other words that in the known voice recognition modules, the phoneme data is selected with the content stored therein for further processing always that showed the highest acoustic match in the first processing stage. Probleme ergeben sich aus dieser Art der Spracherkennung immer dann, wenn ähnlich klingende Worte bzw. Spracheingaben voneinander zu unterscheiden sind. Problems arise from this type of speech recognition whenever similar sounding words or voice commands are indistinguishable. Aufgrund der häufig sehr unterschiedlichen Sprechweise der verschiedenen Benutzer kann es dann sehr leicht zu vielen Interpretationen kommen, so dass das Spracherkennungsmodul nicht den vom Benutzer eigentlich gewünschten Inhalt der Spracheingabe erkennt. Due to the often very different way of speaking of the different users can then very easily lead to many interpretations, so that the speech recognition engine does not recognize the actually desired by the user content of the speech input.
  • Ausgehend von diesem Stand der Technik ist es deshalb Aufgabe der vorliegenden Erfindung, ein Verfahren zum Betrieb eines elektronischen Assistenzsystems vorzuschlagen, mit dem die Treffergenauigkeit des Spracherkennungsmoduls erhöht werden kann. Starting from this prior art, it is therefore an object of the present invention to provide a method for operating an electronic assistant system, with which the hit accuracy of the speech recognition module can be increased.
  • Diese Aufgabe wird durch ein Verfahren nach der Lehre des Anspruchs 1 gelöst. This object is achieved by a method according to the teaching of claim 1.
  • Vorteilhafte Ausführungsformen der Erfindung sind Gegenstand der Unteransprüche. Advantageous embodiments of the invention are subject of the subclaims.
  • Das erfindungsgemäße Verfahren beruht auf dem Grundgedanken, dass das Spracherkennungsmodul mit einer zweiten Verarbeitungsstufe erweitert wird. The inventive method is based on the fundamental idea that the speech recognition engine is extended with a second processing stage. In dieser zweiten Verarbeitungsstufe werden zumindest für einen Teil der Phonem-Datensätze die darin jeweils gespeicherten Inhalte mit den in einer Kontextdatenbank gespeicherten Kontextdaten verglichen. In this second processing stage, the contents stored therein, respectively with the data stored in a context database context data are compared, at least for a part of the phoneme data sets. Der in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert, der allein die akustische Übereinstimmung zwischen der gesprochenen Bedieneranweisung und dem Phonem-Datensatz charakterisiert, kann dann in Abhängigkeit von dem in der zweiten Verarbeitungsstufe vorgenommenen Kontextvergleich modifiziert werden. The matching value determined in the first processing stage, which alone characterizes the acoustic match between the spoken user instructions and the phoneme data set can then be modified according to the modification in the second processing stage context comparison. Zumindest der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert wird dann zur Weiterverarbeitung in die anderen Teile des Assistenzsystems weitergegeben. At least the phoneme record with the best modified match value is then passed on for further processing in other parts of the assistance system.
  • Durch die erfindungsgemäße Erweiterung des Spracherkennungsmoduls mit der zweiten Verarbeitungsstufe wird erreicht, dass die Übereinstimmung der vom Benutzer gesprochenen Bedieneranweisung nicht mehr nur noch rein akustisch bewertet wird, sondern auch eine inhaltliche Kontextbewertung erfolgt. The inventive extension of the speech recognition module to the second stage of processing that the agreement of the user spoken operator instruction is not only assessed purely acoustic, but a context evaluation also takes place content is achieved. Dadurch wird es möglich, dass beispielsweise Phonem-Datensätze, die zwar eine relativ hohe akustische Übereinstimmung ergeben haben, aber aufgrund ihres Kontextes sehr unwahrscheinlich erscheinen, einen entsprechend schlechteren Übereinstimmungswert erhalten und somit mit entsprechend geringerer Wahrscheinlichkeit zur Weiterverarbeitung vorgesehen werden. This makes it possible, for example, that phoneme records that have indeed result in a relatively high acoustic match, but seem very unlikely due to its context, get a correspondingly poorer match value and are thus provided with correspondingly less likely for further processing. Letztendlich kann durch Anwendung des erfindungsgemäßen Verfahrens die Trefferwahrscheinlichkeit bei der Erkennung von gesprochenen Bedieneranweisungen erheblich verbessert werden. Ultimately, the hit probability can be significantly improved in the recognition of spoken operator instructions by using the method according to the invention.
  • Die erfindungsgemäße Verarbeitung der Phonem-Datensätze in der zweiten Verarbeitungsstufe zur Abarbeitung des inhaltlichen Kontextvergleichs stellt einen durchaus erheblichen Zusatzaufwand bei der Datenverarbeitung dar. Um den zusätzlichen Datenverarbeitungsaufwand insgesamt auf ein tolerierbares Maß zu begrenzen ist es deshalb besonders vorteilhaft, wenn nicht alle Phonem-Datensätze dem Kontextvergleich in der zweiten Verarbeitungsstufe unterzogen werden, sondern nur die Phonem-Datensätze an die zweite Verarbeitungsstufe zum inhaltlichen Kontextvergleich weitergegeben werden, deren in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert oberhalb eines vorgegebenen Grenzwerts liegt. The processing of the invention of the phoneme sets in the second processing stage for processing the editorial context comparison is a quite significant additional effort in data processing. In order to limit the additional data processing expense total to a tolerable level, it is particularly advantageous, if not all phoneme records the be context comparison subjected in the second processing step, but only the phoneme data sets are passed on to the second processing stage for editorial context comparison whose determined in the first processing stage matching value is above a predetermined limit value. Im Ergebnis wird dadurch also erreicht, dass alle Phonem-Datensätze, die beim akustischen Vergleich in der ersten Verarbeitungsstufe keine ausreichend guten Ergebnisse erbracht haben, bereits vor dem Kontextvergleich in der zweiten Verarbeitungsstufe ausgefiltert werden. The result is thus achieved that all phoneme records that have not produced good enough results when acoustic comparison in the first processing stage, are filtered out before the context comparison in the second stage of processing.
  • In der Grundform des erfindungsgemäßen Verfahrens wird jeweils nur der Phonem-Datensatz mit dem jeweils besten modifizierten Übereinstimmungswert zur Weiterverarbeitung weitergegeben. In the basic form of the method, only the phoneme data is passed to the respective best modified match value for further processing each. In der Weiterverarbeitung kann beispielsweise dann der im Phonem-Datensatz gespeicherte Inhalt automatisch zur Weiterverarbeitung ausgewählt und in nachgelagerten Funktionsmodulen weiterverarbeitet werden. In the further processing of stored in the phoneme data content, for example, then be automatically selected for further processing and further processed in downstream functional modules. Vielfach ist es jedoch wünschenswert, dass nicht nur der Phonem-Datensatz mit der besten Bewertung weitergegeben wird. It is often desirable, however, that not only the phoneme data is passed with the best rating. Beispielsweise ist es bei elektronischen Assistenzsystemen vielfach üblich, dass dem Benutzer eine Gruppe von Treffern mit den relativ höchsten Bewertungen zur Auswahl angezeigt wird, so dass die tatsächliche Auswahl durch den Benutzer dann noch bestätigt werden muss. For example, it is often the case with electronic assistance systems that the user group is indicated by hits with the relatively highest ratings to choose from, so the actual choice must then be confirmed by the user. Im Hinblick auf das erfindungsgemäße Verfahren bedeutet dies, dass dann mehrere Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten nach der zweiten Verarbeitungsstufe zur Weiterverarbeitung weitergegeben werden, um dem Benutzer beispielsweise die Auswahl eines dieser Phonem-Datensätze für die Weiterverarbeitung anzubieten. With respect to the inventive method, this means that then a plurality of phoneme data sets are passed on with the relatively highest modified match values ​​after the second processing stage for further processing, in order to offer the user such as selecting one of said phoneme data sets for further processing. Dies kann beispielsweise dadurch erfolgen, dass dem Benutzer die Inhalte der Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungs werten angezeigt werden und der Benutzer dann durch eine geeignete Auswahl einen der Phonem-Datensätze bestätigt. This can for example take place in that the user are displayed evaluate the contents of the phoneme data sets with the relatively highest modified match and then confirms the user by appropriate selection of one of the phoneme data sets.
  • Um die Auswahl durch den Benutzer zu erleichtern, ist es besonders vorteilhaft, wenn die Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten in einer Liste sortiert werden. To facilitate the selection by the user, it is particularly advantageous if the phoneme records are sorted with the relatively highest modified match values ​​in a list. Die Sortierung der Phonem-Datensätze in der Liste kann dabei nach Größe ihres jeweiligen modifizierten Übereinstimmungswertes erfolgen. Sorting the phoneme records in the list can take place on the size of their respective modified match score. Dies bedeutet mit anderen Worten, dass an der ersten Stelle der Liste jeweils der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert angeordnet ist und sich daran die Phonem-Datensätze abgestuft nach ihrem jeweiligen modifizierten Übereinstimmungswert sortiert anschließen. This means in other words that at the top of the list each of the phoneme data is arranged with the best match value and the modified because graded according to their respective modified match value to join the phoneme records sorted. Die Größe der Liste kann dabei vielfach durch eine bestimmte Anzahl von in der Liste auszunehmenden Phonem-Datensätzen definiert sein. The size of the list can thereby be often defined by a certain number of auszunehmenden in the list phoneme data sets. Enthält die Liste beispielsweise fünf Speicherplätze, werden in der Liste die fünf Phonem-Datensätze aufgenommen, die die fünf höchsten modifizierten Übereinstimmungswerte aufweisen. If the list contains, for example, five presets, the five phoneme records are included in the list that have the five highest values ​​modified match.
  • In welcher Weise der Kontextvergleich in der zweiten Verarbeitungsstufe vorgenommen wird, ist grundsätzlich beliebig. In what way the context comparison is made in the second processing step, is basically optional. Nach einer ersten bevorzugten Verfahrensvariante sind in der Kontextdatenbank frühere Eingaben der Daten des Benutzers, die vom Benutzer für die Benutzung bestätigt wurden, gespeichert. In a first preferred variant of the method in the context database previous entries of user data that has been confirmed by the user for the use of stored. Dem liegt die Grundüberlegung zugrunde, dass zu einem früheren Zeitpunkt vom Benutzer bestätigte Eingabedaten mit relativ hoher Wahrscheinlichkeit erneut von dem gleichen Benutzer eingegeben werden. The basic idea that underlies earlier confirmed by the user input data with a relatively high probability re-entered by the same user. Mit diesem in der Kontextdatenbank gespeicherten und in der Vergangenheit bereits mindestens einmal bestätigten Eingabedaten, wird der Inhalt der Phonem-Datensätze dann in der zweiten Verarbeitungsstufe verglichen. With this information stored in the context database and already confirmed at least once in the past input data, the content of the phoneme data sets is then compared in the second stage of processing. Für die Phonem-Datensätze, für die eine Übereinstimmung des Inhalts mit den in der Kontextdatenbank gespeicherten früheren Eingabedaten festgestellt wird, wird der Übereinstimmungswert erhöht, um die Auswahl dieser Phonem-Datensätze entsprechend wahrscheinlicher zu machen. For the phoneme records for a match the contents with those stored in the context database earlier input data is detected, the match value is increased in order to make the selection of these phoneme records accordingly likely.
  • Welchen Zweck das elektronische Assistenzsystem in seiner Grundfunktion erfüllt, ist wiederum grundsätzlich beliebig, da die Auswertung von akustischen Spracheingaben für eine Vielzahl von unterschiedlichen Funktionssystemen von Interesse ist. What purpose the electronic assistance system fulfills its basic function, in turn, is basically arbitrary, since the evaluation of acoustic voice input is for a variety of different functional systems of interest. Von besonders großer Bedeutung für den Benutzerkomfort ist die elektronische Spracherkennung jedoch für Navigationssysteme, insbesondere mobile bzw. fest eingebaute Navigationsgeräte. Particularly important for user comfort, however, the electronic voice recognition for navigation systems, particularly portable or permanently installed navigation devices. Denn beim Betrieb solcher Navigationssysteme muss der Benutzer eine Vielzahl von Eingaben machen, wobei die Tastatureingabe aufgrund der Nutzung, beispielsweise in einem Kraftfahrzeug, vielfach als sehr unbequem empfunden wird. Because the operation of such navigation systems, the user must make a variety of inputs, with keyboard input due to the use, for example in a motor vehicle, is often perceived as very uncomfortable.
  • Im Hinblick auf die Benutzung des erfindungsgemäßen Verfahrens beim Betrieb von Navigationssystemen ist es weiterhin besonders vorteilhaft, wenn eine Kontextdatenbank benutzerspezifische Adressdaten enthält. With regard to the use of the inventive method in the operation of navigation systems, it is also particularly advantageous if a context database contains user address data. Dabei kann es sich beispielsweise um das elektronische Adressbuch eines Benutzers handeln. This may for example, be the electronic address of a user. Denn alle im elektronischen Adressbuch des Benutzers gespeicherten Adressen weisen eine entsprechend hohe Wahrscheinlichkeit als mögliche Zielpunkte für das Navigationssystem auf. For all the addresses stored in the electronic address of the user have a correspondingly high probability as potential targets for the navigation system.
  • Weiterhin ist es bei Betrieb des erfindungsgemäßen Verfahrens auf ein Navigationssystem besonders vorteilhaft, wenn eine Kontextdatenbank die Startpunkte bzw. Zielpunkte enthält, die bereits in der Vergangenheit Grundlage einer Routenplanung gewesen sind. Further, in operation of the method according to the invention particularly advantageously to a navigation system, if a context database contains the starting points and destination points that have already been based on a route planning in the past. Denn bestimmte Start- oder Zielpunkte werden vom Benutzer immer wieder angefahren und sind deshalb bei der späteren Routenplanung als auch besonders wahrscheinliche Treffer anzusehen. For specific start or end points are approached repeatedly by the user and are therefore to be considered in the subsequent route planning and more probable results.
  • Gemäß einer weiteren Variante ist außerdem noch eine Kontextdatenbank vorhanden, in der Daten zur Beschreibung der Bedeutung von Städten enthalten sind. According to another variant also is still a context database available, are included in the data describing the importance of cities. Dabei kann es sich beispielsweise um die Einwohnerzahl und/oder die Stadtfläche einer Stadt handeln. This may for example be the number of inhabitants and / or the urban area of ​​a city. Denn die Auswahl einer Stadt mit großer Einwohnerzahl bzw. großer Stadtfläche ist erheblich wahrscheinlicher, als beispielsweise die Auswahl eines kleinen Dorfes. Because the selection of a city with a large population and large urban area is significantly more likely than, say, the selection of a small village. Alternativ zur Verwendung des erfindungsgemäßen Verfahrens auf einem Navigationssystem kann das elektronische Assistenzsystem auch in der Art eines Medienabspielgeräts, insbesondere in der Art eines MP3-Abspielgeräts, ausgebildet sein. Alternatively to the use of the inventive method on a navigation system, the electronic assistant system may also be in the form of a media player, in particular in the manner of a MP3 player, may be formed. Auch hier muss der Benutzer vielfach mit sehr geringem Eingabekomfort seine Eingabedaten eingeben, so dass die Verbesserung des Eingabekomforts durch entsprechende Spracheingaben bei hoher Trefferwahrscheinlichkeit von großer Bedeutung ist. Again, the user must often enter with very little input comfort its input data, so that the improvement of the input comfort is through appropriate speech inputs with high hit probability of great importance.
  • Beim Betrieb des Verfahrens auf einem Medienabspielgerät kann die Kontextdatenbank bevorzugt Daten zu bevorzugten Musikstücken, und/oder Daten zur benutzerspezifischen Bewertung von Musikstücken, und/oder Daten zum Zeitpunkt der Abspeicherung von Musikstücken enthalten. When operating the process on a media player of the context database may preferably include data to preferred music pieces and / or data for the user-specific evaluation of pieces of music and / or data at the time of storage of pieces of music. Denn die vom Benutzer favorisierten Musikstücke, die beispielsweise in Favoritenlisten gespeichert sind, bzw. die Musikstücke, die vom Benutzer eine hohe benutzerspezifische Bewertung erhalten haben oder erst vor kurzer Zeit auf dem Medienabspielgerät abgespeichert wurden, weisen eine deutlich höhere Trefferwahrscheinlichkeit auf als andere Musikstücke. For the favored by the user pieces of music that are stored for example in lists of favorites, or the pieces of music that the user has given a high user rating or were stored on the media player only recently, have a significantly higher probability of a hit than other pieces of music.
  • Gemäß einer weiteren Funktionsalternative kann das erfindungsgemäße Verfahren auch auf Fahrkartenautomaten installiert werden. According to a further feature alternative method of the invention can also be installed at ticket machines. Auch hier ist wiederum die Eingabe von einer Vielzahl von Eingabedaten durch den Benutzer notwendig, der zudem vielfach völlig ungeübt ist. Again, the input from a variety of input data by the user is required again, which also is often completely untrained.
  • Beim Kontextvergleich auf einem Fahrkartenautomat können die Inhalte der Phonem-Datensätze dann mit den Daten von bevorzugten Zielbahnhöfen, bzw. mit Daten von nahe gelegenen Zielbahnhöfen oder mit den Daten zur Größe oder Bedeutung von Zielbahnhöfen verglichen werden. With contextual comparison on a ticket machine, the contents of the phoneme data sets can then be compared with the data of preferred destination stations, or with data from nearby stations of destination or with the data on the size or importance of target stations.
  • Verschiedene Aspekte der Erfindung sind in der Zeichnung schematisiert dargestellt und werden nachfolgend beispielhaft erläutert. Various aspects of the invention are shown schematically in the drawing and will be explained by way of example.
  • Es zeigen: Show it:
  • 1 1 : eine sortierte Ergebnisliste mit den Inhalten mehrerer Phonem-Datensätze nach Durchlaufen der ersten Verarbeitungsstufe; : A list of results with the contents of several phoneme records after passing through the first-stage processing;
  • 2 2 : die Ergebnisliste gemäß : The results according to 1 1 nach Durchlaufen der zweiten Verarbeitungsstufe. after passing through the second stage of processing.
  • 1 1 zeigt eine Liste displays a list 01 01 , in deren ersten Spalte fünf Ortsnamen angeschrieben sind. In whose first column five place names are written. Bei diesen Ortsnamen handelt es sich um die Inhalte von Phonem-Datensätzen, die beim akustischen Vergleich mit einer Spracheingabe an einem Navigationssystem als mögliche Treffer in einer ersten Verarbeitungsstufe durch akustischen Vergleich erkannt worden sind. These place names is the content of phoneme data sets that have been detected during acoustic comparison with a voice input to a navigation system as possible matches in a first processing stage by acoustic comparison. Entsprechend dem Übereinstimmungswert der akustischen Übereinstimmung wurde der Ort „Würzbach” als wahrscheinlichster Treffer identifiziert und deshalb mit der Priorisierung 1 versehen. According to the matching value of the acoustic match the place "Würzbach" was identified as wahrscheinlichster hits and therefore provided with the prioritization first Der Treffer „Mühlburg” weist dagegen den geringsten akustischen Übereinstimmungswert auf und erhält damit die schlechteste Priorisierung, nämlich 5 Punkte. By contrast, the hit "Mühlburg" has the lowest acoustic match value, and gets the worst prioritization, ie 5 points.
  • 2 2 zeigt die Liste shows the list 01a 01a , nachdem die erkannten Orte in einer zweiten Verarbeitungsstufe einen inhaltlichen Kontextvergleich durchlaufen haben. After the detected locations have undergone a substantive context compared in a second processing stage. Bei diesem inhaltlichen Kontextvergleich wurde festgestellt, dass der Benutzer den Ort „Würzburg” bereits sehr häufig als Ziel seiner Routenplanung eingegeben hat und außerdem eine Vielzahl von Adressen in seinem persönlichen Adressbuch unter der Stadt „Würzburg” gespeichert sind. In this editorial context compared, it was found that the user has already entered the very common "Würzburg" as the goal of its route planning and also a plurality of addresses in his personal address book under the city "Würzburg" are stored. Aufgrund dieses inhaltlichen Kontextvergleiches wird der Treffer „Würzburg” mit einem höheren Übereinstimmungswert modifiziert und erhält nunmehr die höchste Priorisierung 1. Auch die anderen Treffer der Liste 1 werden einem inhaltlichen Kontextvergleich unterzogen und die jeweiligen Übereinstimmungswerte modifiziert, so dass „Mühlburg” nach dieser Modifikation statt der Priorisierung 5 die Priorisierung 3 und „Würzbach” statt der Priorisierung 1 die Priorisierung 4 erhält. Because of this editorial context comparison of results "Würzburg" is modified with a higher match value and now receives the highest priority 1. The other results of Schedule 1 are subjected to an editorial context comparison and modifies the respective match values, so that "Mühlburg" according to this modification, instead prioritizing 5 receives the prioritization 3 and "Würzbach" instead of priority 1, the priority. 4 Die Orte gemäß der Liste 1 werden dann anschließend zur Weiterverarbeitung weitergegeben und können dem Benutzer eines Navigationssystems in der entsprechenden Reihenfolge als mögliche Zielorte angezeigt werden. The locations of the list 1 are subsequently passed on for further processing and the user of a navigation system in the appropriate order can be viewed as potential destinations.

Claims (13)

  1. Verfahren zum Betrieb eines elektronischen Assistenzsystems mit einer akustischen Aufnahmeeinrichtung, an der gesprochene Bedieneranweisungen aufgenommen werden können und mit einem Spracherkennungsmodul weiterverarbeitet werden, wobei in einer ersten Verarbeitungsstufe des Spracherkennungsmoduls die gesprochenen Bedieneranweisungen mit in einer Datenbank gespeicherten Phonem-Datensätzen verglichen werden, und wobei die Phonem-Datensätze entsprechend ihrer jeweiligen akustischen Übereinstimmungsrate mit einem Übereinstimmungswert bewertet werden, dadurch gekennzeichnet , dass in einer zweiten Verarbeitungsstufe des Spracherkennungsmoduls zumindest für einen Teil der Phonem-Datensätze die Inhalte der Phonem-Datensätze mit den in zumindest einer Kontextdatenbank gespeicherten Kontextdaten verglichen werden, wobei der in der ersten Verarbeitungsstufe ermittelte Übereinstimmungswert der Phonem-Datensätze in Abhängigkeit vom Ergebnis des inhaltlichen Kontextvergleichs modifiziert A method for operating an electronic assistance system with an acoustic pick-up device may be added to the spoken user instructions and be further processed by a speech recognition module, the spoken user instructions are compared with stored in a database phoneme data records in a first processing stage of the speech recognition module, and wherein the phoneme -Datensätze be rated according to their respective acoustic matching rate with a matching value, characterized in that the contents of the phoneme data records with the data stored in at least one context database context data are compared in a second processing stage of the voice recognition module at least for a part of the phoneme data sets, wherein the determined in the first processing stage matching value of the phoneme data sets modified in dependence on the result of the content of the context comparison wird, und wobei zumindest der Phonem-Datensatz mit dem besten modifizierten Übereinstimmungswert zur Weiterverarbeitung weitergegeben wird. is and wherein at least the phoneme data is transmitted with the best modified match value for further processing.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass nur die Phonem-Datensätze an die zweite Verarbeitungsstufe zum inhaltlichen Kontextvergleich weitergegeben werden, deren in der ersten Verarbeitungsstufe ermittelter Übereinstimmungswert oberhalb eines vorgegebenen Grenzwerts liegt. The method of claim 1, characterized in that only the phoneme data sets are passed on to the second processing stage for editorial context comparison whose determined in the first processing stage matching value is above a predetermined limit value.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass mehrere Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten nach der zweiten Verarbeitungsstufe zur Weiterverarbeitung weitergegeben werden. A method according to claim 1 or 2, characterized in that a plurality of phoneme data sets with the relatively highest modified match values ​​after the second processing stage will be passed for further processing.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Phonem-Datensätze mit den relativ höchsten modifizierten Übereinstimmungswerten nach der Größe ihres jeweiligen modifizierten Übereinstimmungswertes geordnet in einer Liste sortiert werden. Method according to one of claims 1 to 3, characterized in that the phoneme data sets with the relatively highest modified match values ​​according to the size of their respective modified match value sorted are sorted in a list.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass in der Kontextdatenbank frühere Eingabedaten, die vom Benutzer bestätigt wurden, gespeichert sind, wobei in der zweiten Verarbeitungsstufe der Übereinstimmungswert eines Phonem-Datensatzes erhöhend modifiziert wird, wenn der Inhalt des Phonem-Datensatzes mit einem in der Kontextdatenbank gespeicherten, in der Vergangenheit bestätigten Eingabedatum übereinstimmt. A method according to any one of claims 1 to 4, characterized in that are stored in the context database previous input data, which have been confirmed by the user, being modified increasing in the second processing stage with the correlation value of a phoneme data set if the content of the phoneme data set coincides with a program stored in the context database, confirmed in the past, input date.
  6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das elektronische Assistenzsystem in der Art eines Navigationssystems ausgebildet ist. A method according to any one of claims 1 to 5, characterized in that the electronic assistant system is designed in the manner of a navigation system.
  7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass als eine Kontextdatenbank eine benutzerspezifische Adressdatenbank verwendet wird. A method according to any one of claims 1 to 6, characterized in that a user-specific address database is used as a context database.
  8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass als eine Kontextdatenbank eine Datenbank mit Startpunkten oder Zielpunkten verwendet wird, die in der Vergangenheit Grundlage einer Routenplanung gewesen sind. A method according to any one of claims 1 to 7, characterized in that a data base with start points or destination points is used as a context database that have been the basis of a route planning in the past.
  9. Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass in einer Kontextdatenbank Daten zur Beschreibung der Bedeutung von Städten, insbesondere die Einwohnerzahl und/oder der Stadtfläche, enthalten sind. Method according to one of claims 6 to 8, characterized in that, in a context database data for describing the importance of cities, in particular the inhabitants and / or the city area are included.
  10. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das elektronische Assistenzsystem in der Art eines Medienabspielgeräts, insbesondere eines MP3-Abspielgeräts, ausgebildet ist. A method according to any one of claims 1 to 5, characterized in that the electronic assistant system in the manner of a media player, in particular an MP3-player, is formed.
  11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass in der Kontextdatenbank Daten zu bevorzugten Musikstücken und/oder Daten zur benutzerspezifischen Bewertung der Musikstücke und/oder Daten zum Zeitpunkt der Abspeicherung der Musikstücke enthalten sind. A method according to claim 10, characterized in that, in the context database data to preferred music pieces and / or data to the user-specific evaluation of the pieces of music and / or data is contained at the time of storage of the pieces of music.
  12. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das elektronische Assistenzsystem in der Art eines Fahrkartenautomats ausgebildet ist. A method according to any one of claims 1 to 5, characterized in that the electronic assistant system is designed in the manner of a ticket automaton.
  13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass in der Kontextdatenbank Daten zu bevorzugten Zielbahnhöfen und/oder Daten zu nahe gelegenen Zielbahnhöfen und/oder Daten zur Größe oder Bedeutung von Zielbahnhöfen enthalten sind. A method according to claim 12, characterized in that, in the context database data to the preferred target stations and / or data to nearby stations of destination and / or contains data for the size or importance of target stations.
DE102008021954A 2008-02-29 2008-05-02 A method for operating an electronic assistance system Withdrawn DE102008021954A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102008012067 2008-02-29
DE102008012067.7 2008-02-29
DE102008021954A DE102008021954A1 (en) 2008-02-29 2008-05-02 A method for operating an electronic assistance system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102008021954A DE102008021954A1 (en) 2008-02-29 2008-05-02 A method for operating an electronic assistance system
PCT/DE2009/000156 WO2009106031A1 (en) 2008-02-29 2009-02-06 Method for operating an electronic assistance system

Publications (1)

Publication Number Publication Date
DE102008021954A1 true DE102008021954A1 (en) 2009-09-03

Family

ID=40911440

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008021954A Withdrawn DE102008021954A1 (en) 2008-02-29 2008-05-02 A method for operating an electronic assistance system

Country Status (2)

Country Link
DE (1) DE102008021954A1 (en)
WO (1) WO2009106031A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011116460A1 (en) 2011-10-20 2013-04-25 Volkswagen Aktiengesellschaft Method for providing user interface of e.g. navigation system for passenger car, involves outputting confirmation to user according to user inputs, where confirmation comprises non specific confirmation independent of word portion group
DE102015226408A1 (en) * 2015-12-22 2017-06-22 Robert Bosch Gmbh Method and apparatus for performing speech recognition for controlling at least one function of a vehicle
WO2018082917A1 (en) * 2016-11-02 2018-05-11 Audi Ag Method for processing a user input and motor vehicle having a data-processing device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19742054A1 (en) * 1997-09-24 1999-04-01 Philips Patentverwaltung Input system for at least location and / or street names
DE19933524A1 (en) * 1999-07-16 2001-01-18 Nokia Mobile Phones Ltd A method for entering data into a system
DE10131157C1 (en) * 2001-06-29 2002-07-04 Project49 Ag Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user
DE10125825A1 (en) * 2001-05-26 2002-11-28 Bosch Gmbh Robert Speech input and recognition system for a road vehicle navigation system has input checked against stored values
DE10306022B3 (en) * 2003-02-13 2004-02-19 Siemens Ag Speech recognition method for telephone, personal digital assistant, notepad computer or automobile navigation system uses 3-stage individual word identification
DE102005018174A1 (en) * 2005-04-19 2006-11-02 Daimlerchrysler Ag Process for the specific determination of a complete set of input data in a speech dialog 11
DE102007016887B3 (en) * 2007-04-10 2008-07-31 Siemens Ag Method for operating navigation system, involves entering address information into corresponding phonetic address information, where address information is decoded in phonetic code

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10218226A1 (en) * 2002-04-24 2003-11-06 Volkswagen Ag Speech-control method for multimedia device in motor vehicle, by allocating phoneme data as speech label to individual multimedia files, e.g. titles of tracks
KR100668297B1 (en) * 2002-12-31 2007-01-12 삼성전자주식회사 Method and apparatus for speech recognition
US7136459B2 (en) * 2004-02-05 2006-11-14 Avaya Technology Corp. Methods and apparatus for data caching to improve name recognition in large namespaces
JP4804052B2 (en) * 2005-07-08 2011-10-26 アルパイン株式会社 Voice recognition device, navigation device provided with voice recognition device, and voice recognition method of voice recognition device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19742054A1 (en) * 1997-09-24 1999-04-01 Philips Patentverwaltung Input system for at least location and / or street names
DE19933524A1 (en) * 1999-07-16 2001-01-18 Nokia Mobile Phones Ltd A method for entering data into a system
DE10125825A1 (en) * 2001-05-26 2002-11-28 Bosch Gmbh Robert Speech input and recognition system for a road vehicle navigation system has input checked against stored values
DE10131157C1 (en) * 2001-06-29 2002-07-04 Project49 Ag Dynamic grammatical weighting method for speech recognition system has existing probability distribution for grammatical entries modified for each identified user
DE10306022B3 (en) * 2003-02-13 2004-02-19 Siemens Ag Speech recognition method for telephone, personal digital assistant, notepad computer or automobile navigation system uses 3-stage individual word identification
DE102005018174A1 (en) * 2005-04-19 2006-11-02 Daimlerchrysler Ag Process for the specific determination of a complete set of input data in a speech dialog 11
DE102007016887B3 (en) * 2007-04-10 2008-07-31 Siemens Ag Method for operating navigation system, involves entering address information into corresponding phonetic address information, where address information is decoded in phonetic code

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011116460A1 (en) 2011-10-20 2013-04-25 Volkswagen Aktiengesellschaft Method for providing user interface of e.g. navigation system for passenger car, involves outputting confirmation to user according to user inputs, where confirmation comprises non specific confirmation independent of word portion group
DE102015226408A1 (en) * 2015-12-22 2017-06-22 Robert Bosch Gmbh Method and apparatus for performing speech recognition for controlling at least one function of a vehicle
WO2018082917A1 (en) * 2016-11-02 2018-05-11 Audi Ag Method for processing a user input and motor vehicle having a data-processing device

Also Published As

Publication number Publication date
WO2009106031A1 (en) 2009-09-03

Similar Documents

Publication Publication Date Title
DE69925932T2 (en) Speech synthesis by concatenation of speech waveforms
DE69816676T2 (en) System and method for determining and minimizing a finite transducers for speech recognition
DE69814104T2 (en) Distribution of texts and identification of themes
DE60020773T2 (en) Graphical user interface and methods for modifying pronunciations in speech synthesis and -Erkennungssystemen
DE69725802T2 (en) Prefiltering means lexical trees for speech recognition
DE10040214B4 (en) Method and system for automatic detection of an update of a language model in a speech recognition system
DE69722785T2 (en) Browser method and apparatus with censorship for internet viewing
DE69917112T2 (en) Extension of vocabulary of a client-server speech recognition system
DE60126564T2 (en) Method and arrangement for Sprachsysnthese
DE69722980T2 (en) Recording of voice data with segments of acoustically different environments
DE60302407T2 (en) Ambient and speaker-adapted speech recognition
DE19709518C5 (en) Method and apparatus for speech input of a destination address into a destination guiding system in real-time
DE3317325C2 (en)
DE69822296T2 (en) Pattern recognition registration in a distributed system
DE60126722T2 (en) Pronunciation of new words to the language processing
DE60315947T2 (en) A method for language modeling
DE60035001T2 (en) Speech synthesis with prosody patterns
DE69726526T2 (en) Schema and model adaptation in pattern recognition which is based on Taylor expansion
EP1184839B1 (en) Grapheme-phoneme conversion
DE69933623T2 (en) voice recognition
DE69831991T2 (en) Method and apparatus for speech detection
DE69827667T2 (en) Vocoder based speech
EP0299572B1 (en) Method for connected word recognition
DE69726499T2 (en) Method and apparatus for encoding pronunciation prefix trees
DE102008010419A1 (en) Device and method for creating a text object

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20121201