WO2009129775A1 - Method for operating an electronic assistance system - Google Patents

Method for operating an electronic assistance system Download PDF

Info

Publication number
WO2009129775A1
WO2009129775A1 PCT/DE2009/000502 DE2009000502W WO2009129775A1 WO 2009129775 A1 WO2009129775 A1 WO 2009129775A1 DE 2009000502 W DE2009000502 W DE 2009000502W WO 2009129775 A1 WO2009129775 A1 WO 2009129775A1
Authority
WO
WIPO (PCT)
Prior art keywords
output
instruction
indication
word
context
Prior art date
Application number
PCT/DE2009/000502
Other languages
German (de)
French (fr)
Inventor
Jochen Katzer
Original Assignee
Navigon Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navigon Ag filed Critical Navigon Ag
Publication of WO2009129775A1 publication Critical patent/WO2009129775A1/en

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3629Guidance using speech or audio output, e.g. text-to-speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems

Definitions

  • the invention relates to a method for operating an electronic assistance system with voice output according to the preamble of claim 1.
  • the calculation and acoustic output of instructions is common.
  • This can be, for example, a maneuvering instruction to indicate to the driver of a vehicle a maneuver necessary for following a route.
  • the instructions to be output for the user also include numbers, for example for indicating a distance or for specifying a street number or the like.
  • the instruction is calculated programmatically and then audibly audibly output at an acoustic output device, such as a loudspeaker.
  • an acoustic output device such as a loudspeaker.
  • Output of the number indication also from the language used in each case, since there are very different language habits in the different languages. If, for example, a telephone number is to be output as additional information for a specific destination, the specification of the telephone number as a connected number word is generally completely incomprehensible, but the user expects the acoustic output of the telephone number as a word sequence of several digits. If the assistance system outputs a distance, for example the distance to the next maneuver, the user is regularly expected to specify the distance as a contiguous number word, whereas the indication of the distance as word sequence of several numerical words would remain completely incomprehensible.
  • the method according to the invention is based on the idea that the context of the number is analyzed in the statement. Depending on the analysis result of the context analysis, the numerical value is then acoustically output in the acoustic output of the instruction either as a contiguous number word or as a word sequence of several digit words or as a combination of at least one connected number word and at least one word sequence with at least one digit word. In other words, this means that the context analysis determines in which manner of speech the numerical value should be output to increase the intelligibility. If, for example, the context analysis determines that the number refers to a telephone number, the telephone number can be output as a word sequence from a plurality of numerical words.
  • the number can be output as a contiguous number word.
  • the output as a combination of at least one contiguous number word and at least one word sequence with at least one digit word is possible.
  • a hybrid of contiguous numerical words and word sequences can be generated from multiple numerical words.
  • any number of analysis parameters can be considered.
  • the output of the number should each be changed according to the invention.
  • the instruction can be combined word-based from a plurality of word elements respectively stored in a memory. In other words, this means that a plurality of acoustic word elements are stored in the memory.
  • corresponding acoustic files may be present, with the acoustic instruction then being composed of these acoustic files.
  • the acoustic output and the necessary spoken word elements can also be synthesized in a speech synthesis module according to the known "text-to-speech technology".
  • the inventive method is preferably incorporated into the normal process flow of a navigation system that the text to be issued as a maneuver instruction or tokens that represent the individual components of the output text, in machine-readable form from the maneuver instruction creation unit to the maneuver instruction output unit ,
  • the maneuver instruction creation unit supplements the machine-readable form of the maneuver to be output by further parameters. These parameters include at least the language of the instruction text and the context of each number sequence contained (eg, whether it is a distance or Street indication etc.).
  • a position identifier is also provided as a parameter that allows the maneuver instruction output unit to issue at the correct time prior to the maneuver. With the parameters passed, the maneuver instruction output unit can now make the output of the maneuver accordingly.
  • maneuver instruction creation unit could already carry out the method according to the invention and as a result a
  • 1 shows a table for determining the number output format as a function of the context analysis.
  • FIG. 1 shows a possibility for determining the speech output format of numbers as a function of a context analysis.
  • Column 1 determines the respective input format of a number. It can be a one-digit, two-digit, three-digit number or four-digit number, with one line being uniquely determined depending on whether the number contains a "0" and at which position of the number the "0" occurs. If, for example, the number 230 is to be output, this number is assigned to row 5 of the table with the input format XXO. If, on the other hand, the number "4321" is ben, the line to be selected results from the input format XXXX.
  • the number is to be composed word-based from pieces of audio that are stored acoustically or is synthesized in a speech synthesis module.
  • a word-based speech output generation columns 2 through 5 are selected, and columns 6 through 9 are selected for TTS-based speech synthesis.
  • the further context analysis will be explained on the basis of the word-based speech output, as determined by columns 2 to 5.
  • the TTS-based speech synthesis is done accordingly.
  • the numerical value in the acoustic output is then analyzed to determine whether the speech should be in German or English.
  • Columns 2 and 3 are selected for a German-language edition
  • columns 4 and 5 are selected for an English-language edition.
  • a substantive context analysis is required in which it is checked whether the speech output relates to the specification of a distance, for example the indication of a distance to a next maneuver, or the indication of a street number.
  • the respective speech output format results.
  • the square brackets in the speech output format indicate in each case coherent numerical words or numerical words and number word sequences of several numerical words.
  • the German way of speaking does not distinguish between the pronunciation of road numbers and distances.
  • the number “217” when outputting a Distance for example, the statement “Please follow the road two hundred and tenteen km”, as well as a continuous sequence of numbers spent as in the indication of a street number, for example, the output "turn right on the B two hundred seventeen”.
  • the inclusion of the number "0" is of crucial importance for the linguistic acceptance of the acoustic output, for example, the words “... on Highway 4620” and the words “... on Highway 4602" for the first sentence the acoustic output "Highway four-six-twenty” and for the second sentence "four-six-zero-two".

Abstract

The invention relates to a method for operating an electronic assistance system having speech output, comprising the following steps:  a) Calculating at least one instruction for the user, wherein the instruction contains at least one piece of numerical data, and wherein the numerical data is defined by a multi-digit sequence of digits, b) acoustically outputting the instruction on an output device, wherein the context of the numerical data in the instruction is analyzed, wherein the numerical data is output as a function of the results of the context analysis during the acoustic output of the instruction based on context either as a) a continuous word of a number or b) as a sequence of words comprising a plurality of words of digits or c) as a combination of at least one continuous word of a number and at least one sequence of words comprising at least one word of a digits.

Description

Verfahren zum Betrieb eines elektronischen Assistenzsystems Method for operating an electronic assistance system
Die Erfindung betrifft ein Verfahren zum Betrieb eines elektronischen Assistenzsystems mit Sprachausgabe nach dem Oberbegriff des Anspruchs 1.The invention relates to a method for operating an electronic assistance system with voice output according to the preamble of claim 1.
Bei vielen Assistenzsystemen, beispielsweise Navigationssystemen, ist die Berechnung und akustische Ausgabe von Anweisungen üblich. Dabei kann es sich beispielsweise um eine Manöveranweisung handeln, um dem Fahrer eines Fahrzeuges ein für das Folgen einer Route notwendiges Manöver anzugeben. Die für den Benutzer auszugebenden Anweisungen enthalten dabei vielfach auch Zahlenangaben, beispielsweise zur Angabe einer Distanz oder zur Angabe einer Straßennummer oder Ähnlichem. Bei den gattungsgemäßen Assistenzsystemen wird die Anweisung programmtechnisch berechnet und anschließend an einer akustischen Ausgabeeinrichtung, beispielsweise einem Lautsprecher, akustisch hörbar ausgegeben. Bei der akustischen Ausgabe von Zahlenfolgen wird bei den bekannten Assistenzsystemen entweder eine direkte Aussprache als zusammenhängendes Zahlenwort oder eine zusammengesetzte Aussprache als Wortfolge von mehreren Ziffernworten eingesetzt. Soll mit den bekannten Assistenzsystemen beispielsweise die Zahl „2156" akustisch ausgegeben werden, so kann dies entweder in direkter Aussprache als Zahlenwort „zweitausendeinhundertsechsundfünfzig" oder in zusammengesetzter Wortfolge aus den Ziffernworten „zwei-eins-fünf-sechs" erfolgen.In many assistance systems, such as navigation systems, the calculation and acoustic output of instructions is common. This can be, for example, a maneuvering instruction to indicate to the driver of a vehicle a maneuver necessary for following a route. In many cases, the instructions to be output for the user also include numbers, for example for indicating a distance or for specifying a street number or the like. In the generic assistance systems, the instruction is calculated programmatically and then audibly audibly output at an acoustic output device, such as a loudspeaker. In the acoustic output of number sequences in the known assistance systems either a direct pronunciation is used as a continuous number word or a composite pronunciation as a word sequence of multiple numerical words. Should with the known assistance systems, for example, the number "2156" are issued acoustically, this can be done either in direct pronunciation as numerical word "two thousand one hundred and fifty-six" or in composite word order from the numerical words "two-one-five-six".
Diese Art der Ausgabe von Zahlenangaben entweder als zusammenhängendes Zahlenwort oder als Wortfolge aus mehreren Ziffernworten berücksichtigt jedoch nicht die Problematik, dass die Sprechweise von Zahlenangaben sehr stark vom jeweiligen Kontext abhängen kann. Außerdem hängt eine für den Benutzer gut verständliche akustischeHowever, this type of output of numbers either as a contiguous number word or as a word sequence of several numerical words does not take into account the problem that the manner of speaking of numbers can very much depend on the context in question. In addition, depends on the user well understood acoustic
Ausgabe der Zahlenangabe auch von der jeweils verwendeten Sprache ab, da es in den verschiedenen Sprachen ganz unterschiedliche Sprachgewohnheiten gibt. Soll beispielsweise als Zusatzinformation für ein bestimmtes Ziel eine Telefonnummer ausgegeben werden, ist die Angabe der Telefonnummer als zusammenhängendes Zahlenwort in der Regel völlig unverständlich, sondern der Benutzer erwartet die akustische Ausgabe der Telefonnummer als Wortfolge von mehreren Ziffern. Sollte von dem Assistenzsystem eine Distanz, beispielsweise die Entfernung zum nächsten Manöver, ausgegeben werden, wird vom Benutzer regel- mäßig die Angabe der Distanz als zusammenhängendes Zahlenwort erwartet, wo hingegen die Angabe der Distanz als Wortfolge von mehreren Ziffernworten gänzlich unverständlich bliebe.Output of the number indication also from the language used in each case, since there are very different language habits in the different languages. If, for example, a telephone number is to be output as additional information for a specific destination, the specification of the telephone number as a connected number word is generally completely incomprehensible, but the user expects the acoustic output of the telephone number as a word sequence of several digits. If the assistance system outputs a distance, for example the distance to the next maneuver, the user is regularly expected to specify the distance as a contiguous number word, whereas the indication of the distance as word sequence of several numerical words would remain completely incomprehensible.
Ausgehend vom vorbekannten Stand der Technik wird deshalb ein neues Verfahren zum Betrieb eines elektronischen Assistenzsystems bei der Sprachausgabe von Zahlenangaben vorgeschlagen, dass das intuitive Verständnis der akustischen Zahlenausgabe erhöht.Based on the prior art, therefore, a new method for operating an electronic assistance system in the voice output of numbers is proposed that increases the intuitive understanding of the acoustic number output.
Diese Aufgabe wird durch ein Verfahren nach der Lehre des Anspruchs 1 gelöst.This object is achieved by a method according to the teaching of claim 1.
Vorteilhafte Ausführungsformen der Erfindung sind Gegenstand der Unteransprüche. Das erfindungsgemäße Verfahren beruht auf dem Grundgedanken, dass der Kontext der Zahlenangabe in der Anweisung analysiert wird. Abhängig vom Analyseergebnis der Kontextanalyse wird die Zahlenangabe dann bei der akustischen Ausgabe der Anweisung wahlweise als zusam- menhängendes Zahlenwort, oder als Wortfolge mehrerer Ziffernworte oder als Kombination aus zumindest einem zusammenhängendem Zahlenwort und zumindest einer Wortfolge mit zumindest einem Ziffernwort akustisch ausgegeben. Dies bedeutet mit anderen Worten, dass durch die Kontextanalyse ermittelt wird, in welcher Sprechweise die Zahlenangabe zur Erhöhung der Verständlichkeit ausgegeben werden sollte. Wird bei der Kontextanalyse beispielsweise festgestellt, dass die Zahlenangabe eine Telefonnummer betrifft, kann die Telefonnummer als Wortfolge aus mehreren Ziffernworten ausgegeben werden. Ergibt die Kontextanalyse dagegen, dass die Zahlenangabe eine Distanzangabe zur Beschreibung der Entfernung bis zum Manöver ist, kann die Zahlenangabe als zusammenhängendes Zahlenwort ausgegeben werden. Daneben ist auch die Ausgabe als Kombination aus zumindest einem zusammenhängenden Zahlenwort und zumindest einer Wortfolge mit zumindest jeweils einem Ziffernwort möglich. Insofern kann abhängig vom jeweiligen Kontext bei der akustischen Ausgabe von Zahlenangaben also auch eine Mischform aus zusammenhängenden Zahlenworten und Wortfolgen aus mehreren Ziffernworten generiert werden.Advantageous embodiments of the invention are the subject of the dependent claims. The method according to the invention is based on the idea that the context of the number is analyzed in the statement. Depending on the analysis result of the context analysis, the numerical value is then acoustically output in the acoustic output of the instruction either as a contiguous number word or as a word sequence of several digit words or as a combination of at least one connected number word and at least one word sequence with at least one digit word. In other words, this means that the context analysis determines in which manner of speech the numerical value should be output to increase the intelligibility. If, for example, the context analysis determines that the number refers to a telephone number, the telephone number can be output as a word sequence from a plurality of numerical words. If the context analysis shows that the number is a distance to describe the distance to the maneuver, the number can be output as a contiguous number word. In addition, the output as a combination of at least one contiguous number word and at least one word sequence with at least one digit word is possible. In this respect, depending on the particular context in the acoustic output of numbers so also a hybrid of contiguous numerical words and word sequences can be generated from multiple numerical words.
Als herausragend wichtiger Analyseparameter bei der Kontextanalyse hat sich die jeweils voreingestellte Sprache für die Sprachausgabe der Zahlenangabe erwiesen. Denn die Sprechweise von Zahlen variiert sehr stark mit den Sprachgewohnheiten in den unterschiedlichen Sprachen. Wird beispielsweise im Deutschen die Nummer einer nummerierten Straße akustisch ausgegeben, beispielsweise durch die Angabe „Bitte an der nächsten Kreuzung auf die B 417 einbiegen", so wird die Zahlenan- gäbe „417" als zusammenhängendes Zahlenwort „vierhundertsiebzehn,, ausgegeben, da diese Art der Sprechweise dem deutschen Sprachgebrauch entspricht. Wird dagegen bei einer englischen Sprachausgabe die Zahlenangabe „417" gemacht, beispielsweise durch Ansage des Manövers „Turn right onto Highway 417", so wird entsprechend dem englischsprachigen Sprachgebrauch bei der Angabe von Straßennummern die Straßennummer „Highway 417" als „Highway four-seventeen" ausgegeben. An diesem Beispiel ist also erkennbar, dass entsprechend dem deutschen Sprachgebrauch Straßennummern als zusammenhängende Zahlenworte ausgegeben werden, wo hingegen im englischen Sprachgebrauch sich eine kombinierte Sprechweise als Kombination einer Ziffernangabe und eines Zahlenwortes ergibt.As an outstandingly important analysis parameter in the context analysis, the respectively preset language for the speech output of the number has proved. The way in which numbers are spoken varies greatly with the language habits in the different languages. If, for example, the number of a numbered street in German is issued acoustically, for example by indicating "Please turn at the next intersection onto the B 417", the number "417" is output as a contiguous numerical word "four hundred and seventeen", since this Art the speech corresponds to the German usage. On the other hand, it will be in English the number "417" made, for example, by announcing the maneuver "Turn right on Highway 417", so the road number "Highway 417" is issued as "Highway four-seventeen" according to the English language usage in the indication of street numbers. In this example, it can be seen that, according to the German usage, street numbers are output as contiguous number words, whereas in English usage, a combined speech as a combination of a number specification and a number word results.
In der Kontextanalyse können letztendlich beliebig viele Analyseparameter berücksichtigt werden. Von besonderer Bedeutung ist dabei die Analyse, ob die Zahlenangabe die Angabe einer Distanz, beispielsweise die Entfernung bis zu einem Manöver, die Angabe einer nummerierten Straße, beispielsweise „B 417", die Angabe einer Zahlenangabe in einer Straße, beispielsweise „Straße des 17. Juni", die Angabe einer Hausnummer, die Angabe einer Postleitzahl, die Angabe einer Telefonnummer, die Angabe von Öffnungszeiten, die Angabe von Befahrbarkeitszeiten oder die Angabe von Bewertungsmerkmalen, beispielsweise Restaurantsternen, betrifft. Denn abhängig vom jeweiligen Kontext und insbe- sondere unter Berücksichtigung des jeweils sprachlich Üblichen in der jeweils eingestellten Sprache, sollte die Ausgabe der Zahlenangabe jeweils erfindungsgemäß verändert werden.In the context analysis finally any number of analysis parameters can be considered. Of particular importance in this case is the analysis of whether the indication of a distance, for example the distance to a maneuver, the indication of a numbered road, for example "B 417", the indication of a number in a street, for example "street of the 17. June ", the indication of a house number, the indication of a zip code, the indication of a telephone number, the indication of opening hours, the indication of passable times or the indication of evaluation characteristics, for example restaurant stars, concerns. For depending on the particular context and in particular taking into account each linguistically customary in each language set, the output of the number should each be changed according to the invention.
Von besonderer Bedeutung für die sprachübliche Ausgabe einer Zahlenangabe ist die Ziffer „0". Enthält eine Zahlenangabe nämlich die Ziffer „0", kann die sprachübliche akustische Ausgabe dieser Zahl, insbesondere unter Berücksichtigung der voreingestellten Sprache, stark variieren. Enthält die Zahlenangabe eine „0", so sollte die akustische Anweisung abhängig von der Stellung der „0" in der Zahlenangabe und/oder abhängig vom Kontext der Zahlenangabe und/oder abhängig von der voreinge- stellten Sprache jeweils unterschiedlich ausgegeben werden. In welcher Weise bei der Aufbereitung der akustischen Ausgabe der Anweisung vorgegangen wird, ist grundsätzlich beliebig. Gemäß einer ersten Verfahrensvariante kann die Anweisung wortstück-basiert aus mehreren in einem Speicher gespeicherten, jeweils gesprochenen Wort- elementen kombiniert werden. Dies bedeutet mit anderen Worten, dass im Speicher eine Vielzahl von akustischen Wortelementen gespeichert ist. So können beispielsweise für alle Zahlen von 0 bis 99 entsprechende Akustikdateien vorhanden sein, wobei aus diesen Akustikdateien anschließend die akustische Anweisung zusammengesetzt wird. Alternativ dazu können die akustische Ausgabe und die dafür notwendigen gesprochenen Wortelemente auch in einem Sprachsynthesemodul gemäß der bekannten „Text-to-Speech-Technologie" synthetisiert werden.Of particular importance for the customary output of a numerical value is the number "0." If a numerical value contains the number "0", the usual acoustic output of this number, especially taking into account the default language, can vary greatly. If the numerical value contains a "0", then the acoustic instruction should be output differently depending on the position of the "0" in the numerical value and / or depending on the context of the numerical value and / or depending on the preset language. The way in which the acoustic output of the instruction is processed is basically arbitrary. According to a first variant of the method, the instruction can be combined word-based from a plurality of word elements respectively stored in a memory. In other words, this means that a plurality of acoustic word elements are stored in the memory. For example, for all numbers from 0 to 99, corresponding acoustic files may be present, with the acoustic instruction then being composed of these acoustic files. Alternatively, the acoustic output and the necessary spoken word elements can also be synthesized in a speech synthesis module according to the known "text-to-speech technology".
Welche Funktion das elektronische Assistenzsystem übernimmt, ist grundsätzlich beliebig. Von größter Bedeutung ist die sprachübliche akustische Ausgabe von Zahlenangaben jedoch bei Navigationssystemen, da hier eine Vielzahl von Zahlenangaben in unterschiedlichen Kontextservicezusammenhängen und unterschiedlichen Sprachen auszugeben ist.Which function the electronic assistance system assumes is basically arbitrary. Of great importance, however, is the voice-like acoustic output of numbers in navigation systems, since a large number of figures must be output in different context service contexts and different languages.
Beim Ausführen des erfindungsgemäßen Verfahrens auf einem Navigationssystem ist es weiterhin von größter Bedeutung, dass die Manöveran- Weisungen des Navigationssystems den Zahlenangabenkontext richtig wiedergeben. Im Rahmen der Erstellung der Manöveranweisungen wird das erfindungsgemäße Verfahren vorzugsweise so in den normalen Verfahrensablauf eines Navigationssystems eingebaut, dass der als Manöveranweisung auszugebende Text bzw. solche Tokens, welche die einzelnen Komponenten des Ausgabetextes repräsentieren, in maschinenlesbarer Form von der Manöveranweisungserstellungseinheit an die Manöveranweisungsausgabeeinheit übergeben wird. Hierbei ergänzt die Manöveranweisungserstellungseinheit die maschinenlesbare Form des auszugebenden Manövers durch weitere Parameter. Zu diesen Parametern gehören zumindest die Sprache des Anweisungstextes und der Kontext jeder enthaltenen Zahlenfolge (z.B. ob es sich um eine Distanz oder Straßenangabe etc. handelt). Alternativ können zusätzlich das Land, in dem die Ausgabe vorgenommen wird, sowie weitere nutzerspezifische Präferenzinformationen übergeben werden. Gattungsgemäß wird ebenfalls eine Positionskennzeichnung als Parameter übergeben, welche der Manöveranweisungsausgabeeinheit ermöglicht, zum richtigen Zeitpunkt vor dem Manöver die Ausgabe vorzunehmen. Mit den übergebenen Parametern kann die Manöveranweisungsausgabeeinheit nun die Ausgabe des Manövers entsprechend vornehmen.In carrying out the method according to the invention on a navigation system, it is furthermore of utmost importance that the maneuvering instructions of the navigation system correctly reproduce the number-indicating context. As part of the preparation of the maneuvering instructions, the inventive method is preferably incorporated into the normal process flow of a navigation system that the text to be issued as a maneuver instruction or tokens that represent the individual components of the output text, in machine-readable form from the maneuver instruction creation unit to the maneuver instruction output unit , In this case, the maneuver instruction creation unit supplements the machine-readable form of the maneuver to be output by further parameters. These parameters include at least the language of the instruction text and the context of each number sequence contained (eg, whether it is a distance or Street indication etc.). Alternatively, the country in which the output is made, as well as other user-specific preference information, can also be transferred. Generically, a position identifier is also provided as a parameter that allows the maneuver instruction output unit to issue at the correct time prior to the maneuver. With the parameters passed, the maneuver instruction output unit can now make the output of the maneuver accordingly.
Alternativ könnte die Manöveranweisungserstellungseinheit auch bereits das erfindungsgemäße Verfahren durchführen und als Ergebnis eineAlternatively, the maneuver instruction creation unit could already carry out the method according to the invention and as a result a
Codierung der Manöveranweisung in maschinenlesbarer Form erzeugen, in der die Zahlen bzw. Ziffern für die Manöveranweisungsausgabeeinheit so codiert sind, dass keine Kenntnis von Kontext mehr notwendig ist und die akustische Ausgabe in der gewünschten Form korrekt wiedergegeben werden kann.Generate coding of the maneuvering instruction in machine-readable form in which the numbers for the maneuver instruction output unit are coded so that no more knowledge of context is necessary and the acoustic output can be correctly reproduced in the desired form.
Verschiedene Aspekte der Erfindung sind aus der Zeichnung ersichtlich und werden nachfolgend beispielhaft erläutert.Various aspects of the invention will become apparent from the drawing and will be exemplified below.
Es zeigt:It shows:
Fig. 1 eine Tabelle zur Bestimmung des Zahlenausgabefor- mats in Abhängigkeit der Kontextanalyse.1 shows a table for determining the number output format as a function of the context analysis.
Fig. 1 zeigt eine Möglichkeit zur Bestimmung des Sprachausgabeformats von Zahlenangaben in Abhängigkeit einer Kontextanalyse.FIG. 1 shows a possibility for determining the speech output format of numbers as a function of a context analysis.
Durch Spalte 1 wird das jeweilige Eingangsformat einer Zahlenangabe bestimmt. Es kann sich dabei um eine einstellige, zweistellige, dreistel- lige Zahl oder vierstellige Zahl handeln, wobei abhängig davon, ob die Zahl eine „0" enthält und an welcher Stelle der Zahl die „0" vorkommt, jeweils eine Zeile eindeutig bestimmt wird. Soll beispielsweise die Zahl 230 ausgegeben werden, wird diese Zahl der Zeile 5 der Tabelle mit dem Eingangsformat XXO zugeordnet. Soll dagegen die Zahl „4321 " ausgege- ben werden, so ergibt sich die zu wählende Zeile aus dem Eingangsformat XXXX.Column 1 determines the respective input format of a number. It can be a one-digit, two-digit, three-digit number or four-digit number, with one line being uniquely determined depending on whether the number contains a "0" and at which position of the number the "0" occurs. If, for example, the number 230 is to be output, this number is assigned to row 5 of the table with the input format XXO. If, on the other hand, the number "4321" is ben, the line to be selected results from the input format XXXX.
Nach Bestimmung der richtigen Zeile in Abhängigkeit vom Eingangsformat der auszugebenden Zahl wird danach unterschieden, ob die Zahlenangabe wortstück-basiert aus akustisch gespeicherten Wortstücken zusammengesetzt werden soll, oder in einem Sprachsynthesemodul synthetisiert wird. Bei einer wortstück-basierten Generierung der Sprachausgabe werden die Spalten 2 bis 5 und bei einer TTS-basierten Sprachsynthese die Spalten 6 bis 9 ausgewählt. Nachfolgend soll die weitere Kontextanalyse anhand der wortstück-basierten Sprachausgabe, wie sie durch die Spalten 2 bis 5 bestimmt wird, erläutert werden. Die TTS-basierte Sprachsynthese erfolgt entsprechend.After determining the correct line as a function of the input format of the number to be output, a distinction is made as to whether the number is to be composed word-based from pieces of audio that are stored acoustically or is synthesized in a speech synthesis module. For a word-based speech output generation, columns 2 through 5 are selected, and columns 6 through 9 are selected for TTS-based speech synthesis. In the following, the further context analysis will be explained on the basis of the word-based speech output, as determined by columns 2 to 5. The TTS-based speech synthesis is done accordingly.
Wurde festgestellt, dass die Sprachausgabe wortstück-basiert erfolgen soll, so wird anschließend die Zahlenangabe in der akustischen Ausgabe daraufhin analysiert, ob die Sprachausgabe deutschsprachig oder englischsprachig erfolgen soll. Bei einer deutschsprachigen Ausgabe werden die Spalten 2 und 3 , bei einer englischsprachigen Ausgabe die Spalten 4 und 5 ausgewählt. Zuletzt ist dann noch eine inhaltliche Kontextanalyse erforderlich, bei der überprüft wird, ob die Sprachausgabe die Angabe einer Distanz, beispielsweise die Angabe einer Entfernung bis zu einem nächsten Manöver, oder die Angabe einer Straßennummer betrifft. Im Kreuzungspunkt der j eweiligen Zeile, die durch das Eingangsformat der Zahlenangabe bestimmt wird, und der Spalte, die durch den inhaltlichen Kontext, die Sprache und die Sprachsynthese bestimmt wird, ergibt sich das jeweilige Sprachausgabeformat. Die eckigen Klammern im Sprachausgabeformat kennzeichnen dabei jeweils zusammenhängende Zahlenworte bzw. Ziffernworte und Zahlenwortfolgen aus mehreren Ziffernworten.If it has been determined that the speech output should be word-based, then the numerical value in the acoustic output is then analyzed to determine whether the speech should be in German or English. Columns 2 and 3 are selected for a German-language edition, columns 4 and 5 are selected for an English-language edition. Finally, a substantive context analysis is required in which it is checked whether the speech output relates to the specification of a distance, for example the indication of a distance to a next maneuver, or the indication of a street number. At the crossing point of the respective line, which is determined by the input format of the number, and the column, which is determined by the content context, the language and the speech synthesis, the respective speech output format results. The square brackets in the speech output format indicate in each case coherent numerical words or numerical words and number word sequences of several numerical words.
Wie man aus der Tabelle entnehmen kann, unterscheidet die deutsche Sprechweise nicht zwischen der Aussprache von Straßennummern und Distanzen. Beispielsweise wird die Zahl „217" bei der Ausgabe einer Distanz, beispielsweise der Angabe „Bitte dem Straßenverlauf zweihundertsiebzehn km folgen", genauso als zusammenhängende Zahlenfolge ausgegeben wie bei der Angabe einer Straßennummer, beispielsweise der Ausgabe „Rechts abbiegen auf die B zweihundertsiebzehn".As you can see from the table, the German way of speaking does not distinguish between the pronunciation of road numbers and distances. For example, the number "217" when outputting a Distance, for example, the statement "Please follow the road two hundred and tenteen km", as well as a continuous sequence of numbers spent as in the indication of a street number, for example, the output "turn right on the B two hundred seventeen".
In der englischen Aussprache hingegen besteht ein großer Unterschied zwischen Distanzangaben und der Angabe von Straßennummern. Bei der Distanzangabe, beispielsweise der Ausgabe „Please follow the road for fourhundred seventeen miles", wird die Distanz als zusammenhängendes Zahlenwort ausgegeben. Bei der Straßennummer wird dagegen die Zahlenangabe als „four-seventeen" ausgegeben.In the English pronunciation, on the other hand, there is a big difference between distances and street numbers. In the distance specification, for example, the output "Please follow the road for fourhundred seventeen miles", the distance is output as a contiguous number word.However, the street number, the number is output as "four-seventeen".
Insbesondere ist auch die Berücksichtigung der Ziffer „0" von entscheidender Bedeutung für die sprachliche Akzeptanz der akustischen Ausgabe. So ergibt sich beispielsweise bei der Aussprache der Angabe „... onto Highway 4620" und der Angabe „ ... onto Highway 4602" für den ersten Satz die akustische Ausgabe „Highway four-six-twenty" und für den zweiten Satz „four-six-zero-two". In particular, the inclusion of the number "0" is of crucial importance for the linguistic acceptance of the acoustic output, for example, the words "... on Highway 4620" and the words "... on Highway 4602" for the first sentence the acoustic output "Highway four-six-twenty" and for the second sentence "four-six-zero-two".

Claims

Patentansprüche claims
1. Verfahren zum Betrieb eines elektronischen Assistenzsystems mit Sprachausgabe mit folgenden Verfahrensschritten: a) Berechnung zumindest einer Anweisung für den Benutzer, wobei die Anweisung zumindest eine Zahlenangabe enthält, und wobei die Zahlenangabe durch eine mehrstellige Ziffernfolge definiert ist, b) akustische Ausgabe der Anweisung an einer Ausgabeeinrichtung, dadurch gekennzeichnet, dass der Kontext der Zahlenangabe in der Anweisung analysiert wird, wobei die Zahlenangabe abhängig vom Ergebnis der Kontextanalyse bei der akustischen Ausgabe der Anweisung kontextabhängig entweder als a) zusammenhängendes Zahlenwort oder b) als Wortfolge mit mehreren Ziffernworten oder c) als Kombination aus zumindest einem zusammenhängenden Zahlenwort und zumindest einer Wortfolge mit zumindest einem Ziffernwort ausgegeben wird.1. A method for operating an electronic assistance system with speech output comprising the following steps: a) calculation of at least one instruction for the user, wherein the statement contains at least one number, and wherein the number is defined by a multi-digit number, b) acoustic output of the instruction an output device, characterized in that the context of the number is analyzed in the statement, the number depending on the result of the context analysis in the acoustic output of the statement context dependent either as a) contiguous number word or b) as a word sequence with multiple numerical words or c) as Combination of at least one contiguous number word and at least one word sequence is output with at least one digit word.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in der Kontextanalyse die für die akustische Ausgabe der Anweisung voreingestellte Sprache als Analyseparameter berücksichtigt wird. 2. Method according to claim 1, characterized in that in the context analysis the language preset for the acoustic output of the instruction is taken into account as analysis parameter.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in der Kontextanalyse analysiert wird, ob die Zahlenangabe in der Anweisung - die Angabe einer Distanz oder3. The method according to claim 1 or 2, characterized in that it is analyzed in the context analysis, whether the number specified in the statement - the indication of a distance or
- die Angabe einer nummerierten Straße oder- the indication of a numbered street or
- die Angabe einer Zahlenangabe in einem Straßennamen oderthe indication of a number in a street name or
- die Angabe einer Hausnummer oder- the indication of a house number or
- die Angabe einer Postleitzahl oder - die Angabe einer Telefonnummer oder- the indication of a postal code or - the indication of a telephone number or
- die Angabe von Öffnungszeiten oder- the indication of opening hours or
- die Angabe von Befahrbarkeitszeiten oder- the indication of passable times or
- die Angabe von Bewertungsmerkmalen betrifft.- concerns the indication of valuation features.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass in der Kontextanalyse analysiert wird, ob die Zahlenangabe Nullen enthält, wobei die akustische Anweisung abhängig von der Stellung der Null in der Zahlenangabe und/oder abhängig vom Kontext der Zahlenangabe und/oder abhängig von der voreingestellten Sprache jeweils unterschiedlich ausgegeben wird.4. The method according to any one of claims 1 to 3, characterized in that it is analyzed in the context analysis, whether the number contains zeros, the acoustic instruction depending on the position of the zero in the numerical value and / or depending on the context of the number and / / or is output differently depending on the preset language.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass für die akustische Ausgabe der Anweisung mehrere in einem Speicher gespeicherte, gesprochene Wortelemente miteinander kombiniert werden. 5. The method according to any one of claims 1 to 4, characterized in that for the acoustic output of the instruction a plurality of stored in a memory, spoken word elements are combined.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass für die akustische Ausgabe der Anweisung die dafür notwendigen gesprochenen Wortelemente in einem Sprachsynthesemodul syn- thetisiert werden.6. The method according to any one of claims 1 to 5, characterized in that for the acoustic output of the instruction the necessary spoken word elements are synthesized in a speech synthesis module.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das elektronische Assistenzsystem ein Navigationssystem ist.7. The method according to any one of claims 1 to 6, characterized in that the electronic assistance system is a navigation system.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Anweisung eine Manöveranweisung des Navigationssystems ist, die Informationen für den Benutzer zum Befahren einer Route enthält. 8. The method according to claim 7, characterized in that the instruction is a maneuvering instruction of the navigation system, which contains information for the user to drive on a route.
PCT/DE2009/000502 2008-04-21 2009-04-20 Method for operating an electronic assistance system WO2009129775A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102008019967A DE102008019967A1 (en) 2008-04-21 2008-04-21 Method for operating an electronic assistance system
DE102008019967.2 2008-04-21

Publications (1)

Publication Number Publication Date
WO2009129775A1 true WO2009129775A1 (en) 2009-10-29

Family

ID=40848281

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2009/000502 WO2009129775A1 (en) 2008-04-21 2009-04-20 Method for operating an electronic assistance system

Country Status (2)

Country Link
DE (1) DE102008019967A1 (en)
WO (1) WO2009129775A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212474B1 (en) * 1998-11-19 2001-04-03 Navigation Technologies Corporation System and method for providing route guidance with a navigation application program
EP1327974A2 (en) * 2002-01-09 2003-07-16 Openwave Systems Inc. System and method for providing locale-specific interpretation of text data
EP1801709A1 (en) * 2005-12-23 2007-06-27 Harman Becker Automotive Systems GmbH Speech generating system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1241600A1 (en) * 2001-03-13 2002-09-18 Siemens Schweiz AG Method and communication system for the generation of responses to questions
US7558732B2 (en) * 2002-09-23 2009-07-07 Infineon Technologies Ag Method and system for computer-aided speech synthesis
US7360155B2 (en) * 2003-01-14 2008-04-15 Oracle International Corp. Structured datatype expansion framework

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212474B1 (en) * 1998-11-19 2001-04-03 Navigation Technologies Corporation System and method for providing route guidance with a navigation application program
EP1327974A2 (en) * 2002-01-09 2003-07-16 Openwave Systems Inc. System and method for providing locale-specific interpretation of text data
EP1801709A1 (en) * 2005-12-23 2007-06-27 Harman Becker Automotive Systems GmbH Speech generating system

Also Published As

Publication number Publication date
DE102008019967A1 (en) 2009-11-26

Similar Documents

Publication Publication Date Title
DE60032193T2 (en) Method and system for selecting recognized words when correcting recognized speech
EP1031456B1 (en) Procedure and device to support a motor vehicle user when operating vehicle components
DE102006039126A1 (en) Method for speech recognition and speech reproduction
EP1793371A2 (en) Speech recognition method
DE102005030380B4 (en) Method for determining a list of hypotheses from a vocabulary of a speech recognition system
DE2946856C2 (en) Word storage device
DE102006036338A1 (en) Method for generating a context-based speech dialog output in a speech dialogue system
EP1282897B1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
EP1121684B1 (en) Method and device for information and/or messages by means of speech
EP0725382B1 (en) Method and device providing digitally coded traffic information by synthetically generated speech
EP1184838B1 (en) Phonetic transcription for speech synthesis
WO2009129775A1 (en) Method for operating an electronic assistance system
EP1038293B1 (en) Method for voice recognition using a grammar
EP0834859B1 (en) Method for determining an acoustic model for a word
EP3665619B1 (en) Method and device for generating vocal announcements based on handwritten user input and vehicle comprising said device
DE10253786B4 (en) Method for the computer-aided determination of a similarity of an electronically registered first identifier to at least one electronically detected second identifier as well as apparatus and computer program for carrying out the same
WO2004029929A1 (en) Method for computer-aided speech synthesis of a stored electronic text into an analog speech signal, speech synthesis device and telecommunication apparatus
EP2592623A2 (en) Technique for outputting an acoustic signal by means of a navigation system
DE102004048348B4 (en) Method for adapting and / or generating statistical language models
DE102016004287A1 (en) Method for speech recognition in a motor vehicle
DE102013219828B4 (en) Method for phonetizing text-containing data records with multiple data record parts and voice-controlled user interface
DE102013019208A1 (en) Motor vehicle voice control
DE102017011567A1 (en) Method and device for correcting a natural speech output by means of an artificial speech system in a vehicle
DE10324425B4 (en) Method for preparing acoustic driving instructions and navigation terminal thereto
DE102006041066A1 (en) Method and device for shortened input of characters

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09734117

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 09734117

Country of ref document: EP

Kind code of ref document: A1