DE102019219406A1 - CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM - Google Patents

CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM Download PDF

Info

Publication number
DE102019219406A1
DE102019219406A1 DE102019219406.0A DE102019219406A DE102019219406A1 DE 102019219406 A1 DE102019219406 A1 DE 102019219406A1 DE 102019219406 A DE102019219406 A DE 102019219406A DE 102019219406 A1 DE102019219406 A1 DE 102019219406A1
Authority
DE
Germany
Prior art keywords
dialog
attributes
properties
input
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102019219406.0A
Other languages
German (de)
Inventor
Daniel Bär
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Continental Automotive GmbH
Original Assignee
Continental Automotive GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Automotive GmbH filed Critical Continental Automotive GmbH
Priority to DE102019219406.0A priority Critical patent/DE102019219406A1/en
Publication of DE102019219406A1 publication Critical patent/DE102019219406A1/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

Ein zum Empfangen einer Dialogeingabe eingerichtetes Dialogsystem (100) ist dazu eingerichtet, zumindest eine Absicht in der Dialogeingabe zu identifizieren (206), und ein damit in einer standardisierten Wissensmodellierung verknüpftes Objekt oder eine Objektklasse zu ermitteln. Das Dialogsystem (100) sucht (214) in einem Speicher oder einer Datenbank (116), in welcher von einer Vorrichtung (118) erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems (100) als Eigenschaften oder Attribute von Objekten oder Objektklassen der standardisierten Wissensmodellierung abrufbar bereitgestellt sind, nach Eigenschaften oder Attributen zu den Objekten oder Objektklassen, für die in der Dialogeingabe keine solchen Eigenschaften oder Attribute enthalten sind, erstellt (222) eine Dialogantwort basierend auf der identifizierten Absicht, des mindestens einen Objekts oder der Objektklasse und der dazugehörigen Eigenschaften oder Attribute, und gibt die Dialogantwort aus (224).A dialog system (100) set up to receive a dialog input is set up to identify at least one intention in the dialog input (206) and to determine an object or an object class linked to it in a standardized knowledge modeling. The dialogue system (100) searches (214) in a memory or a database (116) in which status information or states of a spatial and / or temporal environment of a user of the dialogue system (100) recorded or controlled by a device (118) are used as Properties or attributes of objects or object classes of the standardized knowledge modeling are provided in a retrievable manner, according to properties or attributes of the objects or object classes for which no such properties or attributes are contained in the dialog input, creates (222) a dialog response based on the identified intention of the at least one object or the object class and the associated properties or attributes, and outputs the dialog response (224).

Description

FELDFIELD

Die vorliegende Erfindung betrifft Sprachdialogsysteme, insbesondere solche zur Verwendung in kontextreichen definierten Umgebungen.The present invention relates to speech dialog systems, particularly those for use in high-context defined environments.

HINTERGRUNDBACKGROUND

Mit der zunehmenden Verbreitung von Frage-Antwort-Technologien wie Chatbots, digitalen persönlichen Assistenten, Sprachdialogsystemen, smarten Lautsprechern und dergleichen interagieren die Nutzer von Computergeräten zunehmend mit ihren Computern unter Verwendung natürlicher Sprache.With the increasing spread of question-and-answer technologies such as chatbots, digital personal assistants, speech dialog systems, smart speakers and the like, the users of computer devices increasingly interact with their computers using natural language.

So können Benutzer bspw. über einen in einem Smartphone implementierten digitalen persönlichen Assistenten Termine und Erinnerungen per Sprachbefehl einstellen, oder in einem Smart-Home das Licht oder andere elektrische Verbraucher per Sprachbefehl steuern. In Kraftfahrzeugen sind ebenfalls zunehmend Funktionen per Sprachbefehl steuerbar.For example, users can use a digital personal assistant implemented in a smartphone to set appointments and reminders by voice command, or control the light or other electrical loads in a smart home by voice command. In motor vehicles, functions are also increasingly controllable by voice command.

Auch bei der Suche nach Informationen verwenden Benutzer zunehmend die Konversationssuche anstelle herkömmlicher Suchmethoden, die die Eingabe von Schlüsselwörtern erfordern. In einer Konversationssuche kann ein Benutzer eine Frage oder Abfrage so formulieren, dass die Absicht des Benutzers explizit definiert wird. Zum Beispiel kann ein Benutzer fragen: „Wie lautet die Wettervorhersage für heute in Berlin?“ In dieser Frage gibt es weder Unklarheiten bei der Identifizierung der relevanten Objekte bzw. Inhalte „Wettervorhersage“, „heute“, „Berlin“, noch beim Verständnis der Absicht hinter der Frage.Also, when searching for information, users are increasingly turning to conversational search instead of traditional search methods that require the entry of keywords. In a conversational search, a user can phrase a question or query in such a way that the intent of the user is explicitly defined. For example, a user can ask: "What is the weather forecast for today in Berlin?" In this question, there is no ambiguity in identifying the relevant objects or content "weather forecast", "today", "Berlin", or in understanding the Intent behind the question.

Alternativ kann die Frage eines Benutzers kontextabhängig sein, wobei der Benutzer eine Frage so stellt, dass Kontextinformationen benötigt werden, um die Absicht des Benutzers abzuleiten. Zum Beispiel kann ein Benutzer versuchen mit nur einer begrenzten begrenzte Anzahl von Begriffen Informationen über ein Thema zu finden. Das Dialogsystem ist dann gefordert, die Absicht hinter der Frage des Benutzers zu verstehen und unter Verwendung von Datenbanken oder Suchmaschinen zu versuchen, Webseiten oder andere Ergebnisse als Antwort zu finden. Beispielsweise kann ein Benutzer das Dialogsystem fragen: „Wird es morgen regnen?“ In diesem Beispiel muss das System, das die Abfrage empfängt, möglicherweise Kontextinformationen verwenden, wie beispielsweise den aktuellen Standort des Benutzers oder Einträge in einem Terminplan, die einen anderen Ort nahelegen, um die Absicht des Benutzers zu verstehen.Alternatively, a user's question may be contextual, with the user asking a question in such a way that context information is needed to infer the user's intent. For example, a user can try to find information on a topic using only a limited number of terms. The dialogue system is then required to understand the intention behind the user's question and to try to find web pages or other results as an answer using databases or search engines. For example, a user can ask the dialog system: "Will it rain tomorrow?" In this example, the system receiving the query may need to use contextual information, such as the current location of the user or entries in a schedule that suggest a different location. to understand the intent of the user.

Als weiteres Beispiel kann ein Benutzer eine Frage stellen, die ein unbestimmtes Pronomen enthält, das sich auf ein oder mehrere in der Anfrage nicht spezifizierte Objekte, Wesen oder Orte bezieht, und die Entität, auf die sich das unbestimmte Pronomen bezieht, kann in einer aktuellen Abfrage nicht angegeben werden, kann aber in einer vorhergehenden Abfrage oder Antwort erwähnt worden sein. Zum Beispiel kann ein Benutzer fragen: „Wer hat gestern in der Champions League gespielt“, worauf das Dialogsystem zwei Mannschaften nennt, gefolgt von „Wer hat gewonnen“, wodurch der Benutzer wissen möchte, „wer hat gestern in dem Champions League Spiel gewonnen“. Menschen sind in der Regel in der Lage sich auf kontextuelle Informationen zu beziehen, die bereits erwähnt wurden. Suchmaschinen oder andere Dialogsysteme haben jedoch bislang Schwierigkeiten, einen richtigen Kontext zu einer Anfrage zu bestimmen oder auszuwählen und behandeln jede Anfrage häufig so, als ob sie nicht mit vorherigen Anfragen verbunden wäre.As another example, a user may ask a question that contains an indefinite pronoun that refers to one or more objects, beings, or locations unspecified in the query, and the entity to which the indefinite pronoun refers can be in a current Query not specified, but may have been mentioned in a previous query or response. For example, a user can ask: "Who played in the Champions League yesterday", whereupon the dialogue system names two teams, followed by "Who won", whereby the user wants to know "who won the Champions League game yesterday" . People are usually able to relate to contextual information that has already been mentioned. However, search engines or other dialogue systems have so far had difficulties in determining or selecting a correct context for a query and often treat each query as if it were not connected to previous queries.

Heute verfügbare Dialogsysteme werden üblicherweise mit Hilfe beispielhafter Äußerungen trainiert. Diese Äußerungen werden hierbei um Annotationen angereichert die angeben, welchen Zweck sie erfüllen, sog. „Intents“, welche bedeutungstragenden Elemente oder „Entities“ sie enthalten und wie diese Elemente auf die relevanten Felder abgebildet werden, die auch als „Slots“ bezeichnet werden. Für die beispielhafte Äußerung „Suche ein italienisches Restaurant“ ist der Zweck eine Restaurantsuche oder „restaurant-search“. Das bedeutungstragende Element, die Entity, ist das Wort „italienisches“, was auf den Slot bzw. das relevante Feld „cuisine“ (Küche) abgebildet wird.Dialog systems available today are usually trained with the help of exemplary utterances. These utterances are enriched with annotations that indicate what purpose they fulfill, so-called "intents", which meaningful elements or "entities" they contain and how these elements are mapped to the relevant fields, which are also known as "slots". For the exemplary utterance “looking for an Italian restaurant”, the purpose is a restaurant search or “restaurant search”. The meaningful element, the entity, is the word "Italian", which is shown on the slot or the relevant field "cuisine".

Nachteil des konventionellen Vorgehens ist das isolierte Betrachten von explizit getätigten Sprachäußerungen. Nur solche Inhalte, die der Nutzer bisher bereits geäußert hat, werden vom Sprachdialogsystem berücksichtigt. Andere Informationen, welche die Annotationen ohne Zutun des Benutzers weiter anreichern, die Qualität der Anfrage und so auch die Qualität der Antwort verbessern können, werden bislang nicht oder nur ungenügend genutzt. Dies liegt unter anderem daran, dass jedes Sprachdialogsystem von dem jeweiligen Anbieter individuell designt wird, wobei jeder Anbieter eine eigene, begrenzte und statische Auswahl von möglichen Intents, Entities und Slots trifft. Die Anreicherung der Dialoganfrage durch zeitliche und räumliche Kontextinformationen ist entsprechend davon abhängig, ob ein Anbieter eines Dialogsystems eine passende Modellierung eines gegenwärtigen Kontexts sowie Zugriff auf entsprechende Informationen zur Verfügung stellen kann.The disadvantage of the conventional approach is the isolated observation of explicitly made utterances. Only content that the user has already expressed is taken into account by the speech dialogue system. Other information, which can further enrich the annotations without any action on the part of the user, improve the quality of the query and thus also the quality of the response, has so far not been used or has only been used insufficiently. One of the reasons for this is that each speech dialogue system is individually designed by the respective provider, with each provider making its own, limited and static selection of possible intents, entities and slots. The enrichment of the dialog request with temporal and spatial context information depends accordingly on whether a provider of a dialog system can provide suitable modeling of a current context and access to corresponding information.

Es ist leicht erkennbar, dass Dialogsysteme, welche bei jeder Anfrage oder bei jeder Aufforderung zur Steuerung von Funktionen vollständige Sätze an Informationen benötigen, von Benutzern wenig akzeptiert werden. Wenn ein System die Absicht eines Benutzers hinter einer Frage oder einer Äußerung zur Steuerung einer Funktion nicht verstehen kann, muss der Benutzer eine Frage möglicherweise auf andere Weise erneut stellen, um dann eventuell die gewünschte Antwort zu erhalten. Dies ist für den Benutzer ineffizient.It is easy to see that dialogue systems, which with each request or with each request to control functions require complete sets of information that are rarely accepted by users. If a system cannot understand a user's intention behind a question or utterance to control a function, the user may need to re-ask a question in another way in order to get the desired answer. This is inefficient for the user.

Es ist daher eine Aufgabe der vorliegenden Erfindung ein verbessertes Dialogsystem und Verfahren zur Steuerung desselben vorzuschlagen, das insbesondere die Notwendigkeit der Eingabe oder Wiederholung von für einen Benutzer offensichtlichen Kontextinformationen reduziert.It is therefore an object of the present invention to propose an improved dialog system and method for controlling the same, which in particular reduces the need to input or repeat context information that is obvious to a user.

BESCHREIBUNGDESCRIPTION

Ein solches Dialogsystem ist in Anspruch 1 vorgeschlagen, ein entsprechendes Verfahren ist in Anspruch 6 vorgeschlagen. Ausgestaltungen oder Weiterentwicklungen sind in den jeweiligen abhängigen Ansprüchen angegeben. Such a dialog system is proposed in claim 1 and a corresponding method is proposed in claim 6. Refinements or further developments are specified in the respective dependent claims.

In der folgenden Beschreibung werden die Begriffe Dialogeingabe, Frage, Abfrage, Anfrage oder Query synonym verwendet, wenn sich aus dem Kontext keine abweichende Bedeutung ergibt. Diese Begriffe beziehen sich dabei nicht ausschließlich auf Fragen, sondern sollen auch Äußerungen eines Benutzers umfassen, welche der Steuerung von Funktionen oder Geräten dienen. Die vorliegende Erfindung kann gleichermaßen für Sprachdialogsysteme wie textbasierte Dialogsysteme angewendet werden. Im Folgenden werden entsprechend die Begriffe Dialogsystem und Sprachdialogsystem synonym verwendet, wenn sich aus dem jeweiligen Kontext keine abweichende Bedeutung ergibt. Gleiches gilt für die Begriffe Eingabe oder Spracheingabe sowie Ausgabe oder Sprachausgabe. Sofern in der vorliegenden Beschreibung auf unterschiedliche Schnittstellen Bezug genommen wird können damit separate physikalische Schnittstellen gemeint sein, aber auch separate logische Schnittstellen, oder Ports, welche derselben physikalischen Schnittstelle zugeordnet sind.In the following description, the terms dialog input, question, query, inquiry or query are used synonymously, if the context does not result in a different meaning. These terms do not relate exclusively to questions, but are also intended to include statements by a user that are used to control functions or devices. The present invention can be used equally for speech dialogue systems as well as text-based dialogue systems. In the following, the terms dialogue system and speech dialogue system are used synonymously if the respective context does not result in a different meaning. The same applies to the terms input or voice input and output or voice output. If reference is made to different interfaces in the present description, this can mean separate physical interfaces, but also separate logical interfaces or ports which are assigned to the same physical interface.

Ein erfindungsgemäßes Dialogsystem umfasst eine erste Vorrichtung zum Empfangen einer Dialogeingabe, eine zweite Vorrichtung zur Ausgabe einer Dialogantwort, eine Prozessoreinheit und flüchtigen und/oder nichtflüchtigen Speicher. Das Dialogsystem umfasst außerdem eine erste Schnittstelle zur Datenkommunikation mit einem Speicher bzw. einer Datenbank, in welchem bzw. in welcher von einer dritten Vorrichtung erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems als Eigenschaften oder Attribute von Objekten oder Objektklassen einer standardisierten Wissensmodellierung in einer Datenbank abrufbar bereitgestellt sind.A dialog system according to the invention comprises a first device for receiving a dialog input, a second device for outputting a dialog response, a processor unit and volatile and / or non-volatile memory. The dialog system also includes a first interface for data communication with a memory or a database in which or in which state information or states of a spatial and / or temporal environment of a user of the dialog system as properties or attributes captured or controlled by a third device of objects or object classes of a standardized knowledge modeling are made available in a database so that they can be called up.

Zustände des räumlichen Umfelds können bspw. durch Sensordaten oder Zustandsdaten von Aktuatoren und anderen Vorrichtungen repräsentiert werden, aber auch transiente Erscheinungen wie zu einem Zeitpunkt oder während eines Zeitraums von einem Benutzer wahrnehmbare akustische oder visuelle Informationen umfassen. Die visuellen oder akustischen Informationen können über Kameras bzw. Mikrofone erfasst werden, es ist aber auch möglich zu den Informationen gehörende Metadaten zu empfangen. Ein Beispiel für akustische Informationen ist ein von einem Benutzer gehörtes Radioprogramm, für welches Metainformationen wie bspw. ein Titel einer Sendung oder ein Interpret eines Musikstücks verfügbar sind. Ein Beispiel für visuelle Information sind bspw. Bilddaten einer Umfeldkamera eines Fahrzeugs, welche andere Verkehrsteilnehmer oder ortsfeste Installationen erfasst und erkennt, die für das Führen des Fahrzeugs von Relevanz sind. Andere Zustände oder Zustandsinformationen können Betriebsmodi oder Parameter von Vorrichtungen und Einrichtungen im Umfeld des Benutzers betreffen, oder Umweltinformationen, oder dergleichen. Ein Zustand eines zeitlichen Umfelds kann bspw. eine in der Zukunft oder in der Vergangenheit liegende Information zu einem Aufenthaltsort oder zu einer Tätigkeit betreffen.States of the spatial environment can be represented, for example, by sensor data or state data from actuators and other devices, but also include transient phenomena such as acoustic or visual information that a user can perceive at a point in time or during a period of time. The visual or acoustic information can be recorded via cameras or microphones, but it is also possible to receive metadata belonging to the information. An example of acoustic information is a radio program heard by a user, for which meta information such as a title of a program or an artist of a piece of music is available. An example of visual information is, for example, image data from a camera around a vehicle, which records and recognizes other road users or fixed installations that are relevant for driving the vehicle. Other states or state information can relate to operating modes or parameters of devices and devices in the environment of the user, or environmental information, or the like. A state of a temporal environment can relate, for example, to information about a location or an activity that is in the future or in the past.

Der nichtflüchtige Speicher enthält von der Prozessoreinheit les- und ausführbare Programminstruktionen, welche das System dazu einrichten, eine Dialogeingabe zu empfangen, und darin zumindest eine Absicht zu identifizieren. Die Absicht kann bspw. eine Informationsanfrage darstellen, oder eine Aufforderung an eine von dem Dialogsystem steuerbare Vorrichtung oder dergleichen.The non-volatile memory contains program instructions that can be read and executed by the processor unit, which set up the system to receive dialog input and to identify at least one intention therein. The intention can, for example, represent a request for information, or a request to a device controllable by the dialog system or the like.

Das Empfangen der Dialogeingabe kann das Empfangen einer Spracheingabe oder einer Texteingabe umfassen. Entsprechend kann die erste Vorrichtung ein Mikrofon oder eine Tastatur umfassen.Receiving the dialog input can include receiving a voice input or a text input. Correspondingly, the first device can comprise a microphone or a keyboard.

Identifizierbare Absichten können mit einem oder mehreren Objekten oder einer oder mehreren Objektklassen der standardisierten Wissensmodellierung verknüpft sein. Die standardisierte Wissensmodellierung kann als Wissensgraph oder strukturierte Datenbank vorliegen und stellt einen Grundpfeiler des „Semantic Web“ dar. Bekannte Beispiele für standardisierte Wissensmodellierungen sind Wikidata, DBpedia, Freebase oder YAGO.Identifiable intentions can be linked to one or more objects or one or more object classes of the standardized knowledge modeling. The standardized knowledge modeling can be present as a knowledge graph or a structured database and represents a cornerstone of the “Semantic Web”. Well-known examples of standardized knowledge modeling are Wikidata, DBpedia, Freebase or YAGO.

Die Programminstruktionen richten das Dialogsystem außerdem dazu ein, mögliche, mit der identifizierten Absicht in der standardisierten Wissensmodellierung verknüpfte Objekte oder Objektklassen zu ermitteln.The program instructions also set up the dialog system to determine possible objects or object classes linked to the identified intention in the standardized knowledge modeling.

Die Programminstruktionen richten das Dialogsystem ferner dazu ein, den Kontext der Dialogeingabe nach Eigenschaften oder Attributen zu durchsuchen, welche zu den ermittelten Objekten oder Objektklassen passen. Der Kontext umfasst insbesondere in einem vorhergehenden Zeitraum getätigte Äußerungen und ggf. Reaktionen darauf, sowie in dem vorhergehenden Zeitraum ermittelte Verknüpfungen mit Objekten oder Objektklassen einer Wissensmodellierung. Falls nicht für jedes der ermittelten Objekte oder Objektklassen passende Eigenschaften oder Attribute in der Dialogeingabe gefunden werden - oder falls, etwa durch vorgegebene Regeln, eine Aktualisierung solcher Eigenschaften oder Attribute durchgeführt werden soll - wird durch die Programminstruktionen für diejenigen Objekte oder Objektklassen eine Suche nach Eigenschaften oder Attributen in der Datenbank ausgelöst, für die in der Dialogeingabe keine passenden Informationen gefunden wurden bzw. die aktualisiert werden sollten. Die aus der Datenbank abrufbaren Eigenschaften oder Attribute beziehen sich dabei vorzugsweise auf innerhalb eines mindestens den Zeitpunkt des Beginns der Dialogeingabe einschließenden, in die Vergangenheit reichenden Zeitfensters von der dritten Vorrichtung erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände des räumlichen und/oder zeitlichen Umfelds des Benutzers des Dialogsystems. Das Zeitfenster kann für unterschiedliche Objekte oder Objektklassen unterschiedlich sein, abhängig davon, ob und wie schnell sich eine Eigenschaft oder ein Attribut des betreffenden Objekts oder der Objektklasse ändert. Es kann jedoch in den meisten Fällen davon ausgegangen werden, dass ein für die Dialogeingabe relevanter Zustand zumindest zum Zeitpunkt der Dialogeingabe gegenwärtig war, so dass für diesen Zeitpunkt gültige Informationen in jedem Fall aus der Datenbank abrufbar sein sollten. Inwiefern und wie weit zurückreichend frühere Zustände ebenfalls aus der Datenbank abrufbar sein können hängt u.a. von dem zur Verfügung stehenden Speicherplatz und Entscheidungen eines Umsetzenden ab, aber auch von dem Inhalt des Dialogs. Wenn der Benutzer z.B. eine zuvor geäußerte Dialogeingabe mit gleicher identifizierbarer Absicht wiederholt, und auf die vorherige Dialogeingabe bereits eine Reaktion erfolgt ist, kann davon ausgegangen werden, dass zumindest Teile des Inhalts des vorherigen Dialogs nicht mehr relevant sind. In diesem Fall kann es angebracht sein, die Datenbank nach geänderten Eigenschaften oder Attributen zu durchsuchen. Wenn z.B. der Benutzer eine auf ein Musikstück gerichtete zuvor geäußerte Dialogeingabe mit gleicher identifizierbarer Absicht wiederholt, auf die bereits eine Reaktion erfolgt ist, sich aber in der Zwischenzeit das Musikstück geändert hat, kann davon ausgegangen werden, dass der vorherige Dialog abgeschlossen ist und ein neuer Dialog beginnt. Andererseits kann bspw. bei einem auf ein im Radio gespieltes Musikstück bezogenen Dialog eine Aktualisierung der Information über einen anschließend gespieltes Musikstück dann unpassend sein, wenn der ursprüngliche Dialog noch nicht beendet ist, d.h. wenn weitere Dialogeingaben sich erkennbar auf den zuvor begonnenen Dialog beziehen.The program instructions also set up the dialog system to search the context of the dialog input for properties or attributes that match the objects or object classes determined. The context includes, in particular, utterances made in a previous time period and, if applicable, reactions to them, as well as links with objects or object classes of knowledge modeling determined in the previous time period. If suitable properties or attributes are not found in the dialog input for each of the determined objects or object classes - or if such properties or attributes are to be updated, for example due to specified rules - the program instructions for those objects or object classes are used to search for properties or attributes are triggered in the database for which no suitable information was found in the dialog input or which should be updated. The properties or attributes retrievable from the database preferably relate to status information or statuses of the spatial and / or temporal environment of the user recorded or controlled by the third device within a time window that includes at least the time of the beginning of the dialog input and extends into the past of the dialogue system. The time window can be different for different objects or object classes, depending on whether and how quickly a property or an attribute of the object or object class in question changes. In most cases, however, it can be assumed that a state relevant for the dialog input was present at least at the time of the dialog input, so that information valid for this time should always be retrievable from the database. To what extent and how far back previous states can also be retrieved from the database depends, among other things, on the available storage space and decisions made by an implementer, but also on the content of the dialog. If, for example, the user repeats a previously expressed dialog input with the same identifiable intention, and a reaction has already taken place to the previous dialog input, it can be assumed that at least parts of the content of the previous dialog are no longer relevant. In this case it may be appropriate to search the database for changed properties or attributes. If, for example, the user repeats a previously uttered dialogue input directed towards a piece of music with the same identifiable intention, to which a reaction has already taken place, but the piece of music has changed in the meantime, it can be assumed that the previous dialogue has been completed and a new one Dialogue begins. On the other hand, in the case of a dialogue relating to a piece of music played on the radio, for example, an update of the information about a piece of music that is subsequently played may be unsuitable if the original dialogue has not yet ended, i.e. if further dialogue entries clearly relate to the dialogue that was started previously.

Die Programminstruktionen richten das Dialogsystem außerdem dazu ein, basierend auf der identifizierten Absicht und der dazugehörigen Eigenschaften oder Attribute eine Dialogantwort zu erstellen, und die Dialogantwort auszugeben.The program instructions also set up the dialog system to create a dialog response based on the identified intention and the associated properties or attributes, and to output the dialog response.

Das Erstellen der Dialogantwort kann das Senden einer Anfrage zu der identifizierten Absicht, dem mindestens einen Objekt oder der Objektklasse und den zugehörigen Eigenschaften oder Attributen an eine Datenbank oder eine Internet-Suchmaschine umfassen.The creation of the dialog response can include sending a request to the identified intention, the at least one object or the object class and the associated properties or attributes to a database or an Internet search engine.

Das Ausgeben der Dialogantwort kann eine akustische und/oder visuelle Ausgabe oder eine Ausgabe eines Steuersignals umfassen. Entsprechend kann die zweite Vorrichtung einen Lautsprecher, einen Bildschirm und/oder eine Steuervorrichtung aufweisen. Die Steuervorrichtung kann das Steuersignal einem Aktuator einer im räumlichen Umfeld gelegenen weiteren Vorrichtung zuführen, deren Reaktion auf das Steuersignal von dem Benutzer sensorisch wahrnehmbar ist. Bei Ausführungen des Dialogsystems kann die Steuervorrichtung kann auch dazu eingerichtet sein, ein Steuersignal einem nicht im unmittelbaren räumlichen Umfeld des Benutzers gelegenen Aktuator oder einer anderen Vorrichtung zuzuführen. In diesem Fall kann die Steuervorrichtung dazu eingerichtet sein, ein Bestätigungssignal von dem Aktuator oder der anderen Vorrichtung bzw. einer in deren Umfeld angeordneten Überwachungseinrichtung zu empfangen und in eine Dialogantwort zu übersetzen. The output of the dialogue response can include an acoustic and / or visual output or an output of a control signal. Correspondingly, the second device can have a loudspeaker, a screen and / or a control device. The control device can feed the control signal to an actuator of a further device located in the spatial environment, the reaction of which to the control signal can be sensed by the user. In the case of embodiments of the dialog system, the control device can also be set up to feed a control signal to an actuator or to another device that is not in the immediate spatial vicinity of the user. In this case, the control device can be set up to receive a confirmation signal from the actuator or the other device or a monitoring device arranged in the vicinity thereof and to translate it into a dialog response.

Ein erfindungsgemäßes Verfahren zur Steuerung eines Dialogsystems umfasst das Empfangen einer Dialogeingabe, und das Identifizieren einer Absicht in der Dialogeingabe. Dazu kann die Dialogeingabe bspw. nach bestimmten Schlüsselbegriffen durchsucht werden. Die Schlüsselbegriffe können insbesondere Frageworte wie „wann“, „wo“, „wer“ etc. enthalten, und können über einen damit verknüpfbaren weiteren Begriff eine Identifizierung der Absicht ermöglichen. Der weitere Begriff kann ebenfalls in der Dialogeingabe erkannt werden, aus vorhergehenden Dialogeingaben, aus einem räumlichen und/oder zeitlichen Kontext oder dergleichen.A method according to the invention for controlling a dialog system comprises receiving a dialog input and identifying an intention in the dialog input. For this purpose, the dialog input can be searched for certain key terms, for example. The key terms can in particular contain question words such as “when”, “where”, “who” etc., and can enable the intention to be identified via a further term that can be linked to them. The further term can also be recognized in the dialog input, from previous dialog inputs, from a spatial and / or temporal context or the like.

Das Verfahren umfasst außerdem das Ermitteln mindestens eines möglichen, mit der identifizierten Absicht in einer standardisierten Wissensmodellierung verknüpften Objekts oder einer Objektklasse. Die standardisierte Wissensmodellierung kann als Wissensgraph oder strukturierte Datenbank vorliegen, z.B. Wikidata, DBpedia, Freebase oder YAGO. Die Dialogeingabe wird anschließend nach Eigenschaften oder Attributen durchsucht, welche zu den ermittelten Objekten oder der Objektklassen passen. Falls nicht für jedes der ermittelten Objekte oder Objektklassen passende Eigenschaften oder Attribute in der Dialogeingabe gefunden wurden - oder falls, etwa durch vorgegebene Regeln, eine Aktualisierung solcher Eigenschaften oder Attribute durchgeführt werden soll - wird in einer Datenbank nach Eigenschaften oder Attributen für diejenigen Objekte oder Objektklassen gesucht, für die in der Dialogeingabe keine Eigenschaften oder Attribute in der Dialogeingabe gefunden wurden bzw. die aktualisiert werden sollten. Die aus der Datenbank abrufbaren Eigenschaften oder Attribute beziehen sich auf innerhalb eines mindestens den Zeitpunkt des Beginns der Dialogeingabe einschließenden, in die Vergangenheit reichenden Zeitfensters von einer Vorrichtung zur Generierung von Kontextinformationen erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände des räumlichen und/oder zeitlichen Umfelds des Benutzers des Dialogsystems.The method also includes determining at least one possible object or an object class that is linked to the identified intention in a standardized knowledge modeling. The standardized knowledge modeling can be in the form of a knowledge graph or a structured database, for example Wikidata, DBpedia, Freebase or YAGO. The dialog input is then searched for properties or attributes that match the objects or object classes that have been determined. If suitable properties or attributes were not found in the dialog input for each of the determined objects or object classes - or if such properties or attributes are to be updated, for example due to specified rules - a database searches for properties or attributes for those objects or object classes searched for for which no properties or attributes were found in the dialog input or which should be updated. The properties or attributes that can be called up from the database relate to state information or states of the spatial and / or temporal environment of the device for generating context information recorded or controlled within a time window that includes at least the time of the beginning of the dialog input and extends into the past User of the dialog system.

Basierend auf der identifizierten Absicht und den in der Dialogeingabe oder der Suche gefundenen Eigenschaften oder Attribute wird eine Dialogantwort erstellt und ausgegeben.Based on the identified intention and the properties or attributes found in the dialog input or the search, a dialog response is created and output.

Das Erstellen der Dialogantwort kann das Senden einer Anfrage zu der identifizierten Absicht und den Eigenschaften oder Attributen an eine Datenbank oder eine Internet-Suchmaschine umfassen.Generating the dialog response may include sending a query on the identified intent and properties or attributes to a database or an Internet search engine.

Eine Vorrichtung zur Generierung von Kontextinformationen für ein Dialogsystem umfasst eine Prozessoreinheit, flüchtigen und nichtflüchtigen Speicher, eine erste Schnittstelle zur Datenkommunikation mit einer Datenbank sowie mindestens eine zweite Schnittstelle zur Kommunikation mit Sensoren oder anderen Vorrichtungen, welche Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers erfassen bzw. steuern. Der nichtflüchtige Speicher enthält von der Prozessoreinheit les- und ausführbare Programminstruktionen, welche die Vorrichtung dazu einrichten, von den Sensoren oder anderen Vorrichtungen erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems als Eigenschaften oder Attribute von Objekten oder Objektklassen einer standardisierten Wissensmodellierung in der Datenbank abrufbar bereitzustellen.A device for generating context information for a dialog system comprises a processor unit, volatile and non-volatile memory, a first interface for data communication with a database and at least one second interface for communication with sensors or other devices, which state information or states of a spatial and / or temporal Capture or control the environment of a user. The non-volatile memory contains program instructions that can be read and executed by the processor unit, which set up the device to record or control status information or statuses of a spatial and / or temporal environment of a user of the dialog system as properties or attributes of objects or to provide object classes of standardized knowledge modeling in the database so that they can be called up.

Das vorstehend beschriebene Dialogsystem, das zugehörige Steuerverfahren und die Vorrichtung zur Generierung von Kontextinformationen können in besonders vorteilhafter Weise in kontextreichen Umgebungen genutzt werden, in denen eine Vielzahl von Informationen über Zustände von Vorrichtungen oder Systemen sowie weitere Umgebungsparameter über entsprechende Sensoren, Schnittstellen etc. verfügbar sind. Solche kontextreichen Umgebungen sind ein Fahrzeug, ein Smart-Home, eine digitale Fabrik oder dergleichen.The dialog system described above, the associated control method and the device for generating context information can be used in a particularly advantageous manner in context-rich environments in which a large amount of information about the states of devices or systems and other environmental parameters are available via corresponding sensors, interfaces, etc. . Such context-rich environments are a vehicle, a smart home, a digital factory or the like.

In einem beispielhaften Anwendungsfall hört ein Benutzer Musik des Musikers William Fitzsimmons über eine Audioanlage, welche Zusatzinformationen zu dem wiedergegebenen Programm bereitstellen kann. Diese Zusatzinformationen können z.B. bei Radiowiedergabe über einen UKW-Empfänger RDS-Daten umfassen, bei Wiedergabe von Audioinhalten über einen Streaming-Dienst als Metadaten in den empfangenen Daten enthalten sein, oder auf anderem Weg erhalten werden, bspw. über eine Abfrage eines Musikinformationsdienstes oder dergleichen.In an exemplary application, a user listens to music by the musician William Fitzsimmons via an audio system, which can provide additional information about the program being played. This additional information can include RDS data for radio playback via an FM receiver, for example, it can be contained in the received data as metadata when audio content is played back via a streaming service, or it can be obtained in another way, e.g. via a query from a music information service or the like .

Eine Vorrichtung zur Generierung von Kontextinformationen erfasst zyklisch oder kontinuierlich die zu der Musik verfügbaren. Außerdem erfasst die Vorrichtung laufend weitere Kontextinformationen, etwa Informationen zum aktuellen Wetter, eine Wettervorhersage und dergleichen, und speichert diese als Eigenschaften oder Attribute zu entsprechenden Objekten oder Objektklassen einer standardisierten Wissensdatenbank abrufbar in einem Speicher oder einer Datenbank.A device for generating context information cyclically or continuously records the information available for the music. In addition, the device continuously records further context information, such as information on the current weather, a weather forecast and the like, and stores this as properties or attributes for corresponding objects or object classes of a standardized knowledge database, which can be called up in a memory or a database.

Der Benutzer äußert während der Wiedergabe der Musik die Dialogeingabe „Wann ist das nächste Konzert?“. Das Dialogsystem analysiert die Dialogeingabe und versucht, eine Absicht des Benutzers zu identifizieren. Dabei helfen u.a. das Fragewort „wann“ und der weitere Begriff „Konzert“. Das Dialogsystem durchsucht die Dialogeingabe auf weitere Angaben, die bei der Beantwortung der Anfrage hilfreich sein können, findet jedoch keine.While the music is playing, the user utters the dialogue input “When is the next concert?”. The dialog system analyzes the dialog input and tries to identify an intention of the user. Among other things, the question word "when" and the further term "concert" help. The dialog system searches the dialog input for further information that may be helpful in answering the request, but does not find any.

Daher durchsucht das Dialogsystem nun eine Datenbank mit Kontextinformationen, die möglicherweise für die Beantwortung der Anfrage nützliche Informationen liefern kann. Dazu nutzt das Dialogsystem den in einer standardisierten Wissensdatenbank als Objekt oder englisch „entity“ enthaltenen Begriff „Konzert“, der bspw. in der wikidata.org-Datenbank unter der Referenz Q182832 geführt ist. Zu diesem Eintrag ist in der Wissensdatenbank über weitere Zwischenverknüpfungen schließlich ein Eintrag für die Klasse „Musiker“ („musician“) mit der Referenz Q639669 verknüpft. Die Datenbank mit Kontextinformationen enthält zu den Zwischenverknüpfungen der Wissensdatenbank keine Einträge, jedoch hat die Vorrichtung zur Generierung von Kontextinformationen zu der zum Zeitpunkt der Dialoganfrage wiedergegebenen Musik einen Eintrag für die Referenz Q639669 in der Datenbank mit Kontextinformationen gespeichert. Dieser Eintrag wird nun als Kontextinformation genutzt, um eine Anfrage an eine Internet-Suchmaschine zu stellen mit dem Inhalt „Konzert - William Fitzsimmons“. Das von der Internet-Suchmaschine gefundene Ergebnis wird als Dialogantwort ausgegeben.Therefore, the dialog system now searches a database with context information that can possibly provide useful information for answering the request. For this purpose, the dialogue system uses the term “concert” contained in a standardized knowledge database as an object or English “entity”, which is listed, for example, in the wikidata.org database under the reference Q182832. Finally, an entry for the class “musician” with reference Q639669 is linked to this entry in the knowledge database via further intermediate links. The database with context information does not contain any entries for the intermediate links of the knowledge database, but the device for generating context information for the music played at the time of the dialogue request has stored an entry for the reference Q639669 in the database with context information. This entry is now used as context information to send a query to an Internet search engine with the content " Concert - William Fitzsimmons ”. The result found by the Internet search engine is output as a dialog response.

In einem anderen beispielhaften Anwendungsfall ist die kontextreiche Umgebung ein Fahrzeug, das Thermometer zur Messung der Innen- und Außentemperatur hat. Wenn der Benutzer nun ohne vorherige Interaktion mit dem Dialogsystem die Frage „Wieviel Grad sind es?“ stellt, enthält die Dialogeingabe nur das Fragewort „Wieviel“ und den weiteren Begriff „Grad“. In der standardisierten Wissensmodellierung ist das Objekt „Grad“ unter der Referenz Q25267 eingetragen und mit der physikalischen Größe Temperatur (Referenz Q11466) verbunden. Eine bloße Suche in einer Internet-Suchmaschine würde nicht unbedingt sinnvolle Ergebnisse produzieren, alleine schon wegen der fehlenden Ortsangabe. Das Dialogsystem findet aber in der Datenbank mit Kontextinformationen Einträge zur Innen- und Außentemperatur unter der Referenz Q11466 und kann diese Informationen zum Erstellen einer Dialogantwort nutzen, die mit einiger Wahrscheinlichkeit die Frage des Benutzers zufriedenstellend beantwortet.In another exemplary use case, the context rich environment is a vehicle that has thermometers to measure indoor and outdoor temperatures. If the user asks the question "How many degrees are there?" Without prior interaction with the dialog system, the dialog input only contains the question word "How many" and the additional term "Degree". In the standardized knowledge modeling, the "Degree" object is entered under reference Q25267 and linked to the physical variable temperature (reference Q11466). A mere search in an Internet search engine would not necessarily produce meaningful results, if only because of the missing location. However, the dialog system finds entries on the inside and outside temperature in the database with context information under the reference Q11466 and can use this information to create a dialog response that with some probability provides a satisfactory answer to the user's question.

Die zyklische oder kontinuierliche Speicherung von Kontextinformationen als referenzierbare Objekte oder Objektklassen einer oder mehrerer standardisierter Wissensmodellierungen durch die Vorrichtung zur Generierung von Kontextinformationen ermöglicht dem Dialogsystem eine weitreichende Ergänzung auch scheinbar unvollständiger Dialogeingaben eines Benutzers, so dass Nachfragen zur Ergänzung der Dialogeingabe seltener erfolgen müssen. Durch die natürlichere Dialogführung aufgrund der durch das Dialogsystem selbsttätig bezogenen Kontextinformation wird die Akzeptanz des Dialogsystems seitens des Benutzers erheblich gesteigert.The cyclical or continuous storage of context information as referenceable objects or object classes of one or more standardized knowledge models by the device for generating context information enables the dialog system to extensively supplement even seemingly incomplete dialog entries by a user, so that queries to supplement the dialog entry have to be made less frequently. The more natural dialog guidance based on the context information obtained automatically by the dialog system increases the acceptance of the dialog system on the part of the user considerably.

Die Nutzung von standardisierten Wissensmodellierungen erleichtert dabei die Integration von Dialogsystemen in eine Vielzahl unterschiedlicher Kontextsituationen.The use of standardized knowledge modeling facilitates the integration of dialogue systems in a large number of different context situations.

Das vorstehend beschriebene Dialogsystem und Verfahren zu dessen Steuerung kann in vielen Anwendungsfällen vorteilhaft eingesetzt werden, bspw. in einem Kraftfahrzeug, einem Smartphone oder einem Smart Home.The dialog system described above and the method for controlling it can be used advantageously in many applications, for example in a motor vehicle, a smartphone or a smart home.

FigurenlisteFigure list

Im Folgenden wird die Erfindung mit Bezug auf die Zeichnung exemplarisch erläutert. In der Zeichnung zeigt:

  • 1 ein exemplarisches Blockschaltbild eines erfindungsgemäßen Dialogsystems,
  • 2 ein exemplarisches Flussdiagramm eines von dem erfindungsgemäßen Dialogsystem ausgeführten Verfahrens,
  • 3 eine vereinfachte Darstellung des Informationsflusses einer beispielhaften Dialogeingabe in einer kontextreichen Umgebung, und
  • 4 ein exemplarisches Blockschaltbild einer Vorrichtung zur Generierung von Kontextinformationen für das Dialogsystem.
In the following, the invention is explained by way of example with reference to the drawing. In the drawing shows:
  • 1 an exemplary block diagram of a dialog system according to the invention,
  • 2 an exemplary flowchart of a method executed by the dialog system according to the invention,
  • 3 a simplified representation of the information flow of an exemplary dialog input in a context-rich environment, and
  • 4th an exemplary block diagram of a device for generating context information for the dialog system.

Gleiche oder ähnliche Elemente können in den Figuren mit denselben Bezugszeichen referenziert sein.Identical or similar elements can be referenced in the figures with the same reference symbols.

BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELENDESCRIPTION OF EXEMPLARY EMBODIMENTS

1 zeigt ein exemplarisches Blockschaltbild eines erfindungsgemäßen Dialogsystems 100. Eine erste Vorrichtung 102 zum Empfangen einer Dialogeingabe, eine zweite Vorrichtung 104 zur Ausgabe einer Dialogantwort, eine Prozessoreinheit 106, Speicher 108 und eine erste Schnittstelle 110 sind über eine oder mehrere Datenverbindungen und/oder Datenbusse 112 kommunikativ miteinander verbunden. Die erste Schnittstelle 110 ist über eine Kommunikationsverbindung 114 mit einem Speicher oder einer Datenbank 116 verbunden, in welcher eine dritte Vorrichtung 118, die Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems 100 erfasst bzw. steuert, diese Zustandsinformationen bzw. Zustände als Inhalte von Objekten oder Objektklassen einer standardisierten Wissensmodellierung abrufbar bereitstellt. Die Zustandsinformationen bzw. Zustände können von der dritten Vorrichtung 118 zyklisch oder kontinuierlich erfasst und aktualisiert werden, so dass zu jeder Zeit Zustandsinformationen bzw. Zustände für ein in die Vergangenheit zurückreichendes Zeitfenster Daten vorliegen. Dabei kann jede Zustandsinformation bzw. jeder Zustand ein eigenes Zeitfenster haben, innerhalb dessen Zustandsinformationen bzw. Zustände gültig sind. Die dritte Vorrichtung kann über in der Figur nicht dargestellte Sensoren, Steuerausgänge und Kommunikationsschnittstellen mit weiteren Vorrichtungen im räumlichen und/oder zeitlichen Umfeld des Benutzers in Verbindung stehen. Speicher 108 kann flüchtigen und nichtflüchtigen Speicher umfassen, wobei in dem nichtflüchtigen Speicher von der Prozessoreinheit les- und ausführbare Programminstruktionen gespeichert sind, welche das Dialogsystem zur Ausführung des mit Bezug auf 2 beschriebenen Verfahrens 200 einrichten. 1 shows an exemplary block diagram of a dialog system according to the invention 100 . A first device 102 for receiving dialog input, a second device 104 for outputting a dialog response, a processor unit 106 , Storage 108 and a first interface 110 are via one or more data links and / or data buses 112 communicatively connected to each other. The first interface 110 is via a communication link 114 with a memory or a database 116 connected, in which a third device 118 , the status information or statuses of a spatial and / or temporal environment of a user of the dialog system 100 detects or controls, this status information or status is made available as contents of objects or object classes of a standardized knowledge modeling. The status information or statuses can from the third device 118 cyclically or continuously recorded and updated, so that status information or statuses for a time window reaching back into the past are available at all times. Each status information or status can have its own time window within which status information or statuses are valid. The third device can be connected to further devices in the spatial and / or temporal environment of the user via sensors, control outputs and communication interfaces (not shown in the figure). Storage 108 may comprise volatile and non-volatile memory, program instructions readable and executable by the processor unit are stored in the non-volatile memory, which the dialog system for executing the with reference to 2 described procedure 200 set up.

2 zeigt ein exemplarisches Flussdiagramm eines von dem erfindungsgemäßen Dialogsystem 100 ausgeführten Verfahrens 200. Nach dem Start wird in Schritt 204 eine Dialogeingabe empfangen, bspw. als Spracheingabe. In Schritt 206 identifiziert das Dialogsystem zumindest eine Absicht der Dialogeingabe. Dazu kann die Dialogeingabe bspw. nach bestimmten Schlüsselbegriffen durchsucht werden. Die Schlüsselbegriffe können insbesondere Frageworte wie „wann“, „wo“, „wer“ etc. enthalten, und können über einen damit verknüpfbaren weiteren Begriff eine Identifizierung der Absicht ermöglichen. In Schritt 208 wird mindestens ein mögliches, mit der identifizierten Absicht in einer standardisierten Wissensmodellierung verknüpftes Objekt oder eine Objektklasse ermittelt. Anschließend wird in Schritt 210 die Dialogeingabe durchsucht, um Eigenschaften oder Attribute zu finden, die zu ermittelten Objekten oder Objektklassen passen. Wenn nicht für alle Objekte oder Objektklassen passende Eigenschaften oder Attribute in der Dialogeingabe gefunden werden können, „n“-Zweig von Schritt 212, wird in Schritt 214 die Datenbank 116 durchsucht, ob passende Eigenschaften oder Attribute zu den Objekten oder Objektklassen vorhanden sind. Ist dies nicht der Fall, „n“-Zweig von Schritt 216, kann eine Rückfrage als Dialogantwort ausgegeben werden, Schritt 218, worauf das Verfahren die bisherigen Informationen in Schritt 220 als Teilinformation eines Dialogs speichert und zur Dialogeingabe 204 zurückkehrt, oder es kann versucht werden, mit den unvollständigen Informationen in Schritt 222 eine Dialogantwort zu erstellen, die in Schritt 224 ausgegeben wird. Wenn die fehlenden Eigenschaften oder Attribute in der Datenbank 116 vorhanden sind, „j“-Zweig von Schritt 216, oder wenn für alle Objekte oder Objektklassen passende Eigenschaften oder Attribute in der Dialogeingabe gefunden werden können, „j“-Zweig von Schritt 212, wird in Schritt 222 eine entsprechende Dialogausgabe erstellt und in Schritt 224 ausgegeben. 2 Fig. 10 shows an exemplary flow diagram of one of the present invention Dialogue system 100 executed procedure 200 . After starting it will be in step 204 receive a dialog input, e.g. as a voice input. In step 206 the dialog system identifies at least one intention of the dialog input. For this purpose, the dialog input can be searched for certain key terms, for example. The key terms can in particular contain question words such as “when”, “where”, “who” etc., and can enable the intention to be identified via a further term that can be linked to them. In step 208 at least one possible object or object class linked to the identified intention in a standardized knowledge modeling is determined. Then in step 210 searches the dialog input to find properties or attributes that match the identified objects or object classes. If properties or attributes that are not suitable for all objects or object classes can be found in the dialog input, "n" branch from step 212 , will be in step 214 database 116 searches for suitable properties or attributes for the objects or object classes. If this is not the case, "n" branch of step 216 , a query can be output as a dialog response, step 218 whereupon the procedure will step the previous information 220 saves as partial information of a dialog and for dialog input 204 returns, or an attempt can be made with the incomplete information in step 222 create a dialog response in step 224 is issued. If the properties or attributes are missing in the database 116 are present, "j" branch from step 216 , or if suitable properties or attributes can be found for all objects or object classes in the dialog input, "j" branch from step 212 , will be in step 222 a corresponding dialog output is created and in step 224 issued.

3 zeigt eine vereinfachte Darstellung des Informationsflusses einer beispielhaften Dialogeingabe in einer kontextreichen Umgebung. Eine Vorrichtung zur Generierung von Kontextinformationen hat zu einer gegenwärtig abgespielten Musikwiedergabe den Namen des Künstlers ermittelt, bspw. aus mit einer Musikdatei verbundenen Informationen, und diese unter der Referenz Q6942562 in der Datenbank für Kontextinformationen gespeichert. Das Dialogsystem DS empfängt zunächst die Dialogeingabe „Wann ist das nächste Konzert?“ und stellt fest, dass Informationen für die Erstellung einer sinnvollen Dialogantwort fehlen. In der Dialoganfrage ist neben dem Fragewort „wann“ außerdem der Begriff „Konzert“ enthalten, der in der standardisierten Wissensmodellierung mit der Referenz Q182832 enthalten ist. Die Kombination der beiden Begriffe zusammen mit der mehr oder weniger unbestimmten Zeitangabe „nächste“ lässt darauf schließen, dass eine in der Zukunft liegende Konzertveranstaltung gesucht ist. Das Dialogsystem DS stellt sucht nun in der Datenbank mit Kontextinformationen DB nach Inhalten zu der Referenz Q182832. Die Datenbank mit Kontextinformationen DB hat dazu keine Inhalte gespeichert, also sucht das Dialogsystem DS nach mit der Referenz Q182832 verknüpften Objekten oder Objektklassen, und findet die verknüpfte Referenz Q6942562 („musikalische Aufführung“). Erneut stellt das Dialogsystem DS eine Anfrage an die Datenbank mit Kontextinformationen DB, diesmal zu Inhalten mit der Referenz Q6942562. Wiederum sind keine Einträge vorhanden, und das Dialogsystem DS sucht nach mit der Referenz Q6942562 verknüpften Objekten oder Objektklassen und findet die Referenz Q639669 („Musiker“). Das Dialogsystem DS stellt eine weitere Anfrage an die Datenbank mit Kontextinformationen DB, diesmal zu Inhalten mit der Referenz Q639669. Die Datenbank mit Kontextinformationen DB hat dazu den Eintrag „William Fitzsimmons“ gespeichert, und liefert diese Information an das Dialogsystem DS. Das Dialogsystem DS erstellt nun aus dem ursprünglichen Suchbegriff „Konzert“ und der Kontextinformation „William Fitzsimmons“ eine Suchanfrage an eine Internet-Suchmaschine, und erzeugt aus der Antwort eine Dialogausgabe (nicht in der Figur gezeigt). Dabei kann das Dialogsystem als zusätzliche Angabe Suchergebnisse ausschließen, die in der Vergangenheit liegen. 3 shows a simplified representation of the information flow of an exemplary dialog input in a context-rich environment. A device for generating context information has determined the name of the artist for a currently played music reproduction, for example from information associated with a music file, and stored this under the reference Q6942562 in the database for context information. The dialogue system DS first receives the dialogue input “When is the next concert?” And determines that information for the creation of a meaningful dialogue response is missing. In addition to the question word “when”, the dialogue request also contains the term “concert”, which is included in the standardized knowledge modeling with reference Q182832. The combination of the two terms together with the more or less indefinite time “next” suggests that a concert event in the future is wanted. The dialog system DS now searches the database with context information DB for content relating to reference Q182832. The database with context information DB has no content stored for this, so the dialog system DS searches for objects or object classes linked with reference Q182832 and finds the linked reference Q6942562 (“musical performance”). The dialog system DS again sends a query to the database with context information DB, this time for content with the reference Q6942562. Again, there are no entries and the dialog system DS searches for objects or object classes linked with reference Q6942562 and finds reference Q639669 (“musician”). The dialog system DS makes a further query to the database with context information DB, this time for content with the reference Q639669. The database with context information DB has saved the entry “William Fitzsimmons” for this purpose and supplies this information to the dialog system DS. The dialog system DS now uses the original search term “concert” and the context information “William Fitzsimmons” to create a search query for an Internet search engine, and generates a dialog output from the response (not shown in the figure). The dialog system can also exclude search results that are in the past as additional information.

4 zeigt ein beispielhaftes Blockschaltbild einer Vorrichtung 118 zur Generierung von Kontextinformationen für das Dialogsystem 100. Eine Prozessoreinheit 406 ist mit einem Speicher 408, einer ersten Schnittstelle 410 und mindestens einer zweiten Schnittstelle 420 über eine oder mehrere Datenverbindungen und/oder Datenbusse 412 kommunikativ verbunden. Die erste Schnittstelle 410 ist über eine Datenverbindung 414 mit einem Speicher oder einer Datenbank 116 verbunden, in welcher die Vorrichtung 118 Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems 100 als Inhalte von Objekten oder Objektklassen einer standardisierten Wissensmodellierung abrufbar bereitstellt. Die Vorrichtung 118 ist dazu über mindestens eine von der zweiten Schnittstelle 420 ausgehende Datenverbindung 430 mit Sensoren oder anderen Vorrichtungen 440 kommunikativ verbunden, welche Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems erfassen bzw. steuern. 4th shows an exemplary block diagram of a device 118 to generate context information for the dialog system 100 . A processing unit 406 is with a memory 408 , a first interface 410 and at least one second interface 420 via one or more data links and / or data buses 412 communicatively connected. The first interface 410 is over a data connection 414 with a memory or a database 116 connected in which the device 118 State information or states of a spatial and / or temporal environment of a user of the dialog system 100 as content of objects or object classes of a standardized knowledge modeling makes available. The device 118 is for this purpose via at least one of the second interface 420 outgoing data connection 430 with sensors or other devices 440 communicatively connected which state information or states of a spatial and / or temporal environment of a user of the dialog system record or control.

BezugszeichenlisteList of reference symbols

100100
DialogsystemDialogue system
102102
erste Vorrichtungfirst device
104104
zweite Vorrichtungsecond device
106106
ProzessoreinheitProcessor unit
108108
SpeicherStorage
110110
erste Schnittstellefirst interface
112112
Datenverbindung/-busData connection / bus
114114
KommunikationsverbindungCommunication link
116116
DatenbankDatabase
118118
dritte Vorrichtungthird device
200200
VerfahrenProcedure
204204
Dialogeingabe empfangenDialog input received
206206
Absicht identifizierenIdentify intention
208208
Objekt ermittelnDetermine object
210210
Eigenschaft/Attribut für Objekt in Dialogeingabe suchenSearch property / attribute for object in dialog input
212212
Eigenschaft/Attribut für Objekt in Dialogeingabe gefunden?Property / attribute found for object in dialog input?
214214
Datenbank durchsuchenSearch database
216216
Datenbanksuche erfolgreich?Database search successful?
218218
RückfrageInquiry
220220
Anfrageinhalt als Teilinformation speichernSave query content as partial information
222222
Dialogantwort erstellenCreate dialog response
224224
Dialogantwort ausgeben Output dialog response
406406
ProzessoreinheitProcessor unit
408408
SpeicherStorage
410410
erste Schnittstellefirst interface
412412
Datenverbindung/-busData connection / bus
414414
KommunikationsverbindungCommunication link
420420
zweite Schnittstellesecond interface
430430
KommunikationsverbindungCommunication link
440440
Sensor/weitere VorrichtungSensor / further device

Claims (10)

Dialogsystem (100) mit einer ersten Vorrichtung (102) zum Empfangen einer Dialogeingabe, einer zweiten Vorrichtung (104) zur Ausgabe einer Dialogantwort, einer Prozessoreinheit (106) und einem Speicher (108), der von der Prozessoreinheit les- und ausführbare Programminstruktionen enthält, wobei das Dialogsystem (100) außerdem eine erste Schnittstelle (110) zur Datenkommunikation mit einem Speicher bzw. einer Datenbank (116) umfasst, in welchem bzw. welcher von einer dritten Vorrichtung (118) erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems (100) als Eigenschaften oder Attribute von Objekten oder Objektklassen einer standardisierten Wissensmodellierung abrufbar bereitgestellt sind, wobei die Programminstruktionen, wenn sie von der Prozessoreinheit (106) ausgeführt werden das Dialogsystem (100) einrichten zum: - Empfangen (204) der Dialogeingabe, - Identifizieren (206) zumindest einer Absicht in der Dialogeingabe, - Ermitteln (208) mindestens eines mit der identifizierten Absicht in der standardisierten Wissensmodellierung verknüpften möglichen Objekts oder einer Objektklasse, - Durchsuchen (210) der Dialogeingabe nach Eigenschaften oder Attributen, welche zu dem mindestens einen ermittelten Objekt oder der Objektklasse passen, wobei, falls nicht für jedes der ermittelten Objekte oder Objektklassen passende Eigenschaften oder Attribute in der Dialogeingabe gefunden werden, die Programminstruktionen das Dialogsystem (100) außerdem einrichten zum: - Suchen (214), in der Datenbank (116), von Eigenschaften oder Attributen für diejenigen Objekte oder Objektklassen, für die in der Dialogeingabe keine Eigenschaften oder Attribute in der Dialogeingabe gefunden wurden, wobei sich die aus der Datenbank abrufbaren Eigenschaften oder Attribute auf innerhalb eines mindestens den Zeitpunkt des Beginns der Dialogeingabe einschließenden, in die Vergangenheit reichenden Zeitfensters von der dritten Vorrichtung (118) erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände des räumlichen und/oder zeitlichen Umfelds des Benutzers des Dialogsystems (100) beziehen, - Erstellen (222) einer Dialogantwort basierend auf der identifizierten Absicht, des mindestens einen Objekts oder der Objektklasse und der dazugehörigen Eigenschaften oder Attribute, und - Ausgeben (224) der Dialogantwort.Dialog system (100) with a first device (102) for receiving a dialog input, a second device (104) for outputting a dialog response, a processor unit (106) and a memory (108) which contains program instructions that can be read and executed by the processor unit, wherein the dialog system (100) also comprises a first interface (110) for data communication with a memory or a database (116) in which or which by a third device (118) acquired or controlled state information or states of a spatial and / or the temporal environment of a user of the dialog system (100) can be called up as properties or attributes of objects or object classes of standardized knowledge modeling, the program instructions, when they are executed by the processor unit (106), setting up the dialog system (100) for: - receiving (204) the dialog input, - Identifying (206) at least one intention in the dialog input, - Determining (208) at least one possible object or an object class linked to the identified intention in the standardized knowledge modeling, Searching (210) the dialog input for properties or attributes that match the at least one determined object or the object class, with the program instructions, if the properties or attributes are not found in the dialog input for each of the determined objects or object classes, the program instructions the dialog system ( 100) also set up for: - Searching (214), in the database (116), of properties or attributes for those objects or object classes for which no properties or attributes were found in the dialog input, the properties or attributes retrievable from the database being within obtain a time window that includes at least the time of the beginning of the dialog input and extends into the past from the third device (118) recorded or controlled status information or statuses of the spatial and / or temporal environment of the user of the dialog system (100), - creating (222) a dialog response based on the identified intention, the at least one object or the object class and the associated properties or attributes, and - Outputting (224) the dialog response. Dialogsystem (100) nach Anspruch 1, wobei das Empfangen (204) der Dialogeingabe das Empfangen einer Spracheingabe oder einer Texteingabe umfasst, und wobei die erste Vorrichtung (100) ein Mikrofon oder eine Tastatur umfasst.Dialog system (100) according to Claim 1 wherein receiving (204) the dialog input comprises receiving a voice input or a text input, and wherein the first device (100) comprises a microphone or a keyboard. Dialogsystem (100) nach Anspruch 1 oder 2, wobei das Ausgeben (224) der Dialogantwort eine akustische oder visuelle Ausgabe oder eine Ausgabe eines Steuersignals umfasst, wobei die zweite Vorrichtung (104) einen Lautsprecher, einen Bildschirm oder eine Steuervorrichtung umfasst, wobei die Steuervorrichtung das Steuersignal einem Aktuator einer im räumlichen Umfeld gelegenen weiteren Vorrichtung zuführt, deren Reaktion auf das Steuersignal von dem Benutzer sensorisch wahrnehmbar ist.Dialog system (100) according to Claim 1 or 2 , wherein the output (224) of the dialogue response comprises an acoustic or visual output or an output of a control signal, wherein the second device (104) comprises a loudspeaker, a screen or a control device, the control device sending the control signal to an actuator of one located in the spatial environment feeds further device, the reaction of which to the control signal can be sensed by the user. Dialogsystem (100) nach Anspruch 1, 2 oder 3, wobei das Erstellen (222) der Dialogantwort umfasst: - Senden einer Anfrage zu der identifizierten Absicht, dem mindestens einen Objekt oder der Objektklasse und zugehöriger Eigenschaften oder Attribute an eine Datenbank oder eine Internet-Suchmaschine.Dialog system (100) according to Claim 1 , 2 or 3 wherein the creation (222) of the dialogue response comprises: sending a request on the identified intention, the at least one object or the object class and associated properties or attributes to a database or an Internet search engine. Vorrichtung (118) zur Generierung von Kontextinformationen für ein Dialogsystem (100) mit einer Prozessoreinheit (406) und einem Speicher (408), der von der Prozessoreinheit les- und ausführbare Programminstruktionen enthält, einer ersten Schnittstelle (410) zur Datenkommunikation mit einem Speicher bzw. einer Datenbank (116), mindestens einer zweiten Schnittstelle (420) zur Kommunikation mit Sensoren oder anderen Vorrichtungen (440), welche Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers erfassen bzw. steuern, wobei die Programminstruktionen, wenn sie von der Prozessoreinheit (406) ausgeführt werden die Vorrichtung (118) dazu einrichten, von den Sensoren oder anderen Vorrichtungen (440) erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände eines räumlichen und/oder zeitlichen Umfelds eines Benutzers des Dialogsystems (100) als Eigenschaften oder Attribute von Objekten oder Objektklassen einer standardisierten Wissensmodellierung in der Datenbank (116) abrufbar bereitzustellen.Device (118) for generating context information for a dialog system (100) with a processor unit (406) and a memory (408) which contains program instructions that can be read and executed by the processor unit, a first interface (410) for data communication with a memory or a database (116), at least one second interface (420) for communication with sensors or other devices (440) which record or control status information or statuses of a spatial and / or temporal environment of a user, the program instructions if they executed by the processor unit (406) set up the device (118) to use the sensors or other devices (440) detected or controlled state information or states of a spatial and / or temporal environment of a user of the dialog system (100) as properties or Attributes of objects or object classes of a standardized knowledge modeling to be made available in the database (116) so that it can be called up. Verfahren (200) zur Steuerung eines Dialogsystems (100), umfassend: - Empfangen (204) einer Dialogeingabe, - Identifizieren (206) einer Absicht in der Dialogeingabe, - Ermitteln (208) mindestens eines mit der identifizierten Absicht in einer standardisierten Wissensmodellierung verknüpften Objekts oder einer Objektklasse, - Durchsuchen (210) der Dialogeingabe nach Eigenschaften oder Attributen, welche zu dem mindestens einen ermittelten Objekt oder der Objektklasse passen, - Prüfen (212) ob für jedes der ermittelten Objekte oder Objektklassen passende Eigenschaften oder Attribute in der Dialogeingabe gefunden wurden und, falls nicht, Suchen (214), in einer Datenbank (116), nach Eigenschaften oder Attributen für diejenigen Objekte oder Objektklassen, für die in der Dialogeingabe keine Eigenschaften oder Attribute in der Dialogeingabe gefunden wurden, wobei sich die aus der Datenbank abrufbaren Eigenschaften oder Attribute auf innerhalb eines mindestens den Zeitpunkt des Beginns der Dialogeingabe einschließenden, in die Vergangenheit reichenden Zeitfensters von einer Vorrichtung (118) erfasste bzw. gesteuerte Zustandsinformationen bzw. Zustände des räumlichen und/oder zeitlichen Umfelds des Benutzers des Dialogsystems (100) beziehen, - Erstellen (222) einer Dialogantwort basierend auf der identifizierten Absicht, dem mindestens einen Objekt oder der Objektklasse und den dazugehörigen, in der Dialogeingabe oder der Suche (214) gefundenen Eigenschaften oder Attribute, und - Ausgeben (224) der Dialogantwort.A method (200) for controlling a dialog system (100), comprising: - receiving (204) a dialog input, - identifying (206) an intention in the dialogue input, - Determining (208) at least one object or an object class linked to the identified intention in a standardized knowledge modeling, - Searching (210) the dialog input for properties or attributes that match the at least one determined object or the object class, - Check (212) whether suitable properties or attributes were found in the dialog input for each of the determined objects or object classes and, if not, search (214) in a database (116) for properties or attributes for those objects or object classes for which in the dialog input no properties or attributes were found in the dialog input, the properties or attributes retrievable from the database being recorded or recorded by a device (118) within a time window that includes at least the time of the beginning of the dialog input and extends into the past. Obtain controlled status information or statuses of the spatial and / or temporal environment of the user of the dialog system (100), - creating (222) a dialog response based on the identified intention, the at least one object or the object class and the associated properties or attributes found in the dialog input or the search (214), and - Outputting (224) the dialog response. Verfahren (200) nach Anspruch 6, wobei das Erstellen (222) der Dialogantwort umfasst: - Senden einer Anfrage zu der identifizierten Absicht, dem mindestens einen Objekt oder der Objektklasse und den zugehörigen Eigenschaften oder Attributen an eine Datenbank oder eine Internet-Suchmaschine.Method (200) according to Claim 6 wherein the creation (222) of the dialog response comprises: sending a request on the identified intention, the at least one object or the object class and the associated properties or attributes to a database or an Internet search engine. Computerprogrammprodukt umfassend Befehle, die bei der Ausführung des Programms durch eine Prozessoreinheit (106) eines Dialogsystems (100) dieses veranlassen, das Verfahren (200) nach Anspruch 6 oder 7 auszuführen.A computer program product comprising instructions which, when the program is executed by a processor unit (106) of a dialog system (100), cause the program according to the method (200) Claim 6 or 7th to execute. Computerlesbareres Medium, auf dem das Computerprogrammprodukt nach Anspruch 8 gespeichert istComputer-readable medium on which the computer program product is after Claim 8 is stored Fahrzeug mit einem Dialogsystem (100) nach einem der Ansprüche 1-4 und einer Vorrichtung nach Anspruch 5.Vehicle with a dialog system (100) according to one of the Claims 1 - 4th and a device according to Claim 5 .
DE102019219406.0A 2019-12-12 2019-12-12 CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM Withdrawn DE102019219406A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102019219406.0A DE102019219406A1 (en) 2019-12-12 2019-12-12 CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102019219406.0A DE102019219406A1 (en) 2019-12-12 2019-12-12 CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM

Publications (1)

Publication Number Publication Date
DE102019219406A1 true DE102019219406A1 (en) 2021-06-17

Family

ID=76084962

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102019219406.0A Withdrawn DE102019219406A1 (en) 2019-12-12 2019-12-12 CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM

Country Status (1)

Country Link
DE (1) DE102019219406A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102022001263A1 (en) 2022-04-12 2023-10-12 Mercedes-Benz Group AG Voice dialogue system and vehicle

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060143576A1 (en) * 2004-12-23 2006-06-29 Gupta Anurag K Method and system for resolving cross-modal references in user inputs
US10482885B1 (en) * 2016-11-15 2019-11-19 Amazon Technologies, Inc. Speaker based anaphora resolution

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060143576A1 (en) * 2004-12-23 2006-06-29 Gupta Anurag K Method and system for resolving cross-modal references in user inputs
US10482885B1 (en) * 2016-11-15 2019-11-19 Amazon Technologies, Inc. Speaker based anaphora resolution

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102022001263A1 (en) 2022-04-12 2023-10-12 Mercedes-Benz Group AG Voice dialogue system and vehicle

Similar Documents

Publication Publication Date Title
DE69735526T2 (en) System for interactive communication
DE112016004863T5 (en) Parameter collection and automatic dialog generation in dialog systems
DE60020773T2 (en) Graphical user interface and method for changing pronunciations in speech synthesis and recognition systems
DE69932819T2 (en) SMART TEXT LANGUAGE IMPLEMENTATION
DE202017106466U1 (en) Real-time streaming dialog management
DE112016006153T5 (en) CREATING AND DISTRIBUTING PLAY LISTS WITH RELATED MUSIC AND STORIES
DE60318505T2 (en) Speech command interpreter with dialog focus tracking function and speech command interpretation method
EP1135767A1 (en) Method and layout for forming classes for a language model based on linguistic classes
DE102006006551B4 (en) Method and system for providing voice dialogue applications and mobile terminal
DE102007004684A1 (en) Method and data processing system for controlled query structured information stored
DE202017105856U1 (en) Notification system with content-specific keywords
DE112015006325T5 (en) Information providing system
DE102019219406A1 (en) CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM
EP1282897A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
EP1330817B1 (en) Robust voice recognition with data bank organisation
WO2021144155A1 (en) Method, computer program, and apparatus for processing a user input
DE10123823A1 (en) Parallel presentation of several audio information sources involves reconfiguring at least one source selected by speech input to be acoustically distinguished from other sources
DE112020002743T5 (en) INFORMATION PROCESSING DEVICE
DE10311581A1 (en) Process and system for the automated creation of vocabulary
DE102019218918A1 (en) DIALOGUE SYSTEM, ELECTRONIC DEVICE AND METHOD OF CONTROLLING THE DIALOGUE SYSTEM
DE10156945A1 (en) Method for operation of speech recognition dialogue system for provision of telephone information, etc., whereby navigation is improved as a user can jump straight to a point in a dialogue by giving a marker name
DE112019005921T5 (en) INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND PROGRAM
DE102019219470A1 (en) SYSTEM AND METHOD FOR EXTRACTION AND RETRIEVING INFORMATION TO ASSIST AUTOMOTIVE REPAIRS
DE102012006680A1 (en) Method for contextual information retrieval
DE112019006677T5 (en) Response processing apparatus and response processing method

Legal Events

Date Code Title Description
R163 Identified publications notified
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee