DE102022213210A1 - Verfahren zur Bestimmung einer Fahrzeugdomäne und ein Spracherkennungssystem für ein Fahrzeug - Google Patents

Verfahren zur Bestimmung einer Fahrzeugdomäne und ein Spracherkennungssystem für ein Fahrzeug Download PDF

Info

Publication number
DE102022213210A1
DE102022213210A1 DE102022213210.6A DE102022213210A DE102022213210A1 DE 102022213210 A1 DE102022213210 A1 DE 102022213210A1 DE 102022213210 A DE102022213210 A DE 102022213210A DE 102022213210 A1 DE102022213210 A1 DE 102022213210A1
Authority
DE
Germany
Prior art keywords
domain
user
vehicle
language
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102022213210.6A
Other languages
English (en)
Inventor
Sung Soo Park
Kyowoong Choo
Chang Woo Chun
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Kia Corp
Original Assignee
Hyundai Motor Co
Kia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co, Kia Corp filed Critical Hyundai Motor Co
Publication of DE102022213210A1 publication Critical patent/DE102022213210A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)

Abstract

In einer Umgebung, in der eine Vielzahl von Spracherkennungssystemen verwendet werden kann, kann ein Verfahren zum Bestimmen einer Fahrzeugdomäne und ein Spracherkennungssystem für ein Fahrzeug die eingebrachte Sprache eines Nutzers in eine Fahrzeugdomäne oder eine externe Domäne klassifizieren und es ermöglichen, dass die Sprache des Nutzers durch eines der Spracherkennungssysteme für das Fahrzeug oder das externe Spracherkennungssystem auf Grundlage eines Ergebnisses der Klassifizierung verarbeitet wird, wodurch ein auf die Absicht des Nutzers zugeschnittener Dienst bereitgestellt werden kann. Ein Verfahren zum Bestimmen einer Fahrzeugdomäne umfasst: Umwandeln der Sprache eines Nutzers in Text; und Klassifizieren der Sprache des Nutzers in eine Fahrzeugdomäne oder eine externe Domäne auf Grundlage des Textes, wobei das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne das Klassifizieren einer Domäne des Nutzers und dann das Klassifizieren der Domäne der Sprache des Nutzers umfasst.

Description

  • HINTERGRUND
  • 1. Technisches Gebiet
  • Die Offenbarung betrifft ein Verfahren zur Bestimmung einer Fahrzeugdomäne sowie ein Spracherkennungssystem für ein Fahrzeug, das ein Spracherkennungssystem bestimmen kann, um die eingebrachte Sprache eines Nutzers in einer Umgebung zu verarbeiten, in der eine Vielzahl von Spracherkennungssystemen verwendet werden können.
  • 2. Beschreibung des Stands der Technik
  • Ein Spracherkennungssystem ist in der Lage, aus der Sprache eines Nutzers zu erkennen, was dieser beabsichtigt, und einen Dienst anzubieten, der der identifizierten Absicht des Nutzers entspricht.
  • Ein Spracherkennungssystem ist mit einer bestimmten Vorrichtung verbunden, um die Vorrichtung entsprechend der Absicht des Nutzers zu steuern und auch um spezifische Informationen entsprechend der Absicht des Nutzers bereitzustellen.
  • Solche Spracherkennungssysteme können je nach Spracherkennungsanbieter unterschiedliche Funktionen haben. Obwohl eine Vielzahl von Spracherkennungssystemen die gleiche Funktion bieten, kann das Ergebnis für jedes Spracherkennungssystem unterschiedlich sein.
  • DARSTELLUNG
  • Ein Aspekt der Offenbarung stellt ein Verfahren zur Bestimmung einer Fahrzeugdomäne und ein Spracherkennungssystem für ein Fahrzeug bereit, das in einer Umgebung, in der eine Vielzahl von Spracherkennungssystemen verwendet werden können, die Sprache eines Nutzers in eine Fahrzeugdomäne, die ein vom Spracherkennungssystem für das Fahrzeug zu verarbeitendes Objekt ist, oder eine externe Domäne, die ein von einem externen Spracherkennungssystem zu verarbeitendes Objekt ist, klassifizieren kann. Das Verfahren und das System können es ebenfalls ermöglichen, dass die Sprache des Nutzers durch das Spracherkennungssystem für das Fahrzeug oder das externe Spracherkennungssystem auf Grundlage eines Ergebnisses der Klassifizierung verarbeitet wird. Auf diese Weise können das Verfahren und das System einen Dienst bereitstellen, der auf die Absicht des Nutzers zugeschnitten ist.
  • Zusätzliche Aspekte der Offenbarung werden teilweise in der folgenden Beschreibung dargelegt und sollten teilweise aus der Beschreibung ersichtlich sein oder können durch die Praxis der Offenbarung gelernt werden.
  • Gemäß einer Ausführungsform der Offenbarung umfasst ein Verfahren zur Bestimmung einer Fahrzeugdomäne das Umwandeln der Sprache eines Nutzers in Text und das Klassifizieren der Sprache des Nutzers in eine Fahrzeugdomäne oder eine externe Domäne auf Grundlage des Textes. Das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne umfasst das Klassifizieren einer Domäne der Sprache des Nutzers auf Grundlage zuvor gespeicherter schlüsselwortbezogener Informationen und dann das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage eines trainierten Domänenklassifizierungsmodells.
  • Wenn die Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen nicht als externe Domäne klassifiziert wird, umfasst das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells.
  • Das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne umfasst ferner das Einstellen eines Konfidenzwertes des trainierten Domänenklassifizierungsmodells.
  • Das Einstellen des Konfidenzwerts des trainierten Domänenklassifizierungsmodells verwendet ein neu trainiertes Domänenklassifizierungsmodell zur Einstellung des Konfidenzwerts.
  • Wenn die Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells nicht als die externe Domäne klassifiziert wird, wird durch das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne der Konfidenzwert des trainierten Domänenklassifizierungsmodells neu eingestellt.
  • Die zuvor gespeicherte schlüsselwortbezogene Information enthält ein fahrzeugbezogenes Schlüsselwort. Das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen umfasst das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne, wenn das fahrzeugbezogene Schlüsselwort oder eine Kombination der fahrzeugbezogenen Schlüsselwörter in der Sprache des Nutzers enthalten ist.
  • Die zuvor gespeicherte schlüsselwortbezogene Information enthält ein Muster, das durch ein fahrzeugbezogenes Schlüsselwort und ein Prädikat definiert ist. Das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen umfasst das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne, wenn das definierte Muster in der Sprache des Nutzers enthalten ist.
  • Die zuvor gespeicherte schlüsselwortbezogene Information enthält einen fahrzeugbezogenen Entitätsnamen. Das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen umfasst das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne, wenn der fahrzeugbezogene Entitätsname in der Sprache des Nutzers enthalten ist.
  • Das trainierte Domänenklassifizierungsmodell umfasst ein Bereichsklassifizierungsmodell, das ein Ergebnis der Satzeinbettung des Textes, der aus der Sprache des Nutzers umgewandelt wurde, in einen Fahrzeugbereich oder einen anderen Bereich innerhalb eines Einbettungsraums klassifiziert. Das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells umfasst das Klassifizieren der Sprache des Nutzers in die externe Domäne, wenn das Ergebnis der Satzeinbettung des Textes nicht in dem Fahrzeugbereich enthalten ist.
  • Das trainierte Domänenklassifizierungsmodell umfasst ein Absichtsklassifizierungsmodell, das eine Absicht der Sprache des Nutzers klassifiziert. Das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells umfasst das Klassifizieren der Sprache des Nutzers in die externe Domäne, wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht in einer externen Absicht enthalten ist.
  • Das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells umfasst, wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht nicht in der externen Absicht enthalten ist, das Extrahieren eines Slot-Wertes aus der Sprache des Nutzers, und wenn der extrahierte Slot-Wert nicht in einem fahrzeugbezogenen Slot bzw. Schlitz enthalten ist, das Klassifizieren der Sprache des Nutzers in die externe Domäne.
  • Gemäß einer Ausführungsform der Offenbarung umfasst ein Spracherkennungssystem für ein Fahrzeug ein Spracherkennungsmodul, das derart konfiguriert ist, dass es die Sprache eines Nutzers in Text umwandelt, und ein Domänenklassifizierungsmodul, das derart konfiguriert ist, dass es die Sprache des Nutzers auf Grundlage des Textes in eine Fahrzeugdomäne oder eine externe Domäne klassifiziert. Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es eine Domäne der Sprache des Nutzers auf Grundlage von zuvor gespeicherten schlüsselwortbezogenen Informationen klassifiziert und dann die Domäne der Sprache des Nutzers auf Grundlage eines trainierten Domänenklassifizierungsmodells klassifiziert.
  • Wenn die Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen nicht als die externe Domäne klassifiziert wird, ist das Domänenklassifizierungsmodul derart konfiguriert, dass es die Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells klassifiziert.
  • Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es einen Konfidenzwert des trainierten Domänenklassifizierungsmodells einstellt.
  • Das Domänenklassifizierungsmodul verwendet ein neu trainiertes Domänenklassifizierungsmodell, um den Konfidenzwert einzustellen.
  • Wenn die Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells nicht als die externe Domäne klassifiziert wird, ist das Domänenklassifizierungsmodul derart konfiguriert, dass es den Konfidenzwert des trainierten Domänenklassifizierungsmodells neu einstellt.
  • Die zuvor gespeicherte schlüsselwortbezogene Information enthält ein fahrzeugbezogenes Schlüsselwort. Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es die Sprache des Nutzers in die Fahrzeugdomäne klassifiziert, wenn das fahrzeugbezogene Schlüsselwort oder eine Kombination der fahrzeugbezogenen Schlüsselwörter in der Sprache des Nutzers enthalten ist.
  • Die zuvor gespeicherten schlüsselwortbezogenen Informationen enthalten ein Muster, das durch ein fahrzeugbezogenes Schlüsselwort und ein Prädikat definiert ist. Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es die Sprache des Nutzers in die Fahrzeugdomäne klassifiziert, wenn das definierte Muster in der Sprache des Nutzers enthalten ist.
  • Die zuvor gespeicherte schlüsselwortbezogene Information enthält einen fahrzeugbezogenen Entitätsnamen. Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es die Sprache des Nutzers in die Fahrzeugdomäne klassifiziert, wenn der fahrzeugbezogene Entitätsname in der Sprache des Nutzers enthalten ist.
  • Das trainierte Domänenklassifizierungsmodell umfasst ein Bereichsklassifizierungsmodell, das ein Ergebnis der Satzeinbettung des Textes, der aus der Sprache des Nutzers umgewandelt wurde, in einen Fahrzeugbereich oder einen anderen Bereich innerhalb eines Einbettungsraums klassifiziert. Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es die Sprache des Nutzers in die externe Domäne klassifiziert, wenn das Ergebnis der Satzeinbettung des Textes nicht in dem Fahrzeugbereich enthalten ist.
  • Das trainierte Domänenklassifizierungsmodell umfasst ein Absichtsklassifizierungsmodell, das eine Absicht der Sprache des Nutzers klassifiziert. Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es die Sprache des Nutzers in die externe Domäne klassifiziert, wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht in einer externen Absicht enthalten ist.
  • Das Domänenklassifizierungsmodul ist derart konfiguriert, dass es einen Slot-Wert aus der Sprache des Nutzers extrahiert, wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht nicht in der externen Absicht enthalten ist, und die Sprache des Nutzers in die externe Domäne klassifiziert, wenn der extrahierte Slot-Wert nicht in einem fahrzeugbezogenen Slot bzw. Schlitz enthalten ist.
  • Figurenliste
  • Diese und/oder andere Aspekte der Offenbarung sollen aus der folgenden Beschreibung der Ausführungsformen in Verbindung mit den beigefügten Zeichnungen ersichtlich und leichter verständlich werden:
    • 1 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen einem Nutzer und einem Spracherkennungssystem für ein Fahrzeug gemäß einer Ausführungsform zeigt;
    • 2 ist ein Diagramm, das eine Verbindungsbeziehung zwischen einem externen Spracherkennungssystem und einem Spracherkennungssystem für ein Fahrzeug gemäß einer Ausführungsform darstellt;
    • 3 ist ein Diagramm, das ein Beispiel für ein Verarbeitungsergebnis eines externen Spracherkennungssystems und eines Spracherkennungssystems für ein Fahrzeug in Bezug auf die Sprache eines einzelnen Nutzers zeigt;
    • 4 ist ein Steuerblockdiagramm, das ein Spracherkennungssystem für ein Fahrzeug gemäß einer Ausführungsform darstellt;
    • 5 ist ein Ablaufdiagramm, das ein Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform veranschaulicht;
    • 6 ist ein Ablaufdiagramm, das die Vorgänge zur Klassifizierung eines Bereichs in einem Verfahren zur Bestimmung eines Fahrzeugdomäne gemäß einer Ausführungsform veranschaulicht;
    • 7-10 sind Diagramme, die die Vorgänge der schlüsselwortbasierten Domänenklassifizierung in einem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform veranschaulichen;
    • 11, 12 und 13 sind Diagramme, die Vorgänge der lernbasierten Domänenklassifizierung in einem Verfahren zur Bestimmung einer Fahrzeugdomäne veranschaulichen;
    • 14 ist ein schematisches Diagramm, das die Struktur eines trainierten Domänenklassifizierungsmodells zeigt, das in einem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform verwendet wird; und
    • 15 ist ein Diagramm zur Veranschaulichung der Vorgänge bei der Neueinstellung eines Konfidenzwertes in einem Verfahren zur Bestimmung eines Fahrzeugdomäne gemäß einer Ausführungsform.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Die hier dargelegten und in der Konfiguration der Offenbarung dargestellten Ausführungsformen sind lediglich Ausführungsformen, so dass sie zum Zeitpunkt der Offenbarung durch verschiedene Äquivalente und Änderungen ersetzt werden können.
  • Gleiche Bezugszeichen in der gesamten Beschreibung bezeichnen gleiche Elemente.
  • Die hier verwendeten Begriffe dienen nur der Beschreibung bestimmter Ausführungsformen und sollen die Offenbarung nicht einschränken. Es wird angemerkt, dass die Singularformen auch die Pluralformen einschließen, es sei denn, aus dem Kontext ergibt sich eindeutig etwas anderes. Es wird ferner angemerkt, dass die in dieser Beschreibung verwendeten Begriffe „beinhalten“, „umfassen“ und/oder „aufweisen“ das Vorhandensein bestimmter Merkmale, ganzer Zahlen, Schritte, Vorgänge, Elemente und/oder Komponenten angeben, jedoch nicht das Vorhandensein oder Hinzufügen eines oder mehrerer anderer Merkmale, ganzer Zahlen, Schritte, Vorgänge, Elemente, Komponenten und/oder Gruppen davon ausschließen.
  • Obwohl die Begriffe „erstes“, „zweites“ usw. hier zur Beschreibung verschiedener Elemente verwendet werden können, sollten die verschiedenen Elemente nicht durch diese Begriffe eingeschränkt werden. Ohne vom technischen Grundgedanken oder den wesentlichen Merkmalen der Offenbarung abzuweichen, kann zum Beispiel ein erstes Element als zweites Element bezeichnet werden, und auch ein zweites Element kann als erstes Element bezeichnet werden. Beschreibungen sind so zu verstehen, dass sie alle Kombinationen eines oder mehrerer der aufgeführten Elemente umfassen, wenn die Elemente mit dem konjunktiven Begriff „-und/oder -“ oder ähnlichem beschrieben werden.
  • Darüber hinaus können sich Begriffe wie „-Teil“, „-Gerät“, „-Block“, „-Mitglied“, „-Modul“ und dergleichen auf eine Einheit zur Verarbeitung zumindest einer Funktion oder Handlung beziehen. Die Begriffe können sich zum Beispiel auf zumindest einen Prozess beziehen, der von zumindest einer Hardware, wie etwa einem Field-Programmable Gate Array (FPGA)/einer anwendungsspezifischen integrierten Schaltung (ASIC), einer in Speichern oder Prozessoren gespeicherten Software verarbeitet wird. Wenn ein Teil, eine Vorrichtung, ein Block, ein Element, ein Modul oder ähnliches der vorliegenden Offenbarung als einen Zweck verfolgend oder einen Vorgang, Funktion oder ähnliches ausführend beschrieben wird, sollte das Teil, die Vorrichtung, der Block, das Element, das Modul oder ähnliches hier als „konfiguriert, um“ diesen Zweck zu erfüllen oder diese Vorgänge oder Funktion auszuführen, betrachtet werden.
  • Die für die Verfahrensschritte verwendeten Bezugszeichen dienen nur der einfacheren Erklärung, nicht aber der Einschränkung der Reihenfolge der Schritte. Sofern der Kontext nicht eindeutig etwas anderes angibt, kann die schriftliche Reihenfolge also anders gehandhabt werden.
  • Nachfolgend werden Ausführungsformen eines Verfahrens zur Bestimmung einer Fahrzeugdomäne sowie eines Spracherkennungssystems für ein Fahrzeug gemäß einem Aspekt der Offenbarung unter Bezugnahme auf die beigefügten Zeichnungen ausführlich beschrieben.
  • 1 ist ein Diagramm, das ein Beispiel für einen Dialog zwischen einem Nutzer und einem Spracherkennungssystem für ein Fahrzeug gemäß einer Ausführungsform darstellt. 2 ist ein Diagramm, das eine Verbindungsbeziehung zwischen einem externen Spracherkennungssystem und einem Spracherkennungssystem für ein Fahrzeug gemäß einer Ausführungsform darstellt. 3 ist ein Diagramm, das ein Beispiel für ein Verarbeitungsergebnis eines externen Spracherkennungssystems und eines Spracherkennungssystems für ein Fahrzeug in Bezug auf die Sprache eines einzelnen Nutzers zeigt.
  • Unter Bezugnahme auf die 1 und 2 ist ein Spracherkennungssystem für ein Fahrzeug 100 gemäß einer Ausführungsform mit einem Fahrzeug 200 verbunden und kann einen Dienst bereitstellen, der der Absicht des Nutzers entspricht, indem es eine Sprache eines Nutzers des Fahrzeugs 200, d.h. eines Fahrers oder eines Insassen, verarbeitet.
  • Wenn ein Nutzer zum Beispiel fragt: „Wann habe ich das Motoröl gewechselt?“, kann das Spracherkennungssystem für das Fahrzeug 100 eine Antwort wie „Sie haben das Motoröl in der Bluehands Cheongdam East Filiale gewechselt, als Sie am 4. Januar 2019 36000 km gefahren hatten“ ausgeben.
  • Die Spracheingabe des Nutzers kann über ein in dem Fahrzeug 200 vorgesehenes Mikrofon erfolgen, und die Antwort des Spracherkennungssystems für das Fahrzeug 100 kann akustisch über einen in dem Fahrzeug 200 vorgesehenen Lautsprecher 220 oder visuell über eine in dem Fahrzeug 200 vorgesehene Anzeige 210 ausgegeben werden.
  • Als weiteres Beispiel kann das Spracherkennungssystem für das Fahrzeug 100 auf die Frage des Nutzers „Was ist eine automatische Bremse?“ eine Antwort wie „Eine automatische Bremse ist eine Funktion, die ein Fahrzeug anhält, auch wenn Sie den Fuß vom Bremspedal nehmen“ ausgeben.
  • Hierbei kann das Fahrzeug 200 zusätzlich zu dem Spracherkennungssystem für das Fahrzeug 100 mit einem Spracherkennungssystem 10 verknüpft sein, das von einem anderen Anbieter betrieben wird. Zur Vereinfachung der Beschreibung werden andere Spracherkennungssysteme 10 als das Spracherkennungssystem für das Fahrzeug 100 als „externes Spracherkennungssystem“ bezeichnet.
  • Gemäß der Ausführungsform kann sich ein Verknüpfen eines Spracherkennungssystems mit dem Fahrzeug 200 auf einen Zustand beziehen, in dem die Spracheingabe eines Nutzers durch das Fahrzeug 200 an das Spracherkennungssystem 100 übertragen werden kann, und ein Ergebnis der Verarbeitung der Sprache des Nutzers in dem Spracherkennungssystem 100 an das Fahrzeug 200 übertragen werden kann.
  • Alternativ kann ein Medium zwischen einem Nutzer und dem Spracherkennungssystem 100 ein mobiles Gerät wie ein Smartphone, ein tragbares Gerät oder ähnliches sein, das nicht das Fahrzeug 200 ist. In diesem Fall kann die Spracheingabe eines Nutzers über das mobile Gerät an das Spracherkennungssystem 100 übertragen werden und ein Verarbeitungsergebnis des Spracherkennungssystems 100 kann über das mobile Gerät ausgegeben werden.
  • Im Folgenden wird ein Beispiel beschrieben, bei dem das Fahrzeug 200 ein Medium zwischen dem Nutzer und dem Spracherkennungssystem 100 ist.
  • Das Spracherkennungssystem für das Fahrzeug 100 und das externe Spracherkennungssystem 10 können unterschiedliche Funktionen haben, die auf jedes Spracherkennungssystem spezialisiert sind, aber auch die gleichen Funktionen. Selbst unter den gleichen Funktionen kann es jedoch Funktionen geben, die je nach den Merkmalen des jeweiligen Spracherkennungssystems unterschiedliche Ergebnisse ausgeben.
  • Wie in 3 gezeigt, ist zum Beispiel bei der Nutzereingabe „Erzähl mir etwas über Kona“ eine der Nutzereingabe entsprechende Domäne [Information Retrieval], und sowohl das Spracherkennungssystem für das Fahrzeug 100 als auch das externe Spracherkennungssystem 10 können die entsprechende Domäne verarbeiten.
  • Wenn die Sprache des Nutzers von dem externen Spracherkennungssystem 10 verarbeitet wird, kann das externe Spracherkennungssystem 10 „Kona“ als Ortsname erkennen und eine Antwort wie „Kona ist ein Reiseziel auf Big Island in Hawaii...“ ausgeben.
  • Wenn die Sprache des Nutzers durch das Spracherkennungssystem für das Fahrzeug 100 verarbeitet wird, kann das Spracherkennungssystem für das Fahrzeug 100 „Kona“ als Auto-Markenname erkennen und eine Antwort wie „Kona ist ein kompakter 5-türiger SUV, der von Hyundai Motors hergestellt wird...“ ausgeben.
  • Mit anderen Worten können die Verarbeitungsergebnisse für dieselbe Eingabe je nach dem verarbeitenden Spracherkennungssystem unterschiedlich ausfallen. Dementsprechend muss die Sprache eines Nutzers von einem Spracherkennungssystem verarbeitet werden, das in der Lage ist, eine optimale, auf die Absicht des Nutzers zugeschnittene Verarbeitung durchzuführen.
  • Zu diesem Zweck kann das Spracherkennungssystem für das Fahrzeug 100 gemäß einer Ausführungsform bestimmen, ob die Sprache des Nutzers durch das Spracherkennungssystem für das Fahrzeug 100 oder das externe Spracherkennungssystem 10 verarbeitet werden soll. Wenn festgestellt wird, dass die Sprache des Nutzers durch das Spracherkennungssystem für das Fahrzeug 100 verarbeitet werden soll, kann das Spracherkennungssystem für das Fahrzeug 100 die Sprache des Nutzers selbst verarbeiten. Wenn festgestellt wird, dass die Sprache des Nutzers von dem externen Spracherkennungssystem 10 verarbeitet werden soll, kann das Spracherkennungssystem für das Fahrzeug 100 die Sprache des Nutzers an das externe Spracherkennungssystem 10 übertragen.
  • 4 ist ein Steuerblockdiagramm, das ein Spracherkennungssystem für das Fahrzeug gemäß einer Ausführungsform darstellt. 5 ist ein Ablaufdiagramm, das ein Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform veranschaulicht.
  • Ein Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform kann durch das Spracherkennungssystem für das Fahrzeug 100 gemäß einer Ausführungsform durchgeführt werden. Daher ist eine Beschreibung des Verfahrens zur Bestimmung einer Fahrzeugdomäne gleichermaßen auf das Spracherkennungssystem für das Fahrzeug 100 anwendbar, und eine Beschreibung des Spracherkennungssystems für das Fahrzeug 100 ist ebenfalls gleichermaßen auf das Verfahren zur Bestimmung einer Fahrzeugdomäne anwendbar.
  • Unter Bezugnahme auf 4 umfasst das Spracherkennungssystem für das Fahrzeug 100 gemäß einer Ausführungsform ein Spracherkennungsmodul 110, ein Vorverarbeitungsmodul 120, ein Domänenklassifizierungsmodul 130, ein Modul zum Verstehen natürlicher Sprache 140, ein Ergebnisverarbeitungsmodul 150 und ein Kommunikationsmodul 160. Das Spracherkennungsmodul 110 wandelt die Sprache eines Nutzers in Text um, und das Vorverarbeitungsmodul 120 führt eine Vorverarbeitung durch, damit der Text in das Domänenklassifizierungsmodul 130 eingegeben werden kann. Das Domänenklassifizierungsmodul 130 klassifiziert die Sprache des Nutzers auf Grundlage des Textes entweder in eine Fahrzeugdomäne oder in eine externe Domäne. Wenn die Sprache des Nutzers als Fahrzeugdomäne klassifiziert wird, verarbeiten das Modul 140 zum Verstehen natürlicher Sprache und das Ergebnisverarbeitungsmodul 150 die Sprache des Nutzers und stellen einen Dienst bereit, der der Absicht des Nutzers entspricht. Das Kommunikationsmodul 160 sendet und empfängt ein Signal mit dem Fahrzeug 200 oder dem externen Spracherkennungssystem 10.
  • Wenn die Sprache des Nutzers über ein in dem Fahrzeug 200 vorgesehenes Mikrofon eingegeben wird, kann die eingegebene Sprache des Nutzers in Form eines Sprachsignals an das Kommunikationsmodul 160 übertragen werden. Das Kommunikationsmodul 160 kann ein Drahtlos-Kommunikationsmodul zum Senden und Empfangen eines Signals mit einer entfernten elektronischen Vorrichtung umfassen, wie etwa ein 3G-Kommunikationsmodul, ein 4G-Kommunikationsmodul, ein 5G-Kommunikationsmodul, Wi-Fi und dergleichen.
  • Das Spracherkennungsmodul 110 kann als Sprach-zu-Text (STT)-Engine implementiert werden und die Sprache des Nutzers, die ein Sprachsignal ist, in Text umwandeln, indem die Sprache des Nutzers auf einen Spracherkennungsalgorithmus angewendet wird.
  • Zum Beispiel kann das Spracherkennungsmodul 110 einen Merkmalsvektor extrahieren, indem es eine Merkmalsvektor-Extraktionstechnologie wie ein Cepstrum, einen linearen Vorhersagekoeffizienten (LPC), einen Mel-Frequenz-Cepstral-Koeffizienten (MFCC), eine Filterbank-Energie oder Ähnliches anwendet.
  • Ebenfalls kann ein Erkennungsergebnis durch den Vergleich des extrahierten Merkmalsvektors mit einem trainierten Referenzmuster erzielt werden. Zu diesem Zweck kann ein akustisches Modell verwendet werden, das Signaleigenschaften von Sprache modelliert und vergleicht, oder ein Sprachmodell, das eine Sequenzbeziehung eines Erkennungsvokabulars wie ein Wort oder eine Silbe modelliert.
  • Darüber hinaus kann das Spracherkennungsmodul 110 die Sprache des Nutzers auf Grundlage von Deep Learning oder maschinellem Lernen in Text umwandeln.
  • Das Modul 140 zum Verstehen natürlicher Sprache kann eine Technologie zum Verstehen natürlicher Sprache (NLU) anwenden, um die in der Sprache des Nutzers enthaltene Absicht zu bestimmen. Die von dem Modul 140 zum Verstehen natürlicher Sprache verarbeitete Sprache des Nutzers bezieht sich auf den von dem Spracherkennungsmodul 110 umgewandelten eingegebenen Text, d.h. auf einen Eingabesatz.
  • Das Modul 140 zum Verstehen natürlicher Sprache kann Informationen wie eine Domäne, einen Entitätsnamen, eine Sprechhandlung usw. aus der Sprache des Nutzers extrahieren und auf Grundlage der extrahierten Informationen die Absicht und eine Entität erkennen, die für die Ausführung der entsprechenden Absicht erforderlich ist.
  • Lautet ein Eingabesatz zum Beispiel „Lass uns nach Hause gehen“, so kann eine Domäne [Navigation] sein, eine Absicht [set. route] sein, und eine Entität, die für die Durchführung der der entsprechenden Absicht entsprechenden Steuerung erforderlich ist, kann [starting point, destination] lauten.
  • Als weiteres Beispiel kann, wenn ein Eingabesatz lautet „Klimaanlage einschalten“, eine Domäne [vehicle control], eine Absicht [turn on. air conditioner] und eine Entität, die für die Durchführung der Steuerung entsprechend der entsprechenden Absicht erforderlich ist, [temperature, air volume] sein.
  • Das Ergebnisverarbeitungsmodul 150 kann ein Ergebnisverarbeitungssignal an das Fahrzeug 200 oder einen externen Server ausgeben, um eine Verarbeitung zur Bereitstellung eines Dienstes entsprechend der Absicht des Nutzers durchzuführen. Wenn der Dienst, der der Absicht des Nutzers entspricht, zum Beispiel eine fahrzeugbezogene Steuerung ist, kann ein Steuersignal zur Durchführung der entsprechenden Steuerung erzeugt und an das Fahrzeug übertragen werden.
  • Wenn der Dienst, der der Absicht des Nutzers entspricht, bestimmte Informationen bereitstellen soll, können die Informationen auch abgerufen und an ein Nutzerendgerät übertragen werden. Je nach Bedarf kann der Abruf von Informationen auf einem anderen externen Server erfolgen.
  • Alternativ dazu kann das Ergebnisverarbeitungsmodul 150 den Inhalt von einem externen Server anfordern, der den Inhalt bereitstellt, wenn der Dienst, der der Absicht des Nutzers entspricht, einen bestimmten Inhalt bereitstellen soll.
  • Alternativ dazu kann das Ergebnisverarbeitungsmodul 150 eine Antwort auf die Sprache des Nutzers erzeugen und die Antwort akustisch ausgeben, wenn der Dienst der Absicht des Nutzers entspricht, einfach einen Dialog fortzusetzen.
  • Die Vorgänge des Vorverarbeitungsmoduls 120 und des Domänenklassifizierungsmoduls 130 werden im Folgenden beschrieben.
  • Das oben beschriebene Spracherkennungssystem für das Fahrzeug 100 kann mit zumindest einem Speicher, der ein Programm speichert, das die oben genannten Vorgänge ausführt, und zumindest einem Prozessor, der ein gespeichertes Programm ausführt, implementiert werden.
  • Die einzelnen Komponenten des Spracherkennungssystems für das Fahrzeug 100 sind nach ihren Funktionen unterteilt, und alle oder ein Teil der einzelnen Komponenten können sich einen Speicher oder Prozessor teilen.
  • Das Spracherkennungssystem für das Fahrzeug 100 kann in Form eines Servers implementiert sein, aber ein Teil seiner Komponenten kann auf dem Fahrzeug 200 oder einem Nutzerendgerät montiert sein. Alternativ kann das Spracherkennungssystem für das Fahrzeug 100 vollständig auf dem Fahrzeug 200 oder einem Nutzerendgerät montiert sein.
  • Nachfolgend werden die Vorgänge zur Klassifizierung der Sprache eines Nutzers in eine Fahrzeugdomäne oder eine externe Domäne unter Bezugnahme auf die 4 und 5 beschrieben.
  • Unter Bezugnahme auf 5 wird in dem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform eine Vorverarbeitung in Bezug auf Text durchgeführt, der aus der Sprache eines Nutzers umgewandelt wurde (1100).
  • In diesem Fall dient die Vorverarbeitung dazu, den umgewandelten Text in eine Form zu bringen, die durch das Domänenklassifizierungsmodul 130 verarbeitet werden kann. Das Vorverarbeitungsmodul 120 kann eine Abstandskorrektur des Textes und eine Koreanisch-Englisch-Korrektur entsprechend der Sprache durchführen, die in der eingegebenen Sprache des Nutzers verwendet wird. Die Abstandskorrektur und die Koreanisch-Englisch-Korrektur können zum Beispiel auf Grundlage eines vordefinierten Wörterbuchs durchgeführt werden.
  • Der Text, in dem die Abstandskorrektur und die Koreanisch-Englisch-Korrektur durchgeführt werden, kann in Token unterteilt werden. Ein Token ist eine kleine Einheit für die Analyse. Gemäß der Ausführungsform kann eine morphologische Analyse durchgeführt werden, um den Text in Morphem-Einheiten zu unterteilen.
  • Bei der morphologischen Analyse kann ein Eingangssatz in Morpheme unterteilt werden. Das Morphem stellt die kleinste Bedeutungseinheit dar, die nicht mehr analysiert werden kann. Das Morphem kann ein Wort oder ein Wortteil sein, das eine grammatikalische oder relationale Bedeutung angibt und einen Wortstamm oder eine Endung eines einfachen Wortes, eine Postposition, eine Vorsilbe, ein Suffix und Ähnliches enthält.
  • In der koreanischen morphologischen Analyse kann ein Prozess der Unterteilung einer Phrase auf Grundlage von Abständen, der Abtrennung einer Postposition von jeder Phrase und der anschließenden Unterteilung in einen Stamm und eine Endung durchgeführt werden. Da jedoch ein einzelnes Wort manchmal mit mehreren Bedeutungen verwendet wird, kann ein Morphem-Wörterbuch verwendet werden, um zu verhindern, dass die morphologische Analyse aufgrund von Mehrdeutigkeit fehlerhaft ist. Außerdem kann für jedes Morphem ein Part-of-Speech-Tagging durchgeführt werden.
  • Der vorverarbeitete Text kann in das Domänenklassifizierungsmodul 130 eingegeben werden.
  • Das Domänenklassifizierungsmodul 130 klassifiziert die Sprache des Nutzers auf Grundlage des eingegebenen Textes (1200) entweder in eine Fahrzeugdomäne oder in eine externe Domäne.
  • Gemäß der Ausführungsform sind die Fahrzeugdomäne und die externe Domäne Domänen auf einer höheren Ebene als eine Domäne, die durch eine Technologie zum Verstehen natürlicher Sprache klassifiziert wird. Die Sprache des Nutzers, die als Fahrzeugdomäne klassifiziert wird, bezieht sich darauf, dass bestimmt wird, dass die Sprache des Nutzers durch das Spracherkennungssystem für das Fahrzeug 100 verarbeitet werden soll. Die als externe Domäne klassifizierte Sprache des Nutzers bedeutet, dass die Sprache des Nutzers durch das externe Spracherkennungssystem 10 verarbeitet werden soll.
  • Wenn die Sprache des Nutzers als Fahrzeugdomäne klassifiziert wird (Ja in Vorgang 1300), wird die Sprache des Nutzers in dem Spracherkennungssystem für das Fahrzeug 100 verarbeitet (1400), und wenn die Sprache des Nutzers als externer Bereich klassifiziert wird (Nein in Vorgang 1300), wird die Sprache des Nutzers an das externe Spracherkennungssystem 10 übertragen (1500).
  • Damit die Sprache des Nutzers in dem Spracherkennungssystem für das Fahrzeug 100 verarbeitet werden kann, kann der aus der Sprache des Nutzers umgewandelte Text in das Modul zum Verstehen natürlicher Sprache 140 eingegeben werden. Der Text, der in das Modul zum Verstehen natürlicher Sprache 140 eingegeben wird, kann der Text sein, der in Vorgang 1100 vorverarbeitet wurde.
  • Auch die während der Domänenklassifizierung gewonnenen Informationen, wie etwa die Erkennung von Entitätsnamen, die Erkennung von Absichten, die Erkennung von Schlitzen bzw. Slots oder dergleichen können in dem Modul zum Verstehen natürlicher Sprache 140 oder in dem Ergebnisverarbeitungsmodul 150 verwendet werden.
  • Wenn alle in dem Modul zum Verstehen natürlicher Sprache (140) zu erfassenden Informationen, wie etwa eine Domäne, eine Absicht, eine Entität usw., im Domänenklassifizierungsmodul (130) erhalten wurden, können die erhaltenen Informationen direkt in das Ergebnisverarbeitungsmodul (150) eingegeben werden.
  • Obwohl in der oben beschriebenen Ausführungsform ein einziges externes Spracherkennungssystem 10 beschrieben wird, können zwei oder mehr externe Spracherkennungssysteme 10, die mit dem Fahrzeug 200 verbunden sind, außer dem Spracherkennungssystem für das Fahrzeug 100 vorhanden sein. Wenn zum Beispiel zwei externe Spracherkennungssysteme 10, die mit dem Fahrzeug 200 verknüpft sind, vorhanden sind, kann die Sprache eines Nutzers als eine Fahrzeugdomäne, eine erste externe Domäne oder eine zweite externe Domäne durch Domänenklassifizierungsvorgänge klassifiziert werden, was unten beschrieben wird.
  • Obwohl die Vorgänge 1400 und 1500 in dem Ablaufdiagramm von 5 dargestellt sind, um Prozesse nach der Domänenklassifizierung zu beschreiben, muss das Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform die Vorgänge 1400 und 1500 nicht notwendigerweise enthalten. Auch die Vorverarbeitung von Text muss in dem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform nicht enthalten sein.
  • 6 ist ein Ablaufdiagramm, das die Vorgänge zur Klassifizierung einer Domäne in einem Verfahren zur Bestimmung eines Fahrzeugdomäne gemäß einer Ausführungsform veranschaulicht.
  • Wie in 6 dargestellt, kann zur Klassifizierung einer Domäne (1200) eine schlüsselwortbasierte Domänenklassifizierung durchgeführt werden (1210). Wenn die Domäne durch die schlüsselwortbasierte Domänenklassifizierung erfolgreich klassifiziert wurde (Ja in Vorgang 1220), kann je nachdem, ob es sich bei der klassifizierten Domäne um die Fahrzeugdomäne oder die externe Domäne (1300) handelt, der Vorgang 1400 oder der Vorgang 1500 durchgeführt werden.
  • Wenn die Domäne durch die schlüsselwortbasierte Domänenklassifizierung (Nein in Vorgang 1220) nicht erfolgreich klassifiziert wurde, kann eine lernbasierte Domänenklassifizierung durchgeführt werden (1230).
  • Mit anderen Worten, die schlüsselwortbasierte Domänenklassifizierung und die lernbasierte Domänenklassifizierung werden nacheinander durchgeführt, aber wenn die Domänenklassifizierung durch die schlüsselwortbasierte Domänenklassifizierung erfolgreich durchgeführt wurde, kann die Domänenklassifizierung beendet werden, ohne die lernbasierte Domänenklassifizierung durchzuführen.
  • 7 bis 10 sind Diagramme, die die Vorgänge der schlüsselwortbasierten Domänenklassifizierung in einem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform veranschaulichen.
  • Bei der schlüsselwortbasierten Domänenklassifizierung (1210) kann eine Domäne der Sprache des Nutzers auf Grundlage zuvor gespeicherter schlüsselwortbezogener Informationen klassifiziert werden.
  • Für die schlüsselwortbasierte Domänenklassifizierung (1210) kann eine Schlüsselworterkennung und/oder eine Mustererkennung und/oder eine Erkennung von Entitätsnamen durchgeführt werden. Gemäß der Ausführungsform wird als Beispiel beschrieben, dass die Erkennung von Schlüsselwörtern, Mustern und Entitätsnamen nacheinander durchgeführt wird.
  • Unter Bezugnahme auf 7 können die zuvor gespeicherten schlüsselwortbezogenen Informationen ein fahrzeugbezogenes Schlüsselwort enthalten, das in einer Schlüsselwortdatenbank (DB) in einem Speicher gespeichert sein kann. Zum Beispiel kann ein fahrzeugbezogenes Schlüsselwort, wie etwa eine Route, Bluetooth, Radio, Anruf, Karte, Bildschirm, Stornierung, Verbindung, Wiedergabe und dergleichen, in der Schlüsselwort-DB gespeichert werden.
  • Wenn eine Satzstruktur der Sprache des Nutzers „Substantiv + Substantiv“ enthält und eine Kombination von fahrzeugbezogenen Schlüsselwörtern, die in der Schlüsselwort-DB gespeichert sind, in der Sprache des Nutzers enthalten sind, kann die Sprache des Nutzers als die Fahrzeugdomäne klassifiziert werden.
  • Wenn die Sprache des Nutzers zum Beispiel eine Kombination von fahrzeugbezogenen Schlüsselwörtern enthält, die in der Schlüsselwort-DB gespeichert sind, wie etwa „Route + Stornierung“, „Bluetooth + Wiedergabe“, „Karte + Bildschirm“ oder „Anruf + Verbindung“, kann die Sprache des Nutzers als die Fahrzeugdomäne klassifiziert werden.
  • Unter Bezugnahme auf 8 können die zuvor gespeicherten schlüsselwortbezogenen Informationen ein Muster umfassen, das durch ein fahrzeugbezogenes Schlüsselwort und ein Prädikat definiert ist, das in einer Muster-DB im Speicher gespeichert werden kann. Zum Beispiel kann ein vordefiniertes Muster, wie „Anruf + tätigen“ und „Einschalten + Radio“, in der Muster-DB gespeichert werden. Das Muster kann aus einer Vielzahl von Beispielsätzen generiert werden, die als Fahrzeugdomäne klassifiziert sind.
  • Wenn eine Satzstruktur der Sprache des Nutzers „Prädikat + Substantiv“ enthält, bestimmt das Domänenklassifizierungsmodul 130, ob ein in der Muster-DB gespeichertes Muster in der Sprache des Nutzers enthalten ist.
  • Wenn das zuvor gespeicherte Muster in der Sprache des Nutzers enthalten ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in die Fahrzeugdomäne klassifizieren.
  • Unter Bezugnahme auf 9 können die zuvor gespeicherten schlüsselwortbezogenen Informationen einen fahrzeugbezogenen Entitätsnamen enthalten, der in einem Fahrzeugentitätsnamen-DB gespeichert sein kann. Der Fahrzeug-Entitätsnamen-DB kann zum Beispiel einen Personennamen-DB, einen Funkfrequenznummern-DB oder einen POI-Namen (Point of Interest) enthalten.
  • Wenn eine Satzstruktur der Sprache des Nutzers „Eigenname + Prädikat“ enthält und ein Eigenname in der Sprache des Nutzers dem fahrzeugbezogenen Entitätsnamen entspricht, der in der Fahrzeugentitätsnamen-DB gespeichert ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in die Fahrzeugdomäne klassifizieren.
  • Bezugnehmend auf 10 können die zuvor gespeicherten schlüsselwortbezogenen Informationen einen Entitätsnamen enthalten, der sich auf einen vom externen Spracherkennungssystem 10 bereitgestellten Dienst bezieht, d.h. einen externen Entitätsnamen, und der externe Entitätsname kann in einer externen Entitätsnamen-DB gespeichert werden. Der externe Entitätsname-DB kann zum Beispiel eine Musik-DB, eine Aktienkurs-DB oder eine Prominenten-DB enthalten.
  • Wenn eine Satzstruktur der Sprache des Nutzers „Eigenname + Prädikat“ enthält und ein Eigenname in der Sprache des Nutzers dem externen Entitätsnamen entspricht, der in der DB der externen Entitätsnamen gespeichert ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in die externe Domäne klassifizieren.
  • Hierbei können die Erkennung von Schlüsselwörtern, die Mustererkennung und die Erkennung von Entitätsnamen nacheinander durchgeführt werden. Wenn zum Beispiel ein Bereich durch die Schlüsselwort-Erkennung klassifiziert wird, kann die Bereichsklassifizierung beendet werden, und wenn der Bereich nicht klassifiziert ist, kann die Mustererkennung durchgeführt werden. Wenn die Domäne durch die Mustererkennung klassifiziert wird, kann die Domänenklassifizierung enden, und wenn die Domäne nicht klassifiziert ist, kann die Erkennung des Entitätsnamens durchgeführt werden.
  • Bei der Erkennung des Entitätsnamens kann zunächst festgestellt werden, ob der Name der fahrzeugbezogenen Entität enthalten ist. Wenn der Name der fahrzeugbezogenen Einheit nicht enthalten ist, kann ermittelt werden, ob der Name der externen Einheit enthalten ist.
  • Wenn die Domänenklassifizierung auch nach Durchführung der Erkennung des Entitätsnamens fehlschlägt (Nein in Vorgang 1220), kann die lernbasierte Domänenklassifizierung durchgeführt werden (1230).
  • 11, 12 und 13 sind Diagramme, die Vorgänge der lernbasierten Domänenklassifizierung in einem Verfahren zur Bestimmung einer Fahrzeugdomäne veranschaulichen.
  • Bei der lernbasierten Domänenklassifikation (1230) kann eine Domäne der Sprache des Nutzers auf Grundlage eines trainierten Domänenklassifizierungsmodells klassifiziert werden.
  • Bei der lernbasierten Domänenklassifizierung (1230) kann eine Bereichsklassifizierung und/oder Absichtsklassifizierung und/oder Bestimmung des verfügbaren Slots durchgeführt werden. Gemäß der Ausführungsform wird als Beispiel beschrieben, dass die Bereichsklassifizierung, die Absichtsklassifizierung und die Bestimmung des verfügbaren Slots nacheinander durchgeführt werden.
  • Unter Bezugnahme auf 11 kann das trainierte Domänenklassifizierungsmodell ein Bereichsklassifizierungsmodell enthalten, das bestimmt, ob ein Ergebnis der Satzeinbettung des aus der Sprache des Nutzers umgewandelten Textes in einem Fahrzeugbereich innerhalb eines Einbettungsraums enthalten ist. Wenn das Ergebnis der Satzeinbettung nicht in dem Fahrzeugbereich enthalten ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in eine externe Domäne klassifizieren.
  • Bei der Verarbeitung natürlicher Sprache bezieht sich Einbettung auf das Ergebnis oder den Prozess der Umwandlung einer natürlichen Sprache in einen Vektor. Mit anderen Worten, durch Einbettung kann ein Wort oder ein Satz in einen Vektor umgewandelt und auf einen Vektorraum oder Einbettungsraum projiziert werden. Bei der Satzeinbettung wird ein ganzer Satz als ein Punkt im Vektorraum oder Einbettungsraum dargestellt.
  • In dem Einbettungsraum können ähnliche Wörter oder Sätze gruppiert werden, und es kann ein Abstand zwischen Vektoren berechnet werden, um den Grad der Ähnlichkeit zu bestimmen. Der Einbettungsraum kann durch das Lernen einer großen Menge an Korpus erstellt werden.
  • Unter Bezugnahme auf 12 kann das trainierte Domänenklassifizierungsmodell ein Absichtsklassifizierungsmodell umfassen, das die Absicht der Sprache des Nutzers klassifiziert. Wenn das Ergebnis der Satzeinbettung in dem Fahrzeugbereich enthalten ist, kann das Domänenklassifizierungsmodul 130 die Absicht der Sprache des Nutzers auf Grundlage des Absichtsklassifizierungsmodells klassifizieren.
  • Zu diesem Zweck kann die fahrzeugbezogene Absicht in einer fahrzeugbezogenen Absichts-DB und die externe Absicht in einer externen Absichts-DB gespeichert werden. Die fahrzeugbezogene Absicht kann eine Absicht umfassen, die von dem Spracherkennungssystem für das Fahrzeug 100 verarbeitet werden kann oder hauptsächlich in dem Spracherkennungssystem für das Fahrzeug 100 verarbeitet wird. Die externe Absicht kann eine Absicht enthalten, der von dem externen Spracherkennungssystem 10 verarbeitet werden kann oder hauptsächlich in dem externen Spracherkennungssystem 10 verarbeitet wird. Zum Beispiel kann eine Absicht wie [Suche. Wetter] oder [Suche. Musik] als externe Absicht klassifiziert werden.
  • Wenn die vom Absichtsklassifizierungsmodell klassifizierte Absicht in der externen Absicht enthalten ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in der externen Domäne klassifizieren.
  • Wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht nicht in der externen Absicht enthalten ist, kann das Domänenklassifizierungsmodul 130 einen Slot-Wert aus der Sprache des Nutzers extrahieren, wie in 13 gezeigt.
  • Ein Slot stellt eine sinnvolle bzw. bedeutsame Information dar, die sich auf eine in einer Sprache enthaltene Absicht bezieht. Der Slot kann durch einen Typ definiert werden, der eine Gruppe angibt, zu der sein Wert gehört, eine Rolle in einem Satz und einen Wert. Eine Entität kann verwendet werden, um einen Slot zu füllen.
  • Wenn der aus der Sprache des Nutzers extrahierte Slot-Wert nicht in einem Fahrzeugsteuerungsziel enthalten ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in die externe Domäne klassifizieren. Das Fahrzeugsteuerungsziel kann Komponenten des Fahrzeugs oder in dem Fahrzeug steuerbare Komponenten enthalten und kann in einem Fahrzeugsteuerungsziel-DB gespeichert werden.
  • Wie in 13 gezeigt, ist, wenn die Sprache des Nutzers „Head-up-Display einschalten“ lautet, eine Absicht [Fahrzeugsteuerungsziel einschalten], und ein Slot-Wert ist ein Head-up-Display. Wenn der Nutzer „Bremslichter einschalten“ sagt, lautet die Absicht [Fahrzeugsteuerungsziel einschalten], und der Slot-Wert ist Bremslichter.
  • Da der aus der Sprache des Nutzers extrahierte Slot-Wert in der Ziel-DB der Fahrzeugsteuerung enthalten ist, klassifiziert das Domänenklassifizierungsmodul 130 in dieser Ausführungsform die Sprache des Nutzers nicht in die externe Domäne.
  • 14 ist ein schematisches Diagramm, das die Struktur eines trainierten Domänenklassifizierungsmodells zeigt, das in einem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform verwendet wird.
  • Ein trainiertes Domänenklassifizierungsmodell gemäß der Offenlegung kann ein Modell sein, das in der Lage ist, die Absicht oder einen Slot aus einem Eingabesatz zu extrahieren, indem sowohl ein Satz als auch die Absicht oder der Slot des Satzes durch einen Deep-Learning-Algorithmus trainiert werden.
  • Gemäß einer Ausführungsform von 14 können ein Forward Long Short Term Memory LSTM und ein Backward LSTM, die eine Klasse eines rekurrenten neuronalen Netzes (RNN) sind, verwendet werden, um eine Kodierungsschicht zu implementieren, und ein Entitätsname kann durch eine bedingte Zufallsfeldschicht (CRF) berücksichtigt werden.
  • Die Struktur des Domänenklassifizierungsmodells aus 14 ist jedoch nur ein Beispiel für das Verfahren zur Bestimmung einer Fahrzeugdomäne, und es können auch andere Domänenklassifizierungsmodelle mit unterschiedlichen Strukturen verwendet werden.
  • Wenn der aus der Sprache des Nutzers extrahierte Slot-Wert in der Fahrzeugsteuerungs-Ziel-DB enthalten ist, kann das Domänenklassifizierungsmodul 130 einen Vorgang zur Neueinstellung eines Konfidenzwertes durchführen.
  • 15 ist ein Diagramm zur Veranschaulichung der Vorgänge bei der Neueinstellung eines Konfidenzwertes in einem Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform.
  • Wie indem linken Diagramm von 15 gezeigt, wird die lernbasierte Datenklassifikation wahrscheinlich einen hohen Konfidenzwert für unbekannte Daten c1 haben und ein falsches Ergebnis ausgeben. Das Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß einer Ausführungsform kann einen Prozess der erneuten Überprüfung umfassen, ob die Sprache eines Nutzers als Fahrzeugdomäne zu klassifizieren ist, indem die oben beschriebenen Merkmale des trainierten Domänenklassifizierungsmodells berücksichtigt werden.
  • Zu diesem Zweck kann durch Anwendung einer neuen Verlustfunktion auf das bereits trainierte Domänenklassifizierungsmodell ein erneutes Training durchgeführt werden, so dass eine gleichmäßige Verteilung des Konfidenzwerts in Bezug auf die unbekannten Daten ausgegeben werden kann, wie im rechten Diagramm von 15 dargestellt.
  • Wenn der aus der Sprache des Nutzers extrahierte Slot-Wert in der Fahrzeugsteuerungs-Ziel-DB enthalten ist, kann das Domänenklassifizierungsmodul 130 einen eingestellten Konfidenzwert von dem Domänenklassifizierungsmodell erhalten, das zum Einstellen des Konfidenzwerts neu trainiert wurde. Wenn der eingestellte Konfidenzwert einen Schwellenwert überschreitet, kann das Domänenklassifizierungsmodul 130 schließlich die Sprache des Nutzers in die Fahrzeugdomäne klassifizieren (Ja in Vorgang 1300). Wenn der eingestellte Konfidenzwert kleiner oder gleich dem Schwellenwert ist, kann das Domänenklassifizierungsmodul 130 die Sprache des Nutzers in die externe Domäne klassifizieren (Nein in Vorgang 1300).
  • Wie aus den obigen Ausführungen ersichtlich, können das Verfahren zur Bestimmung einer Fahrzeugdomäne und das Spracherkennungssystem für das Fahrzeug in einer Umgebung, in der mehrere Spracherkennungssysteme verwendet werden können, die eingegebene Sprache eines Nutzers in eine Fahrzeugdomäne, die ein vom Spracherkennungssystem für das Fahrzeug zu verarbeitendes Objekt ist, oder eine externe Domäne, die ein von einem externen Spracherkennungssystem zu verarbeitendes Objekt ist, klassifizieren. Das Verfahren zur Bestimmung einer Fahrzeugdomäne und das Spracherkennungssystem für das Fahrzeug können auch die Verarbeitung der Sprache des Nutzers durch das Spracherkennungssystem für das Fahrzeug oder das externe Spracherkennungssystem auf Grundlage eines Ergebnisses der Klassifizierung ermöglichen. Somit können das Verfahren zur Bestimmung einer Fahrzeugdomäne und das Spracherkennungssystem für das Fahrzeug einen auf die Absicht des Nutzers zugeschnittenen Dienst bereitstellen.
  • Ein Verfahren zur Bestimmung einer Fahrzeugdomäne gemäß den Ausführungsformen kann daher in Form eines Aufzeichnungsmediums implementiert werden, das computerausführbare Anweisungen speichert, die von einem Prozessor ausgeführt werden können. Die Anweisungen können in Form eines Programmcodes gespeichert werden, und wenn sie von einem Prozessor ausgeführt werden, können die Anweisungen ein Programmmodul erzeugen, um Vorgänge der offenbarten Ausführungsformen durchzuführen. Das Aufzeichnungsmedium kann als nichtflüchtiges, computerlesbares Aufzeichnungsmedium implementiert werden.
  • Der computerlesbare Code kann auf einem Medium aufgezeichnet oder über das Internet übertragen werden. Der Datenträger kann einen Festwertspeicher (ROM), einen Direktzugriffsspeicher (RAM), Magnetbänder, Magnetplatten, Flash-Speicher und optische Aufzeichnungsmedien umfassen.
  • Obgleich die Ausführungsformen zur Veranschaulichung beschrieben wurden, wird ein Fachmann erkennen, dass verschiedene Änderungen, Ergänzungen und Ersetzungen möglich sind, ohne vom Schutzumfang und Grundgedanken der Offenbarung abzuweichen. Daher wurden die Ausführungsformen nicht zu Zwecken der Einschränkung beschrieben.

Claims (20)

  1. Verfahren zur Bestimmung einer Fahrzeugdomäne, wobei das Verfahren umfasst: Umwandeln einer Sprache eines Nutzers in Text; und Klassifizieren der Sprache des Nutzers in eine Fahrzeugdomäne oder eine externe Domäne auf Grundlage des Textes, wobei das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne das Klassifizieren einer Domäne der Sprache des Nutzers auf Grundlage von zuvor gespeicherten schlüsselwortbezogenen Informationen und dann das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage eines trainierten Domänenklassifizierungsmodells umfasst.
  2. Verfahren nach Anspruch 1, wobei, wenn die Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen nicht in die externe Domäne klassifiziert wird, das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells umfasst.
  3. Verfahren nach Anspruch 2, wobei das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne ferner das Einstellen eines Konfidenzwertes des trainierten Domänenklassifizierungsmodells umfasst.
  4. Verfahren nach Anspruch 3, wobei das Einstellen des Konfidenzwertes des trainierten Domänenklassifizierungsmodells ein neu trainiertes Domänenklassifizierungsmodell verwendet, um den Konfidenzwert einzustellen.
  5. Verfahren nach Anspruch 3, wobei, wenn die Sprache des Nutzers nicht auf Grundlage des trainierten Domänenklassifizierungsmodells in die externe Domäne klassifiziert wird, das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne oder die externe Domäne den Konfidenzwert des trainierten Domänenklassifizierungsmodells neu einstellt.
  6. Verfahren nach Anspruch 1, wobei die zuvor gespeicherte schlüsselwortbezogene Information ein fahrzeugbezogenes Schlüsselwort enthält, und wobei das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne umfasst, wenn das fahrzeugbezogene Schlüsselwort oder eine Kombination der fahrzeugbezogenen Schlüsselwörter in der Sprache des Nutzers enthalten ist.
  7. Verfahren nach Anspruch 1, wobei die zuvor gespeicherte schlüsselwortbezogene Information ein Muster enthält, das durch ein fahrzeugbezogenes Schlüsselwort und ein Prädikat definiert ist, und wobei das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne umfasst, wenn das definierte Muster in der Sprache des Nutzers enthalten ist.
  8. Verfahren nach Anspruch 1, wobei die zuvor gespeicherte schlüsselwortbezogene Information einen fahrzeugbezogenen Entitätsnamen enthält, und wobei das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen das Klassifizieren der Sprache des Nutzers in die Fahrzeugdomäne umfasst, wenn der fahrzeugbezogene Entitätsname in der Sprache des Nutzers enthalten ist.
  9. Verfahren nach Anspruch 1, wobei das trainierte Domänenklassifizierungsmodell ein Bereichsklassifizierungsmodell umfasst, das ein Ergebnis einer Satzeinbettung des aus der Sprache des Nutzers umgewandelten Textes in einen Fahrzeugbereich oder einen anderen Bereich innerhalb eines Einbettungsraums klassifiziert, und wobei das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells das Klassifizieren der Sprache des Nutzers in die externe Domäne umfasst, wenn das Ergebnis der Satzeinbettung des Textes nicht in dem Fahrzeugbereich enthalten ist.
  10. Verfahren nach Anspruch 1, wobei das trainierte Domänenklassifizierungsmodell ein Absichtsklassifikationsmodell umfasst, das eine Absicht der Sprache des Nutzers klassifiziert, und wobei das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells das Klassifizieren der Sprache des Nutzers in die externe Domäne umfasst, wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht in einer externen Absicht enthalten ist.
  11. Verfahren nach Anspruch 10, wobei das Klassifizieren der Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells umfasst, wenn die durch das Absichtsklassifizierungsmodell klassifizierte Absicht nicht in der externen Absicht enthalten ist, Extrahieren eines Slot-Werts aus der Sprache des Nutzers, und wenn der extrahierte Slot-Wert nicht in einem fahrzeugbezogenen Slot enthalten ist, Klassifizieren der Sprache des Nutzers in die externe Domäne.
  12. Spracherkennungssystem für ein Fahrzeug, aufweisend: ein Spracherkennungsmodul, das konfiguriert ist, eine Sprache eines Nutzers in Text umzuwandeln; und ein Domänenklassifizierungsmodul, das konfiguriert ist, die Sprache des Nutzers auf Grundlage des Textes in eine Fahrzeugdomäne oder eine externe Domäne zu klassifizieren, wobei das Domänenklassifizierungsmodul konfiguriert ist, eine Domäne der Sprache des Nutzers auf Grundlage von zuvor gespeicherten schlüsselwortbezogenen Informationen zu klassifizieren und dann die Domäne der Sprache des Nutzers auf Grundlage eines trainierten Domänenklassifizierungsmodells zu klassifizieren.
  13. Spracherkennungssystem für das Fahrzeug nach Anspruch 12, wobei das Domänenklassifizierungsmodul konfiguriert ist, die Domäne der Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells zu klassifizieren, wenn die Sprache des Nutzers nicht auf Grundlage der zuvor gespeicherten schlüsselwortbezogenen Informationen in die externe Domäne klassifiziert wird.
  14. Spracherkennungssystem für das Fahrzeug nach Anspruch 13, wobei das Domänenklassifizierungsmodul konfiguriert ist, einen Konfidenzwert des trainierten Domänenklassifizierungsmodells einzustellen.
  15. Spracherkennungssystem für das Fahrzeug nach Anspruch 14, wobei das Domänenklassifizierungsmodul ein neu trainiertes Domänenklassifizierungsmodell verwendet, um den Konfidenzwert einzustellen.
  16. Spracherkennungssystem für das Fahrzeug nach Anspruch 14, wobei das Domänenklassifizierungsmodul konfiguriert ist, den Konfidenzwert des trainierten Domänenklassifizierungsmodells neu einzustellen, wenn die Sprache des Nutzers auf Grundlage des trainierten Domänenklassifizierungsmodells nicht in die externe Domäne klassifiziert wird.
  17. Spracherkennungssystem für das Fahrzeug nach Anspruch 12, wobei die zuvor gespeicherte schlüsselwortbezogene Information ein fahrzeugbezogenes Schlüsselwort enthält, und wobei das Domänenklassifizierungsmodul konfiguriert ist, die Sprache des Nutzers in die Fahrzeugdomäne zu klassifizieren, wenn das fahrzeugbezogene Schlüsselwort oder eine Kombination der fahrzeugbezogenen Schlüsselwörter in der Sprache des Nutzers enthalten ist.
  18. Spracherkennungssystem für das Fahrzeug nach Anspruch 12, wobei die zuvor gespeicherte schlüsselwortbezogene Information ein Muster enthält, das durch ein fahrzeugbezogenes Schlüsselwort und ein Prädikat definiert ist, und wobei das Domänenklassifizierungsmodul konfiguriert ist, um die Sprache des Nutzers in die Fahrzeugdomäne zu klassifizieren, wenn das definierte Muster in der Sprache des Nutzers enthalten ist.
  19. Spracherkennungssystem für das Fahrzeug nach Anspruch 12, wobei die zuvor gespeicherte schlüsselwortbezogene Information einen fahrzeugbezogenen Entitätsnamen enthält, und wobei das Domänenklassifizierungsmodul konfiguriert ist, die Sprache des Nutzers in die Fahrzeugdomäne zu klassifizieren, wenn der fahrzeugbezogene Entitätsname in der Sprache des Nutzers enthalten ist.
  20. Spracherkennungssystem für das Fahrzeug nach Anspruch 12, wobei das trainierte Domänenklassifizierungsmodell ein Bereichsklassifikationsmodell umfasst, das ein Ergebnis einer Satzeinbettung des aus der Sprache des Nutzers umgewandelten Textes in einen Fahrzeugbereich oder einen anderen Bereich innerhalb eines Einbettungsraums klassifiziert, und wobei das Domänenklassifizierungsmodul konfiguriert ist, die Sprache des Nutzers in die externe Domäne zu klassifizieren, wenn das Ergebnis der Satzeinbettung des Textes nicht in dem Fahrzeugbereich enthalten ist.
DE102022213210.6A 2021-12-08 2022-12-07 Verfahren zur Bestimmung einer Fahrzeugdomäne und ein Spracherkennungssystem für ein Fahrzeug Pending DE102022213210A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KP10-2021-0175090 2021-12-08
KR1020210175090A KR20230086454A (ko) 2021-12-08 2021-12-08 차량 도메인 판단 방법 및 차량용 음성 인식 시스템

Publications (1)

Publication Number Publication Date
DE102022213210A1 true DE102022213210A1 (de) 2023-06-15

Family

ID=86499225

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102022213210.6A Pending DE102022213210A1 (de) 2021-12-08 2022-12-07 Verfahren zur Bestimmung einer Fahrzeugdomäne und ein Spracherkennungssystem für ein Fahrzeug

Country Status (4)

Country Link
US (1) US20230178071A1 (de)
KR (1) KR20230086454A (de)
CN (1) CN116246611A (de)
DE (1) DE102022213210A1 (de)

Also Published As

Publication number Publication date
CN116246611A (zh) 2023-06-09
KR20230086454A (ko) 2023-06-15
US20230178071A1 (en) 2023-06-08

Similar Documents

Publication Publication Date Title
DE102020205786B4 (de) Spracherkennung unter verwendung von nlu (natural language understanding)-bezogenem wissen über tiefe vorwärtsgerichtete neuronale netze
DE112017004374B4 (de) System und Verfahren zur Spracherkennung
DE60033733T2 (de) Datenbankabfragesystem basierend auf Spracherkennung
DE60032193T2 (de) Verfahren und System zur Auswahl erkannter Wörter bei der Korrektur erkannter Sprache
DE112014006542B4 (de) Einrichtung und Verfahren zum Verständnis von einer Benutzerintention
DE60005326T2 (de) Erkennungseinheiten mit komplementären sprachmodellen
DE60004862T2 (de) Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem
DE112014002819B4 (de) System und Verfahren zur Erkennung von Sprache
DE102017124264B4 (de) Computerimplementiertes Verfahren und Rechensystem zum Bestimmen phonetischer Beziehungen
DE112017004397T5 (de) System und Verfahren zur Einstufung von hybriden Spracherkennungsergebnissen mit neuronalen Netzwerken
EP0925578B1 (de) Sprachverarbeitungssystem und verfahren zur sprachverarbeitung
DE102018113034A1 (de) Stimmenerkennungssystem und stimmenerkennungsverfahren zum analysieren eines befehls, welcher mehrere absichten hat
WO2000025299A1 (de) Verfahren und anordnung zur klassenbildung für ein sprachmodell basierend auf linguistischen klassen
DE102019004300A1 (de) Verwendung eines dynamischen speichernetzwerks zum verfolgen digitaler dialogzustände und erzeugen von antworten
DE60133537T2 (de) Automatisches umtrainieren eines spracherkennungssystems
DE102015106280B4 (de) Systeme und Verfahren zum Kompensieren von Sprachartefakten in Spracherkennungssystemen
DE102005018174A1 (de) Verfahren zur gezielten Ermittlung eines vollständigen Eingabedatensatzes in einem Sprachdialog 11
DE102015109379A1 (de) Systeme und Verfahren für ein Navigationssystem, das eine Suche mit Diktieren und Teilübereinstimmung verwendet
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE112022000504T5 (de) Interaktive Inhaltsausgabe
EP1058235A2 (de) Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese
DE102020215954A1 (de) Dialogsystem und verfahren zum steuern desselben
DE112021000292T5 (de) Sprachverarbeitungssystem
DE102013219649A1 (de) Verfahren und System zum Erstellen oder Ergänzen eines benutzerspezifischen Sprachmodells in einem mit einem Endgerät verbindbaren lokalen Datenspeicher
DE102019218918A1 (de) Dialogsystem, elektronisches gerät und verfahren zur steuerung des dialogsystems