WO2011054324A1 - System und methode zur spracherfassung von strukturierten daten - Google Patents

System und methode zur spracherfassung von strukturierten daten Download PDF

Info

Publication number
WO2011054324A1
WO2011054324A1 PCT/DE2009/001559 DE2009001559W WO2011054324A1 WO 2011054324 A1 WO2011054324 A1 WO 2011054324A1 DE 2009001559 W DE2009001559 W DE 2009001559W WO 2011054324 A1 WO2011054324 A1 WO 2011054324A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
schema
applies regardless
grammar
recognition
Prior art date
Application number
PCT/DE2009/001559
Other languages
English (en)
French (fr)
Inventor
Bertram Stoll
Original Assignee
Bertram Stoll
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bertram Stoll filed Critical Bertram Stoll
Priority to PCT/DE2009/001559 priority Critical patent/WO2011054324A1/de
Priority to DE112009005347T priority patent/DE112009005347A5/de
Publication of WO2011054324A1 publication Critical patent/WO2011054324A1/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules

Definitions

  • Drawing 1 shows a block diagram of the structure of the overall system with the following details:
  • Speech recognition application 7 usable grarnmatikbecast created.
  • audio device to 7) is passed.
  • messages from the speech recognition software are dynamically returned through a feedback channel (speaker) to the user.
  • Drawing 1 gives a schematic overview of the components used. It should be noted that an implementation may differ in detail from these components. Components may be added, components omitted or otherwise arranged. The central statement of the claims asserted below should not be affected by this.
  • Tree maintenance data schema in a relational geodatabase a grammar for controlling a speech recognition application. This application allows you to insert, delete, and modify existing database entities of type tree, with all commands and setting the
  • Attribute values of a concrete entity via voice input It is a pure human - machine communication without any intermediary human intermediaries (agents).
  • the machine gives feedback to the user via a TTS (text to speech engine).

Abstract

Bislang ist mir kein Verfahren bekannt, welches direkt durch Ausnutzung vorhandener Datenschemata eine Grammatik zur Konfiguration einer Spracherkennungssoftware erstellt, um damit den Erkennungsgrad zu verbessern und direkt Instanzen des Datenschemas zu erzeugen. Der Erkennungsgrad der gesprochenen Eingabe ist sehr hoch und wird in der Praxis dazu führen, dass sich diese Erfassungsform für Geodaten (Zwang zur vor Ort Erfassung) durchsetzen wird. Anwendungsgebiete können beispielsweise die Straßenbaumdokumentation oder die Straßenzustandserfassung sein. Für die Dokumentenbesprechung sind Anwendungsgebiete im Bereich der Kontrolldokumentation - beispielsweise bei Wartung und Kontrolle komplexer technischer Einrichtungen wahrscheinlich.

Description

SYSTEM UND METHODE ZUR SPRACHLICHEN ERFASSUNG VON STRUKTURIERTEN DATEN
BESCHREIBUNG
HINTERGRUND
Die vor Ort Erfassung von strukturierten Daten mit mobilen Eingabegeräten ist in den allermeisten Fällen nur sehr mühsam zu bewältigen. Erschwerende Faktoren sind in der Regel klein ausfallende Bildschirme, welche die Werteauswahl durch Stifteingabe erschweren, nicht vorhandene oder klein ausfallende Tastaturen und/oder Sonneneinstrahlung, die zu Unleserlichkeit des Bildschirms führen kann.
Um diesem Umstand entgegenzuwirken, wird ein System beschrieben, welches diese
Erschwernisse durch Spracheingabe umgeht. Ein wesentliches Merkmal ist dabei die Erlangung einer hohen Erkennungsgenauigkeit durch die automatische Auswertung und Umsetzung der vorhandenen Datenschemata in eine für diesen Spracherkennungszweck eingeschränkte und voll verwertbare Semantik.
ERLÄUTERUNGEN ZU ZEICHNUNG 1
Zeichnung 1 zeigt ein Blockdiagramm zur Struktur des Gesamtsystems mit folgenden Details:
1) Versinnbildlicht ein Datenschema. Dabei handelt es sich um stralcturierte Daten, unabhängig davon ob diese in einer Datenbank abgelegt oder beispielsweise in einem Textdokument durch Textmarken strukturiert sind.
2) Versinnbildlicht die Verbindung zwischen einem Schemaextraktor und dem Datenschema, unabhängig davon ob es sich um eine off- oder online Verbindung zum Datenschema handelt.
3) Versinnbildlicht eine Anwendung, die über 2) ein Schema generiert.
4) Versinnbildlicht den Datenfluss vom Schemaextraktor zum Grammatikgenerator.
5) Versinnbildlicht eine Anwendung, die aus dem extrahierten Schema eine für die
Spracherkennungsanwendung 7) verwertbare Grarnmatikbeschreibung erstellt.
6) Versinnbildlicht den off- oder online Datenfluss von 5) nach 7).
7) Versinnbildlicht die eigentliche Spracherkennungsanwendung.
8) Versinnbildlicht den Datenfluss von der Spracherkennungsanwendung zu einem
9) Adapter, der im off- oder online Modus
10) die Datenübertragung zur persistenten Speicherung der erfassten Operationen und Daten in einer BESCHREIBUNG
11) Instanz des Datenschemas durchführt.
12) Steht für die Spracheingabe durch den Benutzer, welche durch einen entsprechendes
13) Audiogerät an 7) weitergegeben wird. Umgekehrt werden dynamisch Meldungen der Spracherkennungssoftware durch einen Feedback Kanal (Lautsprecher) an den Benutzer zurückgegeben.
BESCHREIBUNG IM DETAIL
Zeichnung 1 gibt einen schematischen Überblick zu den eingesetzten Komponenten. Es ist zu beachten, dass eine Implementierung im Einzelnen von diesen Komponenten abweichen kann. Es können Komponenten hinzukommen, Komponenten weggelassen oder anders arrangiert werden. Die zentrale Aussage der weiter unten geltend gemachten Ansprüche soll davon nicht berührt werden.
Die ,proof-of-concep Implementierung dieses Konzeptes erzeugt aus einem
Baumpflegedatenschema in einer relationalen Geodatenbank eine Grammatik zur Steuerung einer Spracherkennungsanwendung. Diese Anwendung erlaubt das Einfügen, Löschen und Ändern vorhandener Datenbankentitäten vom Typ Baum, wobei alle Befehle und das Setzen der
Attributwerte einer konkreten Entität über Spracheingabe erfolgen. Es handelt sich dabei um eine reine Mensch - Maschine Kommunikation ohne weitere zwischengeschaltete menschliche Vermittler (Agenten). Die Maschine gibt über eine TTS (text to Speech engine) Rückmeldung an den Anwender.
Es ist unerheblich, ob die Anbindung an die Datenschemainstanz im offline oder online Modus erfolgt. Im Falle einer offline Anbindung, werden die Daten in Dateisystemdateien
zwischengespeichert und später von einem offline Adapter in die Instanz transportiert.
Des weiteren wird aus den in einem Textdokument definierten Textmarken eine Grammatik zur Besprechung des Textdokumentes erzeugt. Die Rolle der relationalen Datenbank übernimmt in diesem Falle das Textdokument.

Claims

ANSPRÜCHE Geltend gemachte Ansprüche:
1. Eine Methode, die für ein vorhandenes Datenschema eine Spracherkennungsgrammatik mit typischer - aber nicht notwendigerweise - eingeschränktem Vokabular erstellt und die einer Spracherkennungsanwendung ermöglicht, in diesem Schema definierte Datenstrukturen mit hoher Erkennungsrate natürlichsprachlich zu erfassen, zu ändern oder zu löschen.
2. Anspruch 1 gilt unabhängig von der zum Einsatz kommenden Hardware und
Betriebssystemplattform.
3. Anspruch 1 gilt unabhängig von der Art und Weise der Speicherung des
Datenschemaformates und der Daten (XML Datei, HTML Datei, durch
Positionsdefinitionen wie beispielsweise Textmarken strukturiertes Textdokument, Datenbankschema) .
4. Anspruch 1 gilt unabhängig von der zum Einsatz kommenden Spracherkennungssoftware.
5. Anspruch 1 gilt unabhängig davon, ob die erfassten oder geänderten Daten direkt (online) oder nachträglich (offline) in der Datenschemainstanz gespeichert werden.
6. Anspruch 1 gilt unabhängig davon, ob ein automatisch arbeitender Schemaextraktor
(Zeichnung 1, Detail 3) zum Einsatz kommt.
7. Anspruch 1 gilt unabhängig davon, ob ein automatisch arbeitender Grammatikgenerator (Zeichnung 1 Detail 5) zum Einsatz kommt.
PCT/DE2009/001559 2009-11-05 2009-11-05 System und methode zur spracherfassung von strukturierten daten WO2011054324A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/DE2009/001559 WO2011054324A1 (de) 2009-11-05 2009-11-05 System und methode zur spracherfassung von strukturierten daten
DE112009005347T DE112009005347A5 (de) 2009-11-05 2009-11-05 System und methode zur spracherfassung von strukturierten daten

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/DE2009/001559 WO2011054324A1 (de) 2009-11-05 2009-11-05 System und methode zur spracherfassung von strukturierten daten

Publications (1)

Publication Number Publication Date
WO2011054324A1 true WO2011054324A1 (de) 2011-05-12

Family

ID=42126038

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2009/001559 WO2011054324A1 (de) 2009-11-05 2009-11-05 System und methode zur spracherfassung von strukturierten daten

Country Status (2)

Country Link
DE (1) DE112009005347A5 (de)
WO (1) WO2011054324A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015211101A1 (de) 2015-06-17 2016-12-22 Volkswagen Aktiengesellschaft Spracherkennungssystem sowie Verfahren zum Betreiben eines Spracherkennungssystems mit einer mobilen Einheit und einem externen Server

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999930B1 (en) * 2002-03-27 2006-02-14 Extended Systems, Inc. Voice dialog server method and system
US20060064302A1 (en) * 2004-09-20 2006-03-23 International Business Machines Corporation Method and system for voice-enabled autofill
US20070061132A1 (en) * 2005-09-14 2007-03-15 Bodin William K Dynamically generating a voice navigable menu for synthesized data
US20080097760A1 (en) * 2006-10-23 2008-04-24 Sungkyunkwan University Foundation For Corporate Collaboration User-initiative voice service system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999930B1 (en) * 2002-03-27 2006-02-14 Extended Systems, Inc. Voice dialog server method and system
US20060064302A1 (en) * 2004-09-20 2006-03-23 International Business Machines Corporation Method and system for voice-enabled autofill
US20070061132A1 (en) * 2005-09-14 2007-03-15 Bodin William K Dynamically generating a voice navigable menu for synthesized data
US20080097760A1 (en) * 2006-10-23 2008-04-24 Sungkyunkwan University Foundation For Corporate Collaboration User-initiative voice service system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015211101A1 (de) 2015-06-17 2016-12-22 Volkswagen Aktiengesellschaft Spracherkennungssystem sowie Verfahren zum Betreiben eines Spracherkennungssystems mit einer mobilen Einheit und einem externen Server
US10170121B2 (en) 2015-06-17 2019-01-01 Volkswagen Ag Speech recognition system and method for operating a speech recognition system with a mobile unit and an external server

Also Published As

Publication number Publication date
DE112009005347A5 (de) 2012-08-16

Similar Documents

Publication Publication Date Title
DE102009045187B4 (de) System und Verfahren zum Kommunizieren mit Telefonagenten in einem automatisierten Call Center
EP2176858B1 (de) Verfahren zur spracherkennung
DE102015203372A1 (de) Begriffsklärung dynamischer befehle
DE102012109829A1 (de) Verfahren und Vorrichtung zum Steuern von Straßenlampen
DE102011109932B4 (de) Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung
WO2007121218A3 (en) Field device editor tool
DE10147706A1 (de) Verfahren zum Bedienen eines Feldgerätes
WO2006051076A1 (de) Verfahren zur verknüpfung von technischen daten und system zum bedienen und beobachten einer industriellen anlage
EP3095114B1 (de) Verfahren und system zur erzeugung eines steuerungsbefehls
DE2946856C2 (de) Wortspeichergerät
DE102007058651A1 (de) Verfahren zum Betrieb eines Navigationsgeräts
WO2011054324A1 (de) System und methode zur spracherfassung von strukturierten daten
DE102013114763A1 (de) Sprachsteuerungsverfahren sowie Computerprogrammprodukt und Vorrichtung zur Durchführung des Verfahrens
DE102013022164A1 (de) Ermittlung einer Formationskompatibilität zwischen einer Datenverarbeitungseinrichtung und einer weiteren Datenverarbeitungseinrichtung vor Übertragung einer Multimediadatei zwischen ihnen
Ravetz Master planning by and for the urban shared mind: towards a ‘neighbourhood 3.0’.
EP3608149A1 (de) Verfahren zum steuern einer vorrichtung zur bereitstellung einer erinnerung in einem fahrzeug sowie vorrichtung zur bereitstellung einer erinnerung in einem fahrzeug
Klaus et al. Pflegende Angehörige und Vereinbarkeit von Pflege und Beruf: Befunde aus dem Deutschen Alterssurvey 2008
DE102009049931A1 (de) Diagnose- und Wartungseinrichtung für eine Schaltanlage sowie demgemäße Schaltanlage
EP1321851A2 (de) Verfahren zum Betrieb eines Sprach-Dialogsystems
DE102006006305A1 (de) Verfahren zur Aufbereitung von Informationen für ein Sprachdialogsystem
CN206392684U (zh) 汽车侧围板件冲孔专机
DE202023104446U1 (de) System zur Spracherkennung und Transkription für Exilanten-Testimonio
DE102014101481A1 (de) Flurförderzeug mit Bedienerinformation
DE102020119980B3 (de) Sprachassistenzsystem, Verfahren und Computerprogramm zur sprachbasierten Unterstützung
DE112018007578T5 (de) Dialogsystem, das zu Semantik-Verständnis-Mapping zwischen Benutzerabsichten und Maschinenservices fähig ist

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09812414

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 4237/DELNP/2012

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 112009005347

Country of ref document: DE

Ref document number: 1120090053475

Country of ref document: DE

REG Reference to national code

Ref country code: DE

Ref legal event code: R225

Ref document number: 112009005347

Country of ref document: DE

Effective date: 20120816

122 Ep: pct application non-entry in european phase

Ref document number: 09812414

Country of ref document: EP

Kind code of ref document: A1