DE102023112331A1 - Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe - Google Patents

Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe Download PDF

Info

Publication number
DE102023112331A1
DE102023112331A1 DE102023112331.9A DE102023112331A DE102023112331A1 DE 102023112331 A1 DE102023112331 A1 DE 102023112331A1 DE 102023112331 A DE102023112331 A DE 102023112331A DE 102023112331 A1 DE102023112331 A1 DE 102023112331A1
Authority
DE
Germany
Prior art keywords
voice command
command input
display area
voice
controlling processes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102023112331.9A
Other languages
English (en)
Inventor
Jörg Jonas-Kops
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of DE102023112331A1 publication Critical patent/DE102023112331A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/017Head mounted
    • G02B27/0172Head mounted characterised by optical features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/017Head mounted
    • G02B2027/0178Eyeglass type
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

Die Erfindung betrifft ein Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe mit den Verfahrensschritten Darstellen von Sprachbefehlseingabemöglichkeiten auf einer Anzeigeeinrichtung, Erfassen einer Sprachbefehlseingabe, Zuordnen der erfassten Sprachbefehlseingabe zu einem Prozessschritt und Starten des der Sprachbefehlseingabe zugeordneten Prozessschrittes, wobei die Anzeigeeinrichtung einen Gesamtanzeigebereich bereitstellt, wobei ein erster Anzeigebereich im Zentrum des Gesamtanzeigebereichs angeordnet wird, wobei die Fläche des ersten Anzeigebereichs kleiner ist als die Fläche des Gesamtanzeigebereichs und wobei die Sprachbefehlseingabemöglichkeiten im ersten Anzeigebereich dargestellt werden. Die Erfindung betrifft weiterhin ein Softwareprogramm und eine Datenbrille zur Ausführung des erfindungsgemäßen Verfahrens.

Description

  • Die Erfindung betrifft ein Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe mit den Verfahrensschritten Darstellen von Sprachbefehlseingabemöglichkeiten auf einer Anzeigeeinrichtung, Erfassen einer Sprachbefehlseingabe, Zuordnen der erfassten Sprachbefehlseingabe zu einem Prozessschritt und Starten des der Sprachbefehlseingabe zugeordneten Prozessschrittes, wobei die Anzeigeeinrichtung einen Gesamtanzeigebereich bereitstellt, wobei ein erster Anzeigebereich im Zentrum des Gesamtanzeigebereichs angeordnet wird, wobei die Fläche des ersten Anzeigebereichs kleiner ist als die Fläche des Gesamtanzeigebereichs und wobei die Sprachbefehlseingabemöglichkeiten im ersten Anzeigebereich dargestellt werden. Die Erfindung betrifft weiterhin ein Softwareprogramm und eine Datenbrille zur Ausführung des erfindungsgemäßen Verfahrens.
  • Stand der Technik
  • Elektronische Geräte, die Spracheingabe verstehen und umsetzen, sind bekannt. Derartige Geräte sind z.B. Navigationsgeräte, Smartphones, Smartwatches, Head-Mounted-Devices (HMD) und Augmented-Reality-Systeme (AR). Derartige Systeme werden z.B. im industriellen Bereich (insbesondere Industrie 4.0) der Predictive Maintenance (vorausschauende Wartung) eingesetzt werden, in dem Nutzer Prozesse, wie z.B.: Prüfpläne, Qualitätsprüfungen in Form von Soll-Ist-Vergleichen oder in Form von Schritt für Schritt Anleitungen abarbeiten sowie die Ergebnisse dokumentieren und analysieren.
  • Die genannten Geräte weisen verschiedene Applikationen (Apps) auf und/oder haben über eine meistens drahtlose Verbindung Zugriff auf Apps, deren Funktionen basierend auf der Spracheingabe ausgewählt werden können. Wenn ein Gerät allerdings Zugriff auf viele unterschiedliche Apps hat, kann ein Nutzer nur sehr schwer die Befehle der Spracheingabe memorieren, um auf eine bestimmte Funktion zuzugreifen.
  • Es ist daher Aufgabe der Erfindung, ein Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe bereitzustellen, mit dem ein Nutzer sicher und zuverlässig einen Prozess steuern kann sowie Fehlbedienungen und Manipulationen der Steuerung von Prozessen verringert werden.
  • Es ist ebenfalls Aufgabe der Erfindung, ein Computerprogramm zur Ausführung eines Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe bereitzustellen, mit dem ein Nutzer sicher und zuverlässig einen Prozess steuern kann sowie Fehlbedienungen und Manipulationen der Steuerung von Prozessen verringert werden.
  • Es ist ebenfalls Aufgabe der Erfindung, eine Vorrichtung zur Ausführung eines Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe bereitzustellen, mit dem ein Nutzer sicher und zuverlässig einen Prozess steuern kann sowie Fehlbedienungen und Manipulationen der Steuerung von Prozessen verringert werden.
  • Die Aufgabe wird mittels des Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe gemäß Anspruch 1 gelöst. Vorteilhafte Ausführungen der Erfindung sind in den Unteransprüchen dargelegt.
  • Das erfindungsgemäße Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe weist vier Verfahrensschritte auf: Im ersten Verfahrensschritt werden Spracheingabemöglichkeiten auf einer Anzeigeeinrichtung dargestellt. Im zweiten Verfahrensschritt wird eine Sprachbefehlseingabe erfasst. Der Nutzer gibt einen Sprachbefehl, der erfasst wird. Um einen Sprachbefehl als solchen zu erkennen, muss der Sprachbefehl einen Mindestschalldruck aufweisen, m.a.W. von einem Nutzer in einer Mindestlautstärke und/oder in einer unmittelbaren Nähe zum Mikrofon gesprochen werden. Dadurch wird einerseits sichergestellt, dass der Sprachbefehl von dem Nutzer intendiert ist, andererseits wird der Sprachbefehl deutlich von etwaig vorhandenen Hintergrundgeräuschen unterschieden.
  • Das Erfassen einer Sprachbefehlseingabe beinhaltet im Rahmen dieser Schrift das Empfangen und das Erkennen der Sprachbefehlseingabe des Nutzers. Im dritten Verfahrensschritt wird die erfasste Sprachbefehlseingabe einem Prozessschritt zugeordnet. Der Prozessschritt kann z.B. ein Schritt eines Entscheidungsbaums sein. Im vierten Verfahrensschritt wird der der erfassten Sprachbefehlseingabe zugeordnete Prozessschritt gestartet. Der Prozessschritt kann z.B. der nächste Prozessschritt des Entscheidungsbaums sein.
  • Die Anzeigeeinrichtung stellt einen Gesamtanzeigebereich bereit. Dabei ist ein erster Anzeigebereich im Zentrum des Gesamtanzeigebereichs angeordnet. Die Fläche des ersten Anzeigebereichs ist kleiner als die Fläche des Gesamtanzeigebereichs. Vorteilhafterweise werden die Spracheingabemöglichkeiten im ersten Anzeigebereich dargestellt. Dadurch sind die Spracheingabemöglichkeiten prominent im zentralen Blickfeld eines Nutzers angeordnet und deutlich gegenüber Darstellungen am Rand des Gesamtanzeigebereichs hervorgehoben. Ein Nutzer kann so schnell und zuverlässig Spracheingabemöglichkeiten erkennen und auslösen.
  • In einer weiteren Ausführung der Erfindung beträgt der Schalldruck der erfassten Spracheingabe größer 40 dB, bevorzugt größer 45 dB und besonders bevorzugt größer 55 dB. Die übliche Zimmerlautstärke beträgt rund 55 dB. Dadurch wird einerseits sichergestellt, dass die Spracheingabe intendiert ist, andererseits wird die Spracheingabe deutlich von etwaig vorhandenen Hintergrundgeräuschen über Zimmerlautstärke unterschieden. Das erfindungsgemäße Verfahren ist daher auch in Umgebungen einsetzbar, die eine hohe Umgebungslautstärke aufweisen.
  • In einer Weiterbildung der Erfindung werden die Sprachbefehlseingabemöglichkeiten ausschließlich im ersten Anzeigebereich dargestellt. Dadurch sind die Spracheingabemöglichkeiten ausschließlich prominent im zentralen Blickfeld eines Nutzers angeordnet und deutlich gegenüber Darstellungen am Rand des Gesamtanzeigebereichs hervorgehoben. Ein Nutzer kann so schnell und zuverlässig Spracheingabemöglichkeiten erkennen und auslösen.
  • In einer weiteren Gestaltung der Erfindung umfasst ein zweiter Anzeigebereich einen zweiten Teil des Gesamtanzeigebereichs. Der zweite Anzeigebereich stellt Daten dar, die für die Ausführung eines Prozessschrittes nicht notwendig sind. Insbesondere werden keine Spracheingabemöglichkeiten dargestellt. Ein Nutzer kann daher schnell und zuverlässig essentielle Daten von Spracheingabemöglichkeiten unterscheiden.
  • In einer weiteren Ausführung der Erfindung wird der zweite Anzeigebereich im Randbereich des Gesamtanzeigebereichs angeordnet. Der Randbereich einer Anzeige kann dargestellte Daten verzerrt und/oder undeutlich wiedergeben, insbesondere bei geringer Auflösung der Anzeige. Der Randbereich eignet sich daher für die Wiedergabe nicht notwendiger Daten und nutzt trotzdem den verfügbaren Platz einer Anzeige.
  • In einer optionalen Weiterbildung der Erfindung bildet der zweite Anzeigebereich einen Rahmen um den ersten Anzeigebereich. Der erste Anzeigebereich zur Darstellung der Spracheingabemöglichkeiten wird also vom zweiten Anzeigebereich zur Darstellung weniger wichtiger Daten umgeben. Ein Nutzer kann daher schnell und zuverlässig essentielle Daten von Spracheingabemöglichkeiten unterscheiden.
  • In einer weiteren Ausgestaltung der Erfindung werden im zweiten Anzeigebereich ausschließlich graphische Bildelemente dargestellt. Zur Darstellung weniger wichtiger Daten eignen sich graphische Bildelemente, z.B. Icons, die genügend deutlich wiedergegeben werden können und üblicherweise für einen Nutzer eindeutig erkennbar sind.
  • In einer weiteren Ausbildung der Erfindung werden im zweiten Anzeigebereich ausschließlich Informationen wiedergegeben. Die Informationen starten nicht unmittelbar einen Prozessschritt bzw. sind zur Steuerung eines Prozesses nicht zwingend notwendig. Derartige Informationen können z.B. Datum und Uhrzeit, Zeitdauer oder der Ladezustand des Systems zur Spracherkennung sein.
  • In einer Weiterbildung der Erfindung wird der zweite Anzeigebereich in einer anderen Farbe und/oder Helligkeitsstufe als der erste Anzeigebereich dargestellt. Dadurch wird insbesondere auch durch graphische Hervorhebung eine Unterscheidung von Spracheingabemöglichkeiten und nicht essentiellen Informationen erzielt. Ein Nutzer kann daher schnell und zuverlässig Informationen von Spracheingabemöglichkeiten unterscheiden.
  • In einer weiteren Ausführung der Erfindung umfasst das Verfahren den Verfahrensschritt Identifikation der Spracheingabe als Sprachbefehl zur Ausführung eines Prozessschrittes. Die Identifikation kann z.B. mittels einer Suche nach und Erkennung von Schlüsselworten als Sprachbefehl durchgeführt werden.
  • In einer weiteren Gestaltung der Erfindung erfolgt nach Erfassen der Sprachbefehlseingabe eine erste visuelle Ausgabe im ersten Anzeigebereich. Die erste Ausgabe kann z.B. ein Symbol, ein Icon oder eine schriftliche Ausgabe sein. Der Nutzer erhält durch die erste Ausgabe eine Rückmeldung über den identifizierten Sprachbefehl und kann sich so vergewissern, dass seine Spracheingabe richtig erkannt ist.
  • In einer weiteren Ausbildung der Erfindung wird in der ersten Ausgabe der erkannte Sprachbefehl wiederholt. Die Wiederholung ist eine einfache, aber zuverlässige Methode, dem Nutzer anzuzeigen, dass der von ihm gegebene Sprachbefehl korrekt erfasst wurde. Der Nutzer kann daher schnell erkennen, ob der identifizierte Sprachbefehl dem von ihm intendierten Sprachbefehl entspricht.
  • In einer weiteren Ausführung der Erfindung umfasst die erste Ausgabe eine neue Spracheingabemöglichkeit. Der Nutzer erhält die Möglichkeit, eine neue Spracheingabe zu geben. Die neue Spracheingabe kann z.B. eine Annullierung oder eine Bestätigung der ursprünglichen Spracheingabe beinhalten.
  • In einer weiteren Gestaltung der Erfindung erfolgt die erste Ausgabe der neuen Spracheingabemöglichkeit zusammen mit anderen Spracheingabemöglichkeiten. Der Nutzer erhält die Möglichkeit, neue Spracheingaben zu geben. Die Spracheingabemöglichkeiten können z.B. Annullierung oder Bestätigung der ursprünglichen Spracheingabe oder weitere Prozessschritte sein.
  • In einer weiteren Ausgestaltung der Erfindung wird der dem identifizierten Sprachbefehl zugeordnete Prozessschritt nach Erfassen und Zuordnen des Sprachbefehls gestartet, wenn der Sprachbefehl solitär erfasst wird. Jede Spracheingabe eines Nutzers wird nur auf einen Sprachbefehl geprüft, und in jeder Spracheingabe wird nur ein Sprachbefehl identifiziert. Dies erleichtert einem Nutzer die Nachvollziehbarkeit seiner Spracheingaben, Verwirrung durch Mehrfachbefehle wird vermieden.
  • In einer weiteren Ausführung der Erfindung ist die Anzeigeeinrichtung in eine Datenbrille integriert. Die Datenbrille ist während des Verfahrens mit einem Computer verbunden, der die geeignete und ausreichende Hardware-Ausstattung aufweist. Weitere Hardware kann über die Kopplung über geeignete Kommunikationsschnittstellen mit der Datenbrille verbunden sein. Sie wird dann als zur Datenbrille gehörig gezählt, wenn ein entsprechendes der Hardware zugeordnetes Treiberprogramm auf der Datenbrille ausgeführt wird.
  • Die Aufgabe wird ebenfalls mittels des Softwareprogramms zur Durchführung des Verfahrens gemäß Anspruch 18 gelöst.
  • Das erfindungsgemäße Softwareprogramm ist geeignet, das Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe durchzuführen. Das Softwareprogramm nutzt die Hardware der Datenbrille zur Eingabe von Sprachbefehlen und Ausgabe von Bestätigung bzw. Widerruf der eingegebenen Sprachbefehle.
  • Die Aufgabe wird außerdem durch die Datenbrille gemäß Anspruch 19 gelöst.
  • Die erfindungsgemäße Datenbrille zur Ausführung des erfindungsgemäßen Verfahrens weist eine Anzeigeeinrichtung zur Darstellung von Spracheingabemöglichkeiten auf. Die Anzeigeeinrichtung ist permanent im Sichtfeld des Nutzers angeordnet, z.B. mittels eines AR-Systems.
  • Weiterhin weist das System ein Mikrophon zum Erfassen von gesprochenen Spracheingabemöglichkeiten auf. Das Mikrofon kann permanent im Sprachfeld des Nutzers angeordnet sein, z.B. mittels eines AR-Systems.
  • Außerdem weist das System eine Computereinheit zur Ausführung eines Softwareprogramms zur Durchführung des Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe auf. Die Computereinheit kann ein Wearable wie Smartphone, Smartwatch sein oder innerhalb eines AR-Systems angeordnet sein. Möglich ist aber auch eine stationäre Computereinheit, mit der ein Wearable mittels Kabelverbindung oder kabelloser Verbindung verbunden ist.
  • In einer Weiterbildung der Erfindung verfügt die Datenbrille ausschließlich über ein Mikrofon zur Befehlseingabe durch einen Nutzer. Das Mikrofon ist derart an der Datenbrille angeordnet, dass ein Nutzer komfortabel und sicher einen Spracheingabebefehl geben kann. Durch das System sind Spracheingabebefehle mit einem Schalldruck von mindestens 10 dB, bevorzugt mindestens 40 dB und besonders bevorzugt mindestens 55 dB erfassbar.
  • Ausführungsbeispiele des erfindungsgemäßen Systems und des erfindungsgemäßen Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe sind in den Zeichnungen schematisch vereinfacht dargestellt und werden in der nachfolgenden Beschreibung näher erläutert.
  • Es zeigen:
    • 1: Ansicht eines Ausführungsbeispiels des erfindungsgemäßen Systems
    • 2: Die Anzeige von Spracheingabemöglichkeiten
    • 3: Weitere Anzeige von Spracheingabemöglichkeiten
    • 4: Ausgabe einer neuen Spracheingabemöglichkeit
    • 5: Weitere Anzeige von Spracheingabemöglichkeiten
    • 6: Ein Ablaufdiagramm des erfindungsgemäßen Verfahrens
  • 1 zeigt eine Ansicht eines Ausführungsbeispiels des erfindungsgemäßen Systems zur Durchführung des Verfahrens 400 zur Steuerung von Prozessen. Das System weist eine Datenbrille 100 auf, mittels dem Spracheingabemöglichkeiten in das Sichtfeld eines Nutzers eingeblendet werden. Die Datenbrille 100 wird in diesem Ausführungsbeispiel wie eine herkömmliche Brille vom Nutzer getragen und verfügt über eine entsprechend gestaltete Fassung 170 mit Bügel 180 und Brillengläsern 190. Die Datenbrille 100 weist die Projektionsvorrichtung 110 mit Bildschirm 120 zur Einblendung der Spracheingabemöglichkeiten direkt vor dem Auge des Nutzers auf. Eine derartige Datenbrille 100 erhöht die Geschwindigkeit der Bearbeitung von Prozessen, da der Nutzer beide Arme frei hat. Zur Sprachein- und ausgabe verfügt die Datenbrille 100 über eine Kommunikationseinheit 160 mit Mikrofon 130 und Audioausgabe 140. Die Audioausgabe 140 kann vorteilhafterweise In-Ear-Kopfhörer aufweisen. Gesteuert wird die Datenbrille 100 durch die Steuereinheit 150. Durch das System sind Spracheingaben mit einem Schalldruck von mindestens 40 dB erfassbar.
  • Neben der Verwendung einer Datenbrille 100 kann das erfindungsgemäße Verfahren 400 aber auch auf anderen Geräten, vorteilhafterweise Wearables (am Körper getragene Geräte) ausgeführt werden, z.B. mittels eines Smartphones. Das System weist außerdem einen Rechner auf (nicht dargestellt), mit der die Steuereinheit 150 verbunden ist. Der Rechner ist vorzugsweise ein handelsüblicher PC oder Notebook, der genügend Rechenleistung bereitstellt, um ein Computerprogramm zu betreiben, mit dem das erfindungsgemäße Verfahren 400 durchgeführt wird.
  • Das erfindungsgemäße Verfahren 400 zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe weist vier Verfahrensschritte auf: Im ersten Verfahrensschritt 410 werden auf einem ersten Anzeigebereich 121 der Anzeigeeinrichtung 120 Sprachbefehlseingabemöglichkeiten 211, 212, 213, 214 dargestellt. Im zweiten Verfahrensschritt 420 wird eine Spracheingabe des Nutzers erfasst. In einem optionalen Verfahrensschritt wird die Spracheingabe des Nutzers als ein Sprachbefehl zur Ausführung eines Prozessschrittes identifiziert.
  • Um eine Spracheingabe als solche zu erkennen, muss die Spracheingabe einen Mindestschalldruck aufweisen, m.a.W. von einem Nutzer in einer Mindestlautstärke und/oder in einer unmittelbaren Nähe zum Mikrofon 130 gesprochen werden. Dadurch wird einerseits sichergestellt, dass die Spracheingabe von dem Nutzer intendiert ist, andererseits wird die Spracheingabe deutlich von etwaig vorhandenen Hintergrundgeräuschen unterschieden. Das erfindungsgemäße Verfahren ist daher auch in Umgebungen einsetzbar, die eine hohe Umgebungslautstärke aufweisen. Der Schalldruck der erfassten Spracheingabe beträgt in diesem Ausführungsbeispiel 45dB.
  • Im nächsten Verfahrensschritt 430 wird die Spracheingabe einem Prozessschritt zugeordnet. Im letzten Verfahrensschritt 440 wird der der Spracheingabe zugeordnete Prozessschritt gestartet.
  • Ein Ausführungsbeispiel der Anzeige von Spracheingabemöglichkeiten 211, 212, 213, 214 auf der Anzeigevorrichtung 110 zeigt 2. Zur Steuerung des Verfahrens 400 wird vorteilhafterweise ein Chatbot verwendet, also ein textbasiertes Dialogsystem, mit dem ein Nutzer einen Prozess steuert. Der Chatbot reagiert nur auf bestimmte auf dem Bildschirm 120 dargestellte Spracheingabemöglichkeiten 211, 212, 213, 214. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer vier unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214 zur Auswahl an. Der Bildschirm 120 der Anzeigevorrichtung 110 weist einen ersten Anzeigebereich 121 und einen zweiten Anzeigebereich 122 auf. Der erste Anzeigebereich 121 ist derart im Zentrum des Bildschirms 120 angeordnet, dass der erste Anzeigebereich 121 eine geringere Fläche als der Gesamtanzeigebereich des Bildschirms 120 aufweist.
  • In diesem Ausführungsbeispiel ist der zweite Anzeigebereich 122 derart rahmenförmig um den ersten Anzeigebereich 121 auf dem Bildschirm 120 angeordnet, dass der zweite Anzeigebereich 122 eine Fläche vom Randbereich des Bildschirms 120 bis zum ersten Anzeigebereich 121 einnimmt, m.a.W. die Fläche des ersten Anzeigebereichs 121 zusammen mit der Fläche des zweiten Anzeigebereichs 122 bildet den Gesamtanzeigebereich des Bildschirms 120. Die Spracheingabemöglichkeiten 211, 212, 213, 214 sind sowohl in Schriftform als auch als graphische Darstellung auf dem Bildschirm 120 angezeigt. Der Nutzer gibt einen Sprachbefehl durch Sprechen des Sprachbefehls je nachdem, welche der Spracheingabemöglichkeiten 211, 212, 213, 214 ihm geeignet erscheint.
  • 3 zeigt ein weiteres Ausführungsbeispiel der Anzeige von Spracheingabemöglichkeiten 211, 212, 213, 214 auf der Anzeigevorrichtung 110. Zur Steuerung des Prozesses wird ebenfalls ein Chatbot verwendet. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer ebenfalls vier unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214 im ersten Anzeigebereich 121 an.
  • Der als Rahmen um den ersten Anzeigebereich 121 angeordnete zweite Anzeigebereich 122 zeigt erfindungsgemäß keine Spracheingabemöglichkeiten, sondern Informationen, die nicht unmittelbar einen Prozessschritt starten bzw. zur Steuerung eines Prozesses zwingend notwendig sind. Die auf dem zweiten Anzeigebereich 122 dargestellten Informationen informieren den Nutzer z.B. über den Zustand der Datenbrille 100 und des Spracherkennungssystem. Die im zweiten Anzeigebereich 122 angezeigten Informationen sind vorteilhafterweise graphische Darstellungen (z.B. Icons), in diesem Ausführungsbeispiel ein Icon 221, das den Ladezustand der Datenbrille 100 anzeigt, außerdem ein Icon 222, dass die Qualität der kabellosen Verbindung zwischen Datenbrille 100 und Rechner darstellt.
  • Ein Ausführungsbeispiel einer Ausgabe einer neuen Spracheingabemöglichkeit 214 auf der Anzeigevorrichtung 110 zeigt 4. Ein Nutzer hat bereits einen ersten Sprachbefehl aus einer Auswahl von Spracheingabemöglichkeiten in das Mikrofon 130 der Datenbrille 100 gegeben (s. 2, 3), in diesem Ausführungsbeispiel den Befehl „Chatbot“. Dabei erfolgt der Empfang der Spracheingabe des Nutzers ausschließlich über das Mikrofon 130 der Datenbrille 100. Die Sprachbefehlseingabe des Nutzers wird erfasst und erkannt 420. Dann wird die erfasste Sprachbefehlseingabe einem Prozessschritt zugeordnet 430, in diesem Ausführungsbeispiel also dem Prozessschritt „Chatbot“. Auf dem ersten Anzeigebereich 121 des Bildschirms 120 der Anzeigevorrichtung 110 wird nun eine weitere Sprachbefehlseingabemöglichkeit215 visuell angezeigt, in diesem Ausführungsbeispiel die Sprachbefehlseingabemöglichkeit „Abbruch“. Durch Spracheingabe des Widerrufs 215 kann ein Nutzer den vorher gegebenen Sprachbefehl „Chatbot“ widerrufen. Der Sprachbefehl „Chatbot“ wird bei Spracheingabe „Abbruch“ nicht ausgeführt, jedoch ausgeführt 440 ohne Widerruf.
  • In diesem Ausführungsbeispiel erfolgt die Bestätigung 224 in Form einer Ausgabe ebenfalls im ersten Anzeigebereich 121 des Bildschirms 120 durch ein Symbol, das der jeweiligen Spracheingabemöglichkeit 211, 212, 213, 214 angepasst und damit eindeutig zugeordnet ist. Damit können auch unterschiedliche Nutzer der Datenbrille 100 sofort und auf einen Blick erkennen, dass das von ihnen eingegebene Sprachsignal erfasst und korrekt erkannt ist. Alternativ oder zusätzlich kann der identifizierte Sprachbefehl akustisch auf der Audioausgabe 140 der Datenbrille 100 erfolgen, z.B. durch Ausgabe einer Wiederholung des Sprachbefehls, eines geeigneten Tones oder einer Melodie.
  • Der als Rahmen um den ersten Anzeigebereich 121 angeordnete zweite Anzeigebereich 122 zeigt keine Spracheingabemöglichkeiten, sondern Informationen, die nicht unmittelbar einen Prozessschritt starten bzw. zur Steuerung eines Prozesses zwingend notwendig sind. Die auf dem zweiten Anzeigebereich 122 dargestellten Informationen sind graphische Darstellungen (z.B. Icons), in diesem Ausführungsbeispiel ein Icon 221, das den Ladezustand der Datenbrille 100 anzeigt, außerdem ein Icon 222, dass die Qualität der kabellosen Verbindung zwischen Datenbrille 100 und Rechner darstellt. Zusätzlich werden Uhrzeit und Datum 223 mittels Buchstaben angezeigt. Die verwendeten Buchstaben zur Anzeige der Informationen 223 im zweiten Anzeigebereich 122 weisen vorteilhafterweise eine größere Schriftgröße auf als die im ersten Anzeigebereich 121 dargestellten Spracheingabemöglichkeiten 211, 212, 213, 214, 215. Dadurch wird optisch eine Unterscheidung zwischen Spracheingabemöglichkeiten 211, 212, 213, 214, 215 und Informationen 221, 222, 223 für den Nutzer möglich.
  • 5 zeigt ein weiteres Ausführungsbeispiel der Anzeige von Spracheingabemöglichkeiten 211, 212, 213, 214 auf der Anzeigevorrichtung 110. Zur Steuerung des Prozesses wird ebenfalls ein Chatbot verwendet. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer ebenfalls vier unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214 im ersten Anzeigebereich 121 an. Der als Rahmen um den ersten Anzeigebereich 121 angeordnete zweite Anzeigebereich 122 zeigt keine Spracheingabemöglichkeiten, sondern Informationen. Die auf dem zweiten Anzeigebereich 122 dargestellten Informationen sind graphische Darstellungen, in diesem Ausführungsbeispiel ebenfalls ein Icon 221, das den Ladezustand der Datenbrille 100 anzeigt, außerdem ein weiteres Icon 222, dass die Qualität der kabellosen Verbindung zwischen Datenbrille 100 und Rechner darstellt. Zusätzlich werden Uhrzeit und Datum 223 mittels Buchstaben angezeigt. Die verwendeten Buchstaben zur Anzeige der Informationen 223 im zweiten Anzeigebereich 122 weisen eine größere Schriftgröße auf als die im ersten Anzeigebereich 121 dargestellten Spracheingabemöglichkeiten 211, 212, 213, 214. Der zweite Anzeigebereich 122 weist in diesem Ausführungsbeispiel eine andere Farbe auf als der erste Anzeigebereich 121, um eine deutliche Unterscheidung beider Anzeigebereiche 121, 122 zu gewährleisten. Kontrast, Farbe und/oder Helligkeitsstufe sowohl des ersten 121 als auch des zweiten Anzeigebereichs 122 sind durch einen Nutzer frei konfigurierbar.
  • Ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens 400 zur Steuerung von Prozessen mittels Sprachbefehlseingabe zeigt 6. Das erfindungsgemäße Verfahren 400 zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe weist vier Verfahrensschritte auf: Im ersten Verfahrensschritt 410 werden auf einem ersten Anzeigebereich 121 der Anzeigeeinrichtung 120 Sprachbefehlseingabemöglichkeiten 211, 212, 213, 214 dargestellt. Im zweiten Verfahrensschritt 420 wird eine Spracheingabe des Nutzers erfasst. In einem optionalen Verfahrensschritt wird die Spracheingabe des Nutzers als ein Sprachbefehl zur Ausführung eines Prozessschrittes identifiziert. Jede Spracheingabe eines Nutzers wird nur auf einen Sprachbefehl geprüft, und in jeder Spracheingabe wird nur ein Sprachbefehl identifiziert. Dies erleichtert einem Nutzer die Nachvollziehbarkeit seiner Spracheingaben, Verwirrung durch Mehrfachbefehle wird vermieden. Im nächsten Verfahrensschritt 430 wird die Spracheingabe einem Prozessschritt zugeordnet. Im letzten Verfahrensschritt 440 wird der der Spracheingabe zugeordnete Prozessschritt gestartet.
  • BEZUGSZEICHENLISTE
  • 100
    Datenbrille
    110
    Projektionsvorrichtung
    120
    Bildschirm/Gesamtanzeigebereich
    121
    Erster Anzeigebereich
    122
    Zweiter Anzeigebereich
    130
    Mikrofon
    140
    Audioausgabe
    150
    Steuereinheit
    160
    Kommunikationseinheit
    170
    Fassung
    180
    Bügel
    190
    Brillenglas
    211, 212, 213, 214
    Spracheingabemöglichkeiten
    215
    Zweite Spracheingabemöglichkeit
    221, 222, 223
    Informationen des zweiten Anzeigebereichs
    224
    Symbol
    400
    Verfahren zur Steuerung von Prozessen
    410
    Anzeige von Spracheingabemöglichkeiten
    420
    Erfassen einer Spracheingabemöglichkeit
    430
    Zuordnen der erfassten Spracheingabemöglichkeit
    440
    Starten des der erfassten Spracheingabemöglichkeit zugeordneten Prozesses

Claims (20)

  1. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe mit den Verfahrensschritten: • Darstellen von Sprachbefehlseingabemöglichkeiten (210, 211, 212, 213, 214) auf einer Anzeigeeinrichtung (110) wobei die Anzeigeeinrichtung (110) einen Gesamtanzeigebereich (120) bereitstellt, wobei ein erster Anzeigebereich (121) im Zentrum des Gesamtanzeigebereichs (120) angeordnet wird wobei die Fläche des ersten Anzeigebereichs (121) kleiner ist als die Fläche des Gesamtanzeigebereichs (120) und wobei die Sprachbefehlseingabemöglichkeiten im ersten Anzeigebereich (121) dargestellt werden • Erfassen einer Sprachbefehlseingabe, wobei die erfasste Sprachbefehlseingabe einen Schalldruck größer als 10 dB aufweist • Zuordnen der erfassten Sprachbefehlseingabe zu einem Prozessschritt • Starten des der Sprachbefehlseingabe zugeordneten Prozessschrittes.
  2. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 1, dadurch gekennzeichnet, dass die Spracheingabe einen Schalldruck größer 40 dB, bevorzugt größer 45 dB und besonders bevorzugt größer 55 dB aufweist.
  3. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Sprachbefehlseingabemöglichkeiten (210, 211, 212, 213, 214) ausschließlich im ersten Anzeigebereich (121) dargestellt sind.
  4. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein zweiter Anzeigebereich (122) einen zweiten Teil des Gesamtanzeigebereichs (120) umfasst.
  5. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 4, dadurch gekennzeichnet, dass der zweite Anzeigebereich (122) im Randbereich des Gesamtanzeigebereichs (120) angeordnet wird.
  6. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 5, dadurch gekennzeichnet, dass der zweite Anzeigebereich (122) einen Rahmen um den ersten Anzeigebereich (121) bildet.
  7. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der Ansprüche 4 bis 6, dadurch gekennzeichnet, dass im zweiten Anzeigebereich (122) ausschließlich graphische Bildelemente dargestellt werden.
  8. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der Ansprüche 4 bis 7, dadurch gekennzeichnet, dass im zweiten Anzeigebereich (122) ausschließlich (statische) Informationen wiedergegeben werden.
  9. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der Ansprüche 4 bis 8, dadurch gekennzeichnet, dass der zweiten Anzeigebereich (122) in einer anderen Farbe und/oder Helligkeitsstufe dargestellt wird als der erste Anzeigebereich (121).
  10. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der Ansprüche 4 bis 7, dadurch gekennzeichnet, dass das Verfahren (400) den Verfahrensschritt Identifizieren der Spracheingabe als Sprachbefehl zur Ausführung eines Prozessschrittes umfasst.
  11. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass nach dem Erfassen der Sprachbefehlseingabe eine erste visuelle Ausgabe im ersten Anzeigebereich (121) erfolgt.
  12. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 11, dadurch gekennzeichnet, dass in der ersten visuellen Ausgabe der erkannte Sprachbefehl wiederholt wird.
  13. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 11 oder 12, dadurch gekennzeichnet, dass die erste visuelle Ausgabe eine neue Spracheingabemöglichkeit (215) umfasst.
  14. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach Anspruch 13, dadurch gekennzeichnet, dass die erste Ausgabe der neuen Spracheingabemöglichkeit (215) zusammen mit anderen Spracheingabemöglichkeiten (210, 211, 212, 213, 214) erfolgt.
  15. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der der erfassten Sprachbefehlseingabe zugeordnete Prozessschritt (440) nach Erfassen und Zuordnen des Sprachbefehls gestartet wird, wenn die Sprachbefehlseingabe solitär erfasst wird
  16. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Anzeigeeinrichtung (110) in eine Datenbrille (100) integriert ist.
  17. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Verfahren (400) ausschließlich die Ressourcen einer Datenbrille (100) zum Empfang einer Spracheingabe verwendet.
  18. Softwareprogramm zur Durchführung des Verfahrens (400) nach einem oder mehreren der Ansprüche 1 bis 17.
  19. Datenbrille (100) zur Durchführung des Verfahrens (400) nach einem oder mehreren der Ansprüche 1 bis 16 umfassend • eine Anzeigeeinrichtung (120) zur Darstellung von Spracheingabemöglichkeiten (210, 211, 212, 213, 214) • ein Mikrophon (130) zum Erfassen von gesprochenen Spracheingabemöglichkeiten (210, 211, 212, 213, 214) • eine Computereinheit zur Ausführung eines Softwareprogramms
  20. Datenbrille (100) zur Durchführung des Verfahrens (400) nach Anspruch 19 dadurch gekennzeichnet, dass die Datenbrille (100) ausschließlich über ein Mikrophon (130) zur Befehlseingabe verfügt, wobei durch das System erfasste Spracheingabemöglichkeiten (210, 211, 212, 213, 214, 215, 216) mit einem Schalldruck von mindestens 10 dB, bevorzugt mindestens 40 dB und besonders bevorzugt mindestens 55 dB erfassbar sind.
DE102023112331.9A 2022-05-10 2023-05-10 Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe Pending DE102023112331A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102022111667.0 2022-05-10
DE102022111667 2022-05-10

Publications (1)

Publication Number Publication Date
DE102023112331A1 true DE102023112331A1 (de) 2023-11-16

Family

ID=88510501

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102023112331.9A Pending DE102023112331A1 (de) 2022-05-10 2023-05-10 Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe

Country Status (1)

Country Link
DE (1) DE102023112331A1 (de)

Similar Documents

Publication Publication Date Title
DE60004862T2 (de) Automatische bestimmung der genauigkeit eines aussprachewörterbuchs in einem spracherkennungssystem
DE112017004374B4 (de) System und Verfahren zur Spracherkennung
DE10066478B3 (de) Tragbarer Computer in einer Prozesssteuerungsumgebung
DE60122352T2 (de) Augenverfolgung für kontextabhängige spracherkennung
DE60318505T2 (de) Sprachbefehlinterpreter mit Funktion zur Verfolgung des Dialogfokuses und Verfahren zur Interpretation von Sprachbefehlen
EP1071075B1 (de) Verfahren und Vorrichtung zur Eingabe von Daten
WO1992001983A1 (de) Verfahren zur durchführung eines variablen dialogs mit technischen geräten
EP1250701A1 (de) System und verfahren zur blickfokussierten sprachverarbeitung
DE102014226554A1 (de) Identifikations- und Reparaturunterstützungs-Vorrichtung und -Verfahren
DE60133537T2 (de) Automatisches umtrainieren eines spracherkennungssystems
DE10250183B4 (de) Kontextinterne Erzeugung und Editierung von Masken und Wellenformen
DE4010028A1 (de) Spracherkennungsverfahren
EP3033657B1 (de) Verfahren zum betreiben einer elektronischen datenbrille und elektronische datenbrille
DE112015003357T5 (de) Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage
DE102023112331A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102015221304A1 (de) Verfahren und Vorrichtung zur Verbesserung der Erkennungsgenauigkeit bei der handschriftlichen Eingabe von alphanumerischen Zeichen und Gesten
DE102020129605A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102009032197A1 (de) System und Verfahren zum Testen eines elektronischen Geräts
DE102023112338A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102020129602A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102023112332A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
EP1220201A2 (de) Verfahren und System zur automatischen Aktionssteuerung bei Vorträgen
DE102020129600A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102023112334A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102020129601A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe