DE19938535A1 - Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte - Google Patents
Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder TexteInfo
- Publication number
- DE19938535A1 DE19938535A1 DE19938535A DE19938535A DE19938535A1 DE 19938535 A1 DE19938535 A1 DE 19938535A1 DE 19938535 A DE19938535 A DE 19938535A DE 19938535 A DE19938535 A DE 19938535A DE 19938535 A1 DE19938535 A1 DE 19938535A1
- Authority
- DE
- Germany
- Prior art keywords
- unit
- speech recognition
- voice
- computer
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000006243 chemical reaction Methods 0.000 title description 2
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 230000002093 peripheral effect Effects 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 14
- 238000000034 method Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012109 statistical procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Die Erfindung bezieht sich auf eine Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte. DOLLAR A Um eine solche Vorrichtung zu schaffen, die eine zuverlässige automatische Umsetzung von Sprache in Tastaturbefehle, Mausbewegungen und/oder Text sicherstellt, effizient und robust auch bei Störungen durch Hintergrundgeräusche funktioniert und eine verläßliche Identifikation des Sprechers/der Sprecherin ermöglicht, werden durch eine Rechnereinheit (1) mit einer Spracherkennungseinheit (2) über ein Mikrophon (3) Sprachkommandos bzw. Sprachtexte in Tastatur- oder Mausbefehle und/oder Texte mittels automatischer Spracherkennung und Sprecheridentifizierung umgewandelt und in Form digitaler Werte über das USB-Interface (4) oder eine andere bidirektionale Schnittstelle (5) an einen Rechner übergeben.
Description
Die Erfindung bezieht sich auf eine Vorrichtung zur Umwandlung
von Sprachkommandos und/oder Sprachtexte in Tastatur- und/
oder Mausbewegungen und/oder Texte.
Es ist bekannt, dass zur Bedienung von Computersystemen
entweder eine Tastatur, ein Touch-Screen, und/oder eine
Computermaus benutzt wird.
Tastaturen als Bedienelement für Computersysteme sind seit den
ersten Tagen des PC's und seiner Vorgänger, um 1980, bekannt.
Computermäuse werden seit dem Einsatz der ersten grafischen
Benutzeroberfläche, eingeführt von der Fa. Apple Inc., um 1986,
eingesetzt und verwendet.
Die Mausbewegungen werden durch Bewegungen der Hand erzeugt,
und die Auslösung eines Menüpunktes oder Programmbefehls
erfolgt durch drücken mit dem Zeigefinger auf die Maustaste.
Die automatische Spracherkennung kann sowohl zur Umsetzung
gesprochener Sprache in Tastaturbefehle und/oder
Mausbewegungen und Texten, als auch zur Verifikation der
Identität eines Benutzers eingesetzt werden.
Seit ca. 1950 laufen verschiedene Forschungsvorhaben
hinsichtlich Spracherkennungstechniken. Wobei seit 1980 die
Erkennungsmöglichkeiten durch die Entwicklung von statistischen
Verfahren wie z. B. dem Hidden-Markow-Modell (HMM) deutlich
verbessert wurden.
Aus der Literatur (Schukat-Talamazzini, E.G. (1995),
Automatische Spracherkennung, Grundlagen, statistische Modelle
und effiziente Algorithmen, Vieweg Verlag, Braunschweig) ist
bereits bekannt, daß Verfahren der Spracherkennung entweder
auf dem Vergleich zwischen abgespeicherten Referenzmustern und
der unbekannten Äußerung beruhen oder auf der Beschreibung
einzelner Wörter des Vokabulars mittels stochastischer Modelle.
Dabei wird eine Äußerung, bestehend aus digitalen Abtastwerten,
zunächst in eine Folge von Sprachblöcken vorgegebener Dauer
zerlegt, und dann für jeden Sprachblock ein Satz von
Merkmalsgrößen berechnet. Jeder Satz ergibt einen sogenannten
Merkmalsvektor. Die statistischen Eigenschaften der
Merkmalsgrößen werden in dem modellbasierenden Ansatz durch
Verteilungsdichtefunktionen mit entsprechenden Mittelwerten und
Varianzen erfasst. Diese Mittelwerte und Varianzen müssen
zunächst in einer Trainingsphase anhand einer Vielzahl von
repräsentativen Trainingsäußerungen bestimmt werden, um einen
Referenzsatz (ein Modell) zu gewinnen. Zur Erkennung einer
unbekannten Äußerung werden dann für die Modelle, die die
Wörter des Vokabulars repräsentieren, jeweils
Wahrscheinlichkeiten berechnet.
Diese statistischen Verfahren wurden durch die Einbeziehung und
Kombination mit Methoden neuronaler Netzwerktechnologien
erweitert.
All diesen Verfahren und Vorrichtungen ist gemeinsam, dass
diese auf einem Host-PC direkt ablaufen müssen, somit diesen
stark belasten und die Handhabung dadurch komplizieren daß
oftmals hohe Wartezeiten bis zum Abschluss des
Erkennungsvorgangs bestehen. Sie benötigen sehr große Ressourcen
an CPU-Leistung und Speicher und sind bei der
Sprecheridentifizierung unzuverlässig.
Aus der US-PS 5,659,665 ist es bekannt, daß vordefinierte
Sprachkommandos in Tastaturanschlags-Daten umgewandelt und in
die Tastaturschnittstelle eingeschliffen werden.
Die derzeit auf dem Markt erhältlichen Bedieneinheiten für
Rechner und Terminals basieren auf mechanischen Eingabegeräten,
bei denen entweder eine Taste gedrückt oder eine Maus bewegt
wird. Dies hat den Nachteil, das immer erst diese Art der
Bedienung gelernt werden muß, und der Umgang mit Rechnern bzw.
Terminals gelernt werden muss, und der Umgang mit Rechnern
dadurch weiten Teilen der Bevölkerung verschlossen bleibt.
Weiterhin sind diese Bedieneinheiten, die durch Schalter,
Taster, Tastatur oder Maus realisiert werden, im Gegensatz zur
automatischen Sprachein- und Sprachausgabe (gemäß der
vorliegenden Erfindung) erheblich fehleranfälliger,
störanfälliger und aufwendiger (in der Handhabung) hinsichtlich
der Datenein- oder Ausgabe. Darüber hinaus sind bei solchen
Systemen immer entsprechende Fähigkeiten und Kenntnisse
bezüglich der Funktionsweise und Bedienung (z. B. bei der
Tastatur) erforderlich, was oft zu einem erhöhten Zeitaufwand
und damit erhöhten Kosten führt.
Oftmals ist es auch im eigentlichen Arbeitsprozeß hinderlich,
die Augen und Hände vom zu bearbeitenden Gegenstand und/oder
Schriftstück zu lösen um die Eingaben mit dem mechanischen
Hilfsmittel vornehmen zu können.
Die Aufgabe der vorliegenden Erfindung besteht nun darin, eine
Vorrichtung zu schaffen, die eine zuverlässige automatische
Umsetzung von Sprache in Tastaturbefehle, Mausbewegungen und/
oder Text sicherstellt, effizient und robust auch bei Störungen
durch Hintergrundgeräusche funktioniert und eine verläßliche
Identifikation des Sprechers/-in ermöglicht.
Zur Lösung dieser Aufgabe wird vorgeschlagen, dass durch eine
Rechnereinheit mit einer Spracherkennungseinheit über ein
Mikrophon Sprachkommandos bzw. Sprachtexte in Tastatur oder
Mausbefehle und/oder Texte mittels automatischer
Spracherkennung und Sprecheridentifizierung umgewandelt und in
Form digitaler Werte über das USB-Interface oder eine andere
bidirektionale Schnittstelle an einen Rechner übergeben werden.
Eine eventuell notwendige Umsetzung der übergebenen Daten kann
mittels Treibersoftware, welche auf dem Rechner oder Terminal
abläuft durchgeführt werden.
Über die an diese Einheit angeschlossene Mikrophon-Lautsprecher
Kombination, können mittels Sprachausgabe Kommandos oder Daten
an den Benutzer zurückgegeben werden.
Die vorstehenden Ausführungen werden anhand der folgenden
Zeichnungen näher erläutert. Dabei zeigen
Fig. 1 eine Rechnereinheit mit einer Spracherkennungseinheit,
einem Mikrophon, einem USB-Interface oder einer anderen
bidirektionale Schnittstelle in Draufsicht,
Fig. 2 eine Rechnereinheit mit weiteren USB-Anschlüssen und
USB-Verteiler in Draufsicht,
Fig. 3 eine Rechnereinheit mit PCMCIA (Personal Computer Memory
Card Interface Association)-Steckplatz in Draufsicht,
Fig. 4 eine Rechnereinheit mit einer Spracherkennungseinheit,
eine Sprecheridentifizierung, eine
Spracherzeugungseinheit, bestehend aus einem
Taktgenerator, einem CPU (Central Processor Unit), einem
Befehlsspeicher und/oder Datenspeicher, einem Mikrophon
einem Lautsprecher und einer Analogein- und -
ausgangsschaltung in Draufsicht.
Fig. 1 beschreibt eine Rechnereinheit (1) mit einer Sprach
erkennungseinheit (2). Diese Spracherkennungseinheit (2) dient
zur Umwandlung von Sprachkommandos bzw. Sprachtexten mittels
eines Mikrophons (3) in Tastatur- oder Mausbefehle und/oder
Texte. Die umgewandelten digitalen Werte werden dann
anschließend über das USB-Interface (4)oder eine beliebige
andere bidirektionale Schnittstelle (5) wie z. B. eine serielle
RS232-Schnittstelle an einen Rechner oder Terminal übergeben.
In Fig. 2 wird die Rechnereinheit (1) mit weiteren USB-
Anschlüssen (6) dargestellt. Mit Hilfe dieser Vorrichtung ist
es möglich, die gewandelten Sprachkommandos oder Sprachdaten
mit anderen Daten von den Peripheriegeräten zu kombinieren und
über den USB-Verteiler (7) weiterzuleiten. Es daher z. B. die
Anzahl einer Warenlieferung gesprochen und deren Produktnummer
gescannt werden. Die dargestellte Recheneinheit (1) fügt die
Daten entsprechend der Vorgaben des Host-Rechners zusammen und
sendet sie als eine zusammenhängende Tastensequenz.
Fig. 3 beschreibt eine Rechnereinheit (1) mit einem PCMCIA
(Personal Computer Memory Card Interface Association)-
Steckplatz (8). Dies ermöglicht die Erweiterung der
Rechnereinheit (1) mit den verschiedensten PCMCIA-Karten, wie
zum Beispiel Ethernet- oder Funknetzkarten.
Fig. 4 zeigt eine Rechnereinheit (1) mit einer
Spracherkennungseinheit (2), einer
Sprecheridentifizierungseinheit (15) und einer
Spracherzeugungseinheit (9), wobei diese aus einem
Taktgenerator (10), einer CPU (Central Processor Unit) (11),
einem Befehlsspeicher und/oder Datenspeicher (12), einem
Mikrophon (3), einem Lautsprecher (13) und einer Analoge m- und
-ausgangsschaltung (14) besteht. Mit Hilfe dieser Vorrichtung
können komplexe Dateneingaben zuerst Dialogorientiert (durch
gesprochene Dialoge mittels Sprachausgabe) zusammengestellt
werden und danach als eine zusammenhängende Tastensequenz an
den Host-Rechner oder Terminal
gesendet werden.
Gemäß der erfindungsgemäßen Vorrichtung wird zur Umsetzung der
Sprachkommandos bzw. Sprachtexte in Tastatur- oder Mausbefehle
und/oder Texte mittels automatischer Spracherkennung und
Sprecheridentifizierung ein Sprachsignal mit einer vorgegebenen
Taktrate, z. B. 100 us, digitalisiert. Das Sprachsignal wird
verändert und/oder transformiert, und/oder vorgeschaltete
Algorithmen zur Merkmalsextraktion (wie digitale Filter) werden
verwendet. Den GP's (genetischen Programmen) wird zusätzlich
und/oder ausschließlich dieses Signal zugeführt. Das digitale
Signal kann verändert und/oder transformiert werden, indem die
Phonem- und/oder Wort-Identifikation auf der Basis von
neuronalen Netzwerken (NN) erfolgt, und das
Klassifikationsergebnis einem NN in Form von digitalen Werten
zugeführt wird. Die Phonem- oder Wort- Identifikation können
auch auf der Basis von Fuzzy Logik (FL) erfolgen. Dabei wird
dann das Klassifikationsergebnis einer FL-Funktion in Form von
digitalen Werten zugeführt. Zur Identifikation des
Sprechers/der Sprecherin wird das Klassifikationsergebnis von
GP's (genetischen Programmen) aus dem Sprachsignal verwendet.
Hierzu werden nachstehende Beispiele erläutert:
Die Steuerung einer Computermaus und die Navigation auf der
Oberfläche eines Computerbetriebssystems kann per
Sprachsteuerung auf Basis von GP (genetischen Programmen)
und/oder NN-Algorithmen und/oder Fuzzy-Logik erfolgen. Damit
ist es möglich, eine Computermaus herzustellen, bei der der
Benutzer alternativ die Betriebssystemkommandos direkt per
Sprache eingibt, Menüs öffnet, Programme startet, oder
Steuerkommandos absetzt, ohne erst den Mauszeiger auf die
entsprechende Position zu fahren, und anzuklicken.
Die Datenein- und ausgaben im Bereich der Logistik können die
über das Mikrophon (3) eingegebenen Sprachkommandos mit den
Daten anderer Peripheriegeräte kombiniert und danach als
Datenstrom über das USB-Interface (4) an einen übergeordneten
Rechner übergeben werden. Wird zum Beispiel in einem
Kommissionierungsprozess ein Artikel der mit einem Barcode
versehen ist, noch mit einer Mengenangabe versehen werden, kann
der Benutzer die Daten in beliebiger Reihenfolge eingeben. Über
den am USB-Interface (4) angeschlossenen Scanner wird die
Artikelnummer erfasst und der Benutzer spricht entweder davor
oder danach die kommissionierte Menge ein. Das System kann
beide Eingabearten unterscheiden, und gibt den kompletten
Datensatz
- a) nur dann weiter wenn alle Daten vorliegen
- b) in einer vordefinierten Form, z. B. erst die Artikelnummer und dann die Menge, weiter.
Im Lagerbereich kann die Weitergabe der erfassten Sprachdaten
über den PCMCIA (Personal Computer Memory CardInterface
Association)-Steckplatz (8) und einer darin eingesteckten
Karte, z. B. ein Funkmodem, erfolgen.
Gemäß der erfindungsgemäßen Vorrichtung ist es möglich, daß die
Spracherkennungseinheit (2) die Emulation des Tastaturtreibers
sicherstellt. Dabei läuft eine Software im Hintergrund des
Betriebssystems und prüft in kurzen Abständen (< 50 msec) ob Daten
am USB-Interface (4) ankommen. Diese werden dann in die selben
Systemkommandos, die auch eine Tastaturtreiber generiert
umgesetzt, und über das API (Application Programming Interface)
des Betriebssystems entweder an die derzeit aktive
Vordergrundanwendung oder eine vordefinierte Anwendung,
gesandt. Dadurch muss innerhalb der Zielapplikation keine
Änderung vorgenommen werden, da sie ohnehin schon auf
Tastaturanschläge reagiert.
Eine weitere Zusatzfunktion dieser Software ist die Umsetzung
eines gesprochenen Wortes wie z. B. in
sogenannte Shortcuts (Kurzbefehle). Diese Shortcuts erlauben das
direkte aktivieren einer Funktion über Tastaturkombinationen.
Im obigen Beispiel ist dies Dies geschieht über
Tabellen und Matrizen die vor der Benutzung erstellt werden.
Gemäß der erfindungsgemäßen Vorrichtung ist es ebenso möglich,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos in Tastatur- und/oder Mausbefehle
umwandelt, welche die sprachgesteuerte Bedienung, eines
WebBrowsers ermöglicht. Die Bedienung erfolgt in der Weise,
dass die gesprochenen Wortes in Shortcuts (Kurzbefehle)
umgesetzt werden. Diese Shortcuts erlauben das direkte
Aktivieren einer Browserfunktion über Tastaturkombinationen.
Dies geschieht über Tabellen und Matrizen die vor der
Benutzung erstellt werden.
Nach der erfindungsgemäßen Vorrichtung kann die Rechnereinheit
(1) durch die Spracherkennungseinheit (2) Sprachkommandos
umwandeln, die die sprachgesteuerte Bedienung eines E-Mail-
Programmes ermöglicht. Dadurch entfällt die Bedienung mit der
Maus und das Schreiben auf der Tastatur.
Weiterhin wird mittels der erfindungsgemäßen Vorrichtung auch
die sprachgesteuerte Bedienung eines Newsreaders ermöglicht.
Weitere Bespiele sind die sprachgesteuerte Terminalemulation
einer Datenbanksoftware, die sprachgesteuerte Bedienung einer
Tabellenkalkulationssoftware oder die sprachgesteuerte
Bedienung eines PPS (Produktion-Planung-Steuerung) Systems.
Ebenso kann die Bedienung eines Warenwirtschaftssystems oder
eines Buchhaltungssysteme mittels akustischer Bedienung
erfolgen.
Letztlich kann auch bei allen Anwendungen, bei denen eine
Bedienung der mechanischen Bedienelemente nicht möglich ist, da
z. B. beide Hände für andere Aufgaben benötigt werden, die
Vorrichtung Einsatz finden.
Vorteil dieser Erfindung ist es, eine Vorrichtung anbieten zu
können, die eine zuverlässige automatische Spracherkennung
ermöglicht, sich einfach als Peripheriegerät anschalten bzw.
einbinden läßt und die bisher übliche mechanische Bedienung
einer Rechnereinheit durch die Sprachbedienung ablöst. Dadurch
wird die Bedienung und die Anwendung vieler Softwareprogramme
stark vereinfacht. Der Lernaufwand für die Rechnerbedienung
wird sehr verringert, und die Arbeitsabläufe beschleunigt und
sicherer, wodurch erhebliche Kosten und viel Zeit gespart wird.
Claims (15)
1. Vorrichtung zur Umwandlung von Sprachkommandos und/oder
Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder
Texte,
dadurch gekennzeichnet,
daß durch eine Rechnereinheit (1) mit einer
Spracherkennungseinheit (2) über ein Mikrophon
(3) Sprachkommandos bzw. Sprachtexte in Tastatur oder
Mausbefehle und/oder Texte mittels automatischer
Spracherkennung und Sprecheridentifizierung umgewandelt und in
Form digitaler Werte über das USB-Interface (4) oder eine
andere bidirektionale Schnittstelle (5) an einen Rechner
übergeben werden.
2. Vorrichtung nach Anspruch 1,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) zusätzlich noch über weitere USB-
Anschlüsse (6) verfügt
und damit einen USB-Verteiler (7) realisiert.
3. Vorrichtung nach einem der Ansprüche 1 bis 2,
dadurch gekennzeichnet,
daß durch die Rechnereinheit (1) die über ein Mikrophon (3)
eingegebenen Sprachkommandos mit den Daten anderer
Peripheriegeräte kombiniert werden und danach als Datenstrom
über das USB-Interface (4) oder eine andere bidirektionale
Schnittstelle (5) an einen Rechner übergeben werden.
4. Vorrichtung nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) über einen PCMCIA (Personal Computer
Memory Card Interface Association)-Steckplatz (8) zur Aufnahme
von Peripheriegeräten, wie z. B. Funknetzwerkkarten verfügt.
5. Vorrichtung nach einem der Ansprüche 1 bis 4,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) eine Spracherkennungseinheit (2),
einer Sprecheridentifizierungseinheit (15) und eine
Spracherzeugungseinheit (9) beinhaltet, wobei diese aus einem
Taktgenerator (10), CPU (Central Processor Unit) (11),
Befehlsspeicher und/oder Datenspeicher (12), Mikrophon (3),
einem Lautsprecher (13) und einer Analogein- und
-ausgangsschaltung (14) besteht.
6. Vorrichtung nach einem der Ansprüche 1 bis 5,
dadurch gekennzeichnet,
daß die durch die Spracherkennungseinheit (2) die Emulation
des Tastaturtreibers ermöglicht wird.
7. Vorrichtung nach einem der Ansprüche 1 bis 6,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos in Tastatur- und/oder Mausbefehle
umwandelt, welche die sprachgesteuerte Bedienung, eines
WebBrowsers ermöglicht.
8. Vorrichtung nach einem der Ansprüche 1 bis 7,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung eines eMail-Programmes ermöglicht.
9. Vorrichtung nach einem der Ansprüche 1 bis 8,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung eines Newsreaders ermöglicht.
10. Vorrichtung nach einem der Ansprüche 1 bis 9,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung einer Terminalemulation ermöglicht.
11. Vorrichtung nach einem der Ansprüche 1 bis 10,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung einer Datenbanksoftware ermöglicht.
12. Vorrichtung nach einem der Ansprüche 1 bis 11,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung einer Tabellenkalkulationssoftware ermöglicht.
13. Vorrichtung nach einem der Ansprüche 1 bis 12,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung eines PPS (Produktion-Planung-Steuerung)-Systems
ermöglicht.
14. Vorrichtung nach einem der Ansprüche 1 bis 13,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung eines Warenwirtschaftssystems ermöglicht.
15. Vorrichtung nach einem der Ansprüche 1 bis 14,
dadurch gekennzeichnet,
daß die Rechnereinheit (1) durch die Spracherkennungseinheit
(2) Sprachkommandos umwandelt, die die sprachgesteuerte
Bedienung eines Buchhaltungssystems ermöglicht.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19938535A DE19938535A1 (de) | 1999-08-13 | 1999-08-13 | Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte |
DE10082416T DE10082416D2 (de) | 1999-08-13 | 2000-08-08 | Vorrichtung zur Umwandlung von Sprachkommandos und / oder Sprachtexte in Tastatur- und / oder Mausbewegungen und / oder Texte |
AU77694/00A AU7769400A (en) | 1999-08-13 | 2000-08-08 | Device for converting spoken commands and/or spoken texts into keyboard and/or mouse movements and/or texts |
PCT/DE2000/002683 WO2001013215A1 (de) | 1999-08-13 | 2000-08-08 | Vorrichtung zur umwandlung von sprachkommandos und/oder sprachtexte in tastatur- und/oder mausbewegungen und/oder texte |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19938535A DE19938535A1 (de) | 1999-08-13 | 1999-08-13 | Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19938535A1 true DE19938535A1 (de) | 2001-02-15 |
Family
ID=7918373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19938535A Withdrawn DE19938535A1 (de) | 1999-08-13 | 1999-08-13 | Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19938535A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005114342A2 (de) * | 2004-05-21 | 2005-12-01 | Endress+Hauser Gmbh+Co. Kg | Variables feldgerät für die automatisierungstechnik |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995018441A1 (en) * | 1993-12-29 | 1995-07-06 | At & T Corp. | Voice command control and verification system and method |
WO1995024681A1 (en) * | 1994-03-08 | 1995-09-14 | Hassan Toosi | Speech-controlled input device with logic standard interface |
US5698834A (en) * | 1993-03-16 | 1997-12-16 | Worthington Data Solutions | Voice prompt with voice recognition for portable data collection terminal |
EP0854417A2 (de) * | 1997-01-06 | 1998-07-22 | Texas Instruments Inc. | Sprachaktivierte Steuerungseinheit |
DE19730920A1 (de) * | 1997-07-18 | 1999-01-21 | Ise Interactive Systems Entwic | Computeranlage |
-
1999
- 1999-08-13 DE DE19938535A patent/DE19938535A1/de not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5698834A (en) * | 1993-03-16 | 1997-12-16 | Worthington Data Solutions | Voice prompt with voice recognition for portable data collection terminal |
WO1995018441A1 (en) * | 1993-12-29 | 1995-07-06 | At & T Corp. | Voice command control and verification system and method |
WO1995024681A1 (en) * | 1994-03-08 | 1995-09-14 | Hassan Toosi | Speech-controlled input device with logic standard interface |
EP0854417A2 (de) * | 1997-01-06 | 1998-07-22 | Texas Instruments Inc. | Sprachaktivierte Steuerungseinheit |
DE19730920A1 (de) * | 1997-07-18 | 1999-01-21 | Ise Interactive Systems Entwic | Computeranlage |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005114342A2 (de) * | 2004-05-21 | 2005-12-01 | Endress+Hauser Gmbh+Co. Kg | Variables feldgerät für die automatisierungstechnik |
WO2005114342A3 (de) * | 2004-05-21 | 2006-05-04 | Endress & Hauser Gmbh & Co Kg | Variables feldgerät für die automatisierungstechnik |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60125696T2 (de) | Universelle Fernsteuerung geeignet zum Empfang von Spracheingaben | |
DE60003971T2 (de) | Verteilte Architektur zum Trainieren eines Spracherkennungssystems | |
DE69923379T2 (de) | Nicht-interaktive Registrierung zur Spracherkennung | |
DE3586378T2 (de) | Mustererkennungsanlage. | |
DE3337353A1 (de) | Sprachanalysator auf der grundlage eines verborgenen markov-modells | |
DE202007019183U1 (de) | Ein tragbares Computerperipheriegerät mit einem universellen seriellen Bus (USB)-Verbinder | |
EP1239460B1 (de) | Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem | |
DE102012024778A1 (de) | Kontinuierlich arbeitende, berührungslose, optische Gestenerkennungsvorrichtung | |
DE60214850T2 (de) | Für eine benutzergruppe spezifisches musterverarbeitungssystem | |
CN114360504A (zh) | 音频处理方法、装置、设备、程序产品及存储介质 | |
DE69333762T2 (de) | Spracherkennungssystem | |
EP1573502A2 (de) | Schnell-eingabevorrichtung | |
DE112015003357T5 (de) | Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage | |
WO2001013215A1 (de) | Vorrichtung zur umwandlung von sprachkommandos und/oder sprachtexte in tastatur- und/oder mausbewegungen und/oder texte | |
DE19938535A1 (de) | Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte | |
DE19851287A1 (de) | Datenverarbeitungssystem oder Kommunikationsendgerät mit einer Einrichtung zur Erkennugn gesprochener Sprache und Verfahren zur Erkennung bestimmter akustischer Objekte | |
EP1220201B1 (de) | Verfahren und System zur automatischen Aktionssteuerung bei Vorträgen | |
DE29914227U1 (de) | Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte | |
DE19963142A1 (de) | Verfahren und Vorrichtung zur sprachgesteuerten Bedienung eines Kiosksystems | |
DE10115899B4 (de) | Verfahren zur Erstellung von Computer-Programmen mittels Spracherkennung | |
DE29922809U1 (de) | Vorrichtung zur sprachgesteuerten Bedienung eines Kiosksystems | |
DE102013002962A1 (de) | Sprachunterstützte Tastatureingabe | |
DE19927317A1 (de) | Verfahren und Vorrichtung zur automatischen Spracherkennung, Sprecheridentifizierung und Spracherzeugung | |
DE202023104777U1 (de) | Erkennsystem zur Erkennung dualer Eingaben von Gesten und virtuellen Tasten auf einem Touchscreen | |
WO1999048075A1 (de) | Gerät zur wiedergabe von informationen bzw. zur ausführung von funktionen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8143 | Withdrawn due to claiming internal priority |