DE4029716C2 - Sprachgesteuertes Fernbedienungssystem - Google Patents
Sprachgesteuertes FernbedienungssystemInfo
- Publication number
- DE4029716C2 DE4029716C2 DE4029716A DE4029716A DE4029716C2 DE 4029716 C2 DE4029716 C2 DE 4029716C2 DE 4029716 A DE4029716 A DE 4029716A DE 4029716 A DE4029716 A DE 4029716A DE 4029716 C2 DE4029716 C2 DE 4029716C2
- Authority
- DE
- Germany
- Prior art keywords
- voice
- command
- remote control
- speech recognition
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/11—Arrangements specific to free-space transmission, i.e. transmission through air or vacuum
- H04B10/114—Indoor or close-range type systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03J—TUNING RESONANT CIRCUITS; SELECTING RESONANT CIRCUITS
- H03J1/00—Details of adjusting, driving, indicating, or mechanical control arrangements for resonant circuits in general
- H03J1/0008—Details of adjusting, driving, indicating, or mechanical control arrangements for resonant circuits in general using a central processing unit, e.g. a microprocessor
- H03J1/0025—Details of adjusting, driving, indicating, or mechanical control arrangements for resonant circuits in general using a central processing unit, e.g. a microprocessor in a remote control unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/16—Circuits
- H04B1/20—Circuits for coupling gramophone pick-up, recorder output, or microphone to receiver
- H04B1/202—Circuits for coupling gramophone pick-up, recorder output, or microphone to receiver by remote control
Description
Die Erfindung bezieht sich auf ein sprachgesteuertes Fernbedienungsgerät
(Fernbedienungssystem) nach dem
Oberbegriff des Patentanspruchs 1. Ein Gerät dieser Art ist aus DE 27 55 633 A1
bekannt.
Die genannte Druckschrift beschreibt eine Fernsteuerung zum Steuern, Ein- und Um
schalten von variablen und festen Gerätefunktionen und Funktionsgrößen in nachrich
tentechnischen Geräten, insbesondere Geräten der Unterhaltungselektronik, mit einem
Fernbedienungsgeber mit Funktionstasten und/oder Analogwertstellern, über die bei
Betätigung Funktionsgeneratoren eingeschaltet werden, deren die Steuerbefehle
beinhaltende Signale drahtlos oder drahtgebunden vom Fernbedienungsgeber zum
Empfänger des zu steuernden Gerätes frequenz- oder amplitudenmoduliert mittels eines
Übertragungsmediums übertragen werden. Der Fernbedienungsgeber ist mit einem
Mikrophon verbunden, das an einen im Fernbedienungsgeber eingebauten Sprachana
lysator angeschlossen ist, und die akustisch eingegebenen Wortbefehle werden nach
Umsetzung in elektrische Signale vom Sprachanalysator nach der Frequenz und nach
auswertbaren Wortteilen analysiert, wobei die Signale der Wortteile mit eingespeicherten
Signalen verglichen werden und bei Koinzidenz ein Steuerbefehl des dem eingegebenen
Wortbefehl entsprechenden Inhalts abgegeben wird. Der Steuerbefehl steuert eine dem
Sprachanalysator nachgeschaltete Sendestufe derart, daß der Steuerbefehl mit einem
Trägerfrequenz- oder amplitudenmoduliert wird. Im Empfänger werden die empfange
nen Signale in einem Demodulator demoduliert, und die rückgewonnenen Steuerbefehle
werden einem elektronischen Umschalter zugeführt, der entsprechend dem anliegenden
Steuerbefehl den zu steuernden Funktionssteller einschaltet und setzt.
Aus der US 4 454 608 ist ein Sprachsynthesesystem bekannt, bei dem wichtige Worte
um Sprachsynthesizer mit größerer Lautstärke wiedergegeben werden, als unwichtige
Worte.
Aus der US 4 286 115 ist ein Erkennungssystem für zusammenhängende Sprache
bekannt, das einen Speicher enthält, in dem individuell gesprochene Wortschätze für den
Vergleich mit der zu erkennenden Sprache gespeichert sind. Ein eingegebenes Muster
wird mit mehreren, einander ähnlichen Bezugsmustern verglichen. Jenes Wort wird als
erkannt bezeichnet, das mit den meisten Vergleichsmustern übereinstimmt.
Bei den herkömmlichen sprachgesteuerten Fernbedienungssystemen wird ein im
Erkennungsergebnis einer Sprachverarbeitung entsprechendes Fernbedienungssignal in
seiner ursprünglichen Form übertragen. Die Wichtigkeit von Operationen eines zu
steuernden Geräts, die den jeweiligen Fernbedienungssignalen entsprechen, d. h. das
Ausmaß der Auswirkungen einer fehlerhaften Erkennung, muß nicht für alle Operationen
dieselbe sein. Beispielsweise sind die negativen Auswirkungen, die bei einer fehlerhaften
Erkennung eines eine Aufnahmeoperation betreffenden Sprachbefehls auftreten, weitaus
gravierender als die negativen Auswirkungen einer fehlerhaften Erkennung eines einer
Wiedergabeoperation entsprechenden Sprachbefehls. Wenn die Steuerbefehle in Abhän
gigkeit vom Typ des Steuerbefehls anstatt mit gleichem Wichtigkeitsgrad mit geeigneten,
unterschiedlichen Wichtigkeitsgraden behandelt werden, kann die Spracherkennung mit
höherer Effizienz verarbeitet werden, und ferner kann für wichtigere Steuerbefehle eine
höhere Zuverlässigkeit erzielt werden.
Der Erfindung liegt daher die Aufgabe zugrunde, ein sprachgesteuertes Fernbedienungs
system der eingangs genannten Art anzugeben, das in Abhängigkeit von der Wichtigkeit
eines Steuerbefehls die der Spracherkennung dienende Verarbeitung verändern kann.
Diese Aufgabe wird durch die im Patentanspruch 1 angegebenen Merkmale gelöst.
Vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
Tragende Merkmale der vorliegenden Erfindung sind eine Wichtigkeitsgrad-Erkennungs
einrichtung zum Ermitteln der Wichtigkeit der Befehlsdaten, eine Erkennungsgenauig
keits-Ermittlungseinrichtung, die die Genauigkeit des Erkennungsergebnisses des
Sprachbefehls ermittelt, und ein Schwellenwert der ermittelten Erkennungsgenauigkeit,
der in Abhängigkeit von der Wichtigkeit des Sprachbefehls variabel ist. Auf diese Weise
werden bei der Erkennung von Befehlen wichtigen Inhalts höhere Anforderungen gestellt,
als bei Befehlen unwichtigen Inhalts.
Die die Wichtigkeit eines Befehls ermitteltende Einrichtung erzeugt in Abhängigkeit von
der Wichtigkeit des Befehls ein entsprechendes Wichtigkeitsgradsignal, das angibt, ob
die entsprechend dem Befehl auszuführende Tätigkeit wichtig ist oder nicht. Die Erken
nungsgenauigkeit-Ermittlungseinrichtung ermittelt die Genauigkeit der Befehlserkennung
durch Vergleich der ermittelten Genauigkeit mit dem genannten vorbestimmten
Schwellenwert, der in Abhängigkeit vom Wichtigkeitsgradsignal schwankt, d. h. in
Abhängigkeit davon, ob der Befehl wichtig ist oder nicht.
Die Erfindung, weitere Merkmale derselben und ihre Vorteile werden nachfolgend unter
Bezugnahme auf in den Zeichnungen dargestellte Ausführungsbeispiele näher erläutert.
Es zeigt:
Fig. 1 ein Blockschaltbild eines allgemeinen Fernbedienungssystems;
Fig. 2 eine beispielhafte Darstellung eines Fernbedienungssignals;
Fig. 3 ein Blockschaltbild des Senders eines allge
meinen sprachgesteuerten Fernbedienungssy
stems
Fig. 4 eine perspektivische Ansicht des Senders ei
nes sprachgesteuerten Fernbedienungssystems
gemäß einer ersten Ausführungsform der vor
liegenden Erfindung;
Fig. 5 ein Blockschaltbild des Senders des sprachge
steuerten Fernbedienungssystems gemäß der er
sten Ausführungsform;
Fig. 6 ein detailliertes Blockschaltbild des Senders
gemäß der ersten Ausführungsform;
Fig. 7 ein Blockschaltbild einer Spracherkennungs
einrichtung gemäß der ersten Ausführungsform;
Fig. 9(a) eine Darstellung eines Analogprozessors;
Fig. 9(b) bis 9(f) Darstellungen der Signal-Wellenformen
im in Fig. 9(a) gezeigten Analogprozessor;
Fig. 10 ein Flußdiagramm eines Operationsablaufs des
Senders gemäß der ersten Ausführungsform;
Fig. 11 ein Blockschaltbild des Senders des sprachge
steuerten Fernbedienungssystems gemäß einer
zweiten Ausführungsform der vorliegenden Er
findung;
Fig. 12 ein Blockschaltbild einer Spracherkennungs
einrichtung gemäß der zweiten Ausführungsform;
und
Fig. 13 ein Flußdiagramm eines Operationsablaufs des
Senders gemäß der zweiten Ausführungsform.
Zum besseren Verständnis der vorliegenden Erfindung wer
den im folgenden zunächst ein allgemeines Fernbedienungs
system und ein Sprach-Fernbedienungssingal beschrieben.
Wie in Fig. 1 gezeigt, umfaßt ein Fernbedienungssystem
100 einen Sender 101, der ein Fernbedienungssignal von
einer von einem zu steuernden Gerät 103 wie etwa einem
AV-Gerät entfernten Position aussendet, und einen Empfän
ger 102, der das ausgesendete Fernbedienungssignal emp
fängt, dieses dekodiert und die dekodierte Information an
das zu steuernde Gerät 103 schickt.
In Fig. 2 ist ein allgemeines Fernbedienungssignal ge
zeigt. Das Fernbedienungssignal besteht aus einem Leit
kode, der die Datenübertragung einem Empfänger anzeigt,
einem Abnehmerkode und einem invertierten Abnehmerkode,
die ein zu steuerndes Gerät bezeichnen, und schließlich
aus einem Datenkode und einem invertierten Datenkode, die
einen Steuerbefehl für das zu steuernde Gerät bezeichnen.
Der invertierte Abnehmerkode und der invertierte Daten
kode werden zur Ermittlung eines Fehlers im Abnehmerkode
bzw. im Datenkode verwendet.
In Fig. 3 ist schematisch der Sender 101 des sprachge
steuerten Fernbedienungssystems 100 gezeigt. Der Sender
101 umfaßt ein Mikrophon M, das einen Sprachbefehl in ein
elektrisches Signal umwandelt. Das umgewandelte elektri
sche Signal wird in eine Spracherkennungseinrichtung 15,
eingegeben, wobei diese in Ge
stalt einer Spracherkennungs-LSI-Schaltung oder ähnlichem
vorliegt und einen Mikroprozessor enthält. Die Spracher
kennungseinrichtung 15 erkennt den Inhalt des eingegebenen
elektrischen Signals und erzeugt diesem erkannten Inhalt
entsprechende Steuerdaten. Der Sender 101 besitzt außer
dem eine einen Mikroprozessor umfassende Steuerschaltung
16. Auf der Grundlage der Steuerdaten von der Spracher
kennungseinrichtung 15 erzeugt die Steuerschaltung 16 ein
Fernbedienungs-Befehlssignal SR und gibt dieses in eine
Sendeeinrichtung 17 ein, die anschließend eine Infrarot
licht-Emitterdiode D₁ aktiviert, so daß diese ein Fernbe
dienungssignal Rc ausgibt. Die erwähnten Bestandteile des
Senders 101 werden von einer Leistungsversorgungsschal
tung 18 mit elektrischer Energie versorgt.
Wenn über das Mikrophon M ein Sprachbefehl empfangen
wird, wandelt die Spracherkennungseinrichtung 15 den
Sprachbefehl in Musterdaten um. Die Spracherkennungs
einrichtung 15 vergleicht die Sprachbefehl-Musterdaten mit
einer Mehrzahl von in ihr gespeicherten Standardmusterda
ten und bestimmt den Abstand zwischen den Sprachbefehl-Muster
daten und den Standardmusterdaten; anschließend
gibt die Spracherkennungseinrichtung 15 Befehlsdaten aus,
die denjenigen Standardmusterdaten entsprechen, deren Ab
stand zu den Sprachbefehl-Musterdaten am kleinsten ist.
Es kann auch eine andere Spracherkennungsverarbeitung zur
Anwendung kommen, in der die Ähnlichkeit der verglichenen
Musterdaten entsprechend einem einfachen Ähnlichkeitsver
fahren bestimmt wird und Befehlsdaten, die den Standard
musterdaten mit der höchsten Ähnlichkeit entsprechen,
ausgegeben werden. Die so erzeugten Befehlsdaten werden
in die Steuerschaltung 16 eingegeben.
Die Steuerschaltung 16 schickt ein den eingegebenen Be
fehlsdaten entsprechendes Fernbedienungs-Befehlssignal SR
an die Sendeeinrichtung 17. Aufgrund des gelieferten Fern
bedienungs-Befehlssignals SR steuert die Sendeeinrichtung 17
die Infrarotlicht-Emitterdiode C₁ an, so daß diese ein Fern
bedienungssignal Rc aussendet. Das zu steuernde Gerät 103
wird auf diese Weise durch das Fernbedienungssignal Rc
ferngesteuert.
Nun wird mit Bezug auf die Fig. 4 bis 10 ein sprachge
steuertes Fernbedienungssystem gemäß einer ersten Ausfüh
rungsform der vorliegenden Erfindung beschrieben.
Wie in Fig. 4 gezeigt, weist ein Sender 10A des sprachge
steuerten Fernbedienungssystems ein einteiliges Gehäuse
11 auf, das der Bedienungsperson das freie Umhertragen
des Senders erlaubt. Das Gehäuse 11 besitzt in seiner
oberen Blende ein Mikrophon M. Das Mikrophon M wandelt
den von der Bedienungsperson gegebenen Sprachbefehl in
ein elektrisches Signal um. Ein Sendemittel (etwa eine
Infrarotlicht-Emitterdiode D₁) ist an einem Ende des Ge
häuses 11 angebracht. Die Infrarotlicht-Emitterdiode D₁
wird dazu verwendet, ein Fernbedienungssignal an den Emp
fänger eines (nicht gezeigten) entfernt angeordneten zu
steuernden Gerätes zu senden. Auf einer Seite des Gehäu
ses 11 ist ein Spracheingabeschalter 12 (der im folgenden
mit "Sprechschalter" bezeichnet wird) angeordnet, der im
gedrückten Zustand geschlossen ist und automatisch geöff
net wird, wenn er losgelassen wird. Der Sprechschalter 12
kann ein automatisch zurückstellender Druckknopf oder ein
(automatisch zurückstellender) Schiebeschalter sein. Wenn
ein Sprachbefehl eingegeben wird, wird der Sprechschalter
12 geschlossen, um den Sender 10A zu betätigen. Sonst ist
der Sprechschalter 12 geöffnet, so daß der Sender 10A au
ßer Betrieb gehalten wird. Das Gehäuse 11 besitzt an sei
ner Seite außerdem einen Betriebswahlschalter 13, der
beispielsweise die Form eines Schiebeschalters besitzt.
Der Betriebswahlschalter 13 dient der Auswahl einer der
Betriebsarten für einen bestimmten Zeitpunkt. Die Be
triebsarten umfassen eine Sprachspeicherbetriebsart, in
der der Sprachbefehl im Sender 10A gespeichert wird, und
eine Spracherkennungsbetriebsart, in der ein Sprachbefehl
erkannt wird, wie später beschrieben werden wird. Das Ge
häuse 11 beinhaltet die elektronische Schaltung des er
findungsgemäßen sprachgesteuerten Fernbedienungssystems.
In Fig. 5 ist die elektronische Schaltung des Senders 10A
des sprachgesteuerten Fernbedienungssystems gemäß der
vorliegenden Erfindung in Blockform gezeigt. Der Sender
10A umfaßt eine Spracherkennungseinrichtung 15A, die einen
über das Mikrophon M eingegebenen Sprachbefehl gemäß ei
ner Mustererkennungsverarbeitung erkennt, eine Wichtig
keitsgrad-Erkennungseinrichtung 5, die den Wichtigkeitsgrad
eines erkannten Sprachbefehls ermittelt, eine Wählvorrich
tung 6, die Schaltungen oder Bestimmungspunkte, an die
ein Ausgangssignal von der Spracherkennungseinrichtung 15A
geschickt werden sollen, in Abhängigkeit vom bestimmten
Wichtigkeitsgrad auswählt, eine Erkennungsgenauigkeits-Ermitt
lungseinrichtung 4, die die Genauigkeit der Erkennung eines
einen hohen Wichtigkeitsgrad besitzenden Sprachbefehls
bestimmt, und eine Sendeeinrichtung 17, die erkannte
Sprachbefehlsdaten in ein Fernbedienungssignal Rc umwan
delt und das Fernbedienungssignal Rc aussendet.
Wie in Fig. 6 gezeigt, umfaßt der Sender 10A eine mit dem
Sprechschalter 12 und dem Betriebswahlschalter 13 verbun
dene Steuerschaltung 16A. Die Steuerschaltung 16A liefert
an die Sendeeinrichtung 17 ein Fernbedienungs-Befehlssignal
SR, woraufhin die Sendeeinrichtung 17 die Infrarotlicht-Emitter
diode D₁ zum Aussenden eines Fernbedienungssignals
Rc an den Empfänger eines entfernt angeordneten zu steu
ernden Gerätes aktiviert. Die Spracherkennungseinrichtung
15A, die Steuerschaltung 16A und die Sendeeinrichtung 17
werden von einer Stromversorgungsschaltung 18 über
eine Stromversorgungs-Steuerschaltung 14 und
Stromversorgungsleitungen mit elektrischer Energie ver
sorgt.
Wie in Fig. 7 gezeigt, umfaßt die Spracherkennungseinrich
tung 15A einen Analogprozessor 21, der ein über das Mi
krophon M empfangenes analoges Sprachbefehlssignal verar
beitet und das verarbeitete analoge Sprachbefehlssignal
als Zeitaufteilungs-Digitaldaten 20 ausgibt, einen
Spracherkennungsprozessor 22, der den Sprachbefehl auf
grund der vom Analogprozessor 21 gelieferten Zeitauftei
lungs-Digitaldaten 20 erkennt, einen Speicher 23A, in dem
Standardmusterdaten für die Spracherkennung gespeichert
sind, und eine Schnittstelle 24, über die Signale an die
Steuerschaltung 16A geliefert und von der Steuerschaltung
16A empfangen werden.
Der Speicher 23A umfaßt eine Standardmusterdaten-Spei
chereinheit 25, in der eine Mehrzahl von unterschiedli
chen Standardmusterdaten PA1 bis PAn, PB1 bis PBn, . . ., PM1
bis PMn für die jeweiligen Sprachbefehle gespeichert wer
den.
Wie in Fig. 8 gezeigt ist, umfaßt der Analogprozessor 21
im allgemeinen einen Verstärker 30, der ein vom Mikrophon
M übertragenes Sprachbefehlssignal auf einen geeigneten
Pegel verstärkt, eine Filterreihe 31, die ein Verstärker
ausgangssignal in Signale in verschiedenen Frequenzbän
dern unterteilt, gleichrichtet und die Signale in diesen
verschiedenen Frequenzbändern ausgibt, eine Ana
log/Digital-Wandleranordnung 32 (die im folgenden mit
"A/D-Wandleranordnung" bezeichnet wird), die die Aus
gangssignale in den verschiedenen Frequenzbändern der
Filterreihe 31 in Digitalsignale umwandelt, und eine
Schnittstelle 33, die Signale an den Spracherkennungspro
zessor 22 schickt und von diesem Signale empfängt.
In Fig. 9(a) ist gezeigt, daß die Filterreihe 31 eine
Bandpaßfilteranordnung 35, die das eingegebene Sprachsi
gnal in Signale einer Mehrzahl von Frequenzbändern (vier
Frequenzbänder in Fig. 9(a)) unterteilt, einen Gleich
richteranordnung 36, die die Ausgangssignale der Bandpaß
filteranordnung 35 gleichrichtet und eine Tiefpaßfiltera
nordnung 37, die aus den Ausgangssignalen von der Gleich
richteranordnung 36 den Brumm entfernt.
Die Bandpaßfilteranordnung 35 umfaßt mehrere (vier
in Fig. 9(a)) Bandpaßfilter BPF₀ bis BPF₃, die ent
sprechend ihren jeweiligen Frequenzbändern die Mittenfre
quenzen f₀, f₁, f₂ und f₃ (f₀<f₁<f₂<f₃) besitzen.
Die Gleichrichteranordnung 36 umfaßt vier Gleichrichter
RCT₀ bis RCT₃, die mit den entsprechenden Bandpaßfiltern
BPF₀ bis BPF₃ der Bandpaßfilteranordnung 35 in Reihe ge
schaltet sind. Von den Gleichrichtern RCT₀ bis RCT₃ wer
den die Ausgangssignale in den jeweiligen Frequenzbändern
der Bandpaßfilter BPF₀ bis BPF₃ gleichgerichtet.
Die Tiefpaßfilteranordnung 37 umfaßt vier Tiefpaßfilter
LPF₀ bis LPF₃, die mit den jeweiligen Gleichrichtern RCT₀
bis RCT₃ der Gleichrichteranordnung 36 in Reihe geschal
tet sind. Die Tiefpaßfilter LPF₀ bis LPF₃ beseitigen aus
den gleichgerichteten Signalen in den entsprechenden Fre
quenzbändern den Brumm.
Die A/D-Wandleranordnung 32 umfaßt vier A/D-Wandler ADC₀
bis ADC₃, die mit den jeweiligen Tiefpaßfiltern LPF₀ bis
LPF₃ der Tiefpaßfilteranordnung 37 in Reihe geschaltet
sind. Die A/D-Wandler ADC₀ bis ADC₃ wandeln die analogen
Ausgangssignale der Tiefpaßfilter LPF₀ bis LPF₃ in Digi
talsignale um.
Nun wird der Betrieb des Analogprozessors 21 beschrieben.
Um der Kürze willen wird nur die Signalverarbeitung in
einem Frequenzband (zum Beispiel im demjenigen des Band
paßfilters BPF₃) beschrieben. In den anderen Frequenzbän
dern wird jedoch eine ähnliche Signalverarbeitung ausge
führt.
Wenn in das Mikrophon ein Sprachbefehl eingegeben wird,
wird das vom Mikrophon M ausgegebene elektrische Signal
durch den Verstärker 30 auf einen geeigneten Signalpegel
verstärkt, woraufhin das verstärkte Signal A (s. Fig.
9(b)) ausgegeben wird. Das verstärkte Signal A wird an
das Bandpaßfilter BPF₃ geliefert, welches nur ein seinem
Frequenzband entsprechendes Signal B hindurchläßt. Dieses
Signal B wird anschließend an den Gleichrichter RCT₃ ge
geben. (s. Fig. 9(c)). Das Signal B wird durch den
Gleichrichter RCT₃ gleichgerichtet, anschließend wird das
gleichgerichtete Ausgangssignal C (s. Fig. 9(d)) des
Gleichrichters RCT₃ an das Tiefpaßfilter LPF₃ geschickt.
Das Tiefpaßfilter LPF₃ beseitigt einen Brumm, der im Si
gnal C eventuell enthalten ist, und erzeugt ein brumm
freies Ausgangssignal D (s. Fig. 9(e)), das anschlie
ßend an den A/D-Wandler ADC₃ gegeben wird. Der A/D-Wand
ler ADC₃ wandelt dann das an ihn gelieferte Eingangssi
gnal D in ein Signal E um, das, wie in Fig. 9(f) gezeigt
ist, aus 4-Bit-Zeitaufteilungs-Digitaldaten (1010)
(0111), (0101), (0111), (1101), . . . zusammengesetzt ist.
Wie in Fig. 8 gezeigt, umfaßt der Spracherkennungsprozes
sor 22 eine Systemsteuerschaltung 40, die Steuerbefehle
von der Steuerschaltung 16A analysiert und verarbeitet
und ferner die gesamte Operation des Spracherkennungspro
zessors 22 steuert, und einen Digitalprozessor 41, der
die Abstandsberechnungen ausführt und den Speicher 23A
steuert.
Die Systemsteuerschaltung 40 umfaßt eine CPU 42
(Zentraleinheit), die den Gesamtbetrieb des Senders 10A
steuert, ein ROM 43 (Nur-Lese-Speicher), in dem ein von
der CPU 42 für die Gesamtoperation des Senders 10A abzu
arbeitendes Steuerprogramm gespeichert ist, ein RAM 44
(Schreib-Lese-Speicher), das vorübergehend Daten spei
chert, und eine Schnittstelle 45, die sowohl an den Ana
logprozessor 21 als auch an den Digitalprozessor 41 Daten
überträgt und von diesen Prozessoren Daten empfängt.
Der Digitalprozessor 41 umfaßt eine Recheneinheit 46, die
Abstandsberechnungen ausführt und auf der Grundlage der
Ergebnisse der Abstandsberechnungen eingegebene Sprachbe
fehle identifiziert, ein Daten-RAM 47, das die für die
Abstandsberechnungen erforderlichen Daten speichert, ein
ROM 48, in dem ein Programm für die Abstandsberechnungen
gespeichert ist, ein Arbeits-RAM 49, das vorübergehend
die verarbeiteten Daten speichert, eine Schnittstelle 50,
die Daten sowohl an den Analogprozessor 21 als auch an
die Systemsteuerschaltung 40 sendet und von diesen Daten
empfängt, und eine Schnittstelle 51, die Daten an den
Speicher 23A überträgt und von diesem empfängt.
Der Spracherkennungsprozessor 22 arbeitet wie folgt: Wenn
von der Steuerschaltung 16A über die Schnittstelle 24 ein
Steuerbefehl an den Spracherkennungsprozessor 22 gegeben
wird, empfängt die Systemsteuerschaltung 40 den Steuerbe
fehl über die Schnittstellen 50 und 45 und analysiert den
empfangenen Steuerbefehl. Wenn das Analyseergebnis eine
Spracherkennungsverarbeitung anzeigt, schickt die Sy
stemsteuerschaltung 40 über die Schnittstellen 45 und 50
einen Befehl zur Spracherkennung an den Digitalprozessor
41.
Wenn die Systemsteuerschaltung 40 aktiviert wird, gibt
der Digitalprozessor 41 Zeitaufteilungs-Digitaldaten 20
(Signal des eingegebenen Sprachbefehls) vom Analogprozes
sor 21 über die Schnittstelle 50 in das Daten-RAM 47 ein.
Die Recheneinheit 46 liest aus der ersten Adresse des
Speichers 23A, in dem unterschiedliche Standardmusterda
ten PA1 bis PAn, PB1 bis PBn, . . ., PM1 bis PMn gespeichert
sind, über die Schnittstelle 51 Standardmusterdaten aus.
Dann bestimmt die Recheneinheit 46 den Logarithmus des
ersten Satzes von Zeitaufteilungs-Digitaldaten
mehrerer Sätze Zeitaufteilungs-Digitaldaten, der
einen der gelesenen Standardmusterdatensätze bildet, und
außerdem den Logarithmus der Zeitaufteilungs-Digitaldaten
des Signals des eingegebenen Sprachbefehls; anschließend
bestimmt die Recheneinheit 46 die Differenz zwischen die
sen Logarithmen. Dann quadriert die Recheneinheit 46
diese Differenzen und addiert die Quadrate, um einen Ab
stand D zu bestimmen. Daher ist der Abstand D durch
gegeben, wobei gilt:
x: Anzahl der Zeitaufteilungen
f(t): eingegebene Sprachbefehlsdaten (Zeitaufteilungs-Digitaldaten)
fs(t): Standardmusterdaten (Zeitaufteilungs-Digitaldaten).
f(t): eingegebene Sprachbefehlsdaten (Zeitaufteilungs-Digitaldaten)
fs(t): Standardmusterdaten (Zeitaufteilungs-Digitaldaten).
Auf die gleiche Weise werden die Abstände D für sämtliche
Standardmusterdaten berechnet. Je kleiner die berechneten
Abstände, um so höher ist die Wahrscheinlichkeit, daß die
Standardmusterdaten dem Sprachbefehl ähnlich sind. Die so
erhaltenen Erkennungsergebnisse werden für jeden der
Sprachbefehle gesammelt. Dann werden die Befehlsdaten,
die demjenigen Sprachbefehl entsprechen, dem die Stan
dardmusterdaten als Ganzes am meisten ähneln, als Be
fehlsdaten der Spracherkennungseinrichtung 15A über die
Schnittstelle 24 an die Steuerschaltung 16A ausgegeben.
Nun wird wieder auf Fig. 6 Bezug genommen. Die Steuer
schaltung 16A ist beispielsweise in einem Mikroprozessor
ausgebildet. Der Mikroprozessor der Steuerschaltung 16A
umfaßt eine CPU, ein ROM, ein RAM und eine Schnittstelle.
Die CPU führt Rechenoperationen aus, wobei sie auf die im
als Arbeitsspeicher dienenden RAM gespeicherten Daten Be
zug nimmt und die Rechenoperationen gemäß dem Algorithmus
(s. Fig. 10) eines im ROM gespeicherten Steuerprogramms
ausführt und dadurch die Gesamtoperation des Senders 10A
bewirkt. Die Steuerschaltung 16A empfängt außerdem Unter
brechungssignale vom Sprechschalter 12 und vom Betriebs
wahlschalter 13 und führt Steuerfunktionen entsprechend
den durch diese Unterbrechungssignale angezeigten Befeh
len aus. Die Operation des Senders 10A unter Steuerung
der Steuerschaltung 16A wird im folgenden beschrieben.
In der Steuerschaltung 16A sind die Erkennungsgenauig
keits-Ermittlungseinrichtung 4, die Wichtigkeitsgrad-Erken
nungseinrichtung 5 und die Wählvorrichtung 6 jeweils soft
waremäßig implementiert. Genauer sind die Wichtigkeits
grad-Erkennungseinrichtung 5 und die Wählvorrichtung 6 in
einem Schritt S17 in Fig. 10 implementiert, während die
Erkennungsgenauigkeits-Ermittlungseinrichtung 4 durch die
Schritte S16, S18 und S19 in Fig. 10 implementiert ist.
Der Sender 10A arbeitet in Abhängigkeit davon, ob der
Sprechschalter 12 gedrückt oder losgelassen ist (d. h.
ein- oder ausgeschaltet ist). Wenn der Sprechschalter 12
gedrückt ist, kann der Sender 10A die Fernbedienungssi
gnale senden, während der Sender dann, wenn der Sprech
schalter 12 losgelassen ist, in einer Betriebsart mit
niedrigem Leistungsverbrauch gehalten wird und auf ein
zugebende Sprachbefehle wartet. Es gibt zwei Eingabebe
triebsarten für die Eingabe von Sprachbefehlen. In einer
Eingabebetriebsart werden Sprachbefehle der Bedienungs
person gespeichert, in der anderen Eingabebetriebsart
werden Sprachbefehle der Bedienungsperson wiedererkannt.
In der Sprachspeicherbetriebsart wird ein Wort wie etwa
"Wiedergabe" in den Sender 10A aufgenommen.
Nun wird der Betrieb des Senders 10A mit Bezug auf das
Flußdiagramm von Fig. 10 beschrieben. Es wird angenommen,
daß der Sprechschalter 12 nicht gedrückt ist und der Sen
der sich in einem Bereitschaftszustand in der Betriebsart
mit niedrigem Energieverbrauch befindet.
Zunächst setzt die Steuerschaltung 16A in einem Schritt
S1 eine Eintragungspuffernummer auf den Wert 1.
Dann ermittelt die Steuerschaltung 16A in einem Schritt
S2, ob der Sprechschalter 12 gedrückt ist oder nicht, in
dem sie ermittelt, ob vom Sprechschalter 12 ein Betriebs
steuersignal Sc erzeugt wird oder nicht. Wenn in diesem
Moment ein Betriebssteuersignal Sc vorliegt, bedeutet
dies, daß der Sprechschalter 12 gedrückt ist, so daß die
Steuerschaltung 16A ein Steuersignal Sv an die Strom
versorgungs-Steuerschaltung 14 sendet. Die Stromver
sorgungs-Steuerschaltung 14 liefert in einer normalen Be
triebsart elektrische Energie und schaltet den Sender 10A
in einem Schritt S4 in die normale Betriebsart.
Wenn der Sprechschalter 12 nicht gedrückt ist, wird der
Sender 10A in der Betriebsart mit niedrigem Energiever
brauch gelassen, anschließend werden die Schritte S2 und
S3 wiederholt, wobei sich der Sender 10A in einem Warte
zustand für einen Sprachbefehl befindet.
Danach liest die Steuerschaltung 16A in einem Schritt S5
den Zustand des Betriebswahlschalters 13, um festzustel
len, ob die Sprachspeicherbetriebsart für Sprachbefehle
angezeigt wird oder nicht.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht
die Steuerung weiter zu einem Schritt S6, in dem die
Steuerschaltung 16A einen Befehl ausgibt, mit dem die
Spracherkennungseinrichtung 15A zur Ausführung einer
Spracherkennungsverarbeitung veranlaßt wird. Gleichzeitig
schickt die Steuerschaltung 16A im Schritt S6 an die
Spracherkennungseinrichtung 15A eine Eintragungspuffernum
mer.
In einem Schritt S7 speichert die Spracherkennungseinrich
tung 15A Spracherkennungs-Standardmusterdaten in einem
entsprechenden Eintragungspuffer des Speichers 23A, d. h.
in einem Eintragungspuffer mit der Eintragungspuffernum
mer 1.
Die Steuerschaltung 16A liest in einem Schritt S8 ein
(nicht gezeigtes) Statusregister in der Spracherkennungs
einrichtung 15A, um festzustellen, ob die Eintragung eines
Sprachbefehls beendet ist oder nicht. Wenn die Eintragung
noch nicht beendet ist, werden die Schritte S7 und S8 so
lange wiederholt, bis sie beendet ist. Wenn die Eintra
gung beendet ist, wird die Eintragungspuffernummer im
Schritt S9 um den Wert 1 erhöht.
Dann ermittelt die Steuerschaltung 16A in einem Schritt
S10, ob die momentane Eintragungspuffernummer einen maxi
mal speicherbaren Wert Nmax übersteigt oder nicht. Wenn
dies nicht der Fall ist, kehrt die Steuerung zum Schritt
S2 zurück. Wenn der maximale Wert überschritten wird,
schickt die Steuerschaltung 16A einen Befehl zur Beendi
gung der Sprachspeicherbetriebsart an die Spracherken
nungseinrichtung 15A und beendet dadurch in einem Schritt
S11 die Sprachspeicherbetriebsart. Dann geht die Steue
rung zurück zum Schritt S2.
Wenn im Schritt S5 vom Betriebswahlschalter 13 nicht die
Sprachspeicherbetriebsart angezeigt wird, d. h. wenn im
Schritt S5 vom Betriebswahlschalter 13 die Spracherken
nungsbetriebsart angezeigt wird, gibt die Steuerschaltung
16A in einem Schritt S12 an die Spracherkennungseinrichtung
15A einen Spracherkennungsbefehl aus. Die Spracherken
nungseinrichtung 15A führt nun in einem Schritt S13 eine
Spracherkennungsverarbeitung aus, wie sie oben beschrie
ben worden ist; das bedeutet, daß zwischen den eingegebe
nen Sprachbefehlsdaten und den Standardmusterdaten ein
Abstand D bestimmt wird, um zwischen diesen eine Ähnlich
keit festzustellen.
Die Steuerschaltung 16A liest in einem Schritt S14 ein
(nicht gezeigtes) Statusregister in der Spracherkennungs
einrichtung 15A, um festzustellen, ob die Spracherkennung
beendet ist oder nicht. Wenn die Spracherkennung noch
nicht beendet ist, werden die Schritte S13 und S14 so
lange wiederholt, bis sie beendet ist. Wenn sie beendet
ist, stellt die Steuerschaltung 16A in einem Schritt S15
fest, ob die Daten des eingegebenen Sprachbefehls mit den
Standardmusterdaten übereinstimmen, d. h. ob der Abstand D
in einem vorgegebenen Abstandsbereich liegt. Wenn die Da
ten des eingegebenen Sprachbefehls mit den Standardmu
sterdaten übereinstimmen, zählt die Steuerschaltung 16A
in einem Schritt S16 die Anzahl derjenigen Standardmu
sterdatensätze sämtlicher dem Erkennungsergebnis entspre
chender Standardmusterdatensätze, die nicht mit dem Er
kennungsergebnis übereinstimmen. Der Zählwert wird als
Wert der Musterzählung bezeichnet, die der Bestimmung des
Erkennungsgenauigkeitsniveaus dient.
Dann bestimmt die Steuerschaltung 16A in einem Schritt
S17, ob das Erkennungsergebnis eine wichtige Operation
anzeigt. Wenn nicht, ermittelt die Steuerschaltung 16A in
einem Schritt S18, ob der Wert der Musterzählung gleich
oder größer als ein vorgegebener zweiter Zählwert ist.
Der zweite Zählwert entspricht einer Bedingung, in der
das gleiche Erkennungsergebnis unter Verwendung von mehr
als der Hälfte der Standardmusterdatensätze erhalten wird
und stellt eine verhältnismäßig niedrige Erkennungsgenau
igkeit dar. Wenn der Wert der Musterzählung niedriger als
der zweite Zählwert ist, geht die Steuerung weiter zu ei
nem Schritt S22 für eine Fehlerverarbeitung, da der ein
gegebene Sprachbefehl aufgrund der niedrigen Erkennungs
genauigkeit nicht erkannt werden kann. Wenn der Wert der
Musterzählung gleich oder größer als der zweite Zählwert
ist, erzeugt die Steuerschaltung 16A aufgrund der erkann
ten Sprachbefehlsdaten ein Fernbedienungs-Befehlssignal
SR, da die Erkennungsgenauigkeit verhältnismäßig hoch ist
und die Erkennungsverarbeitung zuverlässig ist. Dann
schickt die Steuerschaltung 16A in einem Schritt S20 das
Fernbedienungs-Befehlssignal SR an die Sendeeinrichtung 17.
Wenn das Erkennungsergebnis im Schritt S17 eine wichtige
Operation anzeigt, ermittelt die Steuerschaltung 16A in
einem Schritt S19, ob der Wert der Musterzählung gleich
oder größer als ein vorgegebener erster Zählwert ist. Der
erste Zählwert stellt einen verhältnismäßig hohen Erken
nungsgrad dar und entspricht einer Bedingung, in der das
gleiche Erkennungsergebnis unter Verwendung von 90% oder
mehr der Standardmusterdaten erhalten wird. Für Steuerbe
fehle von hoher Wichtigkeit wird zur Aufrechterhaltung
der Steuerungszuverlässigkeit ein Fernbedienungssignal Rc
erst dann erzeugt, wenn die Bedingung im Schritt S19 er
reicht wird.
Die Steuerschaltung 16A erzeugt aufgrund der erkannten
Sprachbefehlsdaten von hoher Erkennungsgenauigkeit ein
Fernbedienungs-Befehlssignal SR und schickt dieses Signal
im Schritt S20 an die Sendeeinrichtung 17. Aufgrund des
Fernbedienungs-Befehlssignals SR sendet die Sendeeinrich
tung 17 in einem Schritt S21 ein entsprechendes Fernbe
dienungssignal Rc aus. Wenn die Daten des eingegebenen
Sprachbefehls mit den Standardmusterdaten im Schritt S15
nicht übereinstimmen oder wenn der Wert der Musterzählung
im Schritt S18 kleiner als der zweite Zählwert oder im
Schritt S19 kleiner als der erste Zählwert ist, führt die
Steuerschaltung 16A im Schritt S22 eine Fehlerverarbei
tung wie etwa die Erzeugung eines Summtons aus, woraufhin
die Steuerung zum Schritt S2 zurückkehrt.
Wie oben beschrieben, wird in der ersten Ausführungsform
der vorliegenden Erfindung ein Sprachbefehl unter Verwen
dung mehrerer verschiedener Standardmusterdaten PA1
bis PAn, PB1 bis PBn, . . ., PM1 bis PMn für die jeweiligen
Sprachbefehle erkannt; wenn das Erkennungsergebnis eine
wichtige Operation anzeigt, wird an die Erkennungsgenau
igkeit eine höhere Anforderung gestellt, um die Rate der
fehlerhaften Erkennung abzusenken.
Nun wird mit Bezug auf die Fig. 11 bis 13 ein sprachge
steuertes Fernbedienungssystem gemäß einer zweiten Aus
führungsform der vorliegenden Erfindung beschrieben.
Das sprachgesteuerten Fernbedienungssystem gemäß der zwei
ten Ausführungsform umfaßt einen Sender, der den gleichen
Aufbau wie der in Fig. 4 gezeigte Sender 10A besitzt.
Der im allgemeinen mit 10B bezeichnete Sender des sprach
gesteuerten Fernbedienungssystems gemäß der zweiten Aus
führungsform ist in den Fig. 11 und 12 gezeigt. Diejeni
gen Teile von Fig. 11, die mit den in Fig. 6 gezeigten
Teilen identisch sind, werden durch das gleiche Bezugs
zeichen bezeichnet und nicht im einzelnen beschrieben.
Der Sender 10B umfaßt eine Spracherkennungseinrichtung 15B,
die, wie in Fig. 12 gezeigt ist, einen Analogprozessor
21, der ein über das Mikrophon M empfangenes analoges
Sprachbefehlssignal verarbeitet und in Form von Zeitauf
teilungs-Digitaldaten ausgibt, eine Mehrzahl von paral
lelen Spracherkennungsprozessoren 22-1 bis 22-n, die den
Sprachbefehl aufgrund der Zeitaufteilungs-Digitaldaten
vom Analogprozessor 21 unabhängig erkennen, einen Spei
cher 23B, in dem Standardmusterdaten für die Spracherken
nung durch die entsprechenden Spracherkennungsprozessoren
22-1 bis 22-n gespeichert sind, und eine Schnittstelle
24, die Signale an die Steuerschaltung 16B sendet und von
dieser Signale empfängt, umfaßt.
Die Spracherkennungsprozessoren 22-1 bis 22-n verwenden
für jeden der Sprachbefehle entsprechende Standardmuster
daten und führen unabhängige Spracherkennungsprozesse
aus. Beispielsweise verwendet der Spracherkennungsprozes
sor 22-1 die Standardmusterdaten PA1, PB1, . . ., PM1, wäh
rend der Spracherkennungsprozessor 22-2 die Standardmu
sterdaten PA2, PB2, . . ., PM2 verwendet.
Diese Standardmusterdaten können in verschiedenen Berei
chen des Speichers 23B wie oben beschrieben oder in ent
sprechenden Speichern, die den jeweiligen Spracherken
nungsprozessoren zugeordnet sind, gespeichert werden.
Die Steuerschaltung 16B umfaßt die Funktionen der Erken
nungsgenauigkeit-Ermittlungseinrichtung 4, der Wichtigkeits
grad-Erkennungseinrichtung 5 und der Wählvorrichtung 6 gemäß
der ersten Ausführungsform. Genauer sammelt die Steuer
schaltung 16B die Erkennungsergebnisse der Spracherken
nungsprozessoren 22-1 bis 22-n, wenn der Steuerbefehl,
der durch das von der Spracherkennungseinrichtung 15B gege
bene Erkennungsergebnis angezeigt wird, zu einem Befehl
mit hoher Wichtigkeit bestimmt wird, und gibt nur das Er
kennungsergebnis mit hoher Erkennungsgenauigkeit als Be
fehlsdaten aus. Wenn kein Erkennungsergebnis, das den
Wichtigkeitsgrad des Steuerbefehls erreicht, erhalten
wird, gibt die Steuerschaltung 16B keinerlei Befehlsdaten
aus. Die Erkennungsgenauigkeits-Ermittlungseinrichtung 4
ist in den Schritten S50 und S51 in Fig. 13 implemen
tiert, während die Wichtigkeitsgrad-Erkennungseinrichtung 5
und die Wählvorrichtung 6 in Fig. 13 durch den Schritt
S49 implementiert sind.
Der Analogprozessor 21, die Spracherkennungsprozessoren
22-1 bis 22-n und die Schnittstelle 24, wie sie in Fig.
12 gezeigt sind, sind ebenso wie weitere in Fig. 11 ge
zeigte Einzelheiten des Aufbaus mit denjenigen der ersten
Ausführungsform identisch.
Im folgenden wird mit Bezug auf Fig. 13 der Betrieb des
Senders 10B gemäß der zweiten Ausführungsform beschrie
ben. Es wird angenommen, daß der Sprechschalter 12 nicht
gedrückt ist und daß sich der Sender 10B in einem Bereit
schaftszustand befindet.
Zunächst setzt die Steuerschaltung 16B in einem Schritt
S31 eine Eintragungspuffernummer auf den Wert 1. Dann
werden in einem Schritt S32 die Prozessornummer auf den
Wert 1 gesetzt und der dieser Prozessornummer entspre
chende Spracherkennungsprozessor, zum Beispiel der
Spracherkennungsprozessor 22-1, aktiviert.
Dann stellt die Steuerschaltung 16B in einem Schritt S33
fest, ob der Sprechschalter 12 gedrückt ist, indem sie
ermittelt, ob vom Sprechschalter 12 ein Betriebssteuersi
gnal Sc erzeugt wird. Wenn der Sprechschalter 12 gedrückt
ist, wird ein Befehlssteuersignal Sc erzeugt, so daß die
Steuerschaltung 16B den Sender 10B zum Empfang eines
Sprachbefehls aktiviert.
Danach liest die Steuerschaltung 16B in einem Schritt S34
den Zustand des Betriebswahlschalters 13, um festzustel
len, ob er die Sprachspeicherbetriebsart für Sprachbe
fehle, in der Standardmusterdaten erzeugt werden, an
zeigt.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht
die Steuerung weiter zu einem Schritt S35, in der die
Steuerschaltung 16B einen Befehl ausgibt, der die
Spracherkennungseinrichtung 15B zur Ausführung einer
Spracheintragungsverarbeitung veranlaßt. Gleichzeitig
schickt die Steuerschaltung 16B im Schritt S35 an die
Spracherkennungseinrichtung 15B eine Eintragungspuffernum
mer.
Dann speichert die Spracherkennungseinrichtung 15B in einem
Schritt S36 in einem dem betreffenden Spracherkennungs
prozessor entsprechenden Eintragungspuffer im Speicher
23B, d. h. in einem Eintragungspuffer mit der Eintragungs
puffernummer 1, Spracherkennungs-Standardmusterdaten.
In einem Schritt S37 liest die Steuerschaltung 16B ein
(nicht gezeigtes) Statusregister in der Spracherkennungs
einrichtung 15B, um festzustellen, ob die Eintragung des
Sprachbefehls beendet ist oder nicht. Wenn die Eintragung
noch nicht beendet ist, werden die Schritte S36 und S37
solange wiederholt, bis sie beendet ist. Wenn sie beendet
ist, wird die Eintragungspuffernummer in einem Schritt
S38 um 1 erhöht.
Dann bestimmt die Steuerschaltung 16B in einem Schritt
S39, ob die momentane Eintragungspuffer eine höchstens im
betreffenden Spracherkennungsprozessor eintragbare Nummer
Nmax übersteigt. Wenn nicht, kehrt die Steuerung zum
Schritt S32 zurück. Wenn der Höchstwert überschritten
wird, bestimmt die Steuerschaltung 16B in einem Schritt
S40, ob die Prozessornummer eine höchste Spracherken
nungsprozessornummer Pmax übersteigt. Wenn nicht, geht
die Steuerung weiter zum Schritt S41.
Im Schritt S41 setzt die Steuerschaltung 16B die Eintra
gungspuffernummer wieder auf den Wert 1. Danach wird die
Prozessornummer in einem Schritt S42 um 1 erhöht, außer
dem wird in diesem Schritt der dieser Prozessornummer
entsprechende Spracherkennungsprozessor, zum Beispiel der
Spracherkennungsprozessor 22-2, aktiviert.
Wenn die Prozessornummer im Schritt S40 die maximale
Spracherkennungsprozessornummer Pmax übersteigt, sendet
die Steuerschaltung 16B an die Spracherkennungseinrichtung
15B einen Befehl zum Sprachspeicherbetriebsart in einem
Schritt S43 beendet wird. Dann kehrt die Steuerung zum
Schritt S32 zurück.
Wenn im Schritt S34 vom Betriebswahlschalter 13 die
Spracherkennungsbetriebsart angezeigt wird, aktiviert die
Steuerschaltung 16B in einem Schritt S44 sämtliche
Spracherkennungsprozessoren. Dann gibt die Steuerschal
tung 16B in einem Schritt S45 an die Spracherkennungs
einrichtung 15B einen Spracherkennungsbefehl aus. Nun füh
ren die Spracherkennungsprozessoren 22-1 bis 22-n in der
Spracherkennungseinrichtung 15B in einem Schritt S46 eine
Spracherkennungsverarbeitung, wie sie oben beschrieben
worden ist, aus.
In einem Schritt S47 liest die Steuerschaltung 16B ein
(nicht gezeigtes) Statusregister in der Spracherkennungs
einrichtung 15B, um festzustellen, ob die von den Spracher
kennungsprozessoren 22-1 bis 22-n ausgeführte Spracher
kennung beendet ist oder nicht. Wenn die Spracherkennung
noch nicht beendet ist, werden die Schritte 546 und S47
solange wiederholt, bis sie beendet ist. Wenn sie beendet
ist, zählt die Steuerschaltung 16B in einem Schritt S48
die Anzahl derjenigen Spracherkennungsprozessoren, deren
Erkennungsergebnisse übereinstimmen. Dieser Zählwert wird
als Wert der Prozessorzählung bezeichnet und zur Bestim
mung des Erkennungsgenauigkeits-Niveaus verwendet.
Dann stellt die Steuerschaltung 16B in einem Schritt S49
fest, ob das Erkennungsergebnis eine wichtige Operation
anzeigt. Wenn nicht, stellt die Steuerschaltung 16B in
einem Schritt S50 die Erkennungsgenauigkeit fest, indem
sie prüft, ob der Wert der Prozessorzählung gleich oder
größer als ein vorgegebener zweiter Zählwert ist. Der
zweite Zählwert entspricht einer Bedingung, in der das
selbe Erkennungsergebnis durch mehr als die Hälfte der
Spracherkennungsprozessoren erkannt wird und stellt eine
verhältnismäßig niedrige Erkennungsgenauigkeit dar. Wenn
der Wert der Prozessorzählung niedriger als der zweite
Zählwert ist, geht die Steuerung weiter zu einem Schritt
S54 für eine Fehlerverarbeitung, da der eingegebene
Sprachbefehl aufgrund der niedrigen Erkennungsgenauigkeit
nicht erkannt werden kann. Wenn der Wert der Prozessor
zählung gleich oder größer als der zweite Zählwert ist,
erzeugt die Steuerschaltung 16B in einem Schritt S52 auf
grund der erkannten Sprachbefehlsdaten ein Fernbedie
nungs-Befehlssignal SR, da die Erkennungsgenauigkeit ver
hältnismäßig hoch ist und die Erkennungsverarbeitung zu
verlässig ist, und sendet dieses Fernbedienungs-Befehls
signal SR an die Sendeeinrichtung 17.
Wenn das Erkennungsergebnis im Schritt S49 eine wichtige
Operation anzeigt, stellt die Steuerschaltung 16B in ei
nem Schritt S51 zur Bestimmung der Erkennungsgenauigkeit
fest, ob der Wert der Prozessorzählung gleich oder größer
als ein vorgegebener erster Zählwert ist. Der erste Zähl
wert stellt einen verhältnismäßig hohen Erkennungsgrad
dar und entspricht einer Bedingung, in der das gleiche
Erkennungsergebnis von mehr als 90% der Spracherkennungs
prozessoren erhalten wird. Um die Steuerzuverlässigkeit
aufrechtzuerhalten, wird für Steuerbefehle von hoher
Wichtigkeit kein Fernbedienungssignal Rc erzeugt, solange
die Bedingung im Schritt S51 nicht erzielt wird.
Die Steuerschaltung 16B erzeugt in einem Schritt S52 auf
grund der erkannten Sprachbefehlsdaten von hoher Erken
nungsgenauigkeit ein Fernbedienungs-Befehlssignal SR und
schickt dieses Signal an die Sendeeinrichtung 17. Aufgrund
des Fernbedienungs-Befehlssignal SR sendet die Sende
einrichtung in einem Schritt S53 ein entsprechendes Fernbe
dienungssignal Rc aus.
Wenn der Wert der Prozessorzählung niedriger als der
zweite Zählwert im Schritt S50 oder niedriger als der er
ste Zählwert im Schritt S51 ist, führt die Steuerschal
tung 16B in einem Schritt S54 eine Fehlerverarbeitung wie
etwa die Erzeugung eines Summtons aus, woraufhin die
Steuerung zum Schritt S32 zurückkehrt.
In der zweiten Ausführungsform wird ein eingegebener
Sprachbefehl aufgrund von verschiedenen Standardmusterda
ten PA1 bis PMn, PA2 bis PM2, . . ., PAn bis PMn von der
Mehrzahl der Spracherkennungsprozessoren 22-1 bis 22-n
erkannt.
Wenn das Erkennungsergebnis eine wichtige Operation an
zeigt, wird die Erkennungsgenauigkeit bestimmt, um die
Rate der fehlerhaften Erkennung abzusenken.
Da an die Erkennungsgenauigkeit eines Sprachbefehls von
hoher Wichtigkeit erhöhte Anforderungen gestellt werden,
wird die Erkennungsrate des sprachgesteuerten Fernbedie
nungssystems erhöht. Folglich werden Schwierigkeiten auf
grund einer fehlerhaften Erkennung minimiert.
Claims (5)
1. Sprachgesteuertes Fernbedienungssystem, enthaltend ein Mi
krofon für die Eingabe eines Sprachbefehls, eine Spracherken
nungseinrichtung zum Vergleichen eines Musters des eingegebenen
Sprachbefehls mit einem vorgegebenen Standardmuster, um den In
halt des Sprachbefehls zu erkennen und dementsprechende Be
fehlsdaten zu erzeugen, die für den auszuführenden Befehl re
präsentativ sind und eine Sendeeinrichtung zum Erzeugen und
Aussenden eines Fernsteuersignals entsprechend den Befehlsdaten
auf der Grundlage des Erkennungsergebnisses, gekennzeichnet
durch eine Wichtigkeitsgrad-Erkennungseinrichtung (5) zum Er
mitteln der Wichtigkeit der Befehlsdaten, um ein Wichtigkeits
gradsignal zu erzeugen, das angibt, ob die den Befehlsdaten
entsprechende Tätigkeit wichtig oder unwichtig ist und eine Er
kennungsgenauigkeits-Ermittlungseinrichtung (4), die die Ge
nauigkeit des Erkennungsergebnisses des Sprachbefehls ermittelt
und das Ergebnis als genau beurteilt, wenn die ermittelte Ge
nauigkeit einen vorbestimmten Schwellenwert überschreitet, der
in Abhängigkeit von dem Wichtigkeitsgradsignal variabel ist,
und die Befehlsdaten nur jener Sprachbefehle zu der Sendeein
richtung (17) überträgt, die als genau beurteilt worden sind.
2. Sprachgesteuertes Fernbedienungssystem nach Anspruch 1, dadurch gekennzeichnet,
daß in der Erkennungsgenauigkeits-Ermittlungseinrichtung (4)
ein erster Schwellenwert für Daten wichtiger Befehle und ein
zweiter Schwellenwert für Daten unwichtiger Befehle vorgesehen
sind.
3. Sprachgesteuertes Fernbedienungssystem nach Anspruch 1, dadurch gekennzeichnet,
daß die Spracherkennungseinrichtung (15A, 15B) mehrere Stan
dardmuster für den Vergleich mit einem Sprachbefehl enthält und
der Schwellenwert in Abhängigkeit von der Anzahl der Standard
muster bestimmt ist, die mit dem Muster des eingegebenen
Sprachbefehls im wesentlichen übereinstimmen.
4. Sprachgesteuertes Fernbedienungssystem nach Anspruch 3, dadurch gekennzeichnet,
daß die Spracherkennungseinrichtung (15A) einen Speicher (25)
zur Speicherung der Standardmuster in entsprechenden Speicher
bereichen und einen Spracherkennungsprozessor (22) enthält, der
die dem eingegebenen Sprachbefehl entsprechenden Standardmuster
aus dem Speicher (25) ausliest und den Sprachbefehl aufgrund
der ausgelesenen Standardmuster erkennt.
5. Sprachgesteuertes Fernbedienungssystem nach Anspruch 3, dadurch gekennzeichnet,
daß die Spracherkennungseinrichtung (15B) mehrere Speicher
(23B) zur Speicherung der jeweiligen Standardmuster und mehrere
Spracherkennungsprozessoren (22-1, . . ., 22-n) enthält, die mit
den entsprechenden Speichern (23B) verbunden sind und dem einge
gebenen Sprachbefehl entsprechende Standardmuster aus dem je
weiligen Speicher (23B) auslesen und den Sprachbefehl aufgrund
der gelesenen Standardmuster erkennen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1341630A JPH03203488A (ja) | 1989-12-29 | 1989-12-29 | 音声リモートコントロール装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4029716A1 DE4029716A1 (de) | 1991-07-04 |
DE4029716C2 true DE4029716C2 (de) | 1998-02-19 |
Family
ID=18347580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE4029716A Expired - Fee Related DE4029716C2 (de) | 1989-12-29 | 1990-09-19 | Sprachgesteuertes Fernbedienungssystem |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPH03203488A (de) |
DE (1) | DE4029716C2 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10012572A1 (de) * | 2000-03-15 | 2001-09-27 | Bayerische Motoren Werke Ag | Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem |
DE10015960A1 (de) * | 2000-03-30 | 2001-10-11 | Micronas Munich Gmbh | Spracherkennungsverfahren und Spracherkennungsvorrichtung |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3208800B2 (ja) * | 1991-08-09 | 2001-09-17 | ソニー株式会社 | マイクロフォン装置及びワイヤレスマイクロフォン装置 |
EP1031140B1 (de) | 1997-11-21 | 2001-10-10 | Siemens Aktiengesellschaft | Verfahren und vorrichtung zur spracherkennung |
US6275800B1 (en) * | 1999-02-23 | 2001-08-14 | Motorola, Inc. | Voice recognition system and method |
US20060087924A1 (en) * | 2004-10-22 | 2006-04-27 | Lance Fried | Audio/video portable electronic devices providing wireless audio communication and speech and/or voice recognition command operation |
DE102016114280A1 (de) * | 2016-08-02 | 2018-02-08 | Endress+Hauser Conducta Gmbh+Co. Kg | Feldgerät der Prozessautomatisierungstechnik |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2755633A1 (de) * | 1977-12-14 | 1979-06-21 | Loewe Opta Gmbh | Fernsteuerung zum steuern, ein- und umschalten von variablen und festen geraetefunktionen und funktionsgroessen in nachrichtentechn. geraeten |
US4286115A (en) * | 1978-07-18 | 1981-08-25 | Nippon Electric Co., Ltd. | System for recognizing words continuously spoken according to a format |
US4454608A (en) * | 1980-10-17 | 1984-06-12 | Hitachi, Ltd. | Audio response apparatus |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0683506B2 (ja) * | 1986-02-20 | 1994-10-19 | 井関農機株式会社 | 音声認識装置 |
-
1989
- 1989-12-29 JP JP1341630A patent/JPH03203488A/ja active Pending
-
1990
- 1990-09-19 DE DE4029716A patent/DE4029716C2/de not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2755633A1 (de) * | 1977-12-14 | 1979-06-21 | Loewe Opta Gmbh | Fernsteuerung zum steuern, ein- und umschalten von variablen und festen geraetefunktionen und funktionsgroessen in nachrichtentechn. geraeten |
US4286115A (en) * | 1978-07-18 | 1981-08-25 | Nippon Electric Co., Ltd. | System for recognizing words continuously spoken according to a format |
US4454608A (en) * | 1980-10-17 | 1984-06-12 | Hitachi, Ltd. | Audio response apparatus |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10012572A1 (de) * | 2000-03-15 | 2001-09-27 | Bayerische Motoren Werke Ag | Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem |
DE10012572C2 (de) * | 2000-03-15 | 2003-03-27 | Bayerische Motoren Werke Ag | Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem |
DE10015960A1 (de) * | 2000-03-30 | 2001-10-11 | Micronas Munich Gmbh | Spracherkennungsverfahren und Spracherkennungsvorrichtung |
DE10015960C2 (de) * | 2000-03-30 | 2003-01-16 | Micronas Munich Gmbh | Spracherkennungsverfahren und Spracherkennungsvorrichtung |
US6826533B2 (en) | 2000-03-30 | 2004-11-30 | Micronas Gmbh | Speech recognition apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
DE4029716A1 (de) | 1991-07-04 |
JPH03203488A (ja) | 1991-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4029698A1 (de) | Sprachgesteuertes fernbedienungssystem | |
DE4029717A1 (de) | Sprachgesteuertes fernbedienungssystem | |
DE4029697C2 (de) | Sprachgesteuertes Fernbedienungssystem | |
DE3819178C2 (de) | ||
DE60305568T2 (de) | Schlüsselworterkennung in einem Sprachsignal | |
DE60222249T2 (de) | Spracherkennungsystem mittels impliziter sprecheradaption | |
DE19752453B4 (de) | Positionserfassungsgerät und Positionszeigereinrichtung und Verfahren zum Erfassen von zwei oder mehr Positionszeigereinrichtungen | |
DE60301534T2 (de) | Verfahren und Vorrichtung für das Vorausahnen des Dienstablaufs | |
DE2918533A1 (de) | Spracherkennungssystem | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
DE3236832A1 (de) | Verfahren und geraet zur sprachanalyse | |
DE3236834A1 (de) | Verfahren und geraet zur sprachanalyse | |
DE4031421C2 (de) | Musteranpassungssystem für eine Spracherkennungseinrichtung | |
DE60023398T2 (de) | Verfahren und Vorrichtung zur Verbesserung der Spracherkennungsgenauigkeit mittels ereignis-basierter Beschränkungen | |
GB2181874A (en) | Voice recognition system | |
DE4031638C2 (de) | ||
DE4029716C2 (de) | Sprachgesteuertes Fernbedienungssystem | |
DE69918635T2 (de) | Vorrichtung und Verfahren zur Sprachverarbeitung | |
DE3043516C2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE3514286A1 (de) | System zur erkennung einzeln gesprochener woerter | |
DE4328752A1 (de) | Spracherkennungssystem | |
DE69922769T2 (de) | Vorrichtung und Verfahren zur Sprachverarbeitung | |
DE19581667C2 (de) | Spracherkennungssystem und Verfahren zur Spracherkennung | |
DE69333762T2 (de) | Spracherkennungssystem | |
EP0595889A1 (de) | Verfahren und anordnung zum erkennen von einzelwörtern gesprochener sprache. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8120 | Willingness to grant licences paragraph 23 | ||
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |