DE4029716C2 - Sprachgesteuertes Fernbedienungssystem - Google Patents

Sprachgesteuertes Fernbedienungssystem

Info

Publication number
DE4029716C2
DE4029716C2 DE4029716A DE4029716A DE4029716C2 DE 4029716 C2 DE4029716 C2 DE 4029716C2 DE 4029716 A DE4029716 A DE 4029716A DE 4029716 A DE4029716 A DE 4029716A DE 4029716 C2 DE4029716 C2 DE 4029716C2
Authority
DE
Germany
Prior art keywords
voice
command
remote control
speech recognition
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE4029716A
Other languages
English (en)
Other versions
DE4029716A1 (de
Inventor
Toshiyuki Kimura
Kazuo Yabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Publication of DE4029716A1 publication Critical patent/DE4029716A1/de
Application granted granted Critical
Publication of DE4029716C2 publication Critical patent/DE4029716C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/11Arrangements specific to free-space transmission, i.e. transmission through air or vacuum
    • H04B10/114Indoor or close-range type systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03JTUNING RESONANT CIRCUITS; SELECTING RESONANT CIRCUITS
    • H03J1/00Details of adjusting, driving, indicating, or mechanical control arrangements for resonant circuits in general
    • H03J1/0008Details of adjusting, driving, indicating, or mechanical control arrangements for resonant circuits in general using a central processing unit, e.g. a microprocessor
    • H03J1/0025Details of adjusting, driving, indicating, or mechanical control arrangements for resonant circuits in general using a central processing unit, e.g. a microprocessor in a remote control unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • H04B1/20Circuits for coupling gramophone pick-up, recorder output, or microphone to receiver
    • H04B1/202Circuits for coupling gramophone pick-up, recorder output, or microphone to receiver by remote control

Description

Die Erfindung bezieht sich auf ein sprachgesteuertes Fernbedienungsgerät (Fernbedienungssystem) nach dem Oberbegriff des Patentanspruchs 1. Ein Gerät dieser Art ist aus DE 27 55 633 A1 bekannt.
Die genannte Druckschrift beschreibt eine Fernsteuerung zum Steuern, Ein- und Um­ schalten von variablen und festen Gerätefunktionen und Funktionsgrößen in nachrich­ tentechnischen Geräten, insbesondere Geräten der Unterhaltungselektronik, mit einem Fernbedienungsgeber mit Funktionstasten und/oder Analogwertstellern, über die bei Betätigung Funktionsgeneratoren eingeschaltet werden, deren die Steuerbefehle beinhaltende Signale drahtlos oder drahtgebunden vom Fernbedienungsgeber zum Empfänger des zu steuernden Gerätes frequenz- oder amplitudenmoduliert mittels eines Übertragungsmediums übertragen werden. Der Fernbedienungsgeber ist mit einem Mikrophon verbunden, das an einen im Fernbedienungsgeber eingebauten Sprachana­ lysator angeschlossen ist, und die akustisch eingegebenen Wortbefehle werden nach Umsetzung in elektrische Signale vom Sprachanalysator nach der Frequenz und nach auswertbaren Wortteilen analysiert, wobei die Signale der Wortteile mit eingespeicherten Signalen verglichen werden und bei Koinzidenz ein Steuerbefehl des dem eingegebenen Wortbefehl entsprechenden Inhalts abgegeben wird. Der Steuerbefehl steuert eine dem Sprachanalysator nachgeschaltete Sendestufe derart, daß der Steuerbefehl mit einem Trägerfrequenz- oder amplitudenmoduliert wird. Im Empfänger werden die empfange­ nen Signale in einem Demodulator demoduliert, und die rückgewonnenen Steuerbefehle werden einem elektronischen Umschalter zugeführt, der entsprechend dem anliegenden Steuerbefehl den zu steuernden Funktionssteller einschaltet und setzt.
Aus der US 4 454 608 ist ein Sprachsynthesesystem bekannt, bei dem wichtige Worte um Sprachsynthesizer mit größerer Lautstärke wiedergegeben werden, als unwichtige Worte.
Aus der US 4 286 115 ist ein Erkennungssystem für zusammenhängende Sprache bekannt, das einen Speicher enthält, in dem individuell gesprochene Wortschätze für den Vergleich mit der zu erkennenden Sprache gespeichert sind. Ein eingegebenes Muster wird mit mehreren, einander ähnlichen Bezugsmustern verglichen. Jenes Wort wird als erkannt bezeichnet, das mit den meisten Vergleichsmustern übereinstimmt.
Bei den herkömmlichen sprachgesteuerten Fernbedienungssystemen wird ein im Erkennungsergebnis einer Sprachverarbeitung entsprechendes Fernbedienungssignal in seiner ursprünglichen Form übertragen. Die Wichtigkeit von Operationen eines zu steuernden Geräts, die den jeweiligen Fernbedienungssignalen entsprechen, d. h. das Ausmaß der Auswirkungen einer fehlerhaften Erkennung, muß nicht für alle Operationen dieselbe sein. Beispielsweise sind die negativen Auswirkungen, die bei einer fehlerhaften Erkennung eines eine Aufnahmeoperation betreffenden Sprachbefehls auftreten, weitaus gravierender als die negativen Auswirkungen einer fehlerhaften Erkennung eines einer Wiedergabeoperation entsprechenden Sprachbefehls. Wenn die Steuerbefehle in Abhän­ gigkeit vom Typ des Steuerbefehls anstatt mit gleichem Wichtigkeitsgrad mit geeigneten, unterschiedlichen Wichtigkeitsgraden behandelt werden, kann die Spracherkennung mit höherer Effizienz verarbeitet werden, und ferner kann für wichtigere Steuerbefehle eine höhere Zuverlässigkeit erzielt werden.
Der Erfindung liegt daher die Aufgabe zugrunde, ein sprachgesteuertes Fernbedienungs­ system der eingangs genannten Art anzugeben, das in Abhängigkeit von der Wichtigkeit eines Steuerbefehls die der Spracherkennung dienende Verarbeitung verändern kann.
Diese Aufgabe wird durch die im Patentanspruch 1 angegebenen Merkmale gelöst. Vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
Tragende Merkmale der vorliegenden Erfindung sind eine Wichtigkeitsgrad-Erkennungs­ einrichtung zum Ermitteln der Wichtigkeit der Befehlsdaten, eine Erkennungsgenauig­ keits-Ermittlungseinrichtung, die die Genauigkeit des Erkennungsergebnisses des Sprachbefehls ermittelt, und ein Schwellenwert der ermittelten Erkennungsgenauigkeit, der in Abhängigkeit von der Wichtigkeit des Sprachbefehls variabel ist. Auf diese Weise werden bei der Erkennung von Befehlen wichtigen Inhalts höhere Anforderungen gestellt, als bei Befehlen unwichtigen Inhalts.
Die die Wichtigkeit eines Befehls ermitteltende Einrichtung erzeugt in Abhängigkeit von der Wichtigkeit des Befehls ein entsprechendes Wichtigkeitsgradsignal, das angibt, ob die entsprechend dem Befehl auszuführende Tätigkeit wichtig ist oder nicht. Die Erken­ nungsgenauigkeit-Ermittlungseinrichtung ermittelt die Genauigkeit der Befehlserkennung durch Vergleich der ermittelten Genauigkeit mit dem genannten vorbestimmten Schwellenwert, der in Abhängigkeit vom Wichtigkeitsgradsignal schwankt, d. h. in Abhängigkeit davon, ob der Befehl wichtig ist oder nicht.
Die Erfindung, weitere Merkmale derselben und ihre Vorteile werden nachfolgend unter Bezugnahme auf in den Zeichnungen dargestellte Ausführungsbeispiele näher erläutert.
Es zeigt:
Fig. 1 ein Blockschaltbild eines allgemeinen Fernbedienungssystems;
Fig. 2 eine beispielhafte Darstellung eines Fernbedienungssignals;
Fig. 3 ein Blockschaltbild des Senders eines allge­ meinen sprachgesteuerten Fernbedienungssy­ stems
Fig. 4 eine perspektivische Ansicht des Senders ei­ nes sprachgesteuerten Fernbedienungssystems gemäß einer ersten Ausführungsform der vor­ liegenden Erfindung;
Fig. 5 ein Blockschaltbild des Senders des sprachge­ steuerten Fernbedienungssystems gemäß der er­ sten Ausführungsform;
Fig. 6 ein detailliertes Blockschaltbild des Senders gemäß der ersten Ausführungsform;
Fig. 7 ein Blockschaltbild einer Spracherkennungs­ einrichtung gemäß der ersten Ausführungsform;
Fig. 9(a) eine Darstellung eines Analogprozessors;
Fig. 9(b) bis 9(f) Darstellungen der Signal-Wellenformen im in Fig. 9(a) gezeigten Analogprozessor;
Fig. 10 ein Flußdiagramm eines Operationsablaufs des Senders gemäß der ersten Ausführungsform;
Fig. 11 ein Blockschaltbild des Senders des sprachge­ steuerten Fernbedienungssystems gemäß einer zweiten Ausführungsform der vorliegenden Er­ findung;
Fig. 12 ein Blockschaltbild einer Spracherkennungs­ einrichtung gemäß der zweiten Ausführungsform; und
Fig. 13 ein Flußdiagramm eines Operationsablaufs des Senders gemäß der zweiten Ausführungsform.
Allgemeines Fernbedienungssystem
Zum besseren Verständnis der vorliegenden Erfindung wer­ den im folgenden zunächst ein allgemeines Fernbedienungs­ system und ein Sprach-Fernbedienungssingal beschrieben.
Wie in Fig. 1 gezeigt, umfaßt ein Fernbedienungssystem 100 einen Sender 101, der ein Fernbedienungssignal von einer von einem zu steuernden Gerät 103 wie etwa einem AV-Gerät entfernten Position aussendet, und einen Empfän­ ger 102, der das ausgesendete Fernbedienungssignal emp­ fängt, dieses dekodiert und die dekodierte Information an das zu steuernde Gerät 103 schickt.
In Fig. 2 ist ein allgemeines Fernbedienungssignal ge­ zeigt. Das Fernbedienungssignal besteht aus einem Leit­ kode, der die Datenübertragung einem Empfänger anzeigt, einem Abnehmerkode und einem invertierten Abnehmerkode, die ein zu steuerndes Gerät bezeichnen, und schließlich aus einem Datenkode und einem invertierten Datenkode, die einen Steuerbefehl für das zu steuernde Gerät bezeichnen. Der invertierte Abnehmerkode und der invertierte Daten­ kode werden zur Ermittlung eines Fehlers im Abnehmerkode bzw. im Datenkode verwendet.
In Fig. 3 ist schematisch der Sender 101 des sprachge­ steuerten Fernbedienungssystems 100 gezeigt. Der Sender 101 umfaßt ein Mikrophon M, das einen Sprachbefehl in ein elektrisches Signal umwandelt. Das umgewandelte elektri­ sche Signal wird in eine Spracherkennungseinrichtung 15, eingegeben, wobei diese in Ge­ stalt einer Spracherkennungs-LSI-Schaltung oder ähnlichem vorliegt und einen Mikroprozessor enthält. Die Spracher­ kennungseinrichtung 15 erkennt den Inhalt des eingegebenen elektrischen Signals und erzeugt diesem erkannten Inhalt entsprechende Steuerdaten. Der Sender 101 besitzt außer­ dem eine einen Mikroprozessor umfassende Steuerschaltung 16. Auf der Grundlage der Steuerdaten von der Spracher­ kennungseinrichtung 15 erzeugt die Steuerschaltung 16 ein Fernbedienungs-Befehlssignal SR und gibt dieses in eine Sendeeinrichtung 17 ein, die anschließend eine Infrarot­ licht-Emitterdiode D₁ aktiviert, so daß diese ein Fernbe­ dienungssignal Rc ausgibt. Die erwähnten Bestandteile des Senders 101 werden von einer Leistungsversorgungsschal­ tung 18 mit elektrischer Energie versorgt.
Wenn über das Mikrophon M ein Sprachbefehl empfangen wird, wandelt die Spracherkennungseinrichtung 15 den Sprachbefehl in Musterdaten um. Die Spracherkennungs­ einrichtung 15 vergleicht die Sprachbefehl-Musterdaten mit einer Mehrzahl von in ihr gespeicherten Standardmusterda­ ten und bestimmt den Abstand zwischen den Sprachbefehl-Muster­ daten und den Standardmusterdaten; anschließend gibt die Spracherkennungseinrichtung 15 Befehlsdaten aus, die denjenigen Standardmusterdaten entsprechen, deren Ab­ stand zu den Sprachbefehl-Musterdaten am kleinsten ist. Es kann auch eine andere Spracherkennungsverarbeitung zur Anwendung kommen, in der die Ähnlichkeit der verglichenen Musterdaten entsprechend einem einfachen Ähnlichkeitsver­ fahren bestimmt wird und Befehlsdaten, die den Standard­ musterdaten mit der höchsten Ähnlichkeit entsprechen, ausgegeben werden. Die so erzeugten Befehlsdaten werden in die Steuerschaltung 16 eingegeben.
Die Steuerschaltung 16 schickt ein den eingegebenen Be­ fehlsdaten entsprechendes Fernbedienungs-Befehlssignal SR an die Sendeeinrichtung 17. Aufgrund des gelieferten Fern­ bedienungs-Befehlssignals SR steuert die Sendeeinrichtung 17 die Infrarotlicht-Emitterdiode C₁ an, so daß diese ein Fern­ bedienungssignal Rc aussendet. Das zu steuernde Gerät 103 wird auf diese Weise durch das Fernbedienungssignal Rc ferngesteuert.
Erste Ausführungsform
Nun wird mit Bezug auf die Fig. 4 bis 10 ein sprachge­ steuertes Fernbedienungssystem gemäß einer ersten Ausfüh­ rungsform der vorliegenden Erfindung beschrieben.
Wie in Fig. 4 gezeigt, weist ein Sender 10A des sprachge­ steuerten Fernbedienungssystems ein einteiliges Gehäuse 11 auf, das der Bedienungsperson das freie Umhertragen des Senders erlaubt. Das Gehäuse 11 besitzt in seiner oberen Blende ein Mikrophon M. Das Mikrophon M wandelt den von der Bedienungsperson gegebenen Sprachbefehl in ein elektrisches Signal um. Ein Sendemittel (etwa eine Infrarotlicht-Emitterdiode D₁) ist an einem Ende des Ge­ häuses 11 angebracht. Die Infrarotlicht-Emitterdiode D₁ wird dazu verwendet, ein Fernbedienungssignal an den Emp­ fänger eines (nicht gezeigten) entfernt angeordneten zu steuernden Gerätes zu senden. Auf einer Seite des Gehäu­ ses 11 ist ein Spracheingabeschalter 12 (der im folgenden mit "Sprechschalter" bezeichnet wird) angeordnet, der im gedrückten Zustand geschlossen ist und automatisch geöff­ net wird, wenn er losgelassen wird. Der Sprechschalter 12 kann ein automatisch zurückstellender Druckknopf oder ein (automatisch zurückstellender) Schiebeschalter sein. Wenn ein Sprachbefehl eingegeben wird, wird der Sprechschalter 12 geschlossen, um den Sender 10A zu betätigen. Sonst ist der Sprechschalter 12 geöffnet, so daß der Sender 10A au­ ßer Betrieb gehalten wird. Das Gehäuse 11 besitzt an sei­ ner Seite außerdem einen Betriebswahlschalter 13, der beispielsweise die Form eines Schiebeschalters besitzt. Der Betriebswahlschalter 13 dient der Auswahl einer der Betriebsarten für einen bestimmten Zeitpunkt. Die Be­ triebsarten umfassen eine Sprachspeicherbetriebsart, in der der Sprachbefehl im Sender 10A gespeichert wird, und eine Spracherkennungsbetriebsart, in der ein Sprachbefehl erkannt wird, wie später beschrieben werden wird. Das Ge­ häuse 11 beinhaltet die elektronische Schaltung des er­ findungsgemäßen sprachgesteuerten Fernbedienungssystems.
(Aufbau der elektronischen Schaltung)
In Fig. 5 ist die elektronische Schaltung des Senders 10A des sprachgesteuerten Fernbedienungssystems gemäß der vorliegenden Erfindung in Blockform gezeigt. Der Sender 10A umfaßt eine Spracherkennungseinrichtung 15A, die einen über das Mikrophon M eingegebenen Sprachbefehl gemäß ei­ ner Mustererkennungsverarbeitung erkennt, eine Wichtig­ keitsgrad-Erkennungseinrichtung 5, die den Wichtigkeitsgrad eines erkannten Sprachbefehls ermittelt, eine Wählvorrich­ tung 6, die Schaltungen oder Bestimmungspunkte, an die ein Ausgangssignal von der Spracherkennungseinrichtung 15A geschickt werden sollen, in Abhängigkeit vom bestimmten Wichtigkeitsgrad auswählt, eine Erkennungsgenauigkeits-Ermitt­ lungseinrichtung 4, die die Genauigkeit der Erkennung eines einen hohen Wichtigkeitsgrad besitzenden Sprachbefehls bestimmt, und eine Sendeeinrichtung 17, die erkannte Sprachbefehlsdaten in ein Fernbedienungssignal Rc umwan­ delt und das Fernbedienungssignal Rc aussendet.
Wie in Fig. 6 gezeigt, umfaßt der Sender 10A eine mit dem Sprechschalter 12 und dem Betriebswahlschalter 13 verbun­ dene Steuerschaltung 16A. Die Steuerschaltung 16A liefert an die Sendeeinrichtung 17 ein Fernbedienungs-Befehlssignal SR, woraufhin die Sendeeinrichtung 17 die Infrarotlicht-Emitter­ diode D₁ zum Aussenden eines Fernbedienungssignals Rc an den Empfänger eines entfernt angeordneten zu steu­ ernden Gerätes aktiviert. Die Spracherkennungseinrichtung 15A, die Steuerschaltung 16A und die Sendeeinrichtung 17 werden von einer Stromversorgungsschaltung 18 über eine Stromversorgungs-Steuerschaltung 14 und Stromversorgungsleitungen mit elektrischer Energie ver­ sorgt.
Wie in Fig. 7 gezeigt, umfaßt die Spracherkennungseinrich­ tung 15A einen Analogprozessor 21, der ein über das Mi­ krophon M empfangenes analoges Sprachbefehlssignal verar­ beitet und das verarbeitete analoge Sprachbefehlssignal als Zeitaufteilungs-Digitaldaten 20 ausgibt, einen Spracherkennungsprozessor 22, der den Sprachbefehl auf­ grund der vom Analogprozessor 21 gelieferten Zeitauftei­ lungs-Digitaldaten 20 erkennt, einen Speicher 23A, in dem Standardmusterdaten für die Spracherkennung gespeichert sind, und eine Schnittstelle 24, über die Signale an die Steuerschaltung 16A geliefert und von der Steuerschaltung 16A empfangen werden.
Der Speicher 23A umfaßt eine Standardmusterdaten-Spei­ chereinheit 25, in der eine Mehrzahl von unterschiedli­ chen Standardmusterdaten PA1 bis PAn, PB1 bis PBn, . . ., PM1 bis PMn für die jeweiligen Sprachbefehle gespeichert wer­ den.
Wie in Fig. 8 gezeigt ist, umfaßt der Analogprozessor 21 im allgemeinen einen Verstärker 30, der ein vom Mikrophon M übertragenes Sprachbefehlssignal auf einen geeigneten Pegel verstärkt, eine Filterreihe 31, die ein Verstärker­ ausgangssignal in Signale in verschiedenen Frequenzbän­ dern unterteilt, gleichrichtet und die Signale in diesen verschiedenen Frequenzbändern ausgibt, eine Ana­ log/Digital-Wandleranordnung 32 (die im folgenden mit "A/D-Wandleranordnung" bezeichnet wird), die die Aus­ gangssignale in den verschiedenen Frequenzbändern der Filterreihe 31 in Digitalsignale umwandelt, und eine Schnittstelle 33, die Signale an den Spracherkennungspro­ zessor 22 schickt und von diesem Signale empfängt.
In Fig. 9(a) ist gezeigt, daß die Filterreihe 31 eine Bandpaßfilteranordnung 35, die das eingegebene Sprachsi­ gnal in Signale einer Mehrzahl von Frequenzbändern (vier Frequenzbänder in Fig. 9(a)) unterteilt, einen Gleich­ richteranordnung 36, die die Ausgangssignale der Bandpaß­ filteranordnung 35 gleichrichtet und eine Tiefpaßfiltera­ nordnung 37, die aus den Ausgangssignalen von der Gleich­ richteranordnung 36 den Brumm entfernt.
Die Bandpaßfilteranordnung 35 umfaßt mehrere (vier in Fig. 9(a)) Bandpaßfilter BPF₀ bis BPF₃, die ent­ sprechend ihren jeweiligen Frequenzbändern die Mittenfre­ quenzen f₀, f₁, f₂ und f₃ (f₀<f₁<f₂<f₃) besitzen.
Die Gleichrichteranordnung 36 umfaßt vier Gleichrichter RCT₀ bis RCT₃, die mit den entsprechenden Bandpaßfiltern BPF₀ bis BPF₃ der Bandpaßfilteranordnung 35 in Reihe ge­ schaltet sind. Von den Gleichrichtern RCT₀ bis RCT₃ wer­ den die Ausgangssignale in den jeweiligen Frequenzbändern der Bandpaßfilter BPF₀ bis BPF₃ gleichgerichtet.
Die Tiefpaßfilteranordnung 37 umfaßt vier Tiefpaßfilter LPF₀ bis LPF₃, die mit den jeweiligen Gleichrichtern RCT₀ bis RCT₃ der Gleichrichteranordnung 36 in Reihe geschal­ tet sind. Die Tiefpaßfilter LPF₀ bis LPF₃ beseitigen aus den gleichgerichteten Signalen in den entsprechenden Fre­ quenzbändern den Brumm.
Die A/D-Wandleranordnung 32 umfaßt vier A/D-Wandler ADC₀ bis ADC₃, die mit den jeweiligen Tiefpaßfiltern LPF₀ bis LPF₃ der Tiefpaßfilteranordnung 37 in Reihe geschaltet sind. Die A/D-Wandler ADC₀ bis ADC₃ wandeln die analogen Ausgangssignale der Tiefpaßfilter LPF₀ bis LPF₃ in Digi­ talsignale um.
Nun wird der Betrieb des Analogprozessors 21 beschrieben. Um der Kürze willen wird nur die Signalverarbeitung in einem Frequenzband (zum Beispiel im demjenigen des Band­ paßfilters BPF₃) beschrieben. In den anderen Frequenzbän­ dern wird jedoch eine ähnliche Signalverarbeitung ausge­ führt.
Wenn in das Mikrophon ein Sprachbefehl eingegeben wird, wird das vom Mikrophon M ausgegebene elektrische Signal durch den Verstärker 30 auf einen geeigneten Signalpegel verstärkt, woraufhin das verstärkte Signal A (s. Fig. 9(b)) ausgegeben wird. Das verstärkte Signal A wird an das Bandpaßfilter BPF₃ geliefert, welches nur ein seinem Frequenzband entsprechendes Signal B hindurchläßt. Dieses Signal B wird anschließend an den Gleichrichter RCT₃ ge­ geben. (s. Fig. 9(c)). Das Signal B wird durch den Gleichrichter RCT₃ gleichgerichtet, anschließend wird das gleichgerichtete Ausgangssignal C (s. Fig. 9(d)) des Gleichrichters RCT₃ an das Tiefpaßfilter LPF₃ geschickt. Das Tiefpaßfilter LPF₃ beseitigt einen Brumm, der im Si­ gnal C eventuell enthalten ist, und erzeugt ein brumm­ freies Ausgangssignal D (s. Fig. 9(e)), das anschlie­ ßend an den A/D-Wandler ADC₃ gegeben wird. Der A/D-Wand­ ler ADC₃ wandelt dann das an ihn gelieferte Eingangssi­ gnal D in ein Signal E um, das, wie in Fig. 9(f) gezeigt ist, aus 4-Bit-Zeitaufteilungs-Digitaldaten (1010) (0111), (0101), (0111), (1101), . . . zusammengesetzt ist.
Wie in Fig. 8 gezeigt, umfaßt der Spracherkennungsprozes­ sor 22 eine Systemsteuerschaltung 40, die Steuerbefehle von der Steuerschaltung 16A analysiert und verarbeitet und ferner die gesamte Operation des Spracherkennungspro­ zessors 22 steuert, und einen Digitalprozessor 41, der die Abstandsberechnungen ausführt und den Speicher 23A steuert.
Die Systemsteuerschaltung 40 umfaßt eine CPU 42 (Zentraleinheit), die den Gesamtbetrieb des Senders 10A steuert, ein ROM 43 (Nur-Lese-Speicher), in dem ein von der CPU 42 für die Gesamtoperation des Senders 10A abzu­ arbeitendes Steuerprogramm gespeichert ist, ein RAM 44 (Schreib-Lese-Speicher), das vorübergehend Daten spei­ chert, und eine Schnittstelle 45, die sowohl an den Ana­ logprozessor 21 als auch an den Digitalprozessor 41 Daten überträgt und von diesen Prozessoren Daten empfängt.
Der Digitalprozessor 41 umfaßt eine Recheneinheit 46, die Abstandsberechnungen ausführt und auf der Grundlage der Ergebnisse der Abstandsberechnungen eingegebene Sprachbe­ fehle identifiziert, ein Daten-RAM 47, das die für die Abstandsberechnungen erforderlichen Daten speichert, ein ROM 48, in dem ein Programm für die Abstandsberechnungen gespeichert ist, ein Arbeits-RAM 49, das vorübergehend die verarbeiteten Daten speichert, eine Schnittstelle 50, die Daten sowohl an den Analogprozessor 21 als auch an die Systemsteuerschaltung 40 sendet und von diesen Daten empfängt, und eine Schnittstelle 51, die Daten an den Speicher 23A überträgt und von diesem empfängt.
Der Spracherkennungsprozessor 22 arbeitet wie folgt: Wenn von der Steuerschaltung 16A über die Schnittstelle 24 ein Steuerbefehl an den Spracherkennungsprozessor 22 gegeben wird, empfängt die Systemsteuerschaltung 40 den Steuerbe­ fehl über die Schnittstellen 50 und 45 und analysiert den empfangenen Steuerbefehl. Wenn das Analyseergebnis eine Spracherkennungsverarbeitung anzeigt, schickt die Sy­ stemsteuerschaltung 40 über die Schnittstellen 45 und 50 einen Befehl zur Spracherkennung an den Digitalprozessor 41.
Wenn die Systemsteuerschaltung 40 aktiviert wird, gibt der Digitalprozessor 41 Zeitaufteilungs-Digitaldaten 20 (Signal des eingegebenen Sprachbefehls) vom Analogprozes­ sor 21 über die Schnittstelle 50 in das Daten-RAM 47 ein. Die Recheneinheit 46 liest aus der ersten Adresse des Speichers 23A, in dem unterschiedliche Standardmusterda­ ten PA1 bis PAn, PB1 bis PBn, . . ., PM1 bis PMn gespeichert sind, über die Schnittstelle 51 Standardmusterdaten aus. Dann bestimmt die Recheneinheit 46 den Logarithmus des ersten Satzes von Zeitaufteilungs-Digitaldaten mehrerer Sätze Zeitaufteilungs-Digitaldaten, der einen der gelesenen Standardmusterdatensätze bildet, und außerdem den Logarithmus der Zeitaufteilungs-Digitaldaten des Signals des eingegebenen Sprachbefehls; anschließend bestimmt die Recheneinheit 46 die Differenz zwischen die­ sen Logarithmen. Dann quadriert die Recheneinheit 46 diese Differenzen und addiert die Quadrate, um einen Ab­ stand D zu bestimmen. Daher ist der Abstand D durch
gegeben, wobei gilt:
x: Anzahl der Zeitaufteilungen
f(t): eingegebene Sprachbefehlsdaten (Zeitaufteilungs-Digitaldaten)
fs(t): Standardmusterdaten (Zeitaufteilungs-Digitaldaten).
Auf die gleiche Weise werden die Abstände D für sämtliche Standardmusterdaten berechnet. Je kleiner die berechneten Abstände, um so höher ist die Wahrscheinlichkeit, daß die Standardmusterdaten dem Sprachbefehl ähnlich sind. Die so erhaltenen Erkennungsergebnisse werden für jeden der Sprachbefehle gesammelt. Dann werden die Befehlsdaten, die demjenigen Sprachbefehl entsprechen, dem die Stan­ dardmusterdaten als Ganzes am meisten ähneln, als Be­ fehlsdaten der Spracherkennungseinrichtung 15A über die Schnittstelle 24 an die Steuerschaltung 16A ausgegeben.
Nun wird wieder auf Fig. 6 Bezug genommen. Die Steuer­ schaltung 16A ist beispielsweise in einem Mikroprozessor ausgebildet. Der Mikroprozessor der Steuerschaltung 16A umfaßt eine CPU, ein ROM, ein RAM und eine Schnittstelle. Die CPU führt Rechenoperationen aus, wobei sie auf die im als Arbeitsspeicher dienenden RAM gespeicherten Daten Be­ zug nimmt und die Rechenoperationen gemäß dem Algorithmus (s. Fig. 10) eines im ROM gespeicherten Steuerprogramms ausführt und dadurch die Gesamtoperation des Senders 10A bewirkt. Die Steuerschaltung 16A empfängt außerdem Unter­ brechungssignale vom Sprechschalter 12 und vom Betriebs­ wahlschalter 13 und führt Steuerfunktionen entsprechend den durch diese Unterbrechungssignale angezeigten Befeh­ len aus. Die Operation des Senders 10A unter Steuerung der Steuerschaltung 16A wird im folgenden beschrieben.
In der Steuerschaltung 16A sind die Erkennungsgenauig­ keits-Ermittlungseinrichtung 4, die Wichtigkeitsgrad-Erken­ nungseinrichtung 5 und die Wählvorrichtung 6 jeweils soft­ waremäßig implementiert. Genauer sind die Wichtigkeits­ grad-Erkennungseinrichtung 5 und die Wählvorrichtung 6 in einem Schritt S17 in Fig. 10 implementiert, während die Erkennungsgenauigkeits-Ermittlungseinrichtung 4 durch die Schritte S16, S18 und S19 in Fig. 10 implementiert ist.
(Gesamtbetrieb)
Der Sender 10A arbeitet in Abhängigkeit davon, ob der Sprechschalter 12 gedrückt oder losgelassen ist (d. h. ein- oder ausgeschaltet ist). Wenn der Sprechschalter 12 gedrückt ist, kann der Sender 10A die Fernbedienungssi­ gnale senden, während der Sender dann, wenn der Sprech­ schalter 12 losgelassen ist, in einer Betriebsart mit niedrigem Leistungsverbrauch gehalten wird und auf ein­ zugebende Sprachbefehle wartet. Es gibt zwei Eingabebe­ triebsarten für die Eingabe von Sprachbefehlen. In einer Eingabebetriebsart werden Sprachbefehle der Bedienungs­ person gespeichert, in der anderen Eingabebetriebsart werden Sprachbefehle der Bedienungsperson wiedererkannt.
In der Sprachspeicherbetriebsart wird ein Wort wie etwa "Wiedergabe" in den Sender 10A aufgenommen.
Nun wird der Betrieb des Senders 10A mit Bezug auf das Flußdiagramm von Fig. 10 beschrieben. Es wird angenommen, daß der Sprechschalter 12 nicht gedrückt ist und der Sen­ der sich in einem Bereitschaftszustand in der Betriebsart mit niedrigem Energieverbrauch befindet.
Zunächst setzt die Steuerschaltung 16A in einem Schritt S1 eine Eintragungspuffernummer auf den Wert 1.
Dann ermittelt die Steuerschaltung 16A in einem Schritt S2, ob der Sprechschalter 12 gedrückt ist oder nicht, in­ dem sie ermittelt, ob vom Sprechschalter 12 ein Betriebs­ steuersignal Sc erzeugt wird oder nicht. Wenn in diesem Moment ein Betriebssteuersignal Sc vorliegt, bedeutet dies, daß der Sprechschalter 12 gedrückt ist, so daß die Steuerschaltung 16A ein Steuersignal Sv an die Strom­ versorgungs-Steuerschaltung 14 sendet. Die Stromver­ sorgungs-Steuerschaltung 14 liefert in einer normalen Be­ triebsart elektrische Energie und schaltet den Sender 10A in einem Schritt S4 in die normale Betriebsart.
Wenn der Sprechschalter 12 nicht gedrückt ist, wird der Sender 10A in der Betriebsart mit niedrigem Energiever­ brauch gelassen, anschließend werden die Schritte S2 und S3 wiederholt, wobei sich der Sender 10A in einem Warte­ zustand für einen Sprachbefehl befindet.
Danach liest die Steuerschaltung 16A in einem Schritt S5 den Zustand des Betriebswahlschalters 13, um festzustel­ len, ob die Sprachspeicherbetriebsart für Sprachbefehle angezeigt wird oder nicht.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht die Steuerung weiter zu einem Schritt S6, in dem die Steuerschaltung 16A einen Befehl ausgibt, mit dem die Spracherkennungseinrichtung 15A zur Ausführung einer Spracherkennungsverarbeitung veranlaßt wird. Gleichzeitig schickt die Steuerschaltung 16A im Schritt S6 an die Spracherkennungseinrichtung 15A eine Eintragungspuffernum­ mer.
In einem Schritt S7 speichert die Spracherkennungseinrich­ tung 15A Spracherkennungs-Standardmusterdaten in einem entsprechenden Eintragungspuffer des Speichers 23A, d. h. in einem Eintragungspuffer mit der Eintragungspuffernum­ mer 1.
Die Steuerschaltung 16A liest in einem Schritt S8 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ einrichtung 15A, um festzustellen, ob die Eintragung eines Sprachbefehls beendet ist oder nicht. Wenn die Eintragung noch nicht beendet ist, werden die Schritte S7 und S8 so­ lange wiederholt, bis sie beendet ist. Wenn die Eintra­ gung beendet ist, wird die Eintragungspuffernummer im Schritt S9 um den Wert 1 erhöht.
Dann ermittelt die Steuerschaltung 16A in einem Schritt S10, ob die momentane Eintragungspuffernummer einen maxi­ mal speicherbaren Wert Nmax übersteigt oder nicht. Wenn dies nicht der Fall ist, kehrt die Steuerung zum Schritt S2 zurück. Wenn der maximale Wert überschritten wird, schickt die Steuerschaltung 16A einen Befehl zur Beendi­ gung der Sprachspeicherbetriebsart an die Spracherken­ nungseinrichtung 15A und beendet dadurch in einem Schritt S11 die Sprachspeicherbetriebsart. Dann geht die Steue­ rung zurück zum Schritt S2.
Wenn im Schritt S5 vom Betriebswahlschalter 13 nicht die Sprachspeicherbetriebsart angezeigt wird, d. h. wenn im Schritt S5 vom Betriebswahlschalter 13 die Spracherken­ nungsbetriebsart angezeigt wird, gibt die Steuerschaltung 16A in einem Schritt S12 an die Spracherkennungseinrichtung 15A einen Spracherkennungsbefehl aus. Die Spracherken­ nungseinrichtung 15A führt nun in einem Schritt S13 eine Spracherkennungsverarbeitung aus, wie sie oben beschrie­ ben worden ist; das bedeutet, daß zwischen den eingegebe­ nen Sprachbefehlsdaten und den Standardmusterdaten ein Abstand D bestimmt wird, um zwischen diesen eine Ähnlich­ keit festzustellen.
Die Steuerschaltung 16A liest in einem Schritt S14 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ einrichtung 15A, um festzustellen, ob die Spracherkennung beendet ist oder nicht. Wenn die Spracherkennung noch nicht beendet ist, werden die Schritte S13 und S14 so­ lange wiederholt, bis sie beendet ist. Wenn sie beendet ist, stellt die Steuerschaltung 16A in einem Schritt S15 fest, ob die Daten des eingegebenen Sprachbefehls mit den Standardmusterdaten übereinstimmen, d. h. ob der Abstand D in einem vorgegebenen Abstandsbereich liegt. Wenn die Da­ ten des eingegebenen Sprachbefehls mit den Standardmu­ sterdaten übereinstimmen, zählt die Steuerschaltung 16A in einem Schritt S16 die Anzahl derjenigen Standardmu­ sterdatensätze sämtlicher dem Erkennungsergebnis entspre­ chender Standardmusterdatensätze, die nicht mit dem Er­ kennungsergebnis übereinstimmen. Der Zählwert wird als Wert der Musterzählung bezeichnet, die der Bestimmung des Erkennungsgenauigkeitsniveaus dient.
Dann bestimmt die Steuerschaltung 16A in einem Schritt S17, ob das Erkennungsergebnis eine wichtige Operation anzeigt. Wenn nicht, ermittelt die Steuerschaltung 16A in einem Schritt S18, ob der Wert der Musterzählung gleich oder größer als ein vorgegebener zweiter Zählwert ist. Der zweite Zählwert entspricht einer Bedingung, in der das gleiche Erkennungsergebnis unter Verwendung von mehr als der Hälfte der Standardmusterdatensätze erhalten wird und stellt eine verhältnismäßig niedrige Erkennungsgenau­ igkeit dar. Wenn der Wert der Musterzählung niedriger als der zweite Zählwert ist, geht die Steuerung weiter zu ei­ nem Schritt S22 für eine Fehlerverarbeitung, da der ein­ gegebene Sprachbefehl aufgrund der niedrigen Erkennungs­ genauigkeit nicht erkannt werden kann. Wenn der Wert der Musterzählung gleich oder größer als der zweite Zählwert ist, erzeugt die Steuerschaltung 16A aufgrund der erkann­ ten Sprachbefehlsdaten ein Fernbedienungs-Befehlssignal SR, da die Erkennungsgenauigkeit verhältnismäßig hoch ist und die Erkennungsverarbeitung zuverlässig ist. Dann schickt die Steuerschaltung 16A in einem Schritt S20 das Fernbedienungs-Befehlssignal SR an die Sendeeinrichtung 17.
Wenn das Erkennungsergebnis im Schritt S17 eine wichtige Operation anzeigt, ermittelt die Steuerschaltung 16A in einem Schritt S19, ob der Wert der Musterzählung gleich oder größer als ein vorgegebener erster Zählwert ist. Der erste Zählwert stellt einen verhältnismäßig hohen Erken­ nungsgrad dar und entspricht einer Bedingung, in der das gleiche Erkennungsergebnis unter Verwendung von 90% oder mehr der Standardmusterdaten erhalten wird. Für Steuerbe­ fehle von hoher Wichtigkeit wird zur Aufrechterhaltung der Steuerungszuverlässigkeit ein Fernbedienungssignal Rc erst dann erzeugt, wenn die Bedingung im Schritt S19 er­ reicht wird.
Die Steuerschaltung 16A erzeugt aufgrund der erkannten Sprachbefehlsdaten von hoher Erkennungsgenauigkeit ein Fernbedienungs-Befehlssignal SR und schickt dieses Signal im Schritt S20 an die Sendeeinrichtung 17. Aufgrund des Fernbedienungs-Befehlssignals SR sendet die Sendeeinrich­ tung 17 in einem Schritt S21 ein entsprechendes Fernbe­ dienungssignal Rc aus. Wenn die Daten des eingegebenen Sprachbefehls mit den Standardmusterdaten im Schritt S15 nicht übereinstimmen oder wenn der Wert der Musterzählung im Schritt S18 kleiner als der zweite Zählwert oder im Schritt S19 kleiner als der erste Zählwert ist, führt die Steuerschaltung 16A im Schritt S22 eine Fehlerverarbei­ tung wie etwa die Erzeugung eines Summtons aus, woraufhin die Steuerung zum Schritt S2 zurückkehrt.
Wie oben beschrieben, wird in der ersten Ausführungsform der vorliegenden Erfindung ein Sprachbefehl unter Verwen­ dung mehrerer verschiedener Standardmusterdaten PA1 bis PAn, PB1 bis PBn, . . ., PM1 bis PMn für die jeweiligen Sprachbefehle erkannt; wenn das Erkennungsergebnis eine wichtige Operation anzeigt, wird an die Erkennungsgenau­ igkeit eine höhere Anforderung gestellt, um die Rate der fehlerhaften Erkennung abzusenken.
Zweite Ausführungsform
Nun wird mit Bezug auf die Fig. 11 bis 13 ein sprachge­ steuertes Fernbedienungssystem gemäß einer zweiten Aus­ führungsform der vorliegenden Erfindung beschrieben.
(Äußerer Aufbau)
Das sprachgesteuerten Fernbedienungssystem gemäß der zwei­ ten Ausführungsform umfaßt einen Sender, der den gleichen Aufbau wie der in Fig. 4 gezeigte Sender 10A besitzt.
(Aufbau der elektronischen Schaltung)
Der im allgemeinen mit 10B bezeichnete Sender des sprach­ gesteuerten Fernbedienungssystems gemäß der zweiten Aus­ führungsform ist in den Fig. 11 und 12 gezeigt. Diejeni­ gen Teile von Fig. 11, die mit den in Fig. 6 gezeigten Teilen identisch sind, werden durch das gleiche Bezugs­ zeichen bezeichnet und nicht im einzelnen beschrieben.
Der Sender 10B umfaßt eine Spracherkennungseinrichtung 15B, die, wie in Fig. 12 gezeigt ist, einen Analogprozessor 21, der ein über das Mikrophon M empfangenes analoges Sprachbefehlssignal verarbeitet und in Form von Zeitauf­ teilungs-Digitaldaten ausgibt, eine Mehrzahl von paral­ lelen Spracherkennungsprozessoren 22-1 bis 22-n, die den Sprachbefehl aufgrund der Zeitaufteilungs-Digitaldaten vom Analogprozessor 21 unabhängig erkennen, einen Spei­ cher 23B, in dem Standardmusterdaten für die Spracherken­ nung durch die entsprechenden Spracherkennungsprozessoren 22-1 bis 22-n gespeichert sind, und eine Schnittstelle 24, die Signale an die Steuerschaltung 16B sendet und von dieser Signale empfängt, umfaßt.
Die Spracherkennungsprozessoren 22-1 bis 22-n verwenden für jeden der Sprachbefehle entsprechende Standardmuster­ daten und führen unabhängige Spracherkennungsprozesse aus. Beispielsweise verwendet der Spracherkennungsprozes­ sor 22-1 die Standardmusterdaten PA1, PB1, . . ., PM1, wäh­ rend der Spracherkennungsprozessor 22-2 die Standardmu­ sterdaten PA2, PB2, . . ., PM2 verwendet.
Diese Standardmusterdaten können in verschiedenen Berei­ chen des Speichers 23B wie oben beschrieben oder in ent­ sprechenden Speichern, die den jeweiligen Spracherken­ nungsprozessoren zugeordnet sind, gespeichert werden.
Die Steuerschaltung 16B umfaßt die Funktionen der Erken­ nungsgenauigkeit-Ermittlungseinrichtung 4, der Wichtigkeits­ grad-Erkennungseinrichtung 5 und der Wählvorrichtung 6 gemäß der ersten Ausführungsform. Genauer sammelt die Steuer­ schaltung 16B die Erkennungsergebnisse der Spracherken­ nungsprozessoren 22-1 bis 22-n, wenn der Steuerbefehl, der durch das von der Spracherkennungseinrichtung 15B gege­ bene Erkennungsergebnis angezeigt wird, zu einem Befehl mit hoher Wichtigkeit bestimmt wird, und gibt nur das Er­ kennungsergebnis mit hoher Erkennungsgenauigkeit als Be­ fehlsdaten aus. Wenn kein Erkennungsergebnis, das den Wichtigkeitsgrad des Steuerbefehls erreicht, erhalten wird, gibt die Steuerschaltung 16B keinerlei Befehlsdaten aus. Die Erkennungsgenauigkeits-Ermittlungseinrichtung 4 ist in den Schritten S50 und S51 in Fig. 13 implemen­ tiert, während die Wichtigkeitsgrad-Erkennungseinrichtung 5 und die Wählvorrichtung 6 in Fig. 13 durch den Schritt S49 implementiert sind.
Der Analogprozessor 21, die Spracherkennungsprozessoren 22-1 bis 22-n und die Schnittstelle 24, wie sie in Fig. 12 gezeigt sind, sind ebenso wie weitere in Fig. 11 ge­ zeigte Einzelheiten des Aufbaus mit denjenigen der ersten Ausführungsform identisch.
(Gesamtbetrieb)
Im folgenden wird mit Bezug auf Fig. 13 der Betrieb des Senders 10B gemäß der zweiten Ausführungsform beschrie­ ben. Es wird angenommen, daß der Sprechschalter 12 nicht gedrückt ist und daß sich der Sender 10B in einem Bereit­ schaftszustand befindet.
Zunächst setzt die Steuerschaltung 16B in einem Schritt S31 eine Eintragungspuffernummer auf den Wert 1. Dann werden in einem Schritt S32 die Prozessornummer auf den Wert 1 gesetzt und der dieser Prozessornummer entspre­ chende Spracherkennungsprozessor, zum Beispiel der Spracherkennungsprozessor 22-1, aktiviert.
Dann stellt die Steuerschaltung 16B in einem Schritt S33 fest, ob der Sprechschalter 12 gedrückt ist, indem sie ermittelt, ob vom Sprechschalter 12 ein Betriebssteuersi­ gnal Sc erzeugt wird. Wenn der Sprechschalter 12 gedrückt ist, wird ein Befehlssteuersignal Sc erzeugt, so daß die Steuerschaltung 16B den Sender 10B zum Empfang eines Sprachbefehls aktiviert.
Danach liest die Steuerschaltung 16B in einem Schritt S34 den Zustand des Betriebswahlschalters 13, um festzustel­ len, ob er die Sprachspeicherbetriebsart für Sprachbe­ fehle, in der Standardmusterdaten erzeugt werden, an­ zeigt.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht die Steuerung weiter zu einem Schritt S35, in der die Steuerschaltung 16B einen Befehl ausgibt, der die Spracherkennungseinrichtung 15B zur Ausführung einer Spracheintragungsverarbeitung veranlaßt. Gleichzeitig schickt die Steuerschaltung 16B im Schritt S35 an die Spracherkennungseinrichtung 15B eine Eintragungspuffernum­ mer.
Dann speichert die Spracherkennungseinrichtung 15B in einem Schritt S36 in einem dem betreffenden Spracherkennungs­ prozessor entsprechenden Eintragungspuffer im Speicher 23B, d. h. in einem Eintragungspuffer mit der Eintragungs­ puffernummer 1, Spracherkennungs-Standardmusterdaten.
In einem Schritt S37 liest die Steuerschaltung 16B ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ einrichtung 15B, um festzustellen, ob die Eintragung des Sprachbefehls beendet ist oder nicht. Wenn die Eintragung noch nicht beendet ist, werden die Schritte S36 und S37 solange wiederholt, bis sie beendet ist. Wenn sie beendet ist, wird die Eintragungspuffernummer in einem Schritt S38 um 1 erhöht.
Dann bestimmt die Steuerschaltung 16B in einem Schritt S39, ob die momentane Eintragungspuffer eine höchstens im betreffenden Spracherkennungsprozessor eintragbare Nummer Nmax übersteigt. Wenn nicht, kehrt die Steuerung zum Schritt S32 zurück. Wenn der Höchstwert überschritten wird, bestimmt die Steuerschaltung 16B in einem Schritt S40, ob die Prozessornummer eine höchste Spracherken­ nungsprozessornummer Pmax übersteigt. Wenn nicht, geht die Steuerung weiter zum Schritt S41.
Im Schritt S41 setzt die Steuerschaltung 16B die Eintra­ gungspuffernummer wieder auf den Wert 1. Danach wird die Prozessornummer in einem Schritt S42 um 1 erhöht, außer­ dem wird in diesem Schritt der dieser Prozessornummer entsprechende Spracherkennungsprozessor, zum Beispiel der Spracherkennungsprozessor 22-2, aktiviert.
Wenn die Prozessornummer im Schritt S40 die maximale Spracherkennungsprozessornummer Pmax übersteigt, sendet die Steuerschaltung 16B an die Spracherkennungseinrichtung 15B einen Befehl zum Sprachspeicherbetriebsart in einem Schritt S43 beendet wird. Dann kehrt die Steuerung zum Schritt S32 zurück.
Wenn im Schritt S34 vom Betriebswahlschalter 13 die Spracherkennungsbetriebsart angezeigt wird, aktiviert die Steuerschaltung 16B in einem Schritt S44 sämtliche Spracherkennungsprozessoren. Dann gibt die Steuerschal­ tung 16B in einem Schritt S45 an die Spracherkennungs­ einrichtung 15B einen Spracherkennungsbefehl aus. Nun füh­ ren die Spracherkennungsprozessoren 22-1 bis 22-n in der Spracherkennungseinrichtung 15B in einem Schritt S46 eine Spracherkennungsverarbeitung, wie sie oben beschrieben worden ist, aus.
In einem Schritt S47 liest die Steuerschaltung 16B ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ einrichtung 15B, um festzustellen, ob die von den Spracher­ kennungsprozessoren 22-1 bis 22-n ausgeführte Spracher­ kennung beendet ist oder nicht. Wenn die Spracherkennung noch nicht beendet ist, werden die Schritte 546 und S47 solange wiederholt, bis sie beendet ist. Wenn sie beendet ist, zählt die Steuerschaltung 16B in einem Schritt S48 die Anzahl derjenigen Spracherkennungsprozessoren, deren Erkennungsergebnisse übereinstimmen. Dieser Zählwert wird als Wert der Prozessorzählung bezeichnet und zur Bestim­ mung des Erkennungsgenauigkeits-Niveaus verwendet.
Dann stellt die Steuerschaltung 16B in einem Schritt S49 fest, ob das Erkennungsergebnis eine wichtige Operation anzeigt. Wenn nicht, stellt die Steuerschaltung 16B in einem Schritt S50 die Erkennungsgenauigkeit fest, indem sie prüft, ob der Wert der Prozessorzählung gleich oder größer als ein vorgegebener zweiter Zählwert ist. Der zweite Zählwert entspricht einer Bedingung, in der das­ selbe Erkennungsergebnis durch mehr als die Hälfte der Spracherkennungsprozessoren erkannt wird und stellt eine verhältnismäßig niedrige Erkennungsgenauigkeit dar. Wenn der Wert der Prozessorzählung niedriger als der zweite Zählwert ist, geht die Steuerung weiter zu einem Schritt S54 für eine Fehlerverarbeitung, da der eingegebene Sprachbefehl aufgrund der niedrigen Erkennungsgenauigkeit nicht erkannt werden kann. Wenn der Wert der Prozessor­ zählung gleich oder größer als der zweite Zählwert ist, erzeugt die Steuerschaltung 16B in einem Schritt S52 auf­ grund der erkannten Sprachbefehlsdaten ein Fernbedie­ nungs-Befehlssignal SR, da die Erkennungsgenauigkeit ver­ hältnismäßig hoch ist und die Erkennungsverarbeitung zu­ verlässig ist, und sendet dieses Fernbedienungs-Befehls­ signal SR an die Sendeeinrichtung 17.
Wenn das Erkennungsergebnis im Schritt S49 eine wichtige Operation anzeigt, stellt die Steuerschaltung 16B in ei­ nem Schritt S51 zur Bestimmung der Erkennungsgenauigkeit fest, ob der Wert der Prozessorzählung gleich oder größer als ein vorgegebener erster Zählwert ist. Der erste Zähl­ wert stellt einen verhältnismäßig hohen Erkennungsgrad dar und entspricht einer Bedingung, in der das gleiche Erkennungsergebnis von mehr als 90% der Spracherkennungs­ prozessoren erhalten wird. Um die Steuerzuverlässigkeit aufrechtzuerhalten, wird für Steuerbefehle von hoher Wichtigkeit kein Fernbedienungssignal Rc erzeugt, solange die Bedingung im Schritt S51 nicht erzielt wird.
Die Steuerschaltung 16B erzeugt in einem Schritt S52 auf­ grund der erkannten Sprachbefehlsdaten von hoher Erken­ nungsgenauigkeit ein Fernbedienungs-Befehlssignal SR und schickt dieses Signal an die Sendeeinrichtung 17. Aufgrund des Fernbedienungs-Befehlssignal SR sendet die Sende­ einrichtung in einem Schritt S53 ein entsprechendes Fernbe­ dienungssignal Rc aus.
Wenn der Wert der Prozessorzählung niedriger als der zweite Zählwert im Schritt S50 oder niedriger als der er­ ste Zählwert im Schritt S51 ist, führt die Steuerschal­ tung 16B in einem Schritt S54 eine Fehlerverarbeitung wie etwa die Erzeugung eines Summtons aus, woraufhin die Steuerung zum Schritt S32 zurückkehrt.
In der zweiten Ausführungsform wird ein eingegebener Sprachbefehl aufgrund von verschiedenen Standardmusterda­ ten PA1 bis PMn, PA2 bis PM2, . . ., PAn bis PMn von der Mehrzahl der Spracherkennungsprozessoren 22-1 bis 22-n erkannt.
Wenn das Erkennungsergebnis eine wichtige Operation an­ zeigt, wird die Erkennungsgenauigkeit bestimmt, um die Rate der fehlerhaften Erkennung abzusenken.
Da an die Erkennungsgenauigkeit eines Sprachbefehls von hoher Wichtigkeit erhöhte Anforderungen gestellt werden, wird die Erkennungsrate des sprachgesteuerten Fernbedie­ nungssystems erhöht. Folglich werden Schwierigkeiten auf­ grund einer fehlerhaften Erkennung minimiert.

Claims (5)

1. Sprachgesteuertes Fernbedienungssystem, enthaltend ein Mi­ krofon für die Eingabe eines Sprachbefehls, eine Spracherken­ nungseinrichtung zum Vergleichen eines Musters des eingegebenen Sprachbefehls mit einem vorgegebenen Standardmuster, um den In­ halt des Sprachbefehls zu erkennen und dementsprechende Be­ fehlsdaten zu erzeugen, die für den auszuführenden Befehl re­ präsentativ sind und eine Sendeeinrichtung zum Erzeugen und Aussenden eines Fernsteuersignals entsprechend den Befehlsdaten auf der Grundlage des Erkennungsergebnisses, gekennzeichnet durch eine Wichtigkeitsgrad-Erkennungseinrichtung (5) zum Er­ mitteln der Wichtigkeit der Befehlsdaten, um ein Wichtigkeits­ gradsignal zu erzeugen, das angibt, ob die den Befehlsdaten entsprechende Tätigkeit wichtig oder unwichtig ist und eine Er­ kennungsgenauigkeits-Ermittlungseinrichtung (4), die die Ge­ nauigkeit des Erkennungsergebnisses des Sprachbefehls ermittelt und das Ergebnis als genau beurteilt, wenn die ermittelte Ge­ nauigkeit einen vorbestimmten Schwellenwert überschreitet, der in Abhängigkeit von dem Wichtigkeitsgradsignal variabel ist, und die Befehlsdaten nur jener Sprachbefehle zu der Sendeein­ richtung (17) überträgt, die als genau beurteilt worden sind.
2. Sprachgesteuertes Fernbedienungssystem nach Anspruch 1, dadurch gekennzeichnet, daß in der Erkennungsgenauigkeits-Ermittlungseinrichtung (4) ein erster Schwellenwert für Daten wichtiger Befehle und ein zweiter Schwellenwert für Daten unwichtiger Befehle vorgesehen sind.
3. Sprachgesteuertes Fernbedienungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Spracherkennungseinrichtung (15A, 15B) mehrere Stan­ dardmuster für den Vergleich mit einem Sprachbefehl enthält und der Schwellenwert in Abhängigkeit von der Anzahl der Standard­ muster bestimmt ist, die mit dem Muster des eingegebenen Sprachbefehls im wesentlichen übereinstimmen.
4. Sprachgesteuertes Fernbedienungssystem nach Anspruch 3, dadurch gekennzeichnet, daß die Spracherkennungseinrichtung (15A) einen Speicher (25) zur Speicherung der Standardmuster in entsprechenden Speicher­ bereichen und einen Spracherkennungsprozessor (22) enthält, der die dem eingegebenen Sprachbefehl entsprechenden Standardmuster aus dem Speicher (25) ausliest und den Sprachbefehl aufgrund der ausgelesenen Standardmuster erkennt.
5. Sprachgesteuertes Fernbedienungssystem nach Anspruch 3, dadurch gekennzeichnet, daß die Spracherkennungseinrichtung (15B) mehrere Speicher (23B) zur Speicherung der jeweiligen Standardmuster und mehrere Spracherkennungsprozessoren (22-1, . . ., 22-n) enthält, die mit den entsprechenden Speichern (23B) verbunden sind und dem einge­ gebenen Sprachbefehl entsprechende Standardmuster aus dem je­ weiligen Speicher (23B) auslesen und den Sprachbefehl aufgrund der gelesenen Standardmuster erkennen.
DE4029716A 1989-12-29 1990-09-19 Sprachgesteuertes Fernbedienungssystem Expired - Fee Related DE4029716C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1341630A JPH03203488A (ja) 1989-12-29 1989-12-29 音声リモートコントロール装置

Publications (2)

Publication Number Publication Date
DE4029716A1 DE4029716A1 (de) 1991-07-04
DE4029716C2 true DE4029716C2 (de) 1998-02-19

Family

ID=18347580

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4029716A Expired - Fee Related DE4029716C2 (de) 1989-12-29 1990-09-19 Sprachgesteuertes Fernbedienungssystem

Country Status (2)

Country Link
JP (1) JPH03203488A (de)
DE (1) DE4029716C2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10012572A1 (de) * 2000-03-15 2001-09-27 Bayerische Motoren Werke Ag Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem
DE10015960A1 (de) * 2000-03-30 2001-10-11 Micronas Munich Gmbh Spracherkennungsverfahren und Spracherkennungsvorrichtung

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3208800B2 (ja) * 1991-08-09 2001-09-17 ソニー株式会社 マイクロフォン装置及びワイヤレスマイクロフォン装置
EP1031140B1 (de) 1997-11-21 2001-10-10 Siemens Aktiengesellschaft Verfahren und vorrichtung zur spracherkennung
US6275800B1 (en) * 1999-02-23 2001-08-14 Motorola, Inc. Voice recognition system and method
US20060087924A1 (en) * 2004-10-22 2006-04-27 Lance Fried Audio/video portable electronic devices providing wireless audio communication and speech and/or voice recognition command operation
DE102016114280A1 (de) * 2016-08-02 2018-02-08 Endress+Hauser Conducta Gmbh+Co. Kg Feldgerät der Prozessautomatisierungstechnik

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2755633A1 (de) * 1977-12-14 1979-06-21 Loewe Opta Gmbh Fernsteuerung zum steuern, ein- und umschalten von variablen und festen geraetefunktionen und funktionsgroessen in nachrichtentechn. geraeten
US4286115A (en) * 1978-07-18 1981-08-25 Nippon Electric Co., Ltd. System for recognizing words continuously spoken according to a format
US4454608A (en) * 1980-10-17 1984-06-12 Hitachi, Ltd. Audio response apparatus

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683506B2 (ja) * 1986-02-20 1994-10-19 井関農機株式会社 音声認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2755633A1 (de) * 1977-12-14 1979-06-21 Loewe Opta Gmbh Fernsteuerung zum steuern, ein- und umschalten von variablen und festen geraetefunktionen und funktionsgroessen in nachrichtentechn. geraeten
US4286115A (en) * 1978-07-18 1981-08-25 Nippon Electric Co., Ltd. System for recognizing words continuously spoken according to a format
US4454608A (en) * 1980-10-17 1984-06-12 Hitachi, Ltd. Audio response apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10012572A1 (de) * 2000-03-15 2001-09-27 Bayerische Motoren Werke Ag Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem
DE10012572C2 (de) * 2000-03-15 2003-03-27 Bayerische Motoren Werke Ag Vorrichtung und Verfahren zur Spracheingabe eines Zielortes mit Hilfe eines definierten Eingabedialogs in ein Zielführungssystem
DE10015960A1 (de) * 2000-03-30 2001-10-11 Micronas Munich Gmbh Spracherkennungsverfahren und Spracherkennungsvorrichtung
DE10015960C2 (de) * 2000-03-30 2003-01-16 Micronas Munich Gmbh Spracherkennungsverfahren und Spracherkennungsvorrichtung
US6826533B2 (en) 2000-03-30 2004-11-30 Micronas Gmbh Speech recognition apparatus and method

Also Published As

Publication number Publication date
DE4029716A1 (de) 1991-07-04
JPH03203488A (ja) 1991-09-05

Similar Documents

Publication Publication Date Title
DE4029698A1 (de) Sprachgesteuertes fernbedienungssystem
DE4029717A1 (de) Sprachgesteuertes fernbedienungssystem
DE4029697C2 (de) Sprachgesteuertes Fernbedienungssystem
DE3819178C2 (de)
DE60305568T2 (de) Schlüsselworterkennung in einem Sprachsignal
DE60222249T2 (de) Spracherkennungsystem mittels impliziter sprecheradaption
DE19752453B4 (de) Positionserfassungsgerät und Positionszeigereinrichtung und Verfahren zum Erfassen von zwei oder mehr Positionszeigereinrichtungen
DE60301534T2 (de) Verfahren und Vorrichtung für das Vorausahnen des Dienstablaufs
DE2918533A1 (de) Spracherkennungssystem
DE2753707A1 (de) Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache
DE3236832A1 (de) Verfahren und geraet zur sprachanalyse
DE3236834A1 (de) Verfahren und geraet zur sprachanalyse
DE4031421C2 (de) Musteranpassungssystem für eine Spracherkennungseinrichtung
DE60023398T2 (de) Verfahren und Vorrichtung zur Verbesserung der Spracherkennungsgenauigkeit mittels ereignis-basierter Beschränkungen
GB2181874A (en) Voice recognition system
DE4031638C2 (de)
DE4029716C2 (de) Sprachgesteuertes Fernbedienungssystem
DE69918635T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE3043516C2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE3514286A1 (de) System zur erkennung einzeln gesprochener woerter
DE4328752A1 (de) Spracherkennungssystem
DE69922769T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE19581667C2 (de) Spracherkennungssystem und Verfahren zur Spracherkennung
DE69333762T2 (de) Spracherkennungssystem
EP0595889A1 (de) Verfahren und anordnung zum erkennen von einzelwörtern gesprochener sprache.

Legal Events

Date Code Title Description
8120 Willingness to grant licences paragraph 23
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee