-
Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft eine Spracherkennungsvorrichtung,
die eine eingegebene Sprache erkennt und eine Erkennung in Übereinstimmung
mit dem Spracherkennungsergebnis ausgibt. Insbesondere betrifft
sie eine Spracherkennungsvorrichtung, die in einem Bewegobjekt,
wie zum Beispiel einem Fahrzeug montiert ist, um eine Anleitung
in Übereinstimmung mit der eingegebenen Sprache bereitzustellen.
-
Hintergrund der Erfindung
-
Eine
Spracherkennungsvorrichtung, die eine eingegebene Sprache erkennt
und eine Erkennung in Übereinstimmung mit einem Spracherkennungsergebnis
vornimmt, ist allgemein bekannt. Beispielsweise ist eine Spracherkennungsvorrichtung
bereitgestellt worden, die in einem Bewegobjekt wie einem Fahrzeug
montiert ist, und die derart aufgebaut ist, dass sie eine Anleitung
für einen Fahrer in Übereinstimmung mit einer
eingegebenen Sprache bereitstellt, um die Gefahr zu vermeiden, die
aus der Beeinflussung einer Taste durch den Fahrer resultiert. Diese
Art von Spracherkennungsvorrichtung ist mit einer Spracherkennungseinheit
ausgerüstet, die eine eingegebene Sprache erkennt, und
die Spracherkennungseinheit muss zwischen der eingegebenen Sprache
und Störung wie zum Beispiel Rauschen unterscheiden, um
die eingegebene Sprache zu erkennen.
-
Zudem
ist eine Spracherkennungsvorrichtung bereitgestellt worden, die
derart aufgebaut ist, dass sie, wenn sie Spracherkennung ausführt,
wenn der Benutzer keinerlei Ton äußert, selbst
nachdem eine vorbestimmte Zeit (d. h., eine Abschaltzeit) verstreicht.
Wenn der Benutzer eine Spracheingabe in Übereinstimmung
mit einem eine Sprachäußerung verlangenden Signal
von der Spracherkennungsvorrichtung vornimmt unter Berücksichtung
der Tatsache, dass im Allgemeinen die Zeit, die ein Benutzer braucht,
um das erste Wort zu äußern, nachdem der Benutzer
das die Äußerung fordernde Signal hört, länger
ist als die, die der Benutzer benötigt, um danach weitere
Wörter zu äußern, erfordert es in einer solchen
Spracherkennungsvorrichtung von dem Benutzer viel Zeit, um das erste
Wort zu äußern, und eine Zeitabschaltung tritt
daher auf, bevor der Benutzer das erste Wort äußert.
-
Um
dieses Problem zu lösen, ist üblicherweise eine
Spracherkennungsvorrichtung bereitgestellt worden, die für
Fahrzeuge gedacht war, die automatisch einen Unterscheidungsreferenzpegel,
der zum Unterscheiden zwischen Rauschen und Sprache verwendet wird,
in Übereinstimmung mit den Fahrbedingungen des Fahrzeugs
wie der Geschwindigkeit und der Getriebeschaltposition des Fahrzeugs
anpassen, um in sicherer Weise zwischen der eingegebenen Sprache
und Rauschen quer über den Geschwindigkeitsbereich des
Fahrzeugs von einer niedrigen Geschwindigkeit zu einer hohen Geschwindigkeit
zu unterscheiden (um die eingegebene Sprache in sicherer Weise zu
erkennen) (siehe beispielsweise Patentreferenz 1).
-
Zudem
wurde eine Spracherkennungsvorrichtung bereitgestellt, die auf solche
Weise aufgebaut ist, dass sie Abschaltzeiten variabel gestaltet, um
das Auftreten einer Zeitabschaltung zu vermeiden, bevor der Benutzer
das erste Wort äußert, insbesondere, um die Abschaltzeit
zu verlängern, die ein Zeitintervall definiert, während
dem der Benutzer das erste Wort äußern muss (siehe
beispielsweise Patentreferenz 2).
[Patentreferenz 1]
JP,57-30913,A (siehe
Seiten 2 bis 3 und
3 und
4)
[Patentreferenz
2]
JP,58-50598,A (siehe
Seite 2 und
1 und
2)
-
Offenbarung der Erfindung
-
Konventionelle
Spracherkennungsvorrichtungen sind wie oben erwähnt aufgebaut.
Daher ist ein Problem bei der durch Patentreferenz 1 offenbarten
Erfindung, dass, weil die Spracherkennungsvorrichtung dieser Druckschrift
nur den zur Unterscheidung zwischen Rauschen und Sprache verwendeten Unterscheidungsreferenzpegel
gemäß der Fahrbedingung des Fahrzeugs anpasst,
sie keinen Zeitabschaltprozess ausführt und demnach die
Wahrscheinlichkeit, dass Rauschen und Sprache gleichzeitig eingegeben
werden, sehr hoch wird, wenn es lange dauert, bis der Benutzer eine
Spracheingabe vornimmt, und es daher, selbst wenn der zur Unterscheidung
zwischen Rauschen und Sprache verwendete Unterscheidungsreferenzpegel
angepasst wird, schwierig wird, zwischen Rauschen und Sprache mit hohem
Grad an Präzision zu unterscheiden und die Spracherkennungsrate
verschlechtert wird.
-
Andererseits
ist ein Problem bei der in Patentreferenz 2 offenbarten Erfindung,
dass wenn die Zeitabschaltungszeit, die eine Zeitdauer definiert, während
der der Benutzer das erste Wort zu äußern hat,
ausgedehnt wird, eine Zeitdauer, während der Rauschen und
Sprache gleichzeitig in die Spracherkennungsvorrichtung eingegeben
werden können, durch die Zunahme Zeitabschaltungszeit länger
wird, die Spracherkennungsvorrichtung die eingegebene Sprache beispielsweise
nicht unter verrauschten Umgebungen korrekt erkennen kann.
-
Die
vorliegende Erfindung wurde gemacht, um die oben erwähnten
Probleme zu lösen und es ist demnach ein Ziel der vorliegenden
Erfindung, eine Spracherkennungsvorrichtung bereitzustellen, die immer
eine eingegebene Sprache mit einem hohen Grad an Präzision
erkennen kann.
-
Eine
Spracherkennungsvorrichtung in Übereinstimmung mit der
vorliegenden Erfindung schließt ein: Eine Spracherkennungseinrichtung
zum Vornehmen einer Spracherkennung; und eine Steuereinrichtung
zum Steuern des Empfangs einer Spracheingabe in die Spracherkennungseinrichtung
gemäß einer Zeitabschaltungszeit, die ein Ende
des Empfangs einer Spracheingabe definiert, und zum Ausführen
der Erkennung gemäß einem Ergebnis der durch die Spracherkennungsvorrichtung
erlangten Spracherkennung. Zudem ist diese Spracherkennungsvorrichtung
dadurch gekennzeichnet, dass die Steuereinrichtung den Empfang von
Sprache gemäß einer Abschaltzeit, die das Ende
des Empfangs einer Sprache definiert, steuert, und die Spracherkennungsvorrichtung
ferner eine Umgebungsbedingungserfassungseinrichtung einschließt
zum Erfassung einer Umgebungsbedingung, und eine Zeitabschaltsteuereinrichtung
zum Ändern der Zeitabschaltungszeit gemäß der
durch die Umgebungsbedingungserfassungseinrichtung erfassten Umgebungsbedingung.
-
Weil
die Spracherkennungsvorrichtung gemäß der vorliegenden
Erfindung derart aufgebaut ist, dass die Zeitablaufzeit auf der
Basis der Umgebungsbedingung geändert wird, wird ein Vorteil
bereitgestellt, imstande zu sein, immer eine geeignete Zeitabschaltungszeit
gemäß der Umgebungsbedingung festzulegen, um die
Wahrscheinlichkeit zu reduzieren, die zu einer fehlerhaften Erkennung
führt, und immer eine eingegebene Sprache mit einem hohen
Grad an Präzision zu erkennen.
-
Kurzbeschreibung der Figuren
-
Es
zeigt:
-
1 ein
Blockdiagramm eines Beispiels einer Spracherkennungsvorrichtung
in Übereinstimmung mit Ausführungsform 1 der vorliegenden
Erfindung;
-
2 ein
Diagramm zum Erläutern erster bis dritter Zeitabschaltzeiten
zur Verwendung in der in 1 gezeigten Spracherkennungsvorrichtung;
-
3 ein
Ablaufdiagramm zum Erläutern des Betriebsablaufs der in 1 gezeigten
Spracherkennungsvorrichtung;
-
4 ein
Blockdiagramm eines Beispiels einer Spracherkennungsvorrichtung
in Übereinstimmung mit Ausführungsform 2 der vorliegenden
Erfindung;
-
5 ein
Ablaufdiagramm zum Erläutern des Betriebs der in 4 gezeigten
Spracherkennungsvorrichtung;
-
6 ein
Diagramm zum Zeigen eines Beispiels einer Entscheidungstabelle zur
Verwendung in der in 4 gezeigten Spracherkennungsvorrichtung;
-
7 ein
Blockdiagramm eines Beispiels einer Spracherkennungsvorrichtung
in Übereinstimmung mit Ausführungsform 3 der vorliegenden
Erfindung;
-
8 ein
Ablaufdiagramm zum Erläutern des Betriebs der in 7 gezeigten
Spracherkennungsvorrichtung; und
-
9 ein
Diagramm zum Zeigen eines Beispiels einer Tabelle eines Schwierigkeitsgrads
im Dialog zur Verwendung in der in 7 gezeigten
Spracherkennungsvorrichtung.
-
Bevorzugte Ausführungsformen
-
Nachstehend
werden die bevorzugten Ausführungsformen der vorliegenden
Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen beschrieben,
um diese Erfindung detaillierter zu erläutern.
-
Ausführungsform 1.
-
1 ist
ein Blockdiagramm zum Zeigen eines Beispiels einer Spracherkennungsvorrichtung
in Übereinstimmung mit Ausführungsform 1 der vorliegenden
Erfindung, und die dargestellte Spracherkennungsvorrichtung 10 ist
in einem Bewegobjekt wie zum Beispiel einem Fahrzeug montiert. Die
Spracherkennungsvorrichtung 10 hat eine Spracheingabeeinrichtung 11 wie
zum Beispiel ein Mikrofon, eine Spracherkennungseinrichtung 12,
eine Steuereinrichtung 13, einen Sprechschalter 14,
eine Eingabeneustartsteuereinrichtung 15, eine Eingabezeitabschaltungszeit-Steuereinrichtung 16,
eine Ausgabeeinrichtung 17 und eine Umgebungsbedingungserfassungseinrichtung 18.
In der Umgebungsbedingungserfassungseinrichtung 18 ist
beispielsweise ein Mikrofon 18a angeordnet.
-
Wenn
ein Benutzer die Spracherkennungsvorrichtung 10 verwendet,
schaltet er oder sie den Sprechschalter 14 ein (er oder
sie drückt diesen Schalter). Hierdurch lässt die
Steuereinrichtung 13 die Spracherkennungseinrichtung 12 in
einen Zustand übergehen, in dem die Spracherkennungseinrichtung 12 arbeiten
kann (d. h., einen Zustand, in dem die Spracherkennungseinrichtung
eine Spracheingabe empfangen kann). Wenn der Benutzer eine Spracheingabe
von der Spracheingabeeinrichtung 11 vornimmt, erkennt die
Spracherkennungseinrichtung 12 die Spracheingabe und stellt
ein Erkennungsergebnis für die Steuereinrichtung 13 bereit. Die
Steuereinrichtung 13 stellt das Erkennungsergebnis als
die Beschreibung dessen, was die Ausgabeeinrichtung 17 erkennt,
bereit und stellt auch eine Erkenntnis (z. B. eine Anleitung oder Ähnliches)
in Übereinstimmung mit dem Erkennungsergebnis für die
Ausgabeeinrichtung 17 bereit. Die Ausgabeeinrichtung 17 gibt
die Beschreibung des Erkennens/der Anleitung aus.
-
In
der dargestellten Spracherkennungsvorrrichtung 10 extrahiert
die Umgebungsbedingungserfassungseinrichtung Rauschen in einem angrenzenden
Umfeld als Umgebungsrauschen und stellt dieses Umgebungsrauschen
der Steuereinrichtung 13 bereit. Wie später erwähnt
wird, stimmt die Eingabe-Zeitabschaltungszeit-Steuereinrichtung 16 eine Zeitabschaltungszeit
zum Stoppen des Empfangs einer Spracheingabe in Übereinstimmung
mit dem Umgebungsrauschen ab. Die Eingabeneustartsteuereinrichtung 15 steuert,
ob der Empfang einer Spracheingabe in Übereinstimmung mit
dem Umgebungsrauschen neugestaltet werden sollte, nachdem die Spracheingabe
einer Zeitabschaltung beendet ist, wie später erwähnt
wird.
-
Nun
wird die oben erwähnte Zeitabschaltungszeit erläutert;
wie in 2 gezeigt, schließt die Zeitabschaltungszeit
erste bis dritte Zeitabschaltungszeiten T1 bis T3 ein. Die erste
Zeitabschaltungszeit T1 ist eine Zeit, die ein Zeitintervall von
Beginn des Empfangs einer Spracheingabe zum Beginn einer Sprachäußerung
definiert. In ähnlicher Weise ist die zweite Zeitabschaltungszeit
T2 eine Zeit, die ein Zeitintervall definiert von dem Beginn des
Empfangs einer Spracheingabe bis zum Ende der Äußerung,
und der folgende Zusammenhang: T1 < T2
ist eingerichtet. Die dritte Zeitabschaltungszeit T3 ist eine Zeit,
die ein Zeitintervall definiert, das dem Ende der Äußerung
des Benutzers folgt. Wenn die dritte Zeitabschaltungszeit T3 abläuft,
beendet die Steuereinrichtung 13 den Empfang der Spracheingabe.
-
Wenn
eine Zeit t1 von Beginn des Empfangs einer Spracheingabe bis zum
Beginn einer Sprachäußerung die erste Zeitabschaltungszeit
T1 übersteigt, beendet die Steuereinrichtung 13 den
Empfang der Spracheingabe, und wenn eine Zeit t2 vom Beginn der
Spracheingabe bis zum Ende der Äußerung die zweite
Zeitabschaltungszeit T2 übersteigt, beendet die Steuereinrichtung 13 ebenfalls
den Empfang der Spracheingabe.
-
Als
Nächstes wird der Betrieb der Spracherkennungsvorrichtung
erläutert.
-
Es
wird Bezug genommen auf 1 bis 3, wenn
die Spracherkennungsvorrichtung 10 eingeschaltet wird (EIN),
schaltet die Steuereinrichtung 13 den automatischen Neustart
des Empfangs einer Spracheingabe ab (AUS) (d. h., sie schaltet die Eingabeneustartsteuereinrichtung 15 aus
(in einen Anfangszustand: Schritt ST1)), und dann bestimmt sie,
ob der automatische Neustart des Empfangs einer Spracheingabe eingeschaltet
wird oder nicht (Schritt ST2). Zu dieser Zeit bestimmt die Steuereinrichtung 13 dann,
weil die Eingabeneustartsteuereinrichtung 15 in den AUS-Zustand
versetzt ist, ob der Sprechschalter 14 gedrückt
wird oder nicht (Schritt ST3) und geht in den Bereitschaftszustand über,
bis der Sprechschalter 14 gedrückt wird. Wenn
der Sprechschalter 14 gedrückt wird, wird der
Empfang einer Spracheingabe durch die Steuereinrichtung 13 gestartet
(Schritt ST4).
-
Das
Umgebungsrauschen wird von der Umgebungsbedingungserfassungseinrichtung 18 für die
Steuereinrichtung 13 bereitgestellt und die Eingabezeitabschaltungszeit-Steuereinrichtung 16 bestimmt,
ob der Pegel des Umgebungsrauschens (d. h., der Rauschpegel) gleich
oder höher als ein vorbestimmter Pegel ist oder nicht,
gesteuert durch die Steuereinrichtung 13 (Schritt ST5).
Wenn der Rauschpegel gleich oder höher als der vorbestimmte Pegel
ist, beurteilt die Eingabezeitabschaltungszeit-Steuereinrichtung 16,
dass Spracheingabe leicht durch das Umgebungsrauschen beeinflusst
ist, d. h., die Erkennungsrate nimmt ab, und kürzt die
ersten bis dritten Zeitabschaltungszeiten T1 bis T3 ausgehend von
ersten bis dritten vorbestimmten Zeiten um erste bis dritte Zeitlängen,
die im Voraus jeweils definiert worden sind (Schritt ST6). Wenn
die ersten bis dritten Zeitabschaltungszeiten T1 bis T3 gekürzt
worden sind, behält die Steuereinrichtung 13 den
automatischen Neustart des Spracheingabeempfangs in dem AUS-Zustand
(Schritt ST7).
-
Als
Nächstes bestimmt die Zeitabschaltungszeit-Steuereinrichtung 16,
ob die erste Zeitabschaltungszeit T1 verstrichen ist, seit der Empfang
einer Spracheingabe begonnen worden ist (Schritt ST8). Wenn die
Eingabezeitabschaltungszeit-Steuereinrichtung 16 bestimmt,
dass die erste Zeitabschaltungszeit T1 verstrichen ist, seit der
Empfang einer Spracheingabe gestartet worden ist, beendet die Steuereinrichtung 13 den
Empfang einer Spracheingabe und kehrt zu Schritt ST2 zurück.
Wenn demgegenüber die Eingabezeitabschaltungszeit-Steuereinrichtung
bestimmt, dass die erste Zeitabschaltungszeit T1 nicht verstrichen
ist, seit der Empfang der Spracheingabe begonnen worden ist, bestimmt
die Steuereinrichtung 13, ob eine Äußerung
begonnen hat oder nicht, und, wenn keine Äußerung
begonnen hat, kehrt sie zum Schritt ST8 zurück.
-
Wenn
eine Äußerung begonnen hat, bestimmt die Eingabezeitabschaltungszeit-Steuereinrichtung 16,
ob die zweite Zeitabschaltzeit T2 verstrichen ist, seit der Empfang
einer Spracheingabe begonnen worden ist (Schritt ST10). Wenn die
Eingabezeitabschaltungszeit-Steuereinrichtung 16 bestimmt, dass
die zweite Zeitabschaltungszeit T2 verstrichen ist, seit der Empfang
einer Spracheingabe begonnen hat, beendet die Steuereinrichtung 13 den
Empfang einer Spracheingabe und kehrt zurück zum Schritt ST2.
Wenn demgegenüber die Eingabezeitabschaltungszeit-Steuereinrichtung
bestimmt, dass die zweite Zeitabschaltzeit T2 nicht verstrichen
ist, seit der Empfang einer Spracheingabe begonnen worden ist, bestimmt
die Steuereinrichtung 13, ob die Äußerung abgeschlossen
ist oder nicht, und, wenn die Äußerung nicht abgeschlossen
ist, kehrt sie zurück zum Schritt ST10 und setzt den Prozess
fort, oder beendet den Prozess andernfalls.
-
Wenn
im Schritt ST5 der Rauschpegel geringer ist als der vorbestimmte
Pegel, verlängert die Eingabezeitabschaltungszeit-Steuereinrichtung 16 die ersten
bis dritten Zeitabschaltzeiten T1 bis T3, um im Voraus definierte
Zeitlängen (Schritt ST12). Wenn die ersten bis dritten
Zeitabschaltungszeiten T1 bis T3 verlängert sind, schaltet
die Steuereinrichtung 13 den automatischen Neustart des
Empfangs einer Spracheingabe EIN (d. h., schaltet die Eingabeneustartsteuereinrichtung 15 EIN:
Schritt ST13) und führt Schritt ST8 aus.
-
Wenn
die Eingabeneustartsteuereinrichtung 15 eingeschaltet wird,
führt die Eingabeneustartsteuereinrichtung 15 in Übereinstimmung
mit dem Rauschpegel eine Steuerung aus, ob der Empfang einer Spracheingabe
neugestartet wird, nachdem eine Zeitabschaltung auftritt. Das heißt,
wenn der Rauschpegel geringer als der vorbestimmte Pegel ist, startet
die Eingabeneustartsteuereinrichtung 15 den Empfang einer
Spracheingabe automatisch neu (mit anderen Worten, selbst wenn der
Sprechschalter 14 nicht gedrückt ist).
-
Wie
oben erwähnt, wird, weil die Spracherkennungsvorrichtung
gemäß dieser Ausführungsform 1 auf solche
Weise konstruiert ist, dass sie die ersten bis dritten Zeitabschaltzeiten
T1 bis T3 verkürzt, wenn der Rauschpegel gleich oder höher
als der vorbestimmte Pegel ist, d. h., das Umgebungsrauschen hoch
ist, als ein Ergebnis des Einstellens der Zeitabschaltzeiten in Übereinstimmung
mit dem Rauschpegel die Wahrscheinlichkeit, dass Rauschen und Sprache
simultan in die Spracherkennungsvorrichtung eingegeben werden, gering
und demnach ist die Wahrscheinlichkeit des Ergebnisses einer fehlerhaften
Erkennung gering. Als ein Ergebnis wird ein Vorteil bereitgestellt,
in der Lage zu sein, immer eine eingegebene Sprache mit hohem Grad
an Präzision zu erkennen.
-
Wie
oben erwähnt, wird, weil die Spracherkennungsvorrichtung
gemäß dieser Ausführungsform 1 auf solche
Weise konstruiert ist, dass sie den automatischen Neustart des Empfangs
einer Spracheingabe einschaltet, wenn der Rauschpegel niedriger
als der vorbestimmte Pegel ist, d. h., das Umgebungsrauschen gering
ist, als ein Ergebnis automatischen Neustartens des Empfangs einer
Spracheingabe, nachdem eine Zeitabschaltung auftritt, ein Vorteil
bereitgestellt, imstande zu sein, den Benutzer in die Lage zu versetzen,
die Operation des Drückens des Sprechschalters 14 zu
unterlassen und so weiter.
-
Ausführungsform 2.
-
4 ist
ein Blockdiagramm zum Zeigen eines Beispiels einer Spracherkennungsvorrichtung
in Übereinstimmung mit Ausführungsform 2 der vorliegenden
Erfindung. In 4 sind dieselben Komponenten
wie jene der Spracherkennungsvorrichtung, die in 1 gezeigt
ist, durch dieselben Bezugsziffern gekennzeichnet wie jene in 1 gezeigten. Weil
die Betriebsabläufe einer Steuereinrichtung und einer Eingabezeitabschaltsteuereinrichtung
von jenen der Steuereinrichtung 13 und der Eingabezeitabschaltungszeit-Steuereinrichtung 16,
die in der 1 gezeigt sind, abweichen, sind
sie in der dargestellten Spracherkennungsvorrichtung 20 jeweils
durch Bezugsziffern 21 bzw. 22 gekennzeichnet.
In 4 hat eine Umgebungsbedingungserfassungseinrichtung 23 einen
Geschwindigkeitssensor 23a, eine GPS-Antenne/einen GPS-Empfänger 23b,
ein dreidimensionales bzw. 3D-Gyroskop 23c, einen Getriebenstufenpositionssensor 23d und
eine Kartendatenbank (Karten-DB) 23e.
-
In 4 erfasst
der Geschwindigkeitssensor 23a die Geschwindigkeit eines
Fahrzeugs und gibt ein Fahrzeuggeschwindigkeitserfassungssignal
aus. Die GPS-Antenne und Empfänger 23b erlangen
ein GPS-Signal durch Empfangen des Signals mit einem GPS-Benutzer
und das 3D-Gyroskop 23c gibt ein Gyroskoperfassungssignal
aus, das die Position und die Fahrtrichtung des Fahrzeugs angibt.
Der Gebtriebpositionssensor 23d erfasst die Getriebeposition des
Fahrzeugs (d. h., die Gangstufe des Getriebes).
-
Die
Umgebungsbedingungserfassungseinrichtung 23 erlangt die
Momentanposition des Fahrzeugs mit dem GPS-Signal und korrigiert
die Momentanposition in Übereinstimmung mit dem Gyroskop-Erfassungssignal
bedarfsweise um die Momentanposition des Fahrzeugs zu erlangen.
Die Umgebungsbedingungserfassungseinrichtung 23 durchsucht
dann die Karten-DB 23e in Übereinstimmung mit
der Momentanposition des Fahrzeugs, um als Fahrzeugmomentanpositionsinformation
einen Straßentyp zu erlangen, entlang dem das Fahrzeug sich
bewegt und den Typ eines Bereichs, in dem das Fahrzeug sich befindet
(z. B. einen Typ, der angibt, ob der Bereich ein städtischer
Bereich oder ein außerstädtischer Bereich ist)
aus der Karte.
-
Die
Umgebungsbedingungserfassungseinrichtung 23 erlangt auch
als Fahrzustandinformation den Fahrzustand des Fahrzeugs gemäß dem Fahrzeuggeschwindigkeitserfassungssignal
und dem Getriebepositionserfassungssignal. Diese Fahrzeugmomentanpositionsinformation
und Fahrzustandsinformation werden der Steuereinrichtung 21 bereitgestellt
und die Eingabezeitabschaltungszeit-Steuereinrichtung 22 stimmt
die ersten bis dritten Zeitabschaltungszeiten T1 bis T3 auf der
Basis der Fahrzeugmomentanpositionsinformation und der Fahrzustandsinformation
ab, wie später erwähnt wird.
-
Als
Nächstes wird der Betrieb der Spracherkennungsvorrichtung
erläutert.
-
Es
wird Bezug genommen auf 4 und 5, wenn
die Spracherkennungsvorrichtung 20 eingeschaltet wird,
versetzt die Steuereinrichtung 21 den automatischen Neustart
des Empfangs einer Spracheingabe in den AUS-Zustand (Schritt ST14) und
bestimmt dann, ob der automatische Neustart des Empfangs der Spracheingabe
sich in dem EIN-Zustand befindet oder nicht (Schritt ST15). Zu dieser
Zeit bestimmt die Steuereinrichtung 21, weil die Eingabeneustartsteuereinrichtung 15 sich
in dem AUS-Zustand befindet, der Sprechschalter 14 gedrückt
ist oder nicht (Schritt ST16) und verweilt im Bereitschaftszustand,
bis der Sprechschalter 14 gedrückt wird. Wenn
der Sprechschalter 14 gedrückt wird, wird der
Empfang einer Spracheingabe durch die Steuereinrichtung 21 gestartet
(Schritt ST17).
-
Als
Nächstes bestimmt die Eingabezeitabschaltsteuereinrichtung
gesteuert durch die Steuereinrichtung 21, ob eine weitere
Bedingung erfüllt ist oder nicht (Schritt ST18). Es wird
Bezug genommen auf 6, 6 ist ein
Diagramm zum Zeigen eines Beispiels einer für die Steuereinrichtung 21 festgelegten
Entscheidungstabelle. Im dargestellten Beispiel hat die Entscheidungstabelle
eine Vielzahl von Aufzählungspunktnummern und alle Aufzählungspunktnummern
entsprechende Bedingungen jeweils "ob der momentane Ort (Momentanposition)
einer in der Nähe des Ziels ist "ob die Geschwindigkeit
niedriger als 60 km/h ist", ob die Geschwindigkeit gleich oder höher
als 60 km/h ist", "ob der Straßentyp eine untergeordnete
Straße ist", ob der Gebietstyp ein Wohnbereich ist" und
so weiter festgelegt und die ersten bis dritten Zeitabschaltzeiten
(ms) werden für jeden der Vielzahl von Aufzählungspunkten
definiert und "EIN" oder "AUS" des automatischen Neustarts (der
automatische Neustart des Sprachempfangs) sind ebenfalls für
jede Vielzahl von Aufzählungspunktnummer definiert.
-
Die
Eingabezeitabschaltsteuereinrichtung 22 vergleicht die
Momentanposition und den Fahrzustand des Fahrzeugs, die durch die
oben erwähnte Fahrzeugmomentanpositionsinformation und
Fahrzustandsinformation angegeben werden, mit der Entscheidungstabelle
und bestimmt, ob die Entscheidungstabelle eine Aufzählungspunktnummer
enthält, die der Momentanposition und dem Fahrzustand des Fahrzeugs
entspricht, und, wenn die entsprechende Aufzählungspunktnummer
in der Tabelle existiert, richtet sie die ersten bis dritten Zeitabschaltzeiten
T1 bis T3 ein, die der entsprechenden Aufzählungspunktnummer
entsprechen (Schritt ST19). Die Eingabeneustartsteuereinrichtung 15 richtet
ferner den automatischen Neustart des Empfangs einer Spracheingabe
in Entsprechung zu der entsprechenden Aufzählungspunktnummer
ein (Schritt ST20).
-
Wie
in 6 gezeigt, unterscheiden sich die ersten bis dritten
Zeitabschaltzeit T3 und die automatische Produktionseinstellung
in Übereinstimmung mit der Bedingung, und die ersten bis
dritten Zeitabschaltzeiten T1 bis T3 werden eingerichtet und die EIN-
oder AUS-Einstellung der automatischen Produktion wird vorgenommen
auf der Basis sowohl der Fahrzeugmomentanpositionsinformation als
auch der Fahrzustandsinformation. Gleichzeitig werden, wenn zwei
oder mehr der durch die Aufzählungspunktnummern 1 bis 99
gezeigten Bedingungen simultan erfüllt sind, die ersten
bis dritten Zeitabschaltzeiten T1 bis T3 und die automatische Reproduktion, die
durch die Aufzählungspunktnummer 100 gezeigt werden, eingerichtet.
-
Nachdem
die ersten bis dritten Zeitabschaltzeiten T1 bis T3 und die automatische
Reproduktion derart eingerichtet worden sind, bestimmt die Eingabezeitabschaltsteuereinrichtung 22,
ob die erste Zeitabschaltzeit T1 verstrichen ist, seitdem der Empfang der
Spracheingabe gestartet worden ist (Schritt ST21). Wenn die Eingabezeitabschaltsteuereinrichtung 22 bestimmt,
dass die erste Zeitabschaltzeit T1 verstrichen ist, seit der Empfang
einer Spracheingabe gestartet worden ist, beendet die Steuereinrichtung 21 den
Empfang einer Spracheingabe und kehrt zurück zu Schritt
ST15. Wenn demgegenüber die Eingabezeitabschaltsteuereinrichtung
bestimmt, dass die erste Zeitabschaltzeit T1 noch nicht verstrichen
ist, seit der Empfang einer Spracheingabe gestartet worden ist,
bestimmt die Steuereinrichtung 21, ob eine Sprachäußerung
begonnen hat oder nicht (Schritt ST22), und, wenn noch kein Äußern
begonnen hat, kehrt sie zurück zu Schritt ST21.
-
Wenn
ein Äußern begonnen hat, bestimmt die Eingabezeitabschaltsteuereinrichtung 22,
ob die zweite Zeitabschaltzeit T2 verstrichen ist, seit der Empfang
einer Spracheingabe begonnen worden ist (Schritt ST23). Wenn die
Eingabezeitabschaltsteuereinrichtung 22 bestimmt, dass
die zweite Zeitabschaltzeit T2 verstrichen ist, seit der Empfang
einer Spracheingabe begonnen worden ist, beendet die Steuereinrichtung 21 den
Empfang einer Spracheingabe und kehrt zurück zu Schritt
ST15. Wenn demgegenüber die Eingabezeitabschaltsteuereinrichtung bestimmt,
dass die zweite Zeitabschaltzeit T2 noch nicht verstrichen ist,
seit der Empfang einer Spracheingabe begonnen worden ist, bestimmt
die Steuereinrichtung 21, ob die Äußerung
beendet ist (Schritt ST24) und, wenn das Äußern
noch nicht abgeschlossen ist, kehrt sie zurück zu Schritt
ST23 und setzt den Prozess fort, oder findet andernfalls den Prozess.
-
Wie
oben erwähnt, ist, weil die Spracherkennungsvorrichtung
gemäß dieser Ausführungsform 2 derart
aufgebaut ist, dass sie die ersten bis dritten Zeitabschaltzeiten
T1 bis T3 in Übereinstimmung mit der Momentanposition und
dem Fahrzustand des Fahrzeugs einrichtet, die Wahrscheinlichkeit,
dass ein von der Momentanposition und dem Fahrzustand des Fahrzeugs
herrührendes Rauschen in die Spracherkennungsvorrichtung
gemeinsam mit einer Spracheingabe eingegeben wird, gering, und demnach wird
die Wahrscheinlichkeit einer resultierenden fehlerhaften Erkennung
niedrig. Als ein Ergebnis wird ein Vorteil bereitgestellt, in der
Lage zu sein, immer eine eingegebene Sprache mit einem hohen Grand an
Präzision zu erkennen.
-
Wie
oben erwähnt, wird, weil die Spracherkennungsvorrichtung
gemäß dieser Ausführungsform 2 auf solche
Weise konstruiert ist, sie gemäß der Momentanposition
und dem Fahrzustand des Fahrzeugs bestimmt, ob der automatische
Neustart des Empfangs einer Spracheingabe vorgenommen werden soll,
als ein Ergebnis des automatischen Neustart des Empfangs einer Spracheingabe
in Übereinstimmung mit der Momentanposition und dem Fahrzustand
des Fahrzeugs, nachdem eine Zeitabschaltung auftritt, ein Vorteil
bereitgestellt, imstande zu sein, den Benutzer in die Lage zu versetzen,
das Betätigen des Drückens des Sprechschalters 14 wegzulassen
und so weiter.
-
Ausführungsform 3.
-
7 ist
ein Blockdiagramm zum Zeigen eines Beispiels einer Spracherkennungsvorrichtung
in Übereinstimmung mit Ausführungsform 3 der vorliegenden
Erfindung. In 7 sind dieselben Komponenten
wie jene der in 1 gezeigten Spracherkennungsvorrichtung
durch dieselben Bezugsziffern gekennzeichnet wie jene in 1 gezeigten.
In der dargestellten Spracherkennungsvorrichtung 30 sind, weil
die Betriebsabläufe einer Steuereinrichtung, einer Eingabezeitabschaltsteuereinrichtung
und einer Eingabeneustartsteuereinrichtung sich von jenen der Steuereinrichtung 13,
der Eingabezeitabschaltungszeit-Steuereinrichtung 16 und
der Eingabeneustartsteuereinrichtung 15, die in 1 gezeigt
werden, unterscheiden, diese jeweils durch Bezugsziffern 31, 32 bzw. 33 gekennzeichnet.
In 7 ist eine Umgebungsbedingungserfassungseinrichtung 34 mit einer
Dialoginhalte-Datenbank bzw. Dialoginhalte-DB 34a vorgesehen.
-
Dialoginhalte,
mit denen die Spracherkennungsvorrichtung 30 jeweils mit
dem Benutzer interagiert, werden in dieser Dialoginhalte-DB 34a gespeichert,
und die Umgebungsbedingungserfassungseinrichtung 34 stellt
einen Dialoginhalt (z. B. eine Frage), die in der Dialoginhalte-DB 34a gespeichert
ist, der Steuereinrichtung 31 in Übereinstimmung
mit den Umgebungsbedingungen des Fahrzeugs bereit und die Steuereinrichtung 31 gibt
diese Frage mit Hilfe der Ausgabeeinrichtung 17 aus. Die Eingabezeitabschaltsteuereinrichtung 32 stimmt dann
die ersten bis dritten Zeitabschaltzeiten T1 bis T3 in Übereinstimmung
mit einem Grad an Schwierigkeit im Dialog ab, welcher später
erläutert wird, gesteuert durch die Steuereinrichtung 31.
Zudem bringt die Eingabeneustartsteuereinrichtung 33 den
automatischen Neustart des Empfangs einer Eingabe in den EIN- oder
AUS-Zustand in Übereinstimmung mit dem Grad an Schwierigkeit
im Dialog gesteuert durch die Steuereinrichtung 31.
-
Als
Nächstes wird der Betrieb der Spracherkennungsvorrichtung
erläutert.
-
Es
wird Bezug genommen auf 7 und 8, wenn
die Spracherkennungsvorrichtung 30 eingeschaltet wird,
versetzt die Steuereinrichtung 31 den automatischen Neustart
des Empfangs der Spracheingabe in den AUS-Zustand (Schritt ST25)
und bestimmt dann, ob der automatische Neustart des Empfangs einer
Spracheingabe sich in dem EIN-Zustand befindet oder nicht (Schritt
ST26). Zu dieser Zeit bestimmt die Steuereinrichtung 31,
weil die Eingabeneustartsteuereinrichtung 33 in den AUS-Zustand
versetzt ist, ob der Sprechschalter 14 gedrückt ist
oder nicht (Schritt ST27) und verharrt im Bereitschaftszustand,
bis der Sprechschalter 14 gedrückt wird. Wenn
der Sprechschalter 14 gedrückt wird, wird der
Empfang einer Spracheingabe durch die Steuereinrichtung 31 gestartet
(Schritt ST28).
-
Daraufhin
gibt die Steuereinrichtung 31 mit Hilfe der Ausgabeeinrichtung 17 eine
in der Dialoginhalte-DB 34a gespeicherte Frage aus. Eine
Tabelle der Schwierigkeitsgrade im Dialog (nachstehend Dialogschwierigkeitsgradtabelle),
wie sie beispielsweise in 9 gezeigt
wird, ist in der Dialoginhalte-DB 34a gespeichert und dieser
Dialogschwierigkeitsgradtabelle wird ein Schwierigkeitsgrad im Dialog
(d. h., eine Bewertungszahl) in Entsprechung zu jedem der Dialoginhalte
(d. h., jeder Frage) eingerichtet. Die Steuereinrichtung 31 akquiriert
einen Schwierigkeitsgrad (d. h., eine Bewertungszahl) in Entsprechung
zu dem Dialoginhalt unter Bezugnahme auf die Dialogschwierigkeitsgradtabelle
und beurteilt die Bewertungszahl (Schritt ST29).
-
Wenn
die Bewertungszahl kleiner als 20 ist, kürzt die Eingabezeitabschaltsteuereinrichtung 32 die
ersten bis dritten Zeitabschaltzeiten T1 bis T3 von den ersten bis
dritten vorbestimmten Zeiten jeweils um erste bis dritte Zeitlängen,
die im Voraus festgelegt worden sind (Schritt ST30). Die Steuereinrichtung 13 behält
auch den automatischen Neustart des Spracheingabeempfangs in dem
AUS-Zustand (Schritt ST31). Als Nächstes bestimmt die Eingabezeitabschaltsteuereinrichtung 32,
ob die erste Zeitabschaltzeit T1 verstrichen ist, seit der Empfang
einer Spracheingabe gestartet worden ist (Schritt ST32).
-
Wenn
die Eingabezeitabschaltsteuereinrichtung 32 bestimmt, dass
die erste Zeitabschaltzeit T1 verstrichen ist, seit der Empfang
einer Spracheingabe gestartet worden ist, beendet die Steuereinrichtung 31 den
Empfang einer Spracheingabe und kehrt zum Schritt ST26 zurück.
Wenn demgegenüber die Eingabezeitabschaltsteuereinrichtung
bestimmt, dass die erste Zeitabschaltzeit T1 noch nicht verstrichen
ist, seit der Empfang einer Spracheingabe gestartet worden ist,
bestimmt die Steuereinrichtung 31, ob ein Äußern
begonnen hat oder nicht (Schritt ST33) und, wenn noch nicht mit
einer Äußerung begonnen worden ist, kehrt sie
zurück zum Schritt S32).
-
Wenn
mit einer Äußerung begonnen worden ist, bestimmt
die Eingabezeitabschaltsteuereinrichtung 32, ob die zweite
Zeitabschaltzeit T2 verstrichen ist, seit der Empfang einer Spracheingabe
gestartet worden ist (Schritt ST34). Wenn die Eingabezeitabschaltsteuereinrichtung 32 bestimmt,
dass die zweite Zeitabschaltzeit T2 verstrichen ist, seit der Empfang einer
Spracheingabe begonnen hat, beendet die Steuereinrichtung 31 den
Empfang einer Spracheingabe und kehrt zurück zum Schritt
ST26. Wenn demgegenüber die Eingabezeitabschaltsteuereinrichtung bestimmt,
dass die zweite Zeitabschaltzeit T2 nicht verstrichen ist, seit
der Empfang einer Spracheingabe begonnen worden ist, bestimmt die
Steuereinrichtung 31, ob das Äußern abgeschlossen
ist oder nicht (Schritt ST35), und, wenn das Äußern
nicht abgeschlossen ist, kehrt sie zurück zum Schritt ST34
und setzt den Prozess fort, oder beendet andernfalls den Prozess.
-
Wenn
im Schritt ST29 die Bewertungszahl gleich oder größer
als 20 ist und kleiner als 30, legt die Eingabezeitabschaltsteuereinrichtung 32 die
ersten bis dritten Zeitabschaltzeiten T1 bis T3 jeweils auf die
ersten bis dritten vorbestimmten Zeiten fest und geht dann zu Schritt
ST32.
-
Wenn
demgegenüber im Schritt ST29 die Bewertungszahl gleich
oder größer als 30 ist, verlängert die
Eingabezeitabschaltsteuereinrichtung 32 die ersten bis
dritten Zeitabschaltzeiten T1 bis T3 von den ersten bis dritten
vorbestimmten Zeiten jeweils um erste bis dritte im Voraus definierte
Zeitlängen (Schritt ST36). Zudem schaltet die Steuereinrichtung 31 den
automatischen Neustart des Spracheingabeempfangs ein (Schritt ST37).
Daraufhin wird der Schritt ST32 ausgeführt. Wenn die Eingabeneustartsteuereinrichtung 33 eingeschaltet
wird, steuert die Eingabeneustartsteuereinrichtung 33,
ob der Empfang einer Spracheingabe gemäß der Bewertungszahl
neu gestartet wird, nachdem eine Zeitabschaltung auftritt. Das heißt,
die Eingabeneustartsteuereinrichtung 33 startet den Empfang
einer Spracheingabe automatisch neu, wenn die Bewertungszahl gleich
oder größer als 30 ist.
-
Wie
oben erwähnt, kann der Benutzer, weil die Spracherkennungsvorrichtung
gemäß dieser Ausführungsform 3 auf solche
Weise konstruiert ist, dass sie die ersten bis dritten Zeitabschaltzeiten
T1 bis T3 verlängert, wenn der Schwierigkeitsgrad des Dialoginhalts
hoch ist, sich mit ausreichender Zeit äußern und
die Akzeptanzrate der Äußerung kann verbessert
werden. Als ein Ergebnis können die durch die Bedienung
bedingte Belastung und der mentale Stress des Benutzers reduziert
werden.
-
Weil
die Spracherkennungsvorrichtung gemäß dieser Ausführungsform
3 auf solche Weise konstruiert ist, dass sie den automatischen Neustart des
Empfangs einer Spracheingabe in Übereinstimmung mit dem
Grad an Schwierigkeit des Dialoginhalts einschaltet, wird als ein
Ergebnis des automatischen Neustart des Empfangs einer Spracheingabe, nachdem
eine Zeitabschaltung auftritt, ein Vorteil bereitgestellt, den Benutzer
in die Lage zu versetzen, die Operation des Drückens des
Sprechschalters 14 wegzulassen und so weiter.
-
Gewerbliche Anwendbarkeit
-
Wie
oben erwähnt, ist die Spracherkennungsvorrichtung in Übereinstimmung
mit der vorliegenden Erfindung geeignet zum Vorsehen einer Spracherkennungsvorrichtung,
die eine eingegebene Sprache mit einem hohen Grad an Präzision
erkennen kann.
-
Zusammenfassung
-
Spracherkennungsvorrichtung
-
Eine
Spracherkennungsvorrichtung 10 schließt eine Spracherkennungseinrichtung 12 ein zum
Durchführen von Spracherkennung und eine Steuereinrichtung
zum Steuern des Empfangs einer Spracheingabe in die Spracherkennungseinrichtung, und
zum Durchführen der Erkennung in Übereinstimmung
mit einem Ergebnis der durch die Spracherkennungseinrichtung akquirierten
Spracherkennung. In dieser Spracherkennungsvorrichtung steuert die Steuereinrichtung
den Empfang einer Sprache in Übereinstimmung mit einer
Zeitabschaltzeit, die das Ende des Empfangs einer Sprache definiert.
Die Spracherkennungsvorrichtung schließt ferner eine Umgebungsbedingungserfassungseinrichtung 18 ein zum
Erfassen einer Umgebungsbedingung, und eine Zeitabschaltzeit-Steuereinrichtung 16 zum Ändern der
Zeitabschaltzeit in Übereinstimmung mit der durch die Umgebungsbedingungserfassungseinrichtung
erfassten Umgebungsbedingung.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- - JP 57-30913
A [0005]
- - JP 58-50598 A [0005]