DE3238855A1 - Spracherkennungseinrichtung - Google Patents
SpracherkennungseinrichtungInfo
- Publication number
- DE3238855A1 DE3238855A1 DE19823238855 DE3238855A DE3238855A1 DE 3238855 A1 DE3238855 A1 DE 3238855A1 DE 19823238855 DE19823238855 DE 19823238855 DE 3238855 A DE3238855 A DE 3238855A DE 3238855 A1 DE3238855 A1 DE 3238855A1
- Authority
- DE
- Germany
- Prior art keywords
- memory
- actuation
- term
- voice command
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims abstract description 46
- 238000003860 storage Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 2
- 238000005744 Teer Meer reaction Methods 0.000 claims 1
- 230000000881 depressing effect Effects 0.000 abstract 1
- 230000000994 depressogenic effect Effects 0.000 abstract 1
- 239000011159 matrix material Substances 0.000 description 6
- 238000000034 method Methods 0.000 description 5
- 238000003825 pressing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000047875 Pica hudsonia Species 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mechanical Engineering (AREA)
- Signal Processing (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Rear-View Mirror Devices That Are Mounted On The Exterior Of The Vehicle (AREA)
Description
TER meer · Müller ■ s-rEirtMEiSTEft :_: ' :: ^ Nissan WG 821 58/1 84 (2) /YM
BESCHREIBUNG
Die Erfindung bezieht sich auf eine durch gesprochene Befehle steuerbare Betätigungseinrichtung, insbesondere nach der Definition
im Oberbegriff von Patentanspruch 1.
In Kraftfahrzeugen wird eine bekannte Spracherkennungseinrichtung zur Betätigung von diversen Antrieben, Stellgliedern u.dgl.
mittels gesprochener Befehle verwendet, zum Beispiel zum Ein- und Ausschalten der Scheinwerfer durch den Ruf: "Scheinwerfer
ein" oder "Scheinwerfer aus".
Die Spracherkennungseinrichtung kann gewöhnlich verschiedene gesprochene Befehle unterscheiden und danach die richtigen Betätigungselemente,
Stellglieder o.dgl. ansteuern, jedoch ist ihr Einsatz in Kraftfahrzeugen mit gewissen Problemen behaftet.
Die über die Spracherkennungseinrichtung steuerbaren Aggregate oder Vorrichtungen eines Kraftfahrzeugs wie Scheinwerfer, Scheibenwischer,
Rundfunkempfänger, Außenspiegel, Türspiegel u.dgl. können von ihrer Betätigungsart her in zwei Gruppen unterteilt
werden: Die als "Ein/Ausschaltgruppe" zu bezeichnende erste Gruppe umfaßt Vorrichtungen wie die Scheinwerfer, Scheibenwischer,
Scheibenwaschanlage, das Autoradio u.dgl., die einfach ein- oder auszuschalten sind. Die als "Justiergruppe" zu bezeichnende
zweite Gruppe umfaßt Außenspiegel, Türfenster u.dgl., die wie beispielsweise die Außenspiegel rechts und links einzeln oder
beide durch den Fahrer genau zu justieren sind und dabei jeweils
in horizontaler und/oder vertikaler Richtung entsprechend eingestellt werden müssen. Die Türfenster rechts und links
sollen einzeln oder beide geöffnet oder geschlossen werden, und für den Fahrersitz und den Beifahrersitz gibt es schließlich
die Möglichkeiten der Sitzverstellung nach vorn und hinten sowie der Verstellung der Sitzlehnen nach vorn und hinten.
BAD ORIGINAL
TER MEER-MÜLLER. STEINMEISTER-..: " :,.:.:",. Nissan WG 821 58/1 84 (2)/YM
Bei über die Spracherkennungseinrichtung zu betätigenden Vorrichtungen
mit mehreren BetMtigungsmöglichkeiten muß der Fahrer oder Bediener gewöhnlich eine Betätigungsfolge einhalten, also
z.B. erst den rechten Außenspiegel horizontal und danach vertikai,
dann den linken Spiegel horizontal und danach vertikal verstellen, oder erst den Sitz vor und dann die Lehne nach hinten
bewegen, oder beispielsweise erst das rechte Türfenster und danach das linke Türfenster öffnen. In dem Fall der Außenspiegelverstellung
ist es daher erforderlich, vier gesprochene Befehle "Rechter Spiegel horizontal", "Rechter Spiegel vertikal",
"Linker Spiegel horizontal" und "Linker Spiegel vertikal" einmal
aufzuzeichnen, damit sie durch die Spracherkennungseinrichtung im Betriebsfall durch Vergleich mit den in gleicher Reihenfolge
in das Mikrofon gesprochenen Befehlen erkannt und ausgeführt
werden können.
Mit dem Ziel einer Verminderung der erforderlichen Aufzeichnungs-Speicherkapazität
ist eine bekannte Einrichtung der eingangs genannten Art so ausgelegt worden, daß gesprochene Betätigungsbefehle in einen "Vorrichtungsansprechteil" wie z.B. "Spiegel"
und einen "Anweisungsteil" wie z.B. "rechts horizontal" oder "rechts vertikal" unterteilt und so separat aufgezeichnet und
identifiziert werden, weil der Begriff "Spiegel" in dieser Befehlsgruppe immer enthalten ist. Die hier angewandte Methode
erfordert mehr Zeit bei der Vor-Aufzeichnung, erfordert aber
weniger Speicherkapazität und erleichtert sowie beschleunigt die Befehlsidentifizierung. Dafür hat diese bekannte Methode
' aber auch Nachteile, weil sämtliche vorkommenden Befehle wie "Spiegel rechts horizontal", "Spiegel rechts vertikal",
"Spiegel links horizontal" und "Spiegel links vertikal" der Reihe nach recht mühsam einzeln und deutlich in das Mikrofon
gesprochen werden müssen. Außerdem besteht bei dieser Vielzahl
TER MEER ■ MÜLLER · SjglMMElaTEfi :_: ' : ^z . Nissan WG 82158/184 (2) /YM
ähnlicher Befehle die Gefahr der Verwechselung im Betriebsfall durch das System.
Der Erfindung liegt die Aufgabe zugrunde, eine Spracherkennungseinrichtung
der eingangs genannten Art so auszubilden und zu verbessern, daß bei der Speicherung von Befehlen für Vorrichtungen
mit mehreren Betätigungsmöglichkeiten der Vorrichtungsansprechteil (z.B. "Spiegel") nicht jedesmal wiederholt werden
muß.
Die erfindungsgemäß.e Lösung der gestellten Aufgabe ist kurz
gefaßt im Patentanspruch 1 angegeben.
Vorteilhafte Weiterbildungen des Erfindungsgedankens sind in
Unteransprüchen gekennzeichnet.
Der Grundgedanke der Erfindung geht dahin, in der Spracherkennungseinrichtung
einen Bezugsmusterspeicher, welcher einen ' Speicher zum Speichern von Begriffen zu mindestens einer zu
verstellenden Vorrichtung und einen zweiten Speicher mit mehreren Einheiten zum Speichern von verschiedenen Betätigungsbegriffen
für jede vorgesehene Vorrichtung umfaßt, mit einem Rücksetzschalter zum Löschen eines durch die Einrichtung erkannten
Betätigungsbefehlsbegriffs und mit einer Wähleinheit
zum Auswählen und Kombinieren von Vorrichtungs- und Betätigungsbegriff sspeichern in Abhängigkeit von einem Rücksetzsignal
aus dem Rücksetzschalter zu kombinieren.
Damit ist dem Benutzer die Möglichkeit gegeben, beispielsweise beide Außenspiegel eines Fahrzeugs zu verstellen, indem er zuerst
unter Betätigung einer Spracherkennungstaste "Spiegel" in
BAD ORIGINAL
TER MEER -MÜLLER . βτέΐΐ^Μ&ΐδτε« *_- " :_: ■■_ Nissan WG 821 58/1 84 (2) /YM
— Q _
ein Mikrofon spricht und dann nacheinander die Betätigungsbefehle "rechts horizontal", "rechts vertikal", "links horizontal"
und "links vertikal" ausspricht, wobei die Einzelbewegungen jeweils durch zwischenzeitliche Betätigung des
Rücksetzschalters zu beenden sind. Der Schlußbefehl lautet "Halt".
Die Erfindung und vorteilhafte Einzelheiten werden nachstehend unter Bezug auf eine Zeichnung in beispielsweiser Ausführungsform näher erläutert. Es zeigen:
Fig. 1 ein schematisches Blockschaltbild einer insbesondere für den Stand der Technik typischen Spracherkennungseinrichtung
für ein Kraftfahrzeug,
Fig. 2 und 3 je ein schematisches Blockschaltbild zu einem ersten und zweiten Ausführungsbeispiel einer erfindungsgemäßen
Kfz.-Spracherkennungseinrichtung,
und
Fig. 4 ein Flußdiagramm zum Ablauf der wiederholten Betätigung einer justierbaren Fahrzeug-Vorrichtung durch
entsprechende gesprochene Befehle in Verbindung mit einem Programm, das in einem Mikrocomputer des
Ausführungsbeispiels von Fig. 3 gespeichert ist.
TER MEER · MÖLLER · ST^IWK^iSTEp., ·,." ·..- .;JVTissan - WG 821 58/1 84 (2) /YM
Vor Verwendung der in Fig. 1 schematisch dargestellten und für den Stand der Technik typischen Spracherkennungseinrxchtung 100
ist es erforderlich, daß der Benutzer zuerst eine Aufzeichnungstaste 1 drückt und in einer besonderen Betriebsart "Voraufzeichnung"
mehrere gesprochene Befehle aufzeichnet. Das von der betätigten Aufzeichnungstaste 1 über eine Schnittstelleneinheit 4
und Leitung 4a an eine Steuerschaltung 5 abgegebene Signal wird in der Steuerschaltung 5 in ein Aufzeichnungssignal zur Aktivierung
aller an der Voraufzeichnung beteiligten Schaltungen bzw.
Einheiten umgesetzt. Ein vom Benutzer gesprochener Befehl wie beispielsweise "Radio Ein " wird von einem Mikrofon in ein entsprechendes
elektrisches Signal verwandelt, welches durch eine hauptsächlich einen das Spektrum normalisierenden Verstärker
enthaltende Sprachverarbeitungsschaltung 6 aus einem Gleichrichter mit Sieb- bzw. Glättungsglied bestehenden
Effektivwert-Glättungsschaltung 15 auf den quadratischen Mittelwert geglättet und danach an einen Stimmdetektor 7 abgegeben
.Der Stimmdetektor 7 deutet, wenn die Stärke eines Sprachbefehlssignals
einen vorgegebenen Pegel für die Dauer eines festgelegten Zeitraums (150 bis 250 ms) überschreitet, diesen
Befund als den Beginn des Sprachbefehlssignals und, wenn die Stärke dieses Signals für die Dauer eines festgelegten Zeitraums
(etwa 300 ms) einen vorgegebenen Pegel unterschreitet, als das Ende des Sprachbefehlssignals. Bei Feststellung des
Signalbeginns gibt der Stimmdetektor 7 ein neues Aufzeichnur.gssignal
an die Steuerschaltung 5 ab, damit jene durch Aktivierung einer Gruppe von Bandpaßfiltern 8 die Aufspaltung des vom
Mikrofon 2 kommenden Sprachbefehlssignals in eine Anzahl festgelegter
Frequenzbänder veranlaßt. Eine Parameter-Aufbereitungsschaltung 9 übernimmt die in Frequenzbänder zerlegten Sprachbef
ehlssignale, gewinnt daraus durch Quadrieren oder Gleichrichtung eine spektrale Lautstärkeverteilung über die Frequenzbänder
und setzt das Frgebnis in entsprechende digitale zeitserielle matrixDhonetische Musterdaten um, welche in einer
nachgeschalteten Speichereinheit 10 gespeichert werden. Weil die Spracherkennungseinrichtung 100 durch Betätigung der Aufzeichnunnstaste
1 auf die Betriebsart "Voraufzeichnung" von
BAD ORIGINAL
TER MEER ■ MÖLLER > ST£lKMgI STE & IJ- ' :": .NISSAN - WG 821 58/1 84(2) /YM
Sprachbefehlssignalen geschaltet worden ist, werden die so
gewonnenen zeitseriellen matrixphonetischen Musterdaten in einen Musterspeicher 11 Übertragen und darin als Bezugsdaten
für die Identifizierung gesprochener Befehle gespeichert.
Nach erfolgter Aufzeichnung der als Bezugsmuster für gesprochene Befehle dienenden Bezugsdaten kann der Benutzer, während er
eine Identifiziertaste 3 betätigt, Befehle wie beispielsweise Radio Ein " in das Mikrofon sprechen. Durch Betätigung der
Identifiziertaste 3 wird bei der Schnittstelleneinheit 4 ein Signal ausgelöst und über eine Leitung 4b an die Steuerschaltung
5 abgegeben, damit jene die gesamte Spracherkennungseinrichtung auf die Betriebsart "Identifizierung" umstellt. Sobald
in dieser Betriebsart der Benutzer einen Befehl in das Mikrofon spricht und dieser Befehl einem zuvor aufgezeichneten gesprochenen
Befehl ähnlich ist, und wenn der Stimmdetektor 7 ein Signal abgibt, dann wird das vom Mikrofon 2 kommende Sprachbefehlssignal
von der Sprachverarbeitungsschaltung 6 verstärkt, von den Bandpaßfiltern 8 gefiltert und in Frequenzbänder
mit entsprechendem Lautstärkespektrum aufgeteilt, von der Aufbereitungsschaltung 9 durch Quadrieren oder Gleichrichten
in entsprechende digitale zeitserielle matrixphonetische Musterdaten umgewandelt und (wie bei der Betriebsart "Voraufzeichnung")
in der Speichereinheit 10 gespeichert.
Danach werden die in der Speichereinheit 10 in der Betriebsart "Identifizierung" gespeicherten zeitseriellen matrixphonetischen Musterdaten mit den in dem Musterspeicher 11 in der
Betriebsart "Voraufzeichnung" gespeicherten zeitseriellen
matrixphonetischen Musterdaten mittels eines Ähnlichkeits-Komparators
12 verglichen. Der Komparator 12 ermittelt nach Durchführung eines Zeit- und Pegelausgleichs zwecks Ausgleichs
.- .. '- , O 4. JO O Ό Ό
TER MEER · MÜLLER · STErNf$dE£STER ; ;-; ; .NISSAN - WG 82158/184{2)/YM
- 1 2 -
unterschiedlicher Sprechweise (da dieselbe Person einmal laut und schnell, zu anderer Zeit dagegen langsam und leise sprechen
kann) zwischen dem gesprochenen Befehl und dem gespeicherten Bezugsbefehl einen Korrelationsfaktor, welcher (wie weiter unten
erläutert wird) gewöhnlich mittels Berechnung des Tchebycheff-Abstands
zwischen den bei der Betriebsart Identifizierung und den bei der Betriebsart Voraufzeichnung gewonnenen zeitseriellen
matrixphonetischen Musterdaten gewonnen wird. Wenn eine nachgeschaltete Prüfschaltung 13 feststellt, daß die errechneten
Werte in einem festgelegten Bereich liegen und folglich Ähnlichkeit zwischen dem voraufgezeichneten und dem soeben gesprochenen
Befehl besteht, dann veranlaßt sie durch Abgabe eines entsprechenden Befehlssignals an das betreffende Stellglied
14 beispielsweise das Öffnen der Fahrzeugtüren. Alle
diese Vorgänge werden durch entsprechende Steuersignale aus der Steuerschaltung 5 kontrolliert.
Die vorstehend in Verbindung mit Fig. 1 beschriebene Spracherkennungseinrichtung
100 besteht aus diskreten Bauelementen oder Einheiten; sie könnte statt dessen auch durch einen Mikrocomputer
mit Zentraleinheit, ROM, RAM, Taktgenerator usw. enthalten, der die Funktionen der beschriebenen Einheiten 7, 9, 10,
11, 12 und 13 ersetzt und gleiche und/oder ähnliche Rechenvorgänge, Operationen u.dgl. ausführt.
Für den Fall, daß vier Bandpaßfilter vorhanden sind und jeder
davon mit zweiunddreißig aufeinanderfolgenden Zeitschritten arbeitet, können die digitalen zeitseriellen matrixphonetischen
BAD ORIGINAL
TER MEER - MÜLLER
"NISSAN - WG 82158/184(2)/YM
-13 -
Mu'sterdaten der Betriebsart Vorauf zeichnung wie folgt ausgedrückt
werden:
F(A) = f(i,j) =
f (1,1), f (1,2), f (1,3)
f (2,1), f (2,2), f (2,3)
f(3,1), f(3,2), f(3,3)
f (4,1) , .f (4,2), f (4,3)
f(1,32) f (2,32) f(3,32) f(4,32)
Darin sind mit A ein erster voraufgezeichneter (Bezugs-) Sprachbefehl
(z.B."Autoradio Ein"), mit i der Filterindex und mit j der Zeitschrittindex bezeichnet.
Wenn mit B ein erster, in der Betriebsart Identifizierung gesprochener
Sprachbefehl (in diesem Fall "Autoradio Ein») bezeichnet ist, dann kann der Tchebycheff-Abstand durch folgenden
Ausdruck errechnet werden:
= Jf(A) - F(B) J =
|fA(i,j) - fB(i,j)j
Das in Fig. 2 schematisch dargestellte erste Ausführungsbeispiel einer erfindungsgemäßen Spracherkennungseinrichtung 100
enthält einen Analysierabschnitt 101, welcher auch die in Fig.
1 vorhandene Sprachsignalverarbeitungsschaltung 6, Glättungsschaltung
15, den Stimmdetektor 7, die Bandpaßfilter 8 sowie die Parameter-Aufbereitungsschaltung 9 umfaßt, einen aus dem
Shnlichkeits-Komparator 12 und der Prüfschaltung 13 von Fig. 1
bestehenden Vergleichsabschnitt 102, einen mit dem Eingang der Schnittstelleneinheit 4 verbundenen Rücksetzschalter 103,
J Z.
TER MEER -MÜLLER · STgINfM-ElSTER :_: " :_: _:^ Nissan - WG 82158/184(2)/YM
- 14 -
durch dessen Betätigung ein gerade ausgesprochener Befehl unterdrückt
und die Einrichtung 100 in die vorhergehende Betriebsart Snracherkennung zurückgesetzt wird, und eine Anzeigeeinheit
104 zur visuellen Darstellung von Erkennungsergebnissen oder z.B. einer Anweisung, einen von der Einrichtung 100 nicht verstandenen
Befehl noch einmal zu wiederholen. Ferner ist ein Bezugsmusterspeicher 11 mit einem ersten Speicher 11-1 für Vorrichtungsbegriffe
wie "Spiegel", "Sitz", "Fenster" u.dgl. und einem zweiten Speicher 11-2 für Betätigungsbegriffe vorhanden.
Der zweite Speicher 11-2 enthält z.B. drei Speichereinheiten
wie eine Spiegelspeichereinheit 11-2a, in der beispielsweise die vier Betätigungsbegriffe "rechts horizontal", "rechts vertikal",
"links horizontal" und "links vertikal" gespeichert sind, eine Sitzspeichereinheit 11-2b zur Speicherung von Sitzbetätigungsbegriffen
wie "vorwärts bewegen", "rückwärts bewegen" , "nach vorn neigen" und "nach hinten neigen" und eine
Fensterspeichereinheit 11-2c zur Speicherung von Fensterbetätiaungsbegriffen
wie "rechts öffnen", "rechts schließen", "links öffnen" und 'links schließen". Mittels einer Musterspeicherwähleinheit
105 können in Abhängigkeit von einem entsprechenden Steuersignal der Steuerschaltung 5 Verbindungen zwischen
dem Vergleichsabschnitt 102 und dem ersten Speicher 11-1 und
dem zweiten Speicher 11-2 hergestellt werden.
Wenn im Betrieb dieses Ausführungsbeispiels in Fig. 2 die Taste
3 für die Betriebsart "Spracherkennung" gedrückt wird, erhält die Steuerschaltung 5 über eine Leitung 4b ein entsprechendes
Signal aus der Schaltereingangs-Schnittstelleneinheit 4 und versetzt ihrerseits die gesamte Einrichtung 100 in diese Betriebsart.
Zuerst wird der erste Speicher 11-1 für Vorrichtungsbegriffe
über die Wählstufe 105 mit dem Vergleichsabschnitt verbunden, und dazu erscheint auf der Anzeigeeinheit 104 die
Anweisung "Sprich einen Vorrichtungsbegriff". Wenn daraufhin
TER MEER -MÜLLER. S-FE1NMBSTE^ -.^
' \
:.;'.. ^355n WG 821 58/1 84 (2)/
γΜ
- 15 -
der Fahrer den Begriff "Spiegel" in das Mikrofon 2 spricht,
wird dieser Befehlsteil durch den Analysierabschnitt 101 analysiert und durch den Vergleichsabschnitt 102 mit den im ersten
Speicher 11-1 vorgespeicherten Vorrichtungsbegriffen verglichen. Falls der Fahrer nicht laut oder deutlich genug gesprochen hat
und/oder der Störgeräuschpegel im Fahrzeug zu hoch war, wird der Fahrer z.B. durch die visuelle Anweisung "Bitte wiederholen1
auf der Anzeigeeinheit 104 aufgefordert, diesen Teil des Befehls
noch einmal in das Mikrofon zu sprechen.
Nach Erkennung des Vorrichtungsbegriffs durch den Vergleichsabschnitt 102 veranlaßt die Steuerschaltung 5 durch Abgabe entsprechender
Signale die Darstellung der Anweisung "Spiegel — Sprich den Betätigungsbegriff" auf der Anzeigeeinheit 104 und
durch ein Signal an die Wählstufe 105 die Herstellung einer
Verbinduna zwischen dem Vergleichsabschnitt 102 und der Spiegelspeichereinheit
11-2a im zweiten Speicher 11-2.
Falls der Fahrer einen falschen Befehl in die Einrichtung 100
gesprochen hat, kann er die Einrichtung 100 durch Betätigung des Rücksetzschalters 103 über die Schnittstelleneinheit 4 und
Leitung 4c sowie die Steuerschaltung 5 veranlassen, durch Abgabe entsprechender Signale an andere Schaltungsbereiche den
gerade ausgesprochenen Befehl zu unterdrücken.
Falls die Einrichtung 100 sich verhören und einen korrekt gesprochenen
Befehlsbegriff (z.B. "Spiegel") als "Sitz" erkennen sollte, dann kann auch dieser falsche Vorrichtungsbegriff auf
die angegebene Weise gelöscht werden.
Sobald der Fahrer den fälligen Betätigungsbegriff "rechts horizontal"
in das Mikrofon 2 spricht, wird der Begriff durch den
TER MEER ■ MÜLLER ■ STEINMEISTER I ^ Z ' ^ : -'_ Nissan WG 82158/184 (2) /YK
Analysierabschnitt 101 analysiert und durch den Vergleichsabschnitt 102 mit den in der Spiegelspeichereinheit 11-2a
gespeicherten Betätigungsbegriffen verglichen. Nach erfolgter Erkennung des Begriffs veranlaßt die Steuerschaltung 5 die
Verstellung des rechten Außenspiegels über das entsprechende Stellglied 14 in Horizontalrichtung. Sobald der rechte Außenspiegel
eine gewünschte Horizontalwinkelposition erreicht hat, bringt der Fahrer durch Betätigung· des Rücksetzschalters 103
den Außenspiegel zum Stillstand in dieser Position, und die Spracherkennungseinrichtung 100 kehrt in einen Bereitschaftszustand
zur Annahme v/eiterer Betätigungsbegriffe, nicht, jedoch
eines neuen Vorrichtungsbegriffs, zurück.
Wenn danach der Fahrer "rechts vertikal" in das Mikrofon 2 spricht, wird auf die gleiche Weise wie zuvor erläutert der
rechte Außenspiegel über das Stellglied 14 in Verbindung mit der Steuerschaltung 5 so lange vertikal verdreht, bis er die
gewünschte Vertikal-Winkelposition erreicht hat; dort wird er durch Betätigung des Rücksetzschalters 103 fixiert. Die Einrichtung
100 ist dann bereit zur Annahme des nächsten Betätigungsbegriffs. Der Fahrer justiert daraufhin den linken Außenspiegel·,
indem er zuerst "links horizontal" in das Mikrofon 2 spricht und, sobald die Horizontalposition stimmt, "links vertikal"
in das Mikrofon ruft. Sobald auch die Vertikalposition des linken Außenspiegels stimmt, beendet der Fahrer den Spiegelverstellvorgang
durch den Ruf "Halt" in das Mikrofon 2.
Bei dem in Fig. 3 dargestellten zweiten Ausführungsbeispiel der
Erfindung sind die wesentlichen Elemente der erfindungsgemäßen SDracherkennunqseinrichtung 100 wie die Musterspeicherwählstufe
105 und der Bezugsmusterspeicher 11 mit den beiden Speichern 11-1 und 11-2 für die Vorrichtungs- und Betätigungsbegriffe usw.
..- .. 323£#55 ·
TER MEER · MÜLLER ν SJ;EIN*MEISTER :._: " ·,. : .;".. Nissan WG 82158/184(2) /YM
- 17 -
durch einen Mikrocomputer 200 ersetzt, der, falls erwünscht, auch noch die Funktionen der hier separat vorhandenen Eingangs-Schnittstelleneinheit
6 und Bandpaßfilter 8 übernehmen könnte. Durch in ihm gespeicherte Programme ist der Mikrocomputer 200
in die Lage versetzt, die gleichen Funktionen wie diskrete
Elemente oder Schaltungen auszuführen.
Das Flußdiagramm 4 enthält Programmschritte zur Aktivierung der
Stellglieder 14 in der vorgegebenen Betätigungsfolge. Der Mikrocomputer
bleibt in Bereitschaft, bis in einem ersten Schritt 1 die Betätigung der Taste "Spracherkennung" 3 erkannt worden ist.
Danach geht das Programm zu Schritt 2 über, um einen Vorrichtungsbegriff akustisch entgegenzunehmen. Wenn der ankommende gesprochene
Befehl im nächsten Schritt 3 nach Vergleich mit in der Speichereinheit gespeicherten Musterbefehlen bzw. Musterbegriffen
identifiziert worden ist, erfolgt im nächsten Schritt 4 die Umschaltung des Vergleichsabschnitts 102 auf die Betätigungsbegriff-Speichereinheit
11-2a mit Darstellung der Anweisung "Sprich den Betätigungsbegriff" auf der Anzeigeeinheit 1.0-4. Falls
jetzt der Mikrocomputer 200 durch eine Betätigung des Rücksetzschalters
103 rückgesetzt wird, springt das Programm vom Schritt
5 auf den Programmanfang zurück; andernfalls wird ein in Schritt
6 eingesprochener Betätigungsbegriff, der zu dem im Schritt 3
eingesprochenen Vorrichtungsbegriff paßt, nach Vergleich mit in der Speichereinheit 11-2a gespeicherten Musterbegriffen in
Schritt 7 identifiziert und die angesprochene Vorrichtung in Schritt 8 durch Ansteuerung des betreffenden Stellgliedes 14
verstellt. Wenn danach in Schritt 9 die Betätigung des Rücksetzschalters 103 erkannt ist, wird in Schritt 10 das Stellglied
augenblicklich, angehalten, und das Programm kehrt zu Schritt 5 zurück, um den nächsten Betätigungsbegriff entgegen zunehmen.
Unter Wiederholung der Schritte 5 bis 10 werden alle vorgesehenen
TER MEER -MÜLLER ■ S.l;5LlMlylEISTER ·,„■ — .:., Nissan WG 821 58/1 84 (2)/YM
Betätigungen der angesprochenen Vorrichtungen durchgeführt, bis diese ihre vorgesehene Position eingenommen hat. Nach
Zugang des Schlußbefehls "Halt" von dem Fahrer in Schritt 11, Schritt 12 wird das Stellglied mit Schritt 13 angehalten,
und das Programm springt zu seinem Anfangsschritt 1 zurück.
über die erfindungsgemäße Spracherkennungseinrichtung kann
der Fahrer eine gewünschte justierbare Vorrichtung wie z.B. die Außenspiegel wahlweise einstellen, indem er unter Betätigung
der Taste "Spracherkennung" zuerst den Vorrichtungsbegriff "Spiegel" und dann nacheinander die erforderlichen Betätigungsbegriffe
"rechts horizontal", "rechts vertikal" u.s.w. mit jeweils dazwischenliegender Betätigung der Rücksetztaste
zur Bewegungsunterbrechung in das Mikrofon spricht. Wenn die Spiegel richtig eingestellt sind, wird der Vorgang durch den
Schlußbefehl "Halt" beendet.
Die erfindungsgemäße Spracherkennungseinrichtung bietet dem
Fahrer bzw. Benutzer die vorteilhafte Möglichkeit, eine gewünschte zu justierende Vorrichtung des Fahrzeugs durch mehrere nacheinander
eingesprochene Betätigungsbegriffe genau zu positionieren. Nach jeder Einzelbetätigung wird durch Betätigung
eines die Bewegung beendenden Rücksetzschalters die Bereitschaft für die nächste Betätigungsart hergestellt. Daher ist
es nicht erforderlich, zwischendurch den Vorrichtungsbegriff
zu wiederholen. Dadurch wird die Zuverlässigkeit und Erfolgsquote der Erkennung gesprochener Befehle wesentlich erhöht.
BAD ORIGINAL
-JA-
Leerseite
Claims (1)
1) Aufforderung zur Eingabe eines gesprochenen Schlußbefehls, mit dem alle Stellglieder angehalten werden und das Programm
zum Anfangsschritt (a) zurückkehrt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56167949A JPS5870287A (ja) | 1981-10-22 | 1981-10-22 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3238855A1 true DE3238855A1 (de) | 1983-05-11 |
DE3238855C2 DE3238855C2 (de) | 1985-04-11 |
Family
ID=15859030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE3238855A Expired DE3238855C2 (de) | 1981-10-22 | 1982-10-20 | Spracherkennungseinrichtung |
Country Status (3)
Country | Link |
---|---|
US (1) | US4593403A (de) |
JP (1) | JPS5870287A (de) |
DE (1) | DE3238855C2 (de) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3520118A1 (de) * | 1984-06-13 | 1985-12-19 | N.V. Philips' Gloeilampenfabrieken, Eindhoven | Verfahren zum erkennen eines steuerbefehls in einem system und dialogsystem zur durchfuehrung des verfahrens |
DE3621111A1 (de) * | 1985-08-30 | 1987-03-12 | Jenoptik Jena Gmbh | Optisches entzerrungsgeraet |
EP0293258A1 (de) * | 1987-05-29 | 1988-11-30 | Kabushiki Kaisha Toshiba | Funktelefoneinrichtung |
DE19718007A1 (de) * | 1997-04-29 | 1998-11-05 | Deutsche Telekom Ag | Verfahren und Anordnung zur besseren Auslastung der Leistungsfähigkeit des Spracherkenners eines sprachgesteuerten Kommunikationsendgerätes |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4712243A (en) * | 1983-05-09 | 1987-12-08 | Casio Computer Co., Ltd. | Speech recognition apparatus |
US5025324A (en) * | 1984-09-07 | 1991-06-18 | Hashimoto Corporation | Method of and apparatus for recording information on both a main recording medium and an endless recording medium for repeated event monitoring |
JPH0792673B2 (ja) * | 1984-10-02 | 1995-10-09 | 株式会社東芝 | 認識用辞書学習方法 |
US4912388A (en) * | 1985-08-02 | 1990-03-27 | Canon Kabushiki Kaisha | Drive control device operating a drive mechanism |
US4725956A (en) * | 1985-10-15 | 1988-02-16 | Lockheed Corporation | Voice command air vehicle control system |
US4797924A (en) * | 1985-10-25 | 1989-01-10 | Nartron Corporation | Vehicle voice recognition method and apparatus |
US4757542A (en) * | 1985-12-04 | 1988-07-12 | Nartron Corporation | Speech synthesizer method and apparatus |
US4856072A (en) * | 1986-12-31 | 1989-08-08 | Dana Corporation | Voice actuated vehicle security system |
DE3879028T2 (de) * | 1987-07-16 | 1993-06-24 | Fujitsu Ltd | Spracherkennungseinrichtung. |
US4945570A (en) * | 1987-10-02 | 1990-07-31 | Motorola, Inc. | Method for terminating a telephone call by voice command |
US4870686A (en) * | 1987-10-19 | 1989-09-26 | Motorola, Inc. | Method for entering digit sequences by voice command |
US4862363A (en) * | 1987-12-16 | 1989-08-29 | Dana Corporation | Voice actuated two speed axle |
US5267323A (en) * | 1989-12-29 | 1993-11-30 | Pioneer Electronic Corporation | Voice-operated remote control system |
JP2964518B2 (ja) * | 1990-01-30 | 1999-10-18 | 日本電気株式会社 | 音声制御方式 |
US5249262A (en) * | 1991-05-03 | 1993-09-28 | Intelligent Query Engines | Component intersection data base filter |
DE4222321A1 (de) * | 1992-07-08 | 1994-01-13 | Duerrwaechter E Dr Doduco | Verfahren und Schaltungsanordnung zum Versorgen von Lautsprechern und anderen elektrischen Verbrauchern in Fahrzeugtüren mit Signalen |
US5519809A (en) * | 1992-10-27 | 1996-05-21 | Technology International Incorporated | System and method for displaying geographical information |
US5945985A (en) * | 1992-10-27 | 1999-08-31 | Technology International, Inc. | Information system for interactive access to geographic information |
DE4315210C2 (de) * | 1993-05-07 | 1997-08-21 | Dewert Antriebs Systemtech | Verfahren zur Steuerung der Verstelleinrichtung eines Möbels durch Spracheingabe |
JPH0781498A (ja) * | 1993-09-20 | 1995-03-28 | Mitsubishi Electric Corp | 車両用走行制御装置 |
US5704008A (en) | 1993-12-13 | 1997-12-30 | Lojack Corporation | Method of and apparatus for motor vehicle security assurance employing voice recognition control of vehicle operation |
JP2500761Y2 (ja) * | 1994-03-30 | 1996-06-12 | 株式会社アルファ | 音声認識装置 |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
FR2740085B1 (fr) * | 1995-10-24 | 1997-12-19 | Faure Bertrand Equipements Sa | Procede et systeme de reglage par commande vocale d'un dispositif reglable d'un vehicule automobile |
US5801616A (en) * | 1996-01-04 | 1998-09-01 | George Seelman | Voice actuated vehicle security system with starting system interlock and automatic arming feature |
FR2744277B1 (fr) * | 1996-01-26 | 1998-03-06 | Sextant Avionique | Procede de reconnaissance vocale en ambiance bruitee, et dispositif de mise en oeuvre |
US5832440A (en) * | 1996-06-10 | 1998-11-03 | Dace Technology | Trolling motor with remote-control system having both voice--command and manual modes |
US8648692B2 (en) | 1999-07-23 | 2014-02-11 | Seong Sang Investments Llc | Accessing an automobile with a transponder |
US6952155B2 (en) * | 1999-07-23 | 2005-10-04 | Himmelstein Richard B | Voice-controlled security system with proximity detector |
US6496107B1 (en) | 1999-07-23 | 2002-12-17 | Richard B. Himmelstein | Voice-controlled vehicle control system |
DE19942871B4 (de) * | 1999-09-08 | 2013-11-21 | Volkswagen Ag | Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug |
US6587824B1 (en) * | 2000-05-04 | 2003-07-01 | Visteon Global Technologies, Inc. | Selective speaker adaptation for an in-vehicle speech recognition system |
US6757656B1 (en) * | 2000-06-15 | 2004-06-29 | International Business Machines Corporation | System and method for concurrent presentation of multiple audio information sources |
DE10040466C2 (de) | 2000-08-18 | 2003-04-10 | Bosch Gmbh Robert | Verfahren zur Steuerung einer Spracheingabe und -ausgabe |
KR100406307B1 (ko) * | 2001-08-09 | 2003-11-19 | 삼성전자주식회사 | 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템 |
US6816920B2 (en) * | 2002-03-20 | 2004-11-09 | Hewlett-Packard Development Company, L.P. | Method and system for managing information for a computer system |
US20190362725A1 (en) | 2005-08-17 | 2019-11-28 | Tamiras Per Pte. Ltd., Llc | Providing access with a portable device and voice commands |
US8255123B2 (en) * | 2007-06-27 | 2012-08-28 | GM Global Technology Operations LLC | Apparatus and method for positioning a movable component of a motor actuated device |
EP2045140B1 (de) * | 2007-10-01 | 2010-01-27 | Harman/Becker Automotive Systems GmbH | Sprachgesteuerte Einstellung von Fahrzeugteilen |
JP5171962B2 (ja) * | 2007-10-11 | 2013-03-27 | 本田技研工業株式会社 | 異種データセットからの知識移転を伴うテキスト分類 |
WO2009055819A1 (en) * | 2007-10-26 | 2009-04-30 | Honda Motor Co., Ltd. | Improving free-speech command classification for car navigation system |
US9875583B2 (en) * | 2015-10-19 | 2018-01-23 | Toyota Motor Engineering & Manufacturing North America, Inc. | Vehicle operational data acquisition responsive to vehicle occupant voice inputs |
US9928833B2 (en) | 2016-03-17 | 2018-03-27 | Toyota Motor Engineering & Manufacturing North America, Inc. | Voice interface for a vehicle |
DE102017119365B4 (de) * | 2017-08-24 | 2022-03-03 | Sino Europe Gmbh & Co. Kg | Verfahren zur sprachgesteuerten Betätigung eines motorisch verstellbaren Sitz- und/oder Liegemöbels |
CN109619800B (zh) * | 2018-12-14 | 2022-06-28 | 深圳市丰利源节能科技有限公司 | 一种语音智能化妆镜 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5521035A (en) * | 1978-07-31 | 1980-02-14 | Tokyo Shibaura Electric Co | Control system using voice |
US4181821A (en) * | 1978-10-31 | 1980-01-01 | Bell Telephone Laboratories, Incorporated | Multiple template speech recognition system |
JPS5650396A (en) * | 1979-10-01 | 1981-05-07 | Tokyo Shibaura Electric Co | Sound input device |
US4479197A (en) * | 1980-11-25 | 1984-10-23 | Hewlett-Packard Company | Method and apparatus for selecting and setting the mode of operation for a mechanism |
-
1981
- 1981-10-22 JP JP56167949A patent/JPS5870287A/ja active Granted
-
1982
- 1982-09-29 US US06/428,232 patent/US4593403A/en not_active Expired - Fee Related
- 1982-10-20 DE DE3238855A patent/DE3238855C2/de not_active Expired
Non-Patent Citations (1)
Title |
---|
NICHTS-ERMITTELT * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3520118A1 (de) * | 1984-06-13 | 1985-12-19 | N.V. Philips' Gloeilampenfabrieken, Eindhoven | Verfahren zum erkennen eines steuerbefehls in einem system und dialogsystem zur durchfuehrung des verfahrens |
DE3621111A1 (de) * | 1985-08-30 | 1987-03-12 | Jenoptik Jena Gmbh | Optisches entzerrungsgeraet |
EP0293258A1 (de) * | 1987-05-29 | 1988-11-30 | Kabushiki Kaisha Toshiba | Funktelefoneinrichtung |
DE19718007A1 (de) * | 1997-04-29 | 1998-11-05 | Deutsche Telekom Ag | Verfahren und Anordnung zur besseren Auslastung der Leistungsfähigkeit des Spracherkenners eines sprachgesteuerten Kommunikationsendgerätes |
Also Published As
Publication number | Publication date |
---|---|
JPS5870287A (ja) | 1983-04-26 |
US4593403A (en) | 1986-06-03 |
DE3238855C2 (de) | 1985-04-11 |
JPS6335999B2 (de) | 1988-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3238855A1 (de) | Spracherkennungseinrichtung | |
DE3236724C2 (de) | Durch Sprache steuerbare Betätigungseinrichtung für Kraftfahrzeuge oder dergleichen | |
DE3238853A1 (de) | Sprachsteuerbare betaetigungseinrichtung fuer kraftfahrzeuge | |
EP1256936A2 (de) | Verfahren zum Training oder zur Adaption eines Spracherkenners | |
EP0994461A2 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung | |
WO2009140781A1 (de) | Verfahren zur klassifizierung und entfernung unerwünschter anteile aus einer äusserung bei einer spracherkennung | |
EP2333768A2 (de) | Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und/oder -führung | |
WO2005022511A1 (de) | Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen | |
EP0747880A2 (de) | Spracherkennungssystem | |
EP1041362A2 (de) | Eingabeverfahren in ein Fahrerinformationssystem | |
WO2018069027A1 (de) | Multimodaler dialog in einem kraftfahrzeug | |
WO2017157684A1 (de) | Fortbewegungsmittel, system und verfahren zur anpassung einer länge einer erlaubten sprechpause im rahmen einer spracheingabe | |
DE102016217026A1 (de) | Sprachsteuerung eines Kraftfahrzeugs | |
WO2003054856A1 (de) | Verfahren und vorrichtung zur spracherkennung | |
DE102017206876B4 (de) | Verfahren zum Betreiben eines Sprachsteuerungssystems in einem Kraftfahrzeug undSprachsteuerungssystem | |
WO2001086634A1 (de) | Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems | |
EP1557320B1 (de) | Verfahren und Steuereinrichtung zur Bedienung technischer Einrichtungen eines Fahrzeugs | |
DE19962218A1 (de) | Verfahren und System zum Autorisieren von Sprachbefehlen | |
DE19942869A1 (de) | Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen | |
EP0467157A2 (de) | Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder | |
DE4427444B4 (de) | Einrichtung und Verfahren zur Sprachsteuerung eines Geräts | |
EP0793819B1 (de) | Verfahren zur sprachsteuerung von anlagen und geräten | |
EP3735688B1 (de) | Verfahren, vorrichtung und computerlesbares speichermedium mit instruktionen zum verarbeiten einer spracheingabe, kraftfahrzeug und nutzerendgerät mit einer sprachverarbeitung | |
DE102008024257A1 (de) | Verfahren zur Sprecheridentifikation bei einer Spracherkennung | |
DE19514849A1 (de) | Verfahren zur Fernsteuerung und Vorrichtung dafür |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |