JPH11119792A - 音声認識機能付き機器制御装置および音声認識装置 - Google Patents

音声認識機能付き機器制御装置および音声認識装置

Info

Publication number
JPH11119792A
JPH11119792A JP9286358A JP28635897A JPH11119792A JP H11119792 A JPH11119792 A JP H11119792A JP 9286358 A JP9286358 A JP 9286358A JP 28635897 A JP28635897 A JP 28635897A JP H11119792 A JPH11119792 A JP H11119792A
Authority
JP
Japan
Prior art keywords
command
voice
similar
recognition
similar type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9286358A
Other languages
English (en)
Inventor
Ryuji Yamaguchi
竜司 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP9286358A priority Critical patent/JPH11119792A/ja
Publication of JPH11119792A publication Critical patent/JPH11119792A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識機能付きの機器制御装置であって、
他のコマンドと類似しているために誤認識されやすい類
似タイプコマンドが入力されたときに好適な対応ができ
る装置を提供する。 【解決手段】 ユーザの発声した音声コマンドは、音声
認識部18で認識される。類似タイプコマンドが認識さ
れたとき、ボディECU30により、現在の走行条件を
基に、コマンド実行の許可または禁止が決定される。禁
止の場合、言換コマンドを使った再発声を促すトークバ
ックが行われる。許可の場合、次の機会から言換コマン
ドを使うことを促すトークバックが行われる。言換コマ
ンドの使用を図ることで誤認識発生が減る。また、走行
条件が許す範囲でなるべく類似タイプコマンドを実行で
きる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザの発声した
音声コマンドを認識する機能を有する機器制御装置に関
し、特に、他の音声コマンドと類似した類似タイプコマ
ンドの入力に対して好適な制御ができる装置に関する。
また、本発明は、上記機器制御装置に適した音声認識装
置に関する。
【0002】
【従来の技術】以下、本発明の背景技術を、自動車の電
装機器を例に取り上げて説明する。従来、自動車の車室
内には、パワーウィンドウやヘッドライト等の電装機器
に接続された操作スイッチが設置されており、ユーザ
は、操作スイッチを使って電装機器を操作していた。し
かし、ユーザが運転に対してより集中できるように、電
装機器の操作をできるだけ容易にすることが望まれる。
このような要求に応えるためには、音声認識装置を設け
ることが効果的と考えられる。音声コマンドの発声によ
る機器操作が可能となり、操作性の向上が図られる。
【0003】音声認識装置は、人が発声した音声を認識
する装置であり、各種の電子機器等の入力装置として音
声認識装置を利用することが提案されている。ユーザが
発声した音声はデジタルデータに変換される。「音声」
は、文、単語、文字、記号、数字などである。一例で
は、デジタル音声データに対してケプストラム(cepust
rum)を使うデータ処理が行われ、ユーザが何を言った
のかが認識される。音声認識装置については、例えば、
「音響・音声工学」(古井貞煕、近代科学社、174頁
〜)にて説明されている。
【0004】現状では、100%の確率で正しく音声を
認識することは難しいので、トークバック機能を備える
ことが周知である。音声認識装置には音声合成装置が設
けられる。音声が認識されると、認識結果を示す合成音
声が生成され、出力される。ユーザは、認識結果を知
り、認識結果が正しいか否かを判断する。そして、認識
結果が誤っているときには、再度、ユーザは音声を発声
して認識装置へ入力する。このようなトークバック機能
により、正しい認識結果が確実に得られる。トークバッ
ク機能を備えた音声認識装置は、例えば、特開昭63−
38996号公報や特開平1−177192号公報に記
載されている。
【0005】
【発明が解決しようとする課題】音声コマンドの中に
は、音声認識技術の観点から、他のコマンドと類似した
コマンドがある。この種のコマンドを、以下、「類似タ
イプコマンド」という。例として車両のパワーウィンド
ウの開閉動作のための音声コマンドを考えると、「上げ
る」と「下げる」は類似している。そのため、音声「上
げる」が発声されたとき、音声認識装置は「下げる」を
第1候補としてしまうことがある。このように、ユーザ
が類似タイプコマンドを発声したときは、そのコマンド
が誤って認識される可能性が高い。誤認識の可能性が高
いコマンドに起因する不用意な機器動作は、できるだけ
避ける必要がある。そのためには、例えば「類似タイプ
コマンド」が使われないように図り、誤認識が起こりに
くくすることが望まれる。
【0006】類似タイプコマンドは、本来は認識対象の
コマンドとしては適当ではない。そこで、認識対象の正
規のコマンドとしては、他の音声コマンドと類似してい
ないコマンドが設定されることが好ましい。しかし、ユ
ーザは、常にマニュアルなどを参照して正規コマンドを
使ってくれるとは限らない。また、ある自動車のユーザ
が、自分の車両で普段使っているコマンドを他人の車両
で使用したために、正規コマンドが使用されないことも
ある。このような場合に正規コマンドではないコマンド
が発声されたとき、そのコマンドが全く受け付けられず
無視されると、ユーザにとっての音声認識機能の便利さ
が減じてしまう。正規コマンドではないがユーザに使わ
れる可能性のある類似タイプコマンドも、できるだけ広
く受け入れられることが望まれる。
【0007】なお、ここでは、自動車の電装機器に着目
して音声認識技術の利用について説明した。しかし、こ
のような問題は、自動車の場合に限られず、音声認識技
術を利用する任意の装置において発生し得る。
【0008】本発明は上記課題に鑑みてなされたもので
あり、その目的は、類似タイプコマンドの入力に対する
好適な対応が可能な音声認識機能付き機器制御装置を提
供することにある。
【0009】
【課題を解決するための手段】本発明の音声認識機能付
き機器制御装置は、ユーザの発声した音声コマンドを認
識し、認識した音声コマンドに従って対象機器を制御す
る。本制御装置は、他の音声コマンドと類似しているた
めに誤認識される可能性の高い類似タイプコマンドを記
憶する類似コマンド記憶手段を有し、前記類似タイプコ
マンドが認識されたときに、誤認識に基づく不適当な機
器動作を回避するための対策処理を行う。本発明によれ
ば、誤認識しやすい類似タイプコマンドが類似コマンド
記憶手段に記憶されている。従って、認識された音声コ
マンドが類似タイプコマンドであることが分かるので、
類似タイプコマンドの入力時の不適当な機器動作を回避
するための対策処理を施すことができる。
【0010】好ましくは、本発明の一態様の機器制御装
置は、音声コマンドの認識結果をユーザに知らせるトー
クバックのための音声合成を行う音声合成手段と、前記
類似タイプコマンドと同じ機器動作を指示する音声コマ
ンドであって他のコマンドと類似していない音声コマン
ドを、言換コマンドとして記憶する言換コマンド記憶手
段と、を有し、前記対策処理として、前記類似タイプコ
マンドの代わりに言換コマンドを使うことを促すトーク
バックを行う。
【0011】この態様によれば、類似タイプコマンドが
認識されたときに、そのコマンドに対応する言換コマン
ドを使うことを促すトークバックが行われる。言換コマ
ンドは、他の音声コマンドと似ていないので、誤認識さ
れにくい。このトークバックを聞いたユーザは、以降、
言換コマンドを使って音声入力を行う。このように、類
似タイプコマンドの入力に対応した適切なトークバック
により、類似タイプコマンドができるだけ使用されない
ように図ることができる。その結果、誤認識の発生が低
減し、従って、誤認識に伴う不用意な機器動作も回避で
きる。
【0012】また好ましくは、本発明の別の一態様の制
御装置は、前記対象機器のおかれている環境条件を検出
する環境条件検出手段を有し、前記対策処理として、検
出された環境条件に応じて、認識された類似タイプコマ
ンドに従った機器制御の実行が禁止または許可される。
環境条件は、例えば、自動車における走行条件(走行に
関連する各種の条件)である。
【0013】この態様によれば、ある類似タイプコマン
ドが認識されたとき、ある環境条件下ではそのコマンド
に従った機器動作が禁止される。しかし、同じコマンド
が認識されたときでも、他のある環境条件下では安全性
などを考慮した上で機器動作が許可され、これによりユ
ーザの再入力の手間を少なくできる。従って、本態様に
よれば、検出された環境条件下での不適当な機器動作を
確実に防止した上で、環境条件が許す範囲で類似タイプ
コマンドを実行することをもって、より円滑な機器操作
とより早めの機器動作を可能にすることができる。
【0014】さらに好ましくは、この態様の機器制御装
置は、トークバックのための前述の音声合成手段と、言
換コマンドを記憶する前述の言換コマンド記憶手段とを
有する。そして、機器制御の実行が禁止されたときに
は、前記言換コマンドを使った再発声を促すトークバッ
クが行われ、一方、機器制御の実行が許可されたときに
は、次の機会から前記言換コマンドを使うことを促すト
ークバックが行われる。これにより、環境条件に応じた
機器制御を行いつつ、今後に類似タイプコマンドが使用
されなくなるように図ることができる。
【0015】また、本発明の音声認識装置は、ユーザの
発声した音声コマンドを認識する装置であって、他の音
声コマンドと類似しているために誤認識される可能性の
高い類似タイプコマンドを記憶する類似コマンド記憶手
段と、前記類似タイプコマンドと同じ機器動作を指示す
る音声コマンドであって他のコマンドと類似していない
音声コマンドを、言換コマンドとして記憶する言換コマ
ンド記憶手段と、音声コマンドの認識結果をユーザに知
らせるトークバックのための音声合成を行う音声合成手
段と、を有し、前記類似タイプコマンドが認識されたと
きに、前記類似タイプコマンドの代わりに言換コマンド
を使うことを促すトークバックを行う。
【0016】
【発明の実施の形態】以下、本発明の好適な実施の形態
(以下、実施形態という)について、図面を参照し説明
する。図1は、本発明が適用された、自動車の電装機器
の制御装置を示すブロック図である。ボディECU30
は、制御対象たる電装機器に制御信号を送ることによ
り、それらの対象機器を制御する。ここでは、一例とし
て、パワーウィンドウの開閉およびヘッドライトのオン
オフが制御される。本発明の音声認識装置10は、ボデ
ィECU30と接続されており、ボディECU30の入
力装置として機能する。
【0017】音声認識装置10には信号処理制御部12
が設けられている。信号処理制御部12はCPUを有
し、装置10全体を制御している。信号処理制御部12
には音響処理部14が接続され、音響処理部14にはマ
イク16が接続されている。ユーザが発声した音声コマ
ンドは、マイク16にてアナログ電気信号に変換され、
音響処理部14に入力される。音響処理部14では、音
声データがデジタル信号に変換される。さらに、音響処
理部14では、音声認識に必要なデータ処理が施され
る。例えば、窓関数処理やフーリエ変換処理が行われ、
音声データのケプストラムが求められる。処理後の音声
データは信号処理制御部12へ出力される。
【0018】信号処理制御部12にはトリガースイッチ
26が接続されている。トリガースイッチ26はユーザ
により操作される。信号処理制御部12は、トリガース
イッチ26が押されると、その後に発声された音声のデ
ータを、マイク16から音響処理部14を経由して取り
込む。
【0019】変形例として、トリガースイッチ26の代
わりに、いわゆるプレス・トークスイッチが設けられて
もよい。プレス・トークスイッチを押し続けている間に
発声された音声が、マイク16から信号処理制御部12
に取り込まれる。また、別の変形例として、音声認識装
置10が、常時認識タイプの装置であってもよい。トリ
ガースイッチやプレス・トークスイッチの操作がなくと
も、ユーザによる発声の有無が監視され、検出される。
【0020】また、信号処理制御部12には音声認識部
18が接続されている。信号処理制御部12は、音響処
理部14から取り込んだ音声データを音声認識部18に
送る。音声認識部18はいわゆるDSPやマイコンであ
り、ユーザの発声した音声データを解析する。認識用辞
書記憶部19には、認識対象の音声コマンドに対応する
標準音声データが記憶されている。音声認識部18は、
ユーザの音声データと標準音声データとを比較して、比
較結果に基づいてユーザの音声コマンドを認識する。
【0021】認識処理においては、ユーザの音声データ
を、記憶部19内に用意された複数の標準音声データの
それぞれと比較することによって、認識得点がつけられ
る。認識得点が高いほど、比較対象の両データの類似度
が高い。最も高い認識得点を与える標準音声データに対
応するコマンドが、ユーザの発声した音声コマンドであ
ると仮決定される。認識得点は、例えば、ユーザの音声
データと標準音声データの距離に基づいて算出される。
この距離は、音声データを表す行列式から算出される。
距離が近いほど、認識得点が高く、比較されている両デ
ータが類似している。また例えば、認識得点は、確率手
法を用いて尤度に基づいて算出される。尤度を決定する
ためにヒドンマルコフモデルを用いることが周知であ
る。尤度が高いほど、認識得点が高い。
【0022】本実施形態では、下記のように、制御対象
の機器の複数の動作のそれぞれに対応する音声コマンド
について、各音声コマンドの標準音声データが認識用辞
書記憶部19に記憶されている; 「運転席の窓を閉める」 「運転席の窓を開ける」 「ヘッドライトを点ける」 「ヘッドライトを消す」 これらの音声コマンドは、正規コマンドである。正規コ
マンドは、他のコマンドと類似していないので(類似度
が低い)、他のコマンドと誤認識される可能性は低い。
2つのコマンドの類似度は、上記の距離や尤度を用いて
定量的に評価可能である。例えばコマンド間の距離を考
えると、図2上段に示されるように、「閉める」と「開
ける」の距離は離れている。ユーザが「閉める」と言っ
たとき、ユーザの音声データは「閉める」に近く、「開
ける」から遠い。従って、「閉める」の認識得点が「開
ける」よりも大幅に高くなるので、音声コマンドが高い
確率で正しく認識される。
【0023】さらに、本実施形態では、下記の音声コマ
ンドの標準音声データが認識用辞書記憶部19に記憶さ
れている; 「運転席の窓を上げる」 「運転席の窓を下げる」 「ヘッドライトオン」 「ヘッドライトオフ」 これらの音声コマンドも制御対象の機器の複数の動作に
それぞれ対応しているが、これらの音声コマンドは、イ
レギュラーコマンドである。イレギュラーコマンドは、
他のコマンドと類似しているために、誤認識される可能
性が高い。図2の下段に示されるように、標準音声デー
タの「上げる」と「下げる」の距離は近い。ユーザが
「上げる」と言ったとき、ユーザの音声データは、標準
音声データの「上げる」および「下げる」から同じよう
な距離にある。従って、両者の認識得点も近くなるの
で、誤認識の発生する確率が高い。すなわち、ユーザが
「上げる」と言ったときでも、認識結果が「下げる」に
なり得る。
【0024】上記のようなイレギュラーコマンドは、誤
認識の原因となりうるので、本来は使われないことが好
ましい。そこで、正規コマンドを使うことがマニュアル
にてユーザに推奨されている。しかし、ユーザがマニュ
アルを見ずに音声認識機能を使おうとすることがある。
また、普段は他の車種の自動車を使っているユーザが、
本実施形態の適用された自動車を使うこともある。この
ような場合にユーザが正規コマンド以外のコマンドを使
うことを想定すると、正規でないコマンドを全く受け付
けないようにすることは好ましくない。そこで、正規以
外のコマンドもできるだけ許容するため、上記の如く、
イレギュラーコマンドも認識するように構成されてい
る。
【0025】上記のイレギュラーコマンドは、他のコマ
ンドと似ているために(類似度が高い)誤認識の原因に
なる可能性が高く、本発明の類似タイプコマンドに相当
する。一方、正規コマンドは、他のコマンドと類似して
いないので、誤認識の原因になる可能性が低い。正規コ
マンドは、上記のイレギュラーコマンドと対比すると、
非類似タイプコマンドであるといえる。
【0026】また、上記の正規コマンド「運転席の窓を
閉める」は、イレギュラーコマンド「運転席の窓を上げ
る」と同一の機器動作を指示するためのコマンドであ
る。従って、「運転席の窓を上げる」を本発明の類似タ
イプコマンドとしたときに、「運転席の窓を閉める」
は、本発明の言換コマンドに相当する。言換コマンド
は、類似タイプコマンドと同じ機器動作を指示する音声
コマンドであって他のコマンドと類似していない音声コ
マンドである。他の3組のコマンド「運転席の窓を開け
る」と「運転席の窓を下げる」、「ヘッドライトを点け
る」と「ヘッドライトオン」、「ヘッドライトを消す」
と「ヘッドライトオフ」に関しても同様である。また、
上記より明らかなように、認識用辞書記憶部19は、本
発明の類似コマンド記憶手段および言換コマンド記憶手
段に相当する。
【0027】図1に戻り、音声認識部18の認識結果
は、信号処理制御部12へ送られる。これにより、信号
処理制御部12は、ユーザが何をいったのかが分かる。
なお、上記の音響処理部14および音声認識部18で
は、周知の原理に従った音声認識処理が行われればよ
い。上記の例と異なる音声認識手法が適用されてもよ
く、本実施形態には任意の音声認識手法が適用可能であ
る。
【0028】さらに、信号処理制御部12には音声合成
部20が接続されている。信号処理制御部12の指示に
従い、音声合成部20は、いろいろなメッセージの合成
音声を生成する。音声合成部20での音声合成処理に
は、メッセージ記憶部21に記憶されたメッセージデー
タが用いられる。生成された合成音声はスピーカ22か
ら出力され、ユーザに伝えられる。
【0029】音声合成部20は、例えば、ユーザに音声
の発声を要求する合成音声を生成する。また、音声合成
部20は、トークバック用の合成音声を生成する。トー
クバック音声においては、音声認識部18により認識さ
れた音声コマンドの内容が反復される。トークバック音
声の出力により、装置内での認識結果がユーザに提示さ
れる。
【0030】また、信号処理制御部12は、通信制御部
24を用いてボディECU30との間で、車内LANを
使ったデータ通信を行う。本実施形態では、上記のトー
クバックの前に、音声認識結果は一旦ボディECU30
へ送られる。そして、ボディECU30からの指示に従
って、トークバックのメッセージ作成が行われる。
【0031】次に、ボディECU30について説明す
る。ボディECU30には、CPUを有する機器制御部
32が設けられている。機器制御部32は、通信制御部
34を使って上記の音声認識装置10との間でデータ通
信を行う。また、機器制御部32は、パワーウィンドウ
モータ38およびヘッドライトスイッチ40に制御信号
を送ることにより、制御対象の電装機器であるパワーウ
ィンドウおよびヘッドライトの動作を制御する。制御信
号に従ったモータの回転により窓が開閉し、また、スイ
ッチのオンオフによりヘッドライトが点灯および消灯す
る。
【0032】また、ボディECU30には、スピードメ
ータ42が接続されており、スピードメータ42は車両
速度(車速)をボディECU30に送る。車速から、車
両が走行中であるか、停車中であるかが分かる。所定速
度以下の低車速走行状態は、停車状態に含められてもよ
い。「走行」「停車」といった走行条件は、本発明の環
境条件に相当する。環境条件は、前述のように、音声認
識結果を用いた制御対象機器のおかれている環境に関す
るものである。
【0033】さらに、ボディECU30は、時計を内蔵
しており、時刻に基づいて現在が夜間であるか否かを判
断する。夜間か否かの判断のために、照度センサが設け
られてもよい。「夜間」も走行条件の一つであって、本
発明の環境条件に相当する。
【0034】また、機器制御部32に接続された記憶部
36は、図3に示される可否コードテーブル、および図
4に示されるコマンドテーブルを記憶している。可否コ
ードテーブルでは、操作可否コード(000〜111)
ごとに、機器動作の実行が許可される走行条件と、禁止
される走行条件が示される。○印は許可を、×印は禁止
を示す。例えば、コード000は、停車中も走行中も夜
間も、機器動作が禁止されることを示す。コード010
は、停車中および夜間は機器動作が禁止されるが、走行
中は機器動作が許可されることを示す。コード111
は、停車中、走行中、夜間ともに機器動作が許可される
ことを示す。
【0035】また、図4のコマンドテーブルには、各音
声コマンドと上記の操作可否コードが対応づけられてい
る。なお、図4では、参考として、各コマンドに付けら
れた操作可否コードに対応する走行条件(図3と同じ)
も示されている。
【0036】機器制御部32は、前述のように、現在の
走行条件を把握している。機器制御部32は、走行条件
と2つのテーブルを参照し、ある音声コマンドが入力さ
れたときに、現在の走行条件下ではそのコマンドに対応
する機器動作を許可すべきか、禁止すべきかを判断す
る。例えば、停車中に「運転席の窓を下げる」が、音声
認識装置10から送られてきたとする。このコマンドに
付けられた操作可否コード010によれば、図3に示さ
れるように、停車中のコマンド実行は禁止されるべきで
ある。
【0037】図4のコマンドテーブルは、安全性がより
確実に保たれるようにとの観点に立って作成されてい
る。例えば、「運転席の窓を上げる」が認識されたとす
る。このコマンドはイレギュラーコマンドなので、認識
が誤っている可能性がある(実はユーザが「運転席の窓
を下げる」と言ったかもしれない)。誤った認識に従っ
て窓を閉めることは停車中も走行中も好ましくない。そ
こで、これらの条件下での動作を禁止するべく、「運転
席の窓を上げる」に対しては図示のように操作可否コー
ド001が設定されている。逆に、誤認識により「運転
席の窓を下げる」が認識されたとき、停車中であれば窓
を下げてしまってもよいと考えられる。そこで、停車中
の機器動作は許可されるように、「運転席の窓を下げ
る」に対しては操作可否コード101が付けられてい
る。また、例えば、ヘッドライトに関しては、誤認識に
従って夜間にヘッドライトが消灯されるのは好ましくな
い。そこで、イレギュラーコマンド「ヘッドライトオ
フ」に対して、夜間の機器動作の実行が禁止されるよう
に、操作可否コード110が付けられている。
【0038】上記のようなイレギュラーコマンドに対す
る操作可否コードの設定とは対照的に、正規コマンドに
対しては、いずれも操作可否コード111が付けられて
いる。従って、図中の3つの走行条件に関する限り、ど
のような走行条件下でも、認識されたコマンドに対応す
る機器動作が許可される。正規コマンドは誤認識される
可能性が低いので、誤認識発生を考慮して機器動作を禁
止するためコード設定が不要だからである。
【0039】なお、上記のように、本実施形態では、環
境条件に基づいてコマンド実行が許可されるものの、許
可判断後直ちに機器動作が実行される訳ではない。後述
するように、ユーザに対して適切なトークバックを行
い、ユーザの承認を取った上で、機器動作が実現され
る。これにより、誤認識の最終的な防止が図られる。こ
の点は、正規コマンドに関しても、イレギュラーコマン
ドに関しても同様である。
【0040】次に、図5のフローチャートを参照し、本
実施形態の機器制御装置の動作を説明する。ユーザは、
パワーウィンドウやヘッドライトを操作するために、ト
リガースイッチ26を押した後に、音声コマンドを発声
する(S10)。ユーザが正規コマンドを使うことが好
ましいが、イレギュラーコマンドを使うこともありう
る。音声コマンドはマイク16へ入力され、入力された
音声コマンドが認識される(S12)。ここでは、音声
データの入力信号が音響処理部14でのデータ処理を経
て信号処理制御部12に取り込まれる。音声データは、
信号処理制御部12から音声認識部18へ送られる。音
声認識部18では、ユーザの音声データと、認識用辞書
記憶部19に記憶された標準音声データとが比較され、
認識得点が付けられる。最も高い認識得点を与える標準
音声データに対応する音声コマンドが、ユーザにより入
力されたコマンドであると、仮決定される。
【0041】信号処理制御部12は、仮決定された音声
コマンドに対応する認識得点が所定の判断基準値以上で
あるか否かを判定する(S14)。この判断により、ユ
ーザの発声した音声コマンドが、処理対象のコマンドの
一つであるか否か(認識用辞書記憶部19に記憶されて
いるコマンドの一つであるか否か)が分かる。機器操作
と関係ない音声が発声されたような場合には、高い認識
得点が得られない。このような場合には、信号処理制御
部12は、音声合成部20に対して、再発声要求のメッ
セージの作成を指示する。作成されたメッセージは、ス
ピーカ22から出力される。さらに、スピーカ22は、
信号処理制御部12の指示に従い、ビープ音を出力し
(S16)、S10に戻る。ビープ音を聞いたユーザ
は、メッセージに従い、コマンドを再発声する。なお、
好ましくは、再発声要求メッセージとしては、正しいコ
マンドを使うことを促す案内を含むものが使われる。
【0042】S14がYESのときは、信号処理制御部
12は、通信制御部24を使って、認識された音声コマ
ンドをボディECU30へ送る。音声コマンドは、通信
制御部34に受信され、機器制御部32へ送られる。機
器制御部32は、まず、ボディECU30に記憶された
コマンドテーブル(図4)を参照し、音声コマンドが正
規コマンドであるか否かを判定する(S18)。正規コ
マンドには、図4に示されるように、操作可否コード1
11が付けられている。従って、図3の3つの走行条件
に関しては、常に機器動作の実行が許可される。S18
がYESの場合には、機器制御部32は、音声認識装置
10の信号処理制御部12に対し、ノーマルトークバッ
クを行うことを指示する(S20)。
【0043】ノーマルトークバックでは、「『運転席の
窓を開ける』を認識しました」というように、認識結果
が伝えられる。このメッセージが、音声合成部20によ
り生成され、スピーカ22から出力される。トークバッ
ク後、ユーザが所定待ち時間内にトリガースイッチ26
を押し下げたか否かが判断される(S22)。ユーザ
は、トークバックメッセージに示される認識結果が誤っ
ていると考えたときにトリガースイッチを押す。この場
合、信号処理制御部12の指示に従い、音声合成部20
により再発声要求のメッセージが生成され、スピーカ2
2から出力される。さらに、ビープ音が出力され(S2
4)、S10に戻る。
【0044】S22にて、トークバックから所定待ち時
間が経過してもトリガースイッチが押されなければ、そ
の旨が信号処理制御部12から機器制御部32へ伝えら
れる。機器制御部32は、S12で認識された音声コマ
ンドを実行する(S26)。音声コマンドが「運転席の
窓を開ける」であれば、パワーウィンドウモータ38に
対してモータ動作を指示する制御信号を出力する。
【0045】次に、S18にて、「入力された音声コマ
ンドは正規コマンドでない」と機器制御部32が判断し
たときの動作を説明する。この場合、入力された音声コ
マンドはイレギュラーコマンド(すなわち本発明の類似
タイプコマンド)である。前述のS12では、最も高い
認識得点を与える音声コマンドが選出される。イレギュ
ラーコマンドが使われると、複数の標準音声データにつ
いての認識得点が接近する。そのため、ユーザの発声し
ていないコマンドについての認識得点が最高になること
がある。このように誤認識の可能性が高いことを考慮し
て、下記のような処理が行われる。
【0046】S30にて、図4のコマンドテーブルが参
照され、認識されたイレギュラーコマンドに対応する操
作可否コードが読み出される。また、現在の走行条件の
検出結果が参照される。そして、操作可否コードと走行
条件から、イレギュラーコマンドに対応する機器動作を
許可すべきか否かが判定される(S32)。例えば、イ
レギュラーコマンド「運転席の窓を下げる」が入力され
たとする。このコマンドの操作可否コードは101であ
る。図3のテーブルに示されるように、現在停車中であ
れば機器動作が許可されるが、走行中であれば機器動作
が禁止される。同様に、「ヘッドライトオフ」の操作可
否コードは110である。従って、現在夜間であれば機
器動作が禁止され、夜間でなければ機器動作が許可され
る。
【0047】S32で機器動作が禁止された場合、禁止
判断対応のイレギュラートークバックが行われる(S3
4)。ここでは、機器制御部32から信号処理制御部1
2へ「機器動作の禁止」が伝えられる。信号処理制御部
12は、音声合成部20に対し、下記のイレギュラート
ークバック用のメッセージの作成を命ずる。
【0048】「『運転席の窓を下げる』を認識しまし
た。『下げる』と『上げる』の音が似ているため誤認識
の可能性があります。『運転席の窓を開ける』と言い直
して下さい。」 このメッセージが、スピーカ22から出力され、さらに
ビープ音が出力されて(S34)、S10に戻る。メッ
セージを聞いたユーザは、「運転席の窓を閉める」と言
い直す。
【0049】上記のメッセージは、通常のトークバック
に加え、正規コマンドを使った再発声を要求している。
再発声がなければ機器動作は実行されない。また、正規
コマンドは、本発明の言換コマンドとして用いられてい
る。このように、S32の判断がNO(禁止)の場合に
は、イレギュラーコマンドに従った機器動作は実行され
ず、言換コマンドを使用した再発声が促される。なお、
上記のイレギュラートークバック用のメッセージの『・
・・』の部分は、他の3つのイレギュラーメッセージが
認識されたときは、それらのメッセージの該当部分に置
き換えられる。下記の許可判断対応のメッセージについ
ても同様である。
【0050】一方、S32で機器動作が許可された場
合、許可判断対応のトークバックが行われる(S3
6)。ここでは、機器制御部32から信号処理制御部1
2へ「機器動作の許可」が伝えられる。信号処理制御部
12は、音声合成部20に対し、下記のイレギュラート
ークバック用のメッセージの作成を命ずる。
【0051】「『運転席の窓を下げる』を認識しまし
た。『下げる』と『上げる』の音が似ているため誤認識
の可能性があります。次回からは『運転席の窓を開け
る』と言って下さい。」 許可判断対応のメッセージは、禁止判断対応のメッセー
ジと異なり、今回の再発声を要求していない。機器動作
の実行が許可されているので、今回は言い直しを要求し
なくてもよいからである。代わりに、次の機会からの正
規コマンド(言換コマンド)の使用を促す内容が含まれ
る。
【0052】上記のメッセージがスピーカ22から出力
され(S36)、ユーザが所定待ち時間内にトリガース
イッチ26を押し下げたか否かが判断される(S3
8)。ノーマルトークバックに関する処理と同様に、ト
リガースイッチ26が押されれば、再発生要求メッセー
ジとビープ音が出力される(S40)。トリガースイッ
チ26が押されなければ、その旨が信号処理制御部12
から機器制御部32へ伝えられる。機器制御部32は、
S12で認識された音声コマンドを実行する。例えば音
声コマンドが「運転席の窓を下げる」であれば、パワー
ウィンドウモータ38に対してモータ動作を指示する制
御信号を出力する(S42)。
【0053】以上、本発明の好適な実施形態を説明し
た。本実施形態によれば、本発明の類似タイプコマンド
に相当するイレギュラーコマンドが入力されたときに、
そのときの走行条件に基づいて、安全性を考慮した上で
機器動作が許可あるいは禁止(規制)される。常に機器
動作を禁止するのではなく、好ましくない機器動作が禁
止され、走行条件が許す範囲で機器動作が許可される。
禁止の場合は、ユーザに正規コマンドを使った再発声が
求められる。許可の場合は、ユーザは再発声を行わなく
ともよく、トークバック後に機器動作が実現される。こ
のように、不適当な機器動作を確実に防止した上で、問
題ない範囲でイレギュラーコマンドを実行し、より円滑
な機器操作およびより早めの機器動作を可能にすること
ができる。
【0054】また、本実施形態では、イレギュラーコマ
ンドが認識されたときは、ユーザへのトークバック時
に、本発明の言換コマンドとしての正規コマンドの使用
を促すメッセージが出力される。イレギュラーコマンド
の実行が許可された場合も、禁止された場合も、正規コ
マンドの使用が促される(ただし、許可の場合は、次の
機会からの使用が促される)。従って、誤認識されやす
いイレギュラーコマンドが使われないように図ることが
でき、誤認識の発生を減らして、不用意な機器動作を極
力防止できる。
【0055】(1)本実施形態の変形例を説明する。本
実施形態では、一つの機器動作に関して、一つの正規コ
マンドおよびイレギュラーコマンドが例示されている。
しかし、正規コマンド、イレギュラーコマンドともに複
数であってもよい。他の正規コマンドとしては、例えば
「運転席の窓をアップ」「運転席の窓をダウン」が考え
られる。また、コマンドの内容の判定が可能な範囲で、
コマンドが変形されてもよい。例えば、単に、「開け
る」「閉める」「アップ」「ダウン」でもよい。また、
コマンドの形式は任意であり、文、単語、文字、記号、
数字などのいずれでもよい。
【0056】(2)また、本実施形態では、正規コマン
ドが認識されたとき、トークバック前に、一旦、音声認
識装置10からボディECU30へ正規コマンドが送ら
れる。変形例では、この処理は省略されてもよい。例え
ば、音声合成部20の認識した音声コマンドが正規コマ
ンドであるか否かを信号処理制御部12が判断する。正
規コマンドである場合、信号処理制御部12は、音声合
成部20に対し、ノーマルトークバック用のメッセージ
生成を指示する。イレギュラーコマンドが認識されたと
きは、図5を使って説明したように、コマンドがボディ
ECU30へ送られる。
【0057】(3)さらにまた、本実施形態では、ボデ
ィECU30にて、機器動作の許可/禁止の判断などの
処理を行った。一方、この変形例では、これらの処理
は、すべて、音声認識装置10にて行われる。すなわ
ち、図5内での機器動作以外のすべてのステップが、音
声認識装置10にて行われる。そして、S22やS38
でトークバックに対するユーザの応答がなかったとき
に、認識結果のコマンドが、ボディECU30へ送られ
る。なお、この処理のために、図3の操作可否コードテ
ーブルや図4のコマンドテーブルが音声認識装置10に
備えられる。
【0058】(4)本実施形態では、トークバックによ
り、言換コマンドとしての正規コマンドがユーザに伝え
られた。これに対し、言換コマンドは、他の手法を用い
てユーザに伝えられてもよい。例えば、言換コマンドを
ディスプレイ等を用いて表示することも好適である。
【0059】(5)本実施形態では、自動車の電装機器
の制御装置に本発明が適用された。その他の機器の制御
装置に本発明が適用されてもよいことはもちろんであ
る。また、本発明の適用範囲は、自動車に限られないこ
とももちろんである。
【図面の簡単な説明】
【図1】 本発明の実施形態の全体構成を示すブロック
図である。
【図2】 正規コマンドとイレギュラーコマンドの類似
度を示す図である。
【図3】 操作可否コードテーブルごとに、機器動作が
許可される走行条件および禁止される走行条件を示す可
否コードテーブルを示す図である。
【図4】 各操作コマンドと操作可否コードを対応づけ
るコマンドテーブルを示す図である。
【図5】 図1の装置の動作を示すフローチャートであ
る。
【符号の説明】
10 音声認識装置、12 信号処理制御部、14 音
響処理部、16 マイク、18 音声認識部、19 認
識用辞書記憶部、20 音声合成部、21 メッセージ
記憶部、22 スピーカ、30 ボディECU、32
機器制御部、36 記憶部、38 パワーウィンドウモ
ータ、40 ヘッドライトスイッチ、42 スピードメ
ータ。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 ユーザの発声した音声コマンドを認識
    し、認識した音声コマンドに従って対象機器を制御する
    音声認識機能付き機器制御装置であって、 他の音声コマンドと類似しているために誤認識される可
    能性の高い類似タイプコマンドを記憶する類似コマンド
    記憶手段を有し、 前記類似タイプコマンドが認識されたときに、誤認識に
    基づく不適当な機器動作を回避するための対策処理を行
    うことを特徴とする音声認識機能付き機器制御装置。
  2. 【請求項2】 請求項1に記載の装置において、 音声コマンドの認識結果をユーザに知らせるトークバッ
    クのための音声合成を行う音声合成手段と、 前記類似タイプコマンドと同じ機器動作を指示する音声
    コマンドであって他のコマンドと類似していない音声コ
    マンドを、言換コマンドとして記憶する言換コマンド記
    憶手段と、 を有し、前記対策処理として、前記類似タイプコマンド
    の代わりに言換コマンドを使うことを促すトークバック
    を行うことを特徴とする音声認識機能付き機器制御装
    置。
  3. 【請求項3】 請求項1に記載の装置において、 前記対象機器のおかれている環境条件を検出する環境条
    件検出手段を有し、 前記対策処理として、検出された環境条件に応じて、認
    識された類似タイプコマンドに従った機器制御の実行が
    禁止または許可されることを特徴とする音声認識機能付
    き機器制御装置。
  4. 【請求項4】 請求項3に記載の装置において、 音声コマンドの認識結果をユーザに知らせるトークバッ
    クのための音声合成を行う音声合成手段と、 前記類似タイプコマンドと同じ機器動作を指示する音声
    コマンドであって他のコマンドと類似していない音声コ
    マンドを、言換コマンドとして記憶する言換コマンド記
    憶手段と、 を有し、 機器制御の実行が禁止されたときには、前記言換コマン
    ドを使った再発声を促すトークバックを行い、 機器制御の実行が許可されたときには、次の機会から前
    記言換コマンドを使うことを促すトークバックを行うこ
    とを特徴とする音声認識機能付き機器制御装置。
  5. 【請求項5】 ユーザの発声した音声コマンドを認識す
    る音声認識装置であって、 他の音声コマンドと類似しているために誤認識される可
    能性の高い類似タイプコマンドを記憶する類似コマンド
    記憶手段と、 前記類似タイプコマンドと同じ機器動作を指示する音声
    コマンドであって他のコマンドと類似していない音声コ
    マンドを、言換コマンドとして記憶する言換コマンド記
    憶手段と、 音声コマンドの認識結果をユーザに知らせるトークバッ
    クのための音声合成を行う音声合成手段と、 を有し、前記類似タイプコマンドが認識されたときに、
    前記類似タイプコマンドの代わりに言換コマンドを使う
    ことを促すトークバックを行うことを特徴とする音声認
    識装置。
JP9286358A 1997-10-20 1997-10-20 音声認識機能付き機器制御装置および音声認識装置 Pending JPH11119792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9286358A JPH11119792A (ja) 1997-10-20 1997-10-20 音声認識機能付き機器制御装置および音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9286358A JPH11119792A (ja) 1997-10-20 1997-10-20 音声認識機能付き機器制御装置および音声認識装置

Publications (1)

Publication Number Publication Date
JPH11119792A true JPH11119792A (ja) 1999-04-30

Family

ID=17703355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9286358A Pending JPH11119792A (ja) 1997-10-20 1997-10-20 音声認識機能付き機器制御装置および音声認識装置

Country Status (1)

Country Link
JP (1) JPH11119792A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006145891A (ja) * 2004-11-19 2006-06-08 Pioneer Electronic Corp 音声処理装置、音声処理方法、音声処理用プログラム及び記録媒体
JP2006235040A (ja) * 2005-02-23 2006-09-07 Ricoh Co Ltd 画像形成装置、プログラムおよび記録媒体
JP2008013111A (ja) * 2006-07-07 2008-01-24 Denso Corp 車両機器自動操作装置
JP2008056045A (ja) * 2006-08-30 2008-03-13 Denso Corp 自動制御装置
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system
US7729921B2 (en) 2006-08-14 2010-06-01 Nuance Communications, Inc. Apparatus, method, and program for supporting speech interface design
JP2011221802A (ja) * 2010-04-09 2011-11-04 Yazaki Corp 入力処理方法及び入力処理装置
US8099287B2 (en) 2006-12-05 2012-01-17 Nuance Communications, Inc. Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
JP2012194337A (ja) * 2011-03-16 2012-10-11 Toshiba Corp 自動音声応答装置、音声応答処理システム及び自動音声応答方法
JP2014098844A (ja) * 2012-11-15 2014-05-29 Ntt Docomo Inc 対話支援装置、対話システム、対話支援方法及びプログラム
JP2014134483A (ja) * 2013-01-11 2014-07-24 Clarion Co Ltd 情報処理装置、音声操作システム、および、情報処理装置の音声操作方法
JP2017207610A (ja) * 2016-05-18 2017-11-24 シャープ株式会社 応答制御装置、制御プログラム、情報処理方法、および通信システム
CN108446095A (zh) * 2013-01-17 2018-08-24 三星电子株式会社 图像处理设备、其控制方法、以及图像处理系统
JP2021092612A (ja) * 2019-12-06 2021-06-17 Tvs Regza株式会社 コマンド制御装置、制御方法および制御プログラム
CN115294976A (zh) * 2022-06-23 2022-11-04 中国第一汽车股份有限公司 一种基于车载语音场景的纠错交互方法、系统及其车辆

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system
JP2006145891A (ja) * 2004-11-19 2006-06-08 Pioneer Electronic Corp 音声処理装置、音声処理方法、音声処理用プログラム及び記録媒体
JP2006235040A (ja) * 2005-02-23 2006-09-07 Ricoh Co Ltd 画像形成装置、プログラムおよび記録媒体
JP4562547B2 (ja) * 2005-02-23 2010-10-13 株式会社リコー 画像形成装置、プログラムおよび記録媒体
JP2008013111A (ja) * 2006-07-07 2008-01-24 Denso Corp 車両機器自動操作装置
US7729921B2 (en) 2006-08-14 2010-06-01 Nuance Communications, Inc. Apparatus, method, and program for supporting speech interface design
US7747443B2 (en) 2006-08-14 2010-06-29 Nuance Communications, Inc. Apparatus, method, and program for supporting speech interface design
JP2008056045A (ja) * 2006-08-30 2008-03-13 Denso Corp 自動制御装置
US8380514B2 (en) 2006-12-05 2013-02-19 Nuance Communications, Inc. Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
US8099287B2 (en) 2006-12-05 2012-01-17 Nuance Communications, Inc. Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
JP2011221802A (ja) * 2010-04-09 2011-11-04 Yazaki Corp 入力処理方法及び入力処理装置
JP2012194337A (ja) * 2011-03-16 2012-10-11 Toshiba Corp 自動音声応答装置、音声応答処理システム及び自動音声応答方法
JP2014098844A (ja) * 2012-11-15 2014-05-29 Ntt Docomo Inc 対話支援装置、対話システム、対話支援方法及びプログラム
JP2014134483A (ja) * 2013-01-11 2014-07-24 Clarion Co Ltd 情報処理装置、音声操作システム、および、情報処理装置の音声操作方法
CN108446095A (zh) * 2013-01-17 2018-08-24 三星电子株式会社 图像处理设备、其控制方法、以及图像处理系统
JP2019153314A (ja) * 2013-01-17 2019-09-12 三星電子株式会社Samsung Electronics Co.,Ltd. 映像処理装置及びその制御方法、並びに映像処理システム
JP2017207610A (ja) * 2016-05-18 2017-11-24 シャープ株式会社 応答制御装置、制御プログラム、情報処理方法、および通信システム
JP2021092612A (ja) * 2019-12-06 2021-06-17 Tvs Regza株式会社 コマンド制御装置、制御方法および制御プログラム
CN115294976A (zh) * 2022-06-23 2022-11-04 中国第一汽车股份有限公司 一种基于车载语音场景的纠错交互方法、系统及其车辆

Similar Documents

Publication Publication Date Title
JPH11119792A (ja) 音声認識機能付き機器制御装置および音声認識装置
US8285545B2 (en) Voice command acquisition system and method
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
US8787866B2 (en) System, method and program for controlling mute function on telephone
WO2017042906A1 (ja) 車載用音声認識装置および車載機器
JP2003202897A (ja) 車載機器用音声認識装置
JP2009145755A (ja) 音声認識装置
CN106218557B (zh) 一种带语音识别控制的车载麦克风
JPH11126092A (ja) 音声認識装置および車両用音声認識装置
JP2003114698A (ja) コマンド受付装置及びプログラム
CN109599103A (zh) 车辆控制方法、装置、系统、计算机可读存储介质和汽车
CN106379262B (zh) 一种带语音识别控制的车载蓝牙麦克风
CN113157080A (zh) 用于车辆的指令输入方法、存储介质、系统及车辆
JP2018116130A (ja) 車内音声処理装置および車内音声処理方法
KR102417899B1 (ko) 차량의 음성인식 시스템 및 방법
JP2006208486A (ja) 音声入力装置
JPH0675588A (ja) 音声認識装置
JPH0673800U (ja) 音声認識装置
JP6644455B1 (ja) 自動車の加速制御システム、方法、プログラム
JPS59180599A (ja) 車載用音声認識制御装置
JPH08297497A (ja) 車両用音声処理装置
KR100331574B1 (ko) 음성인식 기술을 이용한 자동차의 선 루프 자동 제어 장치및 방법
JP2006023444A (ja) 音声対話装置
JP2004184803A (ja) 車両用音声認識装置
GB2371669A (en) Control of apparatus by artificial speech recognition