JP2005055827A - 音声認識装置、及び音声認識方法 - Google Patents

音声認識装置、及び音声認識方法 Download PDF

Info

Publication number
JP2005055827A
JP2005055827A JP2003289112A JP2003289112A JP2005055827A JP 2005055827 A JP2005055827 A JP 2005055827A JP 2003289112 A JP2003289112 A JP 2003289112A JP 2003289112 A JP2003289112 A JP 2003289112A JP 2005055827 A JP2005055827 A JP 2005055827A
Authority
JP
Japan
Prior art keywords
operation state
control
control command
return instruction
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003289112A
Other languages
English (en)
Inventor
Toru Nada
徹 名田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2003289112A priority Critical patent/JP2005055827A/ja
Publication of JP2005055827A publication Critical patent/JP2005055827A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 使用者に与える不快感を少なくすることができる音声認識装置を提供する。
【解決手段】 音声認識装置10は、音声認識装置10の出力する制御コマンドを受けた動作処理部50が車載システム20の車載機器の機能の実行を開始して所定時間以内に操作スイッチ30の入力操作を検出した場合、機能の実行を開始した車載機器の動作状態を実行前の動作状態に戻すための制御コマンドを動作処理部50に送信する。これにより、動作処理部50によって、車載機器の動作状態を元の動作状態に戻すことができるため、使用者の意図と反した動作が実行された場合でも、使用者に与える不快感を少なくすることができる。
【選択図】 図1

Description

本発明は、音声認識装置、及び音声認識方法に関するものである。
従来、使用者の音声を認識し、音声認識結果に基づいて制御装置を制御する音声認識装置が提案されている(例えば、特許文献1参照。)。この特許文献1に開示されている音声認識装置によれば、例えば、音声認識結果に基づく表示を行い、この表示開始から所定期間内に音声認識開始指示スイッチによって音声認識開始指示がなされた場合には、音声認識結果を無効とする。一方、所定期間内に音声認識開始指示がなされない場合には、使用者の意図と合致する音声認識結果であったとして、音声認識結果に基づく制御信号を制御装置に送出し、制御装置は、この制御信号を受けて動作を開始する。
特開平7−191693号公報
例えば、音声認識結果が使用者の意図と合致していても、制御装置の実際の動作が使用者の意図と反する場合、従来の音声認識装置は、使用者の意図と反した動作を制御装置に行わせることになり、その結果、使用者に不快感を与えることとなる。
本発明は、かかる問題を鑑みてなされたもので、使用者に与える不快感を少なくすることができる音声認識装置、及び音声認識方法を提供することを目的とする。
請求項1に記載の音声認識装置は、発話内容と制御対象の各種機能を実行する制御コマンドを対応付けて記憶する制御コマンド記憶手段と、発話された音声を認識する音声認識手段と、音声認識手段によって認識された発話内容に対応する制御コマンドを制御コマンド記憶手段から抽出する抽出手段と、抽出手段の抽出する制御コマンドに従って、制御対象の機能を実行する制御手段と、制御手段に対して制御対象の動作状態を過去の動作状態に戻す戻り指示を出す戻り指示手段とを備えることを特徴とする。
このように、本発明の音声認識装置は、制御対象を過去の動作状態に戻す指示手段を備えている。そのため、発話内容に対応する制御コマンドに従って制御対象の機能の実行が開始された後に制御対象を過去の動作状態に戻す指示を受けた場合には、過去の動作状態へ戻す処理を制御手段に実行させるようにすれば、制御対象を元の動作状態に戻すことが可能となる。これにより、制御対象の実際の動作が使用者の意図と反する場合であっても、使用者に与える不快感を少なくすることができる。
請求項2に記載の音声認識装置では、制御手段は、制御対象の過去の動作状態、及び制御手段に出力された制御コマンドの少なくとも一方を記憶する動作状態記憶手段を備え、動作状態記憶手段に記憶された過去の動作状態、及び制御コマンドの少なくとも一方を参照することにより、制御対象を過去の動作状態に戻す処理を実行することを特徴とする。
すなわち、制御コマンドは、制御対象の動作状態を目的とする動作状態に変化させるために実行されるものであり、言い換えれば、制御コマンドの実行前と実行後の制御対象の動作状態とを関連付けるものである。
従って、制御対象が現在の動作状態に変化する際に実行された制御コマンドが記憶されていれば、上述した関連性に基づいて過去の動作状態を特定することができる。この過去の動作状態が特定されれば、現在の動作状態をこの特定した動作状態に変化させるために実行する制御コマンドを特定することができる。また、制御対象の過去の動作状態が記憶されていれば、現在の動作状態から過去の動作状態へ戻すために実行すべき制御コマンドを特定することができる。
このように、制御対象の過去の動作状態、及び制御手段に出力された制御コマンドの少なくとも一方を記憶することで、現在の動作状態から過去の動作状態へ戻すために実行すべき制御コマンドを特定できるため、この特定した制御コマンドに従って実行することで、元の動作状態へ戻すことが可能となる。
請求項3に記載の音声認識装置では、制御コマンド記憶手段は、戻り指示に対応する制御コマンドを含んで記憶し、戻り指示手段は、音声認識手段によって認識される戻り指示を示す発話内容に基づいて戻り指示を出すことを特徴とする。例えば、「戻す」なる発話内容が認識された場合に制御対象を元の動作状態に戻す指示を出すようにする。これにより、使用者は「戻す」と発話することによって、制御対象を過去の動作状態に戻す指示を出すことができる。
請求項4に記載の音声認識装置では、音声入力の開始・終了を指示する音声入力指示手段と、制御手段によって制御対象の機能の実行が開始されてからの時間経過をカウントするタイマー手段とを備え、音声入力指示手段は、時間経過が所定時間に達するまでの間、戻り指示手段として機能することを特徴とする。例えば、音声入力指示手段を構成するハードウェアを所定時間に限って制御対象の動作状態を過去の動作状態に戻す戻り指示を出す戻り指示手段として機能させる。これにより、音声認識装置としてのハードウェアの構成を削減することができる。
請求項5に記載の音声認識装置では、操作スイッチを模擬した図形をタッチパネルの設けられる画面に表示する表示制御手段を備え、戻り指示手段は、図形が表示される領域をタッチ操作することにより戻り指示を出すことを特徴とする。これにより、使用者は、タッチパネルの設けられる画面をタッチ操作するだけで、制御対象を過去の動作状態に戻す指示を出すことができる。
請求項6に記載の音声認識装置では、制御手段によって制御対象の機能の実行が開始されてからの時間経過をカウントするタイマー手段を備え、表示制御手段は、時間経過が所定時間以上となった場合に図形の表示を消去することを特徴とする。
例えば、画面に操作スイッチを模擬した図形を表示する場合、この図形を常時表示すると、画面の表示領域が少なくなってしまう。そこで、所定時間に限り上記図形を表示することで、表示領域が少なくならないようにすることができる。また、所定時間以上経過した場合に図形の表示を消去することで、制御対象の現在の動作状態でよいと使用者が認識したことを音声認識装置側で把握することができる。
請求項7に記載の音声認識装置では、制御コマンド記憶手段は、制御コマンドとして、制御対象の二つの動作状態を交互に変化させる制御コマンドを含んで記憶し、制御手段は、二つの動作状態のうちの一方の動作状態に制御対象を変化させる制御コマンドに従って制御対象の機能を実行した後に戻り指示が出された場合、二つの動作状態の他方の動作状態に制御対象を変化させる制御コマンドに従って制御対象の機能を実行することを特徴とする。
例えば、電源のON/OFF等、二つの動作状態が交互に変化する動作(以下、トグル動作と呼ぶ)の一方の動作を実行した後に、このトグル動作の実行前に戻す場合、実行したトグル動作の反対のトグル動作を実行すれば、制御対象をトグル動作前の動作状態に戻すことができる。従って、トグル動作を実行した後に戻り指示手段による指示が出された場合には、実行したトグル動作の反対のトグル動作を実行することで、制御対象をトグル動作前の動作状態に戻すことができる。
請求項8に記載の音声認識装置では、制御対象の動作状態を検出する動作状態検出手段を備え、動作状態記憶手段は、動作状態検出手段の検出する動作状態をその検出した順序に従って記憶し、戻り指示が出された場合、動作状態記憶手段の記憶する過去の動作状態を抽出する動作状態抽出手段をさらに備え、制御手段は、抽出した動作状態へ戻す処理を実行することを特徴とする。
このように、制御対象の動作状態を記憶しておくことで、戻り指示が出された場合には、現在の動作状態となる前の動作状態を把握することができる。また、現在の動作状態となる前の動作状態を抽出して、この抽出した動作状態へ戻す制御コマンドを特定した上で、その特定した制御コマンドを実行することで、制御対象を過去の動作状態へ戻すことができる。
請求項9に記載の音声認識装置では、動作状態記憶手段は、動作状態検出手段の検出する動作状態が前回記憶した動作状態から変化している場合に、その変化後の動作状態を記憶することを特徴とする。これにより、動作状態の変化を記憶することができる。
請求項10に記載の音声認識装置では、戻り指示手段は、戻すべき制御対象の過去の動作状態から現在の動作状態までに変化した動作状態の回数に応じた指示を出し、動作状態抽出手段は、現在の動作状態から回数前の動作状態を抽出することを特徴とする。
例えば、戻り指示手段が押しボタン等によって構成され、現在の動作状態に変化する2回前の動作状態へ戻そうとする場合には、戻り指示手段を時間的に2回連続して操作(例えば、ダブルクリックの要領で操作)する。これにより、動作状態抽出手段は、2回前の動作状態を抽出することができる。
また、例えば、上述したように、戻り指示手段が「戻す」と発話することによって、制御対象を過去の動作状態に戻す指示を出す場合に、現在の動作状態に変化する2回前の動作状態へ戻そうとするときには、「2回前に戻す」と発話することで、同様に、2回前の動作状態が抽出される。
請求項11に記載の音声認識装置では、戻り指示手段は、戻すべき制御対象の過去の動作状態から現在の動作状態までに変化した動作状態の回数に応じた指示を出し、動作状態抽出手段は、回数が所定回数以上である場合、制御対象の初期の動作状態を抽出することを特徴とする。
これにより、容易に初期の動作状態を抽出することができる。なお、例えば、上述したように、戻り指示手段が「戻す」と発話することによって、制御対象を過去の動作状態に戻す戻り指示を出す場合に、初期の動作状態へ戻そうとするときには、「始めに戻す」と発話することで、初期の動作状態が抽出される。
請求項12に記載の音声認識装置では、制御対象の動作状態を検出する動作状態検出手段を備え、動作状態記憶手段は、動作状態検出手段の検出する動作状態をその検出した順序に従って記憶し、戻り指示が出された場合、動作状態記憶手段の記憶する過去の動作状態を全て抽出する動作状態抽出手段と、抽出した全ての動作状態を示す項目が検出した順序に並べられたリストを表示する表示制御手段と、表示制御手段によって表示されたリストから戻すべき動作状態を示す項目を選択する選択手段とをさらに備え、制御手段は、選択手段によって選択された項目の動作状態へ戻す処理を実行することを特徴とする。これにより、過去の任意の動作状態を選択することで、制御対象をその選択した動作状態へ戻すことができる。
請求項13から請求項24に記載の音声認識方法における作用効果は、請求項1から請求項12に記載の音声認識装置における作用効果と同様であるため、その説明を省略する。
以下、本発明の実施の形態における音声認識装置、及び音声認識方法に関して、図面に基づいて説明する。なお、本実施形態における音声認識装置は、自動車等の車両に搭載されて用いられるものである。図1は、本実施形態における音声認識システム1の概略構成を示すブロック図である。同図に示すように、音声認識システム1は、音声認識装置10、車載システム20、操作スイッチ30、マイク40、動作処理部50、及び記憶媒体管理部60によって構成される。
車載システム20は、オーディオ21、電話機22、ナビゲーション23、エアコン24の複数の車載機器によって構成され、各車載機器は、音声認識装置10と信号線により接続されている。
操作スイッチ30は、音声入力の開始・終了のトリガ信号を音声認識装置10へ送信するトークスイッチとして用いられるもので、例えば、押しボタンスイッチによって構成される。なお、この操作スイッチ30は、表示装置53の画面に設けられるタッチパネルをタッチ操作することによって、入力操作を行うものであってもよい。
また、操作スイッチ30は、音声入力によって車載機器の動作が開始されてから所定時間以内に限って、車載システム20の車載機器の動作状態を元の状態に戻す指示を出す指示手段として用いられる。このように、トークスイッチとして用いる操作スイッチ30を音声入力による動作開始後の所定時間以内に限って元の状態に戻す指示手段として機能させることで、ハードウェアの構成を削減することができる。
動作処理部50は、制御部51、スピーカ52、及び表示装置53によって構成される。制御部51は、音声認識装置10から出力される制御コマンドに従って、上記車載システム20の車載機器の各種機能を実行する。なお、この制御部51は、車載システム20の各車載機器に各々設けられるものであってもよいし、音声認識装置10の内部に設けられるものであってもよい。スピーカ52、及び表示装置53は、音声認識装置10から出力されるデータに従って音声出力や表示をする。
記憶媒体管理部60は、データ入力器61と記憶媒体62によって構成され、データ入力器61が記憶媒体62から目的のデータを読み出して音声認識装置10へ出力する。記憶媒体62は、例えば、ROM、RAM、CD、DVD、HDD、メモリカード等の記憶媒体で構成される。この記憶媒体62には、車載システム20の各車載機器に応じた複数の認識対象語と、各認識対象語に対応する車載機器の機能を実行する制御コマンドが記憶されている。認識対象語とは、車載機器の各種機能を音声入力によって実行する際に参照されるものである。なお、記憶媒体62は、インターネット等のネットワーク上に存在する各種DB等に格納されるものであってもよい。
音声認識装置10は、音声認識部11a、認識処理制御部11b、及び前状態記憶部11cによって構成される制御装置11、状態検出部12、入力操作検出部13、音声入力部14、制御情報出力部15、及び認識対象語管理部16によって構成される。
状態検出部12は、車載システム20の各車載機器の動作状態を検出するもので、検出した動作状態を示す動作状態データを認識処理制御部11aに送信する。入力操作検出部13は、操作スイッチ30からの入力操作を検出するもので、入力操作を検出すると、認識処理制御部11aに対して上記トリガ信号を送信する。
音声入力部14は、マイク40からの音声を入力するもので、入力した音声信号を音声認識部11bへ送信する。制御情報出力部15は、スピーカ52や表示装置53から出力すべき各種のデータ、及び車載システム20の車載機器を動作させる制御コマンドを動作処理部50へ出力する。
認識対象語管理部16は、音声認識部11bによって解析された音声信号に対応する認識語読みと、記憶媒体62に記憶された認識対象語とを照合し、最も確からしい認識対象語に対応する制御コマンドを抽出する。この抽出した制御コマンドは、認識処理制御部11aに送信される。
制御装置11は、上述したように、認識処理制御部11a、音声認識部11b、及び前状態記憶部11cから構成される。この制御装置11は、通常のコンピュータとしての構成を有し、内部には周知のCPU、ROM、RAM、I/O及びこれらの構成を接続するバスラインなどが備えられている。また、認識処理制御部11a、音声認識部11b、及び前状態記憶部11cは、単一のCPUで処理されてもよく、複数のCPUで処理してもよい。
認識処理制御部11aは、入力操作検出部13からのトリガ信号を受けて、マイク40から入力される音声の認識を開始するように、音声認識部11bに指示する。また、認識処理制御部11aは、認識対象語管理部16によって抽出された制御コマンドを制御情報出力部15へ送信する。
さらに、認識処理制御部11aは、状態検出部12から送られる動作状態データのうち、制御情報出力部15から動作処理部50に対して出力した制御コマンドを受けて車載システム20の車載機器が動作した場合の動作状態に対応する動作状態データのみを検出した順序に従って前状態記憶部11cに記憶させる。なお、上記動作状態データであっても、前状態記憶部11cに記憶されている直前の動作状態データと同じ動作状態を示す動作状態データである場合には、この動作状態データを前状態記憶部11cに送信することなく破棄する。
すなわち、前状態記憶部11cには、制御コマンドを受けて動作した場合の動作状態を示す動作状態データで、かつ、直前の動作状態データと重複することのない動作状態データのみが記憶される。言い換えれば、前状態記憶部11cには、直前の動作状態から変化している場合の動作状態を示す動作状態データのみが記憶される。これにより、前状態記憶部11cには、動作状態がその変化した順序に従って記憶されるため、現在の動作状態に変化する前の動作状態を把握することができる。
音声認識部11bは、音声入力部14から送信される音声信号を認識対象語に変換するものである。この音声認識部11bは、例えば、周知の隠れマルコフモデル(Hidden Marlov Model)等の手法を用いて、音声信号に対応する認識語読みを解析する。解析された認識語読みは、認識対象語管理部16に送られ、この認識対象語管理部16において、記憶媒体62に記憶された認識対象語と照合され、最も確からしい認識対象語に対応する制御コマンドが抽出される。
このように構成された音声認識装置10は、例えば、オーディオ21の音量設定、電話機22の電話番号入力、ナビゲーション23における目的地設定、エアコン24における温度設定等の各種機能の操作を音声入力によって行うことができる。ここで、オーディオ21における音量設定を行う場合の例について説明する。
先ず、操作スイッチ30を操作することで、入力操作検出部13は、音声入力を開始するトリガ信号を検出する。入力操作検出部13は、この検出したトリガ信号を認識処理制御部11aへ送信し、認識処理制御部11aは、このトリガ信号を受けて、音声認識部11bに対して音声認識の開始を指示する。これにより、音声認識部11bは、音声入力を受け付けるモードに変更する。
音声認識部11bが音声入力を受け付けるモードであるとき、音声認識システム1の使用者が希望する音量レベルを発話する(例えば、0〜9の10段階で設定される音量レベル場合、現在の音量レベル3から音量レベル6に設定を変更する際には、「音量6」と発話する)と、その音声がマイク40によって音声信号に変換され、この音声信号が音声入力部14へ送られる。音声入力部14は、この音声信号を音声認識部11bへ送る。音声認識部11bは、この音声信号に対応する認識語読みを解析し、解析した認識語読みから最も確からしい認識対象語を特定する。
認識対象語が特定されると、認識対象語管理部16は、この認識対象語に対応する制御コマンドを記憶媒体管理部60から抽出し、抽出した制御コマンドを認識処理制御部11aへ送信する。例えば、「音量6」と認識された音声は、「音量レベルを6にする」という制御コマンドが最終的に抽出される。この制御コマンドを受けた認識処理制御部11aは、制御情報出力部15を介して動作処理部50へ出力する。動作処理部50は、この制御コマンドに応じた機能を実行する。これにより、オーディオ21において、最終的に音量設定が音量レベル6に変更される。
オーディオ21において、制御コマンドに従った機能が実行されると、状態検出部12は、オーディオ21の最終的な動作状態(音量レベル6)が検出され、検出した動作状態を示す動作状態データを認識処理制御部11aに送信する。認識処理制御部11aは、状態検出部12から送信された動作状態データを受信し、前状態記憶部11cに記憶されているオーディオ21の直前の動作状態データとこの受信した動作状態データとを比較し、受信した動作状態データが直前の動作状態データと重複するものでない場合には、この受信した動作状態データを前状態記憶部11cに記憶させる。
なお、本実施形態の音声認識装置10は、音声認識装置10から制御コマンドを受けた動作処理部50が車載機器の機能の実行を開始して所定時間以内に操作スイッチ30の入力操作を検出すると、機能の実行を開始した車載機器の動作状態を実行前の動作状態に戻すための制御コマンドを動作処理部50に送信する。動作処理部50は、この送信される制御コマンドに従って、車載機器の動作状態を元の動作状態に戻す。
次に、本実施形態における音声認識装置10の特徴部分に係わる、音声認識処理の流れについて、図2に示すフローチャートを用いて説明する。先ず、図2に示すステップ(以後、Sと記す)10では、音声認識装置10から制御コマンドを受けて機能を実行した各車載機器の動作状態を検出して、この検出した動作状態を示す動作状態データを前状態記憶部11cに記憶する。
S20では、音声入力が有ったか否かを判定し、肯定判定される場合にはS30へ処理を進め、否定判定される場合には待機状態となる。S30では、入力された音声に対応する制御コマンドを抽出する。S40では、抽出した制御コマンドを動作処理部50へ出力し、動作処理部50によって制御コマンドに従った車載機器の機能が実行される。
S50では、S40における処理の実行が開始されるのと同時にタイマーによる時間経過のカウントを開始する。S60では、S50におけるカウントを開始してから所定時間以内に操作スイッチ30が操作されたか否かを判定する。ここで、肯定判定される場合には、S70へ処理を進め、否定判定される場合には、S10へ処理を移行して、上述した処理を繰り返し実行する。
S70では、車載機器の動作状態をS40の処理の実行前に戻すため、S10にて記憶した現在の動作状態を示す動作状態データとその直前の動作状態データとを前状態記憶部11cから抽出する。そして、現在の動作状態から直前の動作状態に戻すための認識対象語を特定し、この特定した認識対象語に対応する制御コマンドを抽出して、動作処理部50へ出力する。
すなわち、制御コマンドは、車載機器の動作状態を目的とする動作状態に変化させるために実行されるものであり、言い換えれば、制御コマンドの実行前と実行後の車載機器の動作状態とを関連付けるものである。従って、前状態記憶部11cに記憶されている車載機器の過去の動作状態と現在の動作状態とに基づいて、現在の動作状態から過去の動作状態へ戻すために実行すべき制御コマンドを特定することができる。
また、例えば、動作処理部50の実行した制御コマンドを実行した順序に従って前状態記憶部11cに記憶する場合であっても、現在の動作状態と制御コマンドとの関連性に基づいて、過去の動作状態を特定することができる。この過去の動作状態が特定されれば、現在の動作状態をこの特定した動作状態に変化させるために実行する制御コマンドを特定することができる。
このように、車載機器の過去の動作状態、及び制御手段に出力された制御コマンドの少なくとも一方を記憶することで、現在の動作状態から過去の動作状態へ戻すために実行すべき制御コマンドを特定できるため、この特定した制御コマンドに従って実行することで、元の動作状態へ戻すことが可能となる。
このように、本実施形態の音声認識装置10は、音声認識装置10の出力する制御コマンドを受けた動作処理部50が車載機器の機能の実行を開始して所定時間以内に操作スイッチ30の入力操作を検出した場合、機能の実行を開始した車載機器の動作状態を実行前の動作状態に戻すための制御コマンドを動作処理部50に送信する。これにより、動作処理部50によって、車載機器の動作状態を元の動作状態に戻すことができるため、使用者の意図と反した動作が実行された場合でも、使用者に与える不快感を少なくすることができる。
(変形例1)
本実施形態における図2に示したS70では、前状態記憶部11cから現在の動作状態と直前の動作状態を示す動作状態データを抽出しているが、例えば、S40にて実行した動作が電源のON/OFF等、二つの動作状態が交互に変化する動作(トグル動作)の一方の動作である場合には、前状態記憶部11cから動作状態データを抽出することなく、S40にて実行したトグル動作と反対のトグル動作に該当する制御コマンドを制御部51へ送信してもよい。
すなわち、トグル動作の一方の動作を実行した後に、このトグル動作の実行前に戻す場合、実行したトグル動作の反対のトグル動作を実行すれば、車載機器をトグル動作前の動作状態に戻すことができる。従って、トグル動作を実行した後にS60にて操作スイッチ30が操作されたと判定された場合には、S70において、実行したトグル動作の反対のトグル動作を実行することで、車載機器をトグル動作前の動作状態に戻すことができる。
(変形例2)
本実施形態では、操作スイッチ30を操作することで、車載機器の動作状態を元の状態に戻す指示を出す指示手段の機能を発揮するものであるが、この元に戻す指示を音声入力によって行ってもよい。例えば、記憶媒体62に「戻る」なる認識対象語を記憶しておき、この認識対象語が抽出された場合にS70における処理を実行してもよい。これにより、使用者は、「戻す」と発話することによって、車載機器を元の動作状態に戻す指示を出すことができる。
(変形例3)
本実施形態では、車載機器の動作状態を現在の動作状態に変化する直前の動作状態に戻すものであるが、直前の動作状態よりもさらに前の動作状態に戻すことも想定される。このような場合には、戻すべき車載機器の過去の動作状態から現在の動作状態までに変化した動作状態の回数を使用者に入力させるとよい。
例えば、現在の動作状態に変化する2回前の動作状態に戻そうとする場合を説明すると、車載機器の動作状態を元の状態に戻す指示を出す指示手段が押しボタンの操作スイッチ30である場合には、時間的に2回連続して押す(例えば、ダブルクリックの要領で操作)。また、上記指示を使用者の発話「戻す」によって出す場合には、「2回前に戻す」と発話する。このように、現在の動作状態から戻そうとする動作状態までに変化した回数を使用者に入力させることで、直前の動作状態よりもさらに前の動作状態に戻すことが可能となる。
さらに、使用者によって入力される回数が所定回数以上である場合には、初期の動作状態に戻してもよい。これにより、容易に初期の動作状態戻すことができる。なお、上述したように、上記指示を使用者の発話「戻す」によって出す場合には、初期の動作状態へ戻そうとするときには、「始めに戻す」と発話することで初期の動作状態へ戻すようにすればよい。
(変形例4)
本実施形態の操作スイッチ30として、表示装置53の画面に設けられるタッチパネルをタッチ操作することによって入力操作を行うタッチスイッチによって構成し、さらに、所定時間内に限り、このタッチスイッチを車載機器の動作状態を元に戻す指示を出す指示手段として用いる場合には、次のようにすると良い。
例えば、図3(a)に示すように、ナビゲーション23による地図表示中の画面53aに上記指示手段としての操作スイッチ30を示す図形31を音声入力によって車載機器の機能の実行が開始されるのと同時に表示する。これにより、使用者は、タッチ操作するだけで元に戻す指示を出すことができる。
また、図形31を表示したから所定時間経過した場合には、図3(b)に示すように、画面53aから図形31の表示を消去するとよい。すなわち、図形31を画面53aに常時表示すると、地図表示の表示領域が少なくなってしまう。そこで、所定時間に限り図形31を表示することで、画面53aの表示領域が少なくならないようにすることができる。また、所定時間経過した場合に図形31の表示を消去することで、車載機器の現在の動作状態でよいと使用者が認識したことを音声認識装置10側で把握することができる。
(変形例5)
変形例4において、図形31が所定時間以内にタッチ操作された場合には、図4に示すように、前状態記憶部11cの記憶する全ての動作状態の項目を示すリストを画面に表示し、このリストの中からタッチ操作された項目の動作状態に戻す制御コマンドを制御部51へ出力してよい。これにより、過去の動作状態から任意の動作状態を選択して、その選択した動作状態へ戻すことができる。
なお、1画面中に全ての項目が表示できない場合には、コマ送りスイッチ53c、53dを操作することによって項目をスクロール表示してもよいし、ページ送りスイッチ53b、53eを操作することによって、項目をページ送りして表示してもよい。
本発明の実施形態に係わる、音声認識システム1を構成する音声認識装置10と周辺装置の概略構成を示すブロック図である。 本発明の実施形態に係わる、音声認識処理の流れを示すフローチャートである。 (a)は、所定時間経過する前の図形31の表示例を示す図であり、(b)は、所定時間経過後に図形31の表示を消去した表示例を示す図である。 本発明の実施形態の変形例5に係わる、過去の動作状態の項目を示すリストの表示例である。
符号の説明
1 音声認識システム
10 音声認識装置
11 制御装置
11a 認識処理制御部
11b 音声認識部
11c 前状態記憶部
12 状態検出部

Claims (24)

  1. 発話内容と制御対象の各種機能を実行する制御コマンドを対応付けて記憶する制御コマンド記憶手段と、
    発話された音声を認識する音声認識手段と、
    前記音声認識手段によって認識された発話内容に対応する制御コマンドを前記制御コマンド記憶手段から抽出する抽出手段と、
    前記抽出手段の抽出する制御コマンドに従って、前記制御対象の機能を実行する制御手段と、
    前記制御手段に対して前記制御対象の動作状態を過去の動作状態に戻す戻り指示を出す戻り指示手段とを備えることを特徴とする音声認識装置。
  2. 前記制御手段は、前記制御対象の過去の動作状態、及び前記制御手段に出力された制御コマンドの少なくとも一方を記憶する動作状態記憶手段を備え、前記動作状態記憶手段に記憶された過去の動作状態、及び制御コマンドの少なくとも一方を参照することにより、前記制御対象を過去の動作状態に戻す処理を実行することを特徴とする請求項1記載の音声認識装置。
  3. 前記制御コマンド記憶手段は、前記戻り指示に対応する制御コマンドを含んで記憶し、
    前記戻り指示手段は、前記音声認識手段によって認識される戻り指示を示す発話内容に基づいて前記戻り指示を出すことを特徴とする請求項1又は2記載の音声認識装置。
  4. 音声入力の開始・終了を指示する音声入力指示手段と、
    前記制御手段によって前記制御対象の機能の実行が開始されてからの時間経過をカウントするタイマー手段とを備え、
    前記音声入力指示手段は、前記時間経過が所定時間に達するまでの間、前記戻り指示手段として機能することを特徴とする請求項1又は2記載の音声認識装置。
  5. 操作スイッチを模擬した図形をタッチパネルの設けられる画面に表示する表示制御手段を備え、
    前記戻り指示手段は、前記図形が表示される領域をタッチ操作することにより前記戻り指示を出すことを特徴とする請求項1又は2記載の音声認識装置。
  6. 前記制御手段によって前記制御対象の機能の実行が開始されてからの時間経過をカウントするタイマー手段を備え、
    前記表示制御手段は、前記時間経過が所定時間以上となった場合に前記図形の表示を消去することを特徴とする請求項5記載の音声認識装置。
  7. 前記制御コマンド記憶手段は、前記制御コマンドとして、前記制御対象の二つの動作状態を交互に変化させる制御コマンドを含んで記憶し、
    前記制御手段は、前記二つの動作状態のうちの一方の動作状態に前記制御対象を変化させる制御コマンドに従って前記制御対象の機能を実行した後に前記戻り指示が出された場合、前記二つの動作状態の他方の動作状態に前記制御対象を変化させる制御コマンドに従って前記制御対象の機能を実行することを特徴とする請求項1〜6のいずれか1項に記載の音声認識装置。
  8. 前記制御対象の動作状態を検出する動作状態検出手段を備え、
    前記動作状態記憶手段は、前記動作状態検出手段の検出する動作状態をその検出した順序に従って記憶し、
    前記戻り指示が出された場合、前記動作状態記憶手段の記憶する過去の動作状態を抽出する動作状態抽出手段をさらに備え、
    前記制御手段は、前記抽出した動作状態へ戻す処理を実行することを特徴とする請求項2〜6のいずれか1項に記載の音声認識装置。
  9. 前記動作状態記憶手段は、前記動作状態検出手段の検出する動作状態が前回記憶した動作状態から変化している場合に、その変化後の動作状態を記憶することを特徴とする請求項8記載の音声認識装置。
  10. 前記戻り指示手段は、戻すべき前記制御対象の過去の動作状態から現在の動作状態までに変化した動作状態の回数に応じた指示を出し、
    前記動作状態抽出手段は、前記現在の動作状態から前記回数前の動作状態を抽出することを特徴とする請求項9記載の音声認識装置。
  11. 前記戻り指示手段は、戻すべき前記制御対象の過去の動作状態から現在の動作状態までに変化した動作状態の回数に応じた指示を出し、
    前記動作状態抽出手段は、前記回数が所定回数以上である場合、前記制御対象の初期の動作状態を抽出することを特徴とする請求項9記載の音声認識装置。
  12. 前記制御対象の動作状態を検出する動作状態検出手段を備え、
    前記動作状態記憶手段は、前記動作状態検出手段の検出する動作状態をその検出した順序に従って記憶し、
    前記戻り指示が出された場合、前記動作状態記憶手段の記憶する過去の動作状態を全て抽出する動作状態抽出手段と、
    前記抽出した全ての動作状態を示す項目が前記順序に並べられたリストを表示する表示制御手段と、
    前記表示制御手段によって表示されたリストから戻すべき動作状態を示す項目を選択する選択手段とをさらに備え、
    前記制御手段は、前記選択手段によって選択された項目の動作状態へ戻す処理を実行することを特徴とする請求項2又は3記載の音声認識装置。
  13. 発話内容と制御対象の各種機能を実行する制御コマンドを対応付けて記憶し、発話された音声を認識し、この認識した発話内容に対応する制御コマンドを抽出して、この抽出した制御コマンドに従って前記制御対象の機能を実行し、前記制御対象の動作状態を過去の動作状態に戻す戻り指示が出された場合には、前記制御対象の動作状態を過去の動作状態へ戻す処理を実行する音声認識方法。
  14. 前記制御対象の過去の動作状態、及び前記制御手段に出力された制御コマンドの少なくとも一方を記憶し、前記記憶した過去の動作状態、及び制御コマンドの少なくとも一方を参照することにより、前記制御対象を過去の動作状態に戻す処理を実行することを特徴とする請求項13記載の音声認識方法。
  15. 前記戻り指示に対応する制御コマンド記憶し、前記認識される戻り指示を示す発話内容に基づいて前記戻り指示を出すことを特徴とする請求項13又は14記載の音声認識方法。
  16. 前記制御対象の機能の実行が開始されてからの時間経過が所定時間に達するまでの間、音声入力の開始・終了を指示するハードウェアを前記戻り指示を出すハードウェアとして機能させることを特徴とする請求項13又は14記載の音声認識方法。
  17. 操作スイッチを模擬した図形をタッチパネルの設けられる画面に表示し、前記図形が表示される領域をタッチ操作することにより前記戻り指示を出すことを特徴とする請求項13又は14記載の音声認識方法。
  18. 前記制御対象の機能の実行が開始されてからの時間経過が所定時間以上となった場合に前記図形の表示を消去することを特徴とする請求項17記載の音声認識方法。
  19. 前記制御対象の二つの動作状態を交互に変化させる制御コマンドを含んで記憶し、前記二つの動作状態のうちの一方の動作状態に前記制御対象を変化させる制御コマンドに従って前記制御対象の機能を実行した後に前記戻り指示が出された場合、前記二つの動作状態の他方の動作状態に前記制御対象を変化させる制御コマンドに従って前記制御対象の機能を実行することを特徴とする請求項13〜18のいずれか1項に記載の音声認識方法。
  20. 前記制御対象の動作状態を検出し、この検出する動作状態をその検出した順序に従って記憶し、前記戻り指示が出された場合、前記記憶した過去の動作状態を抽出し、この抽出した動作状態へ戻す処理を実行することを特徴とする請求項14〜18のいずれか1項に記載の音声認識方法。
  21. 前記検出した動作状態が前回記憶した動作状態から変化している場合に、その変化後の動作状態を記憶することを特徴とする請求項20記載の音声認識方法。
  22. 前記戻り指示として、戻すべき前記制御対象の過去の動作状態から現在の動作状態までに変化した動作状態の回数に応じた指示を出し、前記現在の動作状態から前記回数前の動作状態を抽出することを特徴とする請求項21記載の音声認識方法。
  23. 前記戻り指示として、戻すべき前記制御対象の過去の動作状態から現在の動作状態までに変化した動作状態の回数に応じた指示を出し、前記回数が所定回数以上である場合、前記制御対象の初期の動作状態を抽出することを特徴とする請求項21記載の音声認識方法。
  24. 前記制御対象の動作状態を検出し、この検出した動作状態をその検出した順序に従って記憶し、前記戻り指示が出された場合、前記記憶した過去の動作状態を全て抽出し、この抽出した全ての動作状態を示す項目が前記順序に並べられたリストを表示し、このリストから戻すべき動作状態を示す項目を選択し、この選択された項目の動作状態へ戻す処理を実行することを特徴とする請求項14又は15記載の音声認識方法。
JP2003289112A 2003-08-07 2003-08-07 音声認識装置、及び音声認識方法 Pending JP2005055827A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003289112A JP2005055827A (ja) 2003-08-07 2003-08-07 音声認識装置、及び音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003289112A JP2005055827A (ja) 2003-08-07 2003-08-07 音声認識装置、及び音声認識方法

Publications (1)

Publication Number Publication Date
JP2005055827A true JP2005055827A (ja) 2005-03-03

Family

ID=34367548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003289112A Pending JP2005055827A (ja) 2003-08-07 2003-08-07 音声認識装置、及び音声認識方法

Country Status (1)

Country Link
JP (1) JP2005055827A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049537A (ja) * 2015-09-04 2017-03-09 株式会社東芝 操作装置、訂正方法およびプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04161997A (ja) * 1990-10-24 1992-06-05 Ricoh Co Ltd 音声認識装置
JPH0830612A (ja) * 1994-07-18 1996-02-02 Toshiba Corp エディタ
JPH08190398A (ja) * 1995-01-10 1996-07-23 Sony Corp 音声認識装置
JP2000066798A (ja) * 1998-08-18 2000-03-03 Sharp Corp 情報処理装置及び情報処理装置の制御方法、並びにその制御用プログラムを記録した記録媒体
JP2000163091A (ja) * 1998-11-27 2000-06-16 Denso Corp 音声認識装置
JP2001063489A (ja) * 1999-08-30 2001-03-13 Alpine Electronics Inc 車載機器の集中管理システム
JP2002189716A (ja) * 2000-12-21 2002-07-05 Nec Software Chubu Ltd 文書編集装置
JP2003084794A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
JP2003084965A (ja) * 2001-09-10 2003-03-20 Ricoh Co Ltd 機器操作装置、プログラムおよび記録媒体

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04161997A (ja) * 1990-10-24 1992-06-05 Ricoh Co Ltd 音声認識装置
JPH0830612A (ja) * 1994-07-18 1996-02-02 Toshiba Corp エディタ
JPH08190398A (ja) * 1995-01-10 1996-07-23 Sony Corp 音声認識装置
JP2000066798A (ja) * 1998-08-18 2000-03-03 Sharp Corp 情報処理装置及び情報処理装置の制御方法、並びにその制御用プログラムを記録した記録媒体
JP2000163091A (ja) * 1998-11-27 2000-06-16 Denso Corp 音声認識装置
JP2001063489A (ja) * 1999-08-30 2001-03-13 Alpine Electronics Inc 車載機器の集中管理システム
JP2002189716A (ja) * 2000-12-21 2002-07-05 Nec Software Chubu Ltd 文書編集装置
JP2003084794A (ja) * 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
JP2003084965A (ja) * 2001-09-10 2003-03-20 Ricoh Co Ltd 機器操作装置、プログラムおよび記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049537A (ja) * 2015-09-04 2017-03-09 株式会社東芝 操作装置、訂正方法およびプログラム

Similar Documents

Publication Publication Date Title
JP3586777B2 (ja) 音声入力装置
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
JP4131978B2 (ja) 音声認識機器制御装置
US9767799B2 (en) Voice recognition system and recognition result display apparatus
KR102029820B1 (ko) 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법
JP2003076389A (ja) タッチスクリーン又は音声認識を通じて動作制御される情報端末及びその命令実行方法
JP4667138B2 (ja) 音声認識方法及び音声認識装置
KR20100076998A (ko) 정보 입력 및 표시를 위한 운전자 보조 시스템의 멀티모달 사용자 인터페이스
JP3702867B2 (ja) 音声制御装置
JP2008145693A (ja) 情報処理装置及び情報処理方法
JP2006208486A (ja) 音声入力装置
JPH08166866A (ja) 対話型インターフェースを具備した編集支援システム
JP4905522B2 (ja) 機器制御装置、機器制御方法及びプログラム
WO2016103465A1 (ja) 音声認識システム
JPH10326176A (ja) 音声対話制御方法
JP2003108581A (ja) 対話型情報検索装置および対話型情報検索方法
JP2005055827A (ja) 音声認識装置、及び音声認識方法
JP4702081B2 (ja) 文字入力装置
JP2009271835A (ja) 機器操作制御装置及びプログラム
JP4229627B2 (ja) ディクテーション装置、方法及びプログラム
CN113160808A (zh) 一种语音控制方法及其系统、语音控制设备
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法
JP2008059571A (ja) 音声入力装置及び機器操作方法
JP2008233009A (ja) カーナビゲーション装置及びカーナビゲーション装置用プログラム
CN115877997B (zh) 一种面向交互元素的语音交互方法、系统及存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070529