JP3760755B2 - 音声入力装置 - Google Patents
音声入力装置 Download PDFInfo
- Publication number
- JP3760755B2 JP3760755B2 JP2000310115A JP2000310115A JP3760755B2 JP 3760755 B2 JP3760755 B2 JP 3760755B2 JP 2000310115 A JP2000310115 A JP 2000310115A JP 2000310115 A JP2000310115 A JP 2000310115A JP 3760755 B2 JP3760755 B2 JP 3760755B2
- Authority
- JP
- Japan
- Prior art keywords
- voice input
- user
- driving
- ultrasonic
- input device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Description
【発明の属する技術分野】
この発明は、使用者の発話と音声辞書内の認識対象語との一致度を、音声認識を用いて演算し、最も一致度の高い認識対象語を音声辞書内から抽出して、操作対象機器に動作指令を出力する音声入力装置に関する。
【0002】
【従来の技術】
図10は、従来の音声入力装置の全体構成を示すブロック図であり、この音声入力装置は、自動車に搭載されるものである。この音声入力装置は、CPU1およびメモリ3を備えた信号処理装置5に、認識対象語を含む音声辞書7aを備えた外部記憶装置7が接続されている。
【0003】
信号処理装置5には、A/Dコンバータ9を介してマイク11が、D/Aコンバータ13を介して出力アンプ15およびスピーカ17がそれぞれ接続されるとともに、対話開始スイッチ19およびモニタディスプレイ21が接続されている。そして、マイク11から入力される使用者の音声により指示した、ラジオやCDプレイヤー,エアコンなどの複数の操作対象機器23のいずれかに対し、制御信号Sを出力して動作させる。
【0004】
図11は、外部記憶装置7に格納されている音声辞書7aを示している。この音声辞書7aは、使用者が音声を使って自動車に搭載されているラジオ,CDプレイヤーおよびエアコンを作動させる場合の認識対象語を記憶している辞書である。図中で、1101〜1109で表記される発話を受け付けることができ、Xで示したのは数字部分である。例えば、使用者が「シーディー ジュウバン」と発話した結果、1106の認識対象語が抽出されれば、音声認識が成功したといえる。
【0005】
次に、上記した従来の音声入力装置の作用を図12のフローチャートに基づき説明する。まず、信号処理装置5は、電源ONとともに外部記憶装置7に含まれる音声辞書7aをメモリ3に読み込む(ステップ1200)。ここで、対話開始スイッチ19が使用者によって操作され(ステップ1201)、使用者が音声辞書7aに含まれる言葉を発話することで、音声の取り込みが開始される(ステップ1202)。例えば「シーディー ジュウバン」と発話したとすると、この言葉を信号処理装置5は、次のように音声として検出する。
【0006】
マイク11から入力された音声信号はA/Dコンバータ9でデジタル信号に変換され信号処理装置5に入力される。信号処理装置5は対話開始スイッチ19が押されるまでは、前記デジタル信号の平均パワーを演算している。対話開始スイッチ19が操作された後、前記平均パワーにくらべてデジタル信号の瞬間パワーが所定値以上大きくなった場合、使用者が発話したと判断し、音声取り込みを開始する。
【0007】
次に、信号処理装置5は、メモリ3に読み込んだ音声辞書7a内の認識対象語群と前記発話した音声区間部分との一致度を演算する(ステップ1203)。一致度の演算は、近年の音声認識アルゴリズムの主流となっているHMM法などにより行われる。なお、この動作を行う間も、並列処理により音声取り込みは継続されている。デジタル信号の瞬間パワーが所定時間以上所定値以下になったとき、使用者の発話が終了したと判断し、音声の取り込み動作を終了する(ステップ1204)。
【0008】
信号処理装置5は一致度の演算終了後、最も一致度の高い認識対象語を選択する(ステップ1205)。ここでは認識対象語1106において「シーディー」に続く数字部Xが10である認識対象語の一致度が最も高くなる。続いて信号処理装置5は、前記一致度の高い認識対象語を認識の結果として音声で使用者にフィードバックする(ステップ1206)。すなわち、外部記憶装置7に記憶された音声合成データを用いて「シーディープレイヤーの10曲目を再生します。」という音声メッセージを合成し、アンプ15、スピーカ17を通して出力する。
【0009】
次に信号処理装置5は、図示しない確定スイッチが所定時間の間に使用者によって押されたかどうかを検出し(ステップ1207)、検出された場合には、認識対象語に対応した操作対象機器23に動作指令を出力する(ステップ1208)。この場合はCDプレイヤーに対し、現在のディスク上の10曲目の曲を再生する指示を出す。前記ステップ1207で、所定時間の間に検出されなかった場合あるいは図示しない取り消しスイッチの操作が検出された場合には、前記ステップ1201に戻る。
【0010】
【発明が解決しようとする課題】
ところで、上記した従来の音声入力装置は、必ず「シーディー」や「エアコン」などの操作対象機器名から始まる発話を受け付けるようになっている。これは認識率を確保するためである。すなわち操作対象機器名を省いた発話を受け付け可能にすると、音声辞書内に発話が似てしまう認識対象語が現れる可能性が高くなる。
【0011】
例えば、図11の音声辞書において、認識対象語1106から操作対象機器名のCDを省くと「X−番」となり、また同1107から操作対象機器名のエアコンを省くと「X−度」となってしまい、両者の発音が似ているため発話の明瞭でない使用者や、騒音が多い場合には誤認識してしまう可能性が高くなってしまう。よって操作対象機器名を付加した音声辞書が有効となるが、その場合操作対象機器名と操作内容の両方を発話しなくてはならず、発話の長さが長くなり、使用者にとって煩わしさが伴うことになる。
【0012】
そこで、この発明は、音声認識能力を充分確保しつつ、発話をより短縮させて操作の煩わしさを解消することを目的としている。
【0013】
【課題を解決するための手段】
前記目的を達成するために、請求項1の発明は、対話開始スイッチが操作されたときになされた使用者の発話と、認識対象語を格納する音声辞書内の前記認識対象語との一致度を、音声認識を用いて演算し、最も一致度の高い認識対象語を前記音声辞書内から抽出し、その抽出結果に基づいて操作対象機器に動作指令を出力する音声入力装置において、前記対話開始スイッチが操作されたときに信号波を送信することで遠隔操作の指令を行う遠隔操作機器と、前記送信波を受信する複数の受信機と、前記複数の受信機の受信結果から、前記遠隔操作機器が向けられている方向を検出し、使用者が操作しようとしている操作対象機器を推定する推定手段と、使用者の発話を受けて音声認識処理を行うときに、前記推定された操作対象機器に関する前記音声辞書内の認識対象語の重み付けを、他の操作対象機器より大きくする構成としてある。
【0014】
請求項2の発明は、請求項1の発明の構成において、受信機は、受信した信号波の受信強度を検出する受信強度検出部を備え、前記推定手段は、この受信強度検出部が検出した信号波の受信強度が大きい操作対象機器ほど重み付けを大きくする構成としてある。
【0015】
請求項3の発明は、請求項1の発明の構成において、推定手段は、遠隔操作機器の3次元位置および方位を検出する位置方位検出手段で構成されている。
【0016】
請求項4の発明は、請求項3の発明の構成において、位置方位検出手段は、遠隔操作機器に設けられた少なくとも2つの超音波発信機と、この超音波発信機から発信された超音波を受信する、前記遠隔操作機器の周囲に配置した少なくとも3つの超音波受信機と、前記各超音波発信機から発信された超音波が前記各超音波受信機に到達するまでの時間に基づいて、前記各超音波発信機の3次元位置をそれぞれ検出する超音波発信機位置検出部とを備える構成としてある。
【0017】
請求項5の発明は、請求項1ないし4のいずれかの発明の構成において、操作対象機器は、自動車の室内に設置され、前記自動車を運転する使用者の運転負荷を検出する運転負荷検出手段を設け、この運転負荷検出手段が検出した運転負荷が大きい状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定する構成としてある。
【0018】
請求項6の発明は、請求項5の発明の構成において、運転負荷検出手段は、使用者の自動車に対する運転操作の忙しさを検出する運転操作負荷検出部を備え、この運転操作負荷検出部が検出した運転操作負荷が大きい状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定する構成としてある。
【0019】
請求項7の発明は、請求項5または6の発明の構成において、運転負荷検出手段は、使用者の自動車に対する運転の注意力の必要性を検出する注意力必要性検出部を備え、この注意力必要性検出部が検出した注意力必要性が高い状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定する構成としてある。
【0020】
請求項8の発明は、請求項1ないし7のいずれかの発明の構成において、最も一致度の高い認識対象語の抽出を行った後に、遠隔操作機器の向けられている方向が変化した場合、最も一致度の高い認識対象語の抽出処理を再度行う構成としてある。
【0021】
【発明の効果】
請求項1の発明によれば、信号波を送信する遠隔操作機器が向けられている操作対象機器を、複数の受信機の受信結果から推定し、使用者の発話を受けて音声認識処理を行うときに、前記推定された操作対象機器に関する音声辞書内の認識対象語の重み付けを、他の操作対象機器より大きくするようにしたため、発話をより短縮させた音声辞書を用いた場合でも、音声認識能力を充分確保でき、操作の煩わしさを解消することができる。
【0022】
請求項2の発明によれば、受信機は、遠隔操作機器から信号波を受信してその受信強度を検出する受信強度検出部を備えており、推定手段は、この受信強度検出部が検出した受信強度が大きい操作対象機器ほど、重付けを大きくするようにしたため、構成の複雑さを招くことなく、遠隔操作機器が向けられている操作対象機器の推定を確実に行うことができる。
【0023】
請求項3の発明によれば、推定手段は、遠隔操作機器の3次元位置および方位を検出する位置方位検出手段で構成されているため、構成の複雑さを招くことなく、遠隔操作機器が向けられている操作対象機器の推定を確実に行うことができる。
【0024】
請求項4の発明によれば、位置方位検出手段は、遠隔操作機器に設けられた少なくとも2つの超音波発信機と、この超音波発信機から発信された超音波を受信する、前記遠隔操作機器の周囲に配置した少なくとも3つの超音波受信機と、前記超音波発信機から発信された超音波が前記超音波受信機に到達するまでの時間に基づいて、前記各超音波発信機の3次元位置および方位をそれぞれ検出する超音波発信機位置検出手段とから構成されているため、構成の複雑さを招くことなく、遠隔操作機器が向けられている操作対象機器の推定を確実に行うことができる。
【0025】
請求項5の発明によれば、操作対象機器が搭載される自動車を運転する使用者の運転負荷を検出する運転負荷検出手段を設け、この運転負荷検出手段が検出した運転負荷が大きい状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定するようにしたため、運転負荷が大きく、遠隔操作機器を正確に操作対象機器に向けられないような場合でも、遠隔操作機器が向けられている操作対象機器の推定を確実に行うことができる。
【0026】
請求項6の発明によれば、運転負荷検出手段は、使用者の自動車に対する運転操作の忙しさを検出する運転操作負荷検出部を備え、この運転操作負荷検出部が検出した運転操作負荷が大きい状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定するようにしたため、使用者が運転操作に忙しく、遠隔操作機器を正確に操作対象機器に向けられないような場合でも、遠隔操作機器が向けられている操作対象機器の推定を確実に行うことができる。
【0027】
請求項7の発明によれば、運転負荷検出手段は、使用者の自動車に対する運転の注意力の必要性を検出する注意力必要性検出部を備え、この注意力必要性検出手段が検出した注意力必要性が高い状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定するようにしたため、使用者が運転の注意力の必要性が高く、遠隔操作機器を正確に操作対象機器に向けられないような場合でも、遠隔操作機器が向けられている操作対象機器の推定を確実に行うことができる。
【0028】
請求項8の発明によれば、最も一致度の高い認識対象語の抽出を行った後に、遠隔操作機器の向けられている方向が変化した場合、最も一致度の高い認識対象語の抽出処理を再度行うようにしたため、遠隔操作機器による操作対象機器の指示を誤った場合に、直ちに修正することができる。
【0029】
【発明の実施の形態】
以下、この発明の実施の形態を図面に基づき説明する。
【0030】
図1は、この発明の実施の一形態に係わる音声入力装置の全体構成を示すブロック図であり、この音声入力装置は、前記した従来のものと同様に自動車に搭載されるものであり、CPU25およびメモリ27を備えた信号処理装置29に、認識対象語を含む音声辞書31備えた外部記憶装置33が接続されている。
【0031】
信号処理装置29には、A/Dコンバータ35を介してマイク37が、D/Aコンバータ39を介して出力アンプ41およびスピーカ43がそれぞれ接続されるとともに、モニタディスプレイ45が接続されている。そして、マイク37から入力される使用者の音声により指示した、ラジオやCDプレイヤー,エアコンなどの複数の操作対象機器47のうちのいずれかに対し、制御信号Sを出力して動作させる。
【0032】
信号処理装置29にはさらに、車輪速センサ49,ナビゲーション装置51,操舵角センサ53およびアクセルペダルセンサ55のそれぞれの検出信号が入力されるよう接続されている。
【0033】
図2は、上記した操作対象機器47が、自動車の車室内におけるダッシュ回りに設置された状態を示している。図中の上部からエアコンのコントロールユニット57,ラジオおよびCDプレイヤーを含むカーオーディオのコントロールユニット59,CDの挿入口61がそれぞれ配置されている。コントロールユニット57,59およびCDの挿入口61には、受信機63,65および67がそれぞれ設けられ、これら各受信機63,65および67は、図1に示すように外部記憶装置33に受信信号が入力されるよう接続されている。この各受信機63,65および67は、後述するリモコン71から送信される信号波となる電磁波信号の受信強度を検出する受信強度検出部を備えている。また、外部記憶装置29には、リモコン71による電磁波の照射範囲を変更させるための信号を送信する送信機69も接続されている。
【0034】
そして、上記した各受信機63,65および67に向けて電磁波を送信することで、操作対象機器47に対して遠隔操作の指令を行う遠隔操作機器としての前記したリモコン71が、本音声入力装置に備えられている。このリモコン71には、電磁波を送信する電磁波送信機72および対話開始スイッチ73がそれぞれ設けられている。
【0035】
図3は、外部記憶装置33に格納されている音声辞書31を示している。この音声辞書31は、使用者が音声を使って自動車に搭載されているラジオ,CDプレイヤーおよびエアコンを作動させる場合の認識対象語を記憶している辞書である。図3中で、301〜315で表記される発話を受け付けることができ、Xで示したのは数字部分である。例えば、使用者が「シーディー ジュウバン」と発話した結果、306の認識対象語が抽出されれば、音声認識が成功したといえる。
【0036】
また、この音声辞書31は、前記従来の図11に示した音声辞書71aと異なり、認識対象語として、307〜309および313〜315の発話を受け付けるようになっている。すなわち、307〜309は「シーディー」を省略したものであり、313〜315は「エアコン」を省略したものである。
【0037】
さらに、この音声辞書31は、操作対象機器47毎に、重み付けの値を記録する記憶領域を備えている。ここでは、各操作対象機器47に対する初期の重み付けが1.0としてある。
【0038】
次に、上記した構成の音声入力装置の作用を図4のフローチャートに基づき説明する。まず、信号処理装置29は電源ONとともに外部記憶装置33に含まれる音声辞書31をメモリ27に読み込む(ステップ400)。ここで、リモコン71上の対話開始スイッチ73が使用者によって操作されると、リモコン71から、対話開始スイッチ73の検出を知らせるための電磁波信号が信号波として送信される。
【0039】
そして、受信機63,65,67の少なくとも1つが前記電磁波信号を受信すると(ステップ401)、信号処理装置29は、音声入力処理を開始した旨を使用者に知らせるために、外部記憶装置33に記憶してある告知音信号を、D/Aコンバータ39,出力アンプ41およびスピーカ43を介して出力させる(ステップ402)。
【0040】
次に、信号処理装置29は、リモコン71がどの操作対象機器47に向けられているかに応じて、図3の音声辞書31内の1.0となっている重み付けを変更する。すなわち、信号処理装置29は、各受信機63,65,67の受信強度検出部が検出した電磁波の受信強度を比較し、最も受信強度の大きい操作対象機器47を、使用者が操作しようとしている操作対象機器47と推定し、これによりリモコン71の向けられている方向を検出した後、前記推定された操作対象機器47を動作させるための認識対象語の重み付けを増加させる(ステップ403)。したがって、上記信号処理装置29は、受信強度検出部とともに、リモコン71が向けられている操作対象機器47を推定する推定手段を構成している。
【0041】
例えば、今リモコン71がカーオーディオのコントロールユニット59に向けられているとする。カーオーディオはラジオおよびCDを含むので、信号処理装置29はラジオおよびCDを操作するための認識対象語の重み付けを、図5のように増加させる。すなわち、図3ではすべての認識対象語の重み付けは等しく1.0となっているものが、重み付けを増加させた後は、ラジオ操作のための認識対象語301,302およびCDを操作させるための認識対象語303〜309の重み付けが1.2に増加している。この重み付けは後述するステップ407において演算結果の一致度に乗算され、その結果が新たな一致度となる。
【0042】
ここで使用者が、音声辞書31に含まれる言葉、例えば「ジュウバン」を発話したとすると、信号処理装置29は、音声を次のように検出する。マイク37からの信号は、A/Dコンバータ35でデジタル信号に変換され信号処理装置29に入力される。信号処理装置29はリモコン71上の対話開始スイッチ73が押されたことを知らせる電磁波信号を受信するまでは、前記デジタル信号の平均パワーを演算している。対話開始スイッチ73が操作された後、前記平均パワーにくらべてデジタル信号の瞬間パワーが所定値以上大きくなったとき、使用者が発話したと判断し、音声取り込みを開始する(ステップ404)。
【0043】
次に信号処理装置29は、メモリ27に読み込んだ音声辞書31内の認識対象語群と前記発話した音声区間部分との一致度を演算する(ステップ405)。一致度の演算は、従来技術と同様に、近年の音声認識アルゴリズムの主流となっているHMM法などにより行われるものとする。なお、この動作を行う間も、並列処理により音声取り込みは継続されている。前記デジタル信号の瞬間パワーが所定時間以上所定値以下になったとき、使用者の発話が終了したと判断し、音声の取り込み動作を終了する(ステップ406)。
【0044】
さらに信号処理装置29は、一致度の演算終了を待つ。通常は図3において数字部Xが10である認識対象語309の一致度が最も高くなる。しかし、話者の音声の特性や周囲の騒音の量などによって、他の認識対象語の一致度が最高になる場合がある。例えば、数字部Xが10である認識対象語313の一致度が最も高くなったとする。一致度は0以上3桁の整数値で表現され、認識対象語313の一致度が600で最大値であり、それに引き続き認識対象語309の一致度が550であったとする。このままでは誤認識であるが、信号処理装置29は各々の一致度に重み付けを乗算する。認識対象語313の重み付けは1.0であるので乗算の結果最終的な一致度は600×1.0=600である。それに対し認識対象語309の重み付けは1.2であるので乗算の結果最終的な一致度は550×1.2=660となる。よって最終的な一致度が最大である認識対象語は309となり(ステップ407)、使用者の発話と一致することとなる。
【0045】
このように、操作対象機器47の名称(この例では「CD」)を省略した発話であっても、音声認識能力を充分確保することができ、使用者にとって煩わしさが解消されたものとなる。
【0046】
次に、信号処理装置29は、前記一致度の高い認識対象語を認識の結果として音声で使用者にフィードバックする(ステップ408)。すなわち、外部記憶装置33に記憶された音声合成データを用いて「シーディープレイヤーの10曲目を再生します。」という音声メッセージを合成し、これをD/Aコンバータ39,出力アンプ41およびスピーカ43を通して出力する。
【0047】
ここで信号処理装置29は、使用者がリモコン71を他の操作対象機器47に向け直して修正していないかどうかをチェックし、向け直している場合は重み付けを変更して(ステップ409)前記ステップ405に戻る。これは、使用者が意図しない操作対象機器47にリモコン71が向けられてしまっている場合の修正を直ちに行うための処理である。これにより使用者は、再度発話する必要がなく、リモコン71を目標とする操作対象機器47に向け直すだけで修正を行うことができる。
【0048】
続いて信号処理装置29は、図示しない確定スイッチが所定時間の間に使用者によって押されるかどうかを検出し(ステップ411)、検出された場合には、認識対象語に対応した操作対象機器47に動作指令を出力する(ステップ413)。この場合はCDプレイヤーに対し、現在のディスク上の10曲目の曲を再生する指示を出す。前記ステップ411で、所定時間の間に検出されなかった場合あるいは図示しない取り消しスイッチの操作が検出された場合には前記ステップ401に戻る。
【0049】
図6は、上記実施の形態におけるリモコン71から操作対象機器47に向けて照射される電磁波の照射範囲を、自動車を運転する際の使用者の運転負荷に応じて変更させる動作を示すフローチャートである。この動作の処理は、数百ミリ秒程度の一定周期で起動される。
【0050】
運転負荷Wは、使用者の運転操作の忙しさを示す運転操作負荷Wdと、使用者が運転に注意を向けるべき度合いを示す注意必要性Wcとの和である。運転操作負荷Wdは、ハンドル操舵のための運転操作負荷Wdwとアクセルペダル操作のための運転操作負荷Wdaとの和である。注意必要性Wcは、現在速度に対する注意の必要性Wcvと走行道路に対する注意の必要性Wcrとの和である。
【0051】
まず、運転操作負荷Wdの算出作業を説明する。信号処理装置29は、本フローチャートで示す処理が起動される毎に使用者の操舵角θ(t)を操舵角センサ53から読み取るとともに、使用者のアクセルペダルの操作角A(t)をアクセルペダルセンサ55から読み取る(ステップ600)。読み取った操舵角θ(t)および操作角A(t)について、それぞれ過去Nwサンプル(θ(1),θ(2),・・・θ(Nw))および過去Naサンプル(A(1),A(2),・・・A(Na))にわたって記憶保持する(ステップ601)。
【0052】
次に、運転操作負荷WdwおよびWdaを、次式(1)および(2)でそれぞれ算出する(ステップ602)。
【0053】
【数1】
なお、Max(Wdw)はWdwの最大値であり、実験的に求められる。またWdwは最大値が1となるように制限される。
【0054】
【数2】
なお、Max(Wda)はWdaの最大値であり、実験的に求められる。またWdaは最大値が1となるように制限される。
【0055】
続いて、運転負荷Wdを次式(3)により算出する(ステップ603)。
【0056】
Wd=k×Wdw+(1−k)×Wda (式3)
なお、kは0より大きく1より小さい値である。
【0057】
以上より、操舵角センサ53およびアクセルペダルセンサ55は、使用者の自動車に対する運転操作の忙しさを検出する運転操作負荷検出部を備えた運転負荷検出手段を構成していることになる。
【0058】
次に注意必要性Wcの算出作業を説明する。信号処理装置29は車両の現在の車速Vを車輪速センサ49から読み取り(ステップ604)、現在速度に対する注意必要性Wcvを次式(4)で算出する(ステップ605)。
【0059】
Wcv=V/Max(V) (式4)
なお、Max(V)はVの最大値であり、実験的に求められる。またWcvは最大値が1となるように制限される。
【0060】
次に走行道路に対する注意必要性Wcrをナビゲーション装置51から受信する(ステップ607)。ナビゲーション装置51は路線毎の注意の必要性を記憶している。その値は0より大きく1より小さい値であり、たとえば市街地の路線に対しては0.8、幅員の大きい自動車専用道路では0.2のような値となる。
【0061】
続いて、注意必要性Wcを次式(5)により算出する(ステップ607)。
【0062】
Wc=h×Wcv+(1−h)×Wcr (式5)
なお、kは0より大きく1より小さい値である。
【0063】
以上より、車輪速センサ49およびナビゲーション装置51は、使用者の自動車に対する運転の注意力の必要性を検出する注意力必要性検出部を備えた運転負荷検出手段を構成していることになる。
【0064】
最後に、運転負荷Wを次式(6)により算出する(ステップ608)。
【0065】
W=g×Wd+(1−g)×Wc (式6)
なお、gは0より大きく1より小さい値である。
【0066】
算出された運転負荷Wは、所定値Bと比較され(ステップ609)、W≧Bのときには、信号処理装置29はリモコン71から照射される電磁波照射範囲を拡大する指令を、送信機69からリモコン71に対して送信する(ステップ610)。これにより、運転負荷Wが大きいときには、リモコン71を目標とする操作対象機器47に正確に向けなくも、使用者が希望する操作対象機器47に電磁波を確実に送信でき、その操作対象機器47に対して音声認識による操作を確実に行うことができる。
【0067】
一方、運転負荷Wが所定値Bより小さいときには、信号処理装置29は電磁波照射範囲を縮小する指令を送信機69からリモコン71に対して送信する(ステップ611)。これにより、不要な電力の電磁波を常に出力する必要がなく、電力を節約することができ、同時にリモコン71上の電磁波発信素子の寿命を延ばすことができる。
【0068】
次に、他の実施形態を説明する。この実施形態は、前記図4のフローチャート中のステップ403でのリモコン71の向けられた方向の検出を、次の原理で行うものである。ここでのリモコン71は、図7に示すように電磁波送信機72に加え、先端部の超音波発信機75と後端部の超音波発信機77を備えている。そして、この2つの超音波発信機75および77から発信される超音波の伝播速度と、リモコン71の周囲に位置する車室内の所定位置(図8中のC1,C2,C3)に配置された3つの超音波受信機の位置との関係を用い、超音波発信機75および77の3次元位置を算出する。2つの超音波発信機75,77の位置が求められれば、リモコン71が向けられた方向を知ることができる。
【0069】
超音波発信機75,77の位置と超音波受信機の位置関係を図8に示す。図中Pが超音波発信機75(または77)の位置であり、車室内3個所C1〜C3に超音波受信機が設置してある。リモコン71上の対話開始スイッチ73が使用者によって操作されると、リモコン71は電磁波送信機72から対話開始スイッチ73の検出を知らせるための電磁波信号を送信すると同時に、2つの超音波発信機75,77から超音波を発信する。
【0070】
信号処理装置29は図示しないタイマにより、受信機63,65,67の何れかが前記電磁波信号を受信してから超音波受信機C1〜C3に超音波が到達するまでの時間を計測する。光の伝播速度は音の伝播速度に比べてはるかに大きいので、次式(7)によりPのC1,C2,C3までの距離Li(L1,L2,L3)をそれぞれ算出できる。
【0071】
Li=Ti×Vs (式7)
なお、i={1,2,3}であり、TiはCi(C1,C2,C3)にて計測された音の伝播時間であり、Vsは音の伝播速度である。
【0072】
Ciの座標を{Xi,Yi,Zi}とおくと、Pの座標{X,Y,Z}は下式(8)を満たす。
【0073】
{(X−Xi)2+(Y−Yi)2+(Z−Zi)2}1/2=Li(式8)
i={1,2,3}であり、式8は3元連立方程式となり、解を求めることが可能である。これにより超音波発信機75(77)の座標を求めることができる。
【0074】
この原理により2つの超音波発信機75,77の座標を求めれば、図9に示すように、リモコン71が向けられる方向D、すなわちリモコン71がどの操作対象機器47に向けられているかを容易に検出することができる。
【0075】
以上より、超音波発信機75,77、超音波受信機および信号処理装置29により、リモコン71の向けられる方向を推定する推定手段となる位置方位検出手段を構成しており、信号処理装置29は超音波発信機75,77の3次元位置を検出する超音波発信機位置検出部を備えていることになる。
【図面の簡単な説明】
【図1】この発明の実施の一形態に係わる音声入力装置の全体構成を示すブロック図である。
【図2】図1の音声入力装置における操作対象機器が自動車の車室内におけるダッシュ回りに配置された状態を示す説明図である。
【図3】図1の音声入力装置における音声辞書を示す説明図である。
【図4】図1の音声入力装置の動作を示すフローチャートである。
【図5】図3の音声辞書における認識対象語に重み付けをした説明図である。
【図6】図1の音声入力装置において、運転負荷に応じて電磁波の照射範囲を変更させる動作を示すフローチャートである。
【図7】この発明の他の実施形態に係わる音声入力装置に使用されるリモコンの説明図である。
【図8】図7の音声入力装置における2つの超音波発信機と3つの超音波受信機との位置関係を示す説明図である。
【図9】図7の音声入力装置におけるリモコンが向けられる方向を示す説明図である。
【図10】従来の音声入力装置の全体構成を示すブロック図である。
【図11】図10の音声入力装置における音声辞書を示す説明図である。
【図12】図11の音声入力装置の動作を示すフローチャートである。
【符号の説明】
29 信号処理装置(推定手段、超音波発信機位置検出部、位置方位検出手段、超音波発信機位置検出部)
31 音声辞書
47 操作対象機器
49 車輪速センサ(運転負荷検出手段,注意力必要性検出部)
51 ナビゲーション装置(運転負荷検出手段,注意力必要性検出部)
53 操舵角センサ(運転負荷検出手段,運転操作負荷検出部)
55 アクセルペダルセンサ(運転負荷検出手段,運転操作負荷検出部)
71 リモコン(遠隔操作機器)
75,77 超音波発信機(推定手段、位置方位検出手段)
Claims (8)
- 対話開始スイッチが操作されたときになされた使用者の発話と、認識対象語を格納する音声辞書内の前記認識対象語との一致度を、音声認識を用いて演算し、最も一致度の高い認識対象語を前記音声辞書内から抽出し、その抽出結果に基づいて操作対象機器に動作指令を出力する音声入力装置において、前記対話開始スイッチが操作されたときに信号波を送信することで遠隔操作の指令を行う遠隔操作機器と、前記送信波を受信する複数の受信機と、前記複数の受信機の受信結果から、前記遠隔操作機器が向けられている方向を検出し、使用者が操作しようとしている操作対象機器を推定する推定手段と、使用者の発話を受けて音声認識処理を行うときに、前記推定された操作対象機器に関する前記音声辞書内の認識対象語の重み付けを、他の操作対象機器より大きくすることを特徴とする音声入力装置。
- 受信機は、受信した信号波の受信強度を検出する受信強度検出部を備え、推定手段は、この受信強度検出部が検出した信号波の受信強度が大きい操作対象機器ほど重み付けを大きくすることを特徴とする請求項1記載の音声入力装置。
- 推定手段は、遠隔操作機器の3次元位置および方位を検出する位置方位検出手段で構成されていることを特徴とする請求項1記載の音声入力装置。
- 位置方位検出手段は、遠隔操作機器に設けられた少なくとも2つの超音波発信機と、この超音波発信機から発信された超音波を受信する、前記遠隔操作機器の周囲に配置した少なくとも3つの超音波受信機と、前記各超音波発信機から発信された超音波が前記各超音波受信機に到達するまでの時間に基づいて、前記各超音波発信機の3次元位置をそれぞれ検出する超音波発信機位置検出部とを備えていることを特徴とする請求項3記載の音声入力装置。
- 操作対象機器は、自動車の室内に設置され、前記自動車を運転する使用者の運転負荷を検出する運転負荷検出手段を設け、この運転負荷検出手段が検出した運転負荷が大きい状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定することを特徴とする請求項1ないし4のいずれかに記載の音声入力装置。
- 運転負荷検出手段は、使用者の自動車に対する運転操作の忙しさを検出する運転操作負荷検出部を備え、この運転操作負荷検出部が検出した運転操作負荷が大きい状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定することを特徴とする請求項5記載の音声入力装置。
- 運転負荷検出手段は、使用者の自動車に対する運転の注意力の必要性を検出する注意力必要性検出部を備え、この注意力必要性検出部が検出した注意力必要性が高い状態のとき、遠隔操作機器から送信される信号波の照射範囲を広く設定することを特徴とする請求項5または6記載の音声入力装置。
- 最も一致度の高い認識対象語の抽出を行った後に、遠隔操作機器の向けられている方向が変化した場合、最も一致度の高い認識対象語の抽出処理を再度行うことを特徴とする請求項1ないし7のいずれかに記載の音声入力装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000310115A JP3760755B2 (ja) | 2000-10-11 | 2000-10-11 | 音声入力装置 |
US09/971,698 US7047198B2 (en) | 2000-10-11 | 2001-10-09 | Audio input device and method of controlling the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000310115A JP3760755B2 (ja) | 2000-10-11 | 2000-10-11 | 音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002116791A JP2002116791A (ja) | 2002-04-19 |
JP3760755B2 true JP3760755B2 (ja) | 2006-03-29 |
Family
ID=18790130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000310115A Expired - Fee Related JP3760755B2 (ja) | 2000-10-11 | 2000-10-11 | 音声入力装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7047198B2 (ja) |
JP (1) | JP3760755B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005062294A1 (ja) | 2003-12-05 | 2005-07-07 | Kabushikikaisha Kenwood | 機器制御装置、音声認識装置、エージェント装置、データ構造及び機器制御方法 |
US7424431B2 (en) * | 2005-07-11 | 2008-09-09 | Stragent, Llc | System, method and computer program product for adding voice activation and voice control to a media player |
JP5014662B2 (ja) * | 2006-04-13 | 2012-08-29 | アルパイン株式会社 | 車載用音声認識装置及び音声認識方法 |
US20080071540A1 (en) * | 2006-09-13 | 2008-03-20 | Honda Motor Co., Ltd. | Speech recognition method for robot under motor noise thereof |
US8219399B2 (en) * | 2007-07-11 | 2012-07-10 | Garmin Switzerland Gmbh | Automated speech recognition (ASR) tiling |
US20090018842A1 (en) * | 2007-07-11 | 2009-01-15 | Garmin Ltd. | Automated speech recognition (asr) context |
JP2012047924A (ja) * | 2010-08-26 | 2012-03-08 | Sony Corp | 情報処理装置、および情報処理方法、並びにプログラム |
EP2866436A1 (en) | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method and apparatus for transmission and reception of media data |
DE112014006409T5 (de) * | 2014-02-26 | 2016-12-08 | Mitsubishi Electric Corporation | Fahrzeugsteuervorrichtung und Fahrzeugsteuerverfahren |
JP6567268B2 (ja) * | 2014-11-18 | 2019-08-28 | 株式会社東芝 | 信号処理装置、サーバ装置、検知システム及び信号処理方法 |
US11587559B2 (en) * | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
TW202021377A (zh) * | 2018-11-23 | 2020-06-01 | 廣達電腦股份有限公司 | 揚聲系統及應用其之揚聲控制方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69322349T3 (de) * | 1992-09-30 | 2004-06-09 | Hitachi, Ltd. | Informationssystem für den Fahrer eines Fahrzeuges |
JP2935256B2 (ja) | 1993-10-22 | 1999-08-16 | 本田技研工業株式会社 | 車両用音声出力装置 |
JP3530591B2 (ja) | 1994-09-14 | 2004-05-24 | キヤノン株式会社 | 音声認識装置及びこれを用いた情報処理装置とそれらの方法 |
JPH0898051A (ja) | 1994-09-28 | 1996-04-12 | Toshiba Corp | テレビジョン受像機 |
JP2753960B2 (ja) | 1994-10-27 | 1998-05-20 | エルジー電子株式会社 | ポイント型無線調整装置及びその調整方法 |
JPH08214183A (ja) | 1995-02-07 | 1996-08-20 | Matsushita Electric Ind Co Ltd | リモコン位置検出機能付映像音響装置 |
JPH0934488A (ja) | 1995-07-18 | 1997-02-07 | Mazda Motor Corp | 車載機器の音声操作装置 |
US5835008A (en) * | 1995-11-28 | 1998-11-10 | Colemere, Jr.; Dale M. | Driver, vehicle and traffic information system |
JPH109812A (ja) | 1996-06-26 | 1998-01-16 | Fuji Xerox Co Ltd | 位置検出デバイスおよび位置検出装置 |
EP1767406A1 (en) * | 1996-11-13 | 2007-03-28 | Toyota Jidosha Kabushiki Kaisha | Vehicle information communication device and vehicle communication system |
FR2761837B1 (fr) * | 1997-04-08 | 1999-06-11 | Sophie Sommelet | Dispositif d'aide a la navigation ayant une architecture distribuee basee sur internet |
DE19736406B4 (de) * | 1997-08-21 | 2007-05-16 | Siemens Ag | Einrichtung zum Steuern eines automatischen Getriebes für ein Kraftfahrzeug |
JP3547300B2 (ja) * | 1997-12-04 | 2004-07-28 | 株式会社日立製作所 | 情報交換システム |
US6181343B1 (en) * | 1997-12-23 | 2001-01-30 | Philips Electronics North America Corp. | System and method for permitting three-dimensional navigation through a virtual reality environment using camera-based gesture inputs |
JP3500948B2 (ja) | 1998-02-18 | 2004-02-23 | 株式会社デンソー | 音声認識装置 |
US6441778B1 (en) * | 1999-06-18 | 2002-08-27 | Jennifer Durst | Pet locator |
US6728531B1 (en) * | 1999-09-22 | 2004-04-27 | Motorola, Inc. | Method and apparatus for remotely configuring a wireless communication device |
US6377825B1 (en) * | 2000-02-18 | 2002-04-23 | Cellport Systems, Inc. | Hands-free wireless communication in a vehicle |
-
2000
- 2000-10-11 JP JP2000310115A patent/JP3760755B2/ja not_active Expired - Fee Related
-
2001
- 2001-10-09 US US09/971,698 patent/US7047198B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7047198B2 (en) | 2006-05-16 |
US20020059067A1 (en) | 2002-05-16 |
JP2002116791A (ja) | 2002-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110691299B (zh) | 音频处理系统、方法、装置、设备及存储介质 | |
US9230538B2 (en) | Voice recognition device and navigation device | |
JP3760755B2 (ja) | 音声入力装置 | |
JP4779748B2 (ja) | 車両用音声入出力装置および音声入出力装置用プログラム | |
US9338549B2 (en) | Acoustic localization of a speaker | |
US7680667B2 (en) | Interactive robot, speech recognition method and computer program product | |
EP1081682A2 (en) | Method and system for microphone array input type speech recognition | |
JP2004109361A (ja) | 指向性設定装置、指向性設定方法及び指向性設定プログラム | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
JP2016126022A (ja) | 音声処理装置 | |
JP2016167645A (ja) | 音声処理装置及び制御装置 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP3654045B2 (ja) | 音声認識装置 | |
JPH11126092A (ja) | 音声認識装置および車両用音声認識装置 | |
JP2000322078A (ja) | 車載型音声認識装置 | |
JP2001013994A (ja) | 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両 | |
JP4410378B2 (ja) | 音声認識方法および装置 | |
KR20190016851A (ko) | 음성 인식 방법 및 이에 사용되는 장치 | |
JP3897946B2 (ja) | 緊急情報送信システム | |
JP2005354223A (ja) | 音源情報処理装置、音源情報処理方法、音源情報処理プログラム | |
CN112562664A (zh) | 音响调节方法、系统、车辆及计算机存储介质 | |
JPH023520B2 (ja) | ||
JP6978888B2 (ja) | 感度調整装置、車載システム、車用ヘッドレスト及び信号処理装置 | |
KR20170015759A (ko) | 듀얼 마이크를 이용한 위상오류필터 기반의 음원 방향 검출 시스템 및 그 방법 | |
JP2000305596A (ja) | 音声認識装置及びナビゲーション装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041126 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050708 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060102 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |