JP2001296891A - 音声認識方法および装置 - Google Patents
音声認識方法および装置Info
- Publication number
- JP2001296891A JP2001296891A JP2000112942A JP2000112942A JP2001296891A JP 2001296891 A JP2001296891 A JP 2001296891A JP 2000112942 A JP2000112942 A JP 2000112942A JP 2000112942 A JP2000112942 A JP 2000112942A JP 2001296891 A JP2001296891 A JP 2001296891A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- unit
- directivity
- voice
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
判別用のスイッチなしで対応できるようにする。 【解決手段】 音声入力部1からのキーワード入力信号
を音声バッファ部2に格納し、その音声信号に対して指
向性調整部3で指向性を変え、音声認識部5で認識処理
する。その認識結果の中から、一致度判定部45で、最
も一致度の高い指向性を判定する。この指向性に設定す
ることにより、良好な音声認識を行うことができる。
Description
制御対象機器に与える入力指示の語彙を認識する、車載
用などの音声認識装置に関するものである。
ステム構成を示すブロック図である。以下、図に従って
説明する。車両等の運転中にナビゲーション機器やオー
ディオ機器等を操作するに際して、スイッチ操作による
運転者の負担を軽減するために、運転者など話者(発話
者)の発声した音声を認識して、接続された機器に入力
指示する音声認識装置がある。
する音声入力部で、無指向性の複数のマイクロホン1a
〜1cからなっている。3はマイクロホン1a〜1cで
検出された信号を調整して音声入力部1の指向性を話者
の方向に調整した音声信号を出力するための指向性調整
部である。5はナビゲーション機器やオーディオ機器等
の入力部に接続された音声認識部である。8は話者の方
向を検出する方向検出手段で、ルームミラーの角度や座
席スライド位置、リクライニング角度などから音声の方
向を検出する。41は方向検出手段8の検出結果に基い
て指向性調整部3を制御する指向性制御部である。
来の車載用音声認識装置の動作内容を示すフローチャー
トである。最初にステップS0において、音声認識開始
の操作が行われる。次にステップS1において、方向検
出手段8で話者の方向を検出し、話者の位置情報を取得
する。次にステップS2において、ステップS1にて取
得した話者の位置情報を基に指向性制御部41が指向性
を話者の方向に変更するように指向性調整部3を制御す
る。次にステップS3において、マイクロホン1a〜1
cから話者の音声を入力する。続いてステップS4にお
いて、指向性調整部3が指向性を変更した音声に対して
音声認識部5が認識処理を実行する。そしてステップS
5において、音声認識部5から認識結果を出力する。
は、指向性を調整する場合、話者の位置を特定するため
に、話者の方向を検出する手段が必要となる。この方向
検出手段として従来は、車載用の場合、ルームミラーの
角度や座席スライド位置、リクライニング角度などから
検出した。そのため、話者が運転者であることに限定さ
れてしまい、運転者以外が話者となる場合は上記方向検
出手段では検出できない。運転者以外をも話者としてそ
の音声を検出する場合、方向検出手段の構成が複雑とな
るだけでなく、誰が発話するのかを検出しなければなら
ないのでその手段として話者判別用のスイッチなどが必
要となる。また、これらの構成を実現した場合において
も、指定した指向性が必ずしも音声認識処理において高
い性能が得られる特性であるとは限らない。
して音声認識性能を向上させると共に、複数の方向に存
在する話者の発声にも、話者判別用のスイッチなしで対
応できる利便性の高い音声認識方法、装置を提供するこ
とを目的とする。
装置は、音声入力部と、音声入力部からの信号を保存す
る音声バッファ部と、音声バッファ部に保存された信号
から指向性を変更した信号を生成する指向性調整部と、
指向性調整部により指向性を変更した信号に対して音声
認識処理を行う音声認識部と、音声バッファ部に保存さ
れた信号を再生する音声バッファ制御部と、指向性調整
部にて変更する複数の指向性情報を記憶した指向性情報
記憶部と、指向性情報記憶部に記憶された指向性情報か
ら1つを選択して指向性調整部を制御する指向性制御部
と、音声認識部における認識対象を記憶した音声認識辞
書部と、音声認識部を制御して認識処理を複数回実行さ
せる音声認識制御部と、変更した複数の指向性における
認識結果の一致度を記憶する判定結果記憶部と、判定結
果記憶部に記憶された認識結果の中から一致度が最も高
い指向性を判定する一致度判定部とを備えたものであ
る。
部と、音声入力部からの信号を保存する音声バッファ部
と、音声バッファ部に保存された信号から指向性および
利得を変更した信号を生成する指向性利得調整部と、指
向性利得調整部により指向性および利得を変更した信号
に対して音声認識処理を行う音声認識部と、音声バッフ
ァ部に保存された信号を再生する音声バッファ制御部
と、指向性利得調整部にて変更する複数の指向性情報お
よび利得情報を記憶した指向性利得情報記憶部と、指向
性利得情報記憶部に記憶された指向性情報および利得情
報から各1つを選択して指向性利得調整部を制御する指
向性利得制御部と、音声認識部における認識対象を記憶
した音声認識辞書部と、音声認識部を制御して認識処理
を複数回実行させる音声認識制御部と、変更した複数の
指向性および利得における認識結果の一致度を記憶する
判定結果記憶部と、判定結果記憶部に記憶された認識結
果の中から一致度が最も高い指向性および利得を判定す
る一致度判定部とを備えたものである。
た音声信号に対して認識処理を行い、あるキーワードが
認識されたかどうかを判定するステップ、キーワードが
認識されたとき、そのキーワードの音声信号に対して指
向性を変更した複数の認識処理を行い、それぞれの認識
結果の一致度を得るステップ、これらの認識結果の中か
ら一致度が最も高い指向性を判定するステップ、および
この判定した指向性に設定してその後の音声認識を行う
ステップを有するものである。
た音声信号に対して認識処理を行い、あるキーワードが
認識されたかどうかを判定するステップ、キーワードが
認識されたとき、そのキーワードの音声信号に対して指
向性および利得を変更した複数の認識処理を行い、それ
ぞれの認識結果の一致度を得るステップ、これらの認識
結果の中から一致度が最も高い指向性および利得を判定
するステップ、およびこの判定した指向性および利得に
設定してその後の音声認識を行うステップを有するもの
である。
実施の形態を、車載用の音声認識装置について説明す
る。図1は、この発明の実施の形態1における音声認識
装置のシステム構成を示すブロック図である。図におい
て、1は話者が発した音声を電気信号(以下、音声信号
と呼ぶ)に変換する音声入力部で、無指向性の複数(こ
こでは3つ)のマイクロホン1a〜1cからなる。図2
は、車両へのマイクロホンの取付位置の例を示す平面図
である。車両11内で、3つのマイクロホン1a〜1c
をダッシュボード12上中央部へ等間隔に三角形をなす
ように設置する。例えば、マイクロホン1a〜1cの各
出力信号のゲインバランスを調整することにより、指向
性を真正面や運転席13方向、あるいは助手席14方向
に変更することが可能となる。
信号を保存する音声バッファ部で、それぞれマイクロホ
ン1a〜1cに対応して設けられた複数の音声バッファ
2a〜2cからなる。3は音声バッファ部2に保存され
た音声信号を調整して、指向性を変更した音声信号を出
力する指向性調整部、5は指向性調整部3で指向性を変
更された音声信号に対して音声認識処理を実行する音声
認識部であり、認識結果と次に述べる音声認識辞書部6
に保存されたデータとの一致度を出力する。6は認識対
象を記憶する音声認識辞書部であり、音声認識部5の音
声認識処理における基準となるデータが保存されてい
る。
音声認識部5を制御する制御部、43は音声バッファ部
2での音声信号の保存と再生を制御する音声バッファ制
御部、41は指向性調整部3での指向性変更を制御する
指向性制御部、42は指向性制御部41による指向性制
御のための複数の指向性情報を記憶する指向性情報記憶
部であり、例えば正面を0°とし、5°間隔で±90°
までを記憶しておき、指向性制御部41がその中から1
つずつ選択して制御を行う。44は音声認識部5の認識
処理の開始や中止、および認識結果と一致度の取得を行
う音声認識制御部、45は指向性制御部41からの指向
性情報および音声認識制御部44からの認識結果と一致
度から、どの指向性が最適であるかを判定する一致度判
定部、46は音声認識部での認識結果と一致度、および
一致度判定部45での判定結果を記憶する判定結果記憶
部であり、上記41〜46で制御部4を構成している。
1に示した音声認識装置の動作内容を示すフローチャー
トである。最初にステップA0において、制御部4の各
部の初期化および処理の開始操作が実行される。次にス
テップA1において、指向性制御部41からの制御によ
り指向性調整部3の指向性設定を無指向性に設定する。
次にステップA2において、マイクロホン1a〜1cに
入力されて音声信号に変換されたそれぞれの信号を音声
バッファ制御部43からの制御により音声バッファ2a
〜2cに格納し、この格納された音声信号を音声バッフ
ァ制御部43からの制御により再生し、この音声信号
を、無指向性に設定された指向性調整部3に入力し、指
向性調整部3の出力を音声認識部5に入力する。音声認
識部5では入力された音声信号に対して、音声認識制御
部44からの制御により、音声操作の開始コマンドとな
るキーワード、例えば「認識スタート」を認識する処理
を実行する。
の認識結果に基づき、音声認識制御部44は、キーワー
ド「認識スタート」が認識されたのかを判定し、認識さ
れなかった場合はステップA2に戻り、再度音声入力処
理およびキーワード認識処理を実行する。認識された場
合はステップA4に進む。次に、ステップA4へ進んだ
ときは、音声バッファ制御部43からの制御により、音
声バッファ2a〜2cへの音声入力を停止し、キーワー
ド「認識スタート」が認識された時のその音声信号を格
納する。
41からの制御により、指向性調整部3の指向性設定を
指向性情報記憶部42に記憶された、例えば正面0°方
向に設定する。次にステップA6において、ステップA
4で音声バッファ2a〜2cに格納されたキーワード
「認識スタート」の音声信号を、音声バッファ制御部4
3からの制御により再生し、指向性調整部3にて指向性
制御部41が設定した指向性をもつ音声信号を生成し、
音声認識部5にてキーワード認識処理を再度実行し、音
声認識制御部44が認識処理の結果と一致度を音声認識
部5から取得して、一致度判定部45に送信する。一致
度判定部45は現在設定されている指向性情報と認識結
果と一致度を判定結果記憶部46へ送信して記憶させ
る。
憶部42に記憶された全ての指向性についての再認識処
理および認識結果と一致度の取得が終了していない場合
はステップA5に戻り、指向性情報記憶部42に記憶さ
れた全ての指向性について終了するまで繰り返す。全て
の指向性について再認識処理および認識結果と一致度の
取得が終了した場合はステップA8に進む。
結果記憶部46に記憶された全ての指向性についての認
識結果と一致度から、一致度判定部45は、認識結果が
正解、すなわちキーワード「認識スタート」であり、か
つ最も一致度の高い指向性はどれであるかを判定し、指
向性制御部41は、一致度判定部45が判定した指向性
となるように指向性調整部3を制御する。
で停止した音声バッファ2a〜2cへの音声入力を再開
する。すなわちマイクロホン1a〜1cに入力されて音
声信号に変換されたそれぞれの信号を音声バッファ制御
部43からの制御により音声バッファ2a〜2cに格納
し、この格納された音声信号を音声バッファ制御部43
からの制御により再生し、ステップA8で認識結果が正
解であってかつ最も一致度の高い指向性に設定された指
向性調整部3に音声信号を入力し、指向性調整部3の出
力を音声認識部5に入力する。音声認識部5では入力さ
れた音声信号に対して、音声認識制御部44からの制御
により音声認識辞書部6に格納された認識語彙を認識す
る処理を実行する。次にステップA10において、音声
認識部5は認識処理の結果を出力し、図示外のオーディ
オ機器等の操作を行う。なお、ステップA8で、図示外
のディスプレイまたはランプにより、キーワード「認識
スタート」の認識完了と指向性の設定方向を表示するよ
うにしておけば、話者がその表示を確認して、ステップ
A9で、続くコマンドを入力することができる。
法、装置においては、キーワード「認識スタート」を認
識した時点の音声バッファの音声信号を用いて指向性を
変更し、音声認識における一致度から話者の方向を判定
して、話者の音声を抽出するため、話者の方向が定まっ
ていない場合においても話者の音声を有効に抽出し、認
識する事が可能である。また、話者の方向検出手段が不
要であり、話者判別用のスイッチあるいは方向検出用の
センサなどのコスト削減が可能となる。
形態2における音声認識装置のシステム構成を示すブロ
ック図である。本実施の形態では、実施の形態1で行っ
た指向性を変化させ一致度の最大のものを選ぶ方法に加
えて、利得変化すなわち信号レベルを変化させて一致度
を見る方法を用いている。図4では図1の指向性調整部
3、指向性制御部41および指向性記憶部42に代え
て、それぞれ指向性利得調整部31、指向性利得制御部
47および指向性利得記憶部48を設けている。
保有された音声信号を調整して指向性および利得を変更
した音声信号を出力する指向性利得調整部、47は指向
性利得調整部31での指向性と利得の変更を制御する指
向性利得制御部、48は指向性利得制御部47の指向性
と利得の制御において複数の指向性情報と複数の利得情
報を記憶する指向性利得情報記憶部であり、例えば正面
を0°とし、5°間隔で±90までを記憶するととも
に、初期利得を0dBとし、3dB間隔で±15dBま
でを記憶している。
指向性と利得を変更された音声信号に対して音声認識処
理を実行する。一致度判定部45は、指向性利得制御部
47からの指向性情報と利得情報および音声認識制御部
44からの認識結果と一致度から、どの指向性および利
得が最適であるかを判定する。制御部4は、43〜48
で構成されている。その他の部分は図1と同様であるの
で説明を省略する。
4に示した音声認識装置の動作内容を示すフローチャー
トである。最初にステップB0において、制御部4の各
部の初期化および処理の開始操作が実行される。次にス
テップB1において、指向性利得制御部47からの制御
により指向性利得調整部31の指向性および利得設定を
無指向性および初期利得に設定する。次にステップB2
において、マイクロホン1a〜1cに入力されて音声信
号に変換されたそれぞれの信号を音声バッファ制御部4
3からの制御により音声バッファ2a〜2cに格納し、
この格納された音声信号を音声バッファ制御部43から
の制御により再生し、この音声信号を、無指向性および
初期利得に設定された指向性利得調整部31に入力し、
指向性利得調整部31の出力を音声認識部5に入力す
る。音声認識部5では入力された音声信号に対して、音
声認識制御部44からの制御により、音声操作の開始コ
マンドとなるキーワード、例えば「認識スタート」を認
識する処理を実行する。
の認識結果に基づき、音声認識制御部44は、キーワー
ド「認識スタート」が認識されたのかを判定し、認識さ
れなかった場合はステップB2に戻り再度音声入力処理
およびキーワード認識処理を実行する。認識された場合
はステップB4に進む。次に、ステップB4へ進んだと
きは、音声バッファ制御部43からの制御により、音声
バッファ2a〜2cへの音声入力を停止し、キーワード
「認識スタート」が認識された時のその音声信号を格納
する。
御部47からの制御により、指向性利得調整部31の指
向性設定を指向性利得情報記憶部48に記憶された例え
ば正面0°方向に設定する。次にステップB6におい
て、ステップB4で音声バッファ2a〜2cに格納され
たキーワード「認識スタート」の音声信号を音声バッフ
ァ制御部43からの制御により再生し、指向性利得調整
部31にて指向性利得制御部47が設定した指向性をも
つ音声信号を生成し、音声認識部5にてキーワード認識
処理を再度実行し、音声認識制御部44が認識処理の結
果と一致度を音声認識部5から取得して、一致度判定部
45に送信する。一致度判定部45は現在設定されてい
る指向性情報と認識結果と一致度を判定結果記憶部46
へ送信して記憶させる。
報記憶部48に記憶された全ての指向性についての再認
識処理および認識結果と一致度の取得が終了していない
場合はステップB5に戻り、指向性利得情報記憶部48
に記憶された全ての指向性について再認識処理および認
識結果と一致度の取得が終了するまで繰り返す。全ての
指向性について再認識処理および認識結果と一致度の取
得が終了した場合はステップB8に進む。
結果記憶部46に記憶された全ての指向性についての認
識結果と一致度から、一致度判定部45は、認識結果が
正解、すなわちキーワード「認識スタート」であり、か
つ最も一致度の高い指向性はどれであるかを判定し、指
向性利得制御部47は、一致度判定部45が判定した指
向性となるように指向性利得調整部31を制御する。
御部47からの制御により、指向性利得調整部31の利
得設定を指向性利得情報記憶部48に記憶された、例え
ば初期利得より3dB高い利得に設定する。この場合の
利得調整は、ステップB8にて判定された指向性の方向
についてのみ利得が調整されるものとする。
4で音声バッファ2a〜2cに格納されたキーワード
「認識スタート」の音声信号を音声バッファ制御部43
からの制御により再生し、指向性利得調整部31にて指
向性利得制御部47が設定した指向性および利得をもつ
音声信号を生成し、音声認識部5にてキーワード認識処
理を再度実行し、音声認識制御部44が認識処理の結果
と一致度を音声認識部5から取得し、一致度判定部45
に送信する。一致度判定部45は現在設定されている指
向性情報と利得情報と認識結果と一致度を判定結果記憶
部46へ送信して記憶させる。
情報記憶部48に記憶された全ての利得についての再認
識処理および認識結果と一致度の取得が終了していない
場合はステップB9に戻り指向性利得情報記憶部48に
記憶された全ての利得に対する再認識処理および認識結
果と一致度の取得が終了するまで繰り返す。全ての利得
について再認識処理および認識結果と一致度の取得が終
了した場合はステップB12に進む。
定結果記憶部46に記憶された全ての利得についての認
識結果と一致度から、一致度判定部45は、認識結果が
正解であり、かつ最も一致度の高い利得はどれであるか
を判定し、指向性利得制御部47は、一致度判定部45
が判定した指向性および利得となるように指向性利得調
整部31を制御する。
4で停止した音声バッファ2a〜2cへの音声入力を再
開する。すなわちマイクロホン1a〜1cに入力されて
音声信号に変換されたそれぞれの信号を音声バッファ制
御部43からの制御により音声バッファ2a〜2cに格
納し、この格納された音声信号を音声バッファ制御部4
3からの制御により再生し、ステップB12で認識結果
が正解であってかつ最も一致度の高い指向性および利得
に設定された指向性利得調整部31に音声信号を入力
し、指向性利得調整部31の出力を音声認識部5に入力
する。音声認識部5では入力された音声信号に対して、
音声認識制御部44からの制御により音声認識辞書部6
に格納された認識語彙を認識する処理を実行する。次に
ステップB14において、音声認識部5は認識処理の結
果を出力し、図示外のオーディオ機器等の制御を行う。
法、装置においては、音声認識における一致度を用いて
話者の方向を判定し、更に音声認識における一致度を用
いて最適な利得、すなわち音声認識に最適な入力信号レ
ベルを判定し、話者の音声を抽出するため、話者の方向
が定まっていない場合においても話者の音声を有効に抽
出するとともに、話者からマイクロホンまでの距離など
のためにマイクロホンへの音声入力レベルが異なる場合
でも、音声認識に最適な入力信号レベルで認識処理を実
行する事が可能である。また、話者の方向検出手段が不
要であり、方向検出用のセンサなどのコスト削減が可能
となる。
形態3における音声認識装置のシステム構成を示すブロ
ック図である。本実施の形態は、音声でナビゲーション
装置を制御する例を示す。図6では、図4に示したもの
に加えてナビゲーション装置7を示している。図6にお
いて、7は音声認識の結果に基づいて制御部4により、
種々の操作が実行されるナビゲーション装置である。そ
の他は図4と同様であるので説明を省略する。
6に示した音声認識装置の動作内容を示すフローチャー
トである。ステップC0〜C12は、図5のステップB
0〜B12と同様であるので説明を省略する。ただし、
図5ではキーワードの例を「認識スタート」として説明
したが、図7では別のキーワード、例えば「ナビゲーシ
ョン」を用いる。
いて、ステップC4で停止した音声バッファ2a〜2c
への音声入力を再開する。すなわちマイクロホン1a〜
1cに入力されて音声信号に変換されたそれぞれの信号
を音声バッファ制御部43からの制御により音声バッフ
ァ2a〜2cに格納し、この格納された音声信号を音声
バッファ制御部43からの制御により再生し、ステップ
C12で認識結果が正解であり、かつ最も一致度の高い
指向性および利得に設定された指向性利得調整部31に
音声信号を入力し、指向性利得調整部31の出力を音声
認識部5に入力する。音声認識部5では入力された音声
信号に対して、音声認識制御部44からの制御により、
音声認識辞書部6に格納されたナビゲーション装置7の
制御コマンド語彙、例えば「詳細表示」、「広域表
示」、「目的地設定」などを認識する処理を実行する。
御部44が音声認識部5の認識結果、例えば「詳細表
示」を取得し、認識結果「詳細表示」に対応した制御信
号をナビゲーション装置7に送信する。次にステップC
15において、ナビゲーション装置7が受信した認識結
果「詳細表示」に対応した制御信号に応じて表示画面を
詳細表示する処理を実行する。
法、装置においては、キーワード「ナビゲーション」を
認識した時点の音声バッファの音声信号を用い指向性を
変更して音声認識における一致度の最も高い指向性を判
定し、これを話者の方向とし、さらに一致度の最も高い
利得を判定して以後の音声認識処理を実行するため、音
声認識の開始スイッチなどは不要であり、操作が簡便と
なる。また、キーワード認識処理における一致度の最も
高い指向性および利得を判定するため、話者の方向が運
転者に限定されず、助手席からの音声操作も可能とな
り、以後のコマンド認識処理において最適な指向性と利
得で認識処理を実行可能であり、認識性能の向上が可能
である。また、話者の方向検出手段が不要であり、方向
検出用のセンサなどのコスト削減が可能となる。
指向性を変更した信号に対して音声認識処理を行う音声
認識部と、認識結果の中から一致度が最も高い指向性を
判定する一致度判定部を備えているので、一致度判定部
で一致度が最高と判定した指向性に設定することによ
り、話者が複数存在してその方向が定まっていない場合
でも話者判別用のスイッチやセンサなしで、話者以外の
ノイズを低減して話者の音声を有効に抽出でき、音声認
識性能が高く、利便性の高い音声認識装置が得られる。
向性および利得を変更した信号に対して音声認識処理を
行う音声認識部と、認識結果の中から一致度の最も高い
指向性と利得を判定する一致度判定部を備えているの
で、一致度判定部で一致度が最高と判定した指向性およ
び利得に設定することにより、話者の方向が定まってお
らず、また音声入力部(マイクロホン)への入力レベル
が大きいあるいは小さい場合でも話者判別用のスイッチ
やセンサなしで、話者の音声を有効に抽出するとともに
適切な信号レベルで認識処理を行うことができ、音声認
識性能が高く、利便性の高い音声認識装置が得られる。
識されたキーワードの音声信号に対して指向性を変更し
た複数の認識処理を行い、その認識結果の中から一致度
が最も高い指向性を判定し、この指向性に設定して以後
の音声認識を行うので、話者の方向が定まっていない場
合でも話者判別用のスイッチやセンサなしで、話者の音
声を有効に抽出でき、音声認識性能が高く、利便性の高
い音声認識方法が得られる。
識されたキーワードの音声信号に対して指向性と利得を
変更した複数の認識処理を行い、その認識結果の中から
一致度が最も高い指向性および利得を判定し、この指向
性および利得に設定して以後の音声認識を行うので、話
者の方向が定まっておらず、また音声入力部への入力レ
ベルが大きいあるいは小さい場合でも話者判別用のスイ
ッチやセンサなしで、話者の音声を有効に抽出するとと
もに適切な信号レベルで認識処理を行うことができ、音
声認識性能が高く、利便性の高い音声認識方法が得られ
る。
置のシステム構成を示すブロック図である。
置を示す平面図である。
チャートである。
置のシステム構成を示すブロック図である。
チャートである。
置のシステム構成を示すブロック図である。
チャートである。
ロック図である。
チャートである。
部、5 音声認識部、6 音声認識辞書部、31 指向
性利得調整部、41 指向性制御部、42 指向性情報
記憶部、43 音声バッファ制御部、44 音声認識制
御部、45 一致度判定部、46 判定結果記憶部、4
7 指向性利得制御部、48 指向性利得情報記憶部。
Claims (4)
- 【請求項1】 音声入力部と、この音声入力部からの信
号を保存する音声バッファ部と、この音声バッファ部に
保存された信号から指向性を変更した信号を生成する指
向性調整部と、この指向性調整部により指向性を変更し
た信号に対して音声認識処理を行う音声認識部と、上記
音声バッファ部に保存された信号を再生する音声バッフ
ァ制御部と、上記指向性調整部にて変更する複数の指向
性情報を記憶した指向性情報記憶部と、この指向性情報
記憶部に記憶された指向性情報から1つを選択して上記
指向性調整部を制御する指向性制御部と、上記音声認識
部における認識対象を記憶した音声認識辞書部と、上記
音声認識部を制御して認識処理を複数回実行させる音声
認識制御部と、変更した複数の指向性における認識結果
の一致度を記憶する判定結果記憶部と、この判定結果記
憶部に記憶された認識結果の中から一致度が最も高い指
向性を判定する一致度判定部とを備えた音声認識装置。 - 【請求項2】 音声入力部と、この音声入力部からの信
号を保存する音声バッファ部と、この音声バッファ部に
保存された信号から指向性および利得を変更した信号を
生成する指向性利得調整部と、この指向性利得調整部に
より指向性および利得を変更した信号に対して音声認識
処理を行う音声認識部と、上記音声バッファ部に保存さ
れた信号を再生する音声バッファ制御部と、上記指向性
利得調整部にて変更する複数の指向性情報および利得情
報を記憶した指向性利得情報記憶部と、この指向性利得
情報記憶部に記憶された指向性情報および利得情報から
各1つを選択して上記指向性利得調整部を制御する指向
性利得制御部と、上記音声認識部における認識対象を記
憶した音声認識辞書部と、上記音声認識部を制御して認
識処理を複数回実行させる音声認識制御部と、変更した
複数の指向性および利得における認識結果の一致度を記
憶する判定結果記憶部と、この判定結果記憶部に記憶さ
れた認識結果の中から一致度が最も高い指向性および利
得を判定する一致度判定部とを備えた音声認識装置。 - 【請求項3】 入力された音声信号に対して認識処理を
行い、あるキーワードが認識されたかどうかを判定する
ステップ、キーワードが認識されたとき、そのキーワー
ドの音声信号に対して指向性を変更した複数の認識処理
を行い、それぞれの認識結果の一致度を得るステップ、
これらの認識結果の中から一致度が最も高い指向性を判
定するステップ、およびこの判定した指向性に設定して
その後の音声認識を行うステップを有する音声認識方
法。 - 【請求項4】 入力された音声信号に対して認識処理を
行い、あるキーワードが認識されたかどうかを判定する
ステップ、キーワードが認識されたとき、そのキーワー
ドの音声信号に対して指向性および利得を変更した複数
の認識処理を行い、それぞれの認識結果の一致度を得る
ステップ、これらの認識結果の中から一致度が最も高い
指向性および利得を判定するステップ、およびこの判定
した指向性および利得に設定してその後の音声認識を行
うステップを有する音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000112942A JP4410378B2 (ja) | 2000-04-14 | 2000-04-14 | 音声認識方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000112942A JP4410378B2 (ja) | 2000-04-14 | 2000-04-14 | 音声認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001296891A true JP2001296891A (ja) | 2001-10-26 |
JP4410378B2 JP4410378B2 (ja) | 2010-02-03 |
Family
ID=18625002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000112942A Expired - Fee Related JP4410378B2 (ja) | 2000-04-14 | 2000-04-14 | 音声認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4410378B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002311990A (ja) * | 2000-12-19 | 2002-10-25 | Hewlett Packard Co <Hp> | 音声制御式機器の活動化方法およびシステム |
WO2006025106A1 (ja) * | 2004-09-01 | 2006-03-09 | Hitachi, Ltd. | 音声認識システム、音声認識方法およびそのプログラム |
JP2006340151A (ja) * | 2005-06-03 | 2006-12-14 | Matsushita Electric Ind Co Ltd | 音響エコーキャンセル装置とそれを用いた電話機および音響エコーキャンセル方法 |
JP2008309864A (ja) * | 2007-06-12 | 2008-12-25 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
US7680287B2 (en) * | 2002-09-17 | 2010-03-16 | Kabushiki Kaisha Toshiba | Directional setting apparatus, directional setting system, directional setting method and directional setting program |
JP2011080868A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 音響監視システム、及び音声集音システム |
JP2012141965A (ja) * | 2011-01-05 | 2012-07-26 | Primesense Ltd | 非触覚ユーザインタフェース用場面プロファイル |
EP2445230A4 (en) * | 2009-06-17 | 2016-05-18 | Panasonic Ip Corp America | HEARING AID |
WO2016103710A1 (ja) * | 2014-12-26 | 2016-06-30 | アイシン精機株式会社 | 音声処理装置 |
JP2019514045A (ja) * | 2016-03-21 | 2019-05-30 | アマゾン テクノロジーズ インコーポレイテッド | 話者照合方法及びシステム |
JP2021076874A (ja) * | 2021-02-17 | 2021-05-20 | 日本電信電話株式会社 | 話者方向強調装置、話者方向強調方法、およびプログラム |
-
2000
- 2000-04-14 JP JP2000112942A patent/JP4410378B2/ja not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002311990A (ja) * | 2000-12-19 | 2002-10-25 | Hewlett Packard Co <Hp> | 音声制御式機器の活動化方法およびシステム |
US7680287B2 (en) * | 2002-09-17 | 2010-03-16 | Kabushiki Kaisha Toshiba | Directional setting apparatus, directional setting system, directional setting method and directional setting program |
WO2006025106A1 (ja) * | 2004-09-01 | 2006-03-09 | Hitachi, Ltd. | 音声認識システム、音声認識方法およびそのプログラム |
JP2006340151A (ja) * | 2005-06-03 | 2006-12-14 | Matsushita Electric Ind Co Ltd | 音響エコーキャンセル装置とそれを用いた電話機および音響エコーキャンセル方法 |
JP4654777B2 (ja) * | 2005-06-03 | 2011-03-23 | パナソニック株式会社 | 音響エコーキャンセル装置 |
JP2008309864A (ja) * | 2007-06-12 | 2008-12-25 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
EP2445230A4 (en) * | 2009-06-17 | 2016-05-18 | Panasonic Ip Corp America | HEARING AID |
JP2011080868A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 音響監視システム、及び音声集音システム |
JP2012141965A (ja) * | 2011-01-05 | 2012-07-26 | Primesense Ltd | 非触覚ユーザインタフェース用場面プロファイル |
WO2016103710A1 (ja) * | 2014-12-26 | 2016-06-30 | アイシン精機株式会社 | 音声処理装置 |
JP2016126022A (ja) * | 2014-12-26 | 2016-07-11 | アイシン精機株式会社 | 音声処理装置 |
JP2019514045A (ja) * | 2016-03-21 | 2019-05-30 | アマゾン テクノロジーズ インコーポレイテッド | 話者照合方法及びシステム |
JP2021076874A (ja) * | 2021-02-17 | 2021-05-20 | 日本電信電話株式会社 | 話者方向強調装置、話者方向強調方法、およびプログラム |
JP7111206B2 (ja) | 2021-02-17 | 2022-08-02 | 日本電信電話株式会社 | 話者方向強調装置、話者方向強調方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4410378B2 (ja) | 2010-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3910898B2 (ja) | 指向性設定装置、指向性設定方法及び指向性設定プログラム | |
US11437020B2 (en) | Techniques for spatially selective wake-up word recognition and related systems and methods | |
US8484033B2 (en) | Speech recognizer control system, speech recognizer control method, and speech recognizer control program | |
JP4304952B2 (ja) | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム | |
JP6584731B2 (ja) | ジェスチャ操作装置及びジェスチャ操作方法 | |
JPH10187186A (ja) | 認識装置および認識方法、並びに学習装置および学習方法 | |
JP2002091466A (ja) | 音声認識装置 | |
JP2007329702A (ja) | 受音装置と音声認識装置とそれらを搭載している可動体 | |
JP2004510239A (ja) | ディクテーションとコマンドの区別を向上させる方法 | |
JP5014662B2 (ja) | 車載用音声認識装置及び音声認識方法 | |
JP4410378B2 (ja) | 音声認識方法および装置 | |
JP3838159B2 (ja) | 音声認識対話装置およびプログラム | |
JP4483450B2 (ja) | 音声案内装置、音声案内方法およびナビゲーション装置 | |
KR20200072965A (ko) | 차량용 듀얼 마이크의 능동형 제어 시스템 및 그의 제어 방법 | |
JP4478146B2 (ja) | 音声認識システム、音声認識方法およびそのプログラム | |
JP2018087871A (ja) | 音声出力装置 | |
JP2020160181A (ja) | 音声処理装置及び音声処理方法 | |
JP2019197964A (ja) | マイク制御装置 | |
JP6851491B2 (ja) | 音声対話制御装置および音声対話制御方法 | |
JP2000305596A (ja) | 音声認識装置及びナビゲーション装置 | |
JP3437492B2 (ja) | 音声認識方法及び装置 | |
JP2001013984A (ja) | 音声操作装置 | |
JP3679617B2 (ja) | 音声伝達方式 | |
JPH0944183A (ja) | レベル表示装置、音声認識装置およびナビゲーション装置 | |
JP7407665B2 (ja) | 音声出力制御装置および音声出力制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061102 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090910 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091113 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131120 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |