JP2004198832A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2004198832A
JP2004198832A JP2002368668A JP2002368668A JP2004198832A JP 2004198832 A JP2004198832 A JP 2004198832A JP 2002368668 A JP2002368668 A JP 2002368668A JP 2002368668 A JP2002368668 A JP 2002368668A JP 2004198832 A JP2004198832 A JP 2004198832A
Authority
JP
Japan
Prior art keywords
voice
noise
unit
threshold
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002368668A
Other languages
English (en)
Inventor
Takeshi Ono
健 大野
Okihiko Nakayama
沖彦 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP2002368668A priority Critical patent/JP2004198832A/ja
Publication of JP2004198832A publication Critical patent/JP2004198832A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】騒音の大きい環境下においても音声認識率の高い音声認識装置を提供することを目的とする。
【解決手段】騒音検出部32によって検出された騒音量が大きい場合には、ビームサーチ法を行う際の枝刈りの閾値αを残す枝の数が少なくなる方向に変更することにより、騒音量が大きい場合には早期に音声認識の演算処理を終了させることができる。これにより、騒音量が大きく、音声認識のための演算時間を多くとっても音声の認識率が低く、早期に再発話を促したほうがよい場合において、すばやく音声認識の演算処理を終了し、音声の認識結果を得ることができる。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、音声を認識する音声認識装置に関する。
【0002】
【従来の技術】
【特許文献1】特開平11−119793号公報
従来の音声認識装置は、入力された音声区間をフレーム分割し、フレーム分割した音声を認識のためにパラメータ化する音声入力部と、パラメータ化された音声の標準パターンをあらかじめ辞書として記憶する記憶部と、音声入力部においてパラメータ化された音声信号と記憶部に記憶された辞書から読み出した標準パターンとをDPマッチング法などによって照合し、認識結果を文字列として出力する音声認識部とを有している。音声認識部では音声認識の演算量を削減するために、DPマッチング法などにビームサーチ法を組み合わせて音声認識を行っている。
【0003】
また音声認識装置は閾値設定部を備え、閾値設定部はビームサーチ法による枝刈りの閾値αを設定して音声認識部へ送るものである。音声認識部はパラメータ化された入力音声と標準パターンとを先頭フレームから比較し累積尤度を計算していくという、最適パス探索問題を解くものである。
【0004】
音声認識部で行われるビームサーチ法による枝刈りとは、最適パス探索問題において、先頭フレームから計算していくそれぞれのパスのうち、累積尤度の低いパスについては途中で計算を止めるという手法のことである。これは音声認識部における演算量を軽減するために行われる。
【0005】
また、フレームが進むにつれて増えていく枝を刈り取るような作業であるので、枝刈りと呼ばれる。ここで枝刈りを行うには、刈るべきパスの累積尤度の閾値が必要であるが、従来の音声認識装置においては外部から閾値を与えるか、あるいは外部から残すべきパスの本数を与える必要があった。この残すべきパスの本数を目標アクティブパス数と呼ぶ。
【0006】
以上のような構成の音声認識装置により、入力された音声を認識しその結果を文字列などとして出力することが可能となる。
またこのような音声認識装置においては、あらかじめ所定の閾値を与えるか、外部から所定の目標アクティブパス数を与える必要があったが、この際に騒音などの少ない環境では、枝刈りの閾値αを小さく設定して残すべきパスの数を多くし、演算時間を多くとることによって十分な音声の認識結果を得るようにしていた。あるいは同様の目的で目標アクティブパス数を大きく設定していた。
【0007】
【発明が解決しようとする課題】
このような上記従来の音声認識装置にあっては、騒音が大きい場合などのように、音声の認識処理の演算時間を多くとっても音声の認識率が低い場合においても長時間の演算処理を行ってしまい、長時間の認識処理時間を待ったにもかかわらず誤った認識結果を得てしまうといったことがあった。
【0008】
また特開平11−119793号公報に記載された音声認識装置においては、枝刈り閾値あるいは目標アクティブパス数を所定の値ではなく動的に変更している。しかしこの音声認識装置は、辞書のパープレキシティに応じて枝刈り閾値あるいは目標アクティブパス数を動的に変化させるものであり、騒音の有無については考慮しておらず、上述の音声認識装置と同様に、騒音の大きい環境下において長時間の認識処理時間を待ったにもかかわらず、正しい認識結果を得ることができないといった問題があった。
【0009】
そこで本発明はこのような問題点に鑑み、騒音の大きい環境下においても音声認識率の高い音声認識装置を提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明は、音声を入力し、該音声の時間波形から音声区間を検出し、検出された音声区間をフレーム分割し、フレーム分割された音声を認識のためのパラメータに変換する音声入力部と、あらかじめ用意された音声の標準パターンを記憶している記憶部と、音声入力部においてパラメータに変換された音声信号と、記憶部に記憶された音声の標準パターンとをビームサーチ法を用いながら比較して音声認識を行う音声認識処理部を有する音声認識装置において、音声認識処理部において用いられるビームサーチ法における枝刈りの閾値を設定する閾値設定部を備え、騒音が大きいという条件が成立する場合に、閾値設定部は、枝刈りの閾値を残す枝の数が少なくなるように設定し、音声認識処理部は、枝刈りの閾値をもとに音声認識を行うものとした。
【0011】
【発明の効果】
本発明によれば、閾値設定部が、騒音が大きいという条件が成立する場合に残す枝の数が少なくなるように枝刈りの閾値を設定する。これにより騒音量が大きく、音声認識のための演算時間を多くとっても音声の認識率が低く、早期に再発話を促したほうがよい場合において、すばやく音声認識の演算処理を終了して音声の認識結果を得ることができる。
また、騒音量が大きいような場合において、使用者が明瞭に発話を行った場合には枝刈りの閾値の変更によらず、音声認識装置は正しい音声の認識結果を得ることができる。
【0012】
【発明の実施の形態】
次に本発明の実施の形態を実施例により説明する。
以下に示す各実施例は、本発明における音声認識装置を車両のナビゲーションシステムに適用したものである。
図1に、第一の実施例における車両のナビゲーションシステムの全体構成を示す。
図示しないGPS(Global Positioning System)アンテナによって受信された信号より自車両の位置を演算し、使用者に各種の情報を提示するナビゲーション制御部2が、音声の認識処理を行う信号処理部3に接続される。
【0013】
信号処理部3はメモリやCPUから構成される。信号処理部3には、あらかじめ用意された音声の標準パターンを辞書として記憶している記憶部6と、発話スイッチ13および訂正スイッチ14を備えた入力指示部12とが接続される。
【0014】
また信号処理部3には、D/Aコンバータ7、出力アンプ8を介してスピーカ9が接続され、信号処理部3から出力されたデジタルの音声信号がD/Aコンバータ7によってアナログの音声信号に変換され、出力アンプ8によって増幅されてスピーカ9から音声として出力される。
信号処理部3には、A/Dコンバータ10を介してマイク11が接続され、マイク11から入力されたアナログの音声信号がA/Dコンバータ10によってデジタルの音声信号に変換されて信号処理部3に伝達される。
【0015】
ナビゲーション制御部2は表示部16およびスピーカ9に接続されており、表示部16およびスピーカ9を通じて車両のドライバ等に位置情報等を提示する。
信号処理部3、記憶部6、D/Aコンバータ7、出力アンプ8およびA/Dコンバータ10より音声認識部1が構成される。
また、音声認識部1、ナビゲーション制御部2、表示部16、スピーカ9、マイク11および入力指示部12よりナビゲーションシステム20が構成される。
【0016】
次に図2を用いて、音声認識部1内で行われる処理の構成について説明する。
信号処理部3は内部に、音声入力部30、音声認識処理部31、騒音検出部32および閾値設定部33を有している。音声認識部1にマイク11を通じて音声が入力されると、音声入力部30は入力された音声の時間波形から音声区間を検出し、検出された音声区間をフレーム分割する。さらにフレーム分割した音声を、音声認識を行うためにパラメータ化する。
【0017】
記憶部6は、あらかじめ用意された音声の標準パターンを辞書として記憶している。音声認識処理部31は、音声入力部30においてパラメータ化された信号と、記憶部6に記憶された辞書から読み出した標準パターンとを、ビームサーチ法を用いながら比較し、認識結果を文字列などとして出力する。
【0018】
騒音検出部32はマイク11を通じて入力された音信号から騒音量を検出し、閾値設定部33は検出された騒音量から、音声認識処理部31で行うビームサーチ法による枝刈りの閾値αを決定する。この際、枝刈りの閾値αの初期値に対し、騒音量が大きいほど残す枝の数が少なくなる方向に閾値αを変更する。枝刈りの閾値αの初期値は、騒音が存在しない場合に十分な音声認識率が得られるような値として実験的に求めたものである。
【0019】
このように音声認識処理部31は、閾値設定部33によって騒音量に応じて設定されたビームサーチ法による枝刈りの閾値αを、刈るべきパスの累積尤度の閾値として用い、累積尤度の低いパスについては途中で計算を止めながら音声の認識処理を行う。
【0020】
図3のフローチャートを用いて、ナビゲーションシステムの音声認識処理の流れについて説明する。
ステップ100において、信号処理部3はナビゲーションシステム20の使用者によって、発話の開始を指示する入力指示部12に設けられた発話スイッチ13が操作されたかどうかの判断を行う。発話スイッチ13の操作があった場合にはステップ101へ進む。
【0021】
ステップ101において、信号処理部3は最大待受け時間の設定を行う。この最大待受け時間は、音声を検出できないまま、音声の待受け状態を継続し続けることを避けるために音声認識装置に設けるものである。最大待受け時間の長さは、記憶部6に記憶された最長の発話文が発話された場合の発話時間に余裕時間を加えた時間を設定する。
ステップ102において、信号処理部3内の騒音検出部32は騒音量の検出を行う。この騒音量は、マイク11を通じて入力されA/Dコンバータ10によってデジタル信号に変換された音声信号のうち、発話スイッチ13が操作されてから後述するステップ104において告知音信号が出力されるまでの間のデジタル信号の平均パワーを演算し、騒音量として記憶する。
【0022】
ステップ103において信号処理部3内の閾値設定部33は、ステップ102で記憶された騒音量に応じて、後述するステップ106でビームサーチ法を用いて一致度演算を行う際の枝刈りの閾値αを設定する。この設定の際に、騒音量が大きいほど残す枝の数が少なくなる方向に枝刈りの閾値αを設定する。
ステップ104において、信号処理部3は音声取り込み処理を開始した旨を使用者に知らせるために、記憶部6に記憶された告知音声信号をD/Aコンバータ7および出力アンプ8を通じて、スピーカ9から出力する。
【0023】
音声取り込み開始を知らせる告知音声を聞いた使用者は、認識対象に含まれる単語の発話を行う。
マイク11から入力された音声信号は、A/Dコンバータ10によってデジタル信号に変換されて信号処理部3に入力される。信号処理部3は、発話スイッチ13が操作された後、ステップ102において得られた騒音量に比べて入力されたデジタル信号の瞬間パワーが所定値以上大きくなったときに、使用者が発話したと判断してステップ105において音声の取り込みを開始する。なお入力されたデジタルの音声信号は、信号処理部3内の音声入力部30によって、所定時間幅の信号を1フレームとして取り込まれる。
【0024】
ステップ106において、信号処理部3内の音声認識処理部31は、記憶部6に記憶された音声の標準パターンと、音声入力部30によってパラメータ化された音声信号とをビームサーチ法を用いて一致度演算を行う。このビームサーチ法を用いた一致度演算は、ステップ103において設定された枝刈りの閾値αを用いて行われる。なおこのステップの処理を行う間も、並列して信号処理部3による音声の取り込みは継続されている。
【0025】
ステップ107において、信号処理部3は発話の終端が検出されたかどうかの判断を行う。この終端の検出は、音声のデジタル信号の瞬間パワーが所定値以下の状態が所定時間以上続いた場合に、使用者の発話が終了したと判断するものである。発話の終端を検出した場合は、ステップ108へ進み、終了していない場合はステップ112へ進む。
【0026】
ステップ112において、信号処理部3は音声取り込み開始後、ステップ101において設定した最大待受け時間を経過したかどうかの判断を行い、経過していない場合はステップ105へ戻る。また、最大待受け時間を経過している場合はステップ108へ進む。
発話の終端が検出されない場合として、使用者の発話終了後に、音声の代わりに信号処理部3に雑音が取り込まれている場合がある。このような場合に、最大待受け時間を経過したときに使用者の発話が終了したものと判断してステップ108へ進む。
【0027】
ステップ108において、音声の取り込み処理を終了する。音声認識処理部31による音声の認識処理の終了後、ステップ109において、信号処理部3は一致度の最も大きい認識対象語を認識結果として、D/Aコンバータ7および出力アンプ8を通じてスピーカ9から出力する。
【0028】
ステップ110において、ステップ109における認識対象語の出力後、信号処理部3は所定時間内に、入力指示部12に備えられた訂正スイッチ14が操作されたかどうかの判断を行う。訂正スイッチ14の操作があった場合は音声の認識結果に対して、使用者が訂正要求したと判断してステップ102へ戻り、上述の音声の認識処理をやり直す。
【0029】
一方、ステップ110において所定時間内に訂正スイッチ14の操作がない場合は、使用者がナビゲーションシステム20の認識結果を容認したと判断してステップ111へ進み、認識結果に応じた処理を行う。本実施例においては、信号処理部3は認識結果をナビゲーション制御部2へ出力し、ナビゲーション制御部2は入力された認識結果に応じて、道案内等の情報提示を行うものとする。
【0030】
本実施例は以上のように構成され、騒音検出部32によって検出された騒音量が大きい場合には、ビームサーチ法を行う際の枝刈りの閾値αを残す枝の数が少なくなる方向に変更することにより、騒音量が大きい場合には早期に音声認識の演算処理を終了させることができる。
【0031】
これにより、騒音量が大きく、音声認識のための演算時間を多くとっても音声の認識率が低く、早期に再発話を促したほうがよい場合において、すばやく音声認識の演算処理を終了し、音声の認識結果を得ることができる。
また騒音量に応じて枝刈りの閾値αを変更したとしても、使用者が明瞭に発話を行った場合には、枝刈りの閾値αの変更によらず音声認識部1は正しい音声の認識結果を得ることができる。
【0032】
次に第二の実施例について説明する。
図4に本実施例における車両のナビゲーションシステムの全体構成を示す。
音声の認識処理を行う信号処理部3Aに、車両の速度を検出するための車速センサ21が接続される。
信号処理部3A、記憶部6、D/Aコンバータ7、出力アンプ8およびA/Dコンバータ10より音声認識部1Aが構成される。
【0033】
また音声認識部1A、ナビゲーション制御部2、表示部16、スピーカ9、マイク11、入力指示部12および車速センサ21よりナビゲーションシステム20Aが構成される。
なお本実施例において、上記第一の実施例と同じ構成については同じ番号を付して説明を省略する。
【0034】
次に図5を用いて、音声認識部1Aで行われる処理の構成について説明する。
信号処理部3Aは内部に、音声入力部30、音声認識処理部31、閾値設定部33Aおよび走行状態検出部34を有している。
走行状態検出部34は、車速センサ21からの信号を受けて車両の走行速度を検出し、閾値設定部33Aは検出された車両速度から音声認識処理部31で行うビームサーチ法による枝刈りの閾値αを設定する。この際、枝刈りの閾値αの初期値に対し、走行速度が大きいほど残す枝の数が少なくなる方向に枝刈りの閾値αを変更する。枝刈りの閾値αの初期値は、車両が停止している場合に十分な音声認識率が得られるような値として実験的に求めたものである。
【0035】
このように音声認識処理部31は、閾値設定部33Aによって車両の走行速度に応じて設定されたビームサーチ法による枝刈りの閾値αを、刈るべきパスの累積尤度の閾値として用い、累積尤度の低いパスについては途中で計算を止めながら音声の認識処理を行う。
他の構成については、第一の実施例と同じであり説明を省略する。
【0036】
図6のフローチャートを用いて、ナビゲーションシステムの音声認識処理の流れについて説明する。
なお、本実施例におけるステップ200およびステップ201は、上記第一の実施例におけるステップ100および101と同様であり、また本実施例におけるステップ204からステップ212は第一の実施例におけるステップ104からステップ112と同様であり説明を省略する。
【0037】
ステップ202において、信号処理部3A内の走行状態検出部34は、車速センサ21からの信号より車両の走行速度を検出する。
ステップ203において、信号処理部3A内の閾値設定部33Aは、ステップ202によって検出された車両の走行速度に応じて、ステップ206で行うビームサーチ法に用いる枝刈りの閾値αを設定する。この設定の際に、車両の走行速度が大きいほど残す枝刈りの閾値αの数が少なくなる方向に設定する。
【0038】
本実施例は以上のように構成され、車速センサ21からの信号より走行状態検出部34によって車両の速度を検出し、検出された車両の速度に応じて閾値設定部33Aが枝刈りの閾値αを設定する。この設定の際に、車両の走行速度が大きいほど残す枝刈りの閾値αの数が少なくなる方向に枝刈りの閾値αを設定することにより、騒音量が大きくなる車両の速度が大きいときに、音声の認識処理の演算時間を短縮することができる。
【0039】
これにより、騒音量が大きく、音声認識のための演算時間を多くとっても音声の認識率が低いような場合で早期に再発話を促したほうがよい場合において、すばやく音声認識の演算処理を終了し、音声の認識結果を得ることができる。
また、音声認識装置の使用者が車両の運転を行っている場合は、使用者に運転負荷が加わっており、車両の速度が大きくなるにつれて発話ミスをしてしまう場合が多い。このような発話ミスも音声認識性能の著しい劣化の要因であって、演算時間を多くかけたとしても音声の認識率は低いものとなり、早期に再発話を促したほうがよい。よってこのような場合においても、すばやく音声認識の演算処理を終了し、音声の認識結果を得ることができる。
【0040】
なお、車両の速度に応じて枝刈りの閾値αを変更したとしても、使用者が明瞭に発話を行った場合には、枝刈りの閾値αの変更によらず音声認識部1Aは正しい音声の認識結果を得ることができる。
【0041】
次に第三の実施例について説明する。
図1に本実施例における車両のナビゲーションシステムの全体構成を示す。
音声の認識処理を行う信号処理部3B、記憶部6、D/Aコンバータ7、出力アンプ8およびA/Dコンバータ10より音声認識部1Bが構成される。
また音声認識部1B、ナビゲーション制御部2、表示部16、スピーカ9、マイク11、入力指示部12および車速センサ21よりナビゲーションシステム20Bが構成される。
なお本実施例において、上記第一の実施例と同じ構成については同じ番号を付して説明を省略する。
【0042】
次に図7を用いて、音声認識部1Bで行われる処理の構成について説明する。
信号処理部3Bは内部に、音声入力部30、音声認識処理部31、騒音検出部32、閾値設定部33B、目標アクティブパス数設定部35および実アクティブパス数検出部36を有している。また音声認識処理部31に記憶部6が接続されている。なお上記第一の実施例と同じ構成については同じ番号を付して説明を省略する。
【0043】
実アクティブパス数検出部36は、音声認識処理部31によって行われるビームサーチ法におけるアクティブなパスの本数n(t)を各フレームごとに検出し、閾値設定部33Bにその検出結果を出力する。
目標アクティブパス数設定部35は、騒音検出部32によって検出された騒音量から音声認識処理部31で行うビームサーチ法による枝刈りのアクティブパス数の目標値を決定する。この際目標アクティブパス数の初期値に対し、騒音量が大きいほど残す枝の数が少なくなる方向に目標アクティブパス数を変更する。アクティブパス数の初期値は、騒音が存在しない場合に十分な音声認識率が得られるような値として実験的に求めたものである。
【0044】
閾値設定部33Bは、実アクティブパス数検出部36によって検出された実際のアクティブパス数n(t)と、目標アクティブパス数設定部35によって設定された目標アクティブパス数N(t)とを比較し、実際のアクティブパス数n(t)が目標アクティブパス数N(t)を上回っている場合には、実際のアクティブパス数n(t)が目標アクティブパス数設定部35によって設定された目標アクティブパス数N(t)となるように、枝刈りの閾値αの値を更新する。
【0045】
図8のフローチャートを用いて、ナビゲーションシステムの音声認識処理の流れについて説明する。
なお、本実施例におけるステップ300およびステップ302は、上記第一の実施例におけるステップ100および102と同様であり、また本実施例におけるステップ304からステップ312は第一の実施例におけるステップ104からステップ112と同様であり説明を省略する。
【0046】
ステップ303において、信号処理部3B内の目標アクティブパス数設定部35は騒音量に応じて目標アクティブパス数N(t)を設定し、閾値設定部33Bが、実際のアクティブパス数n(t)と目標アクティブパス数N(t)を比較して枝刈りの閾値αを更新する。
【0047】
本実施例は以上のように構成され、騒音検出部32によって検出された騒音量をもとに目標アクティブパス数を設定し、その目標アクティブパス数と実際のアクティブパス数とを比較しながら枝刈りの閾値αを更新するので、より適確な閾値を自動的に設定することが可能となる。これによりビームサーチ法において、枝刈りが不十分で不要なパスの計算をしてしまうという冗長性や、枝刈りをし過ぎて最適パスをも刈り取ってしまうという危険性が軽減される。
【0048】
騒音量が大きい場合には、残すべき目標アクティブパス数を小さく設定することにより、騒音量が大きく、音声認識のための演算時間を多くとっても音声の認識率が低いような場合で早期に再発話を促したほうがよい場合において、すばやく音声認識の演算処理を終了し、音声の認識結果を得ることができる。
さらに、音声認識処理の演算時間の上限はおおむね目標アクティブパス数に同期して増減するので、目標アクティブパス数を変更することにより、音声が入力されてから再発話を促すまでの目標時間の上限に合わせた設計が可能となる。
【図面の簡単な説明】
【図1】本発明における第一の実施例および第三の実施例を示す図である。
【図2】音声認識部での処理の構成を示す図である。
【図3】音声認識処理の流れを示す図である。
【図4】第二の実施例を示す図である。
【図5】音声認識部での処理の構成を示す図である。
【図6】音声認識処理の流れを示す図である。
【図7】音声認識部での処理の構成を示す図である。
【図8】音声認識処理の流れを示す図である。
【符号の説明】
1 音声認識部
2 ナビゲーション制御部
3 信号処理部
6 記憶部
9 スピーカ
11 マイク
12 入力指示部
13 発話スイッチ
14 訂正スイッチ
16 表示部
20 ナビゲーションシステム
21 車速センサ
30 音声入力部
31 音声認識処理部
32 騒音検出部
33 閾値設定部
34 走行状態検出部
35 目標アクティブパス数設定部
36 実アクティブパス数検出部

Claims (7)

  1. 音声を入力し、該音声の時間波形から音声区間を検出し、検出された音声区間をフレーム分割し、フレーム分割された音声を認識のためのパラメータに変換する音声入力部と、あらかじめ用意された音声の標準パターンを記憶している記憶部と、前記音声入力部においてパラメータに変換された音声信号と、前記記憶部に記憶された音声の標準パターンとをビームサーチ法を用いながら比較して音声認識を行う音声認識処理部を有する音声認識装置において、
    前記音声認識処理部において用いられるビームサーチ法における枝刈りの閾値を設定する閾値設定部を備え、
    騒音が大きいという条件が成立する場合に、前記閾値設定部は、枝刈りの閾値を残す枝の数が少なくなるように設定し、前記音声認識処理部は、前記枝刈りの閾値をもとに音声認識を行うことを特徴とする音声認識装置。
  2. 騒音を検出する騒音検出部を備え、
    該騒音検出部によって騒音が検出されたときを、前記騒音が大きいという条件が成立する場合とすることを特徴とする請求項1記載の音声認識装置。
  3. 前記閾値設定部は、前記騒音検出部によって検出された騒音が大きくなるにつれて、残す枝の数が少なくなるように枝刈りの閾値を設定することを特徴とする請求項2記載の音声認識装置。
  4. 前記音声認識装置は車両に搭載され、
    該車両の走行状態を検出する走行状態検出部を備え、
    該走行状態検出部によって車両が走行状態であると検出されたときを、前記騒音が大きいという条件が成立する場合とすることを特徴とする請求項1から3のいずれか1に記載の音声認識装置。
  5. 前記閾値設定部は、前記走行状態検出部によって検出された車両の速度が大きくなるにつれて、残す枝の数が少なくなるように枝刈りの閾値を設定することを特徴とする請求項4記載の音声認識装置。
  6. ビームサーチ法における目標アクティブパス数を設定する目標アクティブパス数設定部を備え、
    前記騒音が大きいという条件が成立する場合に、前記目標アクティブパス数設定部は、目標アクティブパス数を残す枝の数が少なくなるように設定し、前記閾値設定部は前記設定された目標アクティブパス数に応じて枝刈りの閾値を設定することを特徴とする請求項1から5のいずれか1に記載の音声認識装置。
  7. 前記目標アクティブパス数設定部は、前記騒音が大きくなるにつれて、目標アクティブパス数を少ない値に設定することを特徴とする請求項6記載の音声認識装置。
JP2002368668A 2002-12-19 2002-12-19 音声認識装置 Withdrawn JP2004198832A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002368668A JP2004198832A (ja) 2002-12-19 2002-12-19 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002368668A JP2004198832A (ja) 2002-12-19 2002-12-19 音声認識装置

Publications (1)

Publication Number Publication Date
JP2004198832A true JP2004198832A (ja) 2004-07-15

Family

ID=32765177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002368668A Withdrawn JP2004198832A (ja) 2002-12-19 2002-12-19 音声認識装置

Country Status (1)

Country Link
JP (1) JP2004198832A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006065067A (ja) * 2004-08-27 2006-03-09 Nec Corp 音声処理装置、音声処理方法及び音声処理プログラム
JP2006171096A (ja) * 2004-12-13 2006-06-29 Ntt Docomo Inc 連続入力音声認識装置および連続入力音声認識方法
JP2006251545A (ja) * 2005-03-11 2006-09-21 Fujitsu Ltd 音声対話システム及びコンピュータプログラム
JP2008176202A (ja) * 2007-01-22 2008-07-31 Nippon Hoso Kyokai <Nhk> 音声認識装置及び音声認識プログラム
JP2011002494A (ja) * 2009-06-16 2011-01-06 Nippon Telegr & Teleph Corp <Ntt> 音声認識装置とその方法と、プログラムと記録媒体
JP2011523796A (ja) * 2008-04-14 2011-08-18 クゥアルコム・インコーポレイテッド 確率的雑音制約を有する半径適応球面復号化
US9230538B2 (en) 2011-04-08 2016-01-05 Mitsubishi Electric Corporation Voice recognition device and navigation device
WO2019202351A1 (ja) * 2018-04-20 2019-10-24 日産自動車株式会社 機器制御装置及び機器を制御する制御方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006065067A (ja) * 2004-08-27 2006-03-09 Nec Corp 音声処理装置、音声処理方法及び音声処理プログラム
JP2006171096A (ja) * 2004-12-13 2006-06-29 Ntt Docomo Inc 連続入力音声認識装置および連続入力音声認識方法
JP2006251545A (ja) * 2005-03-11 2006-09-21 Fujitsu Ltd 音声対話システム及びコンピュータプログラム
JP4667085B2 (ja) * 2005-03-11 2011-04-06 富士通株式会社 音声対話システム、コンピュータプログラム、対話制御装置及び音声対話方法
JP2008176202A (ja) * 2007-01-22 2008-07-31 Nippon Hoso Kyokai <Nhk> 音声認識装置及び音声認識プログラム
JP2011523796A (ja) * 2008-04-14 2011-08-18 クゥアルコム・インコーポレイテッド 確率的雑音制約を有する半径適応球面復号化
JP2011002494A (ja) * 2009-06-16 2011-01-06 Nippon Telegr & Teleph Corp <Ntt> 音声認識装置とその方法と、プログラムと記録媒体
US9230538B2 (en) 2011-04-08 2016-01-05 Mitsubishi Electric Corporation Voice recognition device and navigation device
WO2019202351A1 (ja) * 2018-04-20 2019-10-24 日産自動車株式会社 機器制御装置及び機器を制御する制御方法
JPWO2019202351A1 (ja) * 2018-04-20 2021-05-20 日産自動車株式会社 機器制御装置及び機器を制御する制御方法
JP7192858B2 (ja) 2018-04-20 2022-12-20 日産自動車株式会社 機器制御装置及び機器を制御する制御方法
US11820394B2 (en) 2018-04-20 2023-11-21 Nissan Motor Co., Ltd. Device control apparatus, and control method for controlling devices

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
US7069221B2 (en) Non-target barge-in detection
US6574595B1 (en) Method and apparatus for recognition-based barge-in detection in the context of subword-based automatic speech recognition
US20050261903A1 (en) Voice recognition device, voice recognition method, and computer product
JP4433704B2 (ja) 音声認識装置および音声認識用プログラム
US20090132255A1 (en) Systems and Methods of Performing Speech Recognition with Barge-In for use in a Bluetooth System
JP5431282B2 (ja) 音声対話装置、方法、プログラム
WO2010128560A1 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP2004198832A (ja) 音声認識装置
KR20150056276A (ko) 음성 인식을 위한 전처리 장치 및 그 방법
JP2000338994A (ja) 車載用音声認識装置
JP2006058390A (ja) 音声認識装置
JP2004109563A (ja) 音声対話システム、音声対話のためのプログラムおよび音声対話方法
JP3916861B2 (ja) 音声認識装置
JP6966374B2 (ja) 音声認識システム及びコンピュータプログラム
JP2006337942A (ja) 音声対話装置及び割り込み発話制御方法
JP2015215503A (ja) 音声認識方法、音声認識装置および音声認識プログラム
JP4178931B2 (ja) 音声認識装置
KR100749088B1 (ko) 대화형 네비게이션 시스템 및 그 제어방법
JP3588929B2 (ja) 音声認識装置
JP4979336B2 (ja) 音声出力装置
JP2009003205A (ja) 音声認識装置、および音声認識方法
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
US20200168221A1 (en) Voice recognition apparatus and method of voice recognition
JP2010107614A (ja) 音声案内応答方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060307