JP2005017709A - 車両用音声認識装置、車載ナビゲーション装置 - Google Patents
車両用音声認識装置、車載ナビゲーション装置 Download PDFInfo
- Publication number
- JP2005017709A JP2005017709A JP2003182641A JP2003182641A JP2005017709A JP 2005017709 A JP2005017709 A JP 2005017709A JP 2003182641 A JP2003182641 A JP 2003182641A JP 2003182641 A JP2003182641 A JP 2003182641A JP 2005017709 A JP2005017709 A JP 2005017709A
- Authority
- JP
- Japan
- Prior art keywords
- vehicle
- signal
- speech recognition
- speech
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】音声認識部1において、複数の音響モデル11を記憶し、入力される車速信号とエアコン風量信号に基づいて、記憶した音響モデル11のいずれかを選択する。そして、マイク3より入力された音声信号の音声信号パターンと、選択した音響モデルにおける音素ごとの信号パターンの特徴とを比較することにより音声認識を実行して、操作コマンドをナビゲーション部2に対して出力する。
【選択図】図1
Description
【発明の属する技術分野】
本発明は、車両に搭載されて音声認識を行う車両用音声認識装置に関する。
【0002】
【従来の技術】
取り込んだ音声の音声信号パターンを解析し、音響モデルを用いて音声を音素単位で捉えることによって、音声認識を行う音声認識システムが知られている。この音声認識システムは、辞書と呼ばれる音声認識の対象とする言葉を集めたものを有している。そして、音素ごとのパターンの特徴が記憶された音響モデルを参照することにより、音声信号パターンを音素の並びとして捉え、その音素の並びに当てはまる言葉を辞書から検索することによって、音声認識を実現している(特許文献1)。
【0003】
【特許文献1】
特開平10−282987号公報
【0004】
特許文献1の音声認識システムでは、固定の音響モデルによって音声を音素の並びに変換し、その音素の並びと辞書の言葉とを対応付けている。しかし、取り込まれる音声には状況に応じて様々に変化するノイズ、たとえば、車速に応じて変化するロードノイズなどが重畳される。また、ナビゲーション装置などにおける音声認識では、音声マイクには、エアコン風量に応じて変化するノイズが重畳される。特許文献1の音声認識システムにおいて、このように様々に変化するノイズが重畳された音声が入力されると、その音声信号パターンはノイズによって変化する。したがって、音響モデルに記憶されている音素のパターンの特徴を参照しても、その音声信号パターンを正しい音素の並びには変換できずに、音声認識処理が正しく実行されない場合がある。
【0005】
本発明は、様々に変化するノイズが音声に重畳されても、正しく音声認識を実行できる車両用音声認識装置を提供するものである。
【0006】
【課題を解決するための手段】
請求項1の発明による車両用音声認識装置は、音響モデルとして記憶されている音素ごとの信号パターンの特徴に基づいて音声認識を実行するものであり、異なる複数の音響モデルを記憶する記憶手段と、外部より入力される車両の車速信号とエアコン風量信号とに基づいて、複数の音響モデルのいずれかを選択する選択手段と、入力された音声信号と選択手段により選択された音響モデルとの比較結果に基づいて、音声信号を音素の並びに対応させる音声変換手段と、その音素の並びに基づいて、音声信号に対応する操作コマンドを外部に出力する操作コマンド出力手段とを備えるものである。
請求項2の発明による車載ナビゲーション装置は、請求項1の車両用音声認識装置と、車両用音声認識装置より出力される操作コマンドに基づいて作動し、車両のナビゲーションを行うナビゲーション手段とを備えるものである。
【0007】
【発明の実施の形態】
本発明による車両用音声認識装置の一実施例を適用したナビゲーション装置を図1に示す。図1のナビゲーション装置10は、音声認識を行う音声認識部1と、モニタを用いて地図表示などを行うナビゲーション部2とを有する。音声認識部1にはマイク3が接続されており、このマイク3によって、ユーザから発せられる音声が音声信号に変換され、音声認識部1に入力される。音声認識部1にはまた、車両から出力される車速パルスなどの車速信号と、車両に備えられたエアコンの風量を示す風量信号とが入力される。音声認識部1はこれらの入力信号に基づいて音声認識を行い、ナビゲーション部2に対して様々な操作コマンドを出力する。ナビゲーション部2は、入力された操作コマンドに対応する各種の処理、たとえば地図表示の切り換えや目的地の設定などを実行して、ユーザを目的地まで誘導するための車両のナビゲーションを行う。
【0008】
音声認識部1には、符号11に示す音響モデル00、01、02等よりなる複数の音響モデルが記憶されている。これらの音響モデルのいずれかを用いることによって、音声認識部1はマイク3より入力された音声信号を音素の並びに対応させる。ここで、音声認識部1に入力される音声信号は時間的に連続した信号であり、この連続した音声信号を、音声認識部1において所定のサンプリング時間ごとに切り出す。切り出された音声信号の信号パターンと、音響モデルとして記憶されている音素ごとの信号パターンの特徴とを比較することにより、切り出した音声信号を信号パターンが最も近い音素に対応させる。このようにして、切り出した音声信号に音素を対応させていくことで、入力された連続的な音声信号を音素の並びに対応させることができる。なお、このとき状況に応じて複数の音響モデルを使い分けるが、その具体的な方法は後で説明する。
【0009】
さらに、この音声信号に対応した音素の並びから、音声認識部1よりナビゲーション部2に対して出力する操作コマンドを決定する。各操作コマンドには、その内容ごとにそれぞれ特定の単語(語句)が割り当てられている。たとえば、表示されている地図を1段階広域のものに切り換えるための操作コマンドには、「広域」という単語が割り当てられている。入力された音声信号に対応する音素の並びが、これらの単語のいずれかと一致するかを判定し、いずれかと一致した場合には、その単語が割り当てられている操作コマンドをナビゲーション部2に対して出力する。このとき、完全に一致する単語がない場合は、その音素の並びに最も近い単語が割り当てられている操作コマンドを出力するようにしてもよい。このようにして、音声認識部1は音声認識を実行する。
【0010】
ところで、マイク3において取り込まれる音声には、ユーザから発せられた音声以外の様々なノイズが重畳されている。主なノイズとしては、車両の走行によって発生し、車両速度に応じてノイズ量が変化するもの、たとえばエンジン音や風切り音などによるノイズ、ロードノイズ等がある。また、マイク3にはエアコンの吹き出しによるノイズが重畳される。このエアコンのノイズ量は、エアコン風量に応じて変化する。このようなノイズが重畳されることにより、マイク3において取り込まれる音声が本来のユーザから発せられた音声とは異なるものとなり、音声認識部1に対して出力される音声信号パターンが本来のものから変化する。重畳されるノイズ量が多いほど、音声信号パターンの変化する度合いは大きくなる。
【0011】
音声認識部1は、このようにノイズが重畳されることによって音声信号パターンが変化した場合、その変化の度合いに応じて、適切な音響モデルを選択する。これにより、音声認識が正しく行われるようにする。具体的には、次のようにする。まず、音声認識部1において、入力された車両の車速信号とエアコンの風量信号により、車速とエアコン風量のフラグを内部的に設定する。このフラグは、たとえば図2に示すような8ビットのフラグ構成となっている。図2のフラグにおいて、ビットF0には車速に応じたフラグ値を設定する。たとえば、停車時ならば0、50km/h未満で走行中ならば1、50km/h以上100km/h未満で走行中ならば2、100km/h以上150km/h未満で走行中ならば3を、ビットF0のフラグ値として設定する。また、ビットF1にはエアコン風量に応じたフラグ値を設定する。たとえば、エアコン風量の段階を風速によって0速(エアコン停止時)〜5速と表し、その段階に応じて0〜5をビットF1のフラグ値として設定する。
【0012】
次に、上記のようにして設定された図2のフラグのフラグ値に基づいて、このときの音声信号に対応する音響モデルを選択する。たとえば、図3に示すような音響モデル番号の対応表を参照することにより、対応する音響モデルを選択する。図3の対応表において、たとえばビットF0およびF1のフラグ値が共に0である場合は音響モデル00を選択し、ビットF0のフラグ値が0、ビットF1のフラグ値が1である場合には、音響モデル01を選択する。
【0013】
以上説明したように選択される音響モデルにおいて、その音素ごとの信号パターンの特徴には、それぞれの音響モデルが対応しているフラグ値に該当する車速と風量に応じて、本来の信号パターンにその車速と風量で発生するべきノイズが重畳されている。なお、このときに重畳するノイズ量は、各種の実験などに基づいて最適なものがあらかじめ決定される。すなわち、各音響モデルには、それぞれが対応する車速と風量に応じて、最適な信号パターンの特徴が記録されている。したがって、上記のようにして選択された音響モデルを用いることにより、正しく音声認識を実行することができる。
【0014】
以上説明したナビゲーション装置10によれば、音声認識部1において、複数の音響モデルを記憶し、入力される車速信号とエアコン風量信号に基づいて、記憶した音響モデルのいずれかを選択する。そして、マイク3より入力された音声信号の音声信号パターンと、選択した音響モデルにおける音素ごとの信号パターンの特徴とを比較することにより、音声信号を音素の並びに対応させ、その音素の並びと一致する単語、またはその音素の並びに近い単語に対応する操作コマンドを、ナビゲーション部2に対して出力する。このようにして音声認識を実行することとしたので、車速やエアコン風量により様々に変化するノイズが音声に重畳されても、正しく音声認識を実行できる。
【0015】
なお、以上説明した実施の形態では、図2に示すフラグを用いて車速とエアコン風量の情報をフラグ値として設定し、そのフラグ値により、図3に示す対応表を用いて音響モデルを選択することとした。しかし、本発明はこの内容に限定する必要はなく、車速とエアコン風量に応じて複数の音響モデルのいずれかを選択するものであれば、本発明を適用可能である。
【0016】
以上説明した実施の形態では、記憶手段、選択手段、音声変換手段、および操作コマンド出力手段の各手段を全て音声認識部1によって実現しているが、これはあくまで一例であり、本発明の特徴が損なわれない限り、各構成要素は上記実施の形態に限定されない。
【0017】
【発明の効果】
本発明によれば、複数の音響モデルを記憶し、入力される車速信号とエアコン風量信号とに基づいて、記憶した複数の音響モデルのいずれかを選択する。そして、入力された音声信号の音声信号パターンと、選択した音響モデルにおける音素ごとの信号パターンの特徴との比較結果に基づいて、音声信号を音素の並びに対応させ、その音素の並びに基づいて対応する操作コマンドを出力することにより、音声認識を実行する。このようにしたので、車速やエアコン風量により様々に変化するノイズが音声に重畳されても、正しく音声認識を実行できる。
【図面の簡単な説明】
【図1】本発明による車両用音声認識装置の一実施例を適用したナビゲーション装置の構成を示す図である。
【図2】車速とエアコン風量より設定するフラグの構成例を示す図である。
【図3】設定されたフラグ値に対する音響モデル番号の対応表の例を示す図である。
【符号の説明】
1:音声認識部 2:ナビゲーション部
3:マイク 10:ナビゲーション装置
11:音響モデル
Claims (2)
- 音響モデルとして記憶されている音素ごとの信号パターンの特徴に基づいて音声認識を実行する音声認識装置において、
異なる複数の音響モデルを記憶する記憶手段と、
外部より入力される車両の車速信号とエアコン風量信号とに基づいて、前記複数の音響モデルのいずれかを選択する選択手段と、
入力された音声信号と前記選択手段により選択された音響モデルとの比較結果に基づいて、前記音声信号を音素の並びに対応させる音声変換手段と、
前記音素の並びに基づいて、前記音声信号に対応する操作コマンドを外部に出力する操作コマンド出力手段とを備えることを特徴とする車両用音声認識装置。 - 請求項1の車両用音声認識装置と、
前記車両用音声認識装置より出力される操作コマンドに基づいて作動し、車両のナビゲーションを行うナビゲーション手段とを備えることを特徴とする車載ナビゲーション装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003182641A JP2005017709A (ja) | 2003-06-26 | 2003-06-26 | 車両用音声認識装置、車載ナビゲーション装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003182641A JP2005017709A (ja) | 2003-06-26 | 2003-06-26 | 車両用音声認識装置、車載ナビゲーション装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005017709A true JP2005017709A (ja) | 2005-01-20 |
Family
ID=34182964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003182641A Pending JP2005017709A (ja) | 2003-06-26 | 2003-06-26 | 車両用音声認識装置、車載ナビゲーション装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005017709A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180096685A1 (en) * | 2010-06-24 | 2018-04-05 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US9975505B2 (en) | 2015-07-22 | 2018-05-22 | Hyundai Motor Company | Vehicle and control method thereof |
-
2003
- 2003-06-26 JP JP2003182641A patent/JP2005017709A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180096685A1 (en) * | 2010-06-24 | 2018-04-05 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US10818286B2 (en) * | 2010-06-24 | 2020-10-27 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US9975505B2 (en) | 2015-07-22 | 2018-05-22 | Hyundai Motor Company | Vehicle and control method thereof |
US10160413B2 (en) | 2015-07-22 | 2018-12-25 | Hyundai Motor Company | Vehicle and control method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7881934B2 (en) | Method and system for adjusting the voice prompt of an interactive system based upon the user's state | |
JP5972372B2 (ja) | 車載情報装置 | |
EP3172729B1 (en) | Text rule based multi-accent speech recognition with single acoustic model and automatic accent detection | |
JP2644376B2 (ja) | 車両用音声ナビゲーション方法 | |
JP4260788B2 (ja) | 音声認識機器制御装置 | |
JP2003532163A (ja) | 車載音声認識システムのための選択的話者適合方法 | |
CN104603871B (zh) | 用于运行车辆用的语音控制的信息系统的方法和设备 | |
US9922631B2 (en) | Car karaoke | |
JP2010156825A (ja) | 音声出力装置 | |
US20040215454A1 (en) | Speech recognition apparatus, speech recognition method, and recording medium on which speech recognition program is computer-readable recorded | |
JPH10105192A (ja) | 車両用音声案内装置 | |
JP2006088753A (ja) | 車載音響制御システム及びaiエージェント | |
JP2005049773A (ja) | 音楽再生装置 | |
JP2005017709A (ja) | 車両用音声認識装置、車載ナビゲーション装置 | |
JP2000321080A (ja) | 雑音抑圧装置,音声認識装置及び車両用ナビゲーション装置 | |
JP2018087871A (ja) | 音声出力装置 | |
CN110843790A (zh) | 一种车辆内的硬件协同控制方法、装置及设备 | |
JP4450575B2 (ja) | 車両用音声認識装置、車載ナビゲーション装置 | |
JP2007206239A (ja) | 音声認識装置および音声認識方法 | |
JPH1021049A (ja) | 音声合成装置 | |
JP7061523B2 (ja) | 車載用カラオケ装置 | |
JP2001022373A (ja) | 音声認識方法 | |
JP4190735B2 (ja) | 音声認識方法および装置とナビゲーション装置 | |
JP3679617B2 (ja) | 音声伝達方式 | |
JP2002055694A (ja) | 音声操作装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090428 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090908 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A072 | Dismissal of procedure [no reply to invitation to correct request for examination] |
Free format text: JAPANESE INTERMEDIATE CODE: A072 Effective date: 20100706 |