JPH1138995A - 音声認識装置及びナビゲーションシステム - Google Patents
音声認識装置及びナビゲーションシステムInfo
- Publication number
- JPH1138995A JPH1138995A JP9191186A JP19118697A JPH1138995A JP H1138995 A JPH1138995 A JP H1138995A JP 9191186 A JP9191186 A JP 9191186A JP 19118697 A JP19118697 A JP 19118697A JP H1138995 A JPH1138995 A JP H1138995A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input
- guide
- predetermined
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Traffic Control Systems (AREA)
- Instructional Devices (AREA)
- Navigation (AREA)
Abstract
(57)【要約】
【課題】 音声認識装置の利用方法に慣れていない利用
者であっても容易に利用ができ、より使い勝手の良い音
声認識装置を提供する。 【解決手段】 エンジンがONされると「音声入力が可
能です。クリックで説明します。」というガイド内容A
を報知し、音声での入力ができること自体を利用者に知
らせると共に、積極的に説明を求めたい利用者にはクリ
ック操作をするように促す。クリック操作をした場合に
は、例えば「目的地設定、拡大、縮小などが行えま
す。」というガイド内容Bが報知される。また、いざ音
声入力をしようとしてもどのように入力してよいのかが
判らない場合がある。つまり、PTTスイッチが押下さ
れて音声入力する利用者の意志は推認できるが、実際に
は何も音声入力されないことがある。したがって、その
場合には、例えば「目的地を設定するときは都道府県名
から入力して下さい。」というガイド内容Cを報知す
る。
者であっても容易に利用ができ、より使い勝手の良い音
声認識装置を提供する。 【解決手段】 エンジンがONされると「音声入力が可
能です。クリックで説明します。」というガイド内容A
を報知し、音声での入力ができること自体を利用者に知
らせると共に、積極的に説明を求めたい利用者にはクリ
ック操作をするように促す。クリック操作をした場合に
は、例えば「目的地設定、拡大、縮小などが行えま
す。」というガイド内容Bが報知される。また、いざ音
声入力をしようとしてもどのように入力してよいのかが
判らない場合がある。つまり、PTTスイッチが押下さ
れて音声入力する利用者の意志は推認できるが、実際に
は何も音声入力されないことがある。したがって、その
場合には、例えば「目的地を設定するときは都道府県名
から入力して下さい。」というガイド内容Cを報知す
る。
Description
【0001】
【発明の属する技術分野】本発明は、例えばナビゲーシ
ョンシステムにおける目的地の設定などを音声によって
入力できるようにする場合などに有効な音声認識装置及
びその音声認識装置を備えたナビゲーションシステムに
関する。
ョンシステムにおける目的地の設定などを音声によって
入力できるようにする場合などに有効な音声認識装置及
びその音声認識装置を備えたナビゲーションシステムに
関する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来よ
り、入力された音声を予め記憶されている複数の比較対
象パターン候補と比較し、一致度合の高いものを認識結
果とする音声認識装置が既に実用化されており、例えば
ナビゲーションシステムにおいて設定すべき目的地を利
用者が地名を音声で入力するためなどに用いられてい
る。特に車載ナビゲーションシステムを運転手自身が利
用する場合、音声入力であればボタン操作や画面注視が
伴わないため、車両の走行中に行っても安全性が高いた
め有効である。
り、入力された音声を予め記憶されている複数の比較対
象パターン候補と比較し、一致度合の高いものを認識結
果とする音声認識装置が既に実用化されており、例えば
ナビゲーションシステムにおいて設定すべき目的地を利
用者が地名を音声で入力するためなどに用いられてい
る。特に車載ナビゲーションシステムを運転手自身が利
用する場合、音声入力であればボタン操作や画面注視が
伴わないため、車両の走行中に行っても安全性が高いた
め有効である。
【0003】特に、音声認識装置側が常に音声入力に備
えるように準備しておくのは負担が大きいため、認識対
象となる音声を入力させる期間の開始及び終了タイミン
グについては利用者自身が指定するような構成が採用さ
れることが多い。この入力期間を指定するための手段と
しては、例えばPTT(Push-To-Talk)スイッチなどが
利用される。つまり、PTTスイッチが押されている場
合にだけ入力音声に対する認識処理を実行するようにし
て、実際上必要がない入力音声については処理をしない
ようにしている。
えるように準備しておくのは負担が大きいため、認識対
象となる音声を入力させる期間の開始及び終了タイミン
グについては利用者自身が指定するような構成が採用さ
れることが多い。この入力期間を指定するための手段と
しては、例えばPTT(Push-To-Talk)スイッチなどが
利用される。つまり、PTTスイッチが押されている場
合にだけ入力音声に対する認識処理を実行するようにし
て、実際上必要がない入力音声については処理をしない
ようにしている。
【0004】このように利用価値の高い音声入力の手法
であるが、利用者が音声認識のシステム自体に慣れてい
ないと、次のような問題点が生じる。例えば、利用方法
が判らないことに起因して、装置にとっては不適切な音
声を適当に入力してしまい実効性が上がらないという問
題や、あるいは、極端な場合には装置自体を使わないと
いう問題がある。また、利用方法自体をある程度は理解
しているが具体的な利用方法に慣れていないため、例え
ば入力すべき言葉がすぐに出てこなくて沈黙してしまう
という問題もある。
であるが、利用者が音声認識のシステム自体に慣れてい
ないと、次のような問題点が生じる。例えば、利用方法
が判らないことに起因して、装置にとっては不適切な音
声を適当に入力してしまい実効性が上がらないという問
題や、あるいは、極端な場合には装置自体を使わないと
いう問題がある。また、利用方法自体をある程度は理解
しているが具体的な利用方法に慣れていないため、例え
ば入力すべき言葉がすぐに出てこなくて沈黙してしまう
という問題もある。
【0005】本発明は、このような問題を解決し、音声
認識装置の利用方法に慣れていない利用者であっても容
易に利用ができ、より使い勝手の良い音声認識装置やそ
の音声認識装置を備えたナビゲーションシステムを提供
することを目的とする。
認識装置の利用方法に慣れていない利用者であっても容
易に利用ができ、より使い勝手の良い音声認識装置やそ
の音声認識装置を備えたナビゲーションシステムを提供
することを目的とする。
【0006】
【課題を解決するための手段及び発明の効果】上記目的
を達成するためになされた請求項1に記載の音声認識装
置は、音声を入力するための音声入力手段と、該音声入
力手段を用いて認識対象となる音声を入力させる期間の
開始及び終了を利用者自身が指定するために設けられた
入力期間指定手段と、該入力期間指定手段によって指定
された入力期間内の前記音声入力手段を介して入力され
た音声を、予め辞書手段に記憶されている複数の比較対
象パターン候補と比較して一致度合の高いものを認識結
果とする認識手段と、該認識手段による認識結果を報知
する報知手段と、該報知手段によって認識結果が報知さ
れた後に所定の確定指示がなされた場合には、当該認識
結果を確定したものとして所定の確定後処理を実行する
確定後処理手段と、を備える音声認識装置であって、前
記入力期間指定手段によって音声入力期間の開始が指定
された時点から所定時間経過しても前記音声入力手段を
介した音声入力がない場合には、所定のガイド内容を報
知するガイド手段を備えることを特徴とする。
を達成するためになされた請求項1に記載の音声認識装
置は、音声を入力するための音声入力手段と、該音声入
力手段を用いて認識対象となる音声を入力させる期間の
開始及び終了を利用者自身が指定するために設けられた
入力期間指定手段と、該入力期間指定手段によって指定
された入力期間内の前記音声入力手段を介して入力され
た音声を、予め辞書手段に記憶されている複数の比較対
象パターン候補と比較して一致度合の高いものを認識結
果とする認識手段と、該認識手段による認識結果を報知
する報知手段と、該報知手段によって認識結果が報知さ
れた後に所定の確定指示がなされた場合には、当該認識
結果を確定したものとして所定の確定後処理を実行する
確定後処理手段と、を備える音声認識装置であって、前
記入力期間指定手段によって音声入力期間の開始が指定
された時点から所定時間経過しても前記音声入力手段を
介した音声入力がない場合には、所定のガイド内容を報
知するガイド手段を備えることを特徴とする。
【0007】請求項1に記載の音声認識装置によれば、
利用者は例えばマイクロフォンなどの音声入力手段を介
して音声を入力するのであるが、認識対象の音声を入力
させる期間の開始及び終了を利用者自身が指定するため
に入力期間指定手段が設けられており、この入力期間指
定手段によって指定された入力期間内に入力された音声
が認識対象となる。そして、認識手段が、その入力され
た音声を予め辞書手段に記憶されている複数の比較対象
パターン候補と比較して一致度合の高いものを認識結果
とし、報知手段によって認識結果を報知する。そして、
認識結果が報知された後に所定の確定指示がなされた場
合には、確定後処理手段が、その認識結果を確定したも
のとして所定の確定後処理を実行する。
利用者は例えばマイクロフォンなどの音声入力手段を介
して音声を入力するのであるが、認識対象の音声を入力
させる期間の開始及び終了を利用者自身が指定するため
に入力期間指定手段が設けられており、この入力期間指
定手段によって指定された入力期間内に入力された音声
が認識対象となる。そして、認識手段が、その入力され
た音声を予め辞書手段に記憶されている複数の比較対象
パターン候補と比較して一致度合の高いものを認識結果
とし、報知手段によって認識結果を報知する。そして、
認識結果が報知された後に所定の確定指示がなされた場
合には、確定後処理手段が、その認識結果を確定したも
のとして所定の確定後処理を実行する。
【0008】そして、このような基本的な音声認識に関
する処理を実行する際、入力期間指定手段によって音声
入力期間の開始が指定された時点から所定時間経過して
も音声入力手段を介した音声入力がない場合には、ガイ
ド手段が、所定のガイド内容を少なくとも音声にて報知
する。つまり、入力期間指定手段によって音声入力期間
の開始が指定されたということは、利用者が音声入力を
しようとする意志は推認される。したがって、そのよう
な状態となったにもかかわらず所定時間経過しても音声
入力がないことの原因の一つとして、利用者は音声入力
したいのであるがどのように入力すればよいかについて
の理解が十分でないことが考えられる。そのため、利用
に際して困っている利用者に所定のガイド内容を報知す
るのである。
する処理を実行する際、入力期間指定手段によって音声
入力期間の開始が指定された時点から所定時間経過して
も音声入力手段を介した音声入力がない場合には、ガイ
ド手段が、所定のガイド内容を少なくとも音声にて報知
する。つまり、入力期間指定手段によって音声入力期間
の開始が指定されたということは、利用者が音声入力を
しようとする意志は推認される。したがって、そのよう
な状態となったにもかかわらず所定時間経過しても音声
入力がないことの原因の一つとして、利用者は音声入力
したいのであるがどのように入力すればよいかについて
の理解が十分でないことが考えられる。そのため、利用
に際して困っている利用者に所定のガイド内容を報知す
るのである。
【0009】この場合の所定のガイド内容としては種々
考えられるので、ここでは、ナビゲーションシステムに
おける目的地などを音声入力するために音声認識装置を
適用した場合を想定していくつか説明する。 まず、ナビゲーションシステムに対して自分が音声で
何を入力することができるのか自体を知らない場合など
には、例えば「目的地の設定が行えます」というよう
に、音声入力によって指示が可能な設定項目自体を案内
するものが考えられる。この場合には、音声入力によっ
て指示する対象のシステム(この場合にはナビゲーショ
ン装置)における一連の処理のどの段階にあるかで内容
を変更してもよい。例えば、目的地までの経路設定を一
連の処理と考えると、上述した目的地の設定がされた
後、例えば経由地の指定はするのか、というような経路
を設定する上での条件をさらに指定する場合がある。し
たがって、目的地の設定が済んでいる状況で、上述した
音声入力期間の開始が指定された時点から所定時間経過
しても音声入力がない場合には、今度は「経由地の指定
が行えます」というようなガイド内容を報知すればよ
い。
考えられるので、ここでは、ナビゲーションシステムに
おける目的地などを音声入力するために音声認識装置を
適用した場合を想定していくつか説明する。 まず、ナビゲーションシステムに対して自分が音声で
何を入力することができるのか自体を知らない場合など
には、例えば「目的地の設定が行えます」というよう
に、音声入力によって指示が可能な設定項目自体を案内
するものが考えられる。この場合には、音声入力によっ
て指示する対象のシステム(この場合にはナビゲーショ
ン装置)における一連の処理のどの段階にあるかで内容
を変更してもよい。例えば、目的地までの経路設定を一
連の処理と考えると、上述した目的地の設定がされた
後、例えば経由地の指定はするのか、というような経路
を設定する上での条件をさらに指定する場合がある。し
たがって、目的地の設定が済んでいる状況で、上述した
音声入力期間の開始が指定された時点から所定時間経過
しても音声入力がない場合には、今度は「経由地の指定
が行えます」というようなガイド内容を報知すればよ
い。
【0010】また、ナビゲーションシステムに対して
自分が音声で何を入力することができるのか自体は知っ
ているが、具体的な入力方法を熟知していない場合も想
定される。この場合には、「目的地を設定するときは都
道府県名から入力して下さい」というように、入力方法
の説明をガイド内容として報知することが考えられる。
また、これでも利用者がどのように入力するかを完全に
は理解できず、入力できずにいる場合には、「例えば愛
知県刈谷市昭和町と入力して下さい」というように、具
体的な入力例をガイド内容として報知することが考えら
れる。これによって利用者は具体的な入力方法が判り、
また、具体例まで報知してもらえばそれに倣って自分が
希望する目的地を容易に入力することができる。
自分が音声で何を入力することができるのか自体は知っ
ているが、具体的な入力方法を熟知していない場合も想
定される。この場合には、「目的地を設定するときは都
道府県名から入力して下さい」というように、入力方法
の説明をガイド内容として報知することが考えられる。
また、これでも利用者がどのように入力するかを完全に
は理解できず、入力できずにいる場合には、「例えば愛
知県刈谷市昭和町と入力して下さい」というように、具
体的な入力例をガイド内容として報知することが考えら
れる。これによって利用者は具体的な入力方法が判り、
また、具体例まで報知してもらえばそれに倣って自分が
希望する目的地を容易に入力することができる。
【0011】もちろん、上記及びで説明したガイド
内容は一例であり、適用するナビゲーションシステムの
処理に適合した適切なガイド内容を出せばよいし、また
ナビゲーションシステム以外に適用するのであれば、そ
のシステムの処理に適合するように工夫すればよい。
内容は一例であり、適用するナビゲーションシステムの
処理に適合した適切なガイド内容を出せばよいし、また
ナビゲーションシステム以外に適用するのであれば、そ
のシステムの処理に適合するように工夫すればよい。
【0012】このように、本発明の音声認識装置によれ
ば、音声認識装置の利用方法に慣れていない利用者であ
っても容易に利用ができるようになり、より使い勝手の
良いユーザフレンドリ面で優れた装置を提供することが
できる。また、利用方法に慣れていない利用者に対する
ガイド機能を発揮する上では、上述したように、入力期
間指定手段によって音声入力期間の開始が指定された時
点から所定時間経過しても音声入力手段を介した音声入
力がないという状況が生じた場合にガイド内容を報知す
るのではなく、利用者が積極的にガイド内容を知りたい
という場合に対応できるようにしておくことも考えられ
る。
ば、音声認識装置の利用方法に慣れていない利用者であ
っても容易に利用ができるようになり、より使い勝手の
良いユーザフレンドリ面で優れた装置を提供することが
できる。また、利用方法に慣れていない利用者に対する
ガイド機能を発揮する上では、上述したように、入力期
間指定手段によって音声入力期間の開始が指定された時
点から所定時間経過しても音声入力手段を介した音声入
力がないという状況が生じた場合にガイド内容を報知す
るのではなく、利用者が積極的にガイド内容を知りたい
という場合に対応できるようにしておくことも考えられ
る。
【0013】この点を考慮した音声認識装置は、請求項
2に示すように、音声を入力するための音声入力手段
と、該音声入力手段を用いて認識対象となる音声を入力
させる期間の開始及び終了を利用者自身が指定するため
に設けられた入力期間指定手段と、該入力期間指定手段
によって指定された入力期間内の前記音声入力手段を介
して入力された音声を、予め辞書手段に記憶されている
複数の比較対象パターン候補と比較して一致度合の高い
ものを認識結果とする認識手段と、該認識手段による認
識結果を報知する報知手段と、該報知手段によって認識
結果が報知された後に所定の確定指示がなされた場合に
は、当該認識結果を確定したものとして所定の確定後処
理を実行する確定後処理手段と、を備える音声認識装置
であって、前記入力期間指定手段によって通常の音声入
力期間の開始及び終了の指定ではない所定のガイド要求
がされた場合には、そのガイド要求に応じた所定のガイ
ド内容を報知するガイド手段を備えることを特徴とす
る。
2に示すように、音声を入力するための音声入力手段
と、該音声入力手段を用いて認識対象となる音声を入力
させる期間の開始及び終了を利用者自身が指定するため
に設けられた入力期間指定手段と、該入力期間指定手段
によって指定された入力期間内の前記音声入力手段を介
して入力された音声を、予め辞書手段に記憶されている
複数の比較対象パターン候補と比較して一致度合の高い
ものを認識結果とする認識手段と、該認識手段による認
識結果を報知する報知手段と、該報知手段によって認識
結果が報知された後に所定の確定指示がなされた場合に
は、当該認識結果を確定したものとして所定の確定後処
理を実行する確定後処理手段と、を備える音声認識装置
であって、前記入力期間指定手段によって通常の音声入
力期間の開始及び終了の指定ではない所定のガイド要求
がされた場合には、そのガイド要求に応じた所定のガイ
ド内容を報知するガイド手段を備えることを特徴とす
る。
【0014】この請求項2に記載の音声認識装置によれ
ば、利用者は例えばマイクロフォンなどの音声入力手段
を介して音声を入力するのであるが、認識対象の音声を
入力させる期間の開始及び終了を利用者自身が指定する
ために入力期間指定手段が設けられており、この入力期
間指定手段によって指定された入力期間内に入力された
音声が認識対象となる。そして、認識手段が、その入力
された音声を予め辞書手段に記憶されている複数の比較
対象パターン候補と比較して一致度合の高いものを認識
結果とし、報知手段によって認識結果を報知する。そし
て、認識結果が報知された後に所定の確定指示がなされ
た場合には、確定後処理手段が、その認識結果を確定し
たものとして所定の確定後処理を実行する。
ば、利用者は例えばマイクロフォンなどの音声入力手段
を介して音声を入力するのであるが、認識対象の音声を
入力させる期間の開始及び終了を利用者自身が指定する
ために入力期間指定手段が設けられており、この入力期
間指定手段によって指定された入力期間内に入力された
音声が認識対象となる。そして、認識手段が、その入力
された音声を予め辞書手段に記憶されている複数の比較
対象パターン候補と比較して一致度合の高いものを認識
結果とし、報知手段によって認識結果を報知する。そし
て、認識結果が報知された後に所定の確定指示がなされ
た場合には、確定後処理手段が、その認識結果を確定し
たものとして所定の確定後処理を実行する。
【0015】そして、このような基本的な音声認識に関
する処理を実行する際、入力期間指定手段によって通常
の音声入力期間の開始及び終了の指定ではない所定のガ
イド要求がされた場合には、ガイド手段が、そのガイド
要求に応じた所定のガイド内容を報知する。ここで、
「通常の音声入力期間の開始及び終了の指定ではない所
定のガイド要求がされた場合」とは、例えば次のような
場合を言う。通常の音声入力期間の開始及び終了の指定
は、開始指定の後に音声入力を行い、その後に終了指定
をすることになるので、開始指定から終了指定までの間
隔が例えば1秒以下となるようなことは想定しにくい。
したがって、例えば開始指定から終了指定までの間隔が
比較的短い時間(例えば0.5秒以下)となるいわゆる
「クリック動作」の場合には、それは音声入力期間の開
始及び終了の指定ではなく、ガイド要求のための操作で
あると判断するのである。もちろん、装置側において通
常の音声入力期間の開始及び終了の指定ではありえない
様な特別の操作であれば、これ以外の操作もガイド要求
のための操作であるとしてよい。例えばいわゆる「ダブ
ルクリック」なども適用できる。
する処理を実行する際、入力期間指定手段によって通常
の音声入力期間の開始及び終了の指定ではない所定のガ
イド要求がされた場合には、ガイド手段が、そのガイド
要求に応じた所定のガイド内容を報知する。ここで、
「通常の音声入力期間の開始及び終了の指定ではない所
定のガイド要求がされた場合」とは、例えば次のような
場合を言う。通常の音声入力期間の開始及び終了の指定
は、開始指定の後に音声入力を行い、その後に終了指定
をすることになるので、開始指定から終了指定までの間
隔が例えば1秒以下となるようなことは想定しにくい。
したがって、例えば開始指定から終了指定までの間隔が
比較的短い時間(例えば0.5秒以下)となるいわゆる
「クリック動作」の場合には、それは音声入力期間の開
始及び終了の指定ではなく、ガイド要求のための操作で
あると判断するのである。もちろん、装置側において通
常の音声入力期間の開始及び終了の指定ではありえない
様な特別の操作であれば、これ以外の操作もガイド要求
のための操作であるとしてよい。例えばいわゆる「ダブ
ルクリック」なども適用できる。
【0016】本請求項2記載の音声認識装置によれば、
利用者が積極的にガイド内容を知りたいという場合に
は、上記入力期間指定手段によって所定のガイド要求を
すればよく、利用方法に慣れていない利用者に対するガ
イド機能を発揮することができる。その上、ガイド要求
を指定するためだけに特別な構成を必要とするのではな
く、音声入力のための基本的な処理に必要な入力期間指
定手段をガイド要求の指定にも利用できるため、構成の
簡略化にも寄与する。
利用者が積極的にガイド内容を知りたいという場合に
は、上記入力期間指定手段によって所定のガイド要求を
すればよく、利用方法に慣れていない利用者に対するガ
イド機能を発揮することができる。その上、ガイド要求
を指定するためだけに特別な構成を必要とするのではな
く、音声入力のための基本的な処理に必要な入力期間指
定手段をガイド要求の指定にも利用できるため、構成の
簡略化にも寄与する。
【0017】なお、この場合の所定のガイド内容も種々
考えられるが、上述したナビゲーションシステムにおけ
る目的地などを音声入力するために音声認識装置を適用
した場合を想定して説明した上記及びに関して言え
ば、この場合には特にで示した内容が有効であると考
えられる。つまり、ナビゲーションシステムに対して自
分が音声で何を入力することができるのか自体を知らな
い場合などに「目的地の設定が行えます」というよう
に、音声入力によって指示が可能な設定項目自体を案内
するものである。この場合にも、当然ながら一連のナビ
ゲーション処理のどの段階にあるかで内容を変更しても
よい。また、)で示したガイド内容の例も、特に除外す
ることはなく、「目的地を設定するときは都道府県名か
ら入力して下さい」や「例えば愛知県刈谷市昭和町と入
力して下さい」というようなガイド内容を報知してもよ
い。
考えられるが、上述したナビゲーションシステムにおけ
る目的地などを音声入力するために音声認識装置を適用
した場合を想定して説明した上記及びに関して言え
ば、この場合には特にで示した内容が有効であると考
えられる。つまり、ナビゲーションシステムに対して自
分が音声で何を入力することができるのか自体を知らな
い場合などに「目的地の設定が行えます」というよう
に、音声入力によって指示が可能な設定項目自体を案内
するものである。この場合にも、当然ながら一連のナビ
ゲーション処理のどの段階にあるかで内容を変更しても
よい。また、)で示したガイド内容の例も、特に除外す
ることはなく、「目的地を設定するときは都道府県名か
ら入力して下さい」や「例えば愛知県刈谷市昭和町と入
力して下さい」というようなガイド内容を報知してもよ
い。
【0018】上述した請求項1に示した音声認識装置に
おいては、利用者が音声入力をしようとする意志は推認
されるが実際には音声入力がなく、どのように入力すれ
ばよいかについての理解が十分でないことが考えられる
ため、利用に際して困っている利用者に対して、特に
「どのように入力すればよいのか」を教示するという観
点から所定のガイド内容が決まっていた。それに対し
て、請求項2に記載する音声認識装置においては、利用
者が音声入力をしようとしている状況ではなく、それ以
前の状況でガイド要求をするため、上述したように、
「目的地の設定が行えます」というような音声入力によ
って指示が可能な設定項目自体を案内するといったガイ
ド内容が適合する。但し、ガイド要求がされた状況を判
断し、その状況での適切なガイド内容を報知すればよい
ので、その内容自体を特に限定するものではない。
おいては、利用者が音声入力をしようとする意志は推認
されるが実際には音声入力がなく、どのように入力すれ
ばよいかについての理解が十分でないことが考えられる
ため、利用に際して困っている利用者に対して、特に
「どのように入力すればよいのか」を教示するという観
点から所定のガイド内容が決まっていた。それに対し
て、請求項2に記載する音声認識装置においては、利用
者が音声入力をしようとしている状況ではなく、それ以
前の状況でガイド要求をするため、上述したように、
「目的地の設定が行えます」というような音声入力によ
って指示が可能な設定項目自体を案内するといったガイ
ド内容が適合する。但し、ガイド要求がされた状況を判
断し、その状況での適切なガイド内容を報知すればよい
ので、その内容自体を特に限定するものではない。
【0019】また、上述した2つの機能を兼ね備える音
声認識装置としては、請求項3に示す構成が考えられ
る。すなわち、請求項1に記載の音声認識装置におい
て、ガイド手段は、入力期間指定手段によって通常の音
声入力期間の開始及び終了の指定ではない所定のガイド
要求がされた場合には、そのガイド要求に応じた所定の
ガイド内容を少なくとも音声にて報知するよう構成され
ていることを特徴とする。
声認識装置としては、請求項3に示す構成が考えられ
る。すなわち、請求項1に記載の音声認識装置におい
て、ガイド手段は、入力期間指定手段によって通常の音
声入力期間の開始及び終了の指定ではない所定のガイド
要求がされた場合には、そのガイド要求に応じた所定の
ガイド内容を少なくとも音声にて報知するよう構成され
ていることを特徴とする。
【0020】この場合の音声認識装置によれば、ガイド
手段が、次の2種類の状況を判断して対応する処理を実
行する。つまり、一つは、入力期間指定手段によって音
声入力期間の開始が指定された時点から所定時間経過し
ても音声入力手段を介した音声入力がない場合には、所
定のガイド内容を報知するものであり、もう一つは、入
力期間指定手段によって通常の音声入力期間の開始及び
終了の指定ではない所定のガイド要求がされた場合に
は、そのガイド要求に応じた所定のガイド内容を報知す
るというものである。
手段が、次の2種類の状況を判断して対応する処理を実
行する。つまり、一つは、入力期間指定手段によって音
声入力期間の開始が指定された時点から所定時間経過し
ても音声入力手段を介した音声入力がない場合には、所
定のガイド内容を報知するものであり、もう一つは、入
力期間指定手段によって通常の音声入力期間の開始及び
終了の指定ではない所定のガイド要求がされた場合に
は、そのガイド要求に応じた所定のガイド内容を報知す
るというものである。
【0021】したがって、上述した利用方法に慣れてい
ない利用者の2種類の状況にそれぞれ応じた適切なガイ
ド機能を発揮することができる。なお、報知手段による
認識結果の報知形態、あるいはガイド手段によるガイド
内容の報知形態については、利用者に対して報知が可能
であればどのような形態でもよいが、請求項4に示すよ
うに、少なくとも音声による報知を行なうことが好まし
いと考えられる。これは、例えばカーナビゲーションシ
ステムなどの車載機器用として用いる場合には、音声で
出力されればドライバーは視点を表示装置にずらしたり
する必要がないので、安全運転のより一層の確保の点で
は有利であることなどの理由からである。また、認識結
果の報知を音声で行ない、かつガイド内容の報知も音声
で行なえば、それらのためのハード構成を共通化するこ
とができる。但し、音声に加え例えば画像で報知するよ
うにしてもよい。車載機器として適用する場合に音声出
力が有利であることを述べたが、もちろん車両が走行中
でない状況もあるので、音声及び画像の両方で報知すれ
ば、ドライバーは表示による確認と音声による確認との
両方が可能となる。
ない利用者の2種類の状況にそれぞれ応じた適切なガイ
ド機能を発揮することができる。なお、報知手段による
認識結果の報知形態、あるいはガイド手段によるガイド
内容の報知形態については、利用者に対して報知が可能
であればどのような形態でもよいが、請求項4に示すよ
うに、少なくとも音声による報知を行なうことが好まし
いと考えられる。これは、例えばカーナビゲーションシ
ステムなどの車載機器用として用いる場合には、音声で
出力されればドライバーは視点を表示装置にずらしたり
する必要がないので、安全運転のより一層の確保の点で
は有利であることなどの理由からである。また、認識結
果の報知を音声で行ない、かつガイド内容の報知も音声
で行なえば、それらのためのハード構成を共通化するこ
とができる。但し、音声に加え例えば画像で報知するよ
うにしてもよい。車載機器として適用する場合に音声出
力が有利であることを述べたが、もちろん車両が走行中
でない状況もあるので、音声及び画像の両方で報知すれ
ば、ドライバーは表示による確認と音声による確認との
両方が可能となる。
【0022】また、請求項1〜6のいずれかに記載の音
声認識装置をナビゲーションシステム用として用いる場
合には、請求項7に示すように構成することが考えられ
る。すなわち、請求項1〜6のいずれかに記載の音声認
識装置と、ナビゲーション装置とを備え、音声認識装置
の音声入力手段は、少なくともナビゲーション装置がナ
ビゲート処理をする上で指定される必要のある所定のナ
ビゲート処理関連データの指示を利用者が音声にて入力
するために用いられるものであり、確定後処理手段は、
認識手段による認識結果をナビゲーション装置に出力す
るよう構成されているのである。この場合の「所定のナ
ビゲート処理関連データ」としては、目的地が代表的な
ものとして挙げられるが、それ以外にもルート探索に関
する条件選択など、ナビゲート処理をする上で指定の必
要のある指示が含まれる。
声認識装置をナビゲーションシステム用として用いる場
合には、請求項7に示すように構成することが考えられ
る。すなわち、請求項1〜6のいずれかに記載の音声認
識装置と、ナビゲーション装置とを備え、音声認識装置
の音声入力手段は、少なくともナビゲーション装置がナ
ビゲート処理をする上で指定される必要のある所定のナ
ビゲート処理関連データの指示を利用者が音声にて入力
するために用いられるものであり、確定後処理手段は、
認識手段による認識結果をナビゲーション装置に出力す
るよう構成されているのである。この場合の「所定のナ
ビゲート処理関連データ」としては、目的地が代表的な
ものとして挙げられるが、それ以外にもルート探索に関
する条件選択など、ナビゲート処理をする上で指定の必
要のある指示が含まれる。
【0023】なお、音声認識装置の適用先としては、上
述したナビゲーションシステムには限定されない。例え
ば音声認識装置を空調システム用として用いる場合に
は、設定温度の調整、空調モード(冷房・暖房・ドラ
イ)の選択、あるいは風向モードの選択を音声入力によ
って行うようにすることが考えられる。そして、この場
合には、その設定項目(温度・空調モード・風向モード
など)自体をガイド内容として報知したり、あるいは、
「設定温度を25度にする」と言えばよいのか「設定温
度を5度下げる」というように言えばよいのか、などを
さらにガイド内容として報知することが考えられる。空
調モードや風向モードなどについても同様である。
述したナビゲーションシステムには限定されない。例え
ば音声認識装置を空調システム用として用いる場合に
は、設定温度の調整、空調モード(冷房・暖房・ドラ
イ)の選択、あるいは風向モードの選択を音声入力によ
って行うようにすることが考えられる。そして、この場
合には、その設定項目(温度・空調モード・風向モード
など)自体をガイド内容として報知したり、あるいは、
「設定温度を25度にする」と言えばよいのか「設定温
度を5度下げる」というように言えばよいのか、などを
さらにガイド内容として報知することが考えられる。空
調モードや風向モードなどについても同様である。
【0024】なお、上述のナビゲーションシステム及び
空調システムは、車載機器として用いられる場合だけで
はなく、例えば携帯型ナビゲーション装置や屋内用空調
装置などでもよい。但し、これまで説明したように車載
機器用として用いる場合には利用者がドライバーである
ことが考えられ、その場合には運転自体が最重要であ
り、それ以外の車載機器については、なるべく運転に支
障がないことが好ましい。したがって、車載機器として
のナビゲーションシステムや空調システムを前提とした
音声認識装置の場合には、より一層の利点がある。もち
ろん、このような視点で考えるならば、ナビゲーション
システムや空調システム以外の車載機器に対しても同様
に利用することができる。例えば、カーオーディオ機器
などは有効である。また、いわゆるパワーウインドウの
開閉やミラー角度の調整などを音声によって指示するよ
うな構成を考えれば、そのような状況でも有効である。
空調システムは、車載機器として用いられる場合だけで
はなく、例えば携帯型ナビゲーション装置や屋内用空調
装置などでもよい。但し、これまで説明したように車載
機器用として用いる場合には利用者がドライバーである
ことが考えられ、その場合には運転自体が最重要であ
り、それ以外の車載機器については、なるべく運転に支
障がないことが好ましい。したがって、車載機器として
のナビゲーションシステムや空調システムを前提とした
音声認識装置の場合には、より一層の利点がある。もち
ろん、このような視点で考えるならば、ナビゲーション
システムや空調システム以外の車載機器に対しても同様
に利用することができる。例えば、カーオーディオ機器
などは有効である。また、いわゆるパワーウインドウの
開閉やミラー角度の調整などを音声によって指示するよ
うな構成を考えれば、そのような状況でも有効である。
【0025】また、車載機器用とした場合にはそれ特有
の利点があることは述べたが、本発明の音声認識装置の
適用先としては、利用者による音声入力指示にしたがっ
て所定の処理を実行するものであれば同様に考えられ
る。例えば、携帯用の情報端末装置、あるいは街頭やパ
ーキングエリアなどに設定される情報端末装置などにも
同様に適用できる。
の利点があることは述べたが、本発明の音声認識装置の
適用先としては、利用者による音声入力指示にしたがっ
て所定の処理を実行するものであれば同様に考えられ
る。例えば、携帯用の情報端末装置、あるいは街頭やパ
ーキングエリアなどに設定される情報端末装置などにも
同様に適用できる。
【0026】
【発明の実施の形態】図1は本発明の実施形態の音声認
識装置30を適用したカーナビゲーションシステム2の
概略構成を示すブロック図である。本カーナビゲーショ
ンシステム2は、位置検出器4、地図データ入力器6、
操作スイッチ群8、これらに接続された制御回路10、
制御回路10に接続された外部メモリ12、表示装置1
4及びリモコンセンサ15及び音声認識装置30を備え
ている。なお制御回路10は通常のコンピュータとして
構成されており、内部には、周知のCPU、ROM、R
AM、I/O及びこれらの構成を接続するバスラインが
備えられている。
識装置30を適用したカーナビゲーションシステム2の
概略構成を示すブロック図である。本カーナビゲーショ
ンシステム2は、位置検出器4、地図データ入力器6、
操作スイッチ群8、これらに接続された制御回路10、
制御回路10に接続された外部メモリ12、表示装置1
4及びリモコンセンサ15及び音声認識装置30を備え
ている。なお制御回路10は通常のコンピュータとして
構成されており、内部には、周知のCPU、ROM、R
AM、I/O及びこれらの構成を接続するバスラインが
備えられている。
【0027】位置検出器4は、周知の地磁気センサ1
6、ジャイロスコープ18、距離センサ20、及び衛星
からの電波に基づいて車両の位置を検出するGPS(Gl
obal Positioning System )のためのGPS受信機22
を有している。これらのセンサ等16,18,20,2
2は各々が性質の異なる誤差を持っているため、複数の
センサにより、各々補間しながら使用するように構成さ
れている。なお、精度によっては上述した内の一部で構
成してもよく、更に、ステアリングの回転センサ、各転
動輪の車輪センサ等を用いてもよい。
6、ジャイロスコープ18、距離センサ20、及び衛星
からの電波に基づいて車両の位置を検出するGPS(Gl
obal Positioning System )のためのGPS受信機22
を有している。これらのセンサ等16,18,20,2
2は各々が性質の異なる誤差を持っているため、複数の
センサにより、各々補間しながら使用するように構成さ
れている。なお、精度によっては上述した内の一部で構
成してもよく、更に、ステアリングの回転センサ、各転
動輪の車輪センサ等を用いてもよい。
【0028】地図データ入力器6は、位置検出の精度向
上のためのいわゆるマップマッチング用データ、地図デ
ータ及び目印データを含む各種データを入力するための
装置である。媒体としては、そのデータ量からCD−R
OMを用いるのが一般的であるが、メモリカード等の他
の媒体を用いても良い。
上のためのいわゆるマップマッチング用データ、地図デ
ータ及び目印データを含む各種データを入力するための
装置である。媒体としては、そのデータ量からCD−R
OMを用いるのが一般的であるが、メモリカード等の他
の媒体を用いても良い。
【0029】表示装置14はカラー表示装置であり、表
示装置14の画面には、位置検出器4から入力された車
両現在位置マークと、地図データ入力器6より入力され
た地図データと、更に地図上に表示する誘導経路や後述
する設定地点の目印等の付加データとを重ねて表示する
ことができる。
示装置14の画面には、位置検出器4から入力された車
両現在位置マークと、地図データ入力器6より入力され
た地図データと、更に地図上に表示する誘導経路や後述
する設定地点の目印等の付加データとを重ねて表示する
ことができる。
【0030】また、本カーナビゲーションシステム2
は、リモートコントロール端末(以下、リモコンと称す
る。)15aを介してリモコンセンサ15から、あるい
は操作スイッチ群8により目的地の位置を入力すると、
現在位置からその目的地までの最適な経路を自動的に選
択して誘導経路を形成し表示する、いわゆる経路案内機
能も備えている。このような自動的に最適な経路を設定
する手法は、ダイクストラ法等の手法が知られている。
操作スイッチ群8は、例えば、表示装置14と一体にな
ったタッチスイッチもしくはメカニカルなスイッチ等が
用いられ、各種入力に使用される。
は、リモートコントロール端末(以下、リモコンと称す
る。)15aを介してリモコンセンサ15から、あるい
は操作スイッチ群8により目的地の位置を入力すると、
現在位置からその目的地までの最適な経路を自動的に選
択して誘導経路を形成し表示する、いわゆる経路案内機
能も備えている。このような自動的に最適な経路を設定
する手法は、ダイクストラ法等の手法が知られている。
操作スイッチ群8は、例えば、表示装置14と一体にな
ったタッチスイッチもしくはメカニカルなスイッチ等が
用いられ、各種入力に使用される。
【0031】そして、音声認識装置30は、上記操作ス
イッチ群8あるいはリモコン15aが手動操作により目
的地などを指示するために用いられるのに対して、利用
者が音声で入力することによっても同様に目的地などを
指示することができるようにするための装置である。
イッチ群8あるいはリモコン15aが手動操作により目
的地などを指示するために用いられるのに対して、利用
者が音声で入力することによっても同様に目的地などを
指示することができるようにするための装置である。
【0032】この音声認識装置30は、「認識手段」と
しての音声認識部31と、「確定後処理手段」としての
対話制御部32と、音声合成部33と、音声抽出部34
と、「音声入力手段」としてのマイク35と、「入力期
間指定手段」としてのPTT(Push-To-Talk)スイッチ
36と、スピーカ37と、制御部38と、表示制御部3
9と、表示部40とを備えている。
しての音声認識部31と、「確定後処理手段」としての
対話制御部32と、音声合成部33と、音声抽出部34
と、「音声入力手段」としてのマイク35と、「入力期
間指定手段」としてのPTT(Push-To-Talk)スイッチ
36と、スピーカ37と、制御部38と、表示制御部3
9と、表示部40とを備えている。
【0033】音声認識部31は、音声抽出部34から入
力された音声データを、対話制御部32からの指示によ
り入力音声の認識処理を行い、その認識結果を対話制御
部32に返す。すなわち、音声抽出部34から取得した
音声データに対し、記憶している辞書データを用いて照
合を行ない、複数の比較対象パターン候補と比較して一
致度の高い上位比較対象パターンを対話制御部32へ出
力する。入力音声中の単語系列の認識は、音声抽出部3
4から入力された音声データを順次音響分析して音響的
特徴量(例えばケプストラム)を抽出し、この音響分析
によって得られた音響的特徴量時系列データを得る。そ
して、周知のDPマッチング法、HMM(隠れマルコフ
モデル)あるいはニューラルネットなどによって、この
時系列データをいくつかの区間に分け、各区間が辞書デ
ータとして格納されたどの単語に対応しているかを求め
る。
力された音声データを、対話制御部32からの指示によ
り入力音声の認識処理を行い、その認識結果を対話制御
部32に返す。すなわち、音声抽出部34から取得した
音声データに対し、記憶している辞書データを用いて照
合を行ない、複数の比較対象パターン候補と比較して一
致度の高い上位比較対象パターンを対話制御部32へ出
力する。入力音声中の単語系列の認識は、音声抽出部3
4から入力された音声データを順次音響分析して音響的
特徴量(例えばケプストラム)を抽出し、この音響分析
によって得られた音響的特徴量時系列データを得る。そ
して、周知のDPマッチング法、HMM(隠れマルコフ
モデル)あるいはニューラルネットなどによって、この
時系列データをいくつかの区間に分け、各区間が辞書デ
ータとして格納されたどの単語に対応しているかを求め
る。
【0034】対話制御部32は、音声認識部31におけ
る認識結果や制御部38からの指示に基づき、音声合成
部33への応答音声の出力指示や表示制御部39への応
答表示の出力指示、あるいは、システム自体の処理を実
行する制御回路10に対して例えばナビゲート処理のた
めに必要な目的地を通知して設定処理を実行させるよう
指示する処理を実行する。このような処理が確定後処理
であり、結果として、この音声認識装置30を利用すれ
ば、上記操作スイッチ群8あるいはリモコン15aを手
動しなくても、音声入力によりナビゲーションシステム
に対する目的地の指示などが可能となるのである。
る認識結果や制御部38からの指示に基づき、音声合成
部33への応答音声の出力指示や表示制御部39への応
答表示の出力指示、あるいは、システム自体の処理を実
行する制御回路10に対して例えばナビゲート処理のた
めに必要な目的地を通知して設定処理を実行させるよう
指示する処理を実行する。このような処理が確定後処理
であり、結果として、この音声認識装置30を利用すれ
ば、上記操作スイッチ群8あるいはリモコン15aを手
動しなくても、音声入力によりナビゲーションシステム
に対する目的地の指示などが可能となるのである。
【0035】なお、音声合成部33は、波形データベー
ス内に格納されている音声波形を用い、対話制御部32
からの応答音声の出力指示に基づく音声を合成する。こ
の合成音声がスピーカ37から出力されることとなる。
また、表示制御部39が、対話制御部32からの応答表
示の出力指示に基づく表示画像を生成する。この生成画
像が表示部40に出力されることとなる。
ス内に格納されている音声波形を用い、対話制御部32
からの応答音声の出力指示に基づく音声を合成する。こ
の合成音声がスピーカ37から出力されることとなる。
また、表示制御部39が、対話制御部32からの応答表
示の出力指示に基づく表示画像を生成する。この生成画
像が表示部40に出力されることとなる。
【0036】音声抽出部34は、マイク35にて取り込
んだ周囲の音声をデジタルデータに変換して音声認識部
31に出力するものである。詳しくは、入力した音声の
特徴量を分析するため、例えば数10ms程度の区間の
フレーム信号を一定間隔で切り出し、その入力信号が、
音声の含まれている音声区間であるのか音声の含まれて
いない雑音区間であるのか判定する。マイク35から入
力される信号は、認識対象の音声だけでなく雑音も混在
したものであるため、音声区間と雑音区間の判定を行な
う。この判定方法としては従来より多くの手法が提案さ
れており、例えば入力信号の短時間パワーを一定時間毎
に抽出していき、所定の閾値以上の短時間パワーが一定
以上継続したか否かによって音声区間であるか雑音区間
であるかを判定する手法がよく採用されている。そし
て、音声区間であると判定された場合には、その入力信
号が音声認識部31に出力されることとなる。
んだ周囲の音声をデジタルデータに変換して音声認識部
31に出力するものである。詳しくは、入力した音声の
特徴量を分析するため、例えば数10ms程度の区間の
フレーム信号を一定間隔で切り出し、その入力信号が、
音声の含まれている音声区間であるのか音声の含まれて
いない雑音区間であるのか判定する。マイク35から入
力される信号は、認識対象の音声だけでなく雑音も混在
したものであるため、音声区間と雑音区間の判定を行な
う。この判定方法としては従来より多くの手法が提案さ
れており、例えば入力信号の短時間パワーを一定時間毎
に抽出していき、所定の閾値以上の短時間パワーが一定
以上継続したか否かによって音声区間であるか雑音区間
であるかを判定する手法がよく採用されている。そし
て、音声区間であると判定された場合には、その入力信
号が音声認識部31に出力されることとなる。
【0037】また、本実施形態においては、利用者がP
TTスイッチ36を押しながらマイク35を介して音声
を入力するという使用方法である。具体的には、制御部
38がPTTスイッチ36が押されたタイミングや戻さ
れたタイミング及び押された状態が継続した時間を監視
しており、PTTスイッチ36が押された場合には音声
抽出部34に対して処理の実行を指示する。一方、PT
Tスイッチ36が押されていない場合にはその処理を実
行させないようにしている。したがって、PTTスイッ
チ36が押されている間にマイク35を介して入力され
た音声データが音声認識部31へ出力されることとな
る。また、制御部38には音声抽出部34での音声区間
であるか雑音区間であるかの判定結果も入力するよう構
成されており、例えば、PTTスイッチ36が押された
のに音声入力がなく、その状態が所定時間継続している
といったことも判断できるようにされている。
TTスイッチ36を押しながらマイク35を介して音声
を入力するという使用方法である。具体的には、制御部
38がPTTスイッチ36が押されたタイミングや戻さ
れたタイミング及び押された状態が継続した時間を監視
しており、PTTスイッチ36が押された場合には音声
抽出部34に対して処理の実行を指示する。一方、PT
Tスイッチ36が押されていない場合にはその処理を実
行させないようにしている。したがって、PTTスイッ
チ36が押されている間にマイク35を介して入力され
た音声データが音声認識部31へ出力されることとな
る。また、制御部38には音声抽出部34での音声区間
であるか雑音区間であるかの判定結果も入力するよう構
成されており、例えば、PTTスイッチ36が押された
のに音声入力がなく、その状態が所定時間継続している
といったことも判断できるようにされている。
【0038】次に、本実施形態1のカーナビゲーション
システム2の動作について説明する。なお、音声認識装
置30に関係する部分が特徴であるので、カーナビゲー
ションシステム2としての一般的な動作を簡単に説明し
た後、音声認識装置30に関係する部分の動作について
詳しく説明することとする。
システム2の動作について説明する。なお、音声認識装
置30に関係する部分が特徴であるので、カーナビゲー
ションシステム2としての一般的な動作を簡単に説明し
た後、音声認識装置30に関係する部分の動作について
詳しく説明することとする。
【0039】カーナビゲーションシステム2の電源オン
後に、表示装置14上に表示されるメニューから、ドラ
イバーがリモコン15a(操作スイッチ群8でも同様に
操作できる。以後の説明においても同じ)により、案内
経路を表示装置14に表示させるために経路情報表示処
理を選択した場合、あるいは、音声認識装置30を介し
て希望するメニューをマイク35を介して音声入力する
ことで、対話制御部32から制御回路10へ、リモコン
15aを介して選択されるのを同様の指示がなされた場
合、次のような処理を実施する。
後に、表示装置14上に表示されるメニューから、ドラ
イバーがリモコン15a(操作スイッチ群8でも同様に
操作できる。以後の説明においても同じ)により、案内
経路を表示装置14に表示させるために経路情報表示処
理を選択した場合、あるいは、音声認識装置30を介し
て希望するメニューをマイク35を介して音声入力する
ことで、対話制御部32から制御回路10へ、リモコン
15aを介して選択されるのを同様の指示がなされた場
合、次のような処理を実施する。
【0040】すなわち、ドライバーが表示装置14上の
地図に基づいて、音声あるいはリモコンなどの操作によ
って目的地を入力すると、GPS受信機22から得られ
る衛星のデータに基づき車両の現在地が求められ、目的
地と現在地との間に、ダイクストラ法によりコスト計算
して、現在地から目的地までの最も短距離の経路を誘導
経路として求める処理が行われる。そして、表示装置1
4上の道路地図に重ねて誘導経路を表示して、ドライバ
ーに適切なルートを案内する。このような誘導経路を求
める計算処理や案内処理は一般的に良く知られた処理で
あるので説明は省略する。
地図に基づいて、音声あるいはリモコンなどの操作によ
って目的地を入力すると、GPS受信機22から得られ
る衛星のデータに基づき車両の現在地が求められ、目的
地と現在地との間に、ダイクストラ法によりコスト計算
して、現在地から目的地までの最も短距離の経路を誘導
経路として求める処理が行われる。そして、表示装置1
4上の道路地図に重ねて誘導経路を表示して、ドライバ
ーに適切なルートを案内する。このような誘導経路を求
める計算処理や案内処理は一般的に良く知られた処理で
あるので説明は省略する。
【0041】次に、音声認識装置30における動作につ
いて、上述の経路案内のための目的地を音声入力する場
合を例にとって説明する。イグニションスイッチ3が操
作されてエンジンONとなると(S100:YES)、
カーナビゲーションシステム2の電源オンとなり、まず
ガイド内容Aの報知を行なう(S110)。ここでは、
対話制御部32が音声合成部33にガイド内容Aを音声
で合成出力するよう指示すると共に、表示制御部39に
ガイド内容Aを画像にて表示出力するよう指示する。こ
の指示にしたがう合成音声がスピーカ37から出力され
ると共に、指示にしたがう画像が表示部40に出力され
る。以下、ガイド内容B以降についても報知形態は同じ
である。そして、このガイド内容Aの具体的内容は「音
声入力が可能です。クリックで説明します。」というも
のである。つまり、音声での入力ができること自体を利
用者に報知し、そのこと自体を知らない場合に対応す
る。そして、さらに説明を求めたい利用者にはクリック
操作をするように促すこととなる。
いて、上述の経路案内のための目的地を音声入力する場
合を例にとって説明する。イグニションスイッチ3が操
作されてエンジンONとなると(S100:YES)、
カーナビゲーションシステム2の電源オンとなり、まず
ガイド内容Aの報知を行なう(S110)。ここでは、
対話制御部32が音声合成部33にガイド内容Aを音声
で合成出力するよう指示すると共に、表示制御部39に
ガイド内容Aを画像にて表示出力するよう指示する。こ
の指示にしたがう合成音声がスピーカ37から出力され
ると共に、指示にしたがう画像が表示部40に出力され
る。以下、ガイド内容B以降についても報知形態は同じ
である。そして、このガイド内容Aの具体的内容は「音
声入力が可能です。クリックで説明します。」というも
のである。つまり、音声での入力ができること自体を利
用者に報知し、そのこと自体を知らない場合に対応す
る。そして、さらに説明を求めたい利用者にはクリック
操作をするように促すこととなる。
【0042】S110にてガイド内容Aを報知した後
は、S120にて、PTTスイッチ36がONされたか
(押下されたか)否かを判断する。この判断は制御部3
8で行われる。そして、ONされた場合には(S12
0:YES)、続くS130でクリック操作がどうかを
判断する。この判断も制御部38にて行われるが、具体
的には、PTTスイッチ36がONされた後の比較的短
い時間(例えば0.5秒以内)にOFFされた場合には
それをクリック操作と見なす。
は、S120にて、PTTスイッチ36がONされたか
(押下されたか)否かを判断する。この判断は制御部3
8で行われる。そして、ONされた場合には(S12
0:YES)、続くS130でクリック操作がどうかを
判断する。この判断も制御部38にて行われるが、具体
的には、PTTスイッチ36がONされた後の比較的短
い時間(例えば0.5秒以内)にOFFされた場合には
それをクリック操作と見なす。
【0043】もしも、クリック操作であると判断した場
合には(S130:YES)、S140へ移行してガイ
ド内容Bを報知する。このガイド内容Bの具体的内容は
「目的地設定、拡大、縮小などが行えます。」というも
のである。つまり、どのような内容の音声入力ができる
のかを利用者に報知するのである。このガイド内容Bを
報知した後はS120へ戻る。
合には(S130:YES)、S140へ移行してガイ
ド内容Bを報知する。このガイド内容Bの具体的内容は
「目的地設定、拡大、縮小などが行えます。」というも
のである。つまり、どのような内容の音声入力ができる
のかを利用者に報知するのである。このガイド内容Bを
報知した後はS120へ戻る。
【0044】一方、クリック操作でないと判断した場合
には(S130:NO)、S150へ移行して音声入力
があるかどうかを判断する。上述したように音声抽出部
34ではマイク35を介して入力された音声データに基
づき音声区間であるか雑音区間であるかを判定してお
り、その判定結果は制御部38へ入力するので、制御部
38はこの判定結果を基に音声入力があるかどうかを判
断する。
には(S130:NO)、S150へ移行して音声入力
があるかどうかを判断する。上述したように音声抽出部
34ではマイク35を介して入力された音声データに基
づき音声区間であるか雑音区間であるかを判定してお
り、その判定結果は制御部38へ入力するので、制御部
38はこの判定結果を基に音声入力があるかどうかを判
断する。
【0045】音声入力がある場合には(S150:YE
S)、図4のS260へ移行するが、このS260以降
の処理は後述する。一方、音声入力がない場合には(S
150:NO)、PTTスイッチ36がOFFされたか
どうかを判断し(S160)、PTTスイッチ36がO
FFされた場合には(S160:YES)、S120へ
戻る。一方、PTTスイッチ36がOFFされない、つ
まりONされた状態のままであれば(S160:N
O)、所定時間Taが経過したかどうかを判断する(S
170)。
S)、図4のS260へ移行するが、このS260以降
の処理は後述する。一方、音声入力がない場合には(S
150:NO)、PTTスイッチ36がOFFされたか
どうかを判断し(S160)、PTTスイッチ36がO
FFされた場合には(S160:YES)、S120へ
戻る。一方、PTTスイッチ36がOFFされない、つ
まりONされた状態のままであれば(S160:N
O)、所定時間Taが経過したかどうかを判断する(S
170)。
【0046】所定時間Taが経過していない場合には
(S170:NO)、S150へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S17
0:YES)、S180へ移行してガイド内容Cを報知
する。このガイド内容Cの具体的内容は「目的地を設定
するときは都道府県名から入力して下さい。」というも
のである。つまり、S170にて肯定判断されたという
ことは、PTTスイッチ36がONされたにもかかわら
ず、所定時間Ta経過するまで音声入力がなかったこと
となるため、目的地を設定したいと思っている利用者に
入力方法を報知するのである。
(S170:NO)、S150へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S17
0:YES)、S180へ移行してガイド内容Cを報知
する。このガイド内容Cの具体的内容は「目的地を設定
するときは都道府県名から入力して下さい。」というも
のである。つまり、S170にて肯定判断されたという
ことは、PTTスイッチ36がONされたにもかかわら
ず、所定時間Ta経過するまで音声入力がなかったこと
となるため、目的地を設定したいと思っている利用者に
入力方法を報知するのである。
【0047】S180にてガイド内容Cを報知した後
は、S190へ移行して音声入力があるかどうかを判断
する。音声入力がある場合には(S150:YES)、
図4のS260へ移行する。このS260以降の処理は
後述する。一方、音声入力がない場合には(S190:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S200)、PTTスイッチ36がOFFされ
た場合には(S200:YES)、図2のS120へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S200:NO)、
所定時間Taが経過したかどうかを判断する(S21
0)。
は、S190へ移行して音声入力があるかどうかを判断
する。音声入力がある場合には(S150:YES)、
図4のS260へ移行する。このS260以降の処理は
後述する。一方、音声入力がない場合には(S190:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S200)、PTTスイッチ36がOFFされ
た場合には(S200:YES)、図2のS120へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S200:NO)、
所定時間Taが経過したかどうかを判断する(S21
0)。
【0048】所定時間Taが経過していない場合には
(S210:NO)、S190へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S21
0:YES)、S220へ移行してガイド内容Dを報知
する。このガイド内容Dの具体的内容は「例えば愛知県
刈谷市昭和町と入力して下さい。」というものである。
つまり、S210にて肯定判断されたということは、P
TTスイッチ36がONされたにもかかわらず、所定時
間Ta経過するまで音声入力がなかったこととなる。そ
れ以前の経過も考え合わせると、ガイド内容Cとして
「目的地を設定するときは都道府県名から入力して下さ
い。」と報知したにもかかわらず、やはり音声入力がさ
れずに所定時間が経過してしまったこととなる。これ
は、入力方法の説明をガイド内容として報知したが、利
用者はまだどのように入力するかを完全には理解でき
ず、入力できないといると推定されるため、さらに具体
的な入力例であるガイド内容Dを報知することで、それ
に倣って希望する目的地を容易に入力できるようにする
ためである。
(S210:NO)、S190へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S21
0:YES)、S220へ移行してガイド内容Dを報知
する。このガイド内容Dの具体的内容は「例えば愛知県
刈谷市昭和町と入力して下さい。」というものである。
つまり、S210にて肯定判断されたということは、P
TTスイッチ36がONされたにもかかわらず、所定時
間Ta経過するまで音声入力がなかったこととなる。そ
れ以前の経過も考え合わせると、ガイド内容Cとして
「目的地を設定するときは都道府県名から入力して下さ
い。」と報知したにもかかわらず、やはり音声入力がさ
れずに所定時間が経過してしまったこととなる。これ
は、入力方法の説明をガイド内容として報知したが、利
用者はまだどのように入力するかを完全には理解でき
ず、入力できないといると推定されるため、さらに具体
的な入力例であるガイド内容Dを報知することで、それ
に倣って希望する目的地を容易に入力できるようにする
ためである。
【0049】S220にてガイド内容Dを報知した後
は、S230へ移行して音声入力があるかどうかを判断
する。音声入力がある場合には(S230:YES)、
図4のS260へ移行する。このS260以降の処理は
後述する。一方、音声入力がない場合には(S230:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S240)、PTTスイッチ36がOFFされ
た場合には(S240:YES)、図2のS120へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S240:NO)、
所定時間Taが経過したかどうかを判断する(S25
0)。
は、S230へ移行して音声入力があるかどうかを判断
する。音声入力がある場合には(S230:YES)、
図4のS260へ移行する。このS260以降の処理は
後述する。一方、音声入力がない場合には(S230:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S240)、PTTスイッチ36がOFFされ
た場合には(S240:YES)、図2のS120へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S240:NO)、
所定時間Taが経過したかどうかを判断する(S25
0)。
【0050】所定時間Taが経過していない場合には
(S250:NO)、S230へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S25
0:YES)、図2のS120へ戻る。これまでの処理
では、音声入力がないまま所定時間Taが経過した場合
には所定のガイド内容を報知するようにしていたが、こ
こではガイド内容は報知せずS120へ戻るようにし
た。これは、入力の具体例まで挙げたガイド内容Dを報
知しても利用者が音声入力しないので、音声入力する意
志自体がないと推定し、この時点で一応ガイドするのを
中止するのである。
(S250:NO)、S230へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S25
0:YES)、図2のS120へ戻る。これまでの処理
では、音声入力がないまま所定時間Taが経過した場合
には所定のガイド内容を報知するようにしていたが、こ
こではガイド内容は報知せずS120へ戻るようにし
た。これは、入力の具体例まで挙げたガイド内容Dを報
知しても利用者が音声入力しないので、音声入力する意
志自体がないと推定し、この時点で一応ガイドするのを
中止するのである。
【0051】続いて、上述したS150,S190,S
230にて肯定判断、すなわち音声入力があった場合に
移行するS260の処理以降について説明する。S26
0では、入力された音声に対する認識処理を行なう。こ
の音声認識処理は音声認識部31にて実行されるのであ
るが、具体的には、取得した音声データに対して、記憶
されている辞書データを用いて照合を行なう。そして、
その照合結果により定まった上位比較対象パターンを認
識結果として対話制御部32に出力することとなる。
230にて肯定判断、すなわち音声入力があった場合に
移行するS260の処理以降について説明する。S26
0では、入力された音声に対する認識処理を行なう。こ
の音声認識処理は音声認識部31にて実行されるのであ
るが、具体的には、取得した音声データに対して、記憶
されている辞書データを用いて照合を行なう。そして、
その照合結果により定まった上位比較対象パターンを認
識結果として対話制御部32に出力することとなる。
【0052】続くS270では、その認識結果をトーク
バック及び表示する。つまり、対話制御部32が音声合
成部33及び表示制御部39を制御し、認識した結果を
音声によりスピーカ37から出力させると共に、表示部
40に認識結果を示す文章を表示させる。
バック及び表示する。つまり、対話制御部32が音声合
成部33及び表示制御部39を制御し、認識した結果を
音声によりスピーカ37から出力させると共に、表示部
40に認識結果を示す文章を表示させる。
【0053】その後、S280にて正しい認識であるか
どうかを判断する。これは、利用者からの指示に応じて
判断することとなるが、例えば正しい認識であればマイ
ク35から「はい」を音声入力し、間違った認識であれ
ば「いいえ」を音声入力するようにしておくことが考え
られる。もちろん、操作スイッチ群8を介してこれらの
指示を入力するようにしてもよい。
どうかを判断する。これは、利用者からの指示に応じて
判断することとなるが、例えば正しい認識であればマイ
ク35から「はい」を音声入力し、間違った認識であれ
ば「いいえ」を音声入力するようにしておくことが考え
られる。もちろん、操作スイッチ群8を介してこれらの
指示を入力するようにしてもよい。
【0054】そして、誤った認識であれば(S280:
NO)図2のS120へ戻るが、正しい認識である場合
には(S280:YES)、S290へ移行して認識結
果を確定する。そして続くS300にて、所定の確定後
処理を実行する。この場合の確定後処理とは、認識結果
としての「経路案内のための目的地」に関するデータ
を、制御回路10(図1参照)へ出力する処理などであ
る。
NO)図2のS120へ戻るが、正しい認識である場合
には(S280:YES)、S290へ移行して認識結
果を確定する。そして続くS300にて、所定の確定後
処理を実行する。この場合の確定後処理とは、認識結果
としての「経路案内のための目的地」に関するデータ
を、制御回路10(図1参照)へ出力する処理などであ
る。
【0055】このような確定後処理(S300)が終了
した後は、S310へ移行して、PTTスイッチ36が
ONされたか(押下されたか)否かを判断する。そし
て、ONされた場合には(S310:YES)、続くS
320でクリック操作がどうかを判断し、クリック操作
であると判断した場合には(S320:YES)、S3
30へ移行してガイド内容Eを報知する。このガイド内
容Eの具体的内容は「ルート探索、拡大、縮小などが行
えます。」というものである。つまり、目的地の設定は
これまでの処理で終了しているので、全体的なナビゲー
ション処理における次の段階の処理であるルート探索が
できることを利用者に報知するのである。このガイド内
容Eを報知した後はS310へ戻る。一方、クリック操
作でないと判断した場合には(S320:NO)、図5
のS340へ移行して、音声入力があるかどうかを判断
する。音声入力がある場合には(S340:YES)、
図6のS410へ移行する。このS410以降の処理は
後述する。一方、音声入力がない場合には(S340:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S350)、PTTスイッチ36がOFFされ
た場合には(S350:YES)、図3のS310へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S350:NO)、
所定時間Taが経過したかどうかを判断する(S36
0)。
した後は、S310へ移行して、PTTスイッチ36が
ONされたか(押下されたか)否かを判断する。そし
て、ONされた場合には(S310:YES)、続くS
320でクリック操作がどうかを判断し、クリック操作
であると判断した場合には(S320:YES)、S3
30へ移行してガイド内容Eを報知する。このガイド内
容Eの具体的内容は「ルート探索、拡大、縮小などが行
えます。」というものである。つまり、目的地の設定は
これまでの処理で終了しているので、全体的なナビゲー
ション処理における次の段階の処理であるルート探索が
できることを利用者に報知するのである。このガイド内
容Eを報知した後はS310へ戻る。一方、クリック操
作でないと判断した場合には(S320:NO)、図5
のS340へ移行して、音声入力があるかどうかを判断
する。音声入力がある場合には(S340:YES)、
図6のS410へ移行する。このS410以降の処理は
後述する。一方、音声入力がない場合には(S340:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S350)、PTTスイッチ36がOFFされ
た場合には(S350:YES)、図3のS310へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S350:NO)、
所定時間Taが経過したかどうかを判断する(S36
0)。
【0056】所定時間Taが経過していない場合には
(S360:NO)、S340へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S35
0:YES)、S360へ移行してガイド内容Fを報知
する。このガイド内容Fの具体的内容は「ルートを探索
したいときはルート探索と入力して下さい。」というも
のである。これは、ルートを探索したいと利用者が思っ
ていてもどのように入力よいかを迷っている状況を想定
し、その場合には「ルート探索」と入力すればよいこと
を報知するのである。
(S360:NO)、S340へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S35
0:YES)、S360へ移行してガイド内容Fを報知
する。このガイド内容Fの具体的内容は「ルートを探索
したいときはルート探索と入力して下さい。」というも
のである。これは、ルートを探索したいと利用者が思っ
ていてもどのように入力よいかを迷っている状況を想定
し、その場合には「ルート探索」と入力すればよいこと
を報知するのである。
【0057】S370にてガイド内容Fを報知した後
は、S380へ移行して音声入力があるかどうかを判断
する。音声入力がある場合には(S380:YES)、
図6のS410へ移行する。このS410以降の処理は
後述する。一方、音声入力がない場合には(S380:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S390)、PTTスイッチ36がOFFされ
た場合には(S390:YES)、図4のS310へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S390:NO)、
所定時間Taが経過したかどうかを判断する(S40
0)。
は、S380へ移行して音声入力があるかどうかを判断
する。音声入力がある場合には(S380:YES)、
図6のS410へ移行する。このS410以降の処理は
後述する。一方、音声入力がない場合には(S380:
NO)、PTTスイッチ36がOFFされたかどうかを
判断し(S390)、PTTスイッチ36がOFFされ
た場合には(S390:YES)、図4のS310へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S390:NO)、
所定時間Taが経過したかどうかを判断する(S40
0)。
【0058】所定時間Taが経過していない場合には
(S400:NO)、S380へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S40
0:YES)、図4のS310へ戻る。この場合には、
「ルートを探索したいときはルート探索と入力して下さ
い。」というガイド内容Fの報知(S370)をしたに
もかかわらず利用者が音声入力しないので、この場合に
はそれ以上のガイドはしないようにしている。
(S400:NO)、S380へ戻って音声入力される
のを待つが、所定時間Taが経過した場合には(S40
0:YES)、図4のS310へ戻る。この場合には、
「ルートを探索したいときはルート探索と入力して下さ
い。」というガイド内容Fの報知(S370)をしたに
もかかわらず利用者が音声入力しないので、この場合に
はそれ以上のガイドはしないようにしている。
【0059】続いて、上述したS340,S380にて
肯定判断、すなわち音声入力があった場合に移行するS
410以降の処理について説明する。S410での音声
認識処理及びS420での認識結果のトークバック・表
示については、上述したS260,S270の処理と同
様である。そして、S430では上述のS280と同様
に正しい認識であるかどうかを判断する。誤った認識で
あれば(S430:NO)図4のS310へ戻るが、正
しい認識である場合には(S430:YES)、S44
0へ移行して認識結果を確定する。そして続くS450
にて、所定の確定後処理を実行する。この場合の確定後
処理とは、認識結果としての「ルート探索をする旨の指
示」に関するデータを、制御回路10(図1参照)へ出
力する処理などである。
肯定判断、すなわち音声入力があった場合に移行するS
410以降の処理について説明する。S410での音声
認識処理及びS420での認識結果のトークバック・表
示については、上述したS260,S270の処理と同
様である。そして、S430では上述のS280と同様
に正しい認識であるかどうかを判断する。誤った認識で
あれば(S430:NO)図4のS310へ戻るが、正
しい認識である場合には(S430:YES)、S44
0へ移行して認識結果を確定する。そして続くS450
にて、所定の確定後処理を実行する。この場合の確定後
処理とは、認識結果としての「ルート探索をする旨の指
示」に関するデータを、制御回路10(図1参照)へ出
力する処理などである。
【0060】このような確定後処理(S450)が終了
した後は、S460へ移行して、PTTスイッチ36が
ONされたか(押下されたか)否かを判断する。そし
て、ONされた場合には(S460:YES)、続くS
470でクリック操作がどうかを判断し、クリック操作
であると判断した場合には(S470:YES)、S4
80へ移行してガイド内容Gを報知する。このガイド内
容Gの具体的内容は「ルート探索の条件の変更などが行
えます。」というものである。つまり、ルート探索をす
る旨の指示は音声入力されたので、もしも利用者が条件
の変更をしたいのであればそれもできる旨を報知するの
である。このガイド内容Gを報知した後はS460へ戻
る。
した後は、S460へ移行して、PTTスイッチ36が
ONされたか(押下されたか)否かを判断する。そし
て、ONされた場合には(S460:YES)、続くS
470でクリック操作がどうかを判断し、クリック操作
であると判断した場合には(S470:YES)、S4
80へ移行してガイド内容Gを報知する。このガイド内
容Gの具体的内容は「ルート探索の条件の変更などが行
えます。」というものである。つまり、ルート探索をす
る旨の指示は音声入力されたので、もしも利用者が条件
の変更をしたいのであればそれもできる旨を報知するの
である。このガイド内容Gを報知した後はS460へ戻
る。
【0061】一方、クリック操作でないと判断した場合
には(S470:NO)、S490へ移行して、音声入
力があるかどうかを判断する。音声入力がある場合には
(S490:YES)、S520へ移行して音声認識処
理を行なう。この音声認識処理は上述したS260やS
410と同様であるのでここでは繰り返さない。また、
それ以降の認識結果のトークバック等についても同様で
ある。
には(S470:NO)、S490へ移行して、音声入
力があるかどうかを判断する。音声入力がある場合には
(S490:YES)、S520へ移行して音声認識処
理を行なう。この音声認識処理は上述したS260やS
410と同様であるのでここでは繰り返さない。また、
それ以降の認識結果のトークバック等についても同様で
ある。
【0062】一方、音声入力がない場合には(S49
0:NO)、PTTスイッチ36がOFFされたかどう
かを判断し(S500)、PTTスイッチ36がOFF
された場合には(S500:YES)、S460へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S500:NO)、
所定時間Taが経過したかどうかを判断する(S51
0)。
0:NO)、PTTスイッチ36がOFFされたかどう
かを判断し(S500)、PTTスイッチ36がOFF
された場合には(S500:YES)、S460へ戻
る。一方、PTTスイッチ36がOFFされない、つま
りONされた状態のままであれば(S500:NO)、
所定時間Taが経過したかどうかを判断する(S51
0)。
【0063】所定時間Taが経過していない場合には
(S510:NO)、S490へ戻って音声入力される
のを待つ。所定時間Taが経過した場合には(S51
0:YES)、ここには示していないが、例えばまた別
のガイド内容を報知したり、あるいは音声入力待ちの状
態となるなどの所定の処理を行なう。
(S510:NO)、S490へ戻って音声入力される
のを待つ。所定時間Taが経過した場合には(S51
0:YES)、ここには示していないが、例えばまた別
のガイド内容を報知したり、あるいは音声入力待ちの状
態となるなどの所定の処理を行なう。
【0064】なお、本実施形態では、対話制御部32及
び制御部38が「ガイド手段」に相当し、図2〜図6で
示す処理中の音声認識に関係しない部分の処理がガイド
手段としての処理に相当する。このような処理を実行す
ることによって、本実施形態の音声認識装置30は、次
のような効果を発揮する。
び制御部38が「ガイド手段」に相当し、図2〜図6で
示す処理中の音声認識に関係しない部分の処理がガイド
手段としての処理に相当する。このような処理を実行す
ることによって、本実施形態の音声認識装置30は、次
のような効果を発揮する。
【0065】(1)まず、エンジンがONされると「音
声入力が可能です。クリックで説明します。」というガ
イド内容Aを報知している。つまり、ナビゲーション装
置に対する指示を音声で入力できること自体を利用者に
報知しているため、そのこと自体を知らない場合に対応
できる。
声入力が可能です。クリックで説明します。」というガ
イド内容Aを報知している。つまり、ナビゲーション装
置に対する指示を音声で入力できること自体を利用者に
報知しているため、そのこと自体を知らない場合に対応
できる。
【0066】(2)そして、積極的に説明を求めたい利
用者にはクリック操作をするように促す報知も行ってい
る。クリック操作をした場合には、例えば「目的地設
定、拡大、縮小などが行えます。」というガイド内容B
や「ルート探索、拡大、縮小などが行えます。」という
ガイド内容Eが報知される。これをで指示すべき内容を
利用者が把握できる。なお、このように積極的に説明を
求めたい利用者に対応するため、例えばクリック操作を
複数種類設定しておき、例えばダブルクリック操作をし
た場合には、さらに詳しい説明をするような構成にする
ことも考えられる。つまり、利用者の理解レベルに応じ
た対応ができる。
用者にはクリック操作をするように促す報知も行ってい
る。クリック操作をした場合には、例えば「目的地設
定、拡大、縮小などが行えます。」というガイド内容B
や「ルート探索、拡大、縮小などが行えます。」という
ガイド内容Eが報知される。これをで指示すべき内容を
利用者が把握できる。なお、このように積極的に説明を
求めたい利用者に対応するため、例えばクリック操作を
複数種類設定しておき、例えばダブルクリック操作をし
た場合には、さらに詳しい説明をするような構成にする
ことも考えられる。つまり、利用者の理解レベルに応じ
た対応ができる。
【0067】(3)また、実際に音声入力による指示を
行おうとする利用者であっても、いざ音声入力をしよう
とすると、どのように入力してよいのかが判らない場合
がある。そのような状況では、PTTスイッチ36が押
下されて音声入力をしようとする利用者の意志は推認で
きるが、実際には何も音声入力されないことがある。し
たがって、そのような場合には、例えば「目的地を設定
するときは都道府県名から入力して下さい。」というガ
イド内容Cや「ルートを探索したいときはルート探索と
入力して下さい。」というガイド内容Fを報知する。こ
れにより、音声入力したいのであるがどのように入力す
ればよいかについての理解が十分でない利用者に対する
ガイドが実現できる。
行おうとする利用者であっても、いざ音声入力をしよう
とすると、どのように入力してよいのかが判らない場合
がある。そのような状況では、PTTスイッチ36が押
下されて音声入力をしようとする利用者の意志は推認で
きるが、実際には何も音声入力されないことがある。し
たがって、そのような場合には、例えば「目的地を設定
するときは都道府県名から入力して下さい。」というガ
イド内容Cや「ルートを探索したいときはルート探索と
入力して下さい。」というガイド内容Fを報知する。こ
れにより、音声入力したいのであるがどのように入力す
ればよいかについての理解が十分でない利用者に対する
ガイドが実現できる。
【0068】(4)さらに、上述の「目的地を設定する
ときは都道府県名から入力して下さい」というガイド内
容Cを報知しても、まだ音声入力ができない状況も考え
られる。したがって、その場合のフォローとして、本実
施形態では「例えば愛知県刈谷市昭和町と入力して下さ
い」というガイド内容Dを報知している。このように具
体的な入力例をガイド内容として報知することによっ
て、利用者は具体的な入力方法が判り、また、具体例ま
で報知してもらえばそれに倣って自分が希望する目的地
を容易に入力することができる。
ときは都道府県名から入力して下さい」というガイド内
容Cを報知しても、まだ音声入力ができない状況も考え
られる。したがって、その場合のフォローとして、本実
施形態では「例えば愛知県刈谷市昭和町と入力して下さ
い」というガイド内容Dを報知している。このように具
体的な入力例をガイド内容として報知することによっ
て、利用者は具体的な入力方法が判り、また、具体例ま
で報知してもらえばそれに倣って自分が希望する目的地
を容易に入力することができる。
【0069】このように、本実施形態の音声認識装置3
0を適用したカーナビゲーションシステム2によれば、
音声認識装置30の利用方法に慣れていない利用者であ
っても容易に利用ができるようになり、より使い勝手の
良いユーザフレンドリ面で優れたものとすることができ
る。
0を適用したカーナビゲーションシステム2によれば、
音声認識装置30の利用方法に慣れていない利用者であ
っても容易に利用ができるようになり、より使い勝手の
良いユーザフレンドリ面で優れたものとすることができ
る。
【0070】以上、本発明はこのような実施例に何等限
定されるものではなく、本発明の主旨を逸脱しない範囲
において種々なる形態で実施し得る。例えば、上記実施
形態では、認識結果の報知やガイド内容の報知を音声と
画像の2種類で行なうようにしたが、利用者に対して報
知が可能であればどのような形態でもよく。かりに1つ
だけ採用するならば、音声による報知を行なうことが好
ましい。これは、カーナビゲーションシステム2という
車載機器として用いていることを考慮したものであり、
音声で出力されればドライバーは視点を表示装置にずら
したりする必要がなく、安全運転のより一層の確保の点
では有利であることなどの理由からである。もちろん上
記実施形態のように、音声及び画像の両方で報知すれ
ば、ドライバーは表示による確認と音声による確認との
両方が可能となる。
定されるものではなく、本発明の主旨を逸脱しない範囲
において種々なる形態で実施し得る。例えば、上記実施
形態では、認識結果の報知やガイド内容の報知を音声と
画像の2種類で行なうようにしたが、利用者に対して報
知が可能であればどのような形態でもよく。かりに1つ
だけ採用するならば、音声による報知を行なうことが好
ましい。これは、カーナビゲーションシステム2という
車載機器として用いていることを考慮したものであり、
音声で出力されればドライバーは視点を表示装置にずら
したりする必要がなく、安全運転のより一層の確保の点
では有利であることなどの理由からである。もちろん上
記実施形態のように、音声及び画像の両方で報知すれ
ば、ドライバーは表示による確認と音声による確認との
両方が可能となる。
【0071】また、音声認識装置の適用先としては、上
述したナビゲーションシステムには限定されない。例え
ば音声認識装置を空調システム用として用いる場合に
は、設定温度の調整、空調モード(冷房・暖房・ドラ
イ)の選択、あるいは風向モードの選択を音声入力によ
って行うようにすることが考えられる。そして、この場
合には、その設定項目(温度・空調モード・風向モード
など)自体をガイド内容として報知したり、あるいは、
「設定温度を25度にする」と言えばよいのか「設定温
度を5度下げる」というように言えばよいのか、などを
さらにガイド内容として報知することが考えられる。空
調モードや風向モードなどについても同様である。
述したナビゲーションシステムには限定されない。例え
ば音声認識装置を空調システム用として用いる場合に
は、設定温度の調整、空調モード(冷房・暖房・ドラ
イ)の選択、あるいは風向モードの選択を音声入力によ
って行うようにすることが考えられる。そして、この場
合には、その設定項目(温度・空調モード・風向モード
など)自体をガイド内容として報知したり、あるいは、
「設定温度を25度にする」と言えばよいのか「設定温
度を5度下げる」というように言えばよいのか、などを
さらにガイド内容として報知することが考えられる。空
調モードや風向モードなどについても同様である。
【0072】さらに、ナビゲーションシステムや空調シ
ステムを車載機器として用いる場合には限定されず、例
えば携帯型ナビゲーション装置や屋内用空調装置などの
ように車載機器以外に用いてもよい。但し、これまで説
明したように車載機器用として用いる場合には利用者が
ドライバーであることが考えられ、その場合には運転自
体が最重要であり、それ以外の車載機器に対する操作に
ついては、なるべく運転に支障がないことが好ましい。
したがって、車載機器としてのカーナビゲーションシス
テム2や空調システムを前提とした音声認識装置30の
場合には、より一層の利点がある。
ステムを車載機器として用いる場合には限定されず、例
えば携帯型ナビゲーション装置や屋内用空調装置などの
ように車載機器以外に用いてもよい。但し、これまで説
明したように車載機器用として用いる場合には利用者が
ドライバーであることが考えられ、その場合には運転自
体が最重要であり、それ以外の車載機器に対する操作に
ついては、なるべく運転に支障がないことが好ましい。
したがって、車載機器としてのカーナビゲーションシス
テム2や空調システムを前提とした音声認識装置30の
場合には、より一層の利点がある。
【0073】もちろん、このような視点で考えるなら
ば、ナビゲーションシステムや空調システム以外の車載
機器に対しても同様に利用することができ、例えばカー
オーディオ機器などは有効である。また、それ以外に
も、いわゆるパワーウインドウの開閉やミラー角度の調
整などを音声によって指示するような構成を考えれば、
そのような制御対象についても同様に適用でき、やはり
有効である。
ば、ナビゲーションシステムや空調システム以外の車載
機器に対しても同様に利用することができ、例えばカー
オーディオ機器などは有効である。また、それ以外に
も、いわゆるパワーウインドウの開閉やミラー角度の調
整などを音声によって指示するような構成を考えれば、
そのような制御対象についても同様に適用でき、やはり
有効である。
【0074】また、車載機器用とした場合にはそれ特有
の利点があることは述べたが、音声認識装置30の適用
先としては、利用者による音声入力指示にしたがって所
定の処理を実行するものであれば同様に考えられる。例
えば、携帯用の情報端末装置、あるいは街頭やパーキン
グエリアなどに設定される情報端末装置などにも同様に
適用できる。
の利点があることは述べたが、音声認識装置30の適用
先としては、利用者による音声入力指示にしたがって所
定の処理を実行するものであれば同様に考えられる。例
えば、携帯用の情報端末装置、あるいは街頭やパーキン
グエリアなどに設定される情報端末装置などにも同様に
適用できる。
【図1】 本発明の実施形態としてのカーナビゲーショ
ンシステムの概略構成を示すブロック図である。
ンシステムの概略構成を示すブロック図である。
【図2】 音声認識装置が実行する処理を示すフローチ
ャートの一部である。
ャートの一部である。
【図3】 音声認識装置が実行する処理を示すフローチ
ャートの一部である。
ャートの一部である。
【図4】 音声認識装置が実行する処理を示すフローチ
ャートの一部である。
ャートの一部である。
【図5】 音声認識装置が実行する処理を示すフローチ
ャートの一部である。
ャートの一部である。
【図6】 音声認識装置が実行する処理を示すフローチ
ャートの一部である。
ャートの一部である。
2…カーナビゲーションシステム 4…位置検出器 6…地図データ入力器 8…操作スイッチ
群 10…制御回路 12…外部メモリ 14…表示装置 15…リモコンセ
ンサ 15a…リモコン 16…地磁気セ
ンサ 18…ジャイロスコープ 20…距離センサ 22…GPS受信機 30…音声認識装
置 31…音声認識部 32…対話制御部 33…音声合成部 34…音声入力部 35…マイク 36…PTTスイ
ッチ 37…スピーカ 38…制御部 39…表示制御部 40…表示部
群 10…制御回路 12…外部メモリ 14…表示装置 15…リモコンセ
ンサ 15a…リモコン 16…地磁気セ
ンサ 18…ジャイロスコープ 20…距離センサ 22…GPS受信機 30…音声認識装
置 31…音声認識部 32…対話制御部 33…音声合成部 34…音声入力部 35…マイク 36…PTTスイ
ッチ 37…スピーカ 38…制御部 39…表示制御部 40…表示部
フロントページの続き (51)Int.Cl.6 識別記号 FI G08G 1/0969 G08G 1/0969 G09B 29/00 G09B 29/00 F 29/10 29/10 A
Claims (7)
- 【請求項1】 音声を入力するための音声入力手段と、 該音声入力手段を用いて認識対象となる音声を入力させ
る期間の開始及び終了を利用者自身が指定するために設
けられた入力期間指定手段と、 該入力期間指定手段によって指定された入力期間内の前
記音声入力手段を介して入力された音声を、予め辞書手
段に記憶されている複数の比較対象パターン候補と比較
して一致度合の高いものを認識結果とする認識手段と、 該認識手段による認識結果を報知する報知手段と、 該報知手段によって認識結果が報知された後に所定の確
定指示がなされた場合には、当該認識結果を確定したも
のとして所定の確定後処理を実行する確定後処理手段
と、 を備える音声認識装置であって、 前記入力期間指定手段によって音声入力期間の開始が指
定された時点から所定時間経過しても前記音声入力手段
を介した音声入力がない場合には、所定のガイド内容を
報知するガイド手段を備えることを特徴とする音声認識
装置。 - 【請求項2】 音声を入力するための音声入力手段と、 該音声入力手段を用いて認識対象となる音声を入力させ
る期間の開始及び終了を利用者自身が指定するために設
けられた入力期間指定手段と、 該入力期間指定手段によって指定された入力期間内の前
記音声入力手段を介して入力された音声を、予め辞書手
段に記憶されている複数の比較対象パターン候補と比較
して一致度合の高いものを認識結果とする認識手段と、 該認識手段による認識結果を報知する報知手段と、 該報知手段によって認識結果が報知された後に所定の確
定指示がなされた場合には、当該認識結果を確定したも
のとして所定の確定後処理を実行する確定後処理手段
と、 を備える音声認識装置であって、 前記入力期間指定手段によって通常の音声入力期間の開
始及び終了の指定ではない所定のガイド要求がされた場
合には、そのガイド要求に応じた所定のガイド内容を報
知するガイド手段を備えることを特徴とする音声認識装
置。 - 【請求項3】 請求項1に記載の音声認識装置におい
て、 前記ガイド手段は、前記入力期間指定手段によって通常
の音声入力期間の開始及び終了の指定ではない所定のガ
イド要求がされた場合には、そのガイド要求に応じた所
定のガイド内容を報知するよう構成されていることを特
徴とする音声認識装置。 - 【請求項4】 請求項1〜3のいずれかに記載の音声認
識装置において、 前記報知手段が前記認識結果を少なくとも音声にて報知
するよう構成されていると共に、前記ガイド手段が前記
所定のガイド内容を少なくとも音声にて報知するよう構
成されていることを特徴とする音声認識装置。 - 【請求項5】 請求項1〜4のいずれかに記載の音声認
識装置において、 前記ガイド手段が報知する前記所定のガイド内容は、本
音声認識装置による音声認識結果が利用されるシステム
での処理に関する内容であることを特徴とする音声認識
装置。 - 【請求項6】 請求項5に記載の音声認識装置におい
て、 前記ガイド手段は、前記所定のガイド内容を報知する時
点での前記システムでの処理実行段階に対応したガイド
内容を報知するよう構成されていることを特徴とする音
声認識装置。 - 【請求項7】 請求項1〜6のいずれかに記載の音声認
識装置と、ナビゲーション装置とを備え、 前記音声認識装置の前記音声入力手段は、少なくとも前
記ナビゲーション装置がナビゲート処理をする上で指定
される必要のある所定のナビゲート処理関連データの指
示を利用者が音声にて入力するために用いられるもので
あり、前記確定後処理手段は、前記認識手段による認識
結果を前記ナビゲーション装置に出力するよう構成され
ていることを特徴とするナビゲーションシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9191186A JPH1138995A (ja) | 1997-07-16 | 1997-07-16 | 音声認識装置及びナビゲーションシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9191186A JPH1138995A (ja) | 1997-07-16 | 1997-07-16 | 音声認識装置及びナビゲーションシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1138995A true JPH1138995A (ja) | 1999-02-12 |
Family
ID=16270339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9191186A Pending JPH1138995A (ja) | 1997-07-16 | 1997-07-16 | 音声認識装置及びナビゲーションシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1138995A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005003747A (ja) * | 2003-06-09 | 2005-01-06 | Cai Media Kyodo Kaihatsu:Kk | 対話型ロボット及び対話システム |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
JP2006317573A (ja) * | 2005-05-11 | 2006-11-24 | Xanavi Informatics Corp | 情報端末 |
WO2007116712A1 (ja) * | 2006-04-07 | 2007-10-18 | Pioneer Corporation | 音声認識装置、音声認識方法、音声認識プログラム、および記録媒体 |
JP2008531359A (ja) * | 2005-02-17 | 2008-08-14 | ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 自動車における機器またはシステムの音声制御方法および装置 |
JP2012230191A (ja) * | 2011-04-25 | 2012-11-22 | Denso Corp | 音声入力装置 |
JP2019101730A (ja) * | 2017-12-01 | 2019-06-24 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
-
1997
- 1997-07-16 JP JP9191186A patent/JPH1138995A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005003747A (ja) * | 2003-06-09 | 2005-01-06 | Cai Media Kyodo Kaihatsu:Kk | 対話型ロボット及び対話システム |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
JP2008531359A (ja) * | 2005-02-17 | 2008-08-14 | ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 自動車における機器またはシステムの音声制御方法および装置 |
JP2006317573A (ja) * | 2005-05-11 | 2006-11-24 | Xanavi Informatics Corp | 情報端末 |
WO2007116712A1 (ja) * | 2006-04-07 | 2007-10-18 | Pioneer Corporation | 音声認識装置、音声認識方法、音声認識プログラム、および記録媒体 |
JP2012230191A (ja) * | 2011-04-25 | 2012-11-22 | Denso Corp | 音声入力装置 |
JP2019101730A (ja) * | 2017-12-01 | 2019-06-24 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004037998A (ja) | 音声制御装置 | |
JP2008058409A (ja) | 音声認識方法及び音声認識装置 | |
JP2009139544A (ja) | 入力装置 | |
JPH09292255A (ja) | ナビゲーション方法及び装置 | |
JPH1138995A (ja) | 音声認識装置及びナビゲーションシステム | |
JP2001216129A (ja) | コマンド入力装置 | |
JP4201411B2 (ja) | 音声認識装置及びナビゲーションシステム | |
JP3580643B2 (ja) | 音声認識方法及び音声認識装置 | |
JP4258890B2 (ja) | 音声認識装置、その装置を用いたナビゲーションシステム | |
JPH11142178A (ja) | ナビゲーション装置 | |
JP4320880B2 (ja) | 音声認識装置及び車載ナビゲーションシステム | |
JP2002287792A (ja) | 音声認識装置 | |
JP3890774B2 (ja) | ナビゲーションシステム | |
JP3505982B2 (ja) | 音声対話装置 | |
JP2007057805A (ja) | 車両用情報処理装置 | |
JP4461419B2 (ja) | ナビゲーション装置 | |
JP4113698B2 (ja) | 入力装置、プログラム | |
JP2947143B2 (ja) | 音声認識装置及びナビゲーション装置 | |
JP3654262B2 (ja) | 音声認識装置及びナビゲーションシステム | |
JP3849283B2 (ja) | 音声認識装置 | |
JPH09114491A (ja) | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 | |
JPH1138994A (ja) | 音声認識装置及びナビゲーションシステム | |
JP2009251470A (ja) | 車載情報システム | |
JP4458071B2 (ja) | 入力装置およびプログラム | |
JP4093394B2 (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060328 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060718 |