JP4682199B2

JP4682199B2 - 音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体

Info

Publication number: JP4682199B2
Application number: JP2007522223A
Authority: JP
Inventors: 健太郎山本
Original assignee: Pioneer Corp
Current assignee: Pioneer Corp
Priority date: 2005-06-21
Filing date: 2006-05-29
Publication date: 2011-05-11
Anticipated expiration: 2026-05-29
Also published as: EP1895508A4; EP1895508A1; EP1895508B1; JPWO2006137245A1; DE602006017368D1; WO2006137245A1

Description

本発明は、発話された音声を認識する音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体に関する。ただし、本発明の利用は、上述した音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体には限られない。

従来、マイクなどを介して入力された人間の音声を認識する音声認識技術が知られている。このような音声認識においては、ユーザによる音声入力を受け取り、あらかじめ設定された待ち受け単語とのマッチング処理により、ユーザによる音声入力に対応する単語候補を決定する。そして、その単語候補中に正解が含まれるか否かを判定する。ここで、待ち受け単語とは、その状況においてユーザが発話するであろうと予測される単語である（たとえば、下記特許文献１参照。）。

特開２００４−４６１０６号公報

しかしながら、上述した従来技術によれば、その状況においてユーザが発話するであろうと予測される単語を全て待ち受け単語としなければならないという問題が一例として挙げられる。音声認識は、入力された音声と待ち受け単語とのマッチング処理によっておこなわれる。このため、音声認識の処理の速度を向上させるには、待ち受け単語の数はなるべく少ないことが好ましい。

また、音声認識は、操作ボタンやキー入力に代わる入力手段として用いられることが多く、待ち受け単語が表示画面上に表示される場合も多い。このような場合、多くの待ち受け単語を表示するために、表示画面上を待ち受け単語の表示によって占有されてしまったり、表示画面上の文字が細かく見づらくなってしまうという問題が一例として挙げられる。

上述した課題を解決し、目的を達成するため、請求項１の発明にかかる音声認識装置は、音声が入力される音声入力手段と、あらかじめ設定された複数の待ち受け語を表示する表示手段と、前記表示手段によって表示された複数の前記待ち受け語のうちいずれかを選択するための操作入力手段と、前記音声入力手段に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力手段によってそれぞれの前記待ち受け語が選択された回数とを計数する計数手段と、前記計数手段によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出手段と、前記抽出手段によって抽出された前記優先表示語を前記表示手段に優先的に表示する表示制御手段と、前記優先表示語以外の前記待ち受け語を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、を備えることを特徴とする。

また、請求項５の発明にかかる情報処理装置は、音声が入力される音声入力手段と、装置が有する複数の機能のうちいずれか一つを実行するための複数の操作入力手段と、前記音声入力手段に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力手段によってそれぞれの前記機能が実行された回数とを計数する計数手段と、前記計数手段によって計数された前記回数に基づいて、複数の前記操作入力手段のうち操作者に近い位置に割り振る優先割振機能を決定する決定手段と、前記決定手段によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、を備えることを特徴とする。

また、請求項６の発明にかかる音声認識方法は、音声が入力される音声入力工程と、あらかじめ設定された複数の待ち受け語を表示する表示工程と、前記表示工程によって表示された複数の前記待ち受け語のうちいずれかを選択する操作入力工程と、前記音声入力工程に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力工程によってそれぞれの前記待ち受け語が選択された回数とを計数する計数工程と、前記計数工程によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出工程と、前記抽出工程によって抽出された前記優先表示語を前記表示工程に優先的に表示する表示制御工程と、前記優先表示語以外の前記待ち受け語を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、を含むことを特徴とする。

また、請求項７の発明にかかる音声認識方法は、音声が入力される音声入力工程と、複数の機能のうちいずれか一つを実行させる操作入力工程と、前記音声入力工程に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力工程によってそれぞれの前記機能が実行された回数とを計数する計数工程と、前記計数工程によって計数された前記回数に基づいて、複数の前記操作入力工程のうち操作者に近い位置に割り振る優先割振機能を決定する決定工程と、前記決定工程によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、を含むことを特徴とする。

また、請求項８の発明にかかる音声認識プログラムは、請求項６または７に記載の音声認識方法をコンピュータに実行させることを特徴とする。

また、請求項９の発明にかかる記録媒体は、請求項８に記載の音声認識プログラムを記録したコンピュータに読み取り可能なことを特徴とする。

図１は、実施の形態にかかる音声認識装置の機能的構成を示すブロック図である。図２は、音声認識装置による音声認識処理の手順を示すフローチャートである。図３は、実施例１にかかるナビゲーション装置のハードウェア構成を示すブロック図である。図４は、ナビゲーション装置によるユーザ設定操作の受付手順を示すフローチャートである。図５は、目的地点設定画面の一例を示す図である。図６は、目的地点候補の選択回数の一例を示す図表である。図７は、図６に示した目的地点候補を選択回数が多い順に並べ替えた図表である。図８は、音声認識用辞書に登録された語句を示す図表である。図９は、レコメンド地点を考慮した目的地点設定画面の一例を示す図である。図１０は、ユーザによる目的地点設定操作を模式的に示した図である。図１１は、ナビゲーション装置によるユーザ設定操作の処理手順を示すフローチャートである。図１２は、目的地点候補の選択回数の一例を示す図表である。図１３は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。図１４は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。図１５は、実施例２にかかるナビゲーション装置の外観を示す図である。図１６は、ファンクションキーの機能表示例を示す図である。図１７は、ファンクションキーの機能表示例を示す図である。図１８は、各機能の使用頻度とその割合の一例を示す図表である。図１９は、各機能の使用割合を考慮したファンクションキーへの機能割当を示す図である。図２０は、ファンクションキーに割当られた機能の実行のための音声認識用辞書に登録された語句を示す図表である。

符号の説明

１００音声認識装置
１０１音声入力部
１０２表示部
１０３操作入力部
１０４計数部
１０５抽出部
１０６表示制御部
１０７音声認識部

以下に添付図面を参照して、この発明にかかる音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体の好適な実施の形態を詳細に説明する。

（実施の形態）
図１は、実施の形態にかかる音声認識装置の機能的構成を示すブロック図である。図１において、実施の形態にかかる音声認識装置１００は、音声入力部１０１、表示部１０２、操作入力部１０３、計数部１０４、抽出部１０５、表示制御部１０６、音声認識部１０７によって構成される。

音声入力部１０１は、音声が入力される。音声の入力は、たとえば、ユーザが所定の語句を発話することによっておこなう。表示部１０２は、あらかじめ設定された複数の待ち受け語を表示する。あらかじめ設定された複数の待ち受け語とは、後述する音声認識部１０７によって音声認識可能な語句であり、たとえば、地名や装置に対する操作指示語などである。

操作入力部１０３は、表示部１０２によって表示された複数の待ち受け語のうちいずれかを選択するために設けられる。操作入力部１０３は、たとえば、タッチパネルや操作ボタンによって実現される。操作入力部１０３がタッチパネルである場合は、表示部１０２と操作入力部１０３とは一体とすることができる。

計数部１０４は、音声入力部１０１に入力された音声にそれぞれの待ち受け語が含まれた回数と、操作入力部１０３によってそれぞれの待ち受け語が選択された回数とを計数する。また、計数部１０４は、待ち受け語が属するジャンルごとに回数を計数することとしてもよい。待ち受け語が属するジャンルとは、たとえば、待ち受け語の種類（地名、操作指示語など）や、施設の属性（飲食店、プレイランドなど）である。

抽出部１０５は、計数部１０４によって計数された回数に基づいて、複数の待ち受け語のうち優先的に表示する優先表示語を抽出する。抽出部１０５は、たとえば、計数部１０４によって計数された回数が多い待ち受け語を優先表示語として抽出する。なお、特定の待ち受け語を抽出するではなく、計数部１０４によって計数された回数に基づいて、待ち受け語それぞれに対して優先度をランキングすることとしてもよい。また、計数部１０４がジャンルごとに回数を計数している場合、抽出部１０５は、計数部１０４によって計測された回数が多いジャンルに属する待ち受け語を優先表示語として抽出する。

表示制御部１０６は、抽出部１０５によって抽出された優先表示語を表示部１０２に優先的に表示する。優先的に表示するとは、たとえば、優先表示語を回数が多い順に画面の上部から表示する、あるいは、スクロール操作なしで視認できる場所に配置するなどである。

音声認識部１０７は、優先表示語以外の待ち受け語を優先して、音声入力部１０１に入力された音声を音声認識する。優先表示語以外の待ち受け語を優先して、とは、たとえば、入力された音声とのマッチング処理を、優先表示語より先にそれ以外の待ち受け語に対しておこなうことである。なお、優先表示語以外の待ち受け語が多数ある場合には、さらにそれらの中で優先順位を決めることとしてもよい。

図２は、音声認識装置による音声認識処理の手順を示すフローチャートである。音声認識装置１００は、まず、計数部１０４によって、音声入力部１０１において音声入力された、あるいは操作入力部１０３において操作入力された、待ち受け語の入力回数を計数する（ステップＳ２０１）。つぎに、抽出部１０５によって、複数の待ち受け語のうち優先的に表示する優先表示語を抽出する（ステップＳ２０２）。表示制御部１０６は、表示部１０２に抽出部１０５によって抽出された優先表示語を優先的に表示する（ステップＳ２０３）。

そして、音声入力があるまで待機し（ステップＳ２０４：Ｎｏのループ）、音声入力があった場合は（ステップＳ２０４：Ｙｅｓ）、入力された音声に対して、優先表示語以外の待ち受け語を優先して音声認識をおこない（ステップＳ２０５）、本フローチャートによる処理を終了する。

以上説明したように、実施の形態にかかる音声認識装置１００によれば、優先して音声認識する待ち受け語を絞ることによって、音声認識処理の処理効率を向上させることができる。また、待ち受け語の入力回数によって、優先して表示する待ち受け語を抽出し、簡潔な画面表示をおこなうことができる。さらに、画面表示の優先度が高くない待ち受け語に関しては、優先的に音声認識をおこない、これらの待ち受け語を選択する際の操作の煩雑さを回避することができる。

（ナビゲーション装置３００のハードウェア構成）
図３は、実施例１にかかるナビゲーション装置のハードウェア構成を示すブロック図である。実施例１では、実施の形態にかかる音声認識装置１００を、ナビゲーション装置３００の入力手段として用いる場合について説明する。図３において、ナビゲーション装置３００は、車両に搭載されており、ナビゲーション制御部３０１と、ユーザ操作部３０２と、表示部３０３と、位置取得部３０４と、記録媒体３０５と、記録媒体デコード部３０６と、音声出力部３０７と、通信部３０８と、経路探索部３０９と、経路誘導部３１０と、案内音生成部３１１と、音声認識部３１２と、によって構成される。

ナビゲーション制御部３０１は、ナビゲーション装置３００全体を制御する。ナビゲーション制御部３０１は、たとえば所定の演算処理を実行するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）や、各種制御プログラムを格納するＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、および、ＣＰＵのワークエリアとして機能するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などによって構成されるマイクロコンピュータなどによって実現することができる。

また、ナビゲーション制御部３０１は、経路誘導に際し、経路探索部３０９、経路誘導部３１０、案内音生成部３１１との間で経路誘導に関する情報の入出力をおこない、その結果得られる情報を表示部３０３および音声出力部３０７へ出力する。

ユーザ操作部３０２は、文字、数値、各種指示など、ユーザによって入力操作された情報をナビゲーション制御部３０１に対して出力する。ユーザ操作部３０２の構成としては、後述する表示部３０３と一体として構成されるタッチパネル、物理的な押下／非押下を検出する押ボタンスイッチ、キーボード、ジョイスティックなど公知の各種形態を採用することが可能である。

また、ユーザ操作部３０２は、外部からの音声を入力するマイク３０２ａを備える。マイク３０２ａから入力された音声は、後述する音声認識部３１２によって音声認識される。これにより、ユーザは音声によって入力操作をおこなうことができる。

ユーザ操作部３０２は、ナビゲーション装置３００に対して一体に設けられていてもよいし、リモコンのようにナビゲーション装置３００から分離して操作可能な形態であってもよい。ユーザ操作部３０２は、上述した各種形態のうちいずれか単一の形態で構成されていてもよいし、複数の形態で構成されていてもよい。ユーザは、ユーザ操作部３０２の形態に応じて、適宜入力操作をおこなうことによって情報を入力する。ユーザ操作部３０２の操作によって入力される情報としては、たとえば、探索する経路の目的地点または出発地点が挙げられる。

目的地点または出発地点の入力は、それぞれの地点の緯度・経度や住所を入力する他、目的地点または出発地点となる施設の電話番号やジャンル、キーワードなどを指定することによって、該当する施設が探索され、その位置を特定することができる。より詳細には、これらの情報は、後述する記録媒体３０５に記録された地図情報に含まれる背景種別データに基づいて、地図上の一点として特定される。また、後述する表示部３０３に地図情報を表示させ、表示された地図上の一点を指定するようにしてもよい。

表示部３０３は、たとえば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、ＴＦＴ液晶ディスプレイ、有機ＥＬディスプレイ、プラズマディスプレイなどを含む。表示部３０３は、具体的には、たとえば、映像Ｉ／Ｆや映像Ｉ／Ｆに接続された映像表示用のディスプレイ装置によって構成することができる。映像Ｉ／Ｆは、具体的には、たとえば、ディスプレイ装置全体の制御をおこなうグラフィックコントローラと、即時表示可能な画像情報を一時的に記憶するＶＲＡＭ（ＶｉｄｅｏＲＡＭ）などのバッファメモリと、グラフィックコントローラから出力される画像情報に基づいて、ディスプレイ装置を表示制御する制御ＩＣなどによって構成される。表示部３０３には、アイコン、カーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種情報が表示される。また、表示部３０３には、後述する記録媒体３０５に記憶された地図情報や経路誘導に関する情報が表示される。

位置取得部３０４は、ＧＰＳレシーバおよび各種センサから構成され、装置本体の現在位置（車両の現在位置）の情報を取得する。また、位置取得部３０４は、ＧＰＳレシーバが受信するＧＰＳ情報を受信できない領域など、所定の領域に入った際には、その領域内に設けられた通信機から送信されるＧＰＳ代替情報を受信して、車両の現在位置を検出する。

ＧＰＳレシーバは、ＧＰＳ衛星から送信されるＧＰＳ情報を受信し、ＧＰＳ衛星との幾何学的位置を求める。なお、ＧＰＳとは、ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍの略称であり、４つ以上の衛星からの電波を受信することによって地上での位置を正確に求めるシステムである。ＧＰＳレシーバは、ＧＰＳ衛星からの電波を受信するためのアンテナ、受信した電波を復調するチューナーおよび復調した情報に基づいて現在位置を算出する演算回路などによって構成される。

各種センサは、車速センサや角速度センサ、走行距離センサ、傾斜センサなど自車に搭載された各種センサであり、これらのセンサから出力される情報から、自車の走行軌跡を求める。このように、ＧＰＳレシーバによって外部から得られた情報と合わせて、自車に搭載された各種センサの出力する情報を用いることによって、より高い精度で自車位置の認識をおこなうことができる。

車速センサは、ナビゲーション装置３００を搭載する車両のトランスミッションの出力側シャフトから検出する。角速度センサは、自車の回転時の角速度を検出し、角速度情報と相対方位情報とを出力する。走行距離センサは、車輪の回転に伴って出力される所定周期のパルス信号のパルス数をカウントすることによって車輪１回転当たりのパルス数を算出し、その１回転当たりのパルス数に基づく走行距離情報を出力する。傾斜センサは、路面の傾斜角度を検出する。

記録媒体３０５は、各種制御プログラムや各種情報をコンピュータに読み取り可能な状態で記録する。記録媒体３０５は、記録媒体デコード部３０６による情報の書き込みを受け付けるとともに、書き込まれた情報を不揮発に記録する。記録媒体３０５は、たとえば、ＨＤ（ＨａｒｄＤｉｓｋ）によって実現することができる。記録媒体３０５は、ＨＤに限るものではなく、ＨＤに代えて、あるいは、ＨＤに加えて、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）やＣＤ（ＣｏｍｐａｃｔＤｉｓｋ）など、記録媒体デコード部３０６に対して着脱可能であり可搬性を有するメディアを記録媒体３０５として用いてもよい。記録媒体３０５は、ＤＶＤおよびＣＤに限るものではなく、ＣＤ−ＲＯＭ（ＣＤ−Ｒ，ＣＤ−ＲＷ）、ＭＯ（Ｍａｇｎｅｔｏ−Ｏｐｔｉｃａｌｄｉｓｋ）、メモリカードなどの記録媒体デコード部３０６に対して着脱可能であり可搬性を有するメディアを利用することもできる。

記録媒体３０５に記憶された地図情報は、建物、河川、地表面などの地物（フィーチャ）を表す背景データと、道路の形状を表す道路形状データとを有しており、表示部３０３の表示画面において２次元または３次元に描画される。ナビゲーション装置３００が経路誘導中の場合は、記録媒体３０５に記録された地図情報と位置取得部３０４によって取得された自車位置とが重ねて表示されることとなる。

なお、本実施例では地図情報を記録媒体３０５に記録するようにしたが、これに限るものではない。地図情報は、ナビゲーション装置３００のハードウェアと一体に設けられているものに限って記録されているものではなく、ナビゲーション装置３００外部に設けられていてもよい。その場合、ナビゲーション装置３００は、たとえば、通信部３０８を通じて、ネットワークを介して地図情報を取得する。取得された地図情報はＲＡＭなどに記憶される。

記録媒体デコード部３０６は、記録媒体３０５に対する情報の読み取り／書き込みの制御をおこなう。たとえば、記録媒体としてＨＤを用いた場合には、記録媒体デコード部３０６は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）となる。同様に、記録媒体としてＤＶＤあるいはＣＤ（ＣＤ−Ｒ，ＣＤ−ＲＷを含む）を用いた場合には、記録媒体デコード部３０６は、ＤＶＤドライブあるいはＣＤドライブとなる。書き込み可能かつ着脱可能な記録媒体３０５として、ＣＤ−ＲＯＭ（ＣＤ−Ｒ，ＣＤ−ＲＷ）、ＭＯ、メモリカードなどを利用する場合には、各種記録媒体への情報の書き込みおよび各種記録媒体に記憶された情報の読み出しが可能な専用のドライブ装置を、記録媒体デコード部３０６として適宜用いる。

音声出力部３０７は、接続されたスピーカ（図示なし）への出力を制御することによって、案内音を再生する。スピーカは、１つであってもよいし、複数であってもよい。具体的には、音声出力部３０７は、音声出力用のスピーカに接続される音声Ｉ／Ｆによって実現することができる。より具体的には、音声Ｉ／Ｆは、たとえば、音声デジタル情報のＤ／Ａ変換をおこなうＤ／Ａコンバータと、Ｄ／Ａコンバータから出力される音声アナログ信号を増幅する増幅器と、音声アナログ情報のＡ／Ｄ変換をおこなうＡ／Ｄコンバータと、から構成することができる。

通信部３０８は、渋滞や交通規制などの道路交通情報を、定期的あるいは不定期に取得する。また、通信部３０８は、ネットワークと接続され、サーバなどネットワークに接続された他の機器と情報の送受信をおこなう。

通信部３０８による道路交通情報の受信は、ＶＩＣＳ（ＶｅｈｉｃｌｅＩｎｆｏｒｍａｔｉｏｎａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎＳｙｓｔｅｍ）センターから道路交通情報が配信されたタイミングで行ってもよいし、ＶＩＣＳセンターに対し定期的に道路交通情報を要求することで行ってもよい。また、サーバに集約された全国のＶＩＣＳ情報から、所望の地域の道路交通情報をネットワークを介して取得するようにしてもよい。通信部３０８は、たとえば、ＦＭチューナー、ＶＩＣＳ／ビーコンレシーバ、無線通信機器、およびその他の通信機器によって実現することが可能である。

経路探索部３０９は、記録媒体３０５に記憶されている地図情報や、通信部３０８を介して取得するＶＩＣＳ情報などを利用して、出発地点から目的地点までの最適な経路を探索する。ここで、最適な経路とは、ユーザが指定した条件に最も合致する経路である。一般に、出発地点から目的地点までの経路は無数存在する。このため、経路探索にあたって考慮される事項を設定し、条件に合致する経路を探索するようにしている。

経路誘導部３１０は、経路探索部３０９によって探索された誘導経路情報、位置取得部３０４によって取得された自車位置情報、記録媒体３０５から記録媒体デコード部３０６を経由して得られた地図情報に基づいて、リアルタイムな経路誘導情報の生成をおこなう。このとき生成される経路誘導情報は、通信部３０８によって受信した渋滞情報を考慮したものであってもよい。経路誘導部３１０で生成された経路誘導情報は、ナビゲーション制御部３０１を介して表示部３０３へ出力される。

案内音生成部３１１は、パターンに対応したトーンと音声の情報を生成する。すなわち、経路誘導部３１０で生成された経路誘導情報に基づいて、案内ポイントに対応した仮想音源の設定と音声ガイダンス情報の生成をおこない、ナビゲーション制御部３０１を介して音声出力部３０７へ出力する。

音声認識部３１２は、マイク３０２ａを介して入力された音声を音声認識する。音声認識部３１２によって音声が認識されると、ナビゲーション制御部３０１は認識された言葉に対応した処理をおこなう。たとえば、目的地点の設定画面において発話がおこなわれ、音声認識によって地名が認識されると、ナビゲーション制御部３０１は、認識された地名を目的地点として設定する。ユーザは、表示部３０３に表示された地図から目的地点を指定する代わりに、目的地点名を発話することによって、目的地点を設定することができる。このように、音声認識部３１２による音声認識によって、ユーザ操作部３０２によっておこなう操作に代えることができる。

ここで、音声認識の手法は様々なものが知られているが、一般には、入力された音声を特定するために、あらかじめ認識対象となる音声の周波数分布を分析することで、たとえば、スペクトルや基本周波数の時系列情報などを入力音声の特徴量として抽出し、そのパターンを各単語に対応させて格納する音声認識用辞書を備えている。

認識されるべき音声が入力されると、入力された音声の周波数スペクトルを解析し、あらかじめ用意されている音素モデルとの比較・照合によって音素を特定する。そして、特定された音素モデルと、音声認識用辞書に格納された各単語のパターンをパターンマッチングにより比較照合し、各単語に対する類似度を算出する。つぎに算出された類似度が最も高い単語（パターンが最も近い単語）を、入力された音声であると認識し、その単語を出力するようにしている。つまり、入力された単語の周波数分布のパターンがどの単語パターンに最も類似しているかを調べることによって、入力音声を判定する。

音声認識部３１２は、マッチング処理の処理時間との関係から、音声認識処理において一時にマッチング処理をおこなう単語数を限定している。上述のように、音声認識部３１２は、入力された音声の周波数パターンと音声認識用辞書に格納された全ての各単語のパターンを比較照合した上で、各単語に対する類似度を算出する。このため、音声認識用辞書に登録されている単語数が少ないほど、処理時間を短縮することができる。ただし、登録された単語が発話された単語と一致しなければ、誤認識やエラー（該当単語なし）が多発し、返って使い勝手が悪くなってしまう。

そこで、音声認識部３１２は、単語ごとに音声認識における優先順位（以下、音声認識優先順位という）を設定し、音声認識優先順位に基づいて複数の辞書に単語を割り振る。音声認識処理をおこなう際は、音声認識優先順位が高い単語が割り振られた辞書からマッチング処理をおこなう。これにより、音声認識の精度を維持しつつ音声認識処理の効率化を図ることができる。

ここで、単語に設定する音声認識優先順位を決定する要素は、様々なものが考えられるが、本実施例では、音声認識またはユーザ操作部３０２を介した操作によって選択された回数に基づいて、その単語の音声認識優先順位を設定する。一般に、ユーザの使用頻度の高いメニューは上位に表示するなどがおこなわれている。このようにユーザが頻繁に選択する単語は、表示部３０３に優先的に表示して、ユーザ操作部３０２（タッチパネルなど）による操作をおこない易くする。一方で、選択頻度が少ない単語は、表示部３０３への表示優先度は低くする。その代わりに、音声認識優先度を高く設定し、優先的に音声認識をおこなえるようにする。

このように優先順位を決定するのは、頻繁に選択する単語はタッチパネルなどによってすぐに選択できる方が操作が容易であり、敢えて音声認識を使うメリットは小さい。このため、頻繁に選択する単語は、表示優先度は高くする一方で、音声認識優先度は低く設定する。逆に、選択頻度が少ない単語は、どのようなジャンルにカテゴライズされているか判断しづらい場合が多く、設定画面の表示から探すことが困難である。このような単語は、音声認識によって選択した方が操作を容易にすることができる。このため、選択頻度が少ない単語は、表示優先度を低くする一方で、音声認識優先度を高く設定する。このような設定をおこなうことによって、音声認識部３１２は音声認識の処理速度の向上を図っている。

以上のようなハードウェア構成によってナビゲーション装置３００は構成されている。なお、実施の形態にかかる音声認識装置１００の機能的構成である音声入力部１０１はマイク３０２ａが、表示部１０２は表示部３０３が、操作入力部１０３はユーザ操作部３０２が、計数部１０４、抽出部１０５、表示制御部１０６は、ナビゲーション制御部３０１が、音声認識部１０７は音声認識部３１２が、それぞれその機能を実現する。

（ユーザ設定操作の受付手順）
図４は、ナビゲーション装置によるユーザ設定操作の受付手順を示すフローチャートである。前述のように、ナビゲーション装置３００に対する設定操作は、音声認識部３１２によっておこなう音声認識およびユーザ操作部３０２を介した操作によっておこなうことができる。ナビゲーション装置３００に対する設定操作は様々なものがあるが、ここでは目的地点の設定をおこなう場合を例として説明する。

まず、ナビゲーション制御部３０１は、目的地点候補ごとの選択回数をカウントしている（ステップＳ４０１）。ここで、目的地点は、あらかじめ登録された属性の施設を目的地点候補とし、これらの目的地点候補を選択することによって設定するものとする。あらかじめ登録された属性の施設とは、たとえば、ラーメン屋やファミリーレストランなどの飲食店や、スーパーマーケット、書店などの小売店などである。これらの目的地点候補の選択は、タッチパネル上に表示された施設名ボタンを押下したり、ユーザの発話を音声認識することによっておこなう。また、たとえば、地図上に示された施設を選択したり、前回の目的地点を読み出すなどしてもよい。

ナビゲーション制御部３０１は、目的地点設定画面の表示指示を待って（ステップＳ４０２：Ｎｏのループ）、目的地点設定画面の表示指示があった場合は（ステップＳ４０２：Ｙｅｓ）、レコメンド地点を抽出する（ステップＳ４０３）。目的地点設定画面の表示指示は、経路探索時など目的地点を設定する際におこなわれる。また、レコメンド地点とは、ステップＳ４０１においてカウントしている選択回数が上位の目的地点候補（より詳細には選択回数が上位の目的地点候補を示す語句）である。音声認識部３１２は、目的地点候補を選択回数によって順位付けして、選択回数が上位の単語を抽出する。レコメンド地点を上位何位までを抽出するかは後述する音声認識用辞書の容量に依存する。

つぎに、音声認識部３１２は、ステップＳ４０３で抽出されたレコメンド地点を第２の音声認識用辞書（以下、「第２辞書」という）に、その他の目的地点候補（より詳細には、その他の目的地点候補を示す語句）を第１の音声認識用辞書（以下、「第１辞書」という）に登録する（ステップＳ４０４）。ここで、第１辞書は、音声認識優先度が高い語句を登録する音声認識用辞書である。また、第２辞書は、音声認識優先度が低い語句を登録する辞書である。音声認識処理においては、まず、第１辞書に登録された語句とのマッチング処理がおこなわれ、該当する語句がなかった場合は、第２辞書に登録された語句とのマッチング処理がおこなわれる。

なお、ここでは音声認識用辞書を２つにしたが、選択回数に応じて、さらに多くの音声認識用辞書に単語を割り振ることとしてもよい。特に、割り振るべき単語が大量にある場合は、多くの音声認識用辞書に割り振ることによって、１つの音声認識用辞書に登録される単語数を少なくすることができる。

続いて、ナビゲーション制御部３０１は、レコメンド地点を初期選択メニューに設定し（ステップＳ４０５）、目的地点設定画面を表示する（ステップＳ４０６）。初期選択メニューとは、目的地点設定画面において、目的地点候補として最初に表示される項目である。目的地点候補は数多く存在し、一度に画面表示しようとすると画面表示が煩雑となる。このため、目的地点として選択される回数が多いレコメンド地点を初期選択メニューに置く。たとえば、スクロールバーなどを用いて全ての目的地点候補を表示する場合は、スクロールしなくても表示される位置にレコメンド情報を表示する。これにより、画面が煩雑になることを回避しつつ、ユーザに簡易な操作で目的地点の設定をおこなわせることができる。

そして、ナビゲーション制御部３０１は、ユーザ操作部３０２を介した操作入力または音声入力待ちに移行し（ステップＳ４０７）、本フローチャートによる処理を終了する。以上のような処理によって、ナビゲーション装置３００はユーザからの設定操作を受け付ける。

図５は、目的地点設定画面の一例を示す図である。表示部３０３には、複数の目的地点候補表示５２１〜５２６が表示され、所望の目的を選択できるようになっている。表示部３０３はタッチパネルとなっており、表示された目的地点候補の名称を指で触れると、その目的地点候補が目的地点に設定できるようになっている。なお、目的地点の設定は、ユーザの発話を音声認識することによっても可能である。図示の例では、目的地点候補表示５２１は「公園」を、目的地点候補表示５２２は「書店」を、目的地点候補表示５２３は「スーパーマーケット」を、目的地点候補表示５２４は「ファミリーレストラン」を、目的地点候補表示５２５は「遊園地」を、目的地点候補表示５２６は「ラーメン屋」を、それぞれ示している。これらの項目は、当初、たとえば５０音順に配置されている。

太線で示した表示領域５０１は、目的地点設定画面が表示部３０３上に表示される当初から表示される領域である。一方、点線で示した表示領域５１１は、スクロールボタン５２０を押下するなどによって画面スクロールをおこなうことによって表示部３０３に表示される領域である。一般に、目的地点候補は相当数存在するため、このようなスクロール表示や階層表示を用いて画面表示が煩雑になるのを防いでいる。なお、以下では説明の便宜上、上記に示した６つの地点（目的地点候補表示５２１〜５２６に示された地点）を目的地点候補とする。

図６は、目的地点候補の選択回数の一例を示す図表である。図６の図表において、目的地点候補表示６０１には、目的地点候補が５０音順に示されている。また、選択回数表示６０２には、それぞれの目的地点が選択された回数が示されている。前述のように、ナビゲーション制御部３０１は、目的地点候補ごとの選択回数をカウントしている（図４のステップＳ４０１参照）。

図示の例では、「公園」は１２回、「書店」は５回、「スーパーマーケット」は３４回、「ファミリーレストラン」は４３回、「遊園地」は３回、「ラーメン屋」は６５回、それぞれ選択されている。この選択回数は、その選択がおこなわれた方法が、ユーザ操作部３０２を介した操作入力であるか、音声認識による選択であるかを問わずカウントしている。

図７は、図６に示した目的地点候補を選択回数が多い順に並べ替えた図表である。図６では５０音順に配置されていた目的地点候補表示６０１は、選択回数が多い順に、「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」、「公園」、「書店」、「遊園地」の順に並べ替えられている。このうち、選択回数が上位の目的地点が、レコメンド地点として抽出される（図４のステップＳ４０３参照）。ここでは、選択回数が上位３位の地点をレコメンド地点として抽出するものとする。すなわち、「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」を抽出する。そして、レコメンド地点として抽出された目的地点候補を第２辞書に、その他の目的地点候補を第１辞書に登録する（図４のステップＳ４０４参照）。

図８は、音声認識用辞書に登録された語句を示す図表である。音声認識用辞書８０１には、第１辞書８０２および第２辞書８０３がある。第１辞書８０２には音声認識優先度が高い語句が登録され、第２辞書８０３には音声認識優先度が低い語句が登録される。図示の例では、第２辞書８０３には、レコメンド地点として抽出された「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」が登録されている。一方、第１辞書８０２には、レコメンド地点以外の目的地点候補である「公園」、「書店」、「遊園地」が登録されている。

図９は、レコメンド地点を考慮した目的地点設定画面の一例を示す図である。太線で示した表示領域９０１は、目的地点設定画面が表示部３０３上に表示される当初から表示される領域である。一方、点線で示した表示領域９１１は、スクロールボタン９２０を押下するなどによって画面スクロールをおこなうことによって表示部３０３に表示される領域である。

図示のように、当初から表示される表示領域９０１には、レコメンド情報である「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」を示す目的地点候補表示９２１〜９２３が表示される。一方で、スクロールボタン９２０を押下しなければ表示されない表示領域９１１には、その他の目的地点候補である「公園」、「書店」、「遊園地」を示す目的地点候補表示９２４〜９２６が表示される。

表示部３０３はタッチパネルとなっており、表示された目的地点候補の名称を指で触れると、その目的地点候補が目的地点に設定できる。このため、ユーザは、選択回数が多いレコメンド地点を、スクロール操作なしで目的地点として設定することができる。このため、目的地点の設定操作を容易におこなうことができる。

図１０は、ユーザによる目的地点設定操作を模式的に示した図である。ユーザ１００１は、レコメンド地点を目的地点に選択する際には、表示部３０３の表示領域９０１に示された目的地点候補表示９２１〜９２３を押下する（矢印１０１２）。また、レコメンド情報以外の目的地点候補を選択する際には、その施設名称、たとえば「書店」などと発話する（吹き出し１０１１）。レコメンド地点に該当しない「書店」は、音声認識優先度が高い第１辞書８０２に登録されているため、音声認識処理に要する時間を短縮することができる。なお、表示部３０３の表示をスクロールすることによって、「書店」を選択することも可能である。また、レコメンド地点を音声認識によって選択することも可能であるが、この場合は、第２辞書８０３を用いてマッチング処理をおこなうため、第１辞書８０２に登録されている語句に比べ、処理に要する時間が長くなる。

図１１は、ナビゲーション装置によるユーザ設定操作の処理手順を示すフローチャートである。なお、以下も図４同様に、目的地点の設定をおこなう場合を例として説明する。まず、ナビゲーション制御部３０１は、ユーザ操作部３０２を介して目的地点候補の操作入力があったかを判断する（ステップＳ１１０１）。前述の例では、ユーザ操作部３０２は表示部３０３のタッチパネルであり、操作入力はタッチパネルが触れられたことを示す。操作入力があった場合は（ステップＳ１１０１：Ｙｅｓ）、操作入力された目的地点候補を目的地点として設定して（ステップＳ１１０２）、本フローチャートによる処理を終了する。

また、操作入力がなかった場合は（ステップＳ１１０１：Ｎｏ）、マイク３０２ａを介した音声入力があったかを判断する（ステップＳ１１０３）。音声入力がなかった場合は（ステップＳ１１０３：Ｎｏ）、ステップＳ１１０１に戻り、ユーザからの入力を待つ。一方、音声入力があった場合は（ステップＳ１１０３：Ｙｅｓ）、まず、第１辞書とのマッチング処理によって音声認識をおこなう（ステップＳ１１０４）。そして、第１辞書とのマッチング処理によって入力された音声の認識ができたかを判断し（ステップＳ１１０５）、認識できた場合は（ステップＳ１１０５：Ｙｅｓ）、ステップＳ１１０８に移行する。

一方、認識ができなかった場合は（ステップＳ１１０５：Ｎｏ）、第２辞書とのマッチング処理によって音声認識をおこなう（ステップＳ１１０６）。そして、第２辞書とのマッチング処理によって入力された音声の認識ができたかを判断し（ステップＳ１１０７）、判断できた場合は（ステップＳ１１０７：Ｙｅｓ）、認識した目的地点候補を目的地点に設定して（ステップＳ１１０８）、本フローチャートによる処理を終了する。

一方、第２辞書とのマッチング処理によっても入力された音声の認識ができなかった場合は（ステップＳ１１０７：Ｎｏ）、表示部３０３にエラー表示をおこない（ステップＳ１１０９）、本フローチャートによる処理を終了する。エラー表示は、たとえば、再発話を促すものや、他の同義語に代えて再試行を促すものなどである。また、表示部３０３への表示に限らず、たとえば、音声によるエラー報知であってもよい。

以上のような処理によって、ナビゲーション装置３００はユーザ設定操作の処理をおこなう。レコメンド地点は、当初から画面上に表示されるため、ユーザはタッチパネル操作によってすぐに選択することができる。また、レコメンド地点以外の目的地点候補は、画面上に表示はされていないものの、音声認識優先度が高い第１辞書に登録されており、音声による設定を優先的におこなうことができる。

なお、これまでの説明では、各目的地点候補の選択回数に基づいてレコメンド地点を抽出したが、これに限らず、たとえば、各目的地点候補が属するジャンルごとの選択回数に基づいてレコメンド地点を抽出してもよい。

図１２は、目的地点候補の選択回数の一例を示す図表である。目的地点候補表示１２０１および選択回数表示１２０２は、図６に示したものと同様である。ジャンル属性表示１２０３は、それぞれの目的地点候補が属するジャンルを示している。図示の例では、「公園」および「遊園地」は「プレイスポット」に、「書店」および「スーパーマーケット」は「小売店」に、「ファミリーレストラン」および「ラーメン屋」は「飲食店」に、それぞれ属している。

また、「プレイスポット」に属する施設（「公園」および「遊園地」）が選択された回数の合計は１２＋３＝１５回である。「小売店」に属する施設（「書店」および「スーパーマーケット」）が選択された回数の合計は５＋３４＝３９回である。「飲食店」に属する施設（「ファミリーレストラン」および「ラーメン屋」）が選択された回数の合計は４３＋６５＝１０８回である。これから、飲食店に属する施設が最も多く選択され、続いて小売店、プレイスポットに属する施設が選択されていることがわかる。

一般に、目的地点候補は、その属性に基づいてジャンル分けされており、目的地点候補をジャンルから絞り込むことも可能である。このため、目的地点として選択される回数が多い目的地点候補が属するジャンルを優先的に表示させ、目的地点として選択される回数が少ない目的地点候補が属するジャンルは、音声認識優先度を高める。これにより、ユーザに対して目的地点の設定操作を効率的におこなわせることができる。

図１３は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。表示部３０３には、ジャンルから目的地点を選択する選択画面１３０１が表示され、目的地点候補が属するジャンルのジャンル表示１３２１〜１３２３が表示されている。前述のように、最も多く選択されているジャンルである飲食店が、先頭に表示され、続いて小売店、プレイスポットが表示されている。それぞれのジャンル表示１３２１〜１３２３を押下すると、それぞれのジャンルに属する施設が表示される表示画面に移行する。また、各ジャンルに属する施設を直接音声認識によって選択することもできる。

図１４は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。図１３に示すようにジャンルから目的地点候補の施設を選択する他、図１４に示すように全ての目的地点候補を表示させて選択する場合でもジャンル別の選択回数を考慮することができる。

太線で示した表示領域１４０１は、目的地点設定画面が表示部３０３上に表示される当初から表示される領域である。一方、点線で示した表示領域１４１１は、スクロールボタン１４２０を押下するなどによって画面スクロールをおこなうことによって表示部３０３に表示される領域である。

図示のように、当初から表示される表示領域１４０１には、選択回数が最も多いジャンル「飲食店」に属する施設である「ラーメン屋」および「ファミリーレストラン」の目的地点候補表示１４２１，１４２２が表示される。以降、スクロールボタン１４２０を押下しなければ表示されない表示領域１４１１にかけては、２番目に選択回数が多いジャンル「小売店」に属する施設である「スーパーマーケット」および「書店」の目的地点候補表示１４２３，１４２４が表示される。そして、さらにその下には、選択回数が最も少ないジャンル「プレイランド」に属する施設である「公園」および「遊園地」の目的地点候補表示１４２５，１４２６が表示される。

このような場合、音声認識用辞書の第１辞書には、「公園」「遊園地」などプレイスポットに属する施設が登録される。また、第２辞書には、「ラーメン屋」「ファミリーレストラン」など飲食店に属する施設および「スーパーマーケット」「書店」など小売店に属する施設が登録される。

このように、頻繁に選択されるジャンルに属する施設は優先的に表示することによって、ユーザはタッチパネル操作によって、頻繁に利用する施設を素早く目的地点として設定することができる。また、あまり選択されないジャンルに属する施設は、画面上に表示はされていないものの、音声認識優先度が高い第１辞書に登録されており、音声による設定を優先的におこなうことができる。特に、あまり利用しない施設は、どのようなジャンルに属するか不明な場合があり、画面表示の階層を辿るよりも、音声認識によって選択した方が効率的な場合が多い。このような音声認識によって入力される可能性が高い語句を優先的に音声認識することによって、音声認識処理を効率的におこなうことができる。

以上説明したように、実施例１にかかるナビゲーション装置３００によれば、目的地点の選択回数によって、表示優先度および音声認識優先度を変化させることによって、効率的に目的地点の設定をおこなうことができる。また、選択回数が多い目的地点候補のみを表示することによって、目的地点設定画面に表示する項目を少なくし、画面表示を効率的におこなうことができる。

実施例１では、表示部３０３および音声認識を用いた目的地点の設定に関する実施例を説明した。実施例２では、ハードキーに対する機能割当に関する実施例を説明する。ナビゲーション装置などの車載器は、本体部に物理的に設けられたハードキーを備えている。これらのハードキーは、最初から特定の記号や機能が割り当てられているわけではなく、ユーザによる設定などによって、それぞれが必要とする機能を自由に割り当てることができるものがある（以下、このようなハードキーをファンクションキーという）。実施例２では、ファンクションキーへの機能割当と音声認識を組み合わせて、ユーザ操作の効率化を図る。なお、実施例２にかかるナビゲーション装置の構成は、図３に示した実施例１にかかるナビゲーション装置３００と同様であるので、詳細な説明を省略し、実施例１と同様の符号を用いて説明する。

図１５は、実施例２にかかるナビゲーション装置の外観を示す図である。ナビゲーション装置３００は、表示部３０３および本体部１５００から構成される。表示部３０３には、ナビゲーション画面や設定操作画面などが表示される。本体部１５００には、図３に示したナビゲーション装置３００の構成部のうち、表示部３０３以外のものが収納されている。

本体部１５００には、電源ボタン１５１１のように、その機能が固定したボタンの他、ユーザの設定によって機能を割当可能なファンクションキー１５２１〜１５２５が設けられている。ファンクションキー１５２１〜１５２５には、たとえば、オーディオに関する機能を割当可能であり、「ＣＤ」「ＴＵＮＥＲ」「ＭＤ」「ＨＤＤ」「ＴＡＰＥ」の各機能をいずれかのファンクションキー１５２１〜１５２５に割り振るものとする。

また、ファンクションキー１５２１〜１５２５に割当られた各機能の実行は、ファンクションキー１５２１〜１５２５を押下する他、ユーザがその機能名称を発話することによっておこなうこともできる。ユーザによる発話は、音声認識部３１２（図３参照）によって音声認識され、ナビゲーション制御部３０１（図３参照）は、音声認識された機能を実行する。

図１６および図１７は、ファンクションキーの機能表示例を示す図である。ファンクションキー１５２１〜１５２５は、文字表示または画像表示が可能であり、そのキーがどのような機能を有するかを示すことができる。図１６では文字表示によって、図１７では画像表示によって、それぞれのキーの機能を示している。また、この他、ファクションキー１５２１〜１５２５に指を近づけるとそのキーの機能を音声出力するようにしてもよい。

各ファンクションキー１５２１〜１５２５への機能の割当は、各機能の実行頻度によって決定される。一般に、操作対象は操作者に近い位置の方が効率的であり、誤操作なども少ない。このため、使用頻度が高い機能は、運転者（操作者）に近いキー（ファンクションキー１５２５側）に、使用頻度が低い機能は、操作者に遠いキー（ファンクションキー１５２１側）に、それぞれ配置する。

図１８は、各機能の使用頻度とその割合の一例を示す図表である。図１８の図表において、割当機能表示１８０１には、ファンクションキー１５２１〜１５２５に割当可能な機能が示されている。また、使用回数表示１８０２には、それぞれの機能が使用された回数が示されている。さらに、使用割合表示１８０３には、それぞれの機能が使用された割合が示されている。

図示の例では、「ＣＤ」の使用回数は１０３回であり、使用割合は４８％である。「ＴＵＮＥＲ」の使用回数は１３回であり、使用割合は６％である。「ＭＤ」の使用回数は３２回であり、使用割合は１５％である。「ＨＤＤ」の使用回数は５７回であり、使用割合は２７％である。「ＴＡＰＥ」の使用回数は８回であり、使用割合は４％である。これから、各機能は「ＣＤ」「ＨＤＤ」「ＭＤ」「ＴＵＮＥＲ」「ＴＡＰＥ」の順に使用されていることがわかる。

図１９は、各機能の使用割合を考慮したファンクションキーへの機能割当を示す図である。操作者に最も近いファンクションキー１５２５から、操作者に最も遠いファンクションキー１５２１に向かって、「ＣＤ」「ＨＤＤ」「ＭＤ」「ＴＵＮＥＲ」「ＴＡＰＥ」の順に割り振られている。これにより、ユーザが頻繁に使用する機能が割当られたキーを操作者に近い位置に設定し、これらの機能を使用する際の操作性を向上させることができる。

一方で、運転席から遠いファンクションキー（ファンクションキー１５２１側）に割当られた機能（使用頻度が低い機能）を使用する際には、キーによる操作は煩雑となる場合が多い。このような場合、ユーザは音声認識によってそれらの機能を実行することが多いと考えられる。このため、運転席から遠いファンクションキーに割当られた機能（使用頻度が低い機能）に関しては、音声認識優先度を上げ、効率的に音声認識をおこなえるようにする。

図２０は、ファンクションキーに割当られた機能の実行のための音声認識用辞書に登録された語句を示す図表である。音声認識用辞書２００１には、第１辞書２００２および第２辞書２００３がある。第１辞書２００２には音声認識優先度が高い語句が登録され、第２辞書２００３には音声認識優先度が低い語句が登録される。図示の例では、第１辞書２００２には、使用頻度が低い機能である「ＭＤ」「ＴＵＮＥＲ」「ＴＡＰＥ」が登録されている。一方、第２辞書２００３には、使用頻度が低い機能である「ＣＤ」「ＨＤＤ」が登録されている。

第１辞書に登録された機能は、運転席から遠いファンクションキー（ファンクションキー１５２１側）に割当られており、キー操作よりも音声認識によって実行される可能性が高い。このため、音声認識優先度が高い語句が登録される第１辞書に登録する。また、第２辞書に登録された機能は、運転席から近いファンクションキー（ファンクションキー１５２５側）に割当られており、音声認識よりもキー操作によって実行される可能性が高い。このため、音声認識優先度が低い語句が登録される第２辞書に登録する。これにより、音声認識がおこなわれる語句を優先的に音声認識することができ、音声認識処理の処理効率の向上を図ることができる。

以上説明したように、実施例２にかかるナビゲーション装置３００によれば、ファンクションキー１５２１〜１５２５に割当られる機能の使用頻度によって、各機能に割当るキーの位置を決定する。そして、使用頻度が高い機能は操作者から近いキーに割当て、キー操作をおこない易くする。また、操作者から遠いキーに割当られた機能に関しては、音声認識優先度を高め、効率的な音声認識をおこなう。これにより、ナビゲーション装置の操作性をより向上させることができる。

なお、本実施の形態で説明した音声認識方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。

Claims

音声が入力される音声入力手段と、
あらかじめ設定された複数の待ち受け語を表示する表示手段と、
前記表示手段によって表示された複数の前記待ち受け語のうちいずれかを選択するための操作入力手段と、
前記音声入力手段に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力手段によってそれぞれの前記待ち受け語が選択された回数とを計数する計数手段と、
前記計数手段によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出手段と、
前記抽出手段によって抽出された前記優先表示語を前記表示手段に優先的に表示する表示制御手段と、
前記優先表示語以外の前記待ち受け語を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、
を備えることを特徴とする音声認識装置。
前記抽出手段は、前記計数手段によって計数された前記回数が多い前記待ち受け語を前記優先表示語として抽出することを特徴とする請求項１に記載の音声認識装置。
前記計数手段は、前記待ち受け語が属するジャンルごとに前記回数を計数し、
前記抽出手段は、前記計数手段によって計測された前記回数が多いジャンルに属する前記待ち受け語を前記優先表示語として抽出することを特徴とする請求項１に記載の音声認識装置。
前記操作入力手段は、タッチパネルであり、
前記表示制御手段は、前記優先表示語を前記回数が多い順に表示することを特徴とする請求項１〜３のいずれか一つに記載の音声認識装置。
音声が入力される音声入力手段と、
装置が有する複数の機能のうちいずれか一つを実行するための複数の操作入力手段と、
前記音声入力手段に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力手段によってそれぞれの前記機能が実行された回数とを計数する計数手段と、
前記計数手段によって計数された前記回数に基づいて、複数の前記操作入力手段のうち操作者に近い位置に割り振る優先割振機能を決定する決定手段と、
前記決定手段によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、
を備えることを特徴とする情報処理装置。
音声が入力される音声入力工程と、
あらかじめ設定された複数の待ち受け語を表示する表示工程と、
前記表示工程によって表示された複数の前記待ち受け語のうちいずれかを選択する操作入力工程と、
前記音声入力工程に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力工程によってそれぞれの前記待ち受け語が選択された回数とを計数する計数工程と、
前記計数工程によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出工程と、
前記抽出工程によって抽出された前記優先表示語を前記表示工程に優先的に表示する表示制御工程と、
前記優先表示語以外の前記待ち受け語を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、
を含むことを特徴とする音声認識方法。
音声が入力される音声入力工程と、
複数の機能のうちいずれか一つを実行させる操作入力工程と、
前記音声入力工程に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力工程によってそれぞれの前記機能が実行された回数とを計数する計数工程と、
前記計数工程によって計数された前記回数に基づいて、複数の前記操作入力工程のうち操作者に近い位置に割り振る優先割振機能を決定する決定工程と、
前記決定工程によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、
を含むことを特徴とする音声認識方法。
請求項６または７に記載の音声認識方法をコンピュータに実行させることを特徴とする音声認識プログラム。
請求項８に記載の音声認識プログラムを記録したコンピュータに読み取り可能な記録媒体。