WO2006137245A1

WO2006137245A1 - 音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体

Info

Publication number: WO2006137245A1
Application number: PCT/JP2006/310672
Authority: WO
Inventors: Kentaro Yamamoto
Original assignee: Pioneer Corporation
Priority date: 2005-06-21
Filing date: 2006-05-29
Publication date: 2006-12-28
Also published as: JP4682199B2; EP1895508A4; EP1895508A1; EP1895508B1; JPWO2006137245A1; DE602006017368D1

Abstract

　音声入力部（１０１）は、音声が入力される。表示部（１０２）は、あらかじめ設定された複数の待ち受け語を表示する。操作入力部（１０３）は、表示部（１０２）によって表示された複数の待ち受け語のうちいずれかを選択するために設けられる。計数部（１０４）は、音声入力部（１０１）に入力された音声にそれぞれの待ち受け語が含まれた回数と、操作入力部（１０３）によってそれぞれの待ち受け語が選択された回数とを計数する。抽出部（１０５）は、計数部（１０４）によって計数された回数に基づいて、複数の待ち受け語のうち優先的に表示する優先表示語を抽出する。表示制御部（１０６）は、抽出部（１０５）によって抽出された優先表示語を表示部（１０２）に優先的に表示する。音声認識部（１０７）は、優先表示語以外の待ち受け語を優先して、音声入力部（１０１）に入力された音声を音声認識する。

Description

明細書

音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体

技術分野

[0001] 本発明は、発話された音声を認識する音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体に関する。ただし、本発明の利用は、上述した音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体には限られない。

背景技術

[0002] 従来、マイクなどを介して入力された人間の音声を認識する音声認識技術が知られている。このような音声認識においては、ユーザによる音声入力を受け取り、あらかじめ設定された待ち受け単語とのマッチング処理により、ユーザによる音声入力に対応する単語候補を決定する。そして、その単語候補中に正解が含まれるカゝ否かを判定する。ここで、待ち受け単語とは、その状況においてユーザが発話するであろうと予測される単語である（たとえば、下記特許文献 1参照。 ) o

[0003] 特許文献 1 :特開 2004— 46106号公報

発明の開示

発明が解決しょうとする課題

[0004] し力しながら、上述した従来技術によれば、その状況においてユーザが発話するであろうと予測される単語を全て待ち受け単語としなければならないという問題が一例として挙げられる。音声認識は、入力された音声と待ち受け単語とのマッチング処理によっておこなわれる。このため、音声認識の処理の速度を向上させるには、待ち受け単語の数はなるべく少な、ことが好ま U、。

[0005] また、音声認識は、操作ボタンやキー入力に代わる入力手段として用いられることが多ぐ待ち受け単語が表示画面上に表示される場合も多い。このような場合、多くの待ち受け単語を表示するために、表示画面上を待ち受け単語の表示によって占有されてしまったり、表示画面上の文字が細力べ見づらくなつてしまうという問題が一例として挙げられる。

課題を解決するための手段

[0006] 上述した課題を解決し、目的を達成するため、請求項 1の発明にかかる音声認識装置は、音声が入力される音声入力手段と、あらかじめ設定された複数の待ち受け語を表示する表示手段と、前記表示手段によって表示された複数の前記待ち受け語のうちいずれかを選択するための操作入力手段と、前記音声入力手段に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力手段によってそれぞれの前記待ち受け語が選択された回数とを計数する計数手段と、前記計数手段によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出手段と、前記抽出手段によって抽出された前記優先表示語を前記表示手段に優先的に表示する表示制御手段と、前記優先表示語以外の前記待ち受け語を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、を備えることを特徴とする。

[0007] また、請求項 5の発明にかかる情報処理装置は、音声が入力される音声入力手段と、装置が有する複数の機能のうちいずれか一つを実行するための複数の操作入力手段と、前記音声入力手段に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力手段によってそれぞれの前記機能が実行された回数とを計数する計数手段と、前記計数手段によって計数された前記回数に基づいて、複数の前記操作入力手段のうち操作者に近い位置に割り振る優先割振機能を決定する決定手段と、前記決定手段によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、を備えることを特徴とする。

[0008] また、請求項 6の発明にかかる音声認識方法は、音声が入力される音声入力工程と、あらかじめ設定された複数の待ち受け語を表示する表示工程と、前記表示工程によって表示された複数の前記待ち受け語のうちいずれかを選択する操作入力工程と、前記音声入力工程に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力工程によってそれぞれの前記待ち受け語が選択された回数とを計数する計数工程と、前記計数工程によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出工程と、前記抽出工程によって抽出された前記優先表示語を前記表示工程に優先的に表示する表示制御工程と、前記優先表示語以外の前記待ち受け語を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、を含むことを特徴とする。

[0009] また、請求項 7の発明にかかる音声認識方法は、音声が入力される音声入力工程と、複数の機能のうちいずれか一つを実行させる操作入力工程と、前記音声入力ェ程に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力工程によってそれぞれの前記機能が実行された回数とを計数する計数工程と、前記計数工程によって計数された前記回数に基づいて、複数の前記操作入力工程のうち操作者に近、位置に割り振る優先割振機能を決定する決定工程と、前記決定ェ程によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、を含むことを特徴とする。

[0010] また、請求項 8の発明に力かる音声認識プログラムは、請求項 6または 7に記載の音声認識方法をコンピュータに実行させることを特徴とする。

[0011] また、請求項 9の発明にかかる記録媒体は、請求項 8に記載の音声認識プログラムを記録したコンピュータに読み取り可能なことを特徴とする。

図面の簡単な説明

[0012] [図 1]図 1は、実施の形態に力かる音声認識装置の機能的構成を示すブロック図である。

[図 2]図 2は、音声認識装置による音声認識処理の手順を示すフローチャートである

[図 3]図 3は、実施例 1にかかるナビゲーシヨン装置のハードウェア構成を示すブロック図である。

[図 4]図 4は、ナビゲーシヨン装置によるユーザ設定操作の受付手順を示すフローチヤートである。

[図 5]図 5は、目的地点設定画面の一例を示す図である。

[図 6]図 6は、目的地点候補の選択回数の一例を示す図表である。 [図 7]図 7は、図 6に示した目的地点候補を選択回数が多い順に並べ替えた図表である。

[図 8]図 8は、音声認識用辞書に登録された語句を示す図表である。

[図 9]図 9は、レコメンド地点を考慮した目的地点設定画面の一例を示す図である。

[図 10]図 10は、ユーザによる目的地点設定操作を模式的に示した図である。

[図 11]図 11は、ナビゲーシヨン装置によるユーザ設定操作の処理手順を示すフローチャートである。

[図 12]図 12は、目的地点候補の選択回数の一例を示す図表である。

[図 13]図 13は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。

[図 14]図 14は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。

[図 15]図 15は、実施例 2にかかるナビゲーシヨン装置の外観を示す図である。

[図 16]図 16は、ファンクションキーの機能表示例を示す図である。

[図 17]図 17は、ファンクションキーの機能表示例を示す図である。

[図 18]図 18は、各機能の使用頻度とその割合の一例を示す図表である。

[図 19]図 19は、各機能の使用割合を考慮したファンクションキーへの機能割当を示す図である。

[図 20]図 20は、ファンクションキーに割当られた機能の実行のための音声認識用辞書に登録された語句を示す図表である。

符号の説明

100 音声認識装置

101 音声入力部

102 表示部

103 操作入力部

104 計数部

105 抽出部

106 表示制御部 107 音声認識部

発明を実施するための最良の形態

[0014] 以下に添付図面を参照して、この発明にかかる音声認識装置、情報処理装置、音声認識方法、音声認識プログラムおよび記録媒体の好適な実施の形態を詳細に説明する。

[0015] (実施の形態）

図 1は、実施の形態に力かる音声認識装置の機能的構成を示すブロック図である。図 1において、実施の形態に力かる音声認識装置 100は、音声入力部 101、表示部

102、操作入力部 103、計数部 104、抽出部 105、表示制御部 106、音声認識部 10

7によって構成される。

[0016] 音声入力部 101は、音声が入力される。音声の入力は、たとえば、ユーザが所定の語句を発話することによっておこなう。表示部 102は、あらかじめ設定された複数の待ち受け語を表示する。あらかじめ設定された複数の待ち受け語とは、後述する音声認識部 107によって音声認識可能な語句であり、たとえば、地名や装置に対する操作指示語などである。

[0017] 操作入力部 103は、表示部 102によって表示された複数の待ち受け語のうちいずれかを選択するために設けられる。操作入力部 103は、たとえば、タツチパネルや操作ボタンによって実現される。操作入力部 103がタツチパネルである場合は、表示部 102と操作入力部 103とは一体とすることができる。

[0018] 計数部 104は、音声入力部 101に入力された音声にそれぞれの待ち受け語が含まれた回数と、操作入力部 103によってそれぞれの待ち受け語が選択された回数とを計数する。また、計数部 104は、待ち受け語が属するジャンルごとに回数を計数することとしてもよい。待ち受け語が属するジャンルとは、たとえば、待ち受け語の種類 (地名、操作指示語など)や、施設の属性 (飲食店、プレイランドなど)である。

[0019] 抽出部 105は、計数部 104によって計数された回数に基づいて、複数の待ち受け語のうち優先的に表示する優先表示語を抽出する。抽出部 105は、たとえば、計数部 104によって計数された回数が多い待ち受け語を優先表示語として抽出する。なお、特定の待ち受け語を抽出するではなぐ計数部 104によって計数された回数に基づいて、待ち受け語それぞれに対して優先度をランキングすることとしてもよい。また、計数部 104がジャンルごとに回数を計数している場合、抽出部 105は、計数部 1 04によって計測された回数が多いジャンルに属する待ち受け語を優先表示語として抽出する。

[0020] 表示制御部 106は、抽出部 105によって抽出された優先表示語を表示部 102に優先的に表示する。優先的に表示するとは、たとえば、優先表示語を回数が多い順に画面の上部から表示する、あるいは、スクロール操作なしで視認できる場所に配置するなどである。

[0021] 音声認識部 107は、優先表示語以外の待ち受け語を優先して、音声入力部 101に入力された音声を音声認識する。優先表示語以外の待ち受け語を優先して、とは、たとえば、入力された音声とのマッチング処理を、優先表示語より先にそれ以外の待ち受け語に対しておこなうことである。なお、優先表示語以外の待ち受け語が多数ある場合には、さらにそれらの中で優先順位を決めることとしてもよい。

[0022] 図 2は、音声認識装置による音声認識処理の手順を示すフローチャートである。音声認識装置 100は、まず、計数部 104によって、音声入力部 101において音声入力された、あるいは操作入力部 103において操作入力された、待ち受け語の入力回数を計数する (ステップ S201)。つぎに、抽出部 105によって、複数の待ち受け語のうち優先的に表示する優先表示語を抽出する (ステップ S202)。表示制御部 106は、表示部 102に抽出部 105によって抽出された優先表示語を優先的に表示する (ステップ S 203)。

[0023] そして、音声入力があるまで待機し (ステップ S 204 : Noのループ）、音声入力があつた場合は (ステップ S204 : Yes)、入力された音声に対して、優先表示語以外の待ち受け語を優先して音声認識をおこない (ステップ S205)、本フローチャートによる処理を終了する。

[0024] 以上説明したように、実施の形態に力かる音声認識装置 100によれば、優先して音声認識する待ち受け語を絞ることによって、音声認識処理の処理効率を向上させることができる。また、待ち受け語の入力回数によって、優先して表示する待ち受け語を抽出し、簡潔な画面表示をおこなうことができる。さらに、画面表示の優先度が高くない待ち受け語に関しては、優先的に音声認識をおこない、これらの待ち受け語を選択する際の操作の煩雑さを回避することができる。

実施例 1

[0025] (ナビゲーシヨン装置 300のハードウェア構成）

図 3は、実施例 1にかかるナビゲーシヨン装置のハードウェア構成を示すブロック図である。実施例 1では、実施の形態にかかる音声認識装置 100を、ナビゲーシヨン装置 300の入力手段として用いる場合について説明する。図 3において、ナビゲーション装置 300は、車両に搭載されており、ナビゲーシヨン制御部 301と、ユーザ操作部 302と、表示部 303と、位置取得部 304と、記録媒体 305と、記録媒体デコード部 30 6と、音声出力部 307と、通信部 308と、経路探索部 309と、経路誘導部 310と、案内音生成部 311と、音声認識部 312と、によって構成される。

[0026] ナビゲーシヨン制御部 301は、ナビゲーシヨン装置 300全体を制御する。ナビゲーシヨン制御部 301は、たとえば所定の演算処理を実行する CPU (Central Process ing Unit)や、各種制御プログラムを格納する ROM (Read Only Memory)、および、 CPUのワークエリアとして機能する RAM (Random Access Memory)などによって構成されるマイクロコンピュータなどによって実現することができる。

[0027] また、ナビゲーシヨン制御部 301は、経路誘導に際し、経路探索部 309、経路誘導部 310、案内音生成部 311との間で経路誘導に関する情報の入出力をおこない、その結果得られる情報を表示部 303および音声出力部 307へ出力する。

[0028] ユーザ操作部 302は、文字、数値、各種指示など、ユーザによって入力操作された情報をナビゲーシヨン制御部 301に対して出力する。ユーザ操作部 302の構成としては、後述する表示部 303と一体として構成されるタツチパネル、物理的な押下 Z非押下を検出する押ボタンスィッチ、キーボード、ジョイスティックなど公知の各種形態を採用することが可能である。

[0029] また、ユーザ操作部 302は、外部からの音声を入力するマイク 302aを備える。マイク 302aから入力された音声は、後述する音声認識部 312によって音声認識される。これにより、ユーザは音声によって入力操作をおこなうことができる。

[0030] ユーザ操作部 302は、ナビゲーシヨン装置 300に対して一体に設けられていてもよ V、し、リモコンのようにナビゲーシヨン装置 300から分離して操作可能な形態であってもよい。ユーザ操作部 302は、上述した各種形態のうちいずれか単一の形態で構成されていてもよいし、複数の形態で構成されていてもよい。ユーザは、ユーザ操作部 302の形態に応じて、適宜入力操作をおこなうことによって情報を入力する。ユーザ操作部 302の操作によって入力される情報としては、たとえば、探索する経路の目的地点または出発地点が挙げられる。

[0031] 目的地点または出発地点の入力は、それぞれの地点の緯度 ·経度や住所を入力する他、目的地点または出発地点となる施設の電話番号やジャンル、キーワードなどを指定することによって、該当する施設が探索され、その位置を特定することができる。より詳細には、これらの情報は、後述する記録媒体 305に記録された地図情報に含まれる背景種別データに基づいて、地図上の一点として特定される。また、後述する表示部 303に地図情報を表示させ、表示された地図上の一点を指定するようにしてちょい。

[0032] 表示部 303は、たとえば、 CRT (Cathode Ray Tube)、 TFT液晶ディスプレイ、有機 ELディスプレイ、プラズマディスプレイなどを含む。表示部 303は、具体的には、たとえば、映像 IZFや映像 IZFに接続された映像表示用のディスプレイ装置によつて構成することができる。映像 IZFは、具体的には、たとえば、ディスプレイ装置全体の制御をおこなうグラフィックコントローラと、即時表示可能な画像情報を一時的に記憶する VRAM (Video RAM)などのバッファメモリと、グラフィックコントローラ力ら出力される画像情報に基づ、て、ディスプレイ装置を表示制御する制御 ICなどによつて構成される。表示部 303には、アイコン、カーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種情報が表示される。また、表示部 303には、後述する記録媒体 305に記憶された地図情報や経路誘導に関する情報が表示される。

[0033] 位置取得部 304は、 GPSレシーバおよび各種センサ力構成され、装置本体の現在位置（車両の現在位置）の情報を取得する。また、位置取得部 304は、 GPSレシーバが受信する GPS情報を受信できない領域など、所定の領域に入った際には、その領域内に設けられた通信機から送信される GPS代替情報を受信して、車両の現在位置を検出する。 [0034] GPSレシーバは、 GPS衛星力送信される GPS情報を受信し、 GPS衛星との幾何学的位置を求める。なお、 GPSとは、 Global Positioning Systemの略称であり、 4つ以上の衛星からの電波を受信することによって地上での位置を正確に求めるシステムである。 GPSレシーバは、 GPS衛星からの電波を受信するためのアンテナ、受信した電波を復調するチューナーおよび復調した情報に基づいて現在位置を算出する演算回路などによって構成される。

[0035] 各種センサは、車速センサや角速度センサ、走行距離センサ、傾斜センサなど自車に搭載された各種センサであり、これらのセンサから出力される情報から、自車の走行軌跡を求める。このように、 GPSレシーバによって外部力得られた情報と合わせて、自車に搭載された各種センサの出力する情報を用いることによって、より高い精度で自車位置の認識をおこなうことができる。

[0036] 車速センサは、ナビゲーシヨン装置 300を搭載する車両のトランスミッションの出力側シャフトから検出する。角速度センサは、自車の回転時の角速度を検出し、角速度情報と相対方位情報とを出力する。走行距離センサは、車輪の回転に伴って出力される所定周期のパルス信号のパルス数をカウントすることによって車輪 1回転当たりのパルス数を算出し、その 1回転当たりのパルス数に基づく走行距離情報を出力する。傾斜センサは、路面の傾斜角度を検出する。

[0037] 記録媒体 305は、各種制御プログラムや各種情報をコンピュータに読み取り可能な状態で記録する。記録媒体 305は、記録媒体デコード部 306による情報の書き込みを受け付けるとともに、書き込まれた情報を不揮発に記録する。記録媒体 305は、たとえば、 HD (Hard Disk)によって実現することができる。記録媒体 305は、 HDに限るものではなぐ HDに代えて、あるいは、 HDに加えて、 DVD (Digital Versatil e Disk)や CD (Compact Disk)など、記録媒体デコード部 306に対して着脱可能であり可搬性を有するメディアを記録媒体 305として用いてもょ、。記録媒体 305は、 DVDおよび CDに限るものではなぐ CD— ROM (CD— R, CD-RW) , MO (Mag neto- Optical disk)、メモリカードなどの記録媒体デコード部 306に対して着脱可能であり可搬性を有するメディアを利用することもできる。

[0038] 記録媒体 305に記憶された地図情報は、建物、河川、地表面などの地物（フィーチャ)を表す背景データと、道路の形状を表す道路形状データとを有しており、表示部

303の表示画面にお!、て 2次元または 3次元に描画される。ナビゲーシヨン装置 300 が経路誘導中の場合は、記録媒体 305に記録された地図情報と位置取得部 304によって取得された自車位置とが重ねて表示されることとなる。

[0039] なお、本実施例では地図情報を記録媒体 305に記録するようにしたが、これに限るものではない。地図情報は、ナビゲーシヨン装置 300のハードウェアと一体に設けられているものに限って記録されているものではなぐナビゲーシヨン装置 300外部に設けられていてもよい。その場合、ナビゲーシヨン装置 300は、たとえば、通信部 308 を通じて、ネットワークを介して地図情報を取得する。取得された地図情報は RAMなどに記憶される。

[0040] 記録媒体デコード部 306は、記録媒体 305に対する情報の読み取り Z書き込みの制御をおこなう。たとえば、記録媒体として HDを用いた場合には、記録媒体デコード部 306は、 HDD (Hard Disk Drive)となる。同様に、記録媒体として DVDあるいは CD (CD— R, CD— RWを含む）を用いた場合には、記録媒体デコード部 306は、 DVDドライブある、は CDドライブとなる。書き込み可能かつ着脱可能な記録媒体 30 5として、 CD— ROM (CD— R, CD— RW)、 MO、メモリカードなどを利用する場合には、各種記録媒体への情報の書き込みおよび各種記録媒体に記憶された情報の読み出しが可能な専用のドライブ装置を、記録媒体デコード部 306として適宜用いる

[0041] 音声出力部 307は、接続されたスピーカ（図示なし)への出力を制御することによつて、案内音を再生する。スピーカは、 1つであってもよいし、複数であってもよい。具体的には、音声出力部 307は、音声出力用のスピーカに接続される音声 IZFによって実現することができる。より具体的には、音声 IZFは、たとえば、音声デジタル情報の DZA変換をおこなう DZAコンバータと、 DZ Aコンバータから出力される音声アナログ信号を増幅する増幅器と、音声アナログ情報の AZD変換をおこなう AZDコンバータと、力ら構成することができる。

[0042] 通信部 308は、渋滞や交通規制などの道路交通情報を、定期的あるいは不定期に取得する。また、通信部 308は、ネットワークと接続され、サーバなどネットワークに接続された他の機器と情報の送受信をおこなう。

[0043] 通信部 308による道路交通情報の受信は、 VICS (Vehicle Information and Communication System)センターから道路交通情報が配信されたタイミングで行ってもよいし、 VICSセンターに対し定期的に道路交通情報を要求することで行つてもよい。また、サーノに集約された全国の VICS情報から、所望の地域の道路交通情報をネットワークを介して取得するようにしてもよい。通信部 308は、たとえば、 FM チューナー、 VICS/ビーコンレシーノ、無線通信機器、およびその他の通信機器によって実現することが可能である。

[0044] 経路探索部 309は、記録媒体 305に記憶されている地図情報や、通信部 308を介して取得する VICS情報などを利用して、出発地点から目的地点までの最適な経路を探索する。ここで、最適な経路とは、ユーザが指定した条件に最も合致する経路である。一般に、出発地点から目的地点までの経路は無数存在する。このため、経路探索にあたって考慮される事項を設定し、条件に合致する経路を探索するようにしている。

[0045] 経路誘導部 310は、経路探索部 309によって探索された誘導経路情報、位置取得部 304によって取得された自車位置情報、記録媒体 305から記録媒体デコード部 3 06を経由して得られた地図情報に基づいて、リアルタイムな経路誘導情報の生成をおこなう。このとき生成される経路誘導情報は、通信部 308によって受信した渋滞情報を考慮したものであってもよい。経路誘導部 310で生成された経路誘導情報は、ナビゲーシヨン制御部 301を介して表示部 303へ出力される。

[0046] 案内音生成部 311は、パターンに対応したトーンと音声の情報を生成する。すなわち、経路誘導部 310で生成された経路誘導情報に基づいて、案内ポイントに対応した仮想音源の設定と音声ガイダンス情報の生成をおこな、、ナビゲーシヨン制御部 3 01を介して音声出力部 307へ出力する。

[0047] 音声認識部 312は、マイク 302aを介して入力された音声を音声認識する。音声認識部 312によって音声が認識されると、ナビゲーシヨン制御部 301は認識された言葉に対応した処理をおこなう。たとえば、目的地点の設定画面において発話がおこなわれ、音声認識によって地名が認識されると、ナビゲーシヨン制御部 301は、認識された地名を目的地点として設定する。ユーザは、表示部 303に表示された地図から目的地点を指定する代わりに、目的地点名を発話することによって、目的地点を設定することができる。このように、音声認識部 312による音声認識によって、ユーザ操作部 302によっておこなう操作に代えることができる。

[0048] ここで、音声認識の手法は様々なものが知られている力一般には、入力された音声を特定するために、あらかじめ認識対象となる音声の周波数分布を分析することで、たとえば、スペクトルや基本周波数の時系列情報などを入力音声の特徴量として抽出し、そのパターンを各単語に対応させて格納する音声認識用辞書を備えている。

[0049] 認識されるべき音声が入力されると、入力された音声の周波数スペクトルを解析し、あらかじめ用意されている音素モデルとの比較 ·照合によって音素を特定する。そして、特定された音素モデルと、音声認識用辞書に格納された各単語のパターンをパターンマッチングにより比較照合し、各単語に対する類似度を算出する。つぎに算出された類似度が最も高、単語 (パターンが最も近、単語)を、入力された音声であると認識し、その単語を出力するようにしている。つまり、入力された単語の周波数分布のパターンがどの単語パターンに最も類似して、るかを調べることによって、入力音声を判定する。

[0050] 音声認識部 312は、マッチング処理の処理時間との関係から、音声認識処理において一時にマッチング処理をおこなう単語数を限定している。上述のように、音声認識部 312は、入力された音声の周波数パターンと音声認識用辞書に格納された全ての各単語のパターンを比較照合した上で、各単語に対する類似度を算出する。このため、音声認識用辞書に登録されている単語数が少ないほど、処理時間を短縮することができる。ただし、登録された単語が発話された単語と一致しなければ、誤認識やエラー (該当単語なし）が多発し、返って使い勝手が悪くなつてしまう。

[0051] そこで、音声認識部 312は、単語ごとに音声認識における優先順位 (以下、音声認識優先順位とヽぅ）を設定し、音声認識優先順位に基づ!ヽて複数の辞書に単語を割り振る。音声認識処理をおこなう際は、音声認識優先順位が高い単語が割り振られた辞書力マッチング処理をおこなう。これにより、音声認識の精度を維持しつつ音声認識処理の効率ィ匕を図ることができる。 [0052] ここで、単語に設定する音声認識優先順位を決定する要素は、様々なものが考えられる力本実施例では、音声認識またはユーザ操作部 302を介した操作によって選択された回数に基づいて、その単語の音声認識優先順位を設定する。一般に、ュ一ザの使用頻度の高いメニューは上位に表示するなどがおこなわれている。このようにユーザが頻繁に選択する単語は、表示部 303に優先的に表示して、ユーザ操作部 302 (タツチパネルなど）による操作をおこない易くする。一方で、選択頻度が少ない単語は、表示部 303への表示優先度は低くする。その代わりに、音声認識優先度を高く設定し、優先的に音声認識をおこなえるようにする。

[0053] このように優先順位を決定するのは、頻繁に選択する単語はタツチパネルなどによつてすぐに選択できる方が操作が容易であり、敢えて音声認識を使うメリットは小さい。このため、頻繁に選択する単語は、表示優先度は高くする一方で、音声認識優先度は低く設定する。逆に、選択頻度が少ない単語は、どのようなジャンルにカテゴライズされて!/ヽるか判断しづら!/、場合が多く、設定画面の表示カゝら探すことが困難である。このような単語は、音声認識によって選択した方が操作を容易にすることができる。このため、選択頻度が少ない単語は、表示優先度を低くする一方で、音声認識優先度を高く設定する。このような設定をおこなうことによって、音声認識部 312は音声認識の処理速度の向上を図っている。

[0054] 以上のようなハードウェア構成によってナビゲーシヨン装置 300は構成されて!、る。

なお、実施の形態に力かる音声認識装置 100の機能的構成である音声入力部 101 はマイク 302aが、表示部 102は表示部 303が、操作入力部 103はユーザ操作部 30 2が、計数部 104、抽出部 105、表示制御部 106は、ナビゲーシヨン制御部 301が、音声認識部 107は音声認識部 312が、それぞれその機能を実現する。

[0055] (ユーザ設定操作の受付手順）

図 4は、ナビゲーシヨン装置によるユーザ設定操作の受付手順を示すフローチヤ一トである。前述のように、ナビゲーシヨン装置 300に対する設定操作は、音声認識部 3 12によっておこなう音声認識およびユーザ操作部 302を介した操作によっておこなうことができる。ナビゲーシヨン装置 300に対する設定操作は様々なものがあるが、ここでは目的地点の設定をおこなう場合を例として説明する。 [0056] まず、ナビゲーシヨン制御部 301は、目的地点候補ごとの選択回数をカウントしている (ステップ S401)。ここで、目的地点は、あらかじめ登録された属性の施設を目的地点候補とし、これらの目的地点候補を選択することによって設定するものとする。あら力じめ登録された属性の施設とは、たとえば、ラーメン屋ゃファミリーレストランなどの飲食店や、スーパーマーケット、書店などの小売店などである。これらの目的地点候補の選択は、タツチパネル上に表示された施設名ボタンを押下したり、ユーザの発話を音声認識することによっておこなう。また、たとえば、地図上に示された施設を選択したり、前回の目的地点を読み出すなどしてもよい。

[0057] ナビゲーシヨン制御部 301は、目的地点設定画面の表示指示を待って (ステップ S 402： Noのループ）、目的地点設定画面の表示指示があった場合は (ステップ S402 ： Yes)、レコメンド地点を抽出する (ステップ S403)。目的地点設定画面の表示指示は、経路探索時など目的地点を設定する際におこなわれる。また、レコメンド地点とは、ステップ S401においてカウントしている選択回数が上位の目的地点候補 (より詳細には選択回数が上位の目的地点候補を示す語句)である。音声認識部 312は、目的地点候補を選択回数によって順位付けして、選択回数が上位の単語を抽出する。レコメンド地点を上位何位までを抽出するかは後述する音声認識用辞書の容量に依存する。

[0058] つぎに、音声認識部 312は、ステップ S403で抽出されたレコメンド地点を第 2の音声認識用辞書 (以下、「第 2辞書」という）に、その他の目的地点候補 (より詳細には、その他の目的地点候補を示す語句)を第 1の音声認識用辞書 (以下、「第 1辞書」という）に登録する (ステップ S404)。ここで、第 1辞書は、音声認識優先度が高い語句を登録する音声認識用辞書である。また、第 2辞書は、音声認識優先度が低い語句を登録する辞書である。音声認識処理においては、まず、第 1辞書に登録された語句とのマッチング処理がおこなわれ、該当する語句がな力つた場合は、第 2辞書に登録された語句とのマッチング処理がおこなわれる。

[0059] なお、ここでは音声認識用辞書を 2つにしたが、選択回数に応じて、さらに多くの音声認識用辞書に単語を割り振ることとしてもよい。特に、割り振るべき単語が大量にある場合は、多くの音声認識用辞書に割り振ることによって、 1つの音声認識用辞書に登録される単語数を少なくすることができる。

[0060] 続いて、ナビゲーシヨン制御部 301は、レコメンド地点を初期選択メニューに設定し

(ステップ S405)、目的地点設定画面を表示する (ステップ S406)。初期選択メ-ュ一とは、目的地点設定画面において、目的地点候補として最初に表示される項目である。目的地点候補は数多く存在し、一度に画面表示しょうとすると画面表示が煩雑となる。このため、目的地点として選択される回数が多いレコメンド地点を初期選択メニューに置く。たとえば、スクロールバーなどを用いて全ての目的地点候補を表示する場合は、スクロールしなくても表示される位置にレコメンド情報を表示する。これにより、画面が煩雑になることを回避しつつ、ユーザに簡易な操作で目的地点の設定をおこなわせることができる。

[0061] そして、ナビゲーシヨン制御部 301は、ユーザ操作部 302を介した操作入力または音声入力待ちに移行し (ステップ S407)、本フローチャートによる処理を終了する。以上のような処理によって、ナビゲーシヨン装置 300はユーザ力もの設定操作を受け付ける。

[0062] 図 5は、目的地点設定画面の一例を示す図である。表示部 303には、複数の目的地点候補表示 521〜526が表示され、所望の目的を選択できるようになつている。表示部 303はタツチパネルとなっており、表示された目的地点候補の名称を指で触れると、その目的地点候補が目的地点に設定できるようになつている。なお、目的地点の設定は、ユーザの発話を音声認識することによつても可能である。図示の例では、目的地点候補表示 521は「公園」を、目的地点候補表示 522は「書店」を、目的地点候補表示 523は「スーパーマーケット」を、目的地点候補表示 524は「ファミリーレストラン」を、目的地点候補表示 525は「遊園地」を、目的地点候補表示 526は「ラーメン屋」を、それぞれ示している。これらの項目は、当初、たとえば 50音順に配置されている。

[0063] 太線で示した表示領域 501は、目的地点設定画面が表示部 303上に表示される当初力表示される領域である。一方、点線で示した表示領域 511は、スクロールボタン 520を押下するなどによって画面スクロールをおこなうことによって表示部 303に表示される領域である。一般に、目的地点候補は相当数存在するため、このようなスクロール表示や階層表示を用いて画面表示が煩雑になるのを防いでいる。なお、以下では説明の便宜上、上記に示した 6つの地点（目的地点候補表示 521〜526に示された地点)を目的地点候補とする。

[0064] 図 6は、目的地点候補の選択回数の一例を示す図表である。図 6の図表において、目的地点候補表示 601には、目的地点候補が 50音順に示されている。また、選択回数表示 602には、それぞれの目的地点が選択された回数が示されている。前述のように、ナビゲーシヨン制御部 301は、目的地点候補ごとの選択回数をカウントしている（図 4のステップ S401参照）。

[0065] 図示の例では、「公園」は 12回、「書店」は 5回、「スーパーマーケット」は 34回、「フアミリーレストラン」は 43回、「遊園地」は 3回、「ラーメン屋」は 65回、それぞれ選択されている。この選択回数は、その選択がおこなわれた方法が、ユーザ操作部 302を介した操作入力である力音声認識による選択である力を問わずカウントして!/、る。

[0066] 図 7は、図 6に示した目的地点候補を選択回数が多い順に並べ替えた図表である。

図 6では 50音順に配置されていた目的地点候補表示 601は、選択回数が多い順に、「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」、「公園」、「書店」、「遊園地」の順に並べ替えられている。このうち、選択回数が上位の目的地点が、レコメンド地点として抽出される（図 4のステップ S403参照)。ここでは、選択回数が上位 3位の地点をレコメンド地点として抽出するものとする。すなわち、「ラーメン屋」、「ファミリ一レストラン」、「スーパーマーケット」を抽出する。そして、レコメンド地点として抽出された目的地点候補を第 2辞書に、その他の目的地点候補を第 1辞書に登録する（図 4のステップ S404参照）。

[0067] 図 8は、音声認識用辞書に登録された語句を示す図表である。音声認識用辞書 80 1には、第 1辞書 802および第 2辞書 803がある。第 1辞書 802には音声認識優先度が高い語句が登録され、第 2辞書 803には音声認識優先度が低い語句が登録される。図示の例では、第 2辞書 803には、レコメンド地点として抽出された「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」が登録されている。一方、第 1辞書 802 には、レコメンド地点以外の目的地点候補である「公園」、「書店」、「遊園地」が登録されている。 [0068] 図 9は、レコメンド地点を考慮した目的地点設定画面の一例を示す図である。太線で示した表示領域 901は、目的地点設定画面が表示部 303上に表示される当初から表示される領域である。一方、点線で示した表示領域 911は、スクロールボタン 92 0を押下するなどによって画面スクロールをおこなうことによって表示部 303に表示される領域である。

[0069] 図示のように、当初力も表示される表示領域 901には、レコメンド情報である「ラーメン屋」、「ファミリーレストラン」、「スーパーマーケット」を示す目的地点候補表示 921 〜923が表示される。一方で、スクロールボタン 920を押下しなければ表示されない表示領域 911には、その他の目的地点候補である「公園」、「書店」、「遊園地」を示す目的地点候補表示 924〜926が表示される。

[0070] 表示部 303はタツチパネルとなっており、表示された目的地点候補の名称を指で触れると、その目的地点候補が目的地点に設定できる。このため、ユーザは、選択回数が多いレコメンド地点を、スクロール操作なしで目的地点として設定することができる。このため、目的地点の設定操作を容易におこなうことができる。

[0071] 図 10は、ユーザによる目的地点設定操作を模式的に示した図である。ユーザ 100 1は、レコメンド地点を目的地点に選択する際には、表示部 303の表示領域 901に示された目的地点候補表示 921〜923を押下する (矢印 1012)。また、レコメンド情報以外の目的地点候補を選択する際には、その施設名称、たとえば「書店」などと発話する（吹き出し 1011)。レコメンド地点に該当しない「書店」は、音声認識優先度が高い第 1辞書 802に登録されているため、音声認識処理に要する時間を短縮することができる。なお、表示部 303の表示をスクロールすることによって、「書店」を選択することも可能である。また、レコメンド地点を音声認識によって選択することも可能である力この場合は、第 2辞書 803を用いてマッチング処理をおこなうため、第 1辞書 802 に登録されている語句に比べ、処理に要する時間が長くなる。

[0072] 図 11は、ナビゲーシヨン装置によるユーザ設定操作の処理手順を示すフローチヤートである。なお、以下も図 4同様に、目的地点の設定をおこなう場合を例として説明する。まず、ナビゲーシヨン制御部 301は、ユーザ操作部 302を介して目的地点候補の操作入力があつたかを判断する (ステップ S1101)。前述の例では、ユーザ操作部 302は表示部 303のタツチパネルであり、操作入力はタツチパネルが触れられたことを示す。操作入力があった場合は (ステップ S1101 :Yes)、操作入力された目的地点候補を目的地点として設定して (ステップ S 1102)、本フローチャートによる処理を終了する。

[0073] また、操作入力がな力つた場合は (ステップ S1101 :No)、マイク 302aを介した音声入力があつたかを判断する (ステップ S 1103)。音声入力がな力つた場合は (ステツプ S1103 :No)、ステップ S1101に戻り、ユーザからの入力を待つ。一方、音声入力があった場合は (ステップ S 1103 : Yes)、まず、第 1辞書とのマッチング処理によって音声認識をおこなう（ステップ S1104)。そして、第 1辞書とのマッチング処理によって入力された音声の認識ができたかを判断し (ステップ S1105)、認識できた場合は (ステツプ S 1105 : Yes)、ステップ S 1108に移行する。

[0074] 一方、認識ができな力つた場合は (ステップ S1105 :No)、第 2辞書とのマッチング処理によって音声認識をおこなう (ステップ S1106)。そして、第 2辞書とのマッチング処理によって入力された音声の認識ができたかを判断し (ステップ S 1107)、判断できた場合は (ステップ S1107： Yes)、認識した目的地点候補を目的地点に設定して ( ステップ S1108)、本フローチャートによる処理を終了する。

[0075] 一方、第 2辞書とのマッチング処理によっても入力された音声の認識ができなかつた場合は（ステップ S 1107： No)、表示部 303にエラー表示をおこな!/、（ステップ S 11 09)、本フローチャートによる処理を終了する。エラー表示は、たとえば、再発話を促すものや、他の同義語に代えて再試行を促すものなどである。また、表示部 303への表示に限らず、たとえば、音声によるエラー報知であってもよい。

[0076] 以上のような処理によって、ナビゲーシヨン装置 300はユーザ設定操作の処理をおこなう。レコメンド地点は、当初力画面上に表示されるため、ユーザはタツチパネル操作によってすぐに選択することができる。また、レコメンド地点以外の目的地点候補は、画面上に表示はされていないものの、音声認識優先度が高い第 1辞書に登録されており、音声による設定を優先的におこなうことができる。

[0077] なお、これまでの説明では、各目的地点候補の選択回数に基づ、てレコメンド地点を抽出したが、これに限らず、たとえば、各目的地点候補が属するジャンルごとの選択回数に基づ!/、てレコメンド地点を抽出してもよ!/、。

[0078] 図 12は、目的地点候補の選択回数の一例を示す図表である。目的地点候補表示 1201および選択回数表示 1202は、図 6に示したものと同様である。ジャンル属性表示 1203は、それぞれの目的地点候補が属するジャンルを示している。図示の例では、「公園」および「遊園地」は「プレイスポット」に、「書店」および「スーパーマーケット」は「小売店」に、「ファミリーレストラン」および「ラーメン屋」は「飲食店」に、それぞれ属している。

[0079] また、「プレイスポット」に属する施設（「公園」および「遊園地」）が選択された回数の合計は 12 + 3 = 15回である。「小売店」に属する施設（「書店」および「スーパーマーケット」 )が選択された回数の合計は 5 + 34 = 39回である。「飲食店」に属する施設（「ファミリーレストラン」および「ラーメン屋」）が選択された回数の合計は 43 + 65 = 108 回である。これから、飲食店に属する施設が最も多く選択され、続いて小売店、プレイスポットに属する施設が選択されていることがわかる。

[0080] 一般に、目的地点候補は、その属性に基づ、てジャンル分けされており、目的地点候補をジャンル力も絞り込むことも可能である。このため、目的地点として選択される回数が多い目的地点候補が属するジャンルを優先的に表示させ、目的地点として選択される回数が少ない目的地点候補が属するジャンルは、音声認識優先度を高める。これにより、ユーザに対して目的地点の設定操作を効率的におこなわせることができる。

[0081] 図 13は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。表示部 303には、ジャンルから目的地点を選択する選択画面 1301が表示され、目的地点候補が属するジャンルのジャンル表示 1321〜1323が表示されている。前述のように、最も多く選択されているジャンルである飲食店が、先頭に表示され、続いて小売店、プレイスポットが表示されている。それぞれのジャンル表示 1321〜132 3を押下すると、それぞれのジャンルに属する施設が表示される表示画面に移行する。また、各ジャンルに属する施設を直接音声認識によって選択することもできる。

[0082] 図 14は、ジャンル別の選択回数を考慮した目的地点設定画面の一例を示す図である。図 13に示すようにジャンルから目的地点候補の施設を選択する他、図 14に示すように全ての目的地点候補を表示させて選択する場合でもジャンル別の選択回数を考慮することができる。

[0083] 太線で示した表示領域 1401は、目的地点設定画面が表示部 303上に表示される当初力も表示される領域である。一方、点線で示した表示領域 1411は、スクロールボタン 1420を押下するなどによって画面スクロールをおこなうことによって表示部 30 3に表示される領域である。

[0084] 図示のように、当初力も表示される表示領域 1401には、選択回数が最も多いジャンル「飲食店」に属する施設である「ラーメン屋」および「ファミリーレストラン」の目的地点候補表示 1421, 1422が表示される。以降、スクロールボタン 1420を押下しなければ表示されない表示領域 1411にかけては、 2番目に選択回数が多いジャンル「小売店」に属する施設である「スーパーマーケット」および「書店」の目的地点候補表示 1423, 1424が表示される。そして、さらにその下には、選択回数が最も少ないジャンル「プレイランド」に属する施設である「公園」および「遊園地」の目的地点候補表示 1425, 1426力表示される。

[0085] このような場合、音声認識用辞書の第 1辞書には、「公園」「遊園地」などプレイスポットに属する施設が登録される。また、第 2辞書には、「ラーメン屋」「ファミリーレストラン」など飲食店に属する施設および「スーパーマーケット」「書店」など小売店に属する施設が登録される。

[0086] このように、頻繁に選択されるジャンルに属する施設は優先的に表示することによつて、ユーザはタツチパネル操作によって、頻繁に利用する施設を素早く目的地点として設定することができる。また、あまり選択されないジャンルに属する施設は、画面上に表示はされて、な、ものの、音声認識優先度が高、第 1辞書に登録されており、音声による設定を優先的におこなうことができる。特に、あまり利用しない施設は、どのようなジャンルに属するか不明な場合があり、画面表示の階層を迪るよりも、音声認識によって選択した方が効率的な場合が多い。このような音声認識によって入力される可能性が高い語句を優先的に音声認識することによって、音声認識処理を効率的におこなうことができる。

[0087] 以上説明したように、実施例 1にかかるナビゲーシヨン装置 300によれば、目的地点の選択回数によって、表示優先度および音声認識優先度を変化させることによつて、効率的に目的地点の設定をおこなうことができる。また、選択回数が多い目的地点候補のみを表示することによって、目的地点設定画面に表示する項目を少なくし、画面表示を効率的におこなうことができる。

実施例 2

[0088] 実施例 1では、表示部 303および音声認識を用いた目的地点の設定に関する実施例を説明した。実施例 2では、ハードキーに対する機能割当に関する実施例を説明する。ナビゲーシヨン装置などの車載器は、本体部に物理的に設けられたノヽードキーを備えている。これらのハードキーは、最初から特定の記号や機能が割り当てられているわけではなぐユーザによる設定などによって、それぞれが必要とする機能を自由に割り当てることができるものがある（以下、このようなハードキーをファンクションキ一という）。実施例 2では、ファンクションキーへの機能割当と音声認識を組み合わせて、ユーザ操作の効率ィ匕を図る。なお、実施例 2にかかるナビゲーシヨン装置の構成は、図 3に示した実施例 1にかかるナビゲーシヨン装置 300と同様であるので、詳細な説明を省略し、実施例 1と同様の符号を用いて説明する。

[0089] 図 15は、実施例 2にかかるナビゲーシヨン装置の外観を示す図である。ナビゲーシヨン装置 300は、表示部 303および本体部 1500から構成される。表示部 303には、ナビゲーシヨン画面や設定操作画面などが表示される。本体部 1500には、図 3に示したナビゲーシヨン装置 300の構成部のうち、表示部 303以外のものが収納されている。

[0090] 本体部 1500には、電源ボタン 1511のように、その機能が固定したボタンの他、ュ一ザの設定によって機能を割当可能なファンクションキー 1521〜1525が設けられている。ファンクションキー 1521〜1525には、たとえば、オーディオに関する機能を割当可能であり、「CD」「TUNER」「MD」「HDD」「TAPE」の各機能をいずれかのファンクションキー 1521〜1525に割り振るものとする。

[0091] また、ファンクションキー 1521〜1525に割当られた各機能の実行は、ファンクションキー 1521〜1525を押下する他、ユーザがその機能名称を発話することによっておこなうこともできる。ユーザによる発話は、音声認識部 312 (図 3参照）によって音声認識され、ナビゲーシヨン制御部 301 (図 3参照）は、音声認識された機能を実行する

[0092] 図 16および図 17は、ファンクションキーの機能表示例を示す図である。ファンクションキー 1521〜1525は、文字表示または画像表示が可能であり、そのキーがどのような機能を有するかを示すことができる。図 16では文字表示によって、図 17では画像表示によって、それぞれのキーの機能を示している。また、この他、ファクションキ一 1521〜1525に指を近づけるとそのキーの機能を音声出力するようにしてもよい。

[0093] 各ファンクションキー 1521〜1525への機能の割当は、各機能の実行頻度によつて決定される。一般に、操作対象は操作者に近い位置の方が効率的であり、誤操作なども少ない。このため、使用頻度が高い機能は、運転者 (操作者）に近いキー (ファンクシヨンキー 1525側）に、使用頻度が低い機能は、操作者に遠いキー（ファンクシヨンキー 1521側）に、それぞれ配置する。

[0094] 図 18は、各機能の使用頻度とその割合の一例を示す図表である。図 18の図表において、割当機能表示 1801には、ファンクションキー 1521〜1525に割当可能な機能が示されている。また、使用回数表示 1802には、それぞれの機能が使用された回数が示されている。さらに、使用割合表示 1803には、それぞれの機能が使用された割合が示されている。

[0095] 図示の例では、「CD」の使用回数は 103回であり、使用割合は 48%である。「TU NER」の使用回数は 13回であり、使用割合は 6%である。「MD」の使用回数は 32回であり、使用割合は 15%である。「HDD」の使用回数は 57回であり、使用割合は 27 %である。「TAPE」の使用回数は 8回であり、使用割合は 4%である。これから、各機能は「CD」「HDD」「MD」「TUNER」「TAPE」の順に使用されていることがわかる。

[0096] 図 19は、各機能の使用割合を考慮したファンクションキーへの機能割当を示す図である。操作者に最も近いファンクションキー 1525から、操作者に最も遠いファンクシヨンキー 1521に向かって、「CD」「HDD」「MD」「TUNER」「TAPE」の順に割り振られている。これにより、ユーザが頻繁に使用する機能が割当られたキーを操作者に近い位置に設定し、これらの機能を使用する際の操作性を向上させることができる [0097] 一方で、運転席力も遠いファンクションキー（ファンクションキー 1521側）に割当られた機能 (使用頻度が低い機能)を使用する際には、キーによる操作は煩雑となる場合が多い。このような場合、ユーザは音声認識によってそれらの機能を実行することが多いと考えられる。このため、運転席から遠いファンクションキーに割当られた機能 (使用頻度が低い機能）に関しては、音声認識優先度を上げ、効率的に音声認識をおこなえるようにする。

[0098] 図 20は、ファンクションキーに割当られた機能の実行のための音声認識用辞書に登録された語句を示す図表である。音声認識用辞書 2001には、第 1辞書 2002および第 2辞書 2003がある。第 1辞書 2002には音声認識優先度が高い語句が登録され、第 2辞書 2003には音声認識優先度が低い語句が登録される。図示の例では、第 1辞書 2002には、使用頻度が低い機能である「MD」「TUNER」「TAPE」が登録されている。一方、第 2辞書 2003には、使用頻度が低い機能である「CD」「HDD」が登録されている。

[0099] 第 1辞書に登録された機能は、運転席力も遠いファンクションキー（ファンクションキ一 1521側）に割当られており、キー操作よりも音声認識によって実行される可能性が高い。このため、音声認識優先度が高い語句が登録される第 1辞書に登録する。また、第 2辞書に登録された機能は、運転席から近いファンクションキー (ファンクションキー 1525側）に割当られており、音声認識よりもキー操作によって実行される可能性が高い。このため、音声認識優先度が低い語句が登録される第 2辞書に登録する。これにより、音声認識がおこなわれる語句を優先的に音声認識することができ、音声認識処理の処理効率の向上を図ることができる。

[0100] 以上説明したように、実施例 2にかかるナビゲーシヨン装置 300によれば、ファンクシヨンキー 1521〜 1525に割当られる機能の使用頻度によって、各機能に割当るキ一の位置を決定する。そして、使用頻度が高い機能は操作者力近いキーに割当て、キー操作をおこない易くする。また、操作者力も遠いキーに割当られた機能に関しては、音声認識優先度を高め、効率的な音声認識をおこなう。これにより、ナビゲーシヨン装置の操作性をより向上させることができる。

[0101] なお、本実施の形態で説明した音声認識方法は、あらかじめ用意されたプログラムをパーソナル.コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、 C D— ROM、 MO、 DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体力読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。

Claims

請求の範囲

[1] 音声が入力される音声入力手段と、

あらかじめ設定された複数の待ち受け語を表示する表示手段と、

前記表示手段によって表示された複数の前記待ち受け語のうちいずれかを選択するための操作入力手段と、

前記音声入力手段に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力手段によってそれぞれの前記待ち受け語が選択された回数とを計数する計数手段と、

前記計数手段によって計数された前記回数に基づいて、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出手段と、

前記抽出手段によって抽出された前記優先表示語を前記表示手段に優先的に表示する表示制御手段と、

前記優先表示語以外の前記待ち受け語を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、

を備えることを特徴とする音声認識装置。

[2] 前記抽出手段は、前記計数手段によって計数された前記回数が多い前記待ち受け語を前記優先表示語として抽出することを特徴とする請求項 1に記載の音声認識装置。

[3] 前記計数手段は、前記待ち受け語が属するジャンルごとに前記回数を計数し、前記抽出手段は、前記計数手段によって計測された前記回数が多いジャンルに属する前記待ち受け語を前記優先表示語として抽出することを特徴とする請求項 1に記載の音声認識装置。

[4] 前記操作入力手段は、タツチパネルであり、

前記表示制御手段は、前記優先表示語を前記回数が多、順に表示することを特徴とする請求項 1〜3のいずれか一つに記載の音声認識装置。

[5] 音声が入力される音声入力手段と、

装置が有する複数の機能のうちいずれか一つを実行するための複数の操作入力手段と、前記音声入力手段に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力手段によってそれぞれの前記機能が実行された回数とを計数する計数手段と、

前記計数手段によって計数された前記回数に基づいて、複数の前記操作入力手段のうち操作者に近い位置に割り振る優先割振機能を決定する決定手段と、前記決定手段によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力手段に入力された音声を音声認識する音声認識手段と、

を備えることを特徴とする情報処理装置。

[6] 音声が入力される音声入力工程と、

あらかじめ設定された複数の待ち受け語を表示する表示工程と、

前記表示工程によって表示された複数の前記待ち受け語のうちいずれかを選択する操作入力工程と、

前記音声入力工程に入力された音声にそれぞれの前記待ち受け語が含まれた回数と、前記操作入力工程によってそれぞれの前記待ち受け語が選択された回数とを計数する計数工程と、

前記計数工程によって計数された前記回数に基づ、て、複数の前記待ち受け語のうち優先的に表示する優先表示語を抽出する抽出工程と、

前記抽出工程によって抽出された前記優先表示語を前記表示工程に優先的に表示する表示制御工程と、

前記優先表示語以外の前記待ち受け語を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、

を含むことを特徴とする音声認識方法。

[7] 音声が入力される音声入力工程と、

複数の機能のうちいずれか一つを実行させる操作入力工程と、

前記音声入力工程に入力された音声にそれぞれの前記機能の名称が含まれた回数と、前記操作入力工程によってそれぞれの前記機能が実行された回数とを計数する計数工程と、

前記計数工程によって計数された前記回数に基づいて、複数の前記操作入力ェ程のうち操作者に近い位置に割り振る優先割振機能を決定する決定工程と、前記決定工程によって決定された前記優先割振機能以外の前記機能を優先して、前記音声入力工程に入力された音声を音声認識する音声認識工程と、

を含むことを特徴とする音声認識方法。

[8] 請求項 6または 7に記載の音声認識方法をコンピュータに実行させることを特徴とする音声認識プログラム。

[9] 請求項 8に記載の音声認識プログラムを記録したコンピュータに読み取り可能な記録媒体。