JP4802522B2

JP4802522B2 - 音声入力装置および音声入力方法

Info

Publication number: JP4802522B2
Application number: JP2005067020A
Authority: JP
Inventors: 大介斎藤; 充伸神沼
Original assignee: Nissan Motor Co Ltd
Current assignee: Nissan Motor Co Ltd
Priority date: 2005-03-10
Filing date: 2005-03-10
Publication date: 2011-10-26
Anticipated expiration: 2025-03-10
Also published as: JP2006251298A

Description

本発明は、車両用ナビゲーション装置等に付随する音声入力装置に関する。

近年、自動車において、音声を入力し認識する装置（以下、音声入力装置と称す）を備え、ナビゲーション装置、オーディオ装置あるいは空調装置等の操作を音声で行うことが可能なものがある。こうした音声入力装置は下記「特許文献１」に記載されているように、一般に、音声信号を取込むマイクロフォンを備え、ユーザの発話音声を入力・認識処理するように構成されている。

一般的な音声入力装置では、例えば常に音声入力を待受け、入力音声のパワー値(入力信号の振幅の二乗値)等を用いてユーザの発話音声区間を検出し、認識を行うような構成が以前から記述されている。自動車の室内でこうした構成を用いると、音声信号のみならず、車両のエンジンやエアコンの稼働音、オーディオ音、走行に伴う風音、タイヤと路面の接触に伴うロードノイズ等、多くの雑音が同時に入力される為、認識誤りが多くなる。

このため、車両に搭載される音声入力装置は、使用者が発声の直前に例えばＰＴＴ（Ｐｕｓｈ−Ｔｏ−Ｔａｌｋ）スイッチ、ＰＴＡ（Ｐｕｓｈ−Ｔｏ−Ａｃｔｉｖａｔｅ）スイッチ等の手段により音声入力装置側へ入力開始の信号を送り、認識対象となる音声区間を正確に特定させる方式がよく用いられる（例えば、「特許文献２」）。ＰＴＴ方式は、ボタンが押下されている時間区間についての入力音声が音声認識の対象になる。ＰＴＡ方式では、ボタンが押下された時刻から所定の時間以上にポーズ(無音声区間)が継続されるまでの区間を音声認識の対象とする。これに類似した手法としては、特定のキーワードの入力を前記ＰＴＡスイッチの押下操作と同等の機能として用いる手法も提案されている。
また、前記「特許文献１」においては、可変適応フィルタを用いて背景雑音を抑圧する方法も開示されている。
なお、以下では音声入力開始をシステムに伝達する手段を「発話スイッチ」と呼ぶ。

特開２００１−１９５０８５号公報特開平１１−３８９９５号公報

前記のような発話スイッチを用いた音声入力装置では、音声入力を行う度に使用者がスイッチを押下する等の操作を行わなければならず、操作が煩わしいという問題がある。さらに、使用者が発話を意思決定してから発話を開始する前に、発話スイッチの押下操作あるいはキーワード発話入力等が行われるため、操作完了までの所要時間が増加し、使用者にとって使い勝手が悪いという問題もある。また、発話操作時に、発話語彙の意識とともに、発話ボタンを押下するための意識も必要となることから、心的負荷も増加してしまう。

こうした問題を解消する方法として、常時入力を待受けるタイプのものがある。雑音の少ない環境では音声発話区間を正確に切り分けることが可能であり、有効である。しかしながら、常時雑音入力が大きく、更にこれら雑音の性質(雑音環境)が刻々と変化する自動車の室内においては、誤認識が著しく増加してしまい、その結果、使用者の意思とは異なる語彙が認識され、使用者に不都合を与えてしまうという問題がある。
このため、本発明においては、発話開始のタイミングに意識を払う必要がなく、また、雑音環境が刻々と変化する条件下でも誤認識の生じ難い音声入力装置の実現を目的としている。

前記目的を達成するために、本発明の音声入力装置においては、発話されるタイミングを予測することで発話時における発話スイッチの操作を必要とせず、また、発話される可能性の高い語彙を予測することにより、認識語彙の範囲を予め絞っておくことによって誤認識の確率を低減するようにした。この発話タイミングを予測する方法としては、使用者にとって注目する対象又は目的地となるＰＯＩ（ＰｏｉｎｔｏｆＩｎｔｅｒｅｓｔ）に所定の範囲内に接近したところで自動的に音声入力待受けの状態に入るようにした。また、この待受け状態になったところで、認識辞書の内容を、対象とするＰＯＩに関連した語彙の認識順位優先度を上げておく構成を基本形とした。

また、上記所定の範囲内における自動入力状態以外の範囲においては、手動で発話スイッチを入れ通常入力状態とし、ナビゲーション情報からＰＯＩに関する情報を求めるようにしている。なお、ここで言う上記ＰＯＩの注目する対象とは、ナビゲーション装置に記録された各種施設(ランドマーク)や道路上の分岐・合流地点等を指す。

このため、本発明による音声入力装置においては、マイクロフォン等の
音入力手段を介して音声を取得し、この音声を音声認識手段で情報信号に変換し、認識処理が行われた後に情報信号に変換し、この情報信号は操作命令発行部で認識された語彙内容を解釈し、ＰＯＩ情報を取得するためのナビゲーション部に操作命令を送出する。ナビゲーション部からのＰＯＩ情報はＰＯＩ情報抽出部で必要情報が記憶され、待受け領域判断部でＰＯＩの上記所定の範囲内にあるか否かの判定が行われ、所定の範囲内にあれば発話待受けの状態となり、辞書変更部により認識辞書の優先順位の変更等を行うことを基本動作としている。

以上述べた本発明の構成により、使用者の注目対象となるＰＯＩからの距離が所定の距離以内に接近すると、発話スイッチとは関係なく自動入力状態になるため、使用者は発話スイッチのありかを探したり、スイッチを押下する等の操作が不要となる。また、この自動入力状態になった時に、認識辞書における当該ＰＯＩに関連した語彙の認識順位優先度を上げることにより、誤認識の確率を抑制することが出来た。これら効果により、ＰＯＩ探索時の使用者の負担を軽減することが出来る。

<ＰＯＩの種類と発話可能語彙について>
本発明は、車両の移動に伴い接近してきた各種ＰＯＩ（ＰｏｉｎｔｏｆＩｎｔｅｒｅｓｔ）に基づき、使用者が注目するＰＯＩに対応する情報取得に関した語彙を優先して認識対象にすると共に、接近しつつあるＰＯＩに対して予め定められている区間においては、発話スイッチを押すこと無しに発話入力が可能な環境を提供するものである。ここで対象となるＰＯＩの種類とそのＰＯＩに対し要求される取得情報（対応する要求情報）の組み合わせとしては、例えば下記の表１のようなものが考えられる。

従って、発話スイッチを押すこと無しに音声入力を待受ける場合には、上記ＰＯＩの種類に対応する要求情報を取得するための語彙が認識語彙として認識辞書内の言語辞書に登録されている必要がある。本発明ではこれを注目する対象ＰＯＩに対応して言語辞書を変更することによって実現している。この処理過程の詳細については後述する。

以下では便宜的に、発話スイッチを用いず、ＰＯＩの接近情報に基づいて音声入力待受け可能となる状態を「自動入力状態」と表記し、これに対し発話スイッチの操作によって音声入力待ちうけ可能となる状態を「通常入力状態」と表記する。

（実施の形態１）
＜基本機能と実現手段＞
本実施の形態１においてはＰＯＩの種類を特に限定するものではなく、ともかく所定の範囲内にある任意のＰＯＩを全て対象としている。ここで所定の範囲とは、使用者が或るＰＯＩに接近し、使用者の音声入力の待受け可能となる地理的領域を指す。このようなＰＯＩを対象とする本発明に係る音声入力装置は、使用者の現在位置周辺に存在する任意のＰＯＩの情報をＰＯＩ情報抽出部により抽出し、このＰＯＩ情報と使用者の現在位置との位置関係から音声信号の自動入力状態にあるか否かを判定する待受け領域判断部と、これにより音声信号の自動入力が可能と判断されたところで、音声信号は音声入力部を経由して自動入力を行い、認識動作の開始を認識動作制御部により音声認識部に命令し、これにより、音声認識部において認識処理を行う構成を基本構成としている。この構成により使用者が周辺のＰＯＩと所定の位置関係になっておれば発話スイッチを操作することなく、音声入力を行うことが可能となる。

図１にこの構成を含む本発明による実施の形態１の構成を示し、図２に本発明に係る音声入力装置のハードウエアの構成を示す。
図１において、待受け領域判断部１０２ではＰＯＩ情報抽出部１０１が抽出するＰＯＩと使用者の現在位置との関係を監視する。そして、所定の位置関係、すなわち使用者がＰＯＩに対して予め定められた地理的領域以内に接近したことを示す条件のＰＯＩが検出された場合に音声入力待受け可能と判断し、認識動作制御部１０３に対し発話スイッチ１０７を使用しない自動入力状態に遷移するよう命令を出す。ここで、待受け領域判断部１０２は図２に示す演算装置２０４、記憶装置２０５、センサ２０６、タイマ２０８において実行される。センサ２０６はＧＰＳセンサやジャイロセンサであり、現在位置を検出し決定するものである。

また、ＰＯＩ情報抽出部１０１は、図２の演算装置２０４と記憶装置２０５とから構成され、後述のナビゲーション部１１０が保持するＰＯＩ情報を参照し、当該ＰＯＩに関する情報を抽出し記憶する。演算装置２０４としては、ＣＰＵ、ＭＰＵ、ＤＳＰ、ＦＰＧＡ等の一般的な動作回路を組み合わせたものが使用される。記憶装置２０５としては、キャッシュメモリ、メインメモリ、ＨＤＤ、ＣＤ、ＭＤ、ＤＶＤ、光ディスク、ＦＤＤなど、一般的な記憶媒体が使用される。

なお、本実施の形態１では抽出するＰＯＩ情報について特に制限を設けていない。したがって、ＰＯＩ情報抽出部１０１に記憶する内容はナビゲーション部１１０が保持するＰＯＩ情報のコピーであってもよい。なお、使用者の入力によって抽出されたＰＯＩを限定する方法を実施の形態２で、使用者の運転履歴の分析から限定する方法を実施の形態３において説明する。

以上の過程で、使用者が或るＰＯＩに接近したことを待受け領域判断部１０２が判断し、認識動作制御部１０３が自動入力状態に遷移するよう命令を出した所で、認識動作制御部１０３においては、音入力部１０６から入力音声信号が入力されたタイミングにあわせて音声認識部１０８で認識動作の開始を自動入力状態か通常入力状態かの情報と共に音声認識部１０８に伝達する。なお、認識動作制御部１０３の機能は図２における演算装置２０４で実行される。

本実施の形態１においてはＰＯＩの種類は問わず、接近したＰＯＩに対して音声認識動作を開始する自動入力状態にしているため、発話スイッチ１０７は不要であるが、前記の通常入力状態の場合は必要である。発話スイッチ１０７は、音声入力開始をシステムに伝える為に使用者が押下するスイッチであり、図２におけるスイッチ２０７で実現され、使用者がこのスイッチ２０７を押下すると通常入力状態として音声入力を待つ。すなわち、発話スイッチ１０７は自動入力状態を終了して通常入力状態に移行するための手段であり、使用者が該スイッチ２０７を押下したことを発話スイッチ１０７が検出すると、音声認識部１０８に対し、入力音声信号の認識開始を命令する。

ただし、この発話スイッチ１０７に対しては、誤操作対策及び周囲騒音による誤認識発生予防の意味も含め、発話スイッチ１０７が押下された時刻から所定の期間が過ぎたら認識処理は実行しないようにしておく。ただし、使用者と任意のＰＯＩとが所定の地理的領域内、すなわち、待受け領域判断部１０２が自動入力状態にあると判断した領域内であれば、発話スイッチ１０７が押下された時刻から所定の期間を経過した時間（所定の期間以外の期間）であっても入力された時刻から入力された音声信号の認識処理を行うものとしておく。この発話スイッチの利用法とすることにより、使用者の現在位置が特定の地理的領域内に存在する場合に、発話スイッチの押下の有無にかかわらず入力音声を認識することが出来るようになり、適用範囲のより広い音声入力装置を構成とすることが出来る。

前述のように、待受け領域判断部１０２では、ナビゲーション部１１０から抽出したＰＯＩ情報を、ＰＯＩ情報抽出部１０１を経由して使用者の現在位置監視を行っている。したがって、使用者の移動と共にＰＯＩが変われば、そのＰＯＩの変化と共に音声認識を行う語彙も変化してくる。このため、本発明においては、音声認識部１０８で使用する言語辞書１０５に記録されている語彙の優先順位をＰＯＩにあわせて変更するようにしている。

このため、待受け領域判断部１０２が判断した対象ＰＯＩ(現在位置から所定距離内のＰＯＩ)に基づき、発話される可能性の高い語彙を次発話語彙として予測し、この予測された語彙を優先語彙として認識辞書１０５内の言語辞書部分における当該語彙の優先順位を辞書変更部１０４により変更する。

この構成とすることにより、発話可能性の高い語彙を認識対象語とすることが出来るため、雑音等による誤認識を低減した音声入力機能を提供することが出来る。

ここで、辞書変更部１０４は、図２の演算装置２０４および記憶装置２０５で構成され、図示しないが記憶テーブルを備えており、前出の表１のように、ＰＯＩの種類とそのＰＯＩに対応する要求情報（実際には情報を取得するための語彙＝優先語彙）の組み合わせをこの記憶テーブルに記憶させることになる。この変更された言語辞書を含む認識辞書１０５を用いて音声認識部１０８で認識された語彙は操作命令発行部１０９に送出される。このようにして発話可能性の高い語彙を認識対象語とすることが出来るため雑音等による誤認識を低減した音声入力機能を提供することが出来る。

認識辞書１０５は図２の記憶装置２０５に対応しており、音響辞書と言語辞書とから構成されている。前者の音響辞書は前述の時系列ベクトルデータと照合を行う対象となる言語の音響的特徴量を、例えば隠れマルコフモデル(ＨＭＭ：Hidden Markov Model)等の形式で記録したものであり、後者の言語辞書は、音声入力システムが受理可能な語彙を、例えば単語のつながり(単語ネットワーク)として記録したものである。前記辞書変更部１０４においては、この言語辞書を変更して、前記の優先語彙として選択した語彙が優先して認識されるように言語辞書部分を変更する。変更方法の具体例は後述する。

音入力部１０６は、図２のマイクロフォン２０１と増幅装置２０２、ＡＤ変換装置２０３、演算装置２０４から構成されており、使用者の発話音声 (図１の矢印ａ)をデジタル音声信号（情報信号）に変換して音声認識部１０８へ入力する。マイクロフォン２０１としては一般的なマイクロフォンを用いることができる。

尚、音入力部１０６からは、音声の他、車両内外で発生している雑音やオーディオ、ナビゲーションシステム等から出力される音信号も同時に入力される。従って、マイクロフォン２０１とＡＤ変換装置２０３の間、もしくはＡＤ変換装置２０３と音声認識装置２０４との間に
・音声中の非目的成分を弱めるためのフィルタ(アンチエイリアシングフィルタ)を設ける
・利得調整機構を設けて入力信号のパワー(ゲイン)が適切となるよう増幅量を調整する
・入力信号のパワー変化等に基づき、入力信号中で音声の含まれる区間を正確に切り出す音声抽出(Voice Activity Detection : VADと呼ばれる)機構を設ける
・オーディオやナビゲーションシステムから出力される音信号を打ち消すエコーキャンセリング機構を設ける
といった構成を持つことが望ましい。

音声認識部１０８における処理は、図２の演算装置２０４、記憶装置２０５において実行され、音入力部１０６において取得し、情報信号に変換された音声信号を認識辞書１０５に記憶された音響的特徴（音響辞書）、及び言語的特徴（言語辞書）を用いて比較・照合を行い、尤もらしい(尤度の高い)語彙を一つあるいは複数、認識結果を音声認識部１０８において取得する。一般的な音響的特徴量としては、線形予測分析を用いたＬＰＣ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ）ケプストラム、ＬＰＣデルタケプストラム、メルケプストラム、対数パワー等を組み合わせた時系列ベクトルデータが用いられる。

ここで、音声認識部１０８の認識区間は、待受け領域判断部１０２により決定され
１）認識動作制御部１０３が認識命令を発行している期間、すなわち「自動入力状態」と判定されている期間、
２）発話スイッチ１０７が押されてから所定の期間、
を対象とする。すなわち、待受け領域判断部１０２が使用者の音声入力を待受け可能な地理的領域にあることの判断が基本となっている。また、図示していないが音声信号検出手段を備え、前記認識区間のうち、音声信号が検出されてから無音区間が所定時間継続するまでを実際の認識対象区間としてもよい。

操作命令発行部１０９は、図２の演算装置２０４、記憶装置２０５から構成されており、音声認識部１０８で認識された語彙内容を解釈して、ナビゲーション部１１０へ操作命令を送出する（図１：矢印ｂ）。操作対象であるナビゲーション部１１０は音声以外の操作手段(例えばボタンやタッチパネル等)によっても操作可能であり、これら操作手段からの情報(ボタン押下情報等)も、音声認識結果と同様、操作命令発行部１０９にて操作命令に変換され、ナビゲーション部１１０へ向けて送出される。

ナビゲーション部１１０は、図２の演算装置２０４、記憶装置２０５から構成され、地図データ、この地図に関連付けられたＰＯＩデータテーブル、目的地・経由地等ＰＯＩの情報が設定されている経路誘導機能等を併せ持つ。ここでＰＯＩデータテーブルは、個々のＰＯＩに関する複数の情報を記憶している。前記のＰＯＩ情報抽出部１０１は、ナビゲーション部１１０に内蔵されている経路誘導機能に設定されている目的地、経由地に関する情報に基づき抽出すべきＰＯＩ情報を決定する。これにより、使用者の注目するＰＯＩを適切に抽出することが出来、当該ＰＯＩに対するスイッチを用いない音声操作機能を提供することが出来る。

例えば、
・レストランや遊園地などの施設：施設名称、営業時間、駐車場有無、混雑状況、サービスクーポン情報、各種イベント情報等、
・ＩＣ（インターチェンジ）やＪＣ（ジャンクション）、主要道路の分岐点：
料金情報、利用可否情報(通行止め等)、方面案内情報等
等の情報がこれに相当する。

以上述べたように、ＰＯＩ情報抽出部１０１が抽出したＰＯＩの位置と、使用者の現在位置との地理的関係が予め定められた関係を満たす区間内（地理的範囲内）の任意の位置において、待受け領域判断部１０２は音声入力待ち受け可能と判断する構成としている。この構成により、使用者の注目するＰＯＩとの位置関係に基づいて、発話スイッチを用いない音声入力機能を提供することが出来る。

上記情報には、時刻により変化する情報も含まれる。したがって、外部との通信機能を有し、該変化の含まれる情報を定期的に更新する機能を備えることが望ましい。
また、本発明においては、走行経路上の分岐・合流地点、放送局等の放送は発信地点である情報発信地点、道路状況変化地点、気候変化予測地点、情報取得可能地点等もＰＯＩ情報に含む。これら各地点に関する情報の少なくとも一つに基づいてＰＯＩ情報抽出部１０１抽出すべきＰＯＩ情報を決定する。ここで、走行状況変化地点とは、渋滞地点や幅員変化地点、路面状態変化地点等に相当し、情報取得可能地点とは、ＶＩＣＳビーコン等の路車間通信が確立される地点、ラジオ・テレビ等の放送波の受信が可能となる地点に相当する。この構成により、使用者の注目するＰＯＩを適切に抽出することが出来、このＰＯＩに対するスイッチを用いない音声操作機能を提供することが出来る。

<待受け領域判断方法について>
以下、前記待受け領域判断部１０２の待受け領域判断方法について説明する。待受け領域とは、自動入力状態となる地理的領域であり、対象とするＰＯＩと現在位置との位置関係（地理的関係）から決定される。その地理的関係としては、例えば
Ａ．現在位置と該ＰＯＩと直線距離が所定距離内
Ｂ．現在位置と該ＰＯＩとの経路距離が所定距離内
Ｃ．現在位置から該ＰＯＩまでの推定所要時間が所定以内となる距離以内
等とすればよい。Ａ、Ｂ，Ｃはそれぞれ、方向的な距離の接近度合い、実際の距離の接近度合い、時間的な接近度合いから自動入力状態、すなわち音声入力可能と判断するものである。これにより、使用者にとって親和性の高い発話タイミングによる音声入力機能を提供することが出来る。

図３に上記Ａの方法を用いた場合の待受け領域判断結果を示した。図３中に記載のアイコンはそれぞれ以下の通りである。
３０１：現在位置
３０２，３０３：インターチェンジ(ＩＣ)
３０４：ジャンクション(ＪＣ)
３０５：駐車場
３０６：ガソリンスタンド
３０７：レストラン
３０８：スーパー
３０９：遊園地
３１０：ゴルフ場
３１１：温泉街
３１２：放送波発信地点
図３において、インターチェンジ３０２を中心とする所定のエリア(Ａｒｅａ３０２)が示されているが、これは待受け領域判定部１０２が自動入力状態を判定する領域、すなわち自動入力が可能な領域であり、現在位置がこの領域内にある場合にインターチェンジ３０２の情報取得に関する語彙の入力が可能な自動入力状態となる。インターチェンジ３０３からスーパー３０８も同様にそれぞれのＰＯＩから所定の距離を満たす領域が自動入力領域となる。尚、ジャンクション３０４とレストラン３０７とスーパー３０８の自動入力領域には一部重なる領域がある。こうした領域では、それぞれの情報取得に関する語彙を全て入力可能な自動入力状態とする。ただし、一般道走行中にＪＣの方面案内操作を行う可能性は低いこと等を鑑み、走行中の道路から到達困難なＰＯＩについては自動入力領域から除外することが好ましい。

自動入力領域の広さはＰＯＩの種類によって変更することも可能である。例えば遊園地３０９やゴルフ場３１０といった大型施設では、スーパーやレストランよりも大きな距離を設定することで、現在位置から少し離れた距離から自動入力状態とすることができる。また、Ａｒｅａ３０９のように、施設中心部から所定距離の円を自動入力領域とする方法のほか、ゴルフ場３１０の自動入力領域Ａｒｅａ３１０のように、施設の敷地外周からの所定距離としてもよい。更に、温泉街３１１のように、同種の施設が密接するような地域では、たとえばＡｒｅａ３１１に示す領域のように、複数の同種ＰＯＩを包含する領域を自動入力領域としても良い。
［複数ＰＯＩが同時に対象となる場合の表示、対話方法］
以上述べたように、現在位置から所定範囲内に複数のＰＯＩが存在する場合には、発話入力の認識結果として、対象ＰＯＩに関する情報を順列に表示あるいは音声出力する。例えば、「混雑具合」についての情報問い合わせ操作が行われた場合に、空いている順、あるいは混んでいる順に上位数個のＰＯＩを選択して情報を提示する。更には、該複数ＰＯＩから一意のＰＯＩを特定できるような発話入力を受け付けるよう、音声認識部１０８の認識辞書および対話制御を構成するようにしてもよい。すなわち、現在位置から所定範囲内に複数のレストランが存在し、ＰＯＩ情報抽出部にてこれらレストランが抽出されている場合に、「空いている方のレストランに行く」「一番近いレストランの混み具合」といった発話を受理可能とする。
［放送波等、広域で対象となりうるＰＯＩへの対処］
一方、放送波発信地点（情報発信地点）３１２からの発信情報(ラジオ、テレビ等)を取得可能な地域を、半径Ｒ１の円領域Ａｒｅａ３１２として示している。ただし本実施の形態１では、この発信されている放送波の取得境界、すなわちこの放送波が捕捉不可能な地域から可能な地域に入った地点の付近でのみ自動入力状態を提供する構成としている。放送波取得可能領域は広範であるため、該領域を全て自動入力領域とすると、長時間自動入力状態となり、誤認識の可能性が増加するためである。情報取得可能領域に進入してから所定時間(例えば３０秒間など)に限って自動入力可能状態とすることが望ましい。この構成としたことにより、情報（電波）到達範囲内に進入した場合の所定期間について、スイッチを用いずにこの発信情報を入手するための音声操作機能を提供することが出来る。

図４は前記Ｃの方法、すなわちＰＯＩまでの時間的な接近具合から自動入力領域を判定する例を示している。図４中の道路上の斜線領域がＰＯＩ「Ｓ」の自動入力領域である。所定の時間内でこのＰＯＩに到達できる領域であり、道路の規模や制限速度、混雑具合によって決定される。これによって、「あとｔ秒で通りかかる」というタイミングで自動入力状態を提供できる。同様にして、Ｂの手法を用い、「あとＤｋｍで通りかかる」という領域を自動入力領域とすることも可能である。

尚、上記方法に、進行方向の情報を加え、ＰＯＩから遠ざかる方向に進んでいる場合には自動入力状態を解除するようにしても良い。図５（ａ）は走行予定経路上にＡ，Ｂ二つのＰＯＩが存在している場合の自動入力状態の遷移を示している。図５（ａ）では進行方向に関する情報を用いていない。よってＡ、Ｂそれぞれについて現在位置から所定距離の期間に渡り、自動入力状態となる。すなわち、５０１から５０３までの領域がＰＯＩ＝（Ａ）に基づく自動入力領域であり、５０２から５０４までの領域がＰＯＩ＝（Ｂ）に基づく自動入力領域となる。結果としてＡｒｅａ(Ａ)と示された領域ではＰＯＩ(Ａ)を対象とする自動入力状態となり、同様にＰＯＩ＝Ｂのための領域がＡｒｅａ（Ｂ）そして、ＰＯＩ＝（Ａ＆Ｂ）となる領域がＡｒｅａ（Ａ，Ｂ）となる。

これに対し、進行方向の情報から、通り過ぎたＰＯＩに関する自動入力状態を解除する例を図５（ｂ）に示す。この場合、ＰＯＩ＝（Ａ）の自動入力領域は５０５から５０７、ＰＯＩ＝（Ｂ）では５０６から５０８となる。通り過ぎたＰＯＩに関する情報取得要求は少ないと考えられるため、こうした手段により自動入力領域を限定することで、より使用者の意図に近い自動入力状態が提供できると考える。ただし、例外として、ＤＳＲＣやビーコン等の路車間通信機器の設置地点を対象ＰＯＩとする場合には、通過してからの所定期間についても自動入力状態を保持することが好ましい。これは、路車間通信を行う領域は一般に数ｍから十数ｍの領域であり、音声操作中に該領域を通過してしまう可能性が高いためである。

受信したデータは所定期間ナビゲーション部にて保持される構造とし、この所定保持期間については、このＰＯＩに関する情報取得の語彙を自動入力できる状態とする。図５（ｃ）には上記路車間通信機器を対象ＰＯＩとした場合の自動入力領域を示している。実際に通信を行う領域は５１０から５１１の区間であるが、自動入力領域は５０９から５１２となっている（Ａｒｅａ（ｃ））。尚、図５（ｃ）の例において、自動入力領域の開始点５０９は、ＰＯＩ＝（ｃ）に対する最初の発話入力及び認識処理に要する時間を考慮し、通信領域の始点５１０より手前の地点としている。これにより、通信区間を通過した後も暫くの期間について受信した情報の再表示や音声出力等の操作を行うことが可能である。

<辞書変更手段について>
［通常入力状態での辞書構成と認識動作例］
次に、待受け領域判断部１０２の判断に基づく辞書変更部１０４の具体的な辞書変更方法について説明する。まず、本実施の形態１における言語辞書(通常入力状態すなわち変更処理前)の例を図６に示す。図６（ａ）の言語辞書は、ネットワーク型の言語辞書であり、階層構造で語彙のつながりを表現している。下位階層の単語は、上位階層の単語カテゴリを詳細化する関係となっており、上位階層と下位階層の単語を１単語毎、あるいは連結して入力することが可能である。例えば図６（ａ）の辞書では、「行き先」や、「行き先、神奈川県横浜市金沢区」、「施設情報、ジャンル別、レストラン、Ａレストランの営業時間」等を認識することが可能である。こうした階層構造を持つ言語辞書では、先の語彙の認識結果に応じて後に来る認識対象語彙を絞り込むことができ、認識性能を向上させやすいという利点がある。

一方ネットワークの階層に自由度を持たせ、語順の変更に対応する構成とすることで、例えば「行き先、横須賀駅」と「横須賀駅を行き先にする」双方を認識可能な辞書を提供することも可能である。
また、図６（ｂ）のように、語彙カテゴリ毎に辞書をもち、これらを独立、あるいは並列に照合対象として認識を行う構成としてもよい。この場合も認識可能語彙は図６（ａ）と同様であるが、言語辞書図６（ｂ）では、辞書３０１乃至３０５から何れか単独の辞書のみを有効にすることもでき、また辞書全てを有効にし、各辞書に含まれる語彙を並列に待受けることも可能である。

上述の語順に自由度を与える辞書構造や、複数辞書を並列に待受ける構成では同時に認識できる語彙数が増加するため、使用者にとってより自然な音声入力が可能になるが、対象語彙の増加に伴い認識率は低下する傾向がある為、用いる環境での認識性能に基づき辞書構成を適宜選択することが望ましい。また、受理対象の語彙のほかに、間投詞や咳払いなどを吸収して認識対象から除外するためのガベージモデルを各語彙の前後に挿入することが望ましい。
また、一括入力を除く場合(数単語ずつ区切って入力する場合)では、使用者に対し適宜音声や表示等によるフィードバックがなされることが望ましい。

以下に、図６（ａ）の辞書構造を用いた場合のシステムと使用者の対話例を示す。ただし、この例は通常入力状態の対話例である。したがって、発話の前に使用者が発話スイッチ１０８を押下する操作を行っている。(Ｕ：は使用者の発話、Ｓ：はシステム応答を示す)
「対話例１：目的地設定入力」
Ｕ：(発話スイッチ１０７を押下)
Ｓ：お話しください
Ｕ：行き先
Ｓ：行き先の住所をどうぞ
Ｕ：神奈川県横浜市
Ｓ：横浜市のどこですか
Ｕ：金沢区六浦
Ｓ：神奈川県横浜市金沢区六浦を行き先にします。よろしいですか。
Ｕ：はい
Ｓ：国道ＲＸ号を通るルートです。交通規制に従い走行してください。

「対話例２：レストランの営業時間問い合わせ」
Ｕ：(発話スイッチ１０７を押下)
Ｕ：施設情報
Ｓ：検索方法をどうぞ
Ｕ：ジャンル選択
Ｓ：ジャンルを選択してください
Ｕ：レストラン
Ｓ：以下のようなレストランがあります
Ｕ：ＡＡレストランの営業時間
Ｓ：ＡＡレストランの営業時間は１０時から２１時です。

<自動入力状態での辞書の変更と認識動作について>
次に、待受け領域判断部１０２の判断に基づく認識辞書１０５における言語辞書の変更処理について説明する。待受け領域判断部１０２では、ＰＯＩ情報抽出部１０１にて抽出されたＰＯＩが現在位置と所定の位置関係を満たす区間内、すなわち地理的領域内において、自動入力状態となる。そしてこの自動入力状態となっている区間において、認識動作制御部１０３は音声認識部１０８に対し、認識処理の実行を命令するが、これと同期して、辞書変更部１０４は、対象となるＰＯＩの情報取得に使用される音声操作用の語彙を次発話候補語彙すなわち優先認識語彙として予測選択し、この語彙が認識されやすくなるよう認識辞書１０５中の言語辞書の内容を変更する。

対象となるＰＯＩは現在位置の変化とともに刻々と変化するため、言語辞書もこれに従い動的に変更される。尚、所定の位置関係を満たすＰＯＩが存在しない場合、すなわち待受け領域判断部が自動入力状態と判断していない期間では、発話スイッチが操作されない限り認識処理は行われず、言語辞書も初期状態が保持される。以上述べた構成としたことにより、発話可能性の高い語彙を認識対象語彙とすることが出来るため、雑音等による誤認識を低減した音声入力機能を提供することが出来る。

図６（ａ）の言語辞書に対して優先認識語彙に基づく変更を加えた例を図７から図９に示す。この例では「Ｘレストラン」及び「Ｙスーパー」が所定の位置関係を満たすＰＯＩとして抽出され、自動入力状態となっている場合を示している。

図７は、図６（ａ）の辞書に対し、優先認識語彙を上位階層に追加した辞書とすることで、該語彙については深い階層構造をたどる必要が無く、少ない発話数で操作を完了することが可能である。図７においては、下の階層にあるＰＯＩ情報（Ｘレストラン、Ｙスーパー）を第１階層に移動させて本目的を達成している。

図８は、図７と同様の動的変更に加え、優先認識語彙を除く全ての語彙を無効化する例を示している。これにより、優先認識語彙以外の語彙は一時的に認識対象から除外されるため、認識性能が向上する。

図９は、図６（ａ）の辞書に対し、優先認識語彙の発生確率・遷移確率にボーナスを与えて、尤度が高くなるように変更した場合を示している。操作完了のための発話回数は図６（ａ）と同等であるが、優先認識語彙は相対的に他の語彙より尤度が高くなるため、認識性能が向上する。
以下に図７及び図８の辞書変更手法を施した場合の対話例を示す。この場合は、自動入力状態になっていることを前提としている。

「上記対話例２の場合：レストランの営業時間問い合わせ」
Ｓ：(自動入力状態に移行 (画面や音による報知))
Ｕ：Ｘレストランの営業時間
Ｓ：Ｘレストランの営業時間は１０時から２１時です。
上記の対話例から、自動入力状態では、発話スイッチを使用せずに発話が可能なことに加え、少ない発話数で操作を完了できることがわかる。尚、対話例にも記したように、自動入力状態の開始時刻または終了時刻の何れか、または両方のタイミングにおいて、画面表示や報知音（ガイダンス音）出力等を行い、使用者に対して自動入力状態であることを報知する手段を備えることが望ましい。あるいは、自動入力状態を保持している期間中表示を継続してもよい。この構成により、使用者に対し、発話スイッチを用いない音声入力の好適なタイミングを教示することが出来、親和性の高い音声操作機能を提供することが出来る。

図１０に画面表示による報知の例を示す。図１０（ａ）は通常入力状態の画面であり、ＰＯＩは捕捉されていない。図１０（ａ）の状態から暫く移動した状態が図１０（ｂ）である。所定範囲内にＰＯＩ（Ａ）＝「○×レストラン」が捕捉され、該ＰＯＩアイコンの点滅、及び補助情報の付与（吹き出しの表示、画面下部のメッセージ表示等）がなされている。また、マイクアイコンの表示と、入力可能な語彙（ボイスコマンド）も表示されている。この時、次に補足される予定のＰＯＩを図１０（ｂ）中のＰＯＩ（Ｂ）のように表示しても良い。こうした報知により、使用者は現在○×レストランの情報に関する語彙について入力可能であることを容易に知ることができる。

<基本的な動作例（音声入力有効化と辞書変更フロー）>
図１１のフローチャートにより、本実施の形態１の主要な動作を説明する。
ステップＳ１０１：図２のセンサ２０６を介し演算装置２０４において自車現在位置Ｐ_ｎｏｗを取得する。
ステップＳ１０２：おいて自車現在位置Ｐ_ｎｏｗの情報を基にナビゲーション部１１０に記憶されたＰＯＩ情報を参照する。
ステップＳ１０３：現在位置Ｐ_ｎｏｗから所定範囲Ａｒｅａ(ＰＯＩ_ｔｙｐｅ)に特定のＰＯＩ(ＰＯＩ_Ｘ)が存在するかを検索する。この検索は現在位置Ｐ_ｎｏｗと特定のＰＯＩ(ＰＯＩ_Ｘ)との距離が所定範囲Ａｒｅａ(ＰＯＩ_ｔｙｐｅ)に存在するか否かを求めることになる。本実施の形態１では検索範囲をＰＯＩの種別(ＰＯＩ_ｔｙｐｅ)毎に異なる値Ａｒｅａ(ＰＯＩ_ｔｙｐｅ)として設定している。
ここで、ＰＯＩ_Ｘが検出されない場合（Ｓ１０３でＮＯ）はステップＳ１０４へ進み、ＰＯＩ_Ｘが検出される場合（Ｓ１０３でＹＥＳ）はステップＳ１０７へ進む。
ステップＳ１０４：発話スイッチが押下された場合（Ｓ１０４でＹＥＳ）はステップＳ１０５へ進み、押下されない場合はステップＳ１０１へ戻る。
ステップＳ１０５：発話スイッチが押下された状態であるから、音声認識部(図１：１０５)による音声認識処理可能となる。この場合、言語辞書に変更を受けていない「通常入力状態」での認識動作となる。
ステップＳ１０６：上記の認識結果に基づき、操作命令（コマンド）発行部(図１：１０９)によって、操作命令が発行される。
ステップＳ１０７：上記検索の結果、所定範囲内に見つかったＰＯＩに基づき、該ＰＯＩの情報取得に関連する語彙が認識されやすくなるよう辞書変更部(図1：１０４)によって認識辞書１０５の言語辞書を変更する。
ステップＳ１０８：音入力部(図１：１０３)による音声入力を有効化し、音声認識部(図１：１０８)への入力を開始する。
ステップＳ１０９：タイマを０に初期化し、ステップ１０８で音声入力を有効化した時刻からの経過カウントを開始する。
ステップＳ１１０：発話スイッチの押下が検出される場合（Ｓ１１０：ＹＥＳ）、すなわち自動的に音声入力が有効になっている状態で更に発話スイッチが押された場合は、ステップＳ１１１へ進む。発話スイッチが押下されない場合は（Ｓ１１０：ＮＯ）ステップＳ１１２へ進む。
ステップＳ１１１：言語辞書の変更を解除して元の通常入力状態の辞書構成に戻し、音声認識処理（Ｓ１０５）に移る。
ステップＳ１１２：音声入力の有無を音声認識部１０８で検出する。検出方法としては、入力信号のパワーを監視する等の方法を取ることができる。
音声入力が検出される場合（Ｓ１１２：ＹＥＳ）はステップＳ１１４へ進み、音声入力が検出されない場合（Ｓ１１２：ＮＯ）はステップＳ１１３へ進む。
ステップＳ１１３：タイマ時刻すなわち音声入力を有効化してからの経過時間と期間変数βを比較し、タイマ時刻＜βならばステップＳ１１０へ戻り、タイマ時刻≧βならばステップＳ１１６へ進む。ここで期間変数βは、機器の変化を検出してから何秒間にわたって、音声入力を有効化するかを決定する変数であり、予め所定の値(例えば５秒間等)に決定する。あるいは使用者によって調整可能としても良い。更には、自動入力状態下での使用履歴から、使用者の発話タイミングを学習し、この傾向に適合するように調整するとしてもよい。
ステップＳ１１４：上記ステップＳ１１２：ＹＥＳの出力により音声認識処理を行う。この場合、言語辞書が機器動作変化に基づく変更を受けており、自動入力状態での認識動作となる。
ステップＳ１１５：Ｓ１１４出力の認識結果に基づき、操作命令（コマンド）発行部(図１：１０７)によって、対象ＰＯＩの情報取得に関する操作命令が発行される。
ステップＳ１１６：上記操作コマンドが発行されたところで一連の認識処理を終了させるため音声入力を無効化し、音声認識部への信号の入力を停止する。
ステップＳ１１７：さらに言語辞書の変更を解除し、通常入力状態の辞書へ戻す。

この一連の処理により、通常入力状態では発話スイッチを押した後、入力された音声を認識するよう機能する一方、所定範囲内に特定ＰＯＩが検出された場合に、所定期間(β)において自動入力状態となり、発話スイッチを押さずに操作目的となる機器の操作音声の入力を行うことが可能となる。

上記例では、所定時間をタイマで計時して自動入力状態とする場合について述べたが、図４、図５で示したような、すなわち自車（使用者）と特定ＰＯＩが所定範囲内に位置する期間について継続的に自動入力状態とする場合には、上記フローチャートのステップＳ１１３を
If（Ｄｉｓｔａｎｎｃｅ（Ｐ_ｎｏｗ，ＰＯＩ_Ｘ）> Ａｒｅａ(ＰＯＩ_type))
とすればよい。

<熟練者と未熟練者による使い方の違い>
また、上記フロー図では、自動入力状態下において発話スイッチが押された場合は前記のように通常入力状態に移行するため、この場合は認識動作制御部１０３において自動入力による認識動作を解除し、通常入力状態へ切り替えたと見做される。これにより辞書の変更を解除する（言語辞書を通常状態の辞書に戻す）構成とした。これは、本実施形態の動作を理解している使用者(熟練者)に対する対応である。すなわち、自動入力状態で敢えて発話スイッチを押していることから、使用者が通常入力時の操作を行う意思があるとみなしている。従って、周辺ＰＯＩに関する音声操作以外を行う意思があるとみなして、該ＰＯＩに関連する語彙以外が有効となるように言語辞書を変更するようにしても良い。

一方、非熟練者、すなわち、自動入力が可能な機能を知らない使用者では、自動入力状態において発話ボタンを押してしまう可能性がある。こうした使用者への対応として、例えば「通常入力状態」での認識処理、命令発行を行い、この時の認識結果が現在対象となっている周辺ＰＯＩに関する情報問い合わせの操作であった場合に、事後的に音声や映像の出力によって、本発明の「自動入力状態」について教示することが望ましい。これによって使用者は次回から該機器の動作変化に伴う入力をより円滑に行うことができる。

（実施の形態２）
実施の形態１では、ナビゲーション部１１０に記憶されたＰＯＩ情報を対象とする場合について述べた。本実施の形態２では、これらＰＯＩ情報のうち、使用者の意図に沿ったＰＯＩを絞り込んで抽出し、自動入力状態を提供する方法について説明する。本実施の形態２では、使用者の意図を検出するために、使用者による目的とする目的とする施設のジャンル、すなわちＰＯＩの種類の選択操作、使用者の嗜好に関する情報の入力、使用者の過去の目的地その他設定に関する操作履歴等を利用する。

本実施の形態２の構成を図１２のブロック図に示す。基本的な構成は実施の形態１(図１)と共通であり、更に利用者嗜好記憶部２１１及び情報入力部２１２を加えた構成となっている。以下では実施の形態１との相違部分について説明する。

使用者の嗜好記憶部２１１は図２の演算装置２０４、記憶装置２０５から構成され、使用者が注目するＰＯＩ、興味の無いＰＯＩについての情報をＰＯＩ情報抽出部１０１へ伝送する機能を持つ。以下、具体的な嗜好分析方法について説明する。
・使用者に直接興味のあるＰＯＩに含まれるジャンルの入力を促す
すなわち複数のＰＯＩジャンルを提示し、興味の有無を入力してもらい、その結果興味の強い対象ジャンルとそうでないジャンルとを分類する。この結果として、例えば遊園地等のアミューズメント施設に興味があり、寺社仏閣等への興味が薄いという事前情報が抽出される。この結果、例えば図1３に示す地域を走行している場合では、寺社１３０７は抽出対象ＰＯＩとならず、遊園地１３０６の所定距離内に進入した場合のみ自動入力状態とすることができる。
・過去の操作履歴を分析する
すなわち過去に目的地としたＰＯＩ、過去に情報を問い合わせたＰＯＩなどの操作（設定）履歴情報を記憶し、この結果、所定の頻度を超えて操作されたＰＯＩジャンルを自動入力対象とする。更には同一ジャンル内でも特に操作頻度の高いＰＯＩを自動入力対象としてもよい。また、初期値として全ＰＯＩを自動入力対象とし、操作頻度の低いＰＯＩから順に対象から除外するようにしても良い。本構成によるＰＯＩ抽出例を図１４に示す。この地域において、使用者の過去３ヶ月の操作履歴が以下の通りだとする。
レストラン１３０１：５回
スーパー１３０２：４回
レストラン１３０３：０回
レストラン１３０４：３回
スーパー１３０５：０回
この履歴を該履歴から過去３ヶ月の操作頻度が、１回以上のレストラン１３０１、スーパー１３０２、レストラン１３０４が抽出ＰＯＩとしてＰＯＩ情報抽出部１０１へ伝送される。そして結果的に、該３つのＰＯＩを対象とし、現在位置が所定距離以内となった機関について、自動入力状態となる。
尚、上記操作履歴の他の、例えばクレジットカード利用履歴やインターネットのアクセス履歴などの外部情報を用い、これに基づき興味のあるＰＯＩジャンルを抽出するようにしてもよい。

情報入力部２１２は図１２の演算装置２０４、記憶装置２０５から構成され、使用者からの入力により直接注目ＰＯＩジャンルの限定を受け付け、該ＰＯＩジャンル情報をＰＯＩ情報抽出部へ伝送する機能を持つ。すなわち、レストランに対して自動入力状態とする「レストラン自動待受けモード」や、交差点において自動入力状態とする「交差点方面案内待受けモード」等を予め用意し、使用者の操作により該モードの有効無効を決定する。この機能により、注目したいジャンルのＰＯＩが接近する度に自動入力状態となる。

図１５は、図１３と同じ地域を走行中に、上記「レストラン自動待受けモード」を有効にした場合の自動入力状態となる領域を示している。すなわちこの地域を走行中には、レストラン１３０１及びレストラン１３０３及びレストラン１３０４の所定距離内において、自動入力機能によって情報を問い合わせが可能になる。

以上述べたように、図１２に示した利用者嗜好記憶部２１１および情報入力部２１２を介して取り込まれた情報はＰＯＩ情報抽出部１０１において、
・予め設定された施設のジャンルに関する情報
・予め設定された使用者の嗜好に関する情報
・目的地もしくは経由地の設定履歴情報
・ＰＯＩに関する情報取得操作を行った情報取得履歴情報
の何れかに基づき抽出するＰＯＩを決定する。この構成とすることにより、使用者の注目するＰＯＩを適切に抽出することが出来、このＰＯＩに対するスイッチを用いない音声操作機能を提供することが出来る。

（実施の形態３）
本実施の形態３では、使用者の注目するＰＯＩを「運転履歴」から推定する方法をとる。本実施の形態３の構成を図１６のブロック図に示す。基本的な構成は実施の形態１（図１）と共通であり、更に運転履歴記録・分析部を加えた構成となっている。以下では第一実施形形態との相違部分について説明する。

運転履歴記録分析部３１１は図２の演算装置２０４、記憶装置２０５から構成され、使用者の運転履歴(日時と走行位置)を随時記録し、これを基に、例えば、
使用ルート（出発地、使用道路、到着地）
走行時間帯、
曜日(平日、休日等)、
の「走行状態パラメータ」に基づくＰＯＩへの立ち寄り回数を蓄積する。立ち寄りＰＯＩは例えば運転履歴上の所定時間以上停車した位置から最も近いＰＯＩと定義する。従って、各ＰＯＩに対して、立ち寄った回数と、該立ち寄り時の走行状態パラメータが「立ち寄り履歴分析データ」として記録される。このデータと、現在の運転における「走行状態パラメータ」とを比較することで、類似度の高くなるＰＯＩが存在するかを検索する。この結果、現在の運転から経由地の可能性の高いＰＯＩを抽出することができる。

以下、図１７を用いて上記処理の具体例を説明する。
図１７は、ある使用者の会社から自宅までの運転履歴を示している。自宅から会社の間には過去に立ち寄ったＰＯＩとしてＡ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ，Ｇが存在している。帰宅ルート履歴として、１７０２(実線ルート)、１７０３(破線ルート)、１７０４(点線ルート)の３種類が蓄積されており、各ＰＯＩは立ち寄り履歴分析データ１７０１を持ち、ルート種別、曜日、時間帯毎の立ち寄り回数を記憶している。ここから、各ルートにおける「立ち寄り可能性」を推定する。例えば、
ルート１７０２を利用した場合にＰＯＩ（Ｅ）に立ち寄る可能性が高い。
ルート１７０３を利用した場合にＰＯＩ（Ｂ）に立ち寄る可能性が高い。
ルート１７０４を利用した場合にＰＯＩ（Ａ）及びＰＯＩ（Ｇ）に立ち寄る可能性が高い、と分析される。

この結果を用いて、現在の状態から立ち寄り可能性の高いＰＯＩを推定する。例えば、使用者が１７０９の方向へ移動し始めた場合、ルート１７０２もしくはルート１７０３を利用する可能性が高いと判断して、ＰＯＩ情報抽出部１０１に対し、ＰＯＩ（Ｅ）及びＰＯＩ(Ｂ)を抽出対象とするよう命令する。また、１７１０の位置にて直進した場合にはＰＯＩ（Ｂ）への立ち寄り可能性が低くなったと判断し、抽出対象から除外し、ＰＯＩ（Ｅ）のみを抽出対象とする。

待受け領域判断部１０２は現在位置が領域１７０６にいる期間に渡り、ＰＯＩ（Ｅ）に関する自動入力状態とする。１７１０の位置にて南に進路を変更した場合、ＰＯＩ情報抽出部１０１はＰＯＩ（Ｅ）を抽出対象から除外し、ＰＯＩ（Ｂ）のみを対象とする。そして待受け領域判断部１０２は領域１７０５に存在する期間にわたりＰＯＩ（Ｂ）に関する自動入力状態とする。
同様にして、使用者が１７１０の方向へ移動を開始した場合には、ＰＯＩ（Ａ）、ＰＯＩ（Ｇ）を対象とし、領域１７０７及び１７０８において自動入力状態となる。

以上の処理により、使用者の過去の運転履歴の分析から、経由地となる可能性の高いＰＯＩを予測し、これにより得られたＰＯＩに関する情報をＰＯＩ情報抽出部１０１により抽出する。この構成により、使用者が立ち寄るい経由地となる可能性の高いＰＯＩを適切に抽出することが出来、このＰＯＩに対するスイッチを用いない音声操作機能を提供することが出来る。

本発明による基本構成である実施の形態１の処理系統図。本発明実施の形態１のハードウエア構成図。自動入力状態となる領域を示す地図。自動入力状態となる領域を示す他の地図。走行車線上に２つのＰＯＩが存在する場合の、自動入力状態の設定法を示す領域図で、（ａ）進行方向の情報を使用しない場合、（ｂ）通過したＰＯＩの自動入力状態を解除する場合、（ｃ）路車間通信機器を対象ＰＯＩとした場合の自動入力状態となる範囲を示す地図。：言語辞書の基本構成図。：言語辞書の動的変更法を示す構成図。：言語辞書の他の動的変更法を示す構成図。：言語辞書の更に他の動的変更法を示す構成図。：自動入力状態での報知画面の表示図。：本発明の基本動作を示すフロー図。：実施の形態２の動作を説明するフロー図。：実施の形態２における利用者嗜好によるＰＯＩ抽出法説明の地図。：実施の形態２における利用者操作履歴利用によるＰＯＩ抽出法説明の地図。：実施の形態２における情報入力部の入力結果に基づくＰＯＩ抽出法説明の地図。：実施の形態３におけるＰＯＩ抽出精度向上法説明のフロー図。：実施の形態３の運転履歴分析結果に基づくＰＯＩ抽出法説明の地図。

Claims

入力された音声情報を認識する音声入力装置であって、
音声信号を取得する音入力手段と、
該音入力手段によって取得された音声を認識し、かつ対応する情報信号に変換する音声認識手段と、
指定した目的地または経由地であるＰＯＩまでの経路を誘導する経路誘導機能を内蔵するナビゲーション手段と、
使用者の現在位置周辺に存在する前記ＰＯＩの関連情報から、特定のＰＯＩに関する情報を抽出するＰＯＩ情報抽出手段と、
使用者の音声入力の待受けが可能な地理的領域にあるか否かを判断し、前記ＰＯＩ情報抽出手段が抽出した前記ＰＯＩ位置と、前記現在位置との地理的関係が所定の関係を満たす区間内における任意の位置において、音声入力待受け可能と判断する待受け領域判断手段と、
使用者の現在位置が、前記待受け領域判断手段によって音声入力可能と判断される所定の地理的領域内に存在する場合には、前記取得された音声信号に対して認識処理実行の命令を前記音声認識手段に出す認識動作制御手段と、を備え、
前記ＰＯＩ情報抽出手段は、
前記使用者の、走行位置情報を含む過去の運転履歴を記録する手段と、
前記過去の運転履歴に基づき各ＰＯＩへの立ち寄り回数を使用ルート毎に計測しこれを記録する手段と、
前記使用者の移動方向から使用者が利用しようとしているルートを予測する手段と、
予測したルートに対応する前記使用ルートを用いたときの前記ＰＯＩへの立ち寄り回数をもとに経由地となる可能性の高いＰＯＩを予測する手段と、を有し、
前記予測したＰＯＩを前記特定のＰＯＩとして当該ＰＯＩに関する情報を抽出することを特徴とする音声入力装置。
入力された音声情報を認識する音声入力装置であって、
音声信号を取得する音入力手段と、
該音入力手段によって取得された音声を情報信号に変換する音声認識手段と、
指定した目的地または経由地であるＰＯＩまでの経路を誘導する経路誘導機能を内蔵するナビゲーション手段と、
使用者の現在位置周辺に存在する前記ＰＯＩの関連情報から、特定のＰＯＩに関する情報を抽出するＰＯＩ情報抽出手段と、
使用者の音声入力を待受け可能な地理的領域を判断し、前記ＰＯＩ情報抽出手段が抽出した前記ＰＯＩ位置と、前記現在位置との地理的関係が所定の関係を満たす区間内における任意の位置において、音声入力待受け可能と判断する待受け領域判断手段と、
使用者の現在位置が、前記待受け領域判断手段によって判断される所定の地理的領域内に存在する場合には、取得された音声信号に対して認識処理を行う認識動作制御手段と、
使用者によってスイッチが押下された時刻から所定の期間内において取得された音声信号に対して認識処理を行う発話スイッチ手段とを備え、
前記認識動作制御手段は、前記発話スイッチ手段が押下された時刻から所定の期間以外の期間であっても、使用者の現在位置が前記待受け領域判断手段によって判断される所定の地理的領域内に存在する場合には、取得された音声信号に対して認識処理を行い、
前記ＰＯＩ情報抽出手段は、
前記使用者の、走行位置情報を含む過去の運転履歴を記録する手段と、
前記過去の運転履歴に基づき各ＰＯＩへの立ち寄り回数を使用ルート毎に計測しこれを記録する手段と、
前記使用者の移動方向から使用者が利用しようとしているルートを予測する手段と、
予測したルートに対応する前記使用ルートを用いたときの前記ＰＯＩへの立ち寄り回数をもとに経由地となる可能性の高いＰＯＩを予測する手段と、を有し、
前記予測したＰＯＩを前記特定のＰＯＩとして当該ＰＯＩに関する情報を抽出することを特徴とする音声入力装置。
入力された音声情報を認識する音声入力装置であって、
音声信号を取得する音入力手段と、
該音入力手段によって取得された音声を情報信号に変換する音声認識手段と、
指定した目的地または経由地であるＰＯＩまでの経路を誘導する経路誘導機能を内蔵するナビゲーション手段と、
使用者の現在位置周辺に存在する前記ＰＯＩの関連情報から、特定のＰＯＩに関する情報を抽出するＰＯＩ情報抽出手段と、
該音声認識手段において前記音声信号と比較し評価するための言語辞書を含む認識辞書と、
使用者の音声入力を待受け可能な地理的領域を判断し、前記ＰＯＩ情報抽出手段が抽出した前記ＰＯＩ位置と、前記現在位置との地理的関係が所定の関係を満たす区間内における任意の位置において、音声入力待受け可能と判断する待受け領域判断手段と、
使用者の現在位置が前記待受け領域判断手段によって判断される所定の地理的領域内に存在する場合には、発話される可能性の高い語彙を該地理的領域の関連情報に基づいて予測し、該語彙に基づき前記言語辞書を変更する辞書変更手段と、を備え、
前記ＰＯＩ情報抽出手段は、
前記使用者の、走行位置情報を含む過去の運転履歴を記録する手段と、
前記過去の運転履歴に基づき各ＰＯＩへの立ち寄り回数を使用ルート毎に計測しこれを記録する手段と、
前記使用者の移動方向から使用者が利用しようとしているルートを予測する手段と、
予測したルートに対応する前記使用ルートを用いたときの前記ＰＯＩへの立ち寄り回数をもとに経由地となる可能性の高いＰＯＩを予測する手段と、を有し、
前記予測したＰＯＩを前記特定のＰＯＩとして当該ＰＯＩに関する情報を抽出することを特徴とする音声入力装置。
請求項３に記載の音声入力装置であって、
前記辞書変更手段は、
前記ＰＯＩ情報抽出手段の抽出したＰＯＩ位置と前記現在位置との地理的関係が所定の関係を満たす区間内の任意の位置において、該ＰＯＩの情報取得に関連する音声操作用の語彙を次発話候補語彙と予測し、該次発話候補語彙に基づいて言語辞書を変更することを特徴とする音声入力装置。
請求項３または請求項４に記載の音声入力装置であって、
前記ＰＯＩ情報抽出手段は、
各種施設、走行路上の分岐・合流地点、情報発信地点、道路状況変化地点、気候変化予測地点、情報取得可能地点の少なくとも一つに関する情報のいずれかに基づき、抽出すべきＰＯＩ情報を決定することを特徴とする音声入力装置。
請求項３乃至請求項５の何れかに記載の音声入力装置であって、
前記ＰＯＩ情報抽出手段は、
前記ナビゲーション手段に含まれる経路誘導手段に設定された目的地・経由地に関する情報に基づき抽出するＰＯＩ情報を決定することを特徴とする音声入力装置。
請求項３乃至請求項６の何れかに記載の音声入力装置であって、
前記ＰＯＩ情報抽出手段は、
予め設定された施設のジャンルに関する情報、
あるいは予め設定された使用者の嗜好に関する情報、
あるいは目的地もしくは経由地の設定履歴情報、
あるいはＰＯＩに関する情報取得操作を行った情報取得履歴情報、の少なくとも一つに基づき抽出するＰＯＩ情報を決定することを特徴とする音声入力装置。
入力された音声情報を認識する音声入力方法であって、
音声信号を音入力手段により取得し、
該音入力手段によって取得された音声を音声認識手段により認識し、かつ対応する情報信号に変換し、
指定した目的地または経由地であるＰＯＩまでの経路を誘導する経路誘導機能をナビゲーション手段に内蔵し、
使用者の現在位置周辺に存在する前記ＰＯＩの関連情報から、特定のＰＯＩに関する情報をＰＯＩ情報抽出手段により抽出し、
待受け領域判断手段により、使用者の音声入力の待受けが可能な地理的領域にあるか否かを判断し、前記ＰＯＩ情報抽出手段が抽出した前記ＰＯＩ位置と、前記現在位置との地理的関係が所定の関係を満たす区間内における任意の位置において、音声入力待受け可能と判断し、
使用者の現在位置が、前記待受け領域判断手段によって音声入力可能と判断される所定の地理的領域内に存在する場合には、前記取得された音声信号に対して認識動作制御手段が前記音声認識手段に認識処理実行の命令を出し、
前記ＰＯＩ情報抽出手段は、前記使用者の、走行位置情報を含む過去の運転履歴に基づき各ＰＯＩへの立ち寄り回数を使用ルート毎に計測し、
使用者の移動方向から予測した、使用者が利用しようとしているルートに対応する前記使用ルートを用いたときの前記ＰＯＩへの立ち寄り回数をもとに経由地となる可能性の高いＰＯＩを予測し、予測したＰＯＩを前記特定のＰＯＩとして当該ＰＯＩに関する情報を抽出することを特徴とする音声入力方法。