JP2003029778A

JP2003029778A - ナビゲーションシステムにおける音声対話インターフェース処理方法

Info

Publication number: JP2003029778A
Application number: JP2001215962A
Authority: JP
Inventors: Masahiro Kamiya; 昌宏神谷
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 2001-07-16
Filing date: 2001-07-16
Publication date: 2003-01-31

Abstract

(57)【要約】【課題】ユーザとの間で音声対話を行いながら、対話
の流れ（状況）に応じてナビゲーション機能を実行させ
ることを可能とする。【解決手段】表示部（１９）と、マイクロフォン（１
５）から入力された音声を認識して単語単位の認識結果
を出力する音声認識処理部（１４）と、認識結果に応じ
て対話状態を判断しながらユーザとの対話制御を行う音
声対話制御部（１３）と、音声案内を出力する音声合成
処理部（１６）と、ナビゲーション機能を実行するため
の案内処理部（２０）と、ユーザインターフェース管理
部（１２）とを有し、対話状態に応じて音声案内用文書
及び画面表示用文書を決定し、音声合成処理部から音声
案内用文書による音声案内出力を行い、表示部に画面表
示用文書を表示し、認識結果及び対話状態応じてナビゲ
ーション機能を実行させる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声対話を行うこ
とができる車載用のナビゲーションシステムに関する。

【０００２】

【従来の技術】音声操作機能を備えた車載用のナビゲー
ションシステムが存在している。従来の音声操作機能付
きナビゲーションシステムでは、ユーザが音声入力（例
えば目的地の入力）を行うと、その入力を認識し（目的
地の認識）、認識を完了すると一旦音声入力操作を終了
し、その後認識された入力に応じてナビゲーション機能
（認識された目的地までのルート案内等）を実行してい
た。

【０００３】したがって、従来のナビゲーションシステ
ムがユーザによる音声入力を誤って認識した場合や、ユ
ーザが誤って音声入力を行った場合には、最初から音声
入力操作をやり直す必要があった。例えば、ユーザが目
的地の音声入力を行ったにも拘わらず、希望した目的地
とは異なった目的地が認識され、誤った認識に基づいて
ルート案内がなされた場合には、再度目的地の音声入力
からやり直す必要があった。

【０００４】実際のナビゲーション機能の実行には、様
々なパラメータ、例えば目的地の県名・市名・町名、目
的地の住所、目的地までの経由地、目的地までの行き方
（有料道路の利用等）、ルート案内の方法、地図の縮
尺、及び地図の表示方法等の設定が必要である。しかし
ながら、ナビゲーションシステムが誤ってパラメータの
認識をしてしまい、誤ったナビゲーション機能が実行さ
れた場合には、多くのパラメータの設定を最初からやり
直す必要があり、ユーザには大変な手間であった。

【０００５】また、ナビゲーションシステムは、ナビゲ
ーション機能を実行するために必要な情報を、音声対話
によって得るために１通りの受け答えしかすることがで
きなかった。したがって、ユーザの発話の自由度が低
く、ユーザが希望するナビゲーション機能を設定するた
めに多くの時間を必要としていた。

【０００６】

【発明が解決しようとする課題】そこで本発明は、ユー
ザとの間で音声対話を行いながら、対話の流れ（状況）
に応じてナビゲーション機能を実行させることを可能と
するナビゲーションシステムにおける音声対話インター
フェース処理方法を提供することを目的とするものであ
る。

【０００７】また、本発明は、音声対話におけるユーザ
の発話の自由度を高め、対話に状態に応じたきめ細やか
な応答や案内を可能とするナビゲーションシステムにお
ける音声対話インターフェース処理方法を提供すること
を目的とするものである。

【０００８】

【課題を解決するための手段】上記課題を解決するため
に、本発明に係るナビゲーションシステムにおける音声
対話インターフェース処理方法は、表示部と、マイクロ
フォンから入力された音声を認識して単語単位の認識結
果を出力する音声認識処理部と、認識結果に応じて対話
状態を判断しながらユーザとの対話制御を行う音声対話
制御部と、音声案内を出力する音声合成処理部と、ナビ
ゲーション機能を実行するための案内処理部と、ユーザ
インターフェース管理部とを有し、ユーザインターフェ
ース管理部は、対話状態応じて音声案内用文書及び画面
表示用文書を決定し、音声合成処理部から音声案内用文
書による音声案内出力を行い、表示部に画面表示用文書
を表示し、認識結果及び対話状態に応じて、案内処理部
によるナビゲーション機能を実行させることを特徴とす
る。ユーザインターフェース管理部が、対話状態に応じ
て、音声案内用文書及び画面表示用文書を決定するよう
に構成したものである。

【０００９】さらに、ユーザインターフェース管理部
は、対話状態と文書とを対応付けたテーブルを用いて、
音声案内用文書又は画面表示用文書を決定することが好
ましい。対話状態と文書を対応付けた遷移テーブルを用
いて音声案内用文書又は画面表示用文書を決定するよう
に構成したものである。

【００１０】さらに、ユーザインターフェース管理部
は、テーブルが同一の対話状態に対して複数の文書が対
応している場合には、認識結果の単語数に応じて、音声
案内用文書又は画面表示用文書を決定することが好まし
い。

【００１１】さらに、ユーザインターフェース管理部
は、テーブルが同一の対話状態に対して複数の文書が対
応している場合には、認識結果の単語属性に応じて、音
声案内用文書又は画面表示用文書を決定することが好ま
しい。

【００１２】さらに、ユーザインターフェース管理部
は、テーブルが同一の対話状態に対して複数の文書が対
応している場合には、認識結果の単語認識エラーに応じ
て、音声案内用文書又は画面表示用文書を決定すること
が好ましい。

【００１３】さらに、ユーザインターフェース管理部
は、テーブルが同一の対話状態に対して複数の文書が対
応している場合には、認識結果の単語認識エラーの回数
に応じて、音声案内用文書又は画面表示用文書を決定す
ることが好ましい。

【００１４】さらに、ユーザインターフェース管理部
は、認識結果の単語属性に応じて、予め定められた記憶
領域に認識結果を格納することが好ましい。予め定めら
れた記憶領域、即ちスロットに各種認識結果を格納する
ように構成したものである。

【００１５】さらに、ユーザインターフェース管理部
は、認識結果の単語属性が案内処理部によるナビゲーシ
ョン機能の実行に不必要な場合は、認識結果を記憶領域
に格納しないことが好ましい。

【００１６】さらに、ユーザインターフェース管理部
は、対話制御部による対話終了後に、記憶領域をチェッ
クし、認識結果が格納されている記憶領域に応じて、案
内処理部によるナビゲーション機能を実行させることが
好ましい。

【００１７】さらに、ユーザインターフェース管理部
は、案内処理部によるナビゲーション機能の実行のため
に複数の認識結果が必要な場合には、複数の認識結果を
格納するために連続した複数の記憶領域を設定すること
が好ましい。

【００１８】さらに、ユーザインターフェース管理部
は、対話制御部による対話終了後に、記憶領域をチェッ
クし、連続した複数の記憶領域の先頭に認識結果が格納
されていなければ、その後の記憶領域にも認識結果が格
納されていないものと判断することが好ましい。

【００１９】さらに、ナビゲーションシステムは、案内
処理部によるナビゲーション機能の実行のためのデータ
ベースを更に有し、ユーザインターフェース管理部は、
認識結果をデータベースの表記に変換することが好まし
い。

【００２０】また、上記課題を解決するために、本発明
に係るナビゲーションシステムにおける音声対話インタ
ーフェース処理方法は、表示部と、マイクロフォンから
入力された音声を認識して単語単位の認識結果を出力す
る音声認識処理部と、認識結果に応じて対話状態を判断
しながらユーザとの対話制御を行う音声対話制御部と、
音声案内を出力する音声合成処理部と、ナビゲーション
機能を実行するための案内処理部と、ユーザインターフ
ェース管理部とを有するナビゲーションシステムにおい
て、音声対話制御部は、対話状態応じて音声案内用文書
及び画面表示用文書を決定し、ユーザインターフェース
管理部は、音声合成処理部から音声案内用文書による音
声案内出力を行い、表示部に画面表示用文書を表示し、
認識結果及び対話状態応じて、案内処理部によるナビゲ
ーション機能を実行させることを特徴とする。ユーザイ
ンターフェース管理部ではなく、音声対話制御部が、対
話状態に応じて、音声案内用文書及び画面表示用文書を
決定するように構成したものである。

【００２１】

【発明の実施の形態】図１に、本発明に係るナビゲーシ
ョンシステム１０の基本構成を示す。図１に示すナビゲ
ーションシステム１０は、ナビゲーションシステム１０
全体を制御管理するためのシステム管理部１１、ユーザ
との音声対話を含めた全ての対応を管理するユーザイン
ターフェース管理部１２、ユーザとの音声対話の制御行
う対話制御部１３、運転席付近に設けられたマイクロフ
ォン１５を介して入力されるユーザの音声から音声の内
容を認識するための音声認識処理部１４、音声を合成し
て運転席付近に設けられているスピーカ１７から出力す
るための音声合成処理部１６、地図情報及びルート案内
情報等をディスプレイ１９に表示するための表示制御部
１８、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇ
Ｓｙｓｔｅｍ）アンテナ２２及び車速センサ２３から
所定のデータを受信してナビゲーションシステム１０が
搭載される車両の状態を検出する車両状態検出部２１、
車両状態検出部２１からのデータを利用してルート案内
等のナビゲーション機能を実行するための案内処理部２
０、地図データＤＢ２６に記憶された地図データの検
索、縮尺及び表示方法等の管理を行うための地図情報管
理部２５、及び地図情報管理部２５を用いてルートの探
索等を行うルート探索部２４等を有している。

【００２２】図１において、システム管理部１１、ユー
ザインターフェース管理部１２、対話制御部１３、音声
認識処理部１４、音声合成処理部１６、表示制御部１
８、案内処理部２０、車両状態検出部２１、ルート探索
部２４、及び地図情報管理部２５は、ＣＰＵ及び各種メ
モリ等から構成される別個の処理回路によってそれぞれ
実現されても良いし、ＣＰＵ及び各種メモリを有するコ
ンピュータ上で各処理部の演算処理のためのプログラム
を順次実行させることによって実現するようにしても良
い。

【００２３】地図データＤＢ２６には、少なくとも日本
全国をカバーし、メッシュ状に分割された複数の地図ブ
ロックからなる地図情報が記憶され、さらに同一地域に
対して縮尺の異なる複数の地図ブロックが記憶されてい
るものとする。また、地図データＤＢ２６は、ＣＤ−Ｒ
ＯＭ又はＤＶＤ−ＲＯＭ等の記憶媒体及び記憶媒体から
データを読み出すためのＣＤ−ＲＯＭドライブ又はＤＶ
Ｄ−ＲＯＭドライブ等から構成されているものとする。

【００２４】ナビゲーションシステム１０は、ユーザと
の音声対話を通じて、ユーザの発話の中から目的地等の
情報を認識し、認識結果に基づいて、地図情報やルート
情報をディスプレイ１９上に表示しながら、ルート案内
等のナビゲーション機能を実行する。

【００２５】次に、図２を用いて、ユーザインターフェ
ース管理部１２において音声対話を開始してからルート
案内を開始するまでの手順について説明する。

【００２６】最初に、ナビゲーションシステム１０の電
源ＯＮ又は開始操作等によって音声対話を開始する（ス
テップ２０１）。

【００２７】次に、マイクロフォン１５から入力される
ユーザの音声を音声認識部１４が単語単位で認識し、対
話制御部１３は音声認識処理部１４の認識結果に基づい
て対話状態を決定する。ユーザインターフェース管理部
１２は、対話状態及び認識結果を受信する（ステップ２
０２）。対話状態及び認識結果の内容については後述す
る。

【００２８】次に、ユーザインターフェース管理部１２
は、ユーザとの対話が終了したか否かを確認し（ステッ
プ２０３）、対話が終了した場合にはステップ２０９
へ、対話が終了していない場合にはステップ２０４へ進
む。

【００２９】ステップ２０４では、ユーザインターフェ
ース管理部１２は、予め定められた記憶領域（以下「ス
ロット」と言う）に、ステップ２０２で受信した認識結
果を格納する。スロットの構成及び格納方法については
後述する。

【００３０】次に、ユーザインターフェース管理部１２
は、対話状態等に基づいて、音声対話用文書を決定し
（ステップ２０５）、決定した文書内容の音声出力を音
声合成処理部１６に指示する（ステップ２０６）。指示
を受けた音声合成処理部１６は、指示通りの文書を合成
し、スピーカ１７から出力することとなる。音声対話用
文書の具体例等につていは後述する。

【００３１】次に、ユーザインターフェース管理部１２
は、対話状態等に基づいて、画面表示用文書を決定し
（ステップ２０７）、決定した文書内容の表示を表示制
御部１８に指示する（ステップ２０８）。指示を受けた
表示制御部１８は、表示制御部１８は、指示通りの文書
のデータを対応するメモリ等から抽出してディスプレイ
１９に表示することとなる。

【００３２】このようにしてステップ２０２〜２０８が
対話終了まで繰り返される。ステップ２０２〜２０８が
繰り返されることによって、ユーザとナビゲーションシ
ステム１０との間に音声による対話が進行し、ユーザイ
ンターフェース管理部１２は、ナビゲーション機能の実
行に必要な認識結果を得ることができるように構成され
ている。

【００３３】したがって、ユーザとの対話終了後には、
ステップ２０９へ進み、スロットに格納された認識結果
に基づいて、実行されるナビゲーション機能が決定さ
れ、案内処理部２０等にナビゲーション機能実行の指示
がなされる（ステップ２１０）。認識結果とナビゲーシ
ョン機能の実行との関連については後述する。

【００３４】次に、図３〜図５を用いて、音声対話の進
行について説明する。図３（ａ）はスロット検索テーブ
ルを示しており、図３（ｂ）はスロットを示している。
図４は、音声対話制御部１３においてユーザとの音声対
話を進めるための遷移テーブルを示しており、図５は図
４の流れを図示化した対話状態の推移を示しており、図
６は文書テーブルを示している。また図４の状態番号
は、図５中の番号に対応している。なお、図３、図４及
び図６に示す各テーブル及びスロットは、ナビゲータシ
ステム１０が有する各種メモリ上に予め構成されている
ものとする。

【００３５】図３（ａ）はスロット検索テーブルを示し
ており、各スロット番号に対応してどのような属性を有
する単語が格納されるかを示している。例えば、スロッ
ト番号３には、都道府県名が格納され、スロット番号４
には、市区町村名が格納される。なお、図３（ａ）は一
例であって、種々の変更が可能である。図３（ｂ）は、
実際のスロットに格納された認識結果を示している。即
ち、この状態ではスロット番号３には「兵庫県」との認
識結果が、スロット番号４には「明石市」という認識結
果が格納されている。この時点で何も格納されていない
スロット番号には、「０」が記載されている。

【００３６】図４に示す遷移テーブルは、対話状態番号
４０１、遷移可能な状態数４０２、遷移条件４０３及び
遷移先４０４のデータから構成されている。また、図４
に示すように遷移テーブルは、対話状態を遷移（進行）
させるための役割と、対話状態と文書とを対応付けるた
めの役割を有している。

【００３７】音声対話が開始されると、対話制御部１３
が、対話状態０から音声対話を開始する（図２のステッ
プ２０１に対応）。すると、対話状態０が、ユーザイン
ターエース管理部１２で受信される。ここでは、認識結
果が無いので、何もスロットには格納しない。ユーザイ
ンターエース管理部１２は、図４に示す遷移テーブルに
応じて、対話状態０から、文書番号０を決定し、文書番
号０の「ご用件は何ですか？」の音声出力を音声合成処
理部１６へ指示する。音声合成処理部１６は、図６に示
す文書テーブルから文書番号０に相当する文書を合成し
てスピーカ１７から出力するように処理を行う。

【００３８】次に、音声認識処理部１４が、文書番号０
に対応したユーザの発話から単語単位で認識を行う。こ
こでは、音声認識処理部１４が、「行く」という、単語
属性「動詞」の単語を認識し、対話制御部１３へ認識結
果を送信したしたものとする。すると、対話制御部１３
は、遷移テーブルから対話状態２へ遷移したものと判断
し、ユーザインターフェース管理部１２へ、対話状態２
及び認識結果「行く」を送信する。ユーザインターフェ
ース管理部１２は、受信した認識結果を図３（ａ）に示
すスロット検索テーブルに従って、スロットのスロット
番号１に格納する。さらに、対話状態２から文書番号２
を決定し、文書番号２の「行きたい場所を教えてくださ
い？」の音声出力を音声合成処理部１６へ指示する。音
声合成処理部１６は、図６に示す文書テーブルから文書
番号２に相当する文書を合成してスピーカ１７から出力
するように処理を行う。

【００３９】次に、音声認識処理部１４が、文書番号２
に対応したユーザの発話から単語単位で認識を行う。こ
こでは、音声認識処理部１４が、「兵庫県」という、単
語属性「都道府県名」の単語を認識し、対話制御部１３
へ認識結果を送信したしたものとする。すると、対話制
御部１３は、遷移テーブルから対話状態４へ遷移したも
のと判断し、ユーザインターフェース管理部１２へ、対
話状態４及び認識結果「兵庫県」を送信する。ユーザイ
ンターフェース管理部１２は、受信した認識結果を図３
（ａ）に示すスロット検索テーブルに従って、スロット
のスロット番号３に格納する。さらに、対話状態４から
文書番号４を決定し、文書番号４の「兵庫県の市区町村
名を教えてください？」の音声出力を音声合成処理部１
６へ指示する。音声合成処理部１６は、図６に示す文書
テーブルから文書番号４に相当する文書を合成してスピ
ーカ１７から出力するように処理を行う。

【００４０】次に、音声認識処理部１４が、文書番号４
に対応したユーザの発話から単語単位で認識を行う。こ
こでは、音声認識処理部１４が、「明石市」という、単
語属性「市区町村名」の単語を認識し、対話制御部１３
へ認識結果を送信したしたものとする。すると、対話制
御部１３は、遷移テーブルから対話状態６へ遷移したも
のと判断し、ユーザインターフェース管理部１２へ、対
話状態６及び認識結果「明石市」を送信する。ユーザイ
ンターフェース管理部１２は、受信した認識結果を図３
（ａ）に示すスロット検索テーブルに従って、スロット
のスロット番号４に格納する。さらに、対話状態６から
文書番号６を決定し、文書番号６の「明石市の町名を教
えてください？」の音声出力を音声合成処理部１６へ指
示する。音声合成処理部１６は、図６に示す文書テーブ
ルから文書番号６に相当する文書を合成してスピーカ１
７から出力するように処理を行う。

【００４１】次に、音声認識処理部１４が、文書番号６
に対応したユーザの発話から単語単位で認識を行う。こ
こでは、音声認識処理部１４が、「大久保町」という、
単語属性「町字名」の単語を認識し、対話制御部１３へ
認識結果を送信したしたものとする。すると、対話制御
部１３は、遷移テーブルから対話状態８へ遷移したもの
と判断し、ユーザインターフェース管理部１２へ、対話
状態８及び認識結果「大久保町」を送信する。ユーザイ
ンターフェース管理部１２は、受信した認識結果を図３
（ａ）に示すスロット検索テーブルに従って、スロット
のスロット番号５に格納する。さらに、対話状態８から
文書番号８を決定し、文書番号８の「大久保町の地図を
表示します」の音声出力を音声合成処理部１６へ指示す
る。音声合成処理部１６は、図６に示す文書テーブルか
ら文書番号８に相当する文書を合成してスピーカ１７か
ら出力するように処理を行う。

【００４２】次に、ユーザインターフェース管理部１２
は、図４に示す遷移テーブルから音声対話が終了したも
のと判断し、その時点でスロットに格納されている認識
結果（図３（ｂ）の状態）からナビゲーション機能を決
定する。この場合は、スロット０、３〜５の内容から、
兵庫県明石市大久保町を目的地に設定することが決定さ
れ（図２のステップ２０９に相当）、案内処理部２０に
その旨の指示が送信される（図２のステップ２１０に相
当）。

【００４３】なお、案内処理部２０では、車両状態検出
部２１によってＧＰＳアンテナ２２からのデータに基づ
き車両の現在位置を求める。次に、案内処理部２０は、
ルート探索部２４へ、現在位置から目的地（兵庫県明石
市大久保町）までのルート探索を指示し、さらに地図情
報管理部２５に対して、現在位置から目的地までの地図
情報の検索を指示する。ルート探索部２４からのルート
情報及び地図情報管理部２５からの地図情報を受信した
案内処理部２０は、現在位置から目的地までの地図情報
中にルート情報を合わせた画像をディスプレイ１９に表
示するように表示制御部１８に指示する。このような流
れに従って、音声対話によってナビゲーションシステム
１０が目的地情報を取得して、現在位置から目的地まで
のナビゲーション機能を実行していく。

【００４４】なお、図５に示すように目的地を取得する
対話の流れは１通りではなく、考えられる限り多くの流
れを用意しておくことが好ましい。例えば、対話状態２
における文章番号２の「行きたい場所を教えてください
？」の音声出力に対して、ユーザからの発話中に「兵庫
県明石市」という「都道府県名」＋「市区町村名」が含
まれる場合には対話状態６へ進み、「兵庫県明石市大久
保町」という「都道府県名」＋「市区町村名」＋「町字
名」が含まれる場合には対話状態８へ進み、「野球場」
という「施設種類」が含まれる場合には対話状態１０へ
進み、「兵庫県の野球場」という「都道府県名」＋「施
設種類」が含まれる場合には対話状態１２へ進み、「甲
子園」という「施設名称」が含まれる場合には対話状態
１４へ進むという具合である。

【００４５】次に、図７に示すスロット機能を用いて、
認識結果とナビゲーション機能の実行との関連について
説明する。図７に示すように、各スロット番号７０１
と、実行されるナビゲーション機能７０３とを対応付け
て予め設定しておく。ただし、ナビゲーション機能を実
行するためには複数のスロット番号にまたがる認識結果
が必要な場合には、それらを「補助機能」として、連続
したスロット番号を付与することが望ましい。例えば、
「都道府県名」、「市区町村名」及び「町字名」には、
連続した３〜５のスロット番号が付与されている。な
お、この場合、スロット番号３をチェックすれば、スロ
ット４及び５に認識結果が格納されていないことは明確
であるので、連続したスロット番号を付与することによ
って、チェックを簡素化することが可能となる。

【００４６】また、同一のスロット番号で複数の機能を
兼用する場合には、単語によって機能の選択を判別する
ことが好ましい。さらに、例えば「はい」、「いいえ」
等の返答、「えーッと」等の間投詞、及び「わからな
い」等の単語は、ナビゲーションを動作させる上で不必
要であるので、スロットには格納しないようにすること
が好ましい。

【００４７】さらに、遷移テーブルに沿って対話を進め
ていくに際して、音声認識処理部１４が認識した単語
と、地図データＤＢ２６中に記載されている単語との間
で、漢字や読み仮名との間に差がある場合には、ユーザ
インターフェース管理部１２が、スロットに格納する前
に、地図データＤＢ２６中の記載に合わせて変換してお
くことが好ましい。例えば、音声認識処理部１４が、
「ひょうごけん」と認識した単語を、「兵庫県」に変換
してスロットに格納することを言う。このような変換に
よって、正確な地図情報の表示やルート案内が可能とな
る。

【００４８】次に図８及び９を用いて、音声対話の進行
の他の例について説明する。図８は、ある地点を表示す
るための対話状態の推移を示しており、図９は、図８に
対応した遷移テーブル２である。遷移テーブル２は、状
態番号９０１、遷移可能な状態数９０２、遷移条件９０
３及び遷移先９０４の項目から構成されている。

【００４９】ある状態から状態１００に遷移した場合に
は、文書番号１００が決定され、文書番号１００に相当
する文書、即ち「住所をお話ください。」が音声合成処
理部１６で合成されてスピーカ１７から出力される。

【００５０】次に、状態１０１で、ユーザの発話から単
語単位の認識を行い、「兵庫県」という「県名」が認識
された場合には状態１０２へ、「兵庫県」＋「明石市」
という、「県名」及び「市名」が認識された場合には状
態１０４へ、「兵庫県」＋「明石市」＋「大久保町」と
いう、「県名」＋「市名」＋「町名」が認識された場合
には状態１０６へ遷移する。

【００５１】次に、状態１０２では、文書番号１０２が
決定され、文書番号１０２に相当する文書、即ち「兵庫
県の続きをお話ください。」が音声合成処理部１６で合
成されてスピーカ１７から出力される。

【００５２】次に、状態１０３では、ユーザの発話から
単語単位の認識を行い、「明石市」という、「市名」が
認識された場合には状態１０４へ、「明石市」＋「大久
保町」という、「市名」＋「町名」が認識された場合に
は状態１０６へ遷移する。

【００５３】次に、状態１０４では、状態１０１から状
態１０４へ遷移した場合には（状態１０１での認識単語
数＝２なので）、文書番号１０４−１が決定され、文書
番号１０４−１に相当する文書、即ち「兵庫県、明石市
の続きをお話ください。」が音声合成処理部１６で合成
されてスピーカ１７から出力される。また、状態１０３
から状態１０４へ遷移した場合には（状態１０３での認
識単語数＝１なので）、文書番号１０４−２が決定さ
れ、文書番号１０４−２に相当する文書、即ち「明石市
の続きをお話ください。」が音声合成処理部１６で合成
されてスピーカ１７から出力される。状態１０４では、
よりユーザとの対話をスムーズに進めるために、その１
つ前の遷移状態で、ユーザの発話から認識された単語の
数に応じて、音声対話用文書を変更するように設定され
ている。

【００５４】次に、状態１０５では、ユーザの発話から
単語単位の認識を行い、「大久保町」という、「町名」
が認識された場合には状態１０６へ遷移する。

【００５５】次に、状態１０６では、状態１０１から状
態１０６へ遷移した場合には（状態１０１での認識単語
数＝３なので）、文書番号１０６−１が決定され、文書
番号１０６−１に相当する文書、即ち「兵庫県、明石
市、大久保町の続きをお話ください。」が音声合成処理
部１６で合成されてスピーカ１７から出力される。ま
た、状態１０３から状態１０６へ遷移した場合には（状
態１０３での認識単語数＝２なので）、文書番号１０６
−２が決定され、文書番号１０６−２に相当する文書、
即ち「明石市、大久保町の続きをお話ください。」が音
声合成処理部１６で合成されてスピーカ１７から出力さ
れる。さらに、状態１０５から状態１０６へ遷移した場
合には（状態１０５での認識単語数＝１なので）、文書
番号１０６−３が決定され、文書番号１０６−３に相当
する文書、即ち「大久保町の続きをお話ください。」が
音声合成処理部１６で合成されてスピーカ１７から出力
される。このように、状態１０６では、よりユーザとの
対話をスムーズに進めるために、その１つ前の遷移状態
で、ユーザの発話から認識された単語の数に応じて、音
声対話用文書を変更するように設定されている。

【００５６】図８及び９に示す例のように、一つの対話
状態に対して複数の文書が対応している場合には、認識
結果の単語数に応じて音声案内文書を決定することもで
きる。

【００５７】次に図１０及び１１を用いて、音声対話の
進行の更に他の例について説明する。図１０は、認識エ
ラーが発生した場合の対話状態の推移を示しており、図
１１は図１０に対応した遷移テーブル３である。遷移テ
ーブル３は、状態番号１１０１、遷移可能な状態数１１
０２、遷移条件１１０３及び遷移先１１０４の項目から
構成されている。

【００５８】ある状態から状態２００に遷移した場合に
は、文書番号２００が決定され、文書番号２００に相当
する文書、即ち「住所をお話ください。」が音声合成処
理部１６で合成されてスピーカ１７から出力される。

【００５９】次に、状態１０１で、ユーザの発話から単
語単位の認識を行い、「兵庫県」という「県名」が認識
された場合には状態２０２へ、認識エラーが発生した場
合には、状態２０４へ遷移する。

【００６０】次に、状態２０４では、エラーカウント＝
１として、文書番号２０４−１が決定され、文書番号２
０４−１に相当する文書、即ち「もう一度大きい（小さ
い）声でお話ください。」が音声合成処理部１６で合成
されてスピーカ１７から出力されて、状態２００へ再度
遷移する。

【００６１】もし、再度状態２０１で認識エラーが発生
した場合には、エラーカウント＝２として、文書番号２
０４−２が決定され、文書番号２０４−２に相当する文
書、即ち「もう少し大きい（小さい）声でお話くださ
い。」が音声合成処理部１６で合成されてスピーカ１７
から出力されて、状態２００へ再度遷移する。

【００６２】このように、認識エラーの発生回数に応じ
て、音声案内文書を音声対話用文書を変更するように設
定されている。なお、ここでは、２通りの音声案内文書
を示したが、認識エラー回数に応じて、更に多くの音声
認識文書を設けることのできる。

【００６３】図１０及び１１に示す例のように、一つの
対話状態に対して複数の文書が対応している場合には、
単語認識のエラー、特にエラー回数に応じて音声案内文
書を決定することもできる。

【００６４】さらに、認識エラーの種類、例えばユーザ
の発話が大きすぎる場合、ユーザの発話が小さすぎる場
合、発話のタイミングが早い場合、発話のタイミングが
遅い場合、及び周囲の雑音が大きい場合等に応じて、音
声案内文書を変更するように設定しても良い。その場
合、発話が大きすぎる場合には、小さな声で話すよう
に、発話が小さすぎる場合には、大きな声で話すような
音声案内文書が選択される。

【００６５】上記説明においては、ユーザインターフェ
ース管理部１２が、音声案内用文書及び画面表示用文書
を決定する場合について述べてきたが、対話制御部１３
において、音声案内用文書及び画面表示用文書を決定す
るように構成しても良い。図１２は、対話制御部１３
が、音声案内用文書及び画面表示用文書を決定するよう
に構成した別の手順を示している。以下、図１２に示す
手順について説明する。

【００６６】最初に、ナビゲーションシステム１０の電
源ＯＮ又は対話開始ボタンの押下等によって音声対話を
開始する（ステップ１２０１）。

【００６７】次に、マイクロフォン１５から入力される
ユーザの音声を音声認識部１４が単語単位で認識し、対
話制御部１３は音声認識処理部１４の認識結果を受信す
る（ステップ１２０２）。

【００６８】次に対話制御部１３は、認識結果に基づい
て対話状態を決定する（ステップ１２０３）。

【００６９】次に、対話制御部１３は、対話状態及び認
識結果から、遷移テーブル（図４参照）を利用して、音
声対話用文書を決定する（ステップ１２０４）。さら
に、対話制御部１３は、対話状態及び認識結果から、画
面表示用文書を決定する（ステップ１２０５）。

【００７０】次に、対話制御部１３は、ユーザインター
フェース管理部１２へ、認識結果、決定した音声案内文
書及び画面表示用文書を送信する（ステップ１２０
６）。ユーザインターフェース管理部１２では、受信し
た音声案内文書及び画面表示用文書に基づいて、音声出
力及び画面表示を行い、受信した認識結果をスロットに
格納する。

【００７１】次に、対話制御部１３は、ユーザとの対話
が終了したか否かを判断し（ステップ１２０７）、対話
の終了により一連の流れを終了する。また、対話が終了
されていなければ、再度ステップ１２０２〜１２０６を
繰り返す。このようなステップを繰り返すことによっ
て、ユーザインターフェース管理部１２は、スロットに
認識結果を格納し、図２に示した手順と同様に、ナビゲ
ーション機能を実行していく。

【００７２】

【発明の効果】本発明に従ったナビゲーションシステム
における音声対話インターフェース処理方法を用いれ
ば、適切な音声案内及び画面表示案内をユーザに提供す
ることで、適切な発話を促すことができる。

【００７３】また、本発明に従ったナビゲーションシス
テムにおける音声対話インターフェース処理方法を用い
れば、ユーザが任意に対話を進めても、ランダムに得ら
れる発話からの音声認識結果に基づいてナビゲーション
機能の動作に必要な情報を確実に抽出することができ
る。

【００７４】さらに、本発明に従ったナビゲーションシ
ステムにおける音声対話インターフェース処理方法を用
いれば、スロットへの認識結果の格納状態をチェックす
ることによって、実行するナビゲーション機能を選択す
るようにしたので、処理手順の簡素化及び処理時間の短
縮化を図ることができる。

【図面の簡単な説明】

【図１】本発明を実施するためのナビゲーションシステ
ムの概略を示す図である。

【図２】本発明に従った音声対話インターフェース処理
方法の手順の一例を示す図である。

【図３】（ａ）はスロット検索テーブル示す図、（ｂ）
はスロットに格納された認識結果の一例を示す図であ
る。

【図４】音声対話インターフェース処理方法に対応した
遷移テーブルの一例を示す図である。

【図５】音声対話インターフェース処理方法に対応した
対話状態の推移の一例を示す図である。

【図６】音声対話インターフェース処理方法に対応した
文書テーブルの一例を示す図である。

【図７】音声対話インターフェース処理方法に対応した
スロット機能の一例を示す図である。

【図８】音声対話インターフェース処理方法に対応した
対話状態の他の一例を示す図である。

【図９】図８に対応した遷移テーブルの一例を示す図で
ある。

【図１０】音声対話インターフェース処理方法に対応し
た対話状態の更に他の一例を示す図である。

【図１１】図１０に対応した遷移テーブルの一例を示す
図である。

【図１２】本発明に従った音声対話インターフェース処
理方法の手順の他の一例を示す図である。

【符号の説明】

１０…音声対話型ナビゲーションシステム１１…システム管理部１２…ユーザインターフェース管理部１３…対話制御部１４…音声認識処理部１５…マイクロフォン１６…音声合成処理部１７…スピーカ１８…表示制御部１９…ディスプレイ２０…案内処理部２１…車両状態検出部２２…ＧＰＳアンテナ２３…車速センサ２４…ルート探索部２５…地図情報管理部２６…地図データＤＢ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 13/00 Ｇ１０Ｌ 3/00 ５７１Ｕ 15/18 ５６１Ｄ 15/22 Ｑ 15/28 ５３７ＥＦターム(参考） 2C032 HB02 HB05 HB22 HC08 HC16 HC31 HD03 HD12 2F029 AA02 AB07 AC02 AC14 AC18 5D015 KK01 KK04 LL06 LL07 5D045 AB17 5H180 AA01 BB13 EE01 FF05 FF22 FF25 FF27 FF32

Claims

【特許請求の範囲】

【請求項１】表示部と、マイクロフォンから入力され
た音声を認識して単語単位の認識結果を出力する音声認
識処理部と、前記認識結果に応じて対話状態を判断しな
がらユーザとの対話制御を行う音声対話制御部と、音声
案内を出力する音声合成処理部と、ナビゲーション機能
を実行するための案内処理部と、ユーザインターフェー
ス管理部とを有するナビゲーションシステムにおいて、
前記ユーザインターフェース管理部は、前記対話状態に応じて音声案内用文書及び画面表示用文
書を決定し、前記音声合成処理部から前記音声案内用文書による音声
案内出力を行い、前記表示部に前記画面表示用文書を表示し、前記認識結果及び前記対話状態応じて、前記案内処理部
によるナビゲーション機能を実行させることを特徴とす
るナビゲーションシステムにおける音声対話インターフ
ェース処理方法。
【請求項２】前記ユーザインターフェース管理部は、
対話状態と文書とを対応付けたテーブルを用いて、前記
音声案内用文書を決定する請求項１に記載のナビゲーシ
ョンシステムにおける音声対話インターフェース処理方
法。
【請求項３】前記ユーザインターフェース管理部は、
前記テーブルが同一の対話状態に対して複数の文書が対
応している場合には、前記認識結果の単語数に応じて、
前記音声案内用文書を決定する請求項２に記載のナビゲ
ーションシステムにおける音声対話インターフェース処
理方法。
【請求項４】前記ユーザインターフェース管理部は、
前記テーブルが同一の対話状態に対して複数の文書が対
応している場合には、前記認識結果の単語属性に応じ
て、前記音声案内用文書を決定する請求項２に記載のナ
ビゲーションシステムにおける音声対話インターフェー
ス処理方法。
【請求項５】前記ユーザインターフェース管理部は、
前記テーブルが同一の対話状態に対して複数の文書が対
応している場合には、前記認識結果の単語認識エラーに
応じて、前記音声案内用文書を決定する請求項２に記載
のナビゲーションシステムにおける音声対話インターフ
ェース処理方法。
【請求項６】前記ユーザインターフェース管理部は、
前記テーブルが同一の対話状態に対して複数の文書が対
応している場合には、前記認識結果の単語認識エラーの
回数に応じて、前記音声案内用文書を決定する請求項２
に記載のナビゲーションシステムにおける音声対話イン
ターフェース処理方法。
【請求項７】前記ユーザインターフェース管理部は、
対話状態と文書とを対応付けたテーブルを用いて、前記
画面表示用文書を決定する請求項１に記載のナビゲーシ
ョンシステムにおける音声対話インターフェース処理方
法。
【請求項８】前記ユーザインターフェース管理部は、
前記テーブルが同一の対話状態に対して複数の文書が対
応している場合には、前記認識結果の単語数に応じて、
前記画面表示用文書を決定する請求項７に記載のナビゲ
ーションシステムにおける音声対話インターフェース処
理方法。
【請求項９】前記ユーザインターフェース管理部は、
前記テーブルが同一の対話状態に対して複数の文書が対
応している場合には、前記認識結果の単語属性に応じ
て、前記画面表示用文書を決定する請求項７に記載のナ
ビゲーションシステムにおける音声対話インターフェー
ス処理方法。
【請求項１０】前記ユーザインターフェース管理部
は、前記テーブルが同一の対話状態に対して複数の文書
が対応している場合には、前記認識結果の単語認識エラ
ーに応じて、前記画面表示用文書を決定する請求項７に
記載のナビゲーションシステムにおける音声対話インタ
ーフェース処理方法。
【請求項１１】前記ユーザインターフェース管理部
は、前記テーブルが同一の対話状態に対して複数の文書
が対応している場合には、前記認識結果の単語認識エラ
ーの回数に応じて、前記画面表示用文書を決定する請求
項７に記載のナビゲーションシステムにおける音声対話
インターフェース処理方法。
【請求項１２】前記ユーザインターフェース管理部
は、前記認識結果の単語属性に応じて、予め定められた
記憶領域に前記認識結果を格納する請求項１に記載のナ
ビゲーションシステムにおける音声対話インターフェー
ス処理方法。
【請求項１３】前記ユーザインターフェース管理部
は、前記認識結果の単語属性が前記案内処理部によるナ
ビゲーション機能の実行に不必要な場合は、前記認識結
果を前記記憶領域に格納しない請求項１２に記載のナビ
ゲーションシステムにおける音声対話インターフェース
処理方法。
【請求項１４】前記ユーザインターフェース管理部
は、前記対話制御部による対話終了後に、前記記憶領域
をチェックし、前記認識結果が格納されている記憶領域
に応じて、前記案内処理部によるナビゲーション機能を
実行させる請求項１２に記載のナビゲーションシステム
における音声対話インターフェース処理方法。
【請求項１５】前記ユーザインターフェース管理部
は、前記案内処理部によるナビゲーション機能の実行の
ために複数の認識結果が必要な場合には、前記複数の認
識結果を格納するために連続した複数の記憶領域を設定
する請求項１２に記載のナビゲーションシステムにおけ
る音声対話インターフェース処理方法。
【請求項１６】前記ユーザインターフェース管理部
は、前記対話制御部による対話終了後に、前記記憶領域
をチェックし、前記連続した複数の記憶領域の先頭に認
識結果が格納されていなければ、その後の記憶領域にも
認識結果が格納されていないものと判断する請求項１５
に記載のナビゲーションシステムにおける音声対話イン
ターフェース処理方法。
【請求項１７】前記ナビゲーションシステムは、前記
案内処理部によるナビゲーション機能の実行のためのデ
ータベースを更に有し、前記ユーザインターフェース管
理部は、前記認識結果を前記データベースの表記に変換
する請求項１〜１７の何れか一項に記載のナビゲーショ
ンシステムにおける音声対話インターフェース処理方
法。
【請求項１８】表示部と、マイクロフォンから入力さ
れた音声を認識して単語単位の認識結果を出力する音声
認識処理部と、前記認識結果に応じて対話状態を判断し
ながらユーザとの対話制御を行う音声対話制御部と、音
声案内を出力する音声合成処理部と、ナビゲーション機
能を実行するための案内処理部と、ユーザインターフェ
ース管理部とを有するナビゲーションシステムにおい
て、前記音声対話制御部は、前記対話状態に応じて音声案内
用文書及び画面表示用文書を決定し、前記ユーザインターフェース管理部は、前記音声合成処
理部から前記音声案内用文書による音声案内出力を行
い、前記表示部に前記画面表示用文書を表示し、前記認
識結果及び前記対話状態応じて、前記案内処理部による
ナビゲーション機能を実行させることを特徴とするナビ
ゲーションシステムにおける音声対話インターフェース
処理方法。