JP2003091297A - 音声対話装置 - Google Patents

音声対話装置

Info

Publication number
JP2003091297A
JP2003091297A JP2001284377A JP2001284377A JP2003091297A JP 2003091297 A JP2003091297 A JP 2003091297A JP 2001284377 A JP2001284377 A JP 2001284377A JP 2001284377 A JP2001284377 A JP 2001284377A JP 2003091297 A JP2003091297 A JP 2003091297A
Authority
JP
Japan
Prior art keywords
voice
dictionary
dialogue
voice recognition
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001284377A
Other languages
English (en)
Other versions
JP3576511B2 (ja
Inventor
Kazuya Nomura
和也 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001284377A priority Critical patent/JP3576511B2/ja
Publication of JP2003091297A publication Critical patent/JP2003091297A/ja
Application granted granted Critical
Publication of JP3576511B2 publication Critical patent/JP3576511B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)
  • Navigation (AREA)

Abstract

(57)【要約】 【課題】 使用者が装置側の発する質問に正確に答えら
れない場合でも対話を継続して目的を達成することがで
きる音声対話装置を提供すること。 【解決手段】 使用者が入力した音声を認識する音声認
識部11と、対話の階層毎に必要な音声認識辞書が全対
話階層分格納されている辞書格納部13と、辞書格納部
13内の辞書を選択結合して対話に必要な辞書を準備す
る辞書選択結合部14と、応答音声格納部16内の発声
を促す音声を使用者に対して出力する応答音声出力部1
5と、音声認識された使用者の音声が不明表現誤辞書1
7内の不明表現語であると不明表現語判定部18により
判定されたときに、次に遷移する可能性のある階層全て
の辞書格納部13内の辞書を辞書選択結合部14に選択
結合させることにより、対話を継続するのに有効な辞書
を準備させて、応答音声出力部15により使用者に対し
て音声を出力させる対話制御部12とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識技術と音
声合成技術を用いた音声対話装置に関するものである。
【0002】
【従来の技術】近年、音声認識をして対話をすることに
より所望の目的を達成するようにする音声対話装置が各
種機器に搭載されてきており、例えば、手入力すること
なく操作を補助するようにナビゲーション装置などに搭
載されている。
【0003】この種の音声対話装置としては、例えば、
ナビゲーション装置に搭載されている場合には、図23
に示すように、使用者との間で対話を継続して、目的地
の表示や設定をすることができるようになっている。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声対話装置にあっては、例えば、ナビゲー
ション装置の目的地設定のための項目検索機能を用い
て、図23に示すように、千葉県にある○○ゴルフ場を
検索する場合には、その○○ゴルフ場が千葉県にあるこ
とを知っていなければ対話を継続することができず、検
索不能になってしまう。
【0005】要するに、使用者が対話装置側から発せら
れる質問に対する答えを持っていない場合には、対話が
中断することになり、また、曖昧な答えしかできない場
合には、間違った答えにより、適切な音声認識辞書を選
択することができずに、使用者の目的を達成することが
できない、という問題があった。
【0006】本発明は、このような問題を解決するため
になされたもので、使用者が装置側の発する質問に正確
に答えられない場合でも対話を継続して目的を達成する
ことができる音声対話装置を提供するものである。
【0007】
【課題を解決するための手段】本発明の音声対話装置
は、入力した音声を認識する音声認識手段と、対話の階
層毎に音声認識辞書が格納されている辞書格納手段と、
対話に応じた辞書を準備する辞書準備手段と、発声を促
す音声を出力する応答音声出力手段と、前記音声認識手
段により確定することができないときに対話を継続する
ような前記音声認識辞書を前記辞書準備手段に準備させ
て前記応答音声出力手段から音声を出力させる対話制御
手段とを備える構成を有している。
【0008】このような構成により、音声認識された使
用者の言葉(音声)に応じた指示がなされることによ
り、音声認識辞書が辞書格納手段内から準備されて、使
用者に対して発声を促す音声、すなわち、質問音声や応
答音声などが出力され対話が継続される一方、音声認識
された使用者の音声の内容が次の指示を確定できない内
容のときには、対話を継続するのに有効な音声認識辞書
が辞書格納手段内から準備されて、続けて、質問音声や
応答音声などが出力されることにより対話が継続され
る。したがって、使用者が応答できない場合や曖昧な答
えしかできない場合でも、対話を中断することなく継続
させることができ、目的を達成することができる。
【0009】本発明の音声対話装置の前記辞書準備手段
は、前記辞書格納手段内の前記音声認識辞書を選択結合
して対話に必要な辞書を準備し、前記対話制御手段は、
前記音声認識手段により認識された音声が不明なときに
は、次に遷移する可能性のある階層の前記辞書格納手段
内の前記音声認識辞書を前記辞書準備手段に選択結合さ
せて準備させる構成を有している。
【0010】このような構成により、音声認識された使
用者の音声の内容が不明のために応答できない意味内容
で次の指示を確定できないときには、対話を継続させた
ときに使用される可能性のある全ての音声認識辞書が辞
書格納手段内から選択されて結合されることにより準備
されて、続けて、質問音声や応答音声などが出力される
ことにより対話が継続される。したがって、使用者が答
えを知らないために応答できない場合でも、対話を中断
することなく継続させることができ、目的を達成するこ
とができる。
【0011】本発明の音声対話装置の前記辞書準備手段
は、前記辞書格納手段内の前記音声認識辞書を選択して
対話に必要な辞書を準備し、前記対話制御手段は、前記
音声認識手段により認識された音声が不明なときには、
前記応答音声出力手段に別の質問をする音声を出力させ
て前記辞書準備手段に前記辞書格納手段から対話に必要
な前記音声認識辞書を選択準備させる構成を有してい
る。
【0012】このような構成により、音声認識された使
用者の音声の内容が不明のために応答できない意味内容
で次の指示を確定できないときには、別の質問がされ
て、その答えに対応する音声認識辞書が辞書格納手段内
から選択されることにより準備されることにより、続け
て、質問音声や応答音声などが出力され対話が継続され
る。したがって、使用者が答えを知らないために応答で
きない場合でも、対話を中断することなく継続させるこ
とができ、目的を達成することができる。
【0013】本発明の音声対話装置の前記辞書準備手段
は、前記辞書格納手段内の前記音声認識辞書を選択結合
して対話に必要な辞書を準備し、前記対話制御手段は、
前記音声認識手段により認識された音声が1回目の不明
なことを意味する内容のときには、前記応答音声出力手
段に別の質問をする音声を出力させて前記辞書準備手段
に前記辞書格納手段から対話に必要な前記音声認識辞書
を選択準備させるとともに、前記音声認識手段により認
識された音声が不明な状態が続いたときには、次に遷移
する可能性のある階層全ての前記辞書格納手段内の前記
音声認識辞書を前記辞書準備手段に選択結合させて準備
させる構成を有している。
【0014】このような構成により、内容が不明で応答
できない意味内容であるために次の指示を確定できない
使用者の音声を初めて音声認識したときには、別の質問
がされて、その答えに対応する音声認識辞書が辞書格納
手段内から選択されることにより準備されて、質問音声
や応答音声などが出力されることにより対話が継続され
るが、次の音声認識でも使用者の音声の内容が不明のた
めに指示を確定できないときには、対話を継続させたと
きに使用される可能性のある全ての音声認識辞書が辞書
格納手段内から選択されて結合されることにより準備さ
れて、続けて、質問音声や応答音声などが出力されるこ
とにより対話が継続される。したがって、使用者が答え
を知らないために応答できない場合が繰り返されても、
対話を中断することなく継続させることができ、目的を
達成することができる。
【0015】本発明の音声対話装置の前記辞書準備手段
は、前記辞書格納手段内の前記音声認識辞書を選択結合
して対話に必要な辞書を準備し、前記対話制御手段は、
前記音声認識手段により認識された音声が曖昧であるこ
とを表す内容のときには、前記音声から曖昧さを表す部
分を除いた言葉に対応する前記辞書格納手段内の前記音
声認識辞書と、前記音声の前記曖昧さを表す部分を除い
た前記言葉に概念的に近い内容を含む前記辞書格納手段
内の前記音声認識辞書とを前記辞書準備手段に選択結合
させて準備させる構成を有している。
【0016】このような構成により、音声認識された使
用者の音声の内容が曖昧な答えの意味内容で次の指示を
確定できないときには、その曖昧さを表す部分の言葉を
除いたときに対応する音声認識辞書と共に概念的に近い
音声認識辞書が辞書格納手段内から選択されて結合され
ることにより準備されて、続けて、質問音声や応答音声
などが出力されることにより対話が継続される。したが
って、使用者が正確な答えを知らない場合でも、対話を
中断することなく継続させることができ、目的を達成す
ることができる。
【0017】本発明の音声対話装置の前記辞書準備手段
は、前記辞書格納手段内の前記音声認識辞書を選択結合
して対話に必要な辞書を準備し、前記対話制御手段は、
前記音声認識手段により認識された音声が複数の内容を
含むときには、前記複数の内容毎に対応する前記辞書格
納手段内の前記音声認識辞書の複数を前記辞書準備手段
に選択結合させて準備させる構成を有している。
【0018】このような構成により、音声認識された使
用者の音声が複数の内容を含む意味内容で次の指示を確
定できないときには、それぞれの内容に対応する音声認
識辞書が辞書格納手段内から選択されて結合されること
により準備されて、続けて、質問音声や応答音声などが
出力されることにより対話が継続される。したがって、
使用者が正確な答えを知らない場合でも、対話を中断す
ることなく継続させることができ、目的を達成すること
ができる。
【0019】本発明の音声対話装置の前記辞書準備手段
は、前記辞書格納手段内の前記音声認識辞書を一つ選択
して対話に必要な辞書を準備し、前記対話制御手段は、
前記音声認識手段により認識された音声が複数の内容を
含むときには、前記内容に含まれる一つの内容に対応す
る前記辞書格納手段内の前記音声認識辞書を前記辞書準
備手段に選択準備させて、前記応答音声出力手段に質問
をする音声を出力させることにより、前記音声認識手段
により認識される音声で対話の正誤を確認し、誤ってい
た場合には、前記音声に含まれる他の内容に対応する前
記辞書格納手段内の前記音声認識辞書を前記辞書準備手
段に選択準備させる構成を有している。
【0020】このような構成により、音声認識された使
用者の音声が複数の内容を含む意味内容で次の指示を確
定できないときには、まずは一つの内容に対応する音声
認識辞書が辞書格納手段内から選択準備されて、別の質
問がされることにより、その一つの内容でよかったのか
否かが確認され、誤っていた場合には、他の内容に対応
する音声認識辞書が辞書格納手段内から選択準備され
て、続けて、質問音声や応答音声などが出力されること
により対話が継続される。したがって、使用者が正確な
答えを知らない場合でも、対話を中断することなく継続
させることができ、目的を達成することができる。
【0021】
【発明の実施の形態】以下、本発明を図面に基づいて説
明する。図1〜図6は本発明の音声対話装置の第1の実
施の形態を示す図である。
【0022】まず、装置構成を説明する。図1におい
て、音声対話装置10は、使用者が入力した音声を認識
する音声認識部11と、使用者との間の音声による対話
を制御する対話制御部12と、対話の階層(種類や進度
など)毎に必要な音声認識辞書が全対話階層分格納され
ている辞書格納部13と、対話制御部12からの指令に
より辞書格納部13内に格納されている音声認識辞書を
1個以上選択して結合することにより音声認識部11が
用いる音声認識辞書を作成する辞書選択結合部(辞書準
備手段)14と、対話制御部12の指令により使用者に
対して発声を促す質問音声あるいは応答音声を発する応
答音声出力部15と、この応答音声出力部15で用いら
れる複数の音声を格納する応答音声格納部16と、不明
であることを意味する言葉が項目として登録されている
不明表現語辞書17と、対話制御部12の問い合わせに
応じて不明表現語辞書17を参照し音声認識結果が不明
なことを表現しているかどうか判定する不明表現語判定
部18とから構成されており、ナビゲーション装置に搭
載されて検索や目的地設定などの操作を音声入力により
補助するようになっている。
【0023】次に本発明の音声対話装置による処理動作
を、図2に示す対話のフロー図を用いて説明する。
【0024】まず、使用者(ナビゲーション装置のユー
ザー)の指示により音声対話が開始されると、対話制御
部12は辞書選択結合部14に検索のジャンルを表す言
葉を含む辞書の作成を指令する。この指令により、辞書
選択結合部14は音声認識辞書格納部13から図3に示
すような検索ジャンルを表す言葉を含む音声認識辞書の
作成を行う。
【0025】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対して言葉の発声を促すメッセー
ジを出力することを指令する。この指令に対し、応答音
声出力部15は応答音声格納部16から「ご用はなんで
しょうか。」というメッセージを選択し、使用者に提示
する。
【0026】次いで、対話制御部12は音声認識部11
に対し、辞書選択結合部14が作成した辞書を用いて音
声認識を実行することを指令する。先の「ご用はなんで
しょうか。」というメッセージを聞いた使用者が施設の
検索を行うために「施設検索。」を発声して音声対話装
置10に入力することにより、入力された音声は音声認
識部11で認識され、認識結果として、「施設検索。」
がコマンドとしてとして選ばれ、対話制御部12へ出力
される。この結果により、対話制御部12は辞書選択結
合部14に検索のジャンルを表す言葉と共に「わかりま
せん。」などの使用者が施設の種類を知らない場合に発
声する可能性のある言葉をも含む辞書の選択を指令す
る。この指令により、辞書選択結合部14は音声認識辞
書格納部13から図4に示すような検索ジャンルを表す
言葉と「わかりません。」などの言葉とを含む音声認識
辞書の選択(作成)を行う。
【0027】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対して施設の種類の発声を促すメ
ッセージを出力することを指令する。この指令に対し、
応答音声出力部15は応答音声格納部16から「施設の
種類をお話ください。」というメッセージを選択し、使
用者に提示する。
【0028】次いで、対話制御部12は音声認識部11
に対し、辞書選択結合部14が作成した辞書を用いて音
声認識を実行することを指令する。先の「施設の種類を
お話ください。」というメッセージを聞いた使用者が検
索したいジャンルを表す言葉として、「ゴルフ場。」を
発声して音声対話装置10に入力することにより、入力
された音声は音声認識部11で認識され、認識結果とし
て、「ゴルフ場。」が検索のジャンルとして選ばれる。
【0029】次いで、対話制御部12はゴルフ場の所在
地を絞り込むため辞書選択結合部14に県名と「わかり
ません。」など使用者がゴルフ場の所在する県名を知ら
ない場合に発声する可能性のある言葉とで構成された辞
書の作成を指令する。この指令により、辞書選択結合部
14は音声認識辞書格納部13から図5に示すような県
名と「わかりません。」などの言葉とで構成された音声
認識辞書の作成を行う。
【0030】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の所在する県名の
発声を促すメッセージを出力することを指令する。この
指令に対し、応答音声出力部15は応答音声格納部16
から「ゴルフ場のある県名をお話ください。」というメ
ッセージを選択し、使用者に提示する。このメッセージ
を聞いた使用者が、ゴルフ場がある県名が分からないた
め「わかりません。」と発声して音声対話装置10に入
力することにより、入力された音声は音声認識部11で
認識され、認識結果として、「わかりません。」が選ば
れる。
【0031】次いで、対話制御部12はこの結果を不明
表現語判定部18へ出力する。不明表現語判定部18は
この結果を受け取り、図6に示すような不明であること
を示す言葉を項目とする不明表現語辞書17を参照し、
不明を表す言葉かどうかの判定を行い、その結果を対話
制御部12へ出力する。この場合、「わかりません。」
が不明を表す言葉として判定されるので、この判定結果
に対し、対話制御部12は辞書選択結合部14に県名毎
に分けられたゴルフ場の辞書をすべて結合した辞書の作
成を指令する。この指令により、辞書選択結合部14は
音声認識辞書格納部13から県名毎に分けられたゴルフ
場の辞書をすべて取り出して結合した音声認識辞書の作
成を行う。
【0032】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の名称の発声を促
すメッセージを出力することを指令する。この指令に対
し、応答音声出力部15は応答音声格納部16から「ゴ
ルフ場の名前をお話ください。」というメッセージを選
択し、使用者に提示する。このメッセージを聞いた使用
者が、ゴルフ場の名前「○○ゴルフ場。」と発声して音
声対話装置10に入力することにより、入力された音声
は音声認識部11で認識され、認識結果として、「○○
ゴルフ場。」が選ばれ、検索対象が確定する。
【0033】次いで、対話制御部12は応答音声出力部
15に対し、確定した検索対象「○○ゴルフ場。」を使
用者に提示することを指令する。この指令に対し、応答
音声出力部15は応答音声格納部16に格納されている
内容と「○○ゴルフ場。」を組み合わせて、「○○ゴル
フ場の地図を表示します。」というメッセージを作成
し、使用者に提示する。
【0034】以上の動作により、検索対象の目的地など
の地図をナビゲーション装置の表示画面に表示させるこ
とができる。
【0035】このように第1の実施の形態においては、
辞書選択結合部14および不明表現語判定部18を設け
ることにより、使用者が例えばゴルフ場の所在する県名
を知らずに「わからない。」などと、対話中の質問に対
して答えたために次に行うべき指示が確定できない場合
でも、対話を継続させたときに使用されるであろう、県
名毎に分けられたゴルフ場の辞書をすべて取り出して結
合した音声認識辞書を作成し音声認識を行うことによっ
て、音声対話の流れが中断してしまうことなく検索対象
を確定することができる。したがって、使用者が答えを
知らない応答の場合でも、対話を中断することなく継続
させることができ、目的を達成することができる。
【0036】次に、図7〜図9は本発明の音声対話装置
の第2の実施の形態を示す図である。なお、この第2の
実施の形態は、上述した第1の実施の形態と略同様に構
成されているので、図面を流用して、同様な構成には同
一の符号を付して特徴部分を説明する。
【0037】まず、装置構成を説明する。図7におい
て、音声対話装置20は、音声認識部11と、対話制御
部12と、辞書格納部13と、応答音声出力部15と、
応答音声格納部16と、不明表現語辞書17と、不明表
現語判定部18とを備えるとともに、上述第1の実施の
形態における辞書選択結合部14に代えて、辞書選択部
(辞書準備手段)24を設けられており、この辞書選択
部24は、対話制御部12からの指令により辞書格納部
13内に格納されている音声認識辞書を1個選択するこ
とにより音声認識部11が用いる音声認識辞書を作成す
るようになっている。
【0038】次に本発明の音声対話装置による処理動作
を、図8に示す対話のフロー図を用いて説明する。
【0039】まず、上述第1の実施の形態と同様に、使
用者の指示により音声対話が開始されて、「ご用はなん
でしょうか。」というメッセージに対して、使用者が図
3に示す検索ジャンルの「施設検索。」を発声し、この
「施設検索。」がコマンドとして選ばれると、図4に示
すような検索ジャンルを表す言葉と「わかりません。」
などの言葉とを含む音声認識辞書が作成されて、「施設
の種類をお話ください。」というメッセージが使用者に
提示される。
【0040】そして、この「施設の種類をお話くださ
い。」というメッセージを聞いた使用者が、検索したい
ジャンルを表す言葉がわからないときに、「わかりませ
ん。」と発声して音声対話装置20に入力することによ
り、入力された音声は音声認識部11で認識され、認識
結果として、「わかりません。」が選ばれる。
【0041】次いで、対話制御部12はこの結果を不明
表現語判定部18へ出力する。不明表現語判定部18は
この結果を受け取り、図6に示すような不明であること
を示す言葉を項目とする不明表現語辞書17を参照し、
不明を表す言葉か否かの判定を行い、その結果を対話制
御部12へ出力する。この場合、「わかりません。」が
不明を表す言葉として判定されるので、この判定結果に
対し、対話制御部12は施設の所在地を絞り込むため辞
書選択部24に県名で構成された辞書の選択を指令す
る。この指令により、辞書選択部24は音声認識辞書格
納部13から図9に示すような県名で構成された音声認
識辞書の選択を行う。
【0042】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対して施設の所在する県名の発声
を促すメッセージを出力することを指令する。この指令
に対し、応答音声出力部15は応答音声格納部16から
「施設のある県名をお話ください。」というメッセージ
を選択し、使用者に提示する。このメッセージを聞いた
使用者が、施設のある県名「千葉県。」を発声して音声
対話装置20に入力することにより、入力された音声は
音声認識部11で認識され、認識結果として、「千葉
県。」が選ばれる。この結果に対し、対話制御部12は
辞書選択部24に千葉県にあるすべてのジャンルの施設
で構成された辞書の選択を指令する。この指令により、
辞書選択部24は音声認識辞書格納部13から千葉県に
あるすべてのジャンルの施設で構成された辞書の選択を
行う。
【0043】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対して施設の名称の発声を促すメ
ッセージを出力することを指令する。この指令に対し、
応答音声出力部15は応答音声格納部16から「千葉県
の施設の名前をお話ください。」というメッセージを選
択し、使用者に提示する。このメッセージを聞いた使用
者が、施設の名前「○○ゴルフ場。」と発声して音声対
話装置20に入力することにより、入力された音声は音
声認識部11で認識され、認識結果として、「○○ゴル
フ場。」が選ばれ、検索対象が確定する。
【0044】次いで、対話制御部12は応答音声出力部
15に対し、確定した検索対象「○○ゴルフ場。」を使
用者に提示することを指令する。この指令に対し、応答
音声出力部15は応答音声格納部16に格納されている
内容と「○○ゴルフ場。」を組み合わせて、「○○ゴル
フ場の地図を表示します。」というメッセージを作成
し、使用者に提示する。
【0045】以上の動作により、検索対象の目的地など
の地図をナビゲーション装置の表示画面に表示させるこ
とができる。
【0046】このように第2の実施の形態においては、
辞書選択部24および不明表現語判定部18を設けるこ
とにより、使用者が例えば施設のジャンルの名称を知ら
ずに「わからない。」などと、対話中の質問に対して答
えたために次に行うべき指示が確定できない場合でも、
県名を知っていれば県名毎に分けられたすべてのジャン
ルの施設を含む辞書を用いて音声認識を行うことによっ
て、音声対話の流れが中断してしまうことなく検索対象
を確定することができる。したがって、使用者が答えを
知らない応答の場合でも、対話を中断することなく継続
させることができ、目的を達成することができる。
【0047】また、この第2の実施の形態の他の態様と
しては、図10に示すように、「施設の種類をお話くだ
さい。」というメッセージに対して、また、「施設のあ
る県名をお話ください。」というメッセージに対しても
「わかりません。」という発声が繰り返し入力された場
合には、辞書選択部24にすべてのジャンルの施設で構
成された辞書の選択を行って、「施設の名前をお話くだ
さい。」というメッセージを使用者に提示することによ
って、このメッセージを聞いた使用者が、施設の名前
「○○ゴルフ場。」と発声して音声対話装置20に入力
することにより、検索対象として「○○ゴルフ場。」を
確定し、「○○ゴルフ場の地図を表示します。」という
メッセージを使用者に提示することになる。
【0048】次に、図11〜図14は本発明の音声対話
装置の第3の実施の形態を示す図である。なお、この第
3の実施の形態は、上述した第1の実施の形態と略同様
に構成されているので、図面を流用して、同様な構成に
は同一の符号を付して特徴部分を説明する。
【0049】まず、装置構成を説明する。図11におい
て、音声対話装置30は、音声認識部11と、対話制御
部12と、辞書格納部13と、辞書選択結合部14と、
応答音声出力部15と、応答音声格納部16とを備える
とともに、上述第1の実施の形態における不明表現語辞
書17および不明表現語判定部18に代えて、曖昧表現
語辞書37および曖昧表現語判定部38が設けられてお
り、また加えて、距離計算部39が設けられている。
【0050】曖昧表現語辞書37は、曖昧であることを
意味する言葉が項目として登録されており、曖昧表現語
判定部38は、対話制御部12の問い合わせに応じて曖
昧表現語辞書37を参照し音声認識結果が曖昧なことを
表現しているかどうか判定するようになっている。
【0051】距離計算部39は、特定距離内に含まれる
か否かを計算して検索対象とする範囲を選択するように
なっており、例えば、東京都の指定に対しては隣接県の
千葉県、埼玉県、神奈川県、山梨県を選択するようにな
っている。
【0052】次に本発明の音声対話装置による処理動作
を、図12に示す対話のフロー図を用いて説明する。
【0053】まず、上述第1の実施の形態と同様に、使
用者の指示により音声対話が開始されて、「ご用はなん
でしょうか。」というメッセージに対して、使用者が図
3に示す検索ジャンルの「施設検索。」を発声し、次い
で、図4に示すような検索ジャンルの音声認識辞書が作
成されて「施設の種類をお話ください。」というメッセ
ージが使用者に提示されるのに対して、使用者が「ゴル
フ場。」と発声して音声対話装置30に入力することに
より、入力された音声が音声認識部11で認識されて、
「ゴルフ場。」が検索のジャンルとして選ばれる。
【0054】そして、対話制御部12はゴルフ場の所在
地を絞り込むために、県名と、その県名に連接する「か
なあ。」、「の辺り。」などの使用者がゴルフ場の所在
する県名を曖昧にしか知らない場合に発声する可能性の
ある言葉とで構成された辞書の作成を辞書選択結合部1
4に指令する。この指令により、辞書選択結合部14は
図13に示すように県名を主体辞書とするとともにその
県名に連接する「かなあ。」、「の辺り。」などの言葉
を連接辞書とする音声認識辞書を音声認識辞書格納部1
3から選択して作成する。
【0055】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の所在する県名の
発声を促すメッセージを出力することを指令する。この
指令に対し、応答音声出力部15は応答音声格納部16
から「ゴルフ場のある県名をお話ください。」というメ
ッセージを選択し、使用者に提示する。このメッセージ
を聞いた使用者が、ゴルフ場がある県名が曖昧なため
「東京都かなあ。」と発声して音声対話装置30に入力
することにより、入力された音声は音声認識部11で認
識され、認識結果として、「東京都かなあ。」が選ばれ
る。
【0056】次いで、対話制御部12はこの結果を曖昧
表現語判定部38へ出力する。曖昧表現語判定部38は
この結果を受け取り、図14に示すような曖昧であるこ
とを示す言葉を項目とする曖昧表現語辞書37を参照
し、曖昧を表す言葉を含むか否かの判定を行い、その結
果を対話制御部12へ出力する。この場合、「かな
あ。」が曖昧を表す言葉として判定される。この判定結
果に対し、対話制御部12は距離計算部39に対して認
識結果から曖昧を表す言葉を取り除いた「東京都。」に
対する各県の距離を計算し、東京都と距離が近い県を選
択することを指令する。この指令に対し距離計算部39
は千葉県、埼玉県、神奈川県、山梨県を選択し辞書選択
結合部14にこれら4県に東京都を加えたゴルフ場の辞
書を結合することを指令する。この指令により、辞書選
択結合部14は音声認識辞書格納部13から千葉県、埼
玉県、神奈川県、山梨県、東京都にあるゴルフ場の辞書
を取り出して結合し、音声認識辞書の作成を行う。
【0057】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の名称の発声を促
すメッセージを出力することを指令する。この指令に対
し、応答音声出力部15は応答音声格納部16から「ゴ
ルフ場の名前をお話しください。」というメッセージを
選択し、使用者に提示する。このメッセージを聞いた使
用者が、ゴルフ場の名前「○○ゴルフ場。」と発声して
音声対話装置30に入力することにより、入力された音
声は音声認識部11で認識され、認識結果として、「○
○ゴルフ場。」が選ばれ、検索対象が確定する。
【0058】次いで、対話制御部12は応答音声出力部
15に対し、確定した検索対象「○○ゴルフ場。」を使
用者に提示することを指令する。この指令に対し、応答
音声出力部15は応答音声格納部16に格納されている
内容と「○○ゴルフ場。」を組み合わせて、「○○ゴル
フ場の地図を表示します。」というメッセージを作成
し、使用者に提示する。
【0059】以上の動作により、検索対象の目的地など
の地図をナビゲーション装置の表示画面に表示させるこ
とができる。
【0060】このように第3の実施の形態においては、
辞書選択結合部14および曖昧表現語判定部38を設け
ることにより、使用者が例えばゴルフ場の所在する県名
について曖昧にしか知らずに「東京都かなあ。」など
と、対話中の質問に対して答えたために次に行うべき指
示が確定できない場合でも、東京都から距離的に近い県
のゴルフ場の辞書を結合した音声認識辞書を作成して音
声認識を行うことによって、音声対話の流れが中断して
しまうことなく検索対象を確定することができる。した
がって、使用者が正確な答えを知らずに曖昧な応答にな
ってしまう場合でも、対話を中断することなく継続させ
ることができ、目的を達成することができる。
【0061】次に、図15〜図18は本発明の音声対話
装置の第4の実施の形態を示す図である。なお、この第
4の実施の形態は、上述した第3の実施の形態と略同様
に構成されているので、図面を流用して、同様な構成に
は同一の符号を付して特徴部分を説明する。
【0062】まず、装置構成を説明する。図15におい
て、音声対話装置40は、音声認識部11と、対話制御
部12と、辞書格納部13と、辞書選択結合部14と、
応答音声出力部15と、応答音声格納部16と、曖昧表
現語辞書37と、曖昧表現語判定部38とを備えるとと
もに、上述第3の実施の形態における構成に加えて、概
念辞書テーブル47および類似概念選択部48が設けら
れている。
【0063】概念辞書テーブル47は、図17に示すよ
うに、類似する概念を関連づけして予め設定されている
ものであり、類似概念選択部48は、概念辞書テーブル
47を参照していずれを採用するか決定するようになっ
ている。
【0064】次に本発明の音声対話装置による処理動作
を、図16に示す対話のフロー図を用いて説明する。
【0065】まず、上述第3の実施の形態と同様に、使
用者の指示により音声対話が開始されて、「ご用はなん
でしょうか。」というメッセージに対して、使用者が図
3に示す検索ジャンルの「施設検索。」を発声し、この
「施設検索。」がコマンドとして選ばれる。
【0066】そして、この「施設検索。」が指示される
と、対話制御部12は施設の種類を絞り込むために、施
設の名称と、その名称に連接する「かなあ。」、「の辺
り。」などの使用者が施設の種類が曖昧にしか知らない
場合に発声する可能性のある言葉とで構成された辞書の
作成を辞書選択結合部14に指令する。この指令によ
り、辞書選択結合部14は図18に示すように施設の名
称を主体辞書とするとともにその名称に連接する「かな
あ。」、「の辺り。」などの言葉を連接辞書とする音声
認識辞書を音声認識辞書格納部13から選択して作成す
る。
【0067】次いで、対話制御部12は音声認識部11
に対し、辞書選択結合部14が作成した辞書を用いて音
声認識を実行することを指令するとともに、応答音声出
力部15に対し、使用者に対して施設の種類の発声を促
すメッセージを出力することを指令する。この指令に対
し、応答音声出力部15は応答音声格納部16から「施
設の種類をお話ください。」というメッセージを選択
し、使用者に提示する。この「施設の種類をお話くださ
い。」というメッセージを聞いた使用者が検索したいジ
ャンルを表す言葉として、「動物園かなあ。」と発声し
て音声対話装置40に入力することにより、入力された
音声は音声認識部11で認識され、認識結果として、
「動物園かなあ。」が選ばれる。
【0068】次いで、対話制御部12はこの結果を曖昧
表現語判定部38へ出力する。曖昧表現語判定部38は
この結果を受け取り、図14に示すような曖昧であるこ
とを示す言葉を項目とする曖昧表現語辞書37を参照
し、曖昧を表す言葉を含むか否かの判定を行い、その結
果を対話制御部12へ出力する。この場合、「かな
あ。」が曖昧を表す言葉として判定される。この判定結
果に対し、対話制御部12は類似概念選択部48に対し
て認識結果から曖昧を表す言葉を取り除いた「動物
園。」と近い概念の検索ジャンルを図17に示すような
概念辞書テーブル47を参照して「遊園地。」と決定
し、この結果を対話制御部12へ出力する。対話制御部
12はこの結果を認識結果の「動物園。」と共に記憶す
る。
【0069】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対して施設の所在する県名の発声
を促すメッセージを出力することを指令する。この指令
に対し、応答音声出力部15は応答音声格納部16から
「施設のある県名をお話ください。」というメッセージ
を選択し、使用者に提示する。このメッセージを聞いた
使用者は、「大阪府。」と発声して音声対話装置40に
入力することにより、入力された音声は音声認識部11
で認識され、認識結果として、「大阪府。」が選ばれ
る。
【0070】次いで、対話制御部12は辞書選択結合部
14に対し、先に記憶した「動物園。」と「遊園地。」
の2ジャンルの辞書を結合することを指令する。この指
令により、辞書選択結合部14は音声認識辞書格納部1
3から大阪府の動物園と遊園地の施設辞書を取り出して
結合し、音声認識辞書の作成を行う。
【0071】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対して施設の名称の発声を促すメ
ッセージを出力することを指令する。この指令に対し、
応答音声出力部15は応答音声格納部16から「施設の
名前をお話しください。」というメッセージを選択し、
使用者に提示する。このメッセージを聞いた使用者が、
動物園と曖昧に記憶している遊園地の名前「○○パー
ク。」と発声して音声対話装置40に入力することによ
り、入力された音声は音声認識部11で認識され、認識
結果として、「○○パーク。」が選ばれ、検索対象が確
定する。
【0072】次いで、対話制御部12は応答音声出力部
15に対し、確定した検索対象「○○パーク。」を使用
者に提示することを指令する。この指令に対し、応答音
声出力部15は応答音声格納部16に格納されている内
容と「○○パーク。」を組み合わせて、「○○パークの
地図を表示します。」というメッセージを作成し、使用
者に提示する。
【0073】以上の動作により、検索対象の目的地など
の地図をナビゲーション装置の表示画面に表示させるこ
とができる。
【0074】このように第4の実施の形態においては、
辞書選択結合部14、曖昧表現語判定部38および類似
概念選択部48とを設けることにより、使用者が例えば
施設の種類について曖昧にしか知らずに「動物園かな
あ。」などと、対話中の質問に対して答えたために次に
行うべき指示が確定できない場合でも、動物園に類似す
る施設の遊園地の辞書を結合した音声認識辞書を作成し
て音声認識を行うことによって、音声対話の流れが中断
してしまうことなく検索対象を確定することができる。
したがって、使用者が正確な答えを知らずに曖昧な応答
になってしまう場合でも、対話を中断することなく継続
させることができ、目的を達成することができる。
【0075】次に、図19および図20は本発明の音声
対話装置の第5の実施の形態を示す図である。なお、こ
の第5の実施の形態は、上述した第1の実施の形態と略
同様に構成されているので、図面を流用して、同様な構
成には同一の符号を付して特徴部分を説明する。
【0076】まず、装置構成を説明する。図19におい
て、音声対話装置50は、音声認識部11と、対話制御
部12と、辞書格納部13と、辞書選択結合部14と、
応答音声出力部15と、応答音声格納部16とを備える
とともに、上述第1の実施の形態における不明表現語辞
書17および不明表現語判定部18に代えて、複数結果
判定部58を設けられており、この複数結果判定部58
は、対話制御部12の問い合わせに応じて音声認識結果
が複数かどうかを判定するようになっている。
【0077】次に本発明の音声対話装置による処理動作
を、図20に示す対話のフロー図を用いて説明する。な
お、ここでは、使用者が千葉県の○○ゴルフ場を検索す
ることを目的としているが、○○ゴルフ場の所在地の記
憶が曖昧で東京都か千葉県にあると認識している場合を
一例に説明する。
【0078】まず、上述第1の実施の形態と同様に、使
用者の指示により音声対話が開始されて、「ご用はなん
でしょうか。」というメッセージに対して、使用者が図
3に示す検索ジャンルの「施設検索。」を発声し、次い
で、図4に示すような検索ジャンルの音声認識辞書が作
成されて「施設の種類をお話ください。」というメッセ
ージが使用者に提示されるのに対して、使用者が「ゴル
フ場。」と発声して音声対話装置50に入力することに
より、入力された音声が音声認識部11で認識されて、
「ゴルフ場。」が検索のジャンルとして選ばれる。
【0079】そして、対話制御部12はゴルフ場の所在
地を絞り込むために辞書選択結合部14に県名を表す言
葉で構成された辞書の作成を指令する。この指令によ
り、辞書選択結合部14は音声認識辞書格納部13から
図9に示すような県名で構成された音声認識辞書の作成
を行う。
【0080】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の所在する県名の
発声を促すメッセージを出力することを指令する。この
指令に対し、応答音声出力部15は応答音声格納部16
から「ゴルフ場のある県名をお話ください。」というメ
ッセージを選択し、使用者に提示する。このメッセージ
を聞いた使用者が、ゴルフ場がある県名が曖昧なため
「東京都か千葉県。」と発声して音声対話装置50に入
力することにより、入力された音声は音声認識部11で
認識され、認識結果として、「東京都か千葉県。」が得
られる。
【0081】次いで、対話制御部12はこの結果を複数
結果判定部58へ出力する。複数結果判定部58はこの
結果を受け取り、認識結果中に県名をあらわす言葉とし
て東京都と千葉県の2つが含まれると判定する。その結
果を対話制御部12へ出力する。この判定結果に対し、
対話制御部12は辞書選択結合部14に東京都のゴルフ
場の辞書と千葉県のゴルフ場の辞書を結合した辞書の作
成を指令する。この指令により、辞書選択結合部14は
音声認識辞書格納部13から東京都のゴルフ場の辞書と
千葉県のゴルフ場の辞書を取り出して結合し音声認識辞
書の作成を行う。
【0082】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の名称の発声を促
すメッセージを出力することを指令する。この指令に対
し、応答音声出力部15は応答音声格納部16から「ゴ
ルフ場の名前をお話ください。」というメッセージを選
択し、使用者に提示する。このメッセージを聞いた使用
者が、ゴルフ場の名前「○○ゴルフ場。」と発声して音
声対話装置50に入力することにより、入力された音声
は音声認識部11で認識され、認識結果として、「○○
ゴルフ場。」が選ばれ、検索対象が確定する。
【0083】次いで、対話制御部12は応答音声出力部
15に対し、確定した検索対象「○○ゴルフ場。」を使
用者に提示することを指令する。この指令に対し、応答
音声出力部15は応答音声格納部16に格納されている
内容と「○○ゴルフ場。」を組み合わせて、「○○ゴル
フ場の地図を表示します。」というメッセージを作成
し、使用者に提示する。
【0084】以上の動作により、検索対象の目的地など
の地図をナビゲーション装置の表示画面に表示させるこ
とができる。
【0085】このように第5の実施の形態においては、
辞書選択結合部14および複数結果判定部58を設ける
ことにより、使用者が例えばゴルフ場の所在する県名を
良く知らずに「東京都か千葉県。」と、対話中の質問に
対して答えたために次に行うべき指示が確定できない場
合でも、東京都のゴルフ場の辞書と千葉県のゴルフ場の
辞書を取り出して結合した音声認識辞書を作成し音声認
識を行うことによって、音声対話の流れが中断してしま
うことなく検索対象を確定することができる。したがっ
て、使用者が正確な答えを知らずに曖昧な応答になって
しまう場合でも、対話を中断することなく継続させるこ
とができ、目的を達成することができる。
【0086】次に、図21および図22は本発明の音声
対話装置の第6の実施の形態を示す図である。なお、こ
の第6の実施の形態は、上述した第5の実施の形態と略
同様に構成されているので、図面を流用して、同様な構
成には同一の符号を付して特徴部分を説明する。
【0087】まず、装置構成を説明する。図21におい
て、音声対話装置60は、音声認識部11と、対話制御
部12と、辞書格納部13と、応答音声出力部15と、
応答音声格納部16と、複数結果判定部58とを備える
とともに、上述第5の実施の形態における辞書選択結合
部14に代えて、上述第2の実施の形態で採用した辞書
選択部24を採用しており、また加えて、入力蓄積部6
1を設けている。
【0088】ここで、音声認識部11は、使用者が入力
した音声を認識するのと同時にその入力音声を音響分析
した結果も入力蓄積部61へ出力するようになってお
り、この入力蓄積部61は、音声認識部11から出力さ
れる入力音声またはその入力音声の音響分析結果を蓄積
するようになっている。
【0089】なお、辞書選択部24は、対話制御部12
からの指令により辞書格納部13内に格納されている音
声認識辞書を1個選択することにより音声認識部11が
用いる音声認識辞書を作成する。
【0090】次に本発明の音声対話装置による処理動作
を、図22に示す対話のフロー図を用いて説明する。
【0091】まず、上述第5の実施の形態と同様に、使
用者の指示により音声対話が開始されて、「ご用はなん
でしょうか。」というメッセージに対して、使用者が図
3に示す検索ジャンルの「施設検索。」を発声し、次い
で、「施設の種類をお話ください。」というメッセージ
に対して、使用者が図4に示す検索ジャンルの「ゴルフ
場。」を発声し、次いで、検索ジャンルが「ゴルフ
場。」であることから、図9に示すような検索ジャンル
の音声認識辞書を作成して「ゴルフ場のある県名をお話
ください。」というメッセージを使用者に提示するのに
対して、その使用者がゴルフ場がある県名が曖昧である
ために「東京都か千葉県。」と発声して音声対話装置5
0に入力することにより、入力された音声は音声認識部
11で認識され、認識結果として、「東京都か千葉
県。」が得られる。
【0092】そして、複数結果判定部58は音声認識部
11による認識結果中に県名を表す言葉として東京都と
千葉県の2つが含まれると判定することになり、この判
定結果に対し、対話制御部12は、まずは、辞書選択部
24に東京都のゴルフ場の辞書の選択作成を指令する。
この指令により、辞書選択部24は音声認識辞書格納部
13から東京都のゴルフ場の辞書を取り出して音声認識
辞書を作成する。
【0093】次いで、対話制御部12は応答音声出力部
15に対し、使用者に対してゴルフ場の名称の発声を促
すメッセージを出力することを指令する。この指令に対
し、応答音声出力部15は応答音声格納部16から「ゴ
ルフ場の名前をお話ください。」というメッセージを選
択し、使用者に提示する。
【0094】次いで、対話制御部12は音声認識部11
に対し、辞書選択部24が作成した辞書を用いて音声認
識を実行することを指令する。先のメッセージを聞いた
使用者が、ゴルフ場の名前「○○ゴルフ場。」を発声し
て音声対話装置50に入力することにより、入力された
音声は音声認識部11で認識され、認識結果として「×
×ゴルフ場。」が得られるのと同時に、使用者が発声し
た「○○ゴルフ場。」の入力を入力音声の形で、または
その入力音声を音響分析した結果の形で入力蓄積部61
へ出力し蓄積させる。
【0095】次いで、対話制御部12は応答音声出力部
15に対し、認識結果である「××ゴルフ場。」を使用
者に提示することを指令する。この指令に対し、応答音
声出力部15は応答音声格納部16に格納されている内
容と「××ゴルフ場。」を組み合わせて、「××ゴルフ
場ですか。」というメッセージを作成し、使用者に提示
する。
【0096】次いで、対話制御部12は音声認識部11
に対し、辞書選択部24が作成した辞書を用いて音声認
識を実行することを指令する。これに対し使用者が、期
待する結果ではないため「違う。」と発声して音声対話
装置50に入力することにより、入力された音声は音声
認識部11で認識され、認識結果として、「違う。」が
得られる。
【0097】次いで、対話制御部12は先の東京都の選
択対話が誤っていたため、辞書選択部24に千葉県のゴ
ルフ場の辞書の作成を指令する。この指令により、辞書
選択部24は音声認識辞書格納部13から千葉県のゴル
フ場の辞書を取り出して音声認識辞書を作成する。
【0098】次いで、対話制御部12は音声認識部11
に対し、辞書選択部24が作成した辞書を用いて、入力
蓄積部61から先の入力を取り出して音声認識を実行す
ることを指令することにより、その認識結果として「○
○ゴルフ場。」が得られる。
【0099】次いで、対話制御部12は応答音声出力部
15に対し、「○○ゴルフ場。」を使用者に提示するこ
とを指令する。この指令に対し、応答音声出力部15は
応答音声格納部16に格納されている内容と「○○ゴル
フ場。」を組み合わせて、「○○ゴルフ場の地図を表示
します。」というメッセージを作成し、使用者に提示す
る。
【0100】以上の動作により、検索対象の目的地など
の地図をナビゲーション装置の表示画面に表示させるこ
とができる。
【0101】このように第6の実施の形態においては、
辞書選択部24、複数結果判定部58および入力蓄積部
61を設けることにより、使用者が例えばゴルフ場の所
在する県名を良く知らずに「東京都か千葉県。」と、対
話中の質問に対して答えたために次に行うべき指示が確
定できない場合でも、東京都のゴルフ場の辞書での音声
認識結果と千葉県のゴルフ場の辞書での音声認識結果を
順次求めて、その認識結果を提示することによって、音
声対話の流れが中断してしまうことなく検索対象を確定
することができる。したがって、使用者が正確な答えを
知らずに曖昧な応答になってしまう場合でも、対話を中
断することなく継続させることができ、目的を達成する
ことができる。
【0102】
【発明の効果】以上説明したように、本発明によれば、
音声認識された使用者の音声の内容が次の指示を確定で
きない内容のときには、対話を継続するのに有効な音声
認識辞書を辞書格納手段内から準備するので、続けて、
質問音声や応答音声などを出力し対話を継続することが
できる。したがって、使用者が応答できない場合や曖昧
な答えしかできない場合でも、対話を中断することなく
継続させて目的を達成することができる、という優れた
効果を有する音声対話装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の音声対話装置の第1実施形態の概略全
体構成を示す関係ブロック図
【図2】本発明の音声対話装置の第1実施形態による処
理動作を説明する対話フロー図
【図3】本発明の音声対話装置の第1実施形態が用いる
音声認識辞書を示す概念図
【図4】本発明の音声対話装置の第1実施形態が用いる
音声認識辞書を示す概念図
【図5】本発明の音声対話装置の第1実施形態が用いる
音声認識辞書を示す概念図
【図6】本発明の音声対話装置の第1実施形態が用いる
音声認識辞書を示す概念図
【図7】本発明の音声対話装置の第2実施形態の概略全
体構成を示す関係ブロック図
【図8】本発明の音声対話装置の第2実施形態による処
理動作を説明する対話フロー図
【図9】本発明の音声対話装置の第2実施形態が用いる
音声認識辞書を示す概念図
【図10】本発明の音声対話装置の第2実施形態の他の
実施形態を示す処理動作を説明する対話フロー図
【図11】本発明の音声対話装置の第3実施形態の概略
全体構成を示す関係ブロック図
【図12】本発明の音声対話装置の第3実施形態による
処理動作を説明する対話フロー図
【図13】本発明の音声対話装置の第3実施形態が用い
る音声認識辞書を示す概念図
【図14】本発明の音声対話装置の第3実施形態が用い
る音声認識辞書を示す概念図
【図15】本発明の音声対話装置の第4実施形態の概略
全体構成を示す関係ブロック図
【図16】本発明の音声対話装置の第4実施形態による
処理動作を説明する対話フロー図
【図17】本発明の音声対話装置の第4実施形態が用い
る音声認識辞書を示す概念図
【図18】本発明の音声対話装置の第4実施形態が用い
る音声認識辞書を示す概念図
【図19】本発明の音声対話装置の第5実施形態の概略
全体構成を示す関係ブロック図
【図20】本発明の音声対話装置の第5実施形態による
処理動作を説明する対話フロー図
【図21】本発明の音声対話装置の第6実施形態の概略
全体構成を示す関係ブロック図
【図22】本発明の音声対話装置の第6実施形態による
処理動作を説明する対話フロー図
【図23】従来技術による処理動作を説明する対話フロ
ー図
【符号の説明】
10〜60 音声対話装置 11 音声認識部 12 対話制御部 13 音声認識辞書格納部 14 辞書選択結合部 15 応答音声出力部 16 応答音声格納部 17 不明表現語辞書 18 不明表現語判定部 24 辞書選択部 37 曖昧表現語辞書 38 曖昧表現語判定部 39 距離計算部 47 概念辞書テーブル 48 類似概念選択部 58 複数結果判定部 61 入力蓄積部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // G01C 21/00 G10L 3/00 571H G08G 1/0969 R 571U

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力した音声を認識する音声認識手段
    と、対話の階層毎に音声認識辞書が格納されている辞書
    格納手段と、対話に応じた辞書を準備する辞書準備手段
    と、発声を促す音声を出力する応答音声出力手段と、前
    記音声認識手段により確定することができないときに対
    話を継続するような前記音声認識辞書を前記辞書準備手
    段に準備させて前記応答音声出力手段から音声を出力さ
    せる対話制御手段とを備えることを特徴とする音声対話
    装置。
  2. 【請求項2】 前記辞書準備手段は、前記辞書格納手段
    内の前記音声認識辞書を選択結合して対話に必要な辞書
    を準備し、 前記対話制御手段は、前記音声認識手段により認識され
    た音声が不明なときには、次に遷移する可能性のある階
    層の前記辞書格納手段内の前記音声認識辞書を前記辞書
    準備手段に選択結合させて準備させることを特徴とする
    請求項1に記載の音声対話装置。
  3. 【請求項3】 前記辞書準備手段は、前記辞書格納手段
    内の前記音声認識辞書を選択して対話に必要な辞書を準
    備し、 前記対話制御手段は、前記音声認識手段により認識され
    た音声が不明なときには、前記応答音声出力手段に別の
    質問をする音声を出力させて前記辞書準備手段に前記辞
    書格納手段から対話に必要な前記音声認識辞書を選択準
    備させることを特徴とする請求項1に記載の音声対話装
    置。
  4. 【請求項4】 前記辞書準備手段は、前記辞書格納手段
    内の前記音声認識辞書を選択結合して対話に必要な辞書
    を準備し、 前記対話制御手段は、前記音声認識手段により認識され
    た音声が1回目の不明なことを意味する内容のときに
    は、前記応答音声出力手段に別の質問をする音声を出力
    させて前記辞書準備手段に前記辞書格納手段から対話に
    必要な前記音声認識辞書を選択準備させるとともに、前
    記音声認識手段により認識された音声が不明な状態が続
    いたときには、次に遷移する可能性のある階層全ての前
    記辞書格納手段内の前記音声認識辞書を前記辞書準備手
    段に選択結合させて準備させることを特徴とする請求項
    1に記載の音声対話装置。
  5. 【請求項5】 前記辞書準備手段は、前記辞書格納手段
    内の前記音声認識辞書を選択結合して対話に必要な辞書
    を準備し、 前記対話制御手段は、前記音声認識手段により認識され
    た音声が曖昧であることを表す内容のときには、前記音
    声から曖昧さを表す部分を除いた言葉に対応する前記辞
    書格納手段内の前記音声認識辞書と、前記音声の前記曖
    昧さを表す部分を除いた前記言葉に概念的に近い内容を
    含む前記辞書格納手段内の前記音声認識辞書とを前記辞
    書準備手段に選択結合させて準備させることを特徴とす
    る請求項1に記載の音声対話装置。
  6. 【請求項6】 前記辞書準備手段は、前記辞書格納手段
    内の前記音声認識辞書を選択結合して対話に必要な辞書
    を準備し、 前記対話制御手段は、前記音声認識手段により認識され
    た音声が複数の内容を含むときには、前記複数の内容毎
    に対応する前記辞書格納手段内の前記音声認識辞書の複
    数を前記辞書準備手段に選択結合させて準備させること
    を特徴とする請求項1に記載の音声対話装置。
  7. 【請求項7】 前記辞書準備手段は、前記辞書格納手段
    内の前記音声認識辞書を一つ選択して対話に必要な辞書
    を準備し、 前記対話制御手段は、前記音声認識手段により認識され
    た音声が複数の内容を含むときには、前記内容に含まれ
    る一つの内容に対応する前記辞書格納手段内の前記音声
    認識辞書を前記辞書準備手段に選択準備させて、前記応
    答音声出力手段に質問をする音声を出力させることによ
    り、前記音声認識手段により認識される音声で対話の正
    誤を確認し、誤っていた場合には、前記音声に含まれる
    他の内容に対応する前記辞書格納手段内の前記音声認識
    辞書を前記辞書準備手段に選択準備させることを特徴と
    する請求項1に記載の音声対話装置。
JP2001284377A 2001-09-19 2001-09-19 音声対話装置 Expired - Lifetime JP3576511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001284377A JP3576511B2 (ja) 2001-09-19 2001-09-19 音声対話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001284377A JP3576511B2 (ja) 2001-09-19 2001-09-19 音声対話装置

Publications (2)

Publication Number Publication Date
JP2003091297A true JP2003091297A (ja) 2003-03-28
JP3576511B2 JP3576511B2 (ja) 2004-10-13

Family

ID=19107709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001284377A Expired - Lifetime JP3576511B2 (ja) 2001-09-19 2001-09-19 音声対話装置

Country Status (1)

Country Link
JP (1) JP3576511B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199315A (ja) * 2006-01-25 2007-08-09 Ntt Software Corp コンテンツ提供装置
WO2008072413A1 (ja) * 2006-12-15 2008-06-19 Mitsubishi Electric Corporation 音声認識装置
JP2009036998A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
JP2009036999A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0630064B2 (ja) * 1986-01-17 1994-04-20 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション エキスパート・システムにおける情報収集方法
JPH08255150A (ja) * 1995-03-17 1996-10-01 Toshiba Corp 情報公開装置及びマルチモーダル情報入出力システム
JPH1031497A (ja) * 1996-07-18 1998-02-03 Hitachi Ltd 音声対話制御方法および音声対話システム
JP2000331002A (ja) * 1999-05-14 2000-11-30 Sony Corp 検索装置、検索方法、検索制御プログラムを記録した記録媒体
JP2001083988A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声検索装置、音声検索のための制御プログラムとデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP3186655B2 (ja) * 1996-07-31 2001-07-11 アイシン・エィ・ダブリュ株式会社 車両用ナビゲーション装置及び記憶媒体
JP2002123284A (ja) * 2000-10-12 2002-04-26 Pioneer Electronic Corp 音声認識装置ならびに方法
JP2002169828A (ja) * 2000-11-30 2002-06-14 Mitsubishi Electric Corp 移動体用ナビゲーション装置
JP2002267472A (ja) * 2001-03-07 2002-09-18 Kenwood Corp ナビゲーションシステム、誘導経路探索方法およびプログラム
JP2003067516A (ja) * 2001-08-29 2003-03-07 Yasushi Tsuneyama 生活情報提供方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0630064B2 (ja) * 1986-01-17 1994-04-20 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション エキスパート・システムにおける情報収集方法
JPH08255150A (ja) * 1995-03-17 1996-10-01 Toshiba Corp 情報公開装置及びマルチモーダル情報入出力システム
JPH1031497A (ja) * 1996-07-18 1998-02-03 Hitachi Ltd 音声対話制御方法および音声対話システム
JP3186655B2 (ja) * 1996-07-31 2001-07-11 アイシン・エィ・ダブリュ株式会社 車両用ナビゲーション装置及び記憶媒体
JP2000331002A (ja) * 1999-05-14 2000-11-30 Sony Corp 検索装置、検索方法、検索制御プログラムを記録した記録媒体
JP2001083988A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声検索装置、音声検索のための制御プログラムとデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2002123284A (ja) * 2000-10-12 2002-04-26 Pioneer Electronic Corp 音声認識装置ならびに方法
JP2002169828A (ja) * 2000-11-30 2002-06-14 Mitsubishi Electric Corp 移動体用ナビゲーション装置
JP2002267472A (ja) * 2001-03-07 2002-09-18 Kenwood Corp ナビゲーションシステム、誘導経路探索方法およびプログラム
JP2003067516A (ja) * 2001-08-29 2003-03-07 Yasushi Tsuneyama 生活情報提供方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199315A (ja) * 2006-01-25 2007-08-09 Ntt Software Corp コンテンツ提供装置
WO2008072413A1 (ja) * 2006-12-15 2008-06-19 Mitsubishi Electric Corporation 音声認識装置
US8195461B2 (en) 2006-12-15 2012-06-05 Mitsubishi Electric Corporation Voice recognition system
JP2009036998A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
JP2009036999A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体

Also Published As

Publication number Publication date
JP3576511B2 (ja) 2004-10-13

Similar Documents

Publication Publication Date Title
US7260537B2 (en) Disambiguating results within a speech based IVR session
US6385582B1 (en) Man-machine system equipped with speech recognition device
US6968311B2 (en) User interface for telematics systems
KR100556050B1 (ko) 적어도위치및/또는거리이름들을위한입력시스템
EP1286330B1 (en) Method and apparatus for data entry by voice under adverse conditions
US7826945B2 (en) Automobile speech-recognition interface
US6961706B2 (en) Speech recognition method and apparatus
US9123327B2 (en) Voice recognition apparatus for recognizing a command portion and a data portion of a voice input
JPWO2015151157A1 (ja) 意図理解装置および方法
JP3278222B2 (ja) 情報処理方法及び装置
JP2000194386A (ja) 音声認識応答装置及び方法
WO2006040969A1 (ja) 対話支援装置
KR19990008459A (ko) 개선된 신뢰도의 단어 인식방법 및 단어 인식기
JP2008009153A (ja) 音声対話システム
JP3576511B2 (ja) 音声対話装置
JP4684583B2 (ja) 対話装置
JPH09114493A (ja) 対話制御装置
JP3340163B2 (ja) 音声認識装置
JP2003177788A (ja) 音声対話システムおよびその方法
JP6851491B2 (ja) 音声対話制御装置および音声対話制御方法
JP3755941B2 (ja) 音声対話装置及び対話方法
JP3285954B2 (ja) 音声認識装置
Georgila et al. A speech-based human-computer interaction system for automating directory assistance services
JP3663012B2 (ja) 音声による入力装置
JP2006133296A (ja) 音声対話装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040707

R150 Certificate of patent or registration of utility model

Ref document number: 3576511

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070716

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080716

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 9

EXPY Cancellation because of completion of term