JP2009025517A - 車載用情報提供対話装置 - Google Patents

車載用情報提供対話装置 Download PDF

Info

Publication number
JP2009025517A
JP2009025517A JP2007188064A JP2007188064A JP2009025517A JP 2009025517 A JP2009025517 A JP 2009025517A JP 2007188064 A JP2007188064 A JP 2007188064A JP 2007188064 A JP2007188064 A JP 2007188064A JP 2009025517 A JP2009025517 A JP 2009025517A
Authority
JP
Japan
Prior art keywords
user
vehicle information
task
information providing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007188064A
Other languages
English (en)
Inventor
Eiji Tonozuka
英治 外塚
Minoru Togashi
実 冨樫
Takeshi Ono
健 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP2007188064A priority Critical patent/JP2009025517A/ja
Publication of JP2009025517A publication Critical patent/JP2009025517A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】手詰まり状態を解消できる車載用情報提供対話装置を提供することにある。
【解決手段】
本発明の車載用情報提供対話装置は、ユーザがマイク101に入力した情報に基づいて、所定のタスクを達成する制御部310と、タスクの進捗状況に基づいて、ユーザに手詰まり状態が発生したか判断する判定部313と、手詰まり状態が発生したとの判断に基づいて、オペレータ110側の通信装置1091とハンドオーバ接続する通信装置107とを備えている。
【選択図】図3

Description

本発明は、ナビゲーションシステムなどに使用される車載用情報提供対話装置に関する。
車載ナビゲーションシステムなどの車載機器の入力インタフェースとして音声認識装置が用いられている。
このような音声認識装置の具備する認識語彙が限られるという問題や、ユーザの発音やアクセントの癖などの発話上の問題があるために、音声認識装置がユーザの発話した言葉を正確に認識できないという問題があった。
音声認識装置に誤認識があって、ユーザが再度認識させるために発話しても誤認識が複数回連続してしまうと、ユーザがどのような言葉を発話して良いのか判断できずに、ユーザの手詰まり状態が発生していた。そこで、従来、ユーザの発話がない状態が一定時間以上経過した場合、システムが自発的に発話をすることで、ユーザの発話を促すことができる音声対話装置(特許文献1参照)が提案されている。
特開2002−196789号公報
しかしながら、特許文献1に示した従来の音声対話装置でも、ユーザに手詰まり状態が発生し無発話状態が一定時間以上経過して、音声対話装置が自動応答文を出力して会話を自発的に行ったとしても、ユーザの発話の全て対して最適な応答文を準備できるものではなく、ユーザが当該手詰まり状態を解消できない場合もあるという問題があった。
本発明は、こうした問題に鑑みてなされたものであり、手詰まり状態を解消できる車載用情報提供対話装置を提供することを目的とする。
上記目的達成のため、本発明に係る車載用情報提供対話装置では、ユーザが入力手段に入力した情報に基づいて、所定のタスクを達成する制御手段と、タスクの進捗状況に基づいて、ユーザに手詰まり状態が発生したか判断する手詰まり状態判断手段と、手詰まり状態が発生したとの判断に基づいて、オペレータ側とハンドオーバ接続する通信手段とを備えることを特徴としている。
本発明により、ユーザに手詰まり状態が発生したと判断した場合、通信手段は自動的に、オペレータ側とハンドオーバ接続するので、ユーザはオペレータと対話することができ、手詰まり状態を確実に解消することができる。
以下に、本発明の実施形態に係る車載用情報提供対話装置について、図1乃至図10を参照して説明する。本実施形態に係る車載用情報提供対話装置は、ナビゲーションシステムなどに使用されている。
まず、本実施形態に係る車載用情報提供対話装置を含むナビゲーションシステムについて図1を参照して説明する。図1は、本発明の実施形態に係る車載用情報提供対話装置を含むナビゲーションシステム10の構成図である。図1に示すナビゲーションシステム10は、車両に搭載された車載用情報提供対話装置と、オペレータ110が常駐するオペレーションセンタ109とを備えている。更に、車載用情報提供対話装置とオペレーションセンタ109を接続する通信網20を備えている。本実施形態に係る車載用情報提供対話装置は、ユーザが音声認識を開始するための発話スイッチ100と、ユーザの発話音声を入力する音声入力手段であるマイク101と、音声出力を行うためのスピーカ102とを備えている。また、ナビゲーション装置103と、当該ナビゲーション装置103が出力する地図、メニュー画面または音声認識結果を表示するディスプレイ104を備えている。更に、ユーザの発話音声(音声データ)を録音するための録音手段である録音装置105と、撮影されたユーザの表情を録画するための録画手段である録画装置106とを備えている。オペレータ110側とハンドオーバ接続するためのオペレータ接続スイッチ108と、車外との通信を行うための通信手段である通信装置107とを備えている。なお、本実施形態における通信装置107は、マルチアクセス機能を備えている。このため、後述する送信データをオペレータ110側に送信できる。
また、ナビゲーション装置103は、マイク101を介して入力された音声を音声データにAD変換するA/Dコンバータ1031と、スピーカ102から音声を出力するためにDA変換するD/Aコンバータ1032と、出力アンプ1033とを備えている。更に、A/Dコンバータ1031によりAD変換された音声データを音声認識する信号処理装置1034と、施設の正式名称および位置を保持するデータベースを有する外部記憶装置1035とを備えている。信号処理装置1034は、当該音声認識結果の内容に応じて施設や経路を検索して当該検索結果を表示し、または、音声認識結果の内容に応じて応答を返している。なお、図1に示すように、信号処理装置1034は、主にCPU1034aとメモリ1034bから構成される。また、外部記憶装置1035は、ユーザが所定のタスクを選択するメニュー項目を階層構造にしたデータベース、対話履歴保持装置301(図2参照)およびキャンセル回数保持装置302(図2参照)も備えている。
一方、オペレーションセンタ109は、通信装置107と通信を行うための通信装置1091と、通信装置1091を介して送信されたデータを処理するデータ処理部1092と、当該データを表示するため、または、検索を行うためのパソコン1093と、ユーザと対話を行うための電話1094とを備えている。これにより、オペレータ接続スイッチ108をユーザが押下した場合、マイク101、スピーカ102、ナビゲーション装置103、通信装置107、通信網20、通信装置1091および電話1094を介して、ユーザはオペレータ110と対話することができる。
また、本実施形態では、タスクの進捗状況に基づいて、ユーザに手詰まり状態が発生したか否か判断する。後述するが、例えば、検索語彙が分からない場合、または、目的とする項目が含まれる階層に到達できない場合、ユーザに手詰まり状態が発生したと判断する。ユーザに手詰まり状態が発生したと判断した場合、ユーザとオペレータ110が対話できるように、信号処理装置1034からの信号に基づいて、通信装置107は、オペレータ110側の通信装置1091とハンドオーバ接続する。
次に、図1に示した信号処理装置1034および外部記憶装置1035の内部構成について説明する。図2は、図1に示す信号処理装置1034および外部記憶装置1035のブロック図である。図2に示すように、信号処理装置1034は、A/Dコンバータ1031によりAD変換された音声データを音声認識する音声認識部303を備えている。また、ユーザがマイク101に入力した情報(音声データ)に基づいて、所定のタスクを達成する制御部310も備えている。一方、外部記憶装置1035は、タスクの履歴情報であるユーザとシステム(信号処理装置1034の制御処理)の対話履歴(以下、対話履歴保持内容とする。)を保持する対話履歴保持装置301を備えている。更に、ユーザがシステムの応答に対してキャンセルした回数(以下、キャンセル回数とする。)を保持するキャンセル回数保持手段であるキャンセル回数保持装置302を備える。
ここで、制御部310は、対話履歴保持内容を更新する履歴更新手段である対話履歴更新部311と、キャンセル回数を更新するキャンセル回数更新手段であるキャンセル回数更新部312を備えている。また、キャンセル回数からユーザに手詰まり状態が発生したか否か判断する手詰まり状態判断手段である判定部313を備えている。更に、タスクの種類に基づいて、対話履歴保持内容のうち必要なデータを決定する送信データ決定手段である送信データ決定部314を備えている。また、送信データ決定部314で決定された必要なデータから、オペレータ110側に送信する送信データを作成する送信データ作成手段である送信データ作成部315を備えている。なお、本実施形態の送信データはテキストデータである。また、ユーザに手詰まり状態が発生したと判定部313が判断した場合、通信装置107は、制御部310により、オペレータ110側の通信装置1091とハンドオーバ接続する。また、ユーザに手詰まり状態が発生したと判定部313が判断した場合、通信装置107は、通信網20、通信装置1091を介して、上記送信データをデータ処理部1092に送信する。更に、ユーザに手詰まり状態が発生したと判定部313が判断した場合、通信装置107は、制御部310により、録画装置106で録画された録画データおよび上記音声データをデータ処理部1092に送信する。
次に、図1に示した信号処理装置1034の制御処理について説明する。図3は、図1に示す信号処理装置1034の制御処理の流れを示すフローチャートである。まず、ユーザが発話スイッチ100を操作し、発話開始が指示されると(ステップ201)、制御部310は、上記発話開始の指示を検出して、ユーザの発話音声が入力されたか否かを判断する(ステップ202)。具体的には、マイク101から入力された発話音声(アナログ信号)はA/Dコンバータで音声データ(デジタル信号)に変換され、信号処理装置1034の制御部310に入力される。制御部310は、発話スイッチ100の操作がなされるまでは、無発話音声状態におけるデジタル信号の平均パワーを演算している。発話スイッチ100が操作された後、音声データの瞬間パワーと上記平均パワーとを比較する。発話スイッチ100が操作されたにも関わらず、音声データの瞬間パワーが所定値未満である場合、ユーザが発話していないと判断し(ステップ202:No)、ステップ207に遷移する。一方、制御部310は、音声データの瞬間パワーが所定値以上であったとき、ユーザが発話したと判断し(ステップ202:Yes)、音声取り込みを開始する。更に、制御部310は、取り込んだ音声データを録音装置105に録音する。
次に、音声認識部303は、上記の取り込んだ音声データに基づいて、メモリ1034bにある待ち受け文とのマッチングによる音声認識処理を実施する(ステップ203)。当該音声認識処理では、上記の取り込んだ音声データと各待ち受け文との音響的な近さである音響尤度が計算され、当該音響尤度が高いものから順に上位N個(=N−best)が音声認識結果の候補となる。更に、音声認識部303は、音声認識結果のN−bestに対して信頼度計算を実施する(ステップ204)。次に、制御部310は、音声認識部303における信頼度計算の結果から最適なものを音声認識結果として選択し、応答(システム応答)を生成する(ステップ205)。次に、制御部310は、当該応答をディスプレイ104に表示し、D/Aコンバータ1032および出力アンプ1033を介して、当該応答をスピーカ102から出力する(ステップ206)。
次に、制御部310は、目的地設定などのタスクが完了したか否か判断する(ステップ207)。タスクが完了したと判断した場合(ステップ207:Yes)、音声認識を終了する(ステップ215)。一方、タスクが完了していないと判断した場合(ステップ207:No)、当該判断に基づいて、対話履歴更新部311は、対話履歴保持装置301に保持された対話履歴保持内容を更新する(ステップ208)。次に、キャンセル回数更新部312は、更新された対話履歴保持内容に基づいて、キャンセル回数を更新する必要があるか否か判断する(ステップ209)。ここで、キャンセル回数更新部312は、ユーザがシステムの応答に対してユーザがキャンセルした場合に、キャンセル回数を更新する必要があると判断する。上記キャンセルは、ユーザがシステムの「〜ですか?」のような確認型の応答に対して、「いいえ」と答える場合だけでなく、ユーザが思っていた答えが出力されていないシステム応答に対して、ユーザが入力するコマンド全般を意味する。例えば、ユーザが所定のタスクを選択するメニュー項目の階層を上階層に1つ戻る内容のコマンドを意味する「戻る」や、同一階層に複数のリストがある場合において、次のリストを確認するためのコマンドを意味する「次」も含めている。これらの「戻る」および「次」も、システムの応答で提示された情報以外の情報が欲しい場合に用いるコマンドだからである。
次に、キャンセル回数更新部312がキャンセル回数を更新する必要がないと判断した場合(ステップ209:No)、制御部310はユーザの発話音声を再度待つ(ステップ202)。一方、キャンセル回数更新部312がキャンセル回数を更新する必要があると判断した場合(ステップ209:Yes)、キャンセル回数更新部312は、キャンセル回数保持装置302に保持されたキャンセル回数を1増加する(ステップ210)。次に、判定部313は、増加されたキャンセル回数と閾値を比較し(ステップ211)、ユーザに手詰まり状態が発生したか否か判断する。ここで、判定部313はキャンセル回数と比較するための閾値を保持しているが、当該閾値の設定方法は、例えば、「キャンセルは3回まで」のような閾値を固定する形式でも良い。また、「通常時において、キャンセル回数が少ない人は閾値の回数を少なくする」のような使用するごとに学習する形式でも良い。増加されたキャンセル回数が閾値以下であると判定部313が判断した場合(ステップ211:<閾値)、すなわち、ユーザに手詰まり状態が発生していない場合、制御部310はユーザの発話音声を再度待つ(ステップ202)。
一方、増加されたキャンセル回数が閾値を越えたと判定部313が判断した場合(ステップ211:≧閾値)、すなわち、ユーザに手詰まり状態が発生した場合、送信データ決定部314は、タスクの種類に基づいて、ステップ208で更新された対話履歴保持内容のうち、送信データとして必要なデータを決定する(ステップ212)。次に、送信データ作成部315は、送信データ決定部314で決定された必要なデータから、オペレータ110側に送信する送信データを作成する(ステップ213)。これから、送信データがオペレータ110にとって理解しやすい最適な形式に整理している。次に、通信装置107は、制御部310により、オペレータ110側の通信装置1091とハンドオーバ接続する(ステップ214)。また、通信装置107は、通信網20、通信装置1091を介して、上記送信データ、録画装置106で録画された録画データおよび上記音声データをデータ処理部1092に送信する。これより、ユーザが思っていた答えが出力されていないシステム応答に対して入力するコマンドを入力した場合、キャンセル回数を増加させることで、ユーザが欲しい出力結果とシステムの応答の不一致が続くことによる手詰まり状態を確実に検出できる。これから、自動的にハンドオーバ接続することができる。よって、ユーザはオペレータ110と対話することができ、手詰まり状態を確実に解消することができる。更に、上記送信データをデータ処理部1092に送信することで、オペレータ110は、後述する、ハンドオーバ接続発生までのユーザとシステムの対話履歴を見ることができる。これから、ユーザはオペレータ110に対して最初から説明する必要がなくなり、オペレータ110との対話を短い接続時間で終了することができ、ユーザが選択した目的地設定などのタスクを短時間で完了させることができる。
次に、対話履歴保持装置301に保持された対話履歴保持内容について説明する。図4は、対話履歴保持内容401の一例を示す図である。図4に示すように、本実施形態に係る対話履歴保持内容401は、システムに対してユーザがどのような検索項目を現在行っているかを示す情報を保持している。GPS(Global Positioning System)の情報から現在の自車両走行位置の情報を保持している。また、ハンドオーバ接続発生までのユーザとシステムの対話履歴、すなわち、ユーザの発話音声に対する音声認識結果と当該音声認識結果におけるシステムの応答との履歴を保持している。
以下、ユーザに手詰まり状態が発生した場合の具体例として、目的地をジャンルで検索する場合(対話例1)、目的地を周辺施設で検索する場合(対話例2)、目的地を施設名称で検索する場合におけるシステムが誤認識を繰り返す場合(対話例3)の3シーンについて説明する。まず、目的地をジャンルで検索する場合について図5および図6を参照して説明する。図5はユーザとシステムの対話例1を示す図、図6は図5に示す対話例1における対話履歴保持内容601と送信データ602を示す図である。図5に示すように、ユーザが発話スイッチ100を押すと(ステップU11)、システムは「検索方法をどうぞ」の案内を行う(ステップS11)。次に、ユーザが「ジャンルで探す」の発話を行うと(ステップU12)、システムは「ジャンル名をどうぞ」の案内を行う(ステップS12)。対話履歴更新部311は、対話履歴保持内容601の検索中欄に「ジャンル検索中」を記述する。ユーザが「テーマパーク」の発話を行うと(ステップU13)、システムは「県名をどうぞ」の案内を行う(ステップS13)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「テーマパーク」を記述する。ユーザが「神奈川県」の発話を行うと(ステップU14)と、システムは「神奈川県のテーマパークを提示します。」の案内を行う(ステップS14)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「神奈川県」を記述する。
次に、ユーザが「戻る」の発話を行うと(ステップU15)、システムは「県名をどうぞ」の案内を行う(ステップS15)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「モドル」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。ユーザが「戻る」の発話を行うと(ステップU16)、システムは「ジャンル名をどうぞ」の案内を行う(ステップS16)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「モドル」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。ユーザが「飲食店」の発話を行うと(ステップU17)、システムは「県名をどうぞ」の案内を行う(ステップS17)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「飲食店」を記述する。ユーザが「神奈川県」の発話を行うと(ステップU18)、システムは「神奈川県の飲食店を提示します。」の案内を行う(ステップS18)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「神奈川県」を記述する。ユーザが「戻る」の発話を行うと(ステップU19)、システムは「申し訳ございません。今すぐオペレータにお繋ぎしてお調べ致します。」の案内を行う(ステップS19)。対話履歴更新部311は、対話履歴保持内容601の対話履歴欄に「モドル」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。対話例1では、判定部313の閾値が「3回以上」の場合を示している。ステップS19により、キャンセル回数が閾値を越えたので、システムはオペレーションセンタ109とハンドオーバ接続をする。
複合型大型施設のような複数の店舗で構成されている場所をジャンル検索する場合、当該施設がどのジャンルに含まれているかを判断することは難しいため、ユーザは当該施設が登録されていると思われるジャンル名を選択し検索を行う。検索を進めて行くなかでユーザが設定したい施設が見つからなかった場合、検索作業を適当な階層まで戻り、再度登録されていると思われるジャンル名で検索を進めて行く。当該検索作業を数回繰り返し施設が見つかる場合は問題ないが、施設が見つからない状態が続くと、ユーザの思いつくジャンル名が果ててしまい手詰まり状態になってしまう。手詰まり状態になった際、異なる情報を用いて名称検索や住所検索、電話番号検索など他の検索方法で検索を行うこともできる。しかし、他の情報を保持していない場合、これ以降どのように検索を行えばよいか分からない。そこで、本実施形態では、ユーザに手詰まり状態が発生した場合、すなわち、キャンセル回数が閾値を超えたと判定部313が判断した場合、通信装置107は、制御部310により、オペレータ110側の通信装置1091とハンドオーバ接続している。
また、図6に示すように、対話履歴保持内容601は、現在ユーザがジャンル検索を行っている状態であること、ユーザが神奈川県横須賀市周辺にいること、ハンドオーバ接続発生までのユーザとシステムの対話履歴を保持している。全ての情報をオペレーションセンタ109に送信すると、オペレータ110は情報過多で混乱する可能性がある。また、接続料金も情報量に応じて発生するため、オペレータ110に送る情報は最低限にすべきである。目的地をジャンルで検索する場合、自車両走行位置の情報をオペレータ110に送る必要はない。そこで、送信データ作成部315は、対話履歴保持内容601をジャンル検索中であること、ハンドオーバ接続発生までのユーザとシステムの対話履歴の2つの情報だけに整理し、送信データ602を作成する。通信装置107は、通信網20、通信装置1091を介して、送信データ602をデータ処理部1092に送信する。
次に、目的地を周辺施設で検索する場合について図7および図8を参照して説明する。図7はユーザとシステムの対話例2を示す図、図8は図7に示す対話例2における対話履歴保持内容801と送信データ802を示す図である。図7では、周辺のガソリンスタンドを検索する場合のユーザとシステムの対話例を示している。まず、ユーザが発話スイッチ100を押すと(ステップU21)、システムは「検索方法をどうぞ」の案内を行う(ステップS21)。次に、ユーザが「周辺施設で探す」の発話を行うと(ステップU22)、システムは「周辺施設名をどうぞ」の案内を行う(ステップS22)。対話履歴更新部311は、対話履歴保持内容801の検索中欄に「周辺施設検索中」を記述する。次に、ユーザが「ガソリンスタンド」の発話を行うと(ステップU23)、システムは「周辺のガソリンスタンドを提示します。」の案内を行う(ステップS23)。対話履歴更新部311は、対話履歴保持内容801の対話履歴欄に「ガソリンスタンド」を記述する。次に、ユーザが「次」の発話を行うと(ステップU24)、システムは「周辺のガソリンスタンドを提示します。」の案内を行う(ステップS24)。対話履歴更新部311は、対話履歴保持内容801の対話履歴欄に「ツギ」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。次に、ユーザが「次」の発話を行うと(ステップU25)、システムは「周辺のガソリンスタンドを提示します。」の案内を行う(ステップS25)。対話履歴更新部311は、対話履歴保持内容801の対話履歴欄に「ツギ」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。
次に、ユーザが「戻る」の発話を行うと(ステップU26)、システムは「申し訳ございません。今すぐオペレータにお繋ぎしてお調べ致します。」の案内を行う(ステップS26)。対話履歴更新部311は、対話履歴保持内容801の対話履歴欄に「モドル」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。対話例2では、対話例1と同様、判定部313の閾値が「3回以上」の場合を示している。ステップS26により、キャンセル回数が閾値を越えたので、システムはオペレーションセンタ109とハンドオーバ接続をする。
このように、周辺のガソリンスタンドを検索する場合、システムは自車位置周辺のガソリンスタンドを数件提示する。しかし、ガソリンスタンドの場合、ジャンルは同じであっても様々な店舗や業種形態がある。特有のスタンドのポイントカードを持っているため、ポイントカードが使える系列のスタンドにしかいかない、またはセルフのスタンドよりも有人のスタンドに行きたいなど、1つのジャンルの「ガソリンスタンド」でもユーザの意図は様々である。また、このようなことはガソリンスタンドだけでなく、コンビニや駐車場の場合であっても同様である。コンビニではATM端末を設置している店舗、店頭で振込が可能な店舗などである。また、駐車場では24時間入出可能な駐車場、大型車駐車可能な駐車場などである。すなわち、1つのジャンルのキーワードでもユーザが探している条件に含まれる場合と含まれない場合がある。そのため、システムが出力した情報の中にユーザの思っていた情報が含まれていない場合、「次」などのコマンドを入力し、提示されている情報以外の情報を探すこととなる。上記の作業をユーザが欲しい情報が得られるまで繰り返すこととなるが、上記の繰り返し作業を続けることで、ユーザの検索意欲が落ちる。そこで、本実施形態では、ユーザに手詰まり状態が発生した場合、すなわち、キャンセル回数が閾値を超えたと判定部313が判断した場合、通信装置107は、制御部310により、オペレータ110側の通信装置1091とハンドオーバ接続している。
また、図8に示すように、対話履歴保持内容801は、現在ユーザが周辺施設検索を行っている状態であること、ユーザが神奈川県横須賀市周辺にいること、ハンドオーバ接続発生までのユーザとシステムの対話履歴を保持している。目的地を周辺施設で検索する場合、周辺施設検索中であること、自車両走行位置およびハンドオーバ接続発生までのユーザとシステムの対話履歴の3つの情報が必要である。そこで、送信データ作成部315は、上記の3つの情報から送信データ802を作成する。通信装置107は、通信網20、通信装置1091を介して、送信データ802をデータ処理部1092に送信する。これにより、ユーザがオペレータ110に自車両走行位置を伝える必要がなく、スムーズに目的地の検索を行うことができる。
次に、目的地を施設名称で検索する場合におけるシステムが誤認識を繰り返す場合について図9および図10を参照して説明する。図9はユーザとシステムの対話例3を示す図、図10は図9に示す対話例3における対話履歴保持内容1001と送信データ1002を示す図である。図9に示すように、ユーザが発話スイッチ100を押すと(ステップU31)、システムは「検索方法をどうぞ」の案内を行う(ステップS31)。次に、ユーザが「名称で探す」の発話を行うと(ステップU32)、システムは「名称をどうぞ」の案内を行う(ステップS32)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「名称検索中」を記述する。次に、ユーザが「不入斗運動公園」の発話を行うと(ステップU33)、システムは「○○運動公園ですか。」の案内を行う(ステップS33)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「○○運動公園」を記述する。次に、ユーザが「違う」の発話を行うと(ステップU34)、システムは「名称をどうぞ」の案内を行う(ステップS34)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「チガウ」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。
次に、ユーザが「不入斗運動公園」の発話を行うと(ステップU35)、システムは「△△運動場ですか。」の案内を行う(ステップS35)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「△△運動場」を記述する。次に、ユーザが「違う」の発話を行うと(ステップU36)、システムは「名称をどうぞ」の案内を行う(ステップS36)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「チガウ」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。次に、ユーザが「不入斗運動公園」の発話を行うと(ステップU37)、システムは「□□□□公園ですか。」の案内を行う(ステップS37)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「□□□□公園」を記述する。次に、ユーザが「違う」の発話を行うと(ステップU38)、システムは「申し訳ございません。今すぐオペレータにお繋ぎしてお調べ致します。」の案内を行う(ステップS38)。対話履歴更新部311は、対話履歴保持内容1001の検索中欄に「チガウ」を記述する。キャンセル回数更新部312はキャンセル回数を1回増加する。対話例3では、対話例1と同様、判定部313の閾値が「3回以上」の場合を示している。ステップS38により、キャンセル回数が閾値を越えたので、システムはオペレーションセンタ109にハンドオーバ接続をする。
このように、目的地を施設名称で検索する場合におけるシステムがユーザの発話音声の誤認識を繰り返す場合、ユーザは目的地の検索をどのように進めていいか分からず、手詰まり状態に陥ってしまう。また、上記の場合、ユーザの勘違い、読み間違いの可能性もある。更に、対話例3に用いた施設名称の検索だけでなく、住所検索などを行う場合であっても、同様に手詰まり状態に陥る可能性がある。そこで、本実施形態では、ユーザに手詰まり状態が発生した場合、すなわち、キャンセル回数が閾値を超えたと判定部313が判断した場合、通信装置107は、制御部310により、オペレータ110側の通信装置1091とハンドオーバ接続している。
また、図10に示すように、対話履歴保持内容1001は、現在ユーザが名称検索を行っている状態であること、ユーザが神奈川県横須賀市周辺にいること、ハンドオーバ接続発生時までのユーザとシステムの対話履歴を保持している。全ての情報をオペレーションセンタ109に送信すると、オペレータ110は情報過多で混乱する可能性がある。また、接続料金も情報量に応じて発生するため、オペレータ110に送る情報は最低限にすべきである。目的地を施設名称で検索する場合におけるシステムが誤認識を繰り返す場合、自車両走行位置の情報をオペレータ110に送る必要はない。そこで、送信データ作成部315は、対話履歴保持内容1001を名称検索中であること、ハンドオーバ接続発生までのユーザとシステムの対話履歴の2つの情報だけに整理し、送信データ1002を作成する。通信装置107は、通信網20、通信装置1091を介して、送信データ1002をデータ処理部1092に送信する。
以上より、本実施形態に係る車載用情報提供対話装置では、ユーザがマイク101に入力した情報に基づいて、目的地設定などの所定のタスクを達成する制御部310と、タスクの進捗状況に基づいて、ユーザに手詰まり状態が発生したか判断する判定部313とを備える。手詰まり状態が発生したとの判断に基づいて、通信装置107は、制御部310により、オペレータ110側の通信装置1091とハンドオーバ接続する。これから、ユーザが欲しい出力結果とシステムの応答の不一致が続くことによる手詰まり状態を確実に検出でき、自動的にハンドオーバ接続することができる。よって、ユーザはオペレータ110と対話することができ、手詰まり状態を確実に解消することができる。更に、本実施形態に係る車載用情報提供対話装置は、タスクの進捗状況に基づいて、対話履歴保持内容を更新する対話履歴更新部311を備える。手詰まり状態が発生したのと判断に基づいて、マルチアクセス機能を有する通信装置107は、対話履歴保持内容に係る送信データをデータ処理部1092に送信する。これから、オペレータ110は、ハンドオーバ接続発生までのユーザとシステムの対話履歴を見ることができる。よって、オペレータ110はユーザとシステムの対話履歴をテキストデータとして確認しながらユーザとの対話を行うことができる。ユーザはオペレータ110に対して最初から説明する必要がなくなり、オペレータ110との対話を短い接続時間で終了することができ、ユーザが選択した目的地設定などのタスクを短時間で完了させることができる。
また、本実施形態では、タスクの種類に基づいて、対話履歴保持内容のうち必要なデータを決定する送信データ決定部314と、送信データ決定部314で決定された必要なデータから、オペレータ110に送信する送信データを作成する送信データ作成部315とを備えている。これから、送信データは必要最低限の情報となり、オペレータ110が情報過多で混乱することを防止できる。また、ユーザの発話音声を入力するマイク101と、マイク101を介して入力された音声を変換した音声データを音声認識する音声認識部303をも備えている。これから、音声入力が可能となり、運転中であってもユーザに視線移動など余計な負荷を与えることが無い。よって、システムに対するユーザビリティが向上する。
また、キャンセルした回数を保持するキャンセル回数保持装置302と、キャンセル回数を更新するキャンセル回数更新部312と、キャンセル回数と閾値を比較し、ユーザに手詰まり状態が発生したか否か判断する判定部313とを備える。これより、ユーザが欲しい出力結果とシステムの応答の不一致の回数を制限することができ、システムに対するユーザビリティが向上する。また、本実施形態では、対話例2に示したように、ユーザがタスクを選択するメニュー項目を階層構造にしたデータベースを備え、キャンセル回数更新部312は、同一階層でユーザが入力した回数に基づいて、キャンセル回数を増加する。これから、より高い精度で手詰まり状態を検出することができる。更に、本実施形態では、対話例1に示したように、キャンセル回数更新部312は、ユーザが上階層に戻る内容の入力をした場合に、キャンセル回数を増加する。これから、より高い精度で手詰まり状態を検出することができる。
なお、以上に述べた実施形態は、本発明の実施の一例であり、本発明の範囲はこれらに限定されるものでなく、特許請求の範囲に記載した範囲内で、他の様々な実施形態に適用可能である。例えば、本実施形態に係る車載用情報提供対話装置では、入力手段としてマイク101を用いているが、特にこれに限定されるものでなく、ディスプレイ104にタッチパネルの機能を持たせて、ユーザの入力内容が入力されるタッチパネルを有する情報入力手段としても良い。このようにすれば、直接ディスプレイの表示内容を見て簡便に選択入力ができるため、システムに対するユーザビリティを向上できる。
また、本実施形態では、キャンセル回数が閾値を超えた場合、ユーザに手詰まり状態が発生したと判断しているが、特にこれに限定されるものでなく、ユーザが試行錯誤した場合、ユーザに手詰まり状態が発生したと判断しても良い。例えば、ユーザがタスクを選択するメニュー項目を階層構造にしたデータベースにおいて、同一階層における滞在総和時間を計測し、計測した滞在総和時間が所定値以上である場合、ユーザに手詰まり状態が発生したと判断しても良い。また、検索タスクの結果を再度表示する内容の入力をユーザがした場合、ユーザに手詰まり状態が発生したと判断しても良い。このようにすれば、より高い精度で手詰まり状態を検出することができる。
また、本実施形態では、ユーザに手詰まり状態が発生したと判定部313が判断した場合、通信装置107は、録画装置106で録画された録画データおよび録音装置105で録音されたユーザの発話音声(音声データ)をデータ処理部1092に送信しているが、特にこれに限定されるものでなく、上記録画データと上記音声データを送信しなくても同様の効果を取得できる。また、上記録画データおよび上記音声データからユーザの感情状態を推定する感情推定手段を備え、ユーザに手詰まり状態が発生したと判定部313が判断した場合、推定されたユーザの感情状態に係る情報も送信しても良い。例えば、図11に示すように、制御部310に感情推定部316を備える。そして、上記録画データ、上記音声データの特徴量(音声の強度、テンポおよび抑揚など)に基づいて、ユーザの感情状態(怒り、悲しみなど)を推定した信号を作成する。なお、感情推定部316は、特開2002−091482号公報が詳しい。このようにすれば、ユーザの感情状態をオペレータ110に伝えることができ、オペレータ110はユーザの感情状態に応じた対応を行うことができる。よって、オペレータ110はユーザの感情を損ねることなく対応することが可能となる。
また、本実施形態では、制御部310は、対話履歴更新部311、キャンセル回数更新部312、判定部313、送信データ決定部314および送信データ作成部315を含んでいるが、特にこれに限定されるものでなく、制御部310を、これらと別個独立に備えても良い。
また、本実施形態では、送信データ決定部314および送信データ作成部315を備えているが、特にこれに限定されるものでなく、対話履歴保持内容を送信データとして送信するのであれば、送信データ決定部314および送信データ作成部315は無くても良い。しかし、送信データ決定部314および送信データ作成部315により、送信データを必要最低限の情報とすることができ、オペレータ110が情報過多で混乱することを防止できる。
また、本実施形態では、ディスプレイ104、オペレータ接続スイッチ108、録音装置105および録画装置106を備えているが、特にこれに限定されるものでなく、ディスプレイ104、オペレータ接続スイッチ108、録音装置105および録画装置106は無くても、同様の効果を取得できる。
また、本実施形態では、図4、図6、図8および図10に対話履歴保持内容の一例を示しているが、特にこれに限定されるものでなく、対話履歴保持内容は他の形式でも良い。
本発明の実施形態に係る車載用情報提供対話装置を含むナビゲーションシステムの構成図 図1に示す信号処理装置および外部記憶装置のブロック図 図1に示す信号処理装置の制御処理の流れを示すフローチャート 対話履歴保持内容の一例を示す図 ユーザとシステムの対話例1を示す図 図5に示す対話例1における対話履歴保持内容と送信データを示す図 ユーザとシステムの対話例2を示す図 図7に示す対話例2における対話履歴保持内容と送信データを示す図 ユーザとシステムの対話例3を示す図 図9に示す対話例3における対話履歴保持内容と送信データを示す図 本発明の変形例に係る信号処理装置および外部記憶装置のブロック図
符号の説明
10 ナビゲーションシステム、20 通信網、
100 発話スイッチ、101 音声入力手段であるマイク、
102 スピーカ、103 ナビゲーション装置、104 ディスプレイ、
105 録音手段である録音装置、106 録画手段である録画装置、
107 通信手段である通信装置、108 オペレータ接続スイッチ、
109 オペレーションセンタ、110 オペレータ、
301 対話履歴保持装置、
302 キャンセル回数保持手段であるキャンセル回数保持装置、
303 音声認識部、310 制御手段である制御部、
311 履歴更新手段である対話履歴更新部、
312 キャンセル回数更新手段であるキャンセル回数更新部、
313 手詰まり状態判断手段である判定部、
314 送信データ決定手段である送信データ決定部、
315 送信データ作成手段である送信データ作成部、
316 感情推定手段である感情推定部、
401、601、801、1001 履歴情報である対話履歴保持内容、
602、802、1002 送信データ、
1031 A/Dコンバータ、1032 D/Aコンバータ、
1033 出力アンプ、1034 信号処理装置、1034a CPU、
1034b メモリ、1035 外部記憶装置、
1091 通信装置、1092 データ処理部、1093 パソコン、
1094 電話

Claims (13)

  1. ユーザが入力手段に入力した情報に基づいて、所定のタスクを達成する制御手段と、
    前記タスクの進捗状況に基づいて、前記ユーザに手詰まり状態が発生したか判断する手詰まり状態判断手段と、
    前記手詰まり状態が発生したとの判断に基づいて、オペレータ側とハンドオーバ接続する通信手段とを備えることを特徴とする車載用情報提供対話装置。
  2. 前記通信手段は、マルチアクセス機能を備えていることを特徴とする請求項1に記載の車載用情報提供対話装置。
  3. 前記タスクの進捗状況に基づいて、前記タスクの履歴情報を更新する履歴更新手段を備え、
    前記手詰まり状態が発生したとの判断に基づいて、前記通信手段は、前記履歴情報に係る送信データを前記オペレータに送信することを特徴とする請求項2に記載の車載用情報提供対話装置。
  4. 前記タスクの種類に基づいて、前記履歴情報のうち必要なデータを決定する送信データ決定手段と、
    決定された前記必要なデータから前記送信データを作成する送信データ作成手段とを備えることを特徴とする請求項3に記載の車載用情報提供対話装置。
  5. 前記入力手段は、前記ユーザの発話音声を入力する音声入力手段であることを特徴とする請求項1乃至4のいずれかに記載の車載用情報提供対話装置。
  6. 前記音声データを録音する録音手段と、
    前記ユーザを録画する録画手段と、
    前記録画手段に録画された録画データおよび前記音声データから、前記ユーザの感情状態を推定する感情推定手段とを備え、
    前記通信手段は、前記ハンドオーバ接続時に、前記推定された感情状態を送信することを特徴とする請求項5に記載の車載用情報提供対話装置。
  7. 前記入力手段は、前記ユーザの入力内容が入力されるタッチパネルを有する情報入力手段であることを特徴とする請求項1乃至4のいずれかに記載の車載用情報提供対話装置。
  8. 前記手詰まり状態判断手段は、前記制御手段に前記タスクを達成させるために、前記ユーザが試行錯誤した場合、前記ユーザに前記手詰まり状態が発生したと判断することを特徴とする請求項1乃至7のいずれかに記載の車載用情報提供対話装置。
  9. キャンセル回数を保持するキャンセル回数保持手段と、
    前記キャンセル回数を更新するキャンセル回数更新手段とを備え、
    前記手詰まり状態判断手段は、前記キャンセル回数が閾値より大きい場合、前記ユーザに前記手詰まり状態が発生したと判断することを特徴とする請求項8に記載の車載用情報提供対話装置。
  10. 前記ユーザが前記タスクを選択するメニュー項目を階層構造にしたデータベースを備え、
    前記キャンセル回数更新手段は、前記ユーザが同一階層で入力した回数に基づいて、キャンセル回数を増加することを特徴とする請求項9に記載の車載用情報提供対話装置。
  11. 前記ユーザが前記タスクを選択するメニュー項目を階層構造にしたデータベースを備え、
    前記キャンセル回数更新手段は、前記ユーザが上階層に戻る内容の入力をした場合に、キャンセル回数を増加することを特徴とする請求項9に記載の車載用情報提供対話装置。
  12. 前記ユーザが前記タスクを選択するメニュー項目を階層構造にしたデータベースを備え、
    前記手詰まり状態判断手段は、同一階層における滞在総和時間が所定値以上である場合、前記ユーザに前記手詰まり状態が発生したと判断することを特徴とする請求項8に記載の車載用情報提供対話装置。
  13. 検索タスクの結果を再度表示する内容の入力をした場合に、前記手詰まり状態判断手段は、前記ユーザに前記手詰まり状態が発生したと判断することを特徴とする請求項8に記載の車載用情報提供対話装置。
JP2007188064A 2007-07-19 2007-07-19 車載用情報提供対話装置 Pending JP2009025517A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007188064A JP2009025517A (ja) 2007-07-19 2007-07-19 車載用情報提供対話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007188064A JP2009025517A (ja) 2007-07-19 2007-07-19 車載用情報提供対話装置

Publications (1)

Publication Number Publication Date
JP2009025517A true JP2009025517A (ja) 2009-02-05

Family

ID=40397379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007188064A Pending JP2009025517A (ja) 2007-07-19 2007-07-19 車載用情報提供対話装置

Country Status (1)

Country Link
JP (1) JP2009025517A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014141574A1 (ja) * 2013-03-14 2014-09-18 日本電気株式会社 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム
JP2016109784A (ja) * 2014-12-03 2016-06-20 シャープ株式会社 情報処理装置、情報処理方法、対話システム、および制御プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0876965A (ja) * 1994-09-07 1996-03-22 Toshiba Corp 音声認識システム
JP2002202882A (ja) * 2000-12-28 2002-07-19 Fujitsu Ltd 音声対話システム及び音声対話方法
JP2004037989A (ja) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 音声受付システム
JP2005121526A (ja) * 2003-10-17 2005-05-12 Nissan Motor Co Ltd 車載用情報提供対話装置、システムおよび方法
JP2005182313A (ja) * 2003-12-17 2005-07-07 Nissan Motor Co Ltd 操作メニュー切換装置、車載用ナビゲーション・システムおよび操作メニュー切換え方法
JP2006301799A (ja) * 2005-04-18 2006-11-02 Nissan Motor Co Ltd 車両用情報提供装置、車両用情報提供方法、および、車両用情報提供システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0876965A (ja) * 1994-09-07 1996-03-22 Toshiba Corp 音声認識システム
JP2002202882A (ja) * 2000-12-28 2002-07-19 Fujitsu Ltd 音声対話システム及び音声対話方法
JP2004037989A (ja) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 音声受付システム
JP2005121526A (ja) * 2003-10-17 2005-05-12 Nissan Motor Co Ltd 車載用情報提供対話装置、システムおよび方法
JP2005182313A (ja) * 2003-12-17 2005-07-07 Nissan Motor Co Ltd 操作メニュー切換装置、車載用ナビゲーション・システムおよび操作メニュー切換え方法
JP2006301799A (ja) * 2005-04-18 2006-11-02 Nissan Motor Co Ltd 車両用情報提供装置、車両用情報提供方法、および、車両用情報提供システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014141574A1 (ja) * 2013-03-14 2014-09-18 日本電気株式会社 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム
JP5979303B2 (ja) * 2013-03-14 2016-08-24 日本電気株式会社 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム
JP2016109784A (ja) * 2014-12-03 2016-06-20 シャープ株式会社 情報処理装置、情報処理方法、対話システム、および制御プログラム

Similar Documents

Publication Publication Date Title
JP7317529B2 (ja) サウンドデータを処理するシステム、及びシステムの制御方法
CN106796786B (zh) 语音识别系统
JP3990075B2 (ja) 音声認識支援方法及び音声認識システム
US7826945B2 (en) Automobile speech-recognition interface
US8694323B2 (en) In-vehicle apparatus
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
KR100556050B1 (ko) 적어도위치및/또는거리이름들을위한입력시스템
JP2002091466A (ja) 音声認識装置
JP6202041B2 (ja) 車両用音声対話システム
US20070219786A1 (en) Method for providing external user automatic speech recognition dictation recording and playback
US20190122661A1 (en) System and method to detect cues in conversational speech
US9123327B2 (en) Voice recognition apparatus for recognizing a command portion and a data portion of a voice input
CN102693725A (zh) 依赖于文本信息语境的语音识别
JP2008058409A (ja) 音声認識方法及び音声認識装置
CN107819929A (zh) 优选表情符号的识别和生成
JP2007114475A (ja) 音声認識機器制御装置
JP2006003142A (ja) 番号入力装置およびそれを用いたナビゲーション装置
JP5181533B2 (ja) 音声対話装置
JP2015028566A (ja) 応答制御システム、車載器、およびセンター
WO2000010160A1 (fr) Dispositif et procede de reconnaissance vocale, dispositif de navigation, telephone portable et processeur d&#39;informations
JP2009025517A (ja) 車載用情報提供対話装置
JP3726783B2 (ja) 音声認識装置
JP2004233676A (ja) 対話制御装置
JP4586566B2 (ja) 音声対話システム
JP4624825B2 (ja) 音声対話装置および音声対話方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100929

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20101001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101028

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120703