JP6954821B2 - 対話管理装置及びプログラム - Google Patents

対話管理装置及びプログラム Download PDF

Info

Publication number
JP6954821B2
JP6954821B2 JP2017236961A JP2017236961A JP6954821B2 JP 6954821 B2 JP6954821 B2 JP 6954821B2 JP 2017236961 A JP2017236961 A JP 2017236961A JP 2017236961 A JP2017236961 A JP 2017236961A JP 6954821 B2 JP6954821 B2 JP 6954821B2
Authority
JP
Japan
Prior art keywords
data
user
blank
item
filled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017236961A
Other languages
English (en)
Other versions
JP2019105685A (ja
Inventor
昌宣 鷲尾
昌宣 鷲尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Toyota Motor Corp
Original Assignee
Denso Ten Ltd
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd, Toyota Motor Corp filed Critical Denso Ten Ltd
Priority to JP2017236961A priority Critical patent/JP6954821B2/ja
Priority to US16/213,364 priority patent/US11113025B2/en
Priority to CN201811495086.4A priority patent/CN109903759B/zh
Publication of JP2019105685A publication Critical patent/JP2019105685A/ja
Application granted granted Critical
Publication of JP6954821B2 publication Critical patent/JP6954821B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Description

本発明は、ユーザによる発話内容に基づき、データを埋めていく対話管理装置及びプログラムに関する。
下記特許文献1には、入力された音声に基づいて音声検索を実行する際に、検索のための必須項目がすべて満たされているか否かを判断し、満たされていないと判断した場合には、ユーザに働きかけて不足項目や補充するための音声情報を要求する情報処理装置が開示されている。
特開2015−69103号公報
しかしながら、特許文献1では、検索結果を得るためのデータが不足していると判断すると、データが不足している項目(例えば、場所や出発時間など;以下、「ブランク項目」ともいう。)のすべてを、ユーザの発話によって埋めていく必要がある。このため、例えばブランク項目(いわゆるスロット)に埋めるべきデータが、定例化している朝の会議の開始時間や会議の場所などであったとしても、ユーザはその内容を発話によってすべて埋める必要があり、ユーザの利便性が低下するという問題があった。
本発明は、以上説明した事情を鑑みてなされたものであり、ユーザの利便性を向上させることができる対話管理装置を提供することを目的とする。
本発明の一態様に係る対話管理装置は、ユーザによる発話内容に基づき、複数の項目から構成される1つ以上のサービス・フレームの各項目に対し、データを埋めていく対話管理装置であって、ユーザにより発話された内容に基づいて、1つ以上のサービス・フレームを特定するとともに、特定したサービス・フレームについて、データを埋めるべき項目を特定する特定部と、特定した項目に対し、発話された内容に応じたデータを埋める充填部と、特定した項目にデータが埋められたサービス・フレームにおいて、データが埋められていないブランク項目がある場合に、ユーザの過去の行動履歴に基づき、ブランク項目を埋めるべきデータを推定する推定部と、ユーザに対して、ブランク項目を埋めるべきデータが、推定したデータで正しいか否かの問い合わせを行う問い合わせ部と、ユーザから正しい旨の返答が得られた場合に、推定したデータを、ブランク項目を埋めるべきデータとして確定する確定部とを具備することを要旨とする。
本発明の他の態様に係るサービス提供プログラムは、ユーザによる発話内容に基づき、複数の項目から構成される1つ以上のサービス・フレームの各項目に対し、データを埋めていくコンピュータを、ユーザにより発話された内容に基づいて、1つ以上のサービス・フレームを特定するとともに、特定したサービス・フレームについて、データを埋めるべき項目を特定する特定部と、特定した項目に対し、発話された内容に応じたデータを埋める充填部と、特定した項目にデータが埋められたサービス・フレームにおいて、データが埋められていないブランク項目がある場合に、ユーザの過去の行動履歴に基づき、ブランク項目を埋めるべきデータを推定する推定部と、ユーザに対して、ブランク項目を埋めるべきデータが、推定したデータで正しいか否かの問い合わせを行う問い合わせ部と、ユーザから正しい旨の返答が得られた場合に、推定したデータを、ブランク項目を埋めるべきデータとして確定する確定部として機能させることを要旨とする。
本発明によれば、ユーザの利便性を向上させることができる対話管理装置を提供することができる。
対話管理装置を含むサービス提供システムの構成を例示する図である。 サービス・フレームを例示する図である。 サービス提供システム(ブランク推定データが正しい場合)の動作を示すシーケンス図である。 サービス提供システム(ブランク推定データが正しくない場合)の動作を示すシーケンス図である。
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは同一又は同様の構成を有する。
A.本実施形態
(1)構成
サービス提供システムに対して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号をふしたものは同一又は同様の構成を有する。
図1を参照し、実施形態に係る対話管理装置を含むサービス提供システムの構成について説明する。サービス提供システム100は、各ユーザが使用する情報端末1と、データセンタ等に配置される対話管理装置2及び音声認識装置3とを含む。情報端末1と対話管理装置2との間、及び対話管理装置2と音声認識装置3との間は、ネットワークを介して相互に通信できるように構成される。
ネットワークは、有線であっても無線であってもよく、有線と無線とを組み合わせてもよい。本実施形態では、例示的に、情報端末1と対話管理装置2との間は無線ネットワークを利用し、対話管理装置2と音声認識装置3との間は有線ネットワークを利用することとする。
図1に示す情報端末1は、例えばスマートフォン、携帯電話機、ウェアラブル端末、携帯情報端末(PDA)、タブレット端末、パーソナルコンピュータ(PC)、ノートPCなどの端末装置である。情報端末1は、物理的な構成として、例えば、CPU及びROMやRAMなどのメモリを含む制御ユニット、操作部、ディスプレイ、記憶ユニット、通信ユニットのほか、マイクロフォンなどの入力装置、スピーカなどの出力装置を備えて構成される。CPUがメモリに格納された所定のプログラムを実行することにより、情報端末1に組み込まれた各種機能を実現する。
対話管理装置2は、スロットフィリングの技術を用い、ユーザと音声による対話を通じて音声認識によるサービス(例えば、スケジュール登録など;以下、「サービス」と総称する。)を提供するための装置であり、項目特定部21、充填部22、ブランク項目特定部23、情報収集部24、推定部25、問い合わせ部26、確定部27、要求部28、サービス・フレームデータベース(DB)29を備えている。対話管理装置2は、物理的な構成として、例えば、CPU及びメモリを含む制御ユニット、記憶装置、通信装置等を備えて構成される。CPUがメモリに格納された所定のプログラムを実行することにより、項目特定部21、充填部22、ブランク項目特定部23、情報収集部24、推定部25、問い合わせ部26、確定部27、要求部28、サービス・フレームDB29の各機能を実現する。各機能の詳細については、後述する。
サービス・フレームDB29には、サービスごとに、データを埋めるべき複数の項目(スロット)を備えたサービス・フレームが登録されている。上記サービスとして、例えば、スケジューラ、ナビゲーション、交通情報、天気情報等が該当する。各サービスを提供する際に必要となるコンテンツは、対話管理装置2のデータベースに格納されている。コンテンツを格納するデータベースとして、例えば、スケジューラDB2a、ナビゲーションDB2b、交通情報DB2c、天気情報DB2dがある。
図2は、サービス・フレームDB29に登録されるサービス・フレームを例示した図であり、Aは、サービスがスケジューラである場合のサービス・フレーム、Bは、サービスがナビゲーション(ルート検索)である場合のサービス・フレームである。
図2のAに例示するように、スケジューラのサービス・フレームは、埋める(入力する)べき項目として、日程、開始時間、終了時間、目的及び場所が設定されている。一方、図2のBに例示するように、ナビゲーション(ルート検索)のサービス・フレームは、埋める(入力する)べき項目として、日程、出発時間、到着時間、出発地及び目的地が設定されている。
項目特定部21は、ユーザにより発話された内容(以下、「発話内容」ともいう。)を情報端末1から受信し、受信した発話内容を解析することで、データを埋めるべき項目を特定する。以下、項目を特定する際の手順の概要を説明する。
情報端末1から送信されたユーザの音声は、音声認識装置3によって受信される。音声認識装置3は、受信した音声を解析し、テキストに変換したうえで、対話管理装置2に送信する。音声解析は、公知の音声解析手法(例えば、高速フーリエ変換、短時間フーリエ変換、ウェーブレット変換、ディープ・ラーニングなど)を用いて行うことができる。
続いて、対話管理装置2の項目特定部21は、音声認識装置3から受信したテキストの発話内容に基づいて、サービス・フレームを特定する。さらに、項目特定部21は、特定したサービス・フレームに設定されている複数の項目の中から、発話内容に応じたデータを埋めるべき項目を特定する。
充填部22は、項目特定部21により特定された項目に対し、発話内容に応じたデータを埋める(入力する)。
ブランク項目特定部23は、充填部22によってデータが埋まらなかった項目(以下、「ブランク項目」ともいう。)を特定する。
情報収集部24は、ブランク項目を埋めるために必要な情報の収集を行う。本実施形態では、ブランク項目を埋めるために必要な情報として、ユーザの行動履歴に関する情報(以下、「行動履歴関連情報」ともいう。)を利用する。行動履歴関連情報は、ユーザの過去のスケジュールをあらわすスケジュール情報やユーザの現在位置をあらわす位置情報などが挙げられる。情報収集部24は、ユーザの行動履歴関連情報を外部サーバや提供サービス等(以下、「外部ノード」と総称する。)から取得する。
推定部25は、情報収集部24によって収集されたユーザの行動履歴関連情報に基づき、ブランク項目を埋めるべきデータを推定する。なお、以下の説明では、推定されたブランク項目を埋めるべきデータを「ブランク推定データ」と呼ぶ。
問い合わせ部26は、ユーザに対して、推定部25によって生成されたブランク推定データが正しいか否かの問い合わせを行う。問い合わせ部26は、ブランク推定データが正しいか否かをユーザに問い合わせる対話文を作成し、音声認識装置3を利用して音声出力する。
確定部27は、ユーザからブランク推定データは正しい旨の回答が得られた場合に、ブランク推定データを、ブランク項目に埋めるべきデータとして確定する。ユーザによってブランク推定データは正しい旨の回答が発話されると、その発話内容は、音声認識装置3によって解析された後、テキストメッセージに変換される。確定部27は、音声認識装置3から受信したテキストメッセージをもとに、ユーザからブランク推定データは正しい旨の回答が得られたことを認識すると、受信したテキストメッセージに基づき、ブランク推定データを、ブランク項目に埋めるべきデータとして確定する。そして、確定部27は、登録が完了した旨の対話文を作成し、音声認識装置3を利用して音声出力する。
要求部28は、ユーザからブランク推定データは正しくない(すなわち誤っている)旨の回答が得られた場合に、ユーザに対して、ブランク項目に埋めるべきデータをリクエストする。ユーザによってブランク推定データは正しくない旨の回答が発話されると、その発話内容は、音声認識装置3によって解析された後、テキストメッセージに変換される。要求部28は、音声認識装置3から受信したテキストメッセージをもとに、ユーザからブランク推定データは正しくない旨の回答が得られたことを認識すると、ユーザに対してブランク項目を埋めるべきデータをリクエストする対話文を作成する。要求部28は、作成した対話文を、音声認識装置3を利用して音声出力する。
なお、リクエストに応じてユーザが回答を発話すると、ユーザによって発話された内容は、音声認識装置3によって解析された後、テキストメッセージに変換され、確定部27に送信される。確定部27は、受信したテキストメッセージに基づき、ユーザの回答に含まれる一部のデータを、ブランク項目を埋めるべきデータとして確定する。そして、確定部27は、登録が完了した旨の対話文を作成し、音声認識装置3を利用して音声出力する。
(2)動作
以下、図3及び図4に示すシーケンス図を参照しながら、サービス提供システム100の動作について説明する。なお、以下の説明では、ユーザが対話管理装置2を利用してスケジューラに打ち合わせ予定を登録する場面を想定する。
図3は、ユーザによってブランク推定データが正しいと判断された場合のシーケンス図であり、図4は、ユーザによってブランク推定データが正しくないと判断された場合のシーケンス図である。図3及び図4において、共通するステップには同一符号を付し、詳細な説明は割愛する。
ユーザは、情報端末1の入力装置(図示略)に向かって「明日(7月26日)の9時から12時まで打ち合わせ」と発話する。ユーザの音声は、入力装置を介して音声認識装置3に送信される。音声認識装置3は、受信した音声を解析し(ステップC1)、テキスト変換したうえで、発話内容の認識結果を対話管理装置2に送る(ステップC2)。
対話管理装置2の項目特定部21は、音声認識装置3から受信したテキストの発話内容に基づいて、サービス・フレームを特定する。さらに、項目特定部21は、特定したサービス・フレームに設定されている複数の項目の中から、発話内容に応じたデータを埋めるべき項目を特定する。図3に示す例では、項目特定部21は、ユーザの発話内容(「7月26日の9時から12時まで打ち合わせ」)を解析することで、埋めるべき項目として“日程”、“開始時間”、“終了時間”、“目的”を特定する(ステップC3)。
充填部22は、項目特定部21により特定された項目に対し、発話内容に応じたデータを埋める(充填する)。充填部22は、“日程”、“開始時間”、“終了時間”、“目的”の項目について、それぞれ“7月26日”、“9時”、“12時”、“打ち合わせ”といった発話内容に応じたデータを埋める(ステップC4)。
ブランク項目特定部23は、充填部22によってデータが埋まらなかった項目(すなわち、ブランク項目;ここでは“場所”)を特定し、特定したブランク項目を情報収集部24に通知する。
情報収集部24は、ブランク項目特定部23からの通知に基づき、ブランク項目を埋めるために必要な情報の収集を行う。情報収集部24は、外部ノードに対してブランク項目を埋めるために必要な情報を要求する(ステップC5)。外部ノードは、かかる要求に応じて、ブランク項目(ここでは“場所”)を埋めるために必要と思われる情報を所定のデータベース等から抽出し、行動履歴関連情報として情報収集部24に返す(ステップC6)。情報収集部24は、外部ノードから、ユーザの行動履歴関連情報として、例えば「9時から12時まで、会社(名古屋)にて重要クライアントと定例会議していることが多い」旨の情報を取得する。
推定部25は、情報収集部24によって収集されたユーザの行動履歴関連情報に基づき、ブランク項目を埋めるべきデータを推定する。図3に示す例では、推定部25は、「9時から12時まで、会社で重要クライアントと定例会議していることが多い」旨のユーザの行動履歴情報から、ブランク項目(“場所”)を埋めるべきデータは“会社”である可能性が高いと推定する。そして、推定部25は、“会社”である旨のブランク推定データを生成する(ステップC7)。
問い合わせ部26は、ユーザに対して、推定部25によって生成されたブランク推定データが正しいか否かの問い合わせを行う。具体的には、問い合わせ部26は、ブランク推定データが正しいか否かをユーザに問い合わせる対話文(「場所は、“会社”で大丈夫ですか」)を作成し(ステップC8)、音声認識装置3を利用して音声出力する(ステップC9)。
<ブランク推定データが正しい場合(図3参照)>
ユーザは、情報端末1の出力装置(図示略)から出力される対話文を確認する。ユーザは、ブランク推定データが正しいと判断すると、ブランク推定データは正しい旨の回答(「いいよ」)を行う。ユーザの回答(すなわちユーザによって発話された内容)は、音声認識装置3によって解析された後(ステップC10)、テキストメッセージに変換され、対話管理装置2に送信される(ステップC11)。
確定部27は、音声認識装置3から受信したテキストメッセージをもとに、ユーザからブランク推定データは正しい旨の回答が得られたことを認識すると、受信したテキストメッセージ(「いいよ」)に基づき、ブランク推定データ(“会社”)を、ブランク項目に埋めるべきデータとして確定する(ステップC12)。そして、確定部27は外部ノードに対して、ブランク項目に確定したブランク推定データ(“会社”)を埋めるように指示する。
外部ノードは、確定部27からの指示に従って、ブランク項目に確定したブランク推定データを埋めることで、スケジュール登録を完了し(ステップC13)、登録が完了した旨を確定部27に返す。確定部27は、スケジュール登録が完了した旨の通知を受け取ると、登録が完了した旨の対話文(「登録完了しました」)を作成し(ステップC14)、音声認識装置3を利用して音声出力する(ステップC15)。
<ブランク推定データが正しくない場合(図4参照)>
一方、ユーザは、ブランク推定データが正しくないと判断すると、ブランク推定データは正しくない旨の回答(「ちがうよ」)を行う。ユーザの回答(すなわちユーザによって発話された内容)は、音声認識装置3によって解析された後(ステップC10)、テキストメッセージに変換され、対話管理装置2に送信される(ステップC11)。
要求部28は、音声認識装置3から受信したテキストメッセージをもとに、ユーザからブランク推定データは正しくない(すなわち誤っている)旨の回答が得られたことを認識すると(ステップC20)、ユーザに対してブランク項目を埋めるべきデータをリクエストする対話文(「会議の場所は、どこですか?」)を作成する(ステップC21)。要求部28は、作成した対話文を、音声認識装置3を利用して音声出力する(ステップC22)。
ユーザは、リクエストに応じてユーザが回答(例えば、「クライアントである○×商事です」)を発話する。ユーザによって発話された内容は、音声認識装置3によって解析された後(ステップC23)、テキストメッセージに変換され、確定部27に送信される(ステップC24)。確定部27は、受信したテキストメッセージに基づき、ユーザの回答に含まれる一部のデータ(ここでは“○×商事”;以下、「ユーザの回答データ」ともいう。)を、ブランク項目を埋めるべきデータとして確定する(ステップC25)。そして、確定部27は外部ノードに対して、ブランク項目に確定したユーザの回答データ(“○×商事”)を埋めるように指示する。
外部ノードは、確定部27からの指示に従って、ブランク項目に確定したユーザの回答データを埋めることで(ステップC26)、スケジュール登録を完了し、登録が完了した旨を確定部27に返す。確定部27は、スケジュール登録が完了した旨の通知を受け取ると、登録が完了した旨の対話文(「登録完了しました」)を作成し(ステップC27)、音声認識装置3を利用して音声出力する(ステップC28)。
以上説明したように、本実施形態によれば、ユーザと対話を行いながらサービス・フレームの各項目を埋めていく対話管理装置において、データが埋められないブランク項目(例えば、“場所”)がある場合に、ユーザの過去の行動履歴に基づき、ブランク項目を埋めるデータ(例えば、“会社”)を推定する。そして、推定したデータが正しいか否かをユーザに問い合わせ(例えば、「場所は会社でよいですか?」)、正しい旨の回答(例えば、「そうです」)が得られた場合には、推定したデータを利用してブランク項目を埋める。
これにより、ユーザは、ブランク項目を埋めるデータを、その都度発話して返答する必要がなくなり、簡単な回答(例えば、「そうです」)で返答することが可能となる。
さらに、対話管理装置においては、ブランク項目(例えば、“場所”)の問い合わせを行っているのに、ブランク項目とはまったく関係ない内容(例えば、“日程”に関する内容)が回答されたために、ブランク項目が埋められず、装置側が回答内容を理解できずに、混乱を招く等の問題を未然に防止することが可能となる。
B.変形例
上述した本実施形態では、1つのブランク項目に対し、推定部25が1つのブランク推定データを生成する場合について説明したが、複数のブランク推定データを生成してもよい。例えば、ブランク項目が“場所”である場合、推定部25は、ユーザの行動履歴関連情報に基づいて、“会社”と“シリコンバレー支社”の2つのブランク推定データを生成したとする。この場合、問い合わせ部26は、2つのブランク推定データのいずれであるかを問い合わせる対話文(例えば、「場所は、会社またはシリコンバレー支社のいずれですか。」)を生成すればよい。なお、ブランク項目が複数ある場合には、ブランク項目ごとにブランク推定データを生成し、問い合わせを行うようにしてもよい。
また、ユーザの行動履歴関連情報だけでなく、ユーザの現在位置情報も考慮して、ブランク推定データを生成するようにしてもよい。例えば、ブランク項目が“場所”である場合、推定部25は、ユーザの行動履歴関連情報のみから推定すると、“会社(名古屋)”である可能性がもっとも高いが、ユーザの現在位置情報(例えば、シリコンバレーに出張中)を考慮すると、“会社”である可能性は限りなくゼロに近いと判断する。この場合、推定部25は、情報収集部(第1取得部)24によって取得されるユーザの行動履歴関連情報とともに、図示せぬGPS受信機(第2取得部)によって取得されるユーザの現在位置を加味して、“シリコンバレー支社”をブランク推定データとして生成する。もっとも、推定部25は、このような場合に、“場所”を推定するのは難しいと判断した場合には、問い合わせ部26が、直接、ユーザに“場所”を問い合わせる対話文を生成してもよい。
また、ブランク項目(例えば、“開始時間”)を埋める候補サービスが複数ある場合(例えば、「スケジューラ」と「ナビゲーション」など)には、推定部(決定部)25が、ユーザの行動履歴関連情報に基づき、問い合わせを行うサービスの優先順位を決定してもよい。推定部25は、決定した優先順位に従って、ブランク項目を埋めるべきデータを推定する。
例えば、推定部25が、ユーザの行動履歴関連情報から、“ナビゲーション”の優先順位の方が“スケジューラ”よりも高いと判断すると、問い合わせ部26は、ナビゲーションのブランク項目(“出発時間”)を埋めるべく、「会社への出発時間は、“7時”でよいですか。」といった対話文を生成する。一方、推定部25が、ユーザの行動履歴関連情報から、“スケジューラ”の優先順位の方が“ナビゲーション”よりも高いと判断すると、問い合わせ部26は、スケジューラのブランク項目(“開始時間”)を埋めるべく、「会議のスタートは、“7時”でよいですか。」といった対話文を生成する。このように、ユーザの行動履歴に基づき、ブランク項目を埋めるべきサービスの優先順位を決定しておくことで、より精度の高いブランク推定データを生成することが可能となる。
C.その他
本発明は、上述した本実施形態及び変形例に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。例えば、上述した各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。
また、本明細書において、「ユニット」や「部」とは、単に物理的構成を意味するものではなく、その「ユニット」や「部」が実行する処理をソフトウェアによって実現する場合も含む。また、1つの「ユニット」や「部」が実行する処理を2つ以上の物理的構成や装置により実現されても、2つ以上の「ユニット」や「部」が実行する処理を1つの物理的手段や装置により実現されてもよい。また、上記例では、サービス提供システムの適用対象を特に言及しなかったが、例えば車両に搭載される様々な電子機器(例えばタブレット端末やスマートフォン、携帯情報端末など)に適用可能である。
また、本明細書において説明した各処理を実施するプログラムは、記録媒体に記憶させてもよい。この記録媒体を用いれば、対話管理装置2を構成するコンピュータに、上記プログラムをインストールすることができる。ここで、上記プログラムを記憶した記録媒体は、非一過性の記録媒体であっても良い。非一過性の記録媒体は特に限定されないが、例えば、CD−ROM等の記録媒体であっても良い。
100…サービス提供システム、1…情報端末、2…対話管理装置、21…項目特定部、22…充填部、23…ブランク項目特定部、24…情報収集部、25…推定部、26…問い合わせ部、27…確定部、28…要求部、29…サービス・フレームDB、2a…スケジューラ、2b…ナビゲーション、2c…交通情報、3…音声認識装置。

Claims (4)

  1. ユーザによる発話内容に基づき、複数の項目から構成される1つ以上のサービス・フレームの各項目に対し、データを埋めていく対話管理装置であって、
    前記ユーザにより発話された内容に基づいて、1つ以上のサービス・フレームを特定するとともに、特定した前記サービス・フレームについて、データを埋めるべき項目を特定する特定部と、
    特定した前記項目に対し、発話された内容に応じたデータを埋める充填部と、
    特定した前記項目に前記データが埋められた前記サービス・フレームにおいて、データが埋められていないブランク項目がある場合に、前記ユーザの過去の行動履歴に基づき、前記ブランク項目を埋めるべきデータを推定する推定部と、
    前記ユーザに対して、前記ブランク項目を埋めるべきデータが、推定した前記データで正しいか否かの問い合わせを行う問い合わせ部と、
    前記ユーザから正しい旨の返答が得られた場合に、推定した前記データを、前記ブランク項目を埋めるべきデータとして確定する確定部と
    前記サービス・フレームが複数ある場合には、前記ユーザの過去の行動履歴に基づき、前記ブランク項目を埋めるべきデータを推定するサービス・フレームの優先順位を決定する決定部とを具備し、
    前記推定部は、決定された優先順位に従って、優先順位の高いサービス・フレームから順番に、前記ブランク項目を埋めるべきデータを推定する、対話管理装置。
  2. 前記推定部は、
    外部から前記ユーザの過去の行動履歴に関わる行動履歴関連情報を取得する第1取得部と、
    前記ユーザの現在位置をあらわす現在位置情報を取得する第2取得部とを備え、
    取得した前記行動履歴関連情報及び前記現在位置情報に基づき、前記ブランク項目を埋めるべきデータを推定する、請求項1に記載の対話管理装置。
  3. 前記ユーザから正しくない旨の返答が得られた場合には、前記ユーザに対して、前記ブランク項目を埋めるべきデータの発話をリクエストする要求部をさらに具備する、請求項1または2に記載の対話管理装置。
  4. ユーザによる発話内容に基づき、複数の項目から構成される1つ以上のサービス・フレームの各項目に対し、データを埋めていくコンピュータを、
    前記ユーザにより発話された内容に基づいて、1つ以上のサービス・フレームを特定するとともに、特定した前記サービス・フレームについて、データを埋めるべき項目を特定する特定部と、
    特定した前記項目に対し、発話された内容に応じたデータを埋める充填部と、
    特定した前記項目に前記データが埋められた前記サービス・フレームにおいて、データが埋められていないブランク項目がある場合に、前記ユーザの過去の行動履歴に基づき、前記ブランク項目を埋めるべきデータを推定する推定部と、
    前記ユーザに対して、前記ブランク項目を埋めるべきデータが、推定した前記データで正しいか否かの問い合わせを行う問い合わせ部と、
    前記ユーザから正しい旨の返答が得られた場合に、推定した前記データを、前記ブランク項目を埋めるべきデータとして確定する確定部と
    前記サービス・フレームが複数ある場合には、前記ユーザの過去の行動履歴に基づき、前記ブランク項目を埋めるべきデータを推定するサービス・フレームの優先順位を決定する決定部として機能させるプログラムであって、
    前記推定部は、決定された優先順位に従って、優先順位の高いサービス・フレームから順番に、前記ブランク項目を埋めるべきデータを推定する、プログラム。
JP2017236961A 2017-12-11 2017-12-11 対話管理装置及びプログラム Active JP6954821B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017236961A JP6954821B2 (ja) 2017-12-11 2017-12-11 対話管理装置及びプログラム
US16/213,364 US11113025B2 (en) 2017-12-11 2018-12-07 Interaction management device and non-transitory computer readable recording medium
CN201811495086.4A CN109903759B (zh) 2017-12-11 2018-12-07 交互管理装置和非暂时性计算机可读记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017236961A JP6954821B2 (ja) 2017-12-11 2017-12-11 対話管理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019105685A JP2019105685A (ja) 2019-06-27
JP6954821B2 true JP6954821B2 (ja) 2021-10-27

Family

ID=66696789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017236961A Active JP6954821B2 (ja) 2017-12-11 2017-12-11 対話管理装置及びプログラム

Country Status (3)

Country Link
US (1) US11113025B2 (ja)
JP (1) JP6954821B2 (ja)
CN (1) CN109903759B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021009243A (ja) * 2019-07-02 2021-01-28 コニカミノルタ株式会社 画像形成装置およびそれを制御するためのプログラム
US11308265B1 (en) 2019-10-11 2022-04-19 Wells Fargo Bank, N.A. Digitally aware neural dictation interface

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3674453B2 (ja) * 2000-04-14 2005-07-20 株式会社デンソー 対話型ユーザインターフェース装置
JP4144443B2 (ja) * 2003-06-19 2008-09-03 富士通株式会社 対話装置
JP4539149B2 (ja) * 2004-04-14 2010-09-08 ソニー株式会社 情報処理装置および情報処理方法、並びに、プログラム
JP2009087172A (ja) * 2007-10-02 2009-04-23 Pronet Corp プログラムの作製方法
US20120166929A1 (en) * 2010-12-28 2012-06-28 International Business Machines Corporation System and method for providing a context-sensitive user interface
CN110348812A (zh) * 2012-12-13 2019-10-18 耐克创新有限合伙公司 用于监测健身的装置
CA2897042A1 (en) * 2013-01-09 2014-07-17 Evernym, Inc. Systems and methods for access-controlled interactions
US10956433B2 (en) * 2013-07-15 2021-03-23 Microsoft Technology Licensing, Llc Performing an operation relative to tabular data based upon voice input
JP2015069103A (ja) 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 情報処理装置、制御方法、及びプログラム
US10192549B2 (en) * 2014-11-28 2019-01-29 Microsoft Technology Licensing, Llc Extending digital personal assistant action providers
JP6604542B2 (ja) * 2015-04-02 2019-11-13 パナソニックIpマネジメント株式会社 対話方法、対話プログラム及び対話システム
US9959866B2 (en) 2015-04-02 2018-05-01 Panasonic Intellectual Property Management Co., Ltd. Computer-implemented method for generating a response sentence by using a weight value of node
US10262062B2 (en) * 2015-12-21 2019-04-16 Adobe Inc. Natural language system question classifier, semantic representations, and logical form templates
CN105701211A (zh) * 2016-01-13 2016-06-22 北京光年无限科技有限公司 面向问答系统的主动交互数据处理方法及系统
JP6804865B2 (ja) 2016-04-21 2020-12-23 クラリオン株式会社 情報提供システム、情報提供装置および情報提供方法

Also Published As

Publication number Publication date
US11113025B2 (en) 2021-09-07
CN109903759A (zh) 2019-06-18
JP2019105685A (ja) 2019-06-27
CN109903759B (zh) 2023-06-13
US20190179612A1 (en) 2019-06-13

Similar Documents

Publication Publication Date Title
JP6647351B2 (ja) 候補応答情報を生成する方法及び装置
EP3622510B1 (en) Intercom-style communication using multiple computing devices
KR102270132B1 (ko) 패킷 기반 데이터 메시지 전송의 시퀀스 의존 동작 처리
JP5958475B2 (ja) 音声認識端末装置、音声認識システム、音声認識方法
CN109065053B (zh) 用于处理信息的方法和装置
US20120290301A1 (en) Method and system of enabling intelligent and lightweight speech to text transcription through distributed environment
JP2015135494A (ja) 音声認識方法及び装置
JP2013529794A (ja) 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法
CN102592591A (zh) 双带语音编码
CN110956955B (zh) 一种语音交互的方法和装置
JP7278980B2 (ja) 支援装置、支援方法、およびプログラム
US20200211560A1 (en) Data Processing Device and Method for Performing Speech-Based Human Machine Interaction
JP6954821B2 (ja) 対話管理装置及びプログラム
CN112509562A (zh) 用于文本后处理的方法、装置、电子设备和介质
JP7024799B2 (ja) 車両用操作支援装置
CN110489670B (zh) 一种基于多维地图的民生服务移动应用平台系统及其使用方法
CN105869631B (zh) 语音预测的方法和装置
CN110223694B (zh) 语音处理方法、系统和装置
US20210241755A1 (en) Information-processing device and information-processing method
TW202028992A (zh) 語音查詢系統、語音查詢處理方法、智慧型揚聲器運用伺服器裝置、及程式
JP7377668B2 (ja) 制御装置、制御方法及びコンピュータプログラム
US11755652B2 (en) Information-processing device and information-processing method
JP6826324B2 (ja) サービス提供装置及びサービス提供プログラム
TWI815090B (zh) 服務系統及服務資訊提供方法
JP2018054926A (ja) 音声対話装置および音声対話方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210930

R151 Written notification of patent or utility model registration

Ref document number: 6954821

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151