JP2020034914A

JP2020034914A - 対話エージェントの動作方法及びその装置

Info

Publication number: JP2020034914A
Application number: JP2019154766A
Authority: JP
Inventors: 映錫金; Young-Seok Kim; 貞訓朴; Jeong-Hoon Park; 成民玉; Seong Min Oak; 在勳全; Jehun JEON; 俊輝崔; Junhwi Choi
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2018-08-28
Filing date: 2019-08-27
Publication date: 2020-03-05
Anticipated expiration: 2039-08-27
Also published as: JP7460338B2; US20200075003A1; US11705128B2; EP3618062A1; US11056110B2; US20210304762A1; CN110909135A; KR20200024511A; EP3618062B1

Abstract

【課題】対話エージェントの動作方法及びその装置を提供する。【解決手段】実施形態に係る対話エージェントの動作方法は、サービスの要求のために送信される送信発話のうち少なくとも１つ及びサービスの要求のために受信される受信発話のうち少なくとも１つを含む発話ヒストリーを取得し、発話ヒストリーに基づいてサービスの要求のために求められる項目を含む要求事項明細を更新し、更新された要求事項明細に基づいてサービスを求めるための発話情報を生成して出力する。【選択図】図２

Description

本発明の実施形態は対話エージェントの動作方法及びその装置に関する。

神経網の発展に伴って、ユーザの便宜を提供する様々な人工知能サービス及びロボット技術が提供されている。例えば、チャットボット（ｃｈａｔｂｏｔ）の場合、ユーザから入力された意図及びエンティティ（ｅｎｔｉｔｙ）によりユーザに代わって簡単な予約を行うことができる。対話エージェントシステム（ＤｉａｌｏｇＡｇｅｎｔＳｙｓｔｅｍ；ＤＡＳ）も、ユーザに代わって電話で所望のサービスを予約する動作を行うことができる。しかし、サービス提供者がユーザが求める事項と異なる条件を提示したり、又は、該当ユーザの要求事項が極めて複雑な場合などのように、対話が単純な問答形態ではない場合、チャットボット又は対話エージェントシステムは、ユーザが要求したサービスを充分に処理することができない。その他にも、ユーザが対話エージェントシステムの動作中に直接対話に介入することができない。

米国特許出願第１５／４５６４１２号明細書

一実施形態の目的は、サービスの要求のために対話エージェント装置とユーザ及びサービス提供者間のやりとりした送受信発話を含む発話ヒストリーに基づいて、サービスの要求のために求められる項目を含む要求事項明細を更新し、更新された要求事項明細に基づいて、サービスを求めるための発話情報を生成して出力する対話エージェントを提供することにある。

一実施形態の目的は、対話エージェント装置がサービス提供者の応答発話をＵＩモジュールに伝達し、声及び／又はテキストで出力することで、ユーザとサービス提供者とを直接対話させることにある。

一側面によれば、対話エージェントの動作方法は、サービスの要求のために送信される送信発話のうち少なくとも１つ、及び前記サービスの要求のために受信される受信発話のうち少なくとも１つを含む発話ヒストリーを取得するステップと、前記発話ヒストリーに基づいて、前記サービスの要求のために求められる項目を含む要求事項明細を更新するステップと、前記更新された要求事項明細に基づいて、前記サービスを求めるための発話情報を生成するステップと、前記発話情報を出力するステップとを含む。

前記要求事項明細は、前記項目によって求められる条件が満足されたか否かを示す状態情報を含み得る。

前記状態情報は、該当項目の条件が満足されたことを示す第１状態、前記該当項目の条件が満足されないことを示す第２状態、及び前記該当項目の条件の満足の有無がまだ決定されていないことを示す第３状態のうち少なくとも１つを含み得る。

前記更新するステップは、前記発話ヒストリーに基づいて、前記項目によって求められる条件の満足の有無を判断するステップと、前記判断結果に応じて前記要求事項明細を更新するステップとをさらに含み得る。

前記条件の満足の有無を判断するステップは、前記項目のうち少なくとも１つの項目によって求められる条件が満足されたか否かを判断するステップと、前記項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断するステップのうち少なくとも１つを含み得る。

前記少なくとも１つの項目によって求められる条件が満足されたか否かを判断するステップは、前記発話ヒストリー及び前記要求事項明細を分類器に入力するステップであって、前記分類器は、前記項目によって求められる条件の満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力する、ステップと、前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が満足されたか否かを判断するステップとを含み得る。

前記少なくとも１つの項目によって求められる条件が不満足であるか否かを判断するステップは、前記発話ヒストリー及び前記要求事項明細を分類器に入力するステップであって、前記分類器は、前記項目によって求められる条件の不満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力する、ステップと、前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が不満足であるか否かを判断するステップとを含み得る。

前記対話エージェントの動作方法は、前記項目によって求められる条件の全てが満足されたか否かを判断するステップと、前記条件の全てが満足されたという判断に応じて、前記サービスの要求が完了したことをユーザに知らせるステップとをさらに含み得る。

前記項目によって求められる条件の全てが満足されたか否かを判断するステップは、前記更新された要求事項明細に基づいて、前記条件の全てが満足されたか否かを判断するステップと、前記発話ヒストリー及び前記要求事項明細に基づいて前記項目によって求められる条件の満足の有無を判断し、前記条件の全ての満足の有無を示す値を出力する分類器を用いて、前記条件の全てが満足されたか否かを判断するステップのうち少なくとも１つを含み得る。

前記対話エージェントの動作方法は、前記更新された要求事項明細に基づいて発話対象を決定するステップをさらに含み、前記発話情報を出力するステップは、前記発話対象に前記発話情報を出力するステップを含み得る。

前記発話対象を決定するステップは、前記更新された要求事項明細に含まれた項目のうち、少なくとも１つの項目によって求められる条件が満足されない場合、前記発話対象をユーザとして決定するステップを含み得る。

前記項目は、前記サービス類型ごとに決定された少なくとも１つの必須項目を含み得る。

前記項目は、前記必須項目を除いた少なくとも１つの選択項目をさらに含み得る。

前記対話エージェントの動作方法は、ユーザ装置から前記サービスの提供者との直接通話を求める信号を受信するステップと、前記直接通話を求める信号の受信後に、前記発話情報の生成を中断するステップと、前記ユーザ装置から入力される情報を前記サービス提供者に提供するステップとをさらに含み得る。

前記対話エージェントの動作方法は、前記対話エージェントを通した対話再開を求める信号を受信するステップと、前記対話再開を求める信号に応答して、前記発話情報の生成を再開するステップとをさらに含み得る。

前記対話エージェントの動作方法は、前記更新された要求事項明細をユーザに提供するステップと、前記発話ヒストリーをユーザに提供するステップのうち少なくとも１つをさらに含み得る。

前記対話エージェントの動作方法は、前記更新された要求事項明細に含まれた項目のうち少なくとも１つの項目によって求められる条件が満足されない場合、前記少なくとも１つの項目をユーザに問い合わせるステップをさらに含み得る。

前記対話エージェントの動作方法は、ユーザ端末のインターフェースを介して収集された情報に基づいて生成された前記要求事項明細を受信するステップをさらに含み得る。

前記発話ヒストリーを取得するステップは、前記対話エージェントが前記サービスの提供者に送信する第１送信発話を取得するステップと、前記対話エージェントが前記サービスの提供者から受信する第１受信発話を取得するステップと、前記対話エージェントがユーザに送信する第２送信発話を取得するステップと、前記対話エージェントが前記ユーザから受信する第２受信発話を取得するステップのうち少なくとも１つを含み得る。

一実施形態によれば、対話エージェント装置は、サービスの要求のために送信される送信発話のうち少なくとも１つ、及び前記サービスの要求のために受信される受信発話のうち少なくとも１つを含む発話ヒストリーを取得し、発話情報を出力する通信インターフェースと、前記発話ヒストリーに基づいて、前記サービスの要求のために求められる項目を含む要求事項明細を更新し、前記更新された要求事項明細に基づいて前記サービスを求めるための前記発話情報を生成するプロセッサとを含む。

前記プロセッサは、前記発話ヒストリーに基づいて前記項目によって求められる条件の満足の有無を判断し、前記判断結果に応じて前記要求事項明細を更新し得る。

前記プロセッサは、前記項目のうち少なくとも１つの項目によって求められる条件が満足されたか否かを判断したり、又は、前記項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断し得る。

前記プロセッサは、前記発話ヒストリー及び前記要求事項明細を分類器（前記分類器は、前記項目によって求められる条件の満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力）に入力し、前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が満足されたか否かを判断し得る。

前記プロセッサは、前記発話ヒストリー及び前記要求事項明細を分類器（前記分類器は、前記項目によって求められる条件の不満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力）に入力し、前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が不満足であるか否かを判断し得る。

前記プロセッサは、前記項目によって求められる条件の全てが満足されたか否かを判断し、前記条件の全てが満足されたという判断に応じて、前記サービスの要求が完了したことをユーザに知らせ得る。

前記プロセッサは、前記更新された要求事項明細に基づいて前記条件の全てが満足されたか否かを判断したり、又は、前記発話ヒストリー及び前記要求事項明細に基づいて前記項目によって求められる条件の満足の有無を判断し、前記条件の全ての満足の有無を示す値を出力する分類器を用いて前記条件の全てが満足されたか否かを判断し得る。

前記プロセッサは、前記更新された要求事項明細に基づいて発話対象を決定し、前記発話対象に前記発話情報を出力し得る。

前記プロセッサは、前記更新された要求事項明細に含まれた項目のうち少なくとも１つの項目によって求められる条件が満足されない場合、前記発話対象をユーザとして決定し得る。

前記通信インターフェースは、ユーザ装置から前記サービスの提供者との直接通話を求める信号を受信し、前記プロセッサは、前記直接通話を求める信号の受信後に、前記発話情報の生成を中断し、前記ユーザ装置から入力される情報を前記サービス提供者に提供し得る。

前記通信インターフェースは、前記対話エージェントを通した対話再開を求める信号を受信し、前記プロセッサは、前記対話再開を求める信号に応答して、前記発話情報の生成を再開し得る。

前記通信インターフェースは、前記更新された要求事項明細をユーザに提供したり、前記発話ヒストリーを前記ユーザに提供したり、又は、前記更新された要求事項明細及び前記発話ヒストリーを前記ユーザに提供し得る。

前記プロセッサは、前記更新された要求事項明細に含まれた項目のうち少なくとも１つの項目によって求められる条件が満足されない場合、前記少なくとも１つの項目をユーザに問い合わせ得る。

前記通信インターフェースは、ユーザ端末のインターフェースを介して収集された情報に基づいて生成された前記要求事項明細を受信し得る。

前記通信インターフェースは、前記対話エージェントが前記サービスの提供者に送信する第１送信発話、前記対話エージェントが前記サービスの提供者から受信する第１受信発話、前記対話エージェントがユーザに送信する第２送信発話、及び前記対話エージェントが前記ユーザから受信する第２受信発話のうち少なくとも１つを取得し得る。

一実施形態によれば、対話エージェントは、メモリと、ユーザ装置からサービス要求に関する要求事項を受信し、前記要求事項に基づいて要求事項明細を生成し、前記要求事項明細に基づいてサービス提供者との接続を設定し、前記接続の間に前記サービス提供者によって前記要求事項が全て満足されるかを決定し、前記要求事項が全て満足される場合、前記サービスに対する要求が完了したことをユーザ装置に通知し、前記要求事項が全て満足されない場合、少なくとも１つの要求事項が満足されないことを前記ユーザ装置に通知し、満足されない少なくとも１つの要求事項に関する変更された要求事項を受信し、前記変更された要求事項により前記要求事項明細を更新するプロセッサとを含む。

前記プロセッサは、前記更新された要求事項明細に基づいて前記サービス提供者と第２接続を設定し、前記第２接続の間に、前記更新された要求事項明細に関する全ての条件が前記サービス提供者によって満足されるか否かを決定し得る。

前記ユーザ装置から受信された要求事項が自然語の形態である場合、前記プロセッサは、前記自然語を分析し、前記自然語の分析に基づいて前記サービスのフィールド又は類型を決定し、前記決定されたフィールド又は類型に基づいて前記要求事項明細を生成し得る。

前記ユーザ装置から受信された要求事項がテキスト形態である場合、前記プロセッサは、前記テキストをトークンに分離し、前記分離したトークンを神経網モデルに入力し、前記神経網モデルの出力に基づいて前記要求事項明細を生成し得る。

一側面によれば、サービスの要求のために対話エージェント装置とユーザ及びサービス提供者間のやりとりした送受信発話を含む発話ヒストリーに基づいて、サービスの要求のために求められる項目を含む要求事項明細を更新し、更新された要求事項明細に基づいてサービスを求めるための発話情報を生成して出力する対話エージェントを提供することができる。

一側面によれば、対話エージェント装置がサービス提供者の応答発話をＵＩモジュールに伝達し、声及び／又はテキストで出力することで、ユーザとサービス提供者とを直接対話させることができる。

基本的な対話エージェントシステムを説明するための図である。一実施形態に係る対話エージェントの動作方法を示したフローチャートである。一実施形態に係る対話エージェントシステムの構成図である。一実施形態に係る対話エージェントの対話進行シナリオを説明するための図である。一実施形態に係る対話進行により要求事項明細が更新される過程を説明するための図である。一実施形態に係る対話進行により要求事項明細が更新される過程を説明するための図である。一実施形態に係る対話進行により要求事項明細が更新される過程を説明するための図である。一実施形態に係る対話進行により要求事項明細が更新される過程を説明するための図である。一実施形態に係る対話進行により要求事項明細が更新される過程を説明するための図である。一実施形態に係る対話エージェントが発話ヒストリー及び要求事項明細を表示する方法を説明するための図である。他の実施形態に係る対話エージェントのユーザインターフェースを説明するための図である。一実施形態に係る要求事項明細に含まれた必須項目及び選択項目に対する処理方法を説明するための図である。一実施形態に係る対話エージェント装置のブロック図である。

下記で説明する実施形態は様々な変更が加えられることができる。特許出願の範囲がこのような実施形態によって制限も限定もされることはない。各図面に提示された同じ参照符号は同じ部材を示す。

本明細書で開示されている特定の構造的又は機能的な説明は単に実施形態を説明するための目的として例示されたものであり、実施形態は様々な異なる形態で実施され、本明細書に説明された実施形態に限定されることはない。

本明細書で用いた用語は、単に特定の実施形態を説明するために用いられるものであって、本発明を限定しようとする意図はない。単数の表現は、文脈上、明白に異なる意味をもたない限り複数の表現を含む。本明細書において、「含む」又は「有する」等の用語は明細書上に記載した特徴、数字、ステップ、動作、構成要素、部品又はこれらを組み合わせたものが存在することを示すものであって、１つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又はこれを組み合わせたものなどの存在又は付加の可能性を予め排除しないものとして理解しなければならない。

異なる定義がされない限り、技術的であるか又は科学的な用語を含むここで用いる全ての用語は、本実施形態が属する技術分野で通常の知識を有する者によって一般的に理解されるものと同じ意味を有する。一般的に用いられる予め定義された用語は、関連技術の文脈上で有する意味と一致する意味を有するものと解釈すべきであって、本明細書で明白に定義しない限り、理想的又は過度に形式的な意味として解釈されることはない。

また、添付図面を参照して説明することにおいて、図面符号に関係なく同じ構成要素は同じ参照符号を付与し、これに対する重複する説明は省略する。実施形態の説明において関連する公知技術に対する具体的な説明が実施形態の要旨を不要に曖昧にすると判断される場合、その詳細な説明は省略する。

図１は、基本的な対話エージェントシステムを説明するための図である。図１を参照すると、ユーザ１０１、対話エージェントシステム（ＤｉａｌｏｇＡｇｅｎｔＳｙｓｔｅｍ；ＤＡＳ）１０３、及びサービス提供者（ＳｅｒｖｉｃｅＰｒｏｖｉｄｅｒ；ＳＰ）１０５が示されている。ここで、ユーザ１０１はユーザ端末のユーザに該当し、サービス提供者１０５はサービス提供者端末のユーザに該当する。

例えば、ユーザ１０１は、対話エージェントシステム１０３を介して夕食の予約を求める。ユーザ１０１は、対話エージェントシステム１０３に「電話番号：０１０−ＸＸＸＸ−１２３４」、「今週の水曜日、午後７時に２人予約して」のように予約希望の場所の連絡先、予約時間、及び予約場所などを含む予約要求事項を知らせる。ユーザ１０１の発話を受信した対話エージェントシステム１０３は「０１０−ＸＸＸＸ−１２３４」に電話をかける。ここで、電話番号「０１０−ＸＸＸＸ−１２３４」に該当するサービス業者が、例えば、「寿司Ｏ」というレストランであれば、サービス提供者１０５は「寿司Ｏ」の予約の受付者又は管理者であってもよい。

対話エージェントシステム１０３から電話を受信したサービス提供者１０５が「もしもし、寿司Ｏです」のように応答すると、対話エージェントシステム１０３は、「今週の水曜日、午後７時に２人予約できますか？」のようにユーザ１０１の予約要求事項を伝達する。

サービス提供者１０５は、予約要求事項による予約が可能であれば、ユーザ１０１の要求事項による予約を進む。これとは異なって、該当の予約要求事項による予約が不可能であれば、サービス提供者１０５は「申し訳ございませんが、６時と８時にのみ予約できます」のように変更された予約条件を再び提示するかもしれない。この場合、対話エージェントシステム１０３は、ユーザの予約要求事項が満足されないため、ユーザに「予約不可」というサービス結果を提供する。このように、基本的な対話エージェントシステム１０３は、サービス提供者１０５がユーザ１０１が求める事項と異なる変更された条件を提示したり、又は、該当ユーザの要求事項が極めて複雑な場合などのように対話が単純な問答形態でない場合、ユーザの予約要求事項を充分に処理できない。

その他にも、ユーザ１０１は、サービス提供者１０５との直接対話を介して該当の日付の７時には予約できないが、６時と８時には予約可能である状況であれば、予約時間を６時又は８時に流動的に変更できるかもしれない。しかし、ユーザ１０１が対話エージェントシステム１０３とサービス提供者１０５との間の対話中に直接介入できない場合、ユーザ１０１は、対話エージェントシステム１０３とサービス提供者１０５との間の対話終了の後、再び対話エージェントシステム１０３を介して変更された予約時間（６時又は８時）への予約を要求しない限り、該当の日付の夕食の予約は不可能である。

図２は、一実施形態に係る対話エージェントの動作方法を示したフローチャートである。図２を参照すると、一実施形態に係る対話エージェント装置は、サービスの要求のために送受信される送信発話及び受信発話のうち少なくとも１つを含む発話ヒストリー（ｕｔｔｅｒａｎｃｅｈｉｓｔｏｒｙ）を取得する（Ｓ２１０）。ここで、サービスは、例えば、旅行予約、レストラン予約、ヘアーショップ予約、レントカー予約、公演予約、宿舎予約などのような様々な分野に対する予約サービス、登録サービス、又は電話の問い合わせサービスなどを含み、必ずこれに限定されることはない。

一実施形態において「発話（ｕｔｔｅｒａｎｃｅ）」は、人の考えているものが実際に文章単位で実現されること、又は音を出して話す言語行為のことを指す。発話は、発話の対象（又は発話の対象者）（例えば、話者、聴者）、発話の状況、発話の主題（又は発話の対象）などにより具体的な意味が決定されたり、変わり得る。一実施形態において、発話は人の考えていることを音に出して話す以外にも、人が考えているものをテキストで表現することを全て含む意味として理解される。

送信発話は、対話エージェント装置が対話の相手に送信する発話に該当する。受信発話は、対話エージェント装置が対話の相手から受信する発話に該当する。ここで、送信発話の対象及び受信発話の対象は、ユーザ端末（又は、ユーザ）及び／又はサービス提供者端末（又は、サービス提供者）であり得る。送信発話の対象と受信発話の対象は互いに一致してもよく、互いに異なってもよい。

送信発話は、例えば、音声、又はテキストの形態であってもよい。受信発話は、例えば、音声、テキスト及び命令の形態であってもよい。命令形態の受信発話は、例えば、「予約電話をかけて」、又は「予約」などのようにユーザが予め約束された命令語を自然語で発話したり、又は、テキストで記載することにより伝達される。又は、命令形態の受信発話は、例えば、「サービス要求」、「直接対話する」又は「直接対話断絶」などのようにユーザ端末の画面に表示される様々なボタン、アイコン、その他のユーザインターフェースに対するユーザ選択によって伝達される。

発話ヒストリーは、ユーザ装置の装置特性に応じてテキスト形態で格納されてもよく、音声形態で格納されてもよく、又は、特徴ベクトルの形態で格納されてもよい。格納する形態及び格納の仕方はこれらに限定されず、当該技術分野で既知の任意の方法が使用されてよい。ここで、ユーザ装置の装置特性は、例えば、ユーザ装置がディスプレイのみを含んでいるか、スピーカだけを含んでいるか、又は、ディスプレイとスピーカの全てを含んでいるか、などのように該当装置の機能的な特性に該当する。

例えば、受信発話が音声である場合、対話エージェント装置は、該当音声をテキスト形態に変換して発話ヒストリーに格納する。又は、受信発話が命令である場合、該当命令を対応するテキスト、又は、予め約束された形態のテキストに変換して発話ヒストリーに格納する。

発話ヒストリーは、例えば、対話エージェントがサービスの提供者に送信する第１送信発話、対話エージェントがサービスの提供者から受信する第１受信発話、対話エージェントがユーザに送信する第２送信発話、及び対話エージェントがユーザから受信する第２受信発話のうち少なくとも１つを含み得る。

発話ヒストリーは、例えば、ユーザ装置で要求事項明細を初めて作成する時点から、ユーザが要求したサービスの要求が完了したことを対話エージェントがユーザ端末に知らせる時点までの送信発話及び／又は受信発話内容の一部又は全てを含み得る。

対話エージェント装置は、ステップＳ２１０で取得した発話ヒストリーに基づいて、サービスの要求のために求められる項目を含む要求事項明細を更新する（Ｓ２２０）。ここで、サービスの要求のために求められる項目は、例えば、ユーザが求めるサービスがヘアーショップ予約である場合、ヘアーショップの連絡先、予約時間、予約サービス（カット、ファーム、染色など）、及びヘアデザイナーなどである。又は、ユーザが求めるサービスが公演予約である場合、コンサートホール（又は、予約部署）の連絡先、予約対象公演、公演時間、観覧座席の等級、及び観覧座席の位置などである。一実施形態でサービスの要求のために求められる項目は、サービス類型ごとに相違するように決定されてもよく、サービス類型とは独立した包括的な形態に決定されてもよい。

要求事項明細は、例えば、ユーザ端末のインターフェース（図３に示すＵＩモジュール）３１０を介して収集された情報に基づいて生成され、対話エージェント装置に伝えられてもよい。要求事項明細に含まれた項目は、サービス類型ごとに決定された少なくとも１つの必須項目を含む。また、項目は、必須項目を除いた少なくとも１つの選択項目をさらに含む。該当項目が必須項目であるか、選択項目であるかはユーザの発話内容に応じて変更される。要求事項明細は、項目によって求められる条件が満足されたか否かを示す状態情報を含む。状態情報は、例えば、該当項目の条件が満足されたことを示す第１状態、該当項目の条件が満足されないことを示す第２状態、及び該当項目の条件の満足の有無がまだ決定されていないことを示す第３状態のうち少なくとも１つを含む。例えば、要求事項明細で第１状態は「Ｏ」に表示され、第２状態は「Ｘ」に表示され、第３状態は「？」に表示される。状態情報は、例えば、対話エージェント装置の送信発話の応答として受信される受信発話に基づいて更新される。

ステップＳ２２０において、対話エージェント装置は、発話ヒストリー及び／又は要求事項明細に基づいて項目によって求められる条件の満足の有無を判断する。対話エージェント装置は、例えば、項目のうち少なくとも１つの項目によって求められる条件が満足されたか否かを判断する。対話エージェント装置は、例えば、発話ヒストリー及び要求事項明細を第１分類器に入力する。ここで、第１分類器は、項目によって求められる条件の満足の有無を判断し、項目に対応する状態情報をマルチ・ホット・ベクトル（ｍｕｌｔｉ−ｈｏｔ−ｖｅｃｔｏｒ）に出力する。対話エージェント装置は、第１分類器が出力するマルチ・ホット・ベクトルに基づいて、少なくとも１つの項目によって求められる条件が満足されたか否かを判断する。

又は、対話エージェント装置は、項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断する。対話エージェント装置は、発話ヒストリー及び要求事項明細を第２分類器に入力する。ここで、第２分類器は、項目によって求められる条件の不満足の有無を判断し、項目に対応する状態情報をマルチ・ホット・ベクトルに出力する。対話エージェント装置は、第２分類器から出力されるマルチ・ホット・ベクトルに基づいて、少なくとも１つの項目によって求められる条件が不満足であるか否かを判断する。

対話エージェント装置は、条件の満足の有無に対する判断結果に応じて要求事項明細を更新する。一実施形態に係る対話エージェント装置が要求事項明細を更新する過程については、図５を参照しながら具体的に説明する。

対話エージェント装置は、更新された要求事項明細に基づいて、サービスを求めるための発話情報を生成する（Ｓ２３０）。発話情報は、送信発話を生成するための情報として、例えば、対話エージェント装置の音声形態から出力されてもよく、又は、テキスト形態から出力されてもよい。

対話エージェント装置は、発話情報を出力する（Ｓ２４０）。対話エージェント装置は、例えば、更新された要求事項明細に基づいて発話対象（者）を決定し、決定された発話対象に発話情報を出力する。ここで、発話対象は、例えば、ユーザであってもよく、サービス提供者であってもよく、又は、第三者であってもよい。一実施形態によれば、対話エージェント装置は、更新された要求事項明細に含まれた項目のうち、少なくとも１つの項目によって求められる条件が満足されない場合、発話対象をユーザとして決定する。

また、対話エージェント装置は、項目によって求められる条件の全てが満足されたか否かを判断する。対話エージェント装置は、例えば、更新された要求事項明細に基づいて、項目によって求められる条件の全てが満足されたか否かを判断する。又は、対話エージェント装置は、第３分類器を用いて項目によって求められる条件の全てが満足されたか否かを判断する。ここで、第３分類器は発話ヒストリー及び要求事項明細に基づいて、項目によって求められる条件の全ての満足の有無を判断し、条件の全ての満足の有無を示す値（例えば、「０」又は「１」の２進値）を出力する。対話エージェント装置は、第３分類器で条件の全てが満足されたという判断に応じて、サービスの要求が完了したことをユーザに知らせることができる。対話エージェント装置は、サービスの要求が完了したことを、例えば、「予約が完了しました」のようにスピーカを介して音声形態にユーザに知らせてもよく、ディスプレイに表示されるテキスト形態にユーザに知らせてもよい。

図３は、一実施形態に係る対話エージェントシステムの構成図である。図３を参照すると、一実施形態に係る対話エージェントシステム３００は、ＵＩモジュール３１０、対話モジュール３３０、及び電話モジュール３５０を含む。ＵＩモジュール３１０は、ユーザ端末（又は、装置）に含まれてもよく、対話エージェント装置に含まれてもよい。対話モジュール３３０は、対話エージェント装置に含まれてもよい。

ＵＩモジュール３１０は、ユーザからサービスの要求及び／又は要求事項が入力される入力インターフェースと要求されたサービスに対する進行事項を示す出力インターフェースを提供する。ＵＩモジュール３１０は、要求事項の入力結果として、サービスの要求のために求められる項目を含む要求事項明細を対話モジュール３３０に伝達する。また、ＵＩモジュール３１０は、サービスの要求のための対話進行状況を出力インターフェースを介してユーザに伝達する。

ＵＩモジュール３１０は、要求事項入力部３１３及び対話内容出力部３１６を含む。

要求事項入力部３１３は、ユーザからサービスに対する要求事項が入力される入力インターフェースを提供する。入力インターフェースの入力モダリティ（ｍｏｄａｌｉｔｙ）は、音声を通じた話（自然語）であってもよく、タイピング（ｔｙｐｉｎｇ）を通したテキスト、又は、アイコン又はボタンのクリックなどによる命令語入力などであってもよい。要求事項入力部３１３が入力インターフェースから収集された要求事項に基づいて、サービスごとに決定した要求事項明細の必要項目に値を満足すれば、要求事項明細の初期情報入力が完了する。ここで、ユーザは、例えば、自然語対話を基盤に要求しようとするサービスと当該サービスの要求事項を入力する。

要求事項入力部３１３は、入力インターフェースを介して入力された自然語を分析して所望のサービスと、当該サービスに必要な項目に対応する値を探し得る。要求事項入力部３１３は、例えば、ドメイン及び意図分類（ｄｏｍａｉｎａｎｄｉｎｔｅｎｔｃｌａｓｓｉｆｉｃａｔｉｏｎ）及びスロットタギング（ｓｌｏｔｔａｇｇｉｎｇ）技術に基づいた神経網モデルを用いて入力された自然語からユーザの所望のサービスが何であるか、そして、当該サービスに必要な項目の値が何かを探す。より具体的に、要求事項入力部３１３は、入力インターフェースの入力モダリティがテキストである場合、該当テキストをパッシングしてｎグラム（ｎ−ｇｒａｍ）トークン（ｔｏｋｅｎ）に分離したり、あるいは、予め定義した辞書を基にテキストをパッシングして辞書にある単語、言い換えれば、トークンに分離し、分離したトークンを神経網モデルに入力することでユーザの所望のサービス、及び当該サービスに必要な項目の値を探すことができる。又は、要求事項入力部３１３は、入力モダリティが自然語である場合、音声認識期を用いて自然語を認識し、認識結果に基づいてユーザの所望のサービス、及び当該サービスに必要な項目の値を探すことができる。例えば、要求事項入力部３１３は、自然語分析結果に基づいてユーザの所望のサービス分野（又は、サービス類型）を決定し、当該サービス分野に対応してサービスごとに予め決定した項目を含むよう要求事項明細を生成する。要求事項入力部３１３は、一回のユーザ発話によってサービスの要求のために必要な全ての項目（例えば、必須項目）の値を満たすことができない場合、その後、追加質問を介して必要な項目に対する値がユーザから入力されてもよい。又は、要求事項入力部３１３は、ユーザが所望のサービスを直接選択するようにした後、サービスごとに決定した要求事項明細によりユーザが各項目の値を直接入力するようにしてもよい。要求事項入力部３１３は、例えば、図５Ａに示すように、要求事項明細の初期情報に対する入力が完了すると、作成された要求事項明細を対話モジュール３３０に提供する。

対話内容出力部３１６は、現在のサービス要求に関する進行事項をユーザに出力する出力インターフェースを提供する。出力インターフェースは、例えば、要求事項入力部３１３で要求事項が入力されるためのユーザとの対話、要求事項入力部３１３で要求事項の入力を完了した結果として生成される要求事項明細、対話モジュール３３０で生成する送信発話、送信発話に応答する受信発話、及び対話モジュール３３０で要求事項明細に含まれた項目のうち条件が満足されない項目がある場合、ユーザにこれを知らせる内容などのような情報、言い換えれば、発話ヒストリーをユーザに提供する。出力インターフェースがユーザに提供する情報は、例えば、自然語発話、自然語テキストなどの形態を有し、実施形態によって、特定通知音などの形態を有してもよい。

また、対話内容出力部３１６は、要求事項明細で条件が不満足であるか、又は、満足の有無がまだ決定されていない項目に対応する発話内容を、条件が満足された項目に対応する発話内容と相違するように表示する。ここで、条件が不満足であるか、又は、満足の有無がまだ決定されていない項目に対応する発話内容は、該当項目の状態情報が第２状態、又は第３状態に対応する発話内容であり得る。

対話内容出力部３１６は、要求事項明細で条件が不満足であるか、又は、満足の有無がまだ決定されていない項目に対応する発話内容を、例えば、ハイライト又は点滅などによって表示してユーザに提供する。出力インターフェースがユーザに提供する情報は、例えば、図５に示す各図面に示されているように、画面にテキストの形態に表示されてもよく、又は、スピーカを介して音声でユーザに提供されてもよい。また、対話内容出力部３１６は、要求事項明細で条件が満足されない項目に対応する発話内容がある場合、ユーザに別途の通知を提供する。

対話モジュール３３０は、ＵＩモジュール３１０から受信した要求事項明細で電話番号項目の値を参照して電話モジュール３５０を介してサービス提供者（ＳＰ）に電話呼出を行ってもよい。対話モジュール３３０は、サービス提供者との電話通話結果に応じて要求事項明細を更新し、更新された要求事項明細に基づいてサービスを求めるための発話情報を生成する。

対話モジュール３３０は、発話生成部３３３及び要求事項明細及び対話文脈管理部（以下、「管理部））３３６を含む。

発話生成部３３３は、ＵＩモジュール３１０から受信した要求事項明細及び管理部３３６から受信した発話ヒストリーのうち少なくとも１つに基づいて、サービス要求に必要な文章、言い換えれば、発話情報を生成する。ここで、発話生成部３３３は、要求事項明細に含まれた電話番号項目以外の各項目の値、及び今までの発話ヒストリーを考慮して発話情報を生成する。発話生成部３３３が生成した発話情報（例えば、テキスト形態の文章又は構文）は、ＴＴＳ（ｔｅｘｔｔｏｓｐｅｅｃｈ）機能を介して音声に変換され、電話モジュール３５０に送信発話として提供される。管理部３３６は、送信発話に対するサービス提供者の応答である受信発話を電話モジュール３５０から受信する。

管理部３３６は、受信発話のターン（ｔｕｒｎ）に基づいて、要求事項明細を更新する。管理部３３６は、例えば、対話エージェント装置の送信発話に対する応答が発話のターンに該当するかを判断することで、応答の受信が完了したか否かを決定する。発話のターンは、話者の変更又は話者の１つの応答の受信完了を示す。管理部３３６は、例えば、発話の話者が変更されたり、又は、話者Ａの発話後、３秒間の沈黙があった場合などのように、ある話者の発話後に予め設定された時間が超過した場合に応答が発話の１ターンに該当すると判断して応答の受信が完了される。

管理部３３６は、応答の受信が完了することにより、応答に基づいて要求事項明細に含まれた項目によって求められる条件が新しく満足されたか、言い換えれば、要求事項明細に含まれた項目の状態情報が変更されたかを判断して要求事項明細を更新する。

管理部３３６は、更新された要求事項明細に含まれた項目によって求められる条件の全てが満足されたかを判断し、条件の全てが満足されたという判断に応じて、管理部３３６は通話を終了する。管理部３３６は、例えば、前述した第３分類器を用いて条件の全てが満足されたか否かを判断する。第３分類器は、要求事項明細に含まれた項目によって求められる条件の全てが満足されたかを判断するよう、学習された神経網基盤の２進分類器（ｂｉｎａｒｙｃｌａｓｓｉｆｉｅｒ）であってもよい。

管理部３３６が通話を終了しようとする場合、対話モジュール３３０は、発話生成部３３３が通話終了に必要な発話情報（例えば、サービスの要求が完了したことをユーザに知らせる発話）を生成して出力させた後、管理部３３６が通話を終了させる。

管理部３３６は、発話ヒストリー及び要求事項明細を前述した第１分類器に入力し、第１分類器から出力されるマルチ・ホット・ベクトルによって要求事項明細の項目のうち条件が満足された項目があるか否かを判断し、要求事項明細を更新する。第１分類器は、例えば、神経網基盤のマルチ・クラス分類器であってもよい。第１分類器は、要求事項明細で条件が満足された項目をマルチ・ホット・ベクトルに出力する。例えば、要求事項明細の項目が合計１０個であり、そのうち２つである最初の項目及び２番目の項目の条件が満足されたと仮定する。この場合、第１分類器は、１０個のクラスのうち最初及び２番目クラスの値が「１」になるよう「１１００００００００」のようなマルチ・ホット・ベクトルを出力する。

また、管理部３３６は、発話ヒストリー及び要求事項明細を前述した第２分類器に入力し、第２分類器から出力されるマルチ・ホット・ベクトルによって要求事項明細の項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断して要求事項明細を更新する。第２分類器についても、第１分類器と同様に神経網基盤のマルチ・クラス分類器であってもよい。

第１分類器、第２分類器及び／又は第３分類器は、例えば、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）、ＤＮＮ（ＤｅｅｐＮｅｕｒａｌＮｅｔｗｏｒｋ）、ＲＮＮ（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）、又はＢＬＳＴＭ（ＢｉｄｉｒｅｃｔｉｏｎａｌＬｏｎｇＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ）などのように様々な構造の神経網で実現される。

管理部３３６は、条件を満足できない項目があれば、ＵＩモジュール３１０を介して条件を満足できない項目をユーザに通知し、ユーザから修正された要求事項の入力を受けて要求事項明細を更新する。ここで、ＵＩモジュール３１０は、要求事項明細で条件が満足されない項目をハイライトにして表示される。また、ＵＩモジュール３１０は、条件を満足しない項目に関する送受信発話文章をハイライト又は点滅してユーザに表示してもよい。ここで、修正された要求事項により更新された要求事項明細は、例えば、特定条件を変更したものであってもよく、又は、サービス要求を取り消したものであってもよい。更新された要求事項明細及び発話ヒストリーをユーザに表示する方法については、下記の図５ないし図６を参照して具体的に説明する。

対話モジュール３３０は、項目によって求められる条件の全てが満足されてサービスの要求が完了するまで、図４におけるステップＳ４３０〜ステップＳ４８０に該当する対話の進む過程を繰り返し行う。

対話モジュール３３０は、対話の進む過程を繰り返して行う間に、ユーザ（又はユーザ装置）からサービス提供者との直接通話を求める信号が受信されるか否かを判断する。直接通話を求める信号が受信されたと判断されれば、対話モジュール３３０は、サービス提供者と対話進行中にユーザがサービス提供者と直接対話するようにするインターフェースを提供する。ユーザがサービス提供者と直接対話する場合については、下記の図７を参照して具体的に説明する。

電話モジュール３５０は、送信部３５３及び受信部３５６を含む。送信部３５３は、対話モジュールで生成した送信発話を送信する。受信部３５６は、ユーザ又はサービス提供者から受信した受信発話を対話モジュール３３０に伝達する。

図４は、一実施形態に係る対話エージェントの対話進行シナリオを説明するための図であり、図５は、一実施形態に係る対話進行により要求事項明細が更新される過程を説明するための図である。図４及び図５を参照すると、ユーザ端末が一実施形態に係る対話エージェント装置（ＤＡＳ）にサービス要求事項を伝達した場合に対話エージェント装置（ＤＡＳ）の対話の進む過程が示されている。

ユーザは、ユーザ装置を介して対話エージェント装置（ＤＡＳ）に要求事項明細を伝達することで、ユーザのサービス要求事項を伝達する（Ｓ４１０）。ユーザは、例えば、図５Ａに示すように、「今週の水曜日、午後７時に寿司Ｏ２人予約して」のようにサービス要求事項を伝達する。対話エージェント装置（ＤＡＳ）は、例えば、「はい。次のように今週の水曜日、午後７時に寿司Ｏ２人予約しましょうか？」のようにユーザのサービス要求事項を確認した後、サービス要求事項を分析して要求事項明細５１０を生成する。ここで、対話エージェント装置（ＤＡＳ）は、ユーザのサービス要求事項によって把握した要求事項明細５１０の初期情報（要求したサービス：レストラン予約、レストラン名：寿司Ｏ、電話番号：０１０−ＸＸＸＸ−１２３４）によって要求事項明細５１０の各項目の値を満足させ、ここで、各項目に対応する状態情報は該当項目の値によって求められる条件が満足であるか、不満足であるか、又は、該当項目の条件の満足の有無がまだ決定されていないかに応じて「Ｏ」、「Ｘ」、又は「？」に表示される。ここで、初期情報に該当する電話番号は、ユーザ端末の電話番号部又は対話エージェント装置（ＤＡＳ）に含まれた電話番号部からレストラン名により検索された番号、又は、対話エージェント装置（ＤＡＳ）がインターネット接続を介して検索した番号であってもよい。

対話エージェント装置（ＤＡＳ）は、サービス提供者（ＳＰ）に電話をかける（Ｓ４２０）。対話エージェント装置（ＤＡＳ）は、対話進行のために発話情報を生成してサービス提供者（ＳＰ）に出力し（Ｓ４３０）、サービス提供者（ＳＰ）は、対話エージェント装置（ＤＡＳ）の発話に対して応答する（Ｓ４４０）。対話エージェント装置（ＤＡＳ）は、サービス提供者と対話（通話）を介して要求事項が満足されるかを判断する（Ｓ４５０）。ステップＳ４５０で要求事項が満足されないと判断されれば、対話エージェント装置（ＤＡＳ）は、ユーザに、ユーザの要求事項のうち満足項目及び不満足項目を伝達する（Ｓ４７０）。

対話エージェント装置（ＤＡＳ）は、例えば、図５Ｂに示すように、サービス提供者（ＳＰ）に電話をかけ、対話進行のために生成した発話情報（「今週の水曜日、午後７時に２人予約できますか？」）を出力する。ここで、サービス提供者が対話エージェント装置（ＤＡＳ）の発話に対して「申し訳ございませんが、６時と８時にのみ予約できますが。」のように応答したと仮定する。対話エージェント装置（ＤＡＳ）は、サービス提供者の応答を分析し、要求事項明細５１０で日付項目の値（「今週の水曜日」）と人数項目の値（「２人」）によって求められる条件は満足されるものと判断し、時間項目の値（午後７時）によって求められる条件は満足されないものと判断する。対話エージェント装置（ＤＡＳ）は、各項目の条件満足の有無を判断した結果に応じて、要求事項明細５１０を要求事項明細５２０のように更新し得る。

ステップＳ４７０で、対話エージェント装置（ＤＡＳ）から満足項目及び不満足項目を伝達されたユーザは、満足されない条件に対する修正された要求事項を対話エージェント装置（ＤＡＳ）に伝達する（Ｓ４８０）。ユーザから、満足されない条件に対する修正された要求事項を伝達された対話エージェント装置（ＤＡＳ）は、修正された要求事項に基づいて要求事項明細を更新する。

例えば、対話エージェント装置（ＤＡＳ）は、図５Ｃに示すように、「マスター、ご希望のように時間が７時はできず、６時と８時にのみ可能であるそうです。」のような送信発話を生成し、ユーザに満足項目及び不満足項目を伝達する。これを受信したユーザが「そしたら６時にして」のように満足されない条件に対する修正された要求事項を対話エージェントに伝達したと仮定する。対話エージェント装置（ＤＡＳ）は、「はい、それでは６時に予約します」のようにユーザからの受信発話を確認する発信発話を生成する。また、対話エージェント装置（ＤＡＳ）は、修正された要求事項（「６時」）を反映して要求事項明細５２０を要求事項明細５３０のように更新する。ここで、時間項目の値（６時）によって求められる条件の満足の有無はまだ決定されていないため、時間項目に対応する状態情報は「？」に変更される。

実施形態により、対話エージェント装置（ＤＡＳ）は、更新された要求事項明細に含まれた項目のうち、少なくとも１つの項目によって求められる条件が満足されない場合、少なくとも１つの項目をユーザに問い合わせてもよい。

対話エージェント装置（ＤＡＳ）は、ステップＳ４８０でユーザから伝えられた、満足されない条件に対する修正された要求事項により更新された要求事項明細５３０に基づいて、新しい発話情報を生成（Ｓ４３０）して出力する。例えば、対話エージェント装置（ＤＡＳ）は、更新された要求事項明細５３０に基づいて図５Ｄに示すような新しい発話情報（「それでは、６時に予約できますか？」）を生成（Ｓ４３０）して出力する。対話エージェント装置（ＤＡＳ）は、新しい発話情報に対応するサービス提供者の応答（「はい。水曜日６時に２人予約します。予約者のお名前をお願いします。」）を受信し（Ｓ４４０）、サービス提供者と対話（通話）を介して要求事項が満足されるかを再び判断する（Ｓ４５０）。

ステップＳ４５０において、要求事項が満足されたと判断されれば、対話エージェント装置（ＤＡＳ）は、ユーザの全体要求事項が満足されたかを判断する（Ｓ４６０）。ステップＳ４６０で、ユーザの全体要求事項が満足されないと判断されれば、対話エージェント装置（ＤＡＳ）は、満足されない要求事項に基づいて新しい発話情報を生成（Ｓ４３０）して出力する。

ステップＳ４６０で、ユーザの全体要求事項が満足されたと判断されれば、対話エージェント装置（ＤＡＳ）は、ユーザにサービス要求結果、言い換えれば、サービスの要求が完了したことを知らせる（Ｓ４９０）。例えば、図５Ｅに示された要求事項明細５４０のように、ユーザの全体要求事項が満足されると判断されれば、対話エージェント装置（ＤＡＳ）は、「マスター、寿司Ｏ水曜日の午後６時に２人予約されました。」のようにユーザにサービスの要求が完了したことを知らせることができる。

図６は、一実施形態に係る対話エージェントが発話ヒストリー及び要求事項明細を表示する方法を説明するための図である。図６を参照すると、一実施形態に係る対話エージェント装置のＵＩモジュールを介して提供される画面が示されている。対話エージェント装置は、図５に示す各図面に示されているように要求事項明細を対話内容と共に順次スクロールされるよう表示してもよく、要求事項明細を対話内容と分離して表示してもよい。

対話エージェント装置は、例えば、画面の上段の一定部分に要求事項明細６１０を表示し、要求事項明細６１０の下段に発話ヒストリー６３０を表示する。ここで、要求事項明細６１０の値及び／又は満足の有無を示す状態情報は、典型的には、発話ヒストリー６３０で発話の１ターンが変更されるたびに更新される。

実施形態により、ユーザは、設定によって発話ヒストリー６３０の表示の有無を変更する。また、ユーザは、要求事項明細６１０を全て表示したり、又は、一部のみを表示するように設定してもよい。ユーザは、例えば、要求事項明細６１０のうち条件が満足された項目は表示せず、条件が不満足であるか、条件満足の有無がまだ決定されていない項目を表示するようにしてもよい。ここで、条件が不満足であるか、条件満足の有無がまだ決定されていない項目は、通知形態に表示されたり、又は、ハイライト又は点滅の形態で表示されてもよい。

実施形態に応じて、対話エージェント装置は、ユーザと対話エージェント装置との間の対話と、対話エージェントとサービス提供者との間の対話を互いに区分して互いに相違するように表現してもよい。また、対話エージェント装置は、ユーザの対話エージェント装置間の対話をサービス提供者が見たり聞くことを可能にしてもよく、サービス提供者が見たり聞くことを不可能にしてもよい。

図７は、他の実施形態に係る対話エージェントのユーザインターフェースを説明するための図である。図７を参照すると、対話エージェント装置がサービス提供者との対話進行中にユーザインターフェースを介してユーザ（又は、ユーザ装置）からサービス提供者との直接通話を求める信号が受信された場合の動作が示されている。

例えば、対話エージェント装置がサービス提供者との対話進行中にサービス提供者から「申し訳ございませんが、６時と８時にのみ予約できますが。」のような応答を受信した後、ユーザがユーザインターフェース（例えば、ボタン７１０）を介してサービスの提供者との直接通話を求める信号を送信した仮定する。ここで、直接通話を求める信号は、例えば、ユーザが予め提供されたユーザインターフェースを介して「直接対話する」のように予め特定された命令キーワードを言ったり、図７に示すように画面に表示された「直接対話する」ボタン７１０を押したり、又は「直接対話する」をタイピングするという動作などを介して対話エージェント装置に伝えられることができる。

直接通話を求める信号が伝えられた場合、対話エージェント装置は、発話情報の生成を中断し、ユーザの発話内容（又は、ユーザがタイピングした内容をＴＴＳ機能によって音声に変換）をサービス提供者に送信発話として伝達する。

対話エージェント装置は、サービス提供者の応答発話をＵＩモジュールに伝達して音声及び／又はテキストで出力することで、ユーザとサービス提供者と直接対話することができる。ここで、ユーザの発話内容は、例えば、ユーザの声で提供されてもよく、又は、自動音声認識（ＡｕｔｏｍａｔｉｃＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎ；ＡＳＲ）とＴＴＳとの組合せを介してユーザの声に代わる対話エージェント装置の声に変換されてサービス提供者に送信発話として伝えられてもよい。ここで、サービス提供者とユーザとの間の直接対話の内容についても発話ヒストリーに含まれてもよい。

直接通話が進んでいる間にも、対話エージェント装置は、対話ヒストリーを分析して要求事項明細を更新し、更新された要求事項明細をユーザに提供する。

実施形態により、対話エージェント装置は、サービス提供者との直接通話を求める信号の受信後に、ユーザから対話エージェントを通した対話再開を求める信号を受信してもよい。ここで、対話再開を求める信号は、例えば、「対話エージェントサービス」のように予め特定された命令キーワードを言ったり、図７に示すように画面に表示された「直接対話する」ボタン７１０を再び押したり、又は「対話エージェントサービス」をタイピングする動作などを介して対話エージェント装置に伝えられてもよい。対話エージェント装置は、対話再開を求める信号に応答して、発話情報の生成を再開できる。

図８は、一実施形態に係る要求事項明細に含まれた必須項目及び選択項目に対する処理方法を説明するための図である。図８Ａを参照すると、ユーザ８０１がユーザ装置を介して対話エージェント８０３にユーザのサービス要求事項を伝達した場合、ユーザのサービス要求事項によって対話エージェント８０３が生成した要求事項明細８１０が示されている。ここで、要求事項明細８１０に含まれた項目は、サービス類型ごとに決定された少なくとも１つの必須項目の他にも少なくとも１つの選択項目を含み得る。

対話エージェント８０３は、ユーザのサービス要求事項を分析してユーザが要求したサービス類型（サービスドメイン）を決定する。対話エージェント８０３は、サービス類型ごとに予め決定した要求事項明細のフォーム（ｆｏｒｍ）を呼び出し、ユーザのサービス要求事項から分析された情報（又は、初期情報）により必須項目の値を満たす。ここで、要求事項明細に含まれた必須項目及び選択項目は、当該のサービスごとに予め決定されてもよい。

例えば、ユーザのサービス要求事項に必須項目のうち、１番の項目及び２番の項目の値に該当する内容が含まれていると仮定する。この場合、必須項目の値のうち３番の項目に対する値が追加的に必要な場合、対話エージェント８０３は、３番の項目に対する値を問い合わせる送信発話情報を生成する。対話エージェント８０３は、３番の項目に対する値を問い合わせる送信発話情報をユーザ８０１に伝達し、これに対する応答を受信して要求事項明細８１０の必須項目を全て満たし得る。対話エージェント８０３は、必須項目が全て満たされた要求事項明細８１０に基づいて、サービス提供者８０５にサービスを求めるための発話情報を生成して出力する。ここで、要求事項明細８１０の選択項目は後、サービス提供者８０５との通話を介して満たされてもよく、空いているまま保持されてもよい。

図８Ｂを参照すると、ユーザ８０１がユーザ装置を介して対話エージェント８０３にユーザのサービス要求事項を伝達した場合、ユーザのサービス要求事項によって対話エージェント８０３が生成した要求事項明細８２０が示される。

例えば、ユーザのサービス要求事項に必須項目のうち１番の項目ないし３番の項目の値と、選択項目である５番の項目の値に該当する内容が含まれていると仮定する。対話エージェント８０３は、ユーザのサービス要求事項に基づいて、必須項目である１番の項目ないし３番の項目の値と、選択項目である５番の項目の値を満たして要求事項明細８２０を生成する。ここで、要求事項明細８２０で選択項目に分類された５番の項目は、ユーザのサービス要求事項（又は、ユーザの発話内容）により必須項目に変更されたり、又は、必須項目と同一に扱われる。このように該当項目が必須項目であるか、又は選択項目であるかは、ユーザの発話内容に応じて変更される。

対話エージェント８０３は、要求事項明細８２０に基づいてサービス提供者８０５にサービスを求めるための発話情報を生成して出力する。

前述した例示に示すように、ユーザ８０１と対話エージェント８０３との間のコミュニケーションは、発話インターフェースを介して実行されるが、場合に応じて、ＧＵＩなどの他のインターフェースを介して実行されてもよい。

図９は、一実施形態に係る対話エージェント装置のブロック図である。図９を参照すると、一実施形態に係る対話エージェント装置９００は、通信インターフェース９１０及びプロセッサ９２０を含む。対話エージェント装置９００は、メモリ９３０、ディスプレイ９４０、及びスピーカ９５０をさらに含む。通信インターフェース９１０、プロセッサ９２０、メモリ９３０、ディスプレイ９４０、及びスピーカ９５０は通信バス９０５を介して接続される。

通信インターフェース９１０は、サービスの要求のために送受信される送信発話及び受信発話のうち少なくとも１つを含む発話ヒストリーを取得する。通信インターフェース９１０は、プロセッサ９２０が生成した発話情報を出力する。

通信インターフェース９１０は、対話エージェントを通した対話再開を求める信号を受信する。ここで、プロセッサ９２０は、対話再開を求める信号に応答して、発話情報の生成を再開する。

通信インターフェース９１０は、更新された要求事項明細をユーザに提供したり、発話ヒストリーをユーザに提供したり、又は更新された要求事項明細及び発話ヒストリーをユーザに提供する。

通信インターフェース９１０は、ユーザ端末のインターフェースを介して収集された情報に基づいて生成された要求事項明細を受信する。

通信インターフェース９１０は、対話エージェントがサービスの提供者に送信する第１送信発話、対話エージェントがサービスの提供者から受信する第１受信発話、対話エージェントがユーザに送信する第２送信発話、及び対話エージェントがユーザから受信する第２受信発話のうち少なくとも１つを取得する。

プロセッサ９２０は、発話ヒストリーに基づいて、サービスの要求のために求められる項目を含む要求事項明細を更新する。プロセッサ９２０は、更新された要求事項明細に基づいて、サービスを求めるための発話情報を生成する。要求事項明細は、項目によって求められる条件が満足されたか否かを示す状態情報を含む。状態情報は、例えば、該当項目の条件が満足されたことを示す第１状態、該当項目の条件が満足されないことを示す第２状態、及び該当項目の条件の満足の有無がまだ決定されていないことを示す第３状態などを含む。

プロセッサ９２０は、発話ヒストリーに基づいて、項目によって求められる条件の満足の有無を判断し、判断結果に応じて要求事項明細を更新する。

プロセッサ９２０は、項目のうち少なくとも１つの項目によって求められる条件が満足されたか否かを判断したり、又は、項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断する。

プロセッサ９２０は、発話ヒストリー及び要求事項明細を第１分類器に入力する。プロセッサ９２０は、第１分類器が出力するマルチ・ホット・ベクトルに基づいて、少なくとも１つの項目によって求められる条件が満足されたか否かを判断する。ここで、第１分類器は、項目によって求められる条件の満足の有無を判断し、項目に対応する状態情報をマルチ・ホット・ベクトルに出力する。

プロセッサ９２０は、発話ヒストリー及び要求事項明細を第２分類器に入力する。プロセッサ９２０は、第２分類器が出力するマルチ・ホット・ベクトルに基づいて、少なくとも１つの項目によって求められる条件が不満足であるか否かを判断する。ここで、第２分類器は、項目によって求められる条件の不満足の有無を判断し、項目に対応する状態情報をマルチ・ホット・ベクトルに出力する。

プロセッサ９２０は、項目によって求められる条件の全てが満足されたか否かを判断する。プロセッサ９２０は、条件の全てが満足されたという判断に応じて、サービスの要求が完了したことをユーザに知らせる。

プロセッサ９２０は、更新された要求事項明細に基づいて、条件の全てが満足されたか否かを判断する。又は、プロセッサ９２０は、第３分類器を用いて項目によって求められる条件の全てが満足されたか否かを判断する。ここで、第３分類器は、発話ヒストリー及び要求事項明細に基づいて項目によって求められる条件の満足の有無を判断し、条件の全ての満足の有無を示す値（例えば、２進値）を出力する。

プロセッサ９２０は、更新された要求事項明細に基づいて発話対象を決定する。プロセッサ９２０は、発話対象に発話情報を出力する。プロセッサ９２０は発話情報を、例えば、ディスプレイ９４０及び／又はスピーカ９５０を介して出力する。

プロセッサ９２０は、更新された要求事項明細に含まれた項目のうち、少なくとも１つの項目によって求められる条件が満足されない場合、発話対象をユーザとして決定する。ここで、要求事項明細に含まれた項目は、サービス類型ごとに決定された少なくとも１つの必須項目を含む。また、項目は、必須項目を除いた少なくとも１つの選択項目をさらに含む。

通信インターフェース９１０は、ユーザ装置からサービスの提供者との直接通話を求める信号を受信する。

プロセッサ９２０は、直接通話を求める信号の受信後に発話情報の生成を中断し、ユーザ装置から入力される情報をサービス提供者に提供する。

プロセッサ９２０は、更新された要求事項明細に含まれた項目のうち、少なくとも１つの項目によって求められる条件が満足されない場合、少なくとも１つの項目をユーザに問い合わせる。

また、プロセッサ９２０は、図１〜図８を参照して前述した少なくとも１つの方法又は少なくとも１つの方法に対応するアルゴリズムを行ってもよい。プロセッサ９２０は、目的とする動作を実行させるための物理的な構造を有する回路を有するハードウェアで具現されたデータ処理装置であり得る。例えば、目的とする動作は、プログラムに含まれたコード又は命令を含む。例えば、ハードウェアで具現されたデータ処理装置は、マイクロプロセッサー、中央処理装置、プロセッサコア、マルチ・コアプロセッサ、マルチプロセッサ、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ−ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）を含む。

プロセッサ９２０はプログラムを実行し、対話エージェント装置９００を制御する。プロセッサ９２０によって実行されるプログラムコードは、メモリ９３０に格納される。

メモリ９３０は、ユーザ装置から受信した要求事項明細を格納する。また、メモリ９３０は、プロセッサ９２０で更新された要求事項明細を格納する。メモリ９３０は、プロセッサ９２０が生成した発話情報を格納する。

メモリ９３０は、上述したプロセッサ９２０での処理過程で生成される様々な情報を格納する。その他にも、メモリ９３０は、各種のデータとプログラムなどを格納する。メモリ９３０は、揮発性メモリ又は不揮発性メモリを含む。メモリ９３０は、ハードディスクなどのような大容量格納媒体を備えて各種データを格納する。

ディスプレイ９４０は、プロセッサ９２０が生成したテキスト形態の発話情報を出力する。また、スピーカ９５０は、プロセッサ９２０が生成した音声形態の発話情報を出力する。ここで、プロセッサ９２０は、ＴＴＳ（ＴｅｘｔＴｏＳｐｅｅｃｈ）機能を含む。

以上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、又はハードウェア構成要素及びソフトウェア構成要素の組み合せで具現される。例えば、本実施形態で説明した装置及び構成要素は、例えば、プロセッサ、コントローラ、ＡＬＵ（ａｒｉｔｈｍｅｔｉｃｌｏｇｉｃｕｎｉｔ）、デジタル信号プロセッサ（ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｏｒ）、マイクロコンピュータ、ＦＰＡ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅａｒｒａｙ）、ＰＬＵ（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｕｎｉｔ）、マイクロプロセッサー、又は命令（ｉｎｓｔｒｕｃｔｉｏｎ）を実行して応答する異なる装置のように、１つ以上の汎用コンピュータ又は特殊目的コンピュータを用いて具現される。処理装置は、オペレーティングシステム（ＯＳ）及びオペレーティングシステム上で実行される１つ以上のソフトウェアアプリケーションを実行する。また、処理装置は、ソフトウェアの実行に応答してデータをアクセス、格納、操作、処理、及び生成する。理解の便宜のために、処理装置は１つが使用されるものとして説明する場合もあるが、当技術分野で通常の知識を有する者は、処理装置が複数の処理要素（ｐｒｏｃｅｓｓｉｎｇｅｌｅｍｅｎｔ）及び／又は複数類型の処理要素を含むことが把握する。例えば、処理装置は、複数のプロセッサ又は１つのプロセッサ及び１つのコントローラを含む。また、並列プロセッサ（ｐａｒａｌｌｅｌｐｒｏｃｅｓｓｏｒ）のような、他の処理構成も可能である。

実施形態に係る方法は、様々なコンピュータ手段を介して実施されるプログラム命令の形態で具現され、コンピュータ読み取り可能な記録媒体に記録される。記録媒体は、プログラム命令、データファイル、データ構造などを単独又は組み合せて含む。記録媒体及びプログラム命令は、本発明の目的のために特別に設計して構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり使用可能なものであってもよい。コンピュータ読み取り可能な記録媒体の例としては、ハードディスク、フロッピー（登録商標）ディスク及び磁気テープのような磁気媒体、ＣＤ−ＲＯＭ、ＤＹＩＪＤのような光記録媒体、フロプティカルディスクのような磁気−光媒体、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置を含む。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。ハードウェア装置は、本発明に示す動作を実行するために１つ以上のソフトウェアモジュールとして作動するように構成してもよく、その逆も同様である。

上述したように実施形態をたとえ限定された図面によって説明したが、当技術分野で通常の知識を有する者であれば、上記の説明に基づいて様々な技術的な修正及び変形を適用することができる。例えば、説明された技術が説明された方法と異なる順で実行されるし、及び／又は説明されたシステム、構造、装置、回路などの構成要素が説明された方法と異なる形態で結合又は組み合わせられてもよいし、他の構成要素又は均等物によって置き換え又は置換されたとしても適切な結果を達成することができる。

したがって、本発明の範囲は、開示された実施形態に限定されて定められるものではなく、特許請求の範囲及び特許請求の範囲と均等なものなどによって定められるものである。

９００：対話エージェント装置
９０５：通信バス
９１０：通信インターフェース
９２０：プロセッサ
９３０：メモリ
９４０：ディスプレイ
９５０：スピーカ

Claims

サービスの要求のために送信される送信発話のうち少なくとも１つ、及び前記サービスの要求のために受信される受信発話のうち少なくとも１つを含む発話ヒストリーを取得するステップと、
前記発話ヒストリーに基づいて、前記サービスの要求のために求められる項目を含む要求事項明細を更新するステップと、
前記更新された要求事項明細に基づいて、前記サービスを求めるための発話情報を生成するステップと、
前記発話情報を出力するステップと、
を含む、対話エージェントの動作方法。
前記要求事項明細は、前記項目によって求められる条件が満足されたか否かを示す状態情報を含む、請求項１に記載の対話エージェントの動作方法。
前記状態情報は、
該当項目の条件が満足されたことを示す第１状態、
前記該当項目の条件が満足されないことを示す第２状態、及び
前記該当項目の条件の満足の有無がまだ決定されていないことを示す第３状態
のうち少なくとも１つを含む、請求項２に記載の対話エージェントの動作方法。
前記更新するステップは、
前記発話ヒストリーに基づいて、前記項目によって求められる条件の満足の有無を判断するステップと、
前記判断結果に応じて前記要求事項明細を更新するステップと、
をさらに含む、請求項１−３のいずれか１項に記載の対話エージェントの動作方法。
前記条件の満足の有無を判断するステップは、
前記項目のうち少なくとも１つの項目によって求められる条件が満足されたか否かを判断するステップと、
前記項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断するステップと、
のうち少なくとも１つを含む、請求項４に記載の対話エージェントの動作方法。
前記少なくとも１つの項目によって求められる条件が満足されたか否かを判断するステップは、
前記発話ヒストリー及び前記要求事項明細を分類器に入力するステップであって、前記分類器は、前記項目によって求められる条件の満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力する、ステップと、
前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が満足されたか否かを判断するステップと、
を含む、請求項５に記載の対話エージェントの動作方法。
前記少なくとも１つの項目によって求められる条件が不満足であるか否かを判断するステップは、
前記発話ヒストリー及び前記要求事項明細を分類器に入力するステップであって、前記分類器は、前記項目によって求められる条件の不満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力する、ステップと、
前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が不満足であるか否かを判断するステップと、
を含む、請求項５に記載の対話エージェントの動作方法。
前記項目によって求められる条件の全てが満足されたか否かを判断するステップと、
前記条件の全てが満足されたという判断に応じて、前記サービスの要求が完了したことをユーザに知らせるステップと、
をさらに含む、請求項１−７のいずれか１項に記載の対話エージェントの動作方法。
前記項目によって求められる条件の全てが満足されたか否かを判断するステップは、
前記更新された要求事項明細に基づいて、前記条件の全てが満足されたか否かを判断するステップと、
前記発話ヒストリー及び前記要求事項明細に基づいて前記項目によって求められる条件の満足の有無を判断し、前記条件の全ての満足の有無を示す値を出力する分類器を用いて、前記条件の全てが満足されたか否かを判断するステップと、
のうち少なくとも１つを含む、請求項８に記載の対話エージェントの動作方法。
前記更新された要求事項明細に基づいて発話対象を決定するステップをさらに含み、
前記発話情報を出力するステップは、前記発話対象に前記発話情報を出力するステップを含む、請求項１−９のいずれか１項に記載の対話エージェントの動作方法。
前記発話対象を決定するステップは、前記更新された要求事項明細に含まれた項目のうち、少なくとも１つの項目によって求められる条件が満足されない場合、前記発話対象をユーザとして決定するステップを含む、請求項１０に記載の対話エージェントの動作方法。
前記項目は、前記サービスの類型ごとに決定された少なくとも１つの必須項目を含む、請求項１−１１のいずれか１項に記載の対話エージェントの動作方法。
前記項目は、前記必須項目を除いた少なくとも１つの選択項目をさらに含む、請求項１２に記載の対話エージェントの動作方法。
ユーザ装置から前記サービスの提供者との直接通話を求める信号を受信するステップと、
前記直接通話を求める信号の受信後に、前記発話情報の生成を中断するステップと、
前記ユーザ装置から入力される情報を前記サービスの提供者に提供するステップと、
をさらに含む、請求項１に記載の対話エージェントの動作方法。
前記対話エージェントを通した対話再開を求める信号を受信するステップと、
前記対話再開を求める信号に応答して、前記発話情報の生成を再開するステップと、
をさらに含む、請求項１４に記載の対話エージェントの動作方法。
前記更新された要求事項明細をユーザに提供するステップと、
前記発話ヒストリーをユーザに提供するステップと、
のうち少なくとも１つをさらに含む、請求項１−１３のいずれか１項に記載の対話エージェントの動作方法。
前記更新された要求事項明細に含まれた項目のうち少なくとも１つの項目によって求められる条件が満足されない場合、前記少なくとも１つの項目をユーザに問い合わせるステップをさらに含む、請求項１−１３のいずれか１項に記載の対話エージェントの動作方法。
ユーザ端末のインターフェースを介して収集された情報に基づいて生成された前記要求事項明細を受信するステップをさらに含む、請求項１−１７のいずれか１項に記載の対話エージェントの動作方法。
前記発話ヒストリーを取得するステップは、
前記対話エージェントが前記サービスの提供者に送信する第１送信発話を取得するステップと、
前記対話エージェントが前記サービスの提供者から受信する第１受信発話を取得するステップと、
前記対話エージェントがユーザに送信する第２送信発話を取得するステップと、
前記対話エージェントが前記ユーザから受信する第２受信発話を取得するステップと、
のうち少なくとも１つを含む、請求項１−１８のいずれか１項に記載の対話エージェントの動作方法。
請求項１乃至１９のいずれか一項に記載の動作方法を装置のコンピュータに実行させるコンピュータプログラム。
サービスの要求のために送信される送信発話のうち少なくとも１つ、及び前記サービスの要求のために受信される受信発話のうち少なくとも１つを含む発話ヒストリーを取得し、発話情報を出力する通信インターフェースと、
前記発話ヒストリーに基づいて、前記サービスの要求のために求められる項目を含む要求事項明細を更新し、前記更新された要求事項明細に基づいて前記サービスを求めるための前記発話情報を生成するプロセッサと、
を含む、対話エージェント装置。
前記要求事項明細は、前記項目によって求められる条件が満足されたか否かを示す状態情報を含む、請求項２１に記載の対話エージェント装置。
前記状態情報は、
該当項目の条件が満足されたことを示す第１状態、
前記該当項目の条件が満足されないことを示す第２状態、及び
前記該当項目の条件の満足の有無がまだ決定されていないことを示す第３状態のうち少なくとも１つを含む、請求項２２に記載の対話エージェント装置。
前記プロセッサは、前記発話ヒストリーに基づいて前記項目によって求められる条件の満足の有無を判断し、前記判断結果に応じて前記要求事項明細を更新する、請求項２１−２３のいずれか１項に記載の対話エージェント装置。
前記プロセッサは、前記項目のうち少なくとも１つの項目によって求められる条件が満足されたか否かを判断したり、又は、前記項目のうち少なくとも１つの項目によって求められる条件が不満足であるか否かを判断する、請求項２４に記載の対話エージェント装置。
前記プロセッサは、前記発話ヒストリー及び前記要求事項明細を分類器（前記分類器は、前記項目によって求められる条件の満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力）に入力し、前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が満足されたか否かを判断する、請求項２５に記載の対話エージェント装置。
前記プロセッサは、前記発話ヒストリー及び前記要求事項明細を分類器（前記分類器は、前記項目によって求められる条件の不満足の有無を判断し、前記項目に対応する状態情報をマルチ・ホット・ベクトルに出力）に入力し、前記マルチ・ホット・ベクトルに基づいて、前記少なくとも１つの項目によって求められる条件が不満足であるか否かを判断する、請求項２５に記載の対話エージェント装置。
前記プロセッサは、前記項目によって求められる条件の全てが満足されたか否かを判断し、前記条件の全てが満足されたという判断に応じて、前記サービスの要求が完了したことをユーザに知らせる、請求項２１−２７のいずれか１項に記載の対話エージェント装置。
前記プロセッサは、前記更新された要求事項明細に基づいて前記条件の全てが満足されたか否かを判断したり、又は、前記発話ヒストリー及び前記要求事項明細に基づいて前記項目によって求められる条件の満足の有無を判断し、前記条件の全ての満足の有無を示す値を出力する分類器を用いて前記条件の全てが満足されたか否かを判断する、請求項２８に記載の対話エージェント装置。
前記プロセッサは、前記更新された要求事項明細に基づいて発話対象を決定し、前記発話対象に前記発話情報を出力する、請求項２１−２９のいずれか１項に記載の対話エージェント装置。
前記プロセッサは、前記更新された要求事項明細に含まれた項目のうち少なくとも１つの項目によって求められる条件が満足されない場合、前記発話対象をユーザとして決定する、請求項３０に記載の対話エージェント装置。
前記項目は、前記サービスの類型ごとに決定された少なくとも１つの必須項目を含む、請求項２１−３１のいずれか１項に記載の対話エージェント装置。
前記項目は、前記必須項目を除いた少なくとも１つの選択項目をさらに含む、請求項３２に記載の対話エージェント装置。
前記通信インターフェースは、ユーザ装置から前記サービスの提供者との直接通話を求める信号を受信し、
前記プロセッサは、前記直接通話を求める信号の受信後に、前記発話情報の生成を中断し、前記ユーザ装置から入力される情報を前記サービスの提供者に提供する、請求項３１に記載の対話エージェント装置。
前記通信インターフェースは、前記対話エージェント装置を通した対話再開を求める信号を受信し、
前記プロセッサは、前記対話再開を求める信号に応答して、前記発話情報の生成を再開する、請求項３４に記載の対話エージェント装置。
前記通信インターフェースは、前記更新された要求事項明細をユーザに提供したり、前記発話ヒストリーを前記ユーザに提供したり、又は、前記更新された要求事項明細及び前記発話ヒストリーを前記ユーザに提供する、請求項２１−３３のいずれか１項に記載の対話エージェント装置。
前記プロセッサは、前記更新された要求事項明細に含まれた項目のうち少なくとも１つの項目によって求められる条件が満足されない場合、前記少なくとも１つの項目をユーザに問い合わせる、請求項２１−３３のいずれか１項に記載の対話エージェント装置。
前記通信インターフェースは、ユーザ端末のインターフェースを介して収集された情報に基づいて生成された前記要求事項明細を受信する、請求項２１−３７のいずれか１項に記載の対話エージェント装置。
前記通信インターフェースは、前記対話エージェント装置が前記サービスの提供者に送信する第１送信発話、前記対話エージェント装置が前記サービスの提供者から受信する第１受信発話、前記対話エージェント装置がユーザに送信する第２送信発話、及び前記対話エージェント装置が前記ユーザから受信する第２受信発話のうち少なくとも１つを取得する、請求項２１−３８のいずれか１項に記載の対話エージェント装置。
メモリと、
ユーザ装置からサービス要求に関する要求事項を受信し、
前記要求事項に基づいて要求事項明細を生成し、
前記要求事項明細に基づいてサービス提供者との接続を設定し、
前記接続の間に前記サービス提供者によって前記要求事項が全て満足されるかを決定し、
前記要求事項が全て満足される場合、サービスに対する要求が完了したことをユーザ装置に通知し、
前記要求事項が全て満足されない場合、少なくとも１つの要求事項が満足されないことを前記ユーザ装置に通知し、満足されない少なくとも１つの要求事項に関する変更された要求事項を受信し、前記変更された要求事項により前記要求事項明細を更新するプロセッサと、
を含む、対話エージェント。
前記プロセッサは、
前記更新された要求事項明細に基づいて前記サービス提供者と第２接続を設定し、
前記第２接続の間に、前記更新された要求事項明細に関する全ての条件が前記サービス提供者によって満足されるか否かを決定する、請求項４０に記載の対話エージェント。
前記ユーザ装置から受信された要求事項が自然語の形態である場合、
前記プロセッサは、
前記自然語を分析し、前記自然語の分析に基づいて前記サービスのフィールド又は類型を決定し、前記決定されたフィールド又は類型に基づいて前記要求事項明細を生成する、請求項４０に記載の対話エージェント。
前記ユーザ装置から受信された要求事項がテキストの形態である場合、
前記プロセッサは、前記テキストをトークンに分離し、前記分離したトークンを神経網モデルに入力し、前記神経網モデルの出力に基づいて前記要求事項明細を生成する、請求項４０に記載の対話エージェント。