JP2017151931A

JP2017151931A - 対話決定システム、対話決定方法、対話決定プログラム、及び端末装置

Info

Publication number: JP2017151931A
Application number: JP2016036400A
Authority: JP
Inventors: 峻平佐野; Shumpei Sano; 伸裕鍜治; Nobuhiro Kaji; 颯々野　学; Manabu Satsusano; 学颯々野
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2016-02-26
Filing date: 2016-02-26
Publication date: 2017-08-31
Anticipated expiration: 2036-02-26
Also published as: JP6898064B2

Abstract

【課題】対話システムにおける出力を適切に決定すること。【解決手段】本願に係る対話決定システムは、取得部と、決定部とを有する。取得部は、対話システム以外のシステムからユーザに関する行動情報を取得する。決定部は、取得部により取得されたユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。例えば、決定部は、ユーザに関する行動情報に基づいてユーザが関心を示すと推定される未来のイベントに関する情報を、対話システムにおける出力として決定する。【選択図】図３

Description

本発明は、対話決定システム、対話決定方法、対話決定プログラム、及び端末装置に関する。

従来、ユーザの音声入力に対して情報提供を行う対話システムに関する技術が提供されている。例えば、自動車の搭乗者であるユーザの音声入力に対して情報提供を行う車両用音声対話システムが提供されている。

特開２００６−１９５６３７号公報

しかしながら、上記の従来技術では、対話システムにおける出力を適切に決定できるとは限らない。例えば、対話システム内において収集されるユーザに関する情報のみに基づいて、ユーザの音声入力に対する出力を決定する場合、ユーザの意図を総合的に判断して出力を決定することが難しい。このような場合、ユーザの満足度を高めることが難しく、対話システムの利用を促進することが難しい場合がある。

本願は、上記に鑑みてなされたものであって、対話システムにおける出力を適切に決定する対話決定システム、対話決定方法、対話決定プログラム、及び端末装置を提供することを目的とする。

本願に係る対話決定システムは、対話システム以外のシステムからユーザに関する行動情報を取得する取得部と、前記取得部により取得された前記ユーザに関する行動情報に基づいて、前記対話システムにおける前記ユーザに対する出力を決定する決定部と、を備えたことを特徴とする。

実施形態の一態様によれば、対話システムにおける出力を適切に決定することができるという効果を奏する。

図１は、実施形態に係る決定処理の一例を示す図である。図２は、実施形態に係る決定処理の一例を示す図である。図３は、実施形態に係る応答生成サーバの構成例を示す図である。図４は、実施形態に係るユーザ情報記憶部の一例を示す図である。図５は、実施形態に係る未来イベント情報記憶部の一例を示す図である。図６は、実施形態に係る話題情報記憶部の一例を示す図である。図７は、実施形態に係る端末装置の構成例を示す図である。図８は、実施形態に係る決定処理の一例を示すフローチャートである。図９は、実施形態に係る決定処理の一例を示すフローチャートである。図１０は、実施形態に係る決定処理の一例を示すシーケンス図である。図１１は、応答生成サーバ及び端末装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る対話決定システム、対話決定方法、対話決定プログラム、及び端末装置を実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る対話決定システム、対話決定方法、対話決定プログラム、及び端末装置が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１−１．生成処理〕
まず、図１を用いて、実施形態に係る生成処理の一例について説明する。図１は、実施形態に係る決定処理の一例を示す図である。具体的には、図１は、実施形態に係る決定処理における情報更新の一例を示す図である。なお、本実施形態においては、ユーザの音声入力（以下、単に「入力」とする場合がある）に対して出力を決定する対話決定システム１が、ユーザの入力に対して出力を行う対話システムである場合を示すが、対話決定システムと対話システムとは別システムであってもよい。例えば、ここで対話決定システムとは、音声対話サービスを提供する際に、ユーザへの対話（応答）を決定するシステムのことをいう。また、例えば、ここで対話システムとは、音声対話サービスを提供する際に、ユーザの端末装置へ情報を送信したり、実際にユーザへの対話（応答）を出力したりするシステムのことをいう。つまり、図１では、対話決定システム１が音声対話サービスを提供する際に、ユーザへの対話（応答）を決定し、ユーザの端末装置へ情報を送信する場合を示す。

図１及び図２に示すように、対話決定システム１には、応答生成サーバ１００と、音声認識サーバ３０と、音声合成サーバ４０とが含まれる。応答生成サーバ１００と、音声認識サーバ３０と、音声合成サーバ４０とは図示しない所定のネットワークを介して、有線または無線により通信可能に接続される。なお、図１に示した対話決定システム１には、複数台の応答生成サーバ１００や、複数台の音声認識サーバ３０や、複数台の音声合成サーバ４０が含まれてもよい。

また、図１に示すように、対話決定システム１以外の外部システム５には、コンテンツ配信サーバ５１やメールサーバ５２等が含まれる。例えば、コンテンツ配信サーバ５１は、ユーザにコンテンツを配信するサービスを提供する情報処理装置である。また、例えば、メールサーバ５２は、ユーザに電子メールを送受信するサービスを提供する情報処理装置である。なお、外部システム５は、対話決定システム１以外のシステムであることを示すためのものであり、コンテンツ配信サーバ５１を含むシステムとメールサーバ５２を含むシステムとは別システムであってもよい。

なお、端末装置２０は、対話決定システム１を利用中においては、対話決定システム１に含まれてもよい。例えば、端末装置２０は、対話決定システム１を利用中においては、対話決定システム１の各構成と図示しない所定のネットワークを介して、有線または無線により通信可能に接続される。また、例えば、端末装置２０は、外部システム５を利用中においては、外部システム５の各構成と図示しない所定のネットワークを介して、有線または無線により通信可能に接続される。また、端末装置２０は、複数台であってもよい。

端末装置２０は、ユーザによって利用される情報処理装置である。端末装置２０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。図１は、端末装置２０がスマートフォンである場合を示す。

また、端末装置２０は、ユーザによる操作を受け付ける。図１に示す例において、端末装置２０は、所定のアプリ（例えば、ブラウザ等）に表示するコンテンツをコンテンツ配信サーバ５１へ要求する。なお、以下では、端末装置２０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置２０と読み替えることもできる。

音声認識サーバ３０は、発話の音声データを受信すると、音声データをテキストデータに変換する情報処理装置である。例えば、音声認識サーバ３０は、変換した発話のテキストデータを端末装置２０に送信する。また、音声合成サーバ４０は、応答発話用のテキストデータから音声を合成する音声合成処理を行って、応答発話用の中間表記を生成する情報処理装置である。また、例えば、音声合成サーバ４０は、応答発話用の中間表記を応答生成サーバ１００に送信する。なお、ここでいう中間表記とは、音声出力を行う端末装置２０が音声の出力を行う際に用い、音声出力される応答文等の読みに関する情報を含む中間言語（音声情報）を意味する。なお、中間表記は、中間表記に基づいて端末装置２０が音声を出力可能であれば、どのような情報であってもよい。例えば、端末装置２０がテキストデータ（文字情報）を基に音声の出力を行う場合、中間表記は、テキストデータであってもよい。

応答生成サーバ１００は、ユーザに関する行動情報に基づいて、対話決定システム１におけるユーザに対する出力を決定する情報処理装置である。例えば、応答生成サーバ１００は、ユーザに関する行動情報に基づいてユーザが関心を示すと推定される未来のイベントに関する情報（「未来イベント情報」と記載する場合がある）を、対話決定システム１における出力として決定する。

以下、図１を用いて、決定処理の一例を説明する。図１は、ユーザがユーザＩＤ「Ｕ１」により識別されるユーザ（以下、「ユーザＵ１」とする場合がある）である場合を示す。図１は、ユーザＵ１が外部システム５のサービスを利用する場合を示す。また、図１では、対話決定システム１に含まれる応答生成サーバ１００が、対話決定システム１以外の外部システム５からユーザに関する行動情報を取得する場合を示す。具体的には、応答生成サーバ１００は、外部システム５のコンテンツ配信サーバ５１がユーザＵ１に配信したコンテンツに関する情報（以下、「利用情報」とする場合がある）を取得する場合を示す。そして、応答生成サーバ１００が、取得したユーザＵ１に関する利用情報に基づいて、ユーザＵ１に関する未来イベントに関する情報を更新する場合を示す。また、図１に示す処理は、２０ＸＸ年２月２５日に行われたものとする。

まず、図１に示すように、ユーザＵ１は、端末装置２０を操作して、コンテンツ配信サーバ５１にコンテンツの要求を行う（ステップＳ１１）。例えば、端末装置２０は、ユーザＵ１による操作に応じて、コンテンツ配信サーバ５１にコンテンツＣＴ１１の要求を行う。

端末装置２０からコンテンツ要求を受信したコンテンツ配信サーバ５１は、端末装置２０にコンテンツＣＴ１１を配信する（ステップＳ１２）。例えば、コンテンツ配信サーバ５１は、端末装置２０からコンテンツＣＴ１１の要求を受信し、端末装置２０にコンテンツＣＴ１１を配信する。図１に示す例おいて、コンテンツＣＴ１１は、スポーツニュースに関する記事であり、「２０ＸＸ年２月２９日１９時からＺスタジアムでサッカーＡリーグのチームＢとＣが、首位を争う試合を…」といった内容が記載される。また、コンテンツ配信サーバ５１は、ユーザＵ１にコンテンツＣＴ１１を配信したことを示す履歴を所定の記憶部に記憶する。

その後、応答生成サーバ１００は、外部システム５に情報を要求する（ステップＳ１３）。そして、応答生成サーバ１００は、外部システム５からユーザの利用情報を取得する（ステップＳ１４）。例えば、応答生成サーバ１００は、コンテンツ配信サーバ５１から利用情報を取得する。具体的には、応答生成サーバ１００は、利用情報として、ユーザＵ１にコンテンツＣＴ１１を配信したことを示す情報を、コンテンツ配信サーバ５１から取得する。

そして、応答生成サーバ１００は、取得した利用情報に基づいて未来イベントを抽出する（ステップＳ１５）。ここでいう未来イベントとは、例えば、ステップＳ１５における未来イベントを抽出する処理を行う時点以降に行われる所定の事象をいう。図１では、応答生成サーバ１００は、ユーザＵ１に配信されたコンテンツＣＴ１１に関する情報（記事の内容等）から、未来イベントを抽出する。例えば、応答生成サーバ１００は、コンテンツＣＴ１１から、日時「２０ＸＸ年２月２９日１９時」からイベント「サッカーの試合」が行われることを示す未来イベントに関する情報を抽出する。また、応答生成サーバ１００は、サッカーのリーグが「Ａリーグ」であり、対戦チームが「チームＢ」と「チームＣ」であり、場所が「Ｚスタジアム」であることを示す情報を、未来イベントに関する情報として抽出してもよい。なお、応答生成サーバ１００が利用情報から、未来イベントを抽出する処理の詳細は後述する。

ここで、応答生成サーバ１００は、図１に示すように、未来イベント情報記憶部１２２に各ユーザに対応付けて未来イベントに関する情報を記憶する。以下では、ユーザＵ１に対応する未来イベントに関する情報の更新に応じて、未来イベント情報記憶部１２２を未来イベント情報記憶部１２２−１、１２２−２として説明する。具体的には、ステップＳ１６における更新前の未来イベント情報記憶部１２２を未来イベント情報記憶部１２２−１として図示し、ステップＳ１６における更新後の未来イベント情報記憶部１２２を未来イベント情報記憶部１２２−２として図示する。なお、未来イベント情報記憶部１２２−１、１２２−２は同一の未来イベント情報記憶部１２２である。また、以下では、未来イベント情報記憶部１２２−１、１２２−２について、特に区別することなく説明する場合には、未来イベント情報記憶部１２２と記載する。

ステップＳ１５における未来イベントの抽出後、応答生成サーバ１００は、未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する（ステップＳ１６）。例えば、応答生成サーバ１００は、ステップＳ１５において抽出した未来イベントに関する情報を追加する。具体的には、応答生成サーバ１００は、イベントＩＤ「ＩＶ１２」により識別されるイベント「サッカーの試合」（以下、「未来イベントＩＶ１２」とする）を示す未来イベントに関する情報を、ユーザＵ１に対応付けて未来イベント情報記憶部１２２に記憶する。また、応答生成サーバ１００は、未来イベントＩＶ１２の分類が「スポーツ」であり、未来イベントＩＶ１２が開催される日時「２０ＸＸ年２月２９日１９時」から行われることを示す情報も未来イベント情報記憶部１２２に記憶する。これにより、未来イベント情報記憶部１２２は、図１に示すように、未来イベント情報記憶部１２２−１から未来イベント情報記憶部１２２−２に更新される。

上述したように、対話決定システム１は、ユーザの利用情報に基づいて未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する。すなわち、対話決定システム１は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報に基づいて未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する。これにより、対話決定システム１は、各ユーザが関心を示す可能性の高い未来イベントに関する情報を、ユーザに対応付けて記憶することができる。

また、対話決定システム１は、ユーザ情報記憶部１２１（図４参照）に記憶されたユーザの嗜好（興味・関心）に関する情報を更新してもよい。例えば、対話決定システム１は、分類が「スポーツ」である未来イベントＩＶ１２を未来イベント情報記憶部１２２に記憶する際に、ユーザ情報記憶部１２１にユーザＵ１の嗜好（興味・関心）に関する情報として「スポーツ」を記憶してもよい。すなわち、対話決定システム１は、ユーザＵ１の利用情報に基づく未来イベントＩＶ１２に関する情報により、ユーザ情報記憶部１２１に記憶されたユーザＵ１の嗜好に関する情報を更新してもよい。これにより、対話決定システム１は、ユーザＵ１に対してより適切な応答を行うことが可能となる。

〔１−２．配信処理〕
次に、図２を用いて、実施形態に係る決定処理の一例について説明する。図２は、実施形態に係る配信処理の一例を示す図である。具体的には、図２は、実施形態に係る決定処理における未来イベント決定の一例を示す図である。図２は、ユーザＵ１が対話決定システム１のサービスを利用する場合を示す。図２は、応答生成サーバ１００が、ユーザＵ１の発話による入力情報から抽出された話題に対応する未来イベントに関する情報を出力として決定する場合を示す。また、図２に示す処理は、２０ＸＸ年２月２７日に行われたものとする。

なお、応答生成サーバ１００が、出力する未来イベントに関する情報の決定以外の通常の出力を決定する処理については説明を省略する。例えば、応答生成サーバ１００が、ユーザＵ１の発話による入力情報に対して出力する未来イベントに関する情報の決定以外の出力に関して決定する処理については説明を省略する。また、図２では、端末装置２０からの入力に対して、応答生成サーバ１００が未来イベントに関する情報の決定し、対話決定システム１が出力する処理について説明し、対話決定システム１内の各構成の処理についての詳細は後述する。

図２に示すように、端末装置２０は、対話決定システム１に関するアプリケーション（以下、「対話アプリ」とする場合がある）の起動指示を受け付けると、対話アプリを起動する（ステップＳ２１）。そして、ユーザＵ１は、対話アプリが起動された端末装置２０に音声を入力する（ステップＳ２２）。図２では、端末装置２０は、２０ＸＸ年２月２７日１７時にユーザＵ１が対話アプリを起動中の端末装置２０に対して発話した「昨日のサッカーの試合結果を教えて。」という音声情報を用いて、所定の処理により入力情報ＩＭ１１を取得する。そして、端末装置２０は、応答生成サーバ１００に入力情報ＩＭ１１を送信する（ステップＳ２３）。

応答生成サーバ１００は、端末装置２０から取得した入力情報ＩＭ１１から話題を抽出する（ステップＳ２４）。例えば、応答生成サーバ１００は、話題情報記憶部１２３に記憶された各話題に対応付けられたキーワードのスコアに基づいて、入力情報ＩＭ１１から話題を抽出する。例えば、応答生成サーバ１００は、話題ごとに対応付けられたキーワードのスコアを合算し、合算したスコアが最大の話題を入力情報ＩＭ１１の話題として抽出する。図２では、応答生成サーバ１００は、話題リストＴＬ１１に示すように、入力情報ＩＭ１１から話題「スポーツ」を抽出する。

そして、応答生成サーバ１００は、話題リストＴＬ１１と、入力情報ＩＭ１１を送信したユーザＵ１や日時を示す関連情報ＩＮ１１とに基づいて、出力する未来イベントに関する情報を決定する（ステップＳ２５）。例えば、応答生成サーバ１００は、未来イベント情報記憶部１２２−２中のユーザＵ１に対応し分類が「スポーツ」であって、「２０ＸＸ年２月２７日１７時」から所定の期間内の未来に行われる未来イベントに関する情報を出力する未来イベントに関する情報として決定する。例えば、応答生成サーバ１００は、「２０ＸＸ年２月２７日１７時」から１週間以内に行われる未来イベントに関する情報を出力する未来イベントに関する情報として決定する。図２では、応答生成サーバ１００は、未来イベントＩＶ１２を出力する未来イベントに関する情報として決定する。

そして、応答生成サーバ１００は、通常の処理により決定される入力情報ＩＭ１１に対応する応答に関する情報と、ステップＳ２５により決定された未来イベントＩＶ１２とに基づいて出力を決定する（ステップＳ２６）。例えば、応答生成サーバ１００は、通常の処理により、「２０ＸＸ年２月２７日」の前日である「２０ＸＸ年２月２６日」に行われたサッカーの試合結果を示す情報を種々のニュース等に関する情報を記憶する記憶部から取得して、入力情報ＩＭ１１に対応する応答を決定する。例えば、応答生成サーバ１００は、外部システム５から取得したユーザＵ１がＸ国の試合情報に関するニュースを閲覧したことを示す情報に基づいて、Ｙ国やＺ国の試合結果でなくＸ国の結果を入力情報ＩＭ１１に対応する応答として決定する。このように、応答生成サーバ１００は、「２０ＸＸ年２月２６日」に行われたサッカーの試合が複数ある場合であっても、外部システム５から取得した情報に基づいて、ユーザＵ１に対して複数の候補から適切と推定される応答を決定する。すなわち、応答生成サーバ１００は、複数の候補がある場合であっても、外部システム５から取得した情報に基づいて、ユーザＵ１に対して適切な応答を決定することができる。なお、応答生成サーバ１００は、種々のニュース等に関する情報記憶する記憶部を有してもよいし、外部に設けられた記憶部から取得してもよい。また、応答生成サーバ１００は、ユーザ情報記憶部１２１に記憶されたユーザの嗜好（興味・関心）に関する情報に基づいて、入力情報ＩＭ１１に対応する応答に関する情報を決定してもよい。

図２では、応答生成サーバ１００は、入力情報ＩＭ１１に対応する応答に関する通常情報ＮＭ１１と、未来イベントＩＶ１２と関する未来情報ＦＭ１１とを含む出力情報ＯＭ１１を端末装置２０に出力する出力として決定する。なお、通常情報ＮＭ１１には、「２―１でＸ国が勝ちました。」という、入力情報ＩＭ１１に対応する応答を示す情報が含まれる。また、未来情報ＦＭ１１には、「来週は、チームＢの試合があります。また結果を聞きに来てくださいね。」という、入力情報ＩＭ１１に対応する未来イベントに関する情報や、ユーザＵ１に後日に再び対話アプリの利用を促す情報が含まれる。

そして、応答生成サーバ１００は、出力情報ＯＭ１１を端末装置２０へ送信する（ステップＳ２７）。なお、応答生成サーバ１００は、出力情報ＯＭ１１に関する応答発話用の中間表記を端末装置２０へ送信してもよい。

出力情報ＯＭ１１を受信した端末装置２０は、出力情報ＯＭ１１を音声として出力する（ステップＳ２８）。図２では、端末装置２０は、最初に「２―１でＸ国が勝ちました。」というユーザＵ１の質問に対する回答を出力する。続けて、端末装置２０は、「来週は、チームＢの試合があります。また結果を聞きに来てくださいね。」という未来イベントに関する情報やユーザＵ１に後日に再び対話アプリの利用を促す情報を音声として出力する。このように、対話決定システム１は、ユーザの入力に対して回答した後に続けて、未来のイベントに関する情報を出力することにより、ユーザに対して違和感のない流れで、未来のイベントに関する情報を出力することができる。なお、上述した例では、ユーザの入力に対しての回答（通常の応答）後に続けて、未来のイベントに関する情報を出力する例を示したが、通常の応答は行わなくてもよい。例えば、対話決定システム１は、ユーザの入力に対して、未来のイベントに関する情報のみを出力してもよい。

上述したように、対話決定システム１は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。これにより、対話決定システム１は、ユーザの発話の意図を総合的に判断して出力を決定することができる。また、対話決定システム１は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報から未来のイベントに関する情報を抽出し、抽出した未来のイベントに関する情報を対話システムにおける出力として決定する。これにより、対話決定システム１は、各ユーザが関心を示す可能性の高い未来イベントに関する情報を、ユーザに対して出力することができる。したがって、対話決定システム１は、対話システムにおける出力を適切に決定することができる。また、上述したように、「また結果を聞きに来てくださいね。」等のユーザに近い未来に再度対話決定システム１を利用するよう応答で誘導することにより、対話決定システム１は、対話システムの利用促進させることが可能となる。

なお、図２では、入力情報ＩＭ１１に対して出力情報ＯＭ１１を決定する場合を示したが、対話決定システム１は、入力情報ＩＭ１１に対応する未来イベントに関する情報に基づいて所定の出力を決定してもよい。例えば、対話決定システム１は、入力情報ＩＭ１１に対応する未来イベントに関する情報に基づいて、端末装置２０に所定のアプリケーションを起動させる情報を送信してもよい。また、例えば、対話決定システム１は、入力情報ＩＭ１１に対応する未来イベントに関する情報に基づいて、所定のコンテンツを表示させる情報を送信してもよい。また、図１及び図２に示した例においては、応答生成サーバ１００が決定処理を行う場合を示したが、図１及び図２に示す決定処理は、端末装置２０において行われてもよい。例えば、端末装置２０にインストールされたアプリケーション（対話アプリ等）により、図１及び図２に示す決定処理が行われてもよい。例えば、端末装置２０のアプリ２５により、図１及び図２に示す決定処理が行われてもよい。この場合、端末装置２０のアプリ２５は、取得部や決定部や更新部を有してもよい。例えば、端末装置２０は、決定装置１００であってもよい。例えば、端末装置２０は、決定装置１００の有する機能を有してもよい。この場合、端末装置２０は、図１及び図２において決定装置１００が行うステップを行ってもよい。

また、対話決定システム１は、未来のイベントに関する情報が出力されたユーザの対話決定システム１における応答に関する情報に基づいて、対話決定システム１におけるユーザに対する出力を決定してもよい。例えば、対話決定システム１は、ユーザが対話決定システム１からの出力に対して応答した未来イベントの分類をユーザが関心を示す可能性の高い対象としてもよい。例えば、対話決定システム１は、ユーザＵ１が出力情報ＯＭ１１に対して応答した場合、未来イベントＩＶ１２の分類「スポーツ」を、ユーザ情報記憶部１２１にユーザＵ１の嗜好（興味・関心）に関する情報として記憶してもよい。この場合、例えば、対話決定システム１は、ユーザＵ１に対する出力を決定する場合、ユーザＵ１が関心を示す可能性の高い「スポーツ」に関する話題を優先してもよい。

例えば、対話決定システム１は、応答に関する情報を用いた学習により生成されるモデルに基づいて、対話決定システム１におけるユーザに対する出力を決定してもよい。例えば、対話決定システム１は、ユーザごとが対話決定システム１からの出力に対して応答した未来イベントの分類に基づいて、モデルを生成してもよい。これにより、対話決定システム１は、各ユーザがどの分類の未来イベントに関心を示す可能性の高いかを適切に判定することができる。なお、対話決定システム１が学習するモデルは、上記に限らず、ユーザがどのような出力に対して関心を示す可能性の高いかを判定するモデルであってもよい。例えば、対話決定システム１は、各ユーザが出力にどのようなキーワードが含まれる場合に、出力に対して関心を示す可能性の高いかを判定するモデルであってもよい。この場合、例えば、対話決定システム１は、ユーザごとに素性をキーワードとするモデルを生成してもよい。

〔２．応答生成サーバの構成〕
次に、図３を用いて、実施形態に係る応答生成サーバ１００の構成について説明する。図３は、実施形態に係る応答生成サーバ１００の構成例を示す図である。図３に示すように、応答生成サーバ１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、応答生成サーバ１００は、応答生成サーバ１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、端末装置２０や音声認識サーバ３０や音声合成サーバ４０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図３に示すように、ユーザ情報記憶部１２１と、未来イベント情報記憶部１２２と、話題情報記憶部１２３とを有する。また、記憶部１２０には、上記に限らず、音声対話サービスを提供するために必要な種々の情が記憶される。例えば、記憶部１２０には、ユーザの入力に対して、未来イベント情報以外の通常の応答を行うための対話コーパス等が記憶される。例えば、対話システムが、自動車に搭載されるナビゲーションシステムに用いられる場合、対話システム自身から取得できる情報（例えば、ユーザとの対話履歴やカーナビの検索履歴など）を記憶してもよい。

（ユーザ情報記憶部１２１）
実施形態に係るユーザ情報記憶部１２１は、ユーザに関する各種情報を記憶する。図４は、実施形態に係るユーザ情報記憶部の一例を示す図である。図４に示すユーザ情報記憶部１２１は、「ユーザＩＤ」、「嗜好１」、「嗜好２」等といった項目が含まれる。

「ユーザＩＤ」は、ユーザを識別するための識別情報を示す。例えば、ユーザＩＤ「Ｕ１」により識別されるユーザは、図１の例に示したユーザＵ１に対応する。また、「嗜好１」や「嗜好２」は、ユーザＩＤにより識別されるユーザが興味・関心のある対象を示す。例えば、ユーザが興味・関心のある対象は、対話システムが自動車に搭載されるナビゲーションシステムに用いられる場合、対話システム自身から取得できる情報（例えば、ユーザとの対話履歴やカーナビの検索履歴など）から推定されてもよい。

例えば、図４に示す例において、ユーザＩＤ「Ｕ１」により識別されるユーザが興味・関心のある対象は、「スポーツ」や「車」であることを示す。また、例えば、例えば、図４に示す例において、ユーザＩＤ「Ｕ２」により識別されるユーザが興味・関心のある対象は、「グルメ」や「ファッション」であることを示す。

なお、ユーザ情報記憶部１２１は、ユーザ情報であれば、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部１２１は、氏名、年齢、性別、居住地、家族構成、収入、勤務先等の情報を記憶してもよい。

（未来イベント情報記憶部１２２）
実施形態に係る未来イベント情報記憶部１２２は、未来イベントに関する各種情報を記憶する。図５は、実施形態に係る未来イベント情報記憶部の一例を示す図である。例えば、図５では、未来イベント情報記憶部１２２に、各端末装置２０から取得した利用情報に基づく未来イベントに関する情報が各ユーザに対応付けて記憶される場合を示す。図５に示す未来イベント情報記憶部１２２には、「ユーザＩＤ」、「未来イベント情報」、「抽出元情報」といった項目が含まれる。また、「未来イベント情報」には、「イベント名」、「ＩＤ」、「分類」、「日時」、「対象」といった項目が含まれる。

「ユーザＩＤ」は、ユーザを識別するための識別情報を示す。「イベント名」は、未来イベントの名称を示す。「ＩＤ」は、未来イベントを識別するための識別情報を示す。「分類」は、未来イベントの分類を示す。「日時」は、未来イベントが行われる日時に関する情報を示す。「対象」は、未来イベントに関連する対象を示す。なお、「対象」は複数記憶されてもよい。「抽出元情報」は、未来イベントが抽出された情報を示す。

例えば、図５中の未来イベント情報記憶部１２２では、ＩＤ「ＩＶ１１」により識別されるイベント名「ライブ」や、ＩＤ「ＩＶ１２」により識別されるイベント名「サッカーの試合」（「未来イベントＩＶ１２」に対応）が、ユーザＵ１に対応付けて記憶される。

また、図５に示す例では、ＩＤ「ＩＶ１１」により識別されるイベント名「ライブ」は、分類が「音楽」であり、日時「２０ＸＸ年２月２８日１７時」から行われることを示す。また、ＩＤ「ＩＶ１１」により識別されるイベント名「ライブ」は、対象が「アーティストＡ」であり、抽出元となった情報がメールＭＬ１１であることを示す。

なお、未来イベント情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、未来イベント情報記憶部１２２は、未来イベントが行われるまでの残り時間に関する情報を記憶してもよい。また、例えば、未来イベント情報記憶部１２２に記憶された未来イベントは、現在時刻が日時を過ぎた場合には、削除されてもよい。

（話題情報記憶部１２３）
実施形態に係る話題情報記憶部１２３は、話題フォーマットの評価値（例えばＣＴＲ等）を算出するモデルに関する各種情報を記憶する。図６は、実施形態に係る話題情報記憶部の一例を示す図である。例えば、図６では、話題情報記憶部１２３に、各話題に対応付けて各キーワードのスコアが記憶される場合を示す。図６に示す話題情報記憶部１２３は、キーワードとして「天気」、「観光」、「旅行」、「サッカー」、「試合」といった項目が含まれる。

例えば、図６に示す例では、話題「スポーツ」は、キーワード「天気」のスコアが「０．１」であり、キーワード「観光」のスコアが「０」であり、キーワード「旅行」のスコアが「−０．２」であることを示す。また、例えば、話題「スポーツ」は、キーワード「サッカー」のスコアが「２．０」であり、キーワード「試合」のスコアが「１．０」であることを示す。

例えば、図６に示す例では、話題「旅行」は、キーワード「天気」のスコアが「０．５」であり、キーワード「観光」のスコアが「１．０」であり、キーワード「旅行」のスコアが「２．０」であることを示す。また、例えば、話題「旅行」は、キーワード「サッカー」のスコアが「−０．１」であり、キーワード「試合」のスコアが「０」であることを示す。

なお、話題情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（制御部１３０）
図３の説明に戻って、制御部１３０は、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、応答生成サーバ１００内部の記憶装置に記憶されている各種プログラム（配信プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図３に示すように、制御部１３０は、取得部１３１と、要求生成部１３２と、変換部１３３と、抽出部１３４と、決定部１３５と、音声合成指示部１３６と、応答生成部１３７と、更新部１３８と、送信部１３９とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。

（取得部１３１）
取得部１３１は、対話システム以外のシステムからユーザに関する行動情報を取得する。例えば、取得部１３１は、対話決定システム１以外の外部システム５からユーザに関する行動情報を取得する。例えば、取得部１３１は、外部システム５からユーザの利用情報を取得する。例えば、取得部１３１は、コンテンツ配信サーバ５１から利用情報を取得する。図１では、取得部１３１は、利用情報として、ユーザＵ１にコンテンツＣＴ１１を配信したことを示す情報を、コンテンツ配信サーバ５１から取得する。また、取得部１３１は、端末装置２０から入力情報ＩＭ１１を取得する。

（要求生成部１３２）
要求生成部１３２は、外部システム５に情報を要求する。例えば、要求生成部１３２は、外部システム５にユーザの利用情報を応答生成サーバ１００に送信するように要求する。また、例えば、要求生成部１３２は、応答の生成に必要なデータを外部装置が有している場合、データの検索条件を指定し、所定のＡＰＩ（Application Program Interface）サーバ（図示せず）に対してデータの要求を行ってもよい。例えば、ＡＰＩサーバは、路線ＡＰＩサーバや天気ＡＰＩサーバやＷｅｂ検索ＡＰＩサーバ等、種々のＡＰＩサーバであってもよい。

（変換部１３３）
変換部１３３は、所定のＡＰＩサーバからＸＭＬ（Extensible Markup Language）データを受信すると、予め記憶されたフォーマットに従って、ＸＭＬデータからデータを抽出し、ＸＭＬデータをＨＴＭＬ（Hyper Text Markup Language）データに変換する。例えば、変換部１３３は、路線検索に関するＸＭＬデータを受信すると、乗り換えに関するフォーマットに従って、ＸＭＬデータから駅名や乗車時間の情報を抽出し、ＸＭＬデータをＨＴＭＬデータに変換する。なお、応答生成サーバ１００は、所定のＡＰＩサーバからＸＭＬデータを受信しない場合、変換部１３３を有しなくてもよい。

（抽出部１３４）
抽出部１３４は、取得部１３１により取得された利用情報に基づいて未来イベントを抽出する。例えば、抽出部１３４は、ユーザＵ１に配信されたコンテンツＣＴ１１に関する情報（記事の内容等）から、未来イベントを抽出する。図１の例では、抽出部１３４は、コンテンツＣＴ１１から、日時「２０ＸＸ年２月２９日１９時」からイベント「サッカーの試合」が行われることを示す未来イベントに関する情報を抽出する。例えば、抽出部１３４は、固有表現抽出等の種々の従来技術を適宜用いて、未来イベント情報を抽出する。

また、抽出部１３４は、ユーザの発話に基づいて入力された情報から話題を抽出する。例えば、抽出部１３４は、端末装置２０から取得した入力情報ＩＭ１１から話題を抽出する。例えば、抽出部１３４は、話題情報記憶部１２３に記憶された各話題に対応付けられたキーワードのスコアに基づいて、入力情報ＩＭ１１から話題を抽出する。例えば、抽出部１３４は、話題ごとに対応付けられたキーワードのスコアを合算し、合算したスコアが最大の話題を入力情報ＩＭ１１の話題として抽出する。図２では、抽出部１３４は、話題リストＴＬ１１に示すように、入力情報ＩＭ１１から話題「スポーツ」を抽出する。

（決定部１３５）
決定部１３５は、取得部１３１により取得されたユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。例えば、決定部１３５は、取得部１３１により取得された利用情報に基づいて、対話決定システム１におけるユーザに対する出力を決定する。例えば、決定部１３５は、抽出部１３４により抽出された未来イベントに関する情報に基づいて、対話決定システム１におけるユーザに対する出力を決定する。

決定部１３５は、ユーザに関する行動情報に基づいてユーザが関心を示すと推定される未来のイベントに関する情報を、対話システムにおける出力として決定する。また、決定部１３５は、未来のイベントに関する情報が出力されたユーザの対話システムにおける応答に関する情報に基づいて、対話システムにおける前記ユーザに対する出力を決定してもよい。また、決定部１３５は、応答に関する情報を用いた学習により生成されるモデルに基づいて、対話システムにおけるユーザに対する出力を決定してもよい。

決定部１３５は、ユーザに対する出力として、ユーザの入力に対応する文字情報（文字列）に応答する文字情報（文字列）である応答文字情報を決定する。例えば、決定部１３５は、入力情報ＩＭ１１に対応する文字情報に応答する応答文字情報を含む通常情報ＮＭ１１を決定する。決定部１３５は、対話システムにおけるユーザの入力が回答を求める情報であった場合、ユーザに対する出力として、応答文字情報に続けて出力される文字情報であって、応答文字情報に関連する未来のイベントに関する文字情報を決定する。例えば、決定部１３５は、入力情報ＩＭ１１が回答を求める情報であるため、通常情報ＮＭ１１に含まれる応答文字情報に関連する未来のイベントに関する文字情報であって、通常情報ＮＭ１１に続けて出力される未来イベントＩＶ１２と関する未来情報ＦＭ１１を決定する。

図２では、決定部１３５は、話題リストＴＬ１１と、入力情報ＩＭ１１を送信したユーザＵ１や日時を示す関連情報ＩＮ１１とに基づいて、出力する未来イベントに関する情報を決定する。例えば、決定部１３５は、未来イベント情報記憶部１２２−２中のユーザＵ１に対応し分類が「スポーツ」であって、「２０ＸＸ年２月２７日１７時」から所定の期間内の未来に行われる未来イベントに関する情報を出力する未来イベントに関する情報として決定する。例えば、決定部１３５は、「２０ＸＸ年２月２７日１７時」から１週間以内に行われる未来イベントに関する情報を出力する未来イベントに関する情報として決定する。例えば、決定部１３５は、未来イベントＩＶ１２を出力する未来イベントに関する情報として決定する。

そして、決定部１３５は、通常の処理により決定される入力情報ＩＭ１１に対応する応答に関する情報と、未来イベントＩＶ１２とに基づいて出力を決定する。例えば、決定部１３５は、通常の処理により、「２０ＸＸ年２月２７日」の前日である「２０ＸＸ年２月２６日」に行われたサッカーの試合結果を示す情報を種々のニュース等に関する情報記憶する記憶部から取得して、入力情報ＩＭ１１に対応する応答を決定する。また、決定部１３５は、入力情報ＩＭ１１に対応する応答に関する通常情報ＮＭ１１と、未来イベントＩＶ１２と関する未来情報ＦＭ１１とを含む出力情報ＯＭ１１を端末装置２０に出力する出力として決定する。

例えば、決定部１３５は、ユーザの発話（入力情報）が「明日の天気は？」であり、ユーザに対応する未来イベントにユーザの発話時点の翌日が日時である旅行が含まれる場合、入力情報に対応する応答に関する通常情報「晴れです。」や未来イベントと関する未来情報「明日から旅行ですね。帰ってきたら感想を聞かせてください。」をユーザに対する出力情報として決定する。また、例えば、決定部１３５は、ユーザの発話（入力情報）が「好きな食べ物は？」であり、ユーザに対応する未来イベントにユーザの発話時点の翌日が日時であるチョコレートの祭典が含まれる場合、入力情報に対応する応答に関する通常情報「（チョコレート名）ＸＸＸです。」や未来イベントと関する未来情報「明日はチョコレートの祭典がありますね。行ったら感想を聞かせてください。」をユーザに対する出力情報として決定する。

例えば、図２では、決定部１３５は、取得部１３１により、２０ＸＸ年２月２７日１７時に「昨日のサッカーの試合結果を教えて。」という内容の入力情報ＩＭ１１が取得された場合、サッカーの試合結果を示す情報を種々のニュース等に関する情報を記憶する記憶部から取得して、入力情報ＩＭ１１に対応する応答を決定する。例えば、決定部１３５は、取得部１３１により外部システム５から取得されたユーザＵ１がＸ国の試合情報に関するニュースを閲覧したことを示す情報に基づいて、Ｙ国やＺ国の試合結果でなくＸ国の結果を入力情報ＩＭ１１に対応する応答として決定する。

また、例えば、決定部１３５は、取得部１３１により、「昨日のＸＸＸの結果は？」という内容の入力情報が取得された場合、人名であるＸＸＸの試合結果を示す情報を種々のニュース等に関する情報を記憶する記憶部から取得して、応答を決定する。例えば、昨日（例えば、２０１６年２月２５日）に試合等の結果が生じる行動を行ったＸＸＸという名前に対応する人が複数いる場合、決定部１３５は、外部システム５から取得されたユーザのコンテンツ等の閲覧に関する情報に基づいて、いずれのＸＸＸの結果を応答するかを決定する。例えば、決定部１３５は、取得部１３１により外部システム５からユーザがスケート選手のＸＸＸのニュースを閲覧したことを示す情報が取得された場合、他のＸＸＸの結果ではなくスケート選手のＸＸＸの結果を応答として決定する。

また、例えば、決定部１３５は、取得部１３１により、「何か面白いイベントない？」という内容の入力情報が取得された場合、ユーザが閲覧したコンテンツに関する情報に基づいて、応答を決定する。例えば、決定部１３５は、取得部１３１により外部システム５からユーザがチョコレートの祭典に関するニュースを閲覧していたことを示す情報が取得された場合、Ｘ月Ｙ日に開催されるチョコレートの祭典に関する未来イベント情報を応答として決定する。

これにより、決定部１３５は、ユーザの興味・関心にあったイベント情報を応答として決定することができる。このように、決定部１３５は、未来のイベント情報に基づいて、よりユーザの興味・関心にあった適切な応答を決定することが可能となる。

（音声合成指示部１３６）
音声合成指示部１３６は、応答発話用のテキストデータを音声合成サーバ４０に送信する。音声合成指示部１３６は、テキストデータを音声合成サーバ４０に送信することにより、音声合成サーバ４０に応答発話用のテキストデータから音声を合成する音声合成処理を行わせ、応答発話用の中間表記を生成させる。

（応答生成部１３７）
応答生成部１３７は、応答発話用の中間表記と応答発話用のテキストデータとＨＴＭＬデータとに基づいて出力情報を生成する。なお、応答生成部１３７は、端末装置２０へ送信する情報が応答発話用の中間表記のみである場合、応答発話用の中間表記を出力情報としてもよい。また、応答生成サーバ１００は、端末装置２０へ送信する情報が応答発話用の中間表記のみである場合、応答生成部１３７を有しなくてもよい。

（更新部１３８）
更新部１３８は、ユーザに関する行動情報に基づいてユーザが関心を示すと推定される未来のイベントに関する情報により、記憶部１２０に記憶されたユーザの嗜好に関する情報を更新する。例えば、更新部１３８は、取得部１３１により取得されたユーザの利用情報に基づいて、ユーザ情報記憶部１２１に記憶されたユーザの嗜好（興味・関心）に関する情報を更新する。例えば、更新部１３８は、分類が「スポーツ」である未来イベントＩＶ１２を未来イベント情報記憶部１２２に記憶する際に、ユーザ情報記憶部１２１にユーザＵ１の嗜好（興味・関心）に関する情報として「スポーツ」を記憶してもよい。例えば、更新部１３８は、ユーザＵ１の利用情報に基づく未来イベントＩＶ１２に関する情報により、ユーザ情報記憶部１２１に記憶されたユーザＵ１の嗜好に関する情報を更新してもよい。

また、更新部１３８は、取得部１３１により取得されたユーザの利用情報に基づいて、未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する。例えば、更新部１３８は、未来イベントが抽出された後、未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する。例えば、更新部１３８は、抽出部１３４により抽出された未来イベントにより、未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する。

（送信部１３９）
送信部１３９は、各種情報を外部装置へ送信する。例えば、送信部１３９は、応答発話用の中間表記と応答発話表示用のテキストデータとＨＴＭＬデータを端末装置２０へ送信する。図２では、送信部１３９は、出力情報ＯＭ１１を端末装置２０へ送信する。また、例えば、送信部１３９は、出力情報ＯＭ１１に関する応答発話用の中間表記を端末装置２０へ送信してもよい。

〔３．端末装置の構成〕
次に、図７を用いて、実施形態に係る端末装置２０の構成について説明する。図７は、実施形態に係る端末装置の構成例を示す図である。図７に示すように、端末装置２０は、通信部２１と、マイク２２と、スピーカ２３と、表示部２４と、アプリ２５と、メモリ２６とを有する。

通信部２１は、所定のネットワークを介して応答生成サーバ１００や音声認識サーバ３０との間で各種データを送受信する。通信部２１は、例えば、携帯端末やスマートフォンの場合には、アンテナや通信制御を行う電子回路等である。例えば、端末装置２０がノート型ＰＣやデスクトップ型ＰＣである場合には、ＮＩＣ等に該当する。通信部２１は、例えば、端末装置２０がタブレット型ＰＣである場合には、アンテナや通信制御を行う電子回路等である。

マイク２２は、端末装置２０を利用するユーザが発話した音声入力を受け付ける入力デバイスである。スピーカ２３は、端末装置２０のユーザが発話した音声入力に対する応答音声を出力する出力デバイスである。また、表示部２４は、各種情報を表示する表示デバイスであり、例えばタッチパネルや液晶ディスプレイ等である。表示部２４は、例えば、応答発話表示用のテキストデータや発話意図に応じてＨＴＭＬデータ等を表示する。

アプリ２５は、ユーザが発話した音声入力を受け付けると、音声データを音声認識サーバ３０に送信し、音声認識サーバ３０から発話のテキストデータを受信する。また、アプリ２５は、発話のテキストデータや過去の発話情報を応答生成サーバ１００に送信し、応答生成サーバ１００からＨＴＭＬ等の言語で記述されたデータ、応答発話用の中間表記および応答発話表示用のテキストデータなどを受信する。また、アプリ２５は、端末装置２０を利用するユーザが発話した音声入力に対する応答音声を出力したり、ＨＴＭＬ等の言語で記述されたデータを表示したりする。アプリ２５は、ＣＰＵやＭＰＵ等により実現され、音声データ送信部２５ａ、テキストデータ受信部２５ｂ、テキストデータ送信部２５ｃ、ＨＴＭＬデータ受信部２５ｄ、表示制御部２５ｅによる処理を実現する。

メモリ２６は、履歴記憶部２６ａおよび位置情報記憶部２６ｂを有する。メモリ２６は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子等の記憶装置である。履歴記憶部２６ａは、発話のテキストデータとともに送信される、過去の発話に関する履歴情報を記憶する。位置情報記憶部２６ｂは、例えば、発話のテキストデータとともに送信される、端末装置２０の現在位置を示す位置情報を記憶する。なお、メモリ２６は、履歴情報や位置情報のほかに、ユーザの自宅の住所などの個人情報を記憶していてもよい。これらの情報は、位置情報と同様に、発話のテキストデータとともに応答生成サーバ１００に送信してもよい。

なお、端末装置２０が有する各処理部は、以下に説明する情報処理の機能や作用を実現又は実行する。

〔４．決定処理のフロー〕
次に、図８及び図９を用いて、実施形態に係る対話決定システム１による決定処理の手順について説明する。図８は、実施形態に係る決定処理の一例を示すフローチャートである。具体的には、図８は、実施形態に係る決定処理における未来イベントに関する情報の更新の一例を示すフローチャートである。また、図９は、実施形態に係る決定処理の一例を示すフローチャートである。具体的には、図９は、実施形態に係る決定処理における未来イベント決定の一例を示すフローチャートである。

〔４−１．未来イベント情報の記憶〕
図８に示すように、応答生成サーバ１００は、ユーザの利用情報を取得する（ステップＳ１０１）。その後、応答生成サーバ１００は、ステップＳ１０１において取得したユーザの利用情報からイベント名を抽出する（ステップＳ１０２）。

そして、ステップＳ１０２において利用情報からイベント名を抽出できた場合（ステップＳ１０３：Ｙｅｓ）、応答生成サーバ１００は、利用情報から日時を抽出する（ステップＳ１０４）。一方、ステップＳ１０２において利用情報からイベント名を抽出できなかった場合（ステップＳ１０３：Ｎｏ）、応答生成サーバ１００は、処理を終了する。

また、ステップＳ１０４において利用情報から日時を抽出できた場合（ステップＳ１０５：Ｙｅｓ）、応答生成サーバ１００は、ステップＳ１０４において利用情報から抽出された日時が未来の日時かを判定する（ステップＳ１０６）。一方、ステップＳ１０４において利用情報から日時を抽出できなかった場合（ステップＳ１０５：Ｎｏ）、応答生成サーバ１００は、処理を終了する。

そして、ステップＳ１０４において利用情報から抽出された日時が未来の日時である場合（ステップＳ１０６：Ｙｅｓ）、応答生成サーバ１００は、利用情報から話題を抽出する（ステップＳ１０７）。その後、一方、応答生成サーバ１００は、抽出した未来イベント情報を記憶する（ステップＳ１０８）。例えば、応答生成サーバ１００は、抽出したイベント名や日時や話題等を含む未来イベント情報を未来イベント情報記憶部１２２に記憶する。一方、ステップＳ１０４において利用情報から抽出された日時が未来の日時ではなかった場合（ステップＳ１０６：Ｎｏ）、応答生成サーバ１００は、処理を終了する。

〔４−２．未来イベント情報の決定〕
また、図９に示すように、応答生成サーバ１００は、ユーザの音声入力を取得する（ステップＳ２０１）。その後、応答生成サーバ１００は、ステップＳ２０１において入力された情報から話題を抽出する（ステップＳ２０２）。

そして、応答生成サーバ１００は、ステップＳ２０２において抽出した話題に対応する未来イベント情報が存在するかを判定する（ステップＳ２０３）。

ステップＳ２０２において抽出した話題に対応する未来イベント情報が存在する場合（ステップＳ２０３：Ｙｅｓ）、応答生成サーバ１００は、未来イベント情報に含まれるイベントの日時が現在時刻から所定の期間内かを判定する（ステップＳ２０４）。

未来イベント情報に含まれるイベントの日時が現在時刻から所定の期間内である場合（ステップＳ２０４：Ｙｅｓ）、応答生成サーバ１００は、未来イベント情報に関する対話を行う（ステップＳ２０５）。

一方、ステップＳ２０２において抽出した話題に対応する未来イベント情報が存在しない場合（ステップＳ２０３：Ｎｏ）、応答生成サーバ１００は、通常の対話を行う（ステップＳ２０６）。また、未来イベント情報に含まれるイベントの日時が現在時刻から所定の期間内でない場合（ステップＳ２０４：Ｎｏ）、応答生成サーバ１００は、通常の対話を行う（ステップＳ２０６）。

〔５．決定処理の流れ〕
次に、図１０を用いて、対話決定システム１における決定処理の流れを示す。図１０は、実施形態に係る決定処理の一例を示すシーケンス図である。

図１０に例示するように、端末装置２０は、アプリケーションの起動指示を受け付けると、対話アプリを起動する（ステップＳ５１）。そして、端末装置２０の音声データ送信部２５ａは、ユーザの発話を検知すると、発話の音声データをｓｏｃｋｅｔ通信により音声認識サーバ３０へ送信する（ステップＳ５２）。図２の例では、端末装置２０は、「昨日のサッカーの試合結果を教えて。」というユーザＵ１の発話の音声データ（音声情報）を音声認識サーバ３０へ送信する。

そして、音声認識サーバ３０は、発話の音声データを受信すると、音声データをテキストデータに変換する（ステップＳ５３）。図２の例では、音声認識サーバ３０は、端末装置２０から受信した「昨日のサッカーの試合結果を教えて。」というユーザＵ１の発話の音声データをテキストデータ（例えば、入力情報ＩＭ１１）に変換する。そして、音声認識サーバ３０は、変換した発話のテキストデータを端末装置２０に送信する（ステップＳ５４）。図２の例では、音声認識サーバ３０は、変換した発話のテキストデータとして入力情報ＩＭ１１を端末装置２０に送信する。

続いて、端末装置２０は、音声認識サーバ３０から発話のテキストデータを受信すると、発話のテキストデータを応答生成サーバ１００に送信する（ステップＳ５５）。図２の例では、端末装置２０は、音声認識サーバ３０から発話のテキストデータとして入力情報ＩＭ１１を受信すると、入力情報ＩＭ１１を応答生成サーバ１００に送信する。

続いて、応答生成サーバ１００は、発話のテキストデータを取得すると、テキストデータに対応する出力を決定する決定処理を行う（ステップＳ５６）。図２の例では、応答生成サーバ１００は、発話のテキストデータとして入力情報ＩＭ１１を取得すると、入力情報ＩＭ１１に対応する通常情報ＮＭ１１や未来情報ＦＭ１１を含む出力情報ＯＭ１１を決定する。

また、応答生成サーバ１００は、応答発話用のテキストデータを音声合成サーバ４０に送信する（ステップＳ５７）。図２の例では、応答生成サーバ１００は、応答発話用のテキストデータとして出力情報ＯＭ１１を音声合成サーバ４０に送信する。そして、音声合成サーバ４０は、応答発話用のテキストデータから音声を合成する音声合成処理を行って、応答発話用の中間表記を生成する（ステップＳ５８）。図２の例では、応答生成サーバ１００は、出力情報ＯＭ１１から音声を合成する音声合成処理を行って、応答発話用の中間表記を生成する。そして、音声合成サーバ４０は、応答発話用の中間表記を応答生成サーバ１００に送信する（ステップＳ５９）。図２の例では、音声合成サーバ４０は、出力情報ＯＭ１１から生成した応答発話用の中間表記を応答生成サーバ１００に送信する。

続いて、応答生成サーバ１００は、応答発話用の中間表記を端末装置２０に送信する（ステップＳ６０）。図２の例では、応答生成サーバ１００は、出力情報ＯＭ１１から生成された応答発話用の中間表記を端末装置２０に送信する。なお、応答生成サーバ１００は、端末装置２０が出力情報ＯＭ１１により音声の出力が可能である場合、出力情報ＯＭ１１を端末装置２０に送信してもよい。

そして、端末装置２０は、受信した応答発話用の中間表記等を解析し、ユーザへの出力を決定する（ステップＳ６１）。続いて、端末装置２０は、応答発話用の中間表記を用いて、応答の音声を出力する（ステップＳ６２）。図２の例では、端末装置２０は、出力情報ＯＭ１１から生成された応答発話用の中間表記を用いて、通常情報ＮＭ１１や未来情報ＦＭ１１を含む応答（出力情報ＯＭ１１）の音声を出力する。なお、端末装置２０は、出力情報ＯＭ１１により音声の出力が可能である場合、出力情報ＯＭ１１を用いて、通常情報ＮＭ１１や未来情報ＦＭ１１を含む応答（出力情報ＯＭ１１）の音声を出力してもよい。

〔６．効果〕
上述してきたように、実施形態に係る対話決定システム１は、取得部１３１と、決定部１３５とを有する。取得部１３１は、対話システム（実施形態においては、「対話決定システム１」。以下同じ）以外のシステム（実施形態においては、「外部システム５」。以下同じ）からユーザに関する行動情報（実施形態においては、「利用情報」。以下同じ）を取得する。また、決定部１３５は、取得部１３１により取得されたユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。

これにより、実施形態に係る対話決定システム１は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。これにより、対話決定システム１は、ユーザの発話の意図を総合的に判断して出力を決定することができる。したがって、対話決定システム１は、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る対話決定システム１において、決定部１３５は、ユーザに関する行動情報に基づいてユーザが関心を示すと推定される未来のイベントに関する情報を、対話システムにおける出力として決定する。

これにより、実施形態に係る対話決定システム１は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報から未来のイベントに関する情報を抽出し、抽出した未来のイベントに関する情報を対話システムにおける出力として決定する。これにより、対話決定システム１は、各ユーザが関心を示す可能性の高い未来イベントに関する情報を、ユーザに対して出力することができる。したがって、対話決定システム１は、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る対話決定システム１において、決定部１３５は、未来のイベントが開始される日時がユーザに対して出力を行う日時から未来に向かって所定期間内である場合、未来のイベントに関する情報を、対話システムにおける出力として決定する。

これにより、実施形態に係る対話決定システム１は、未来のイベントが開始される日時がユーザに対して出力を行う日時から未来に向かって所定期間内である場合、未来のイベントに関する情報を対話システムにおける出力として決定する。例えば、対話決定システム１は、未来のイベントが開始される日時がユーザに対して出力を行う日時に近い未来のイベントに関する情報を、対話システムにおける出力として決定する。そのため、対話決定システム１は、各ユーザが関心を示す可能性の高い未来イベントに関する情報を、ユーザに対して出力することができる。したがって、対話決定システム１は、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る対話決定システム１は、更新部１３８を有する。更新部１３８は、ユーザに関する行動情報に基づいて前記ユーザが関心を示すと推定される未来のイベントに関する情報により、記憶部（実施形態においては、「ユーザ情報記憶部１２１）。以下同じ」に記憶されたユーザの嗜好に関する情報を更新する。

これにより、実施形態に係る対話決定システム１は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報に基づいて未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を更新する。これにより、対話決定システム１は、各ユーザが関心を示す可能性の高い未来イベントに関する情報を、ユーザに対応付けて記憶することができる。また、対話決定システム１は、未来イベント情報記憶部１２２に記憶された未来イベントに関する情報を用いることにより、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る対話決定システム１において、決定部１３５は、未来のイベントに関する情報が出力されたユーザの対話システムにおける応答に関する情報に基づいて、対話システムにおけるユーザに対する出力を決定する。

これにより、実施形態に係る対話決定システム１は、未来のイベントに関する情報が出力されたユーザの対話システムにおける応答に関する情報に基づくことにより、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る対話決定システム１において、決定部１３５は、応答に関する情報を用いた学習により生成されるモデルに基づいて、対話システムにおけるユーザに対する出力を決定する。

これにより、実施形態に係る対話決定システム１は、応答に関する情報を用いた学習により生成されるモデルに基づくことにより、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る対話決定システム１において、決定部１３５は、ユーザに対する出力として、ユーザの入力に対応する文字情報に応答する文字情報である応答文字情報を決定する。

これにより、実施形態に係る対話決定システム１は、対話システムにおける出力として、ユーザの入力に対応する文字情報に応答する文字情報である応答文字情報を適切に決定することができる。

また、実施形態に係る対話決定システム１において、決定部１３５は、対話システムにおけるユーザの入力が回答を求める情報であった場合、ユーザに対する出力として、応答文字情報に続けて出力される文字情報であって、応答文字情報に関連する未来のイベントに関する文字情報を決定する。

これにより、実施形態に係る対話決定システム１は、ユーザの入力に対して回答した後に続けて、未来のイベントに関する情報を出力することにより、ユーザに対して違和感のない流れで、未来のイベントに関する情報を出力することができる。したがって、対話決定システム１は、対話システムにおける出力を適切に決定することができる。

また、実施形態に係る端末装置２０は、取得部と、決定部とを有する。取得部は、対話システム以外のシステムからユーザに関する行動情報を取得する。また、決定部は、取得部により取得されたユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。

これにより、実施形態に係る端末装置２０は、対話決定システム１以外の外部システム５から取得したユーザに関する行動情報に基づいて、対話システムにおけるユーザに対する出力を決定する。これにより、端末装置２０は、ユーザの発話の意図を総合的に判断して出力を決定することができる。したがって、端末装置２０は、対話システムにおける出力を適切に決定することができる。

〔７．ハードウェア構成〕
上述してきた実施形態に係る応答生成サーバ１００及び端末装置２０は、例えば図１１に示すような構成のコンピュータ１０００によって実現される。図１１は、応答生成サーバ及び端末装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る応答生成サーバ１００や端末装置２０として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０やアプリ２５の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

以上、本願の実施形態及び変形例のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔８．その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、受付部は、受付手段や受付回路に読み替えることができる。

１対話決定システム（対話システム）
１００応答生成サーバ
１２１ユーザ情報記憶部
１２２未来イベント情報記憶部
１２３話題情報記憶部
１３０制御部
１３１取得部
１３２要求生成部
１３３変換部
１３４抽出部
１３５決定部
１３６音声合成指示部
１３７応答生成部
１３８更新部
１３９送信部
２０端末装置
３０音声認識サーバ
４０音声合成サーバ
Ｎネットワーク

Claims

対話システム以外のシステムからユーザに関する行動情報を取得する取得部と、
前記取得部により取得された前記ユーザに関する行動情報に基づいて、前記対話システムにおける前記ユーザに対する出力を決定する決定部と、
を備えることを特徴とする対話決定システム。
前記決定部は、
前記ユーザに関する行動情報に基づいて前記ユーザが関心を示すと推定される未来のイベントに関する情報を、前記対話システムにおける出力として決定する
ことを特徴とする請求項１に記載の対話決定システム。
前記決定部は、
前記未来のイベントが開始される日時が前記ユーザに対して出力を行う日時から未来に向かって所定期間内である場合、前記未来のイベントに関する情報を、前記対話システムにおける出力として決定する
ことを特徴とする請求項２に記載の対話決定システム。
前記ユーザに関する行動情報に基づいて前記ユーザが関心を示すと推定される未来のイベントに関する情報により、記憶部に記憶された前記ユーザの嗜好に関する情報を更新する更新部、
ことを特徴とする請求項２または請求項３に記載の対話決定システム。
前記決定部は、
未来のイベントに関する情報が出力されたユーザの前記対話システムにおける応答に関する情報に基づいて、前記対話システムにおける前記ユーザに対する出力を決定する
ことを特徴とする請求項１〜４のいずれか１項に記載の対話決定システム。
前記決定部は、
前記応答に関する情報を用いた学習により生成されるモデルに基づいて、前記対話システムにおける前記ユーザに対する出力を決定する
ことを特徴とする請求項５に記載の対話決定システム。
前記決定部は、
前記ユーザに対する出力として、前記ユーザの入力に対応する文字情報に応答する文字情報である応答文字情報を決定する
ことを特徴とする請求項１〜６のいずれか１項に記載の対話決定システム。
前記決定部は、
前記対話システムにおける前記ユーザの入力が回答を求める情報であった場合、前記ユーザに対する出力として、前記応答文字情報に続けて出力される文字情報であって、前記応答文字情報に関連する未来のイベントに関する文字情報を決定する
ことを特徴とする請求項７に記載の対話決定システム。
コンピュータが実行する対話決定方法であって、
対話システム以外のシステムからユーザに関する行動情報を取得する取得工程と、
前記取得工程により取得された前記ユーザに関する行動情報に基づいて、前記対話システムにおける前記ユーザに対する出力を決定する決定工程と、
を含むことを特徴とする対話決定方法。
対話システム以外のシステムからユーザに関する行動情報を取得する取得手順と、
前記取得手順により取得された前記ユーザに関する行動情報に基づいて、前記対話システムにおける前記ユーザに対する出力を決定する決定手順と、
をコンピュータに実行させることを特徴とする対話決定プログラム。
対話システム以外のシステムからユーザに関する行動情報を取得する取得部と、
前記取得部により取得された前記ユーザに関する行動情報に基づいて、前記対話システムにおける前記ユーザに対する出力を決定する決定部と、
を備えることを特徴とする端末装置。