JP2021039677A

JP2021039677A - 情報処理方法、プログラム及び情報処理装置

Info

Publication number: JP2021039677A
Application number: JP2019162215A
Authority: JP
Inventors: 秀樹木通; Hideki Kidooshi; 香苗沢村; Kanae Sawamura
Original assignee: Japan Research Institute Ltd
Current assignee: Japan Research Institute Ltd
Priority date: 2019-09-05
Filing date: 2019-09-05
Publication date: 2021-03-11
Anticipated expiration: 2039-09-05
Also published as: JP7360855B2

Abstract

【課題】ユーザの孤独感又は不安等を和らげることが可能な情報処理方法等を提供する。【解決手段】コンピュータは、第１ユーザの対話履歴情報に基づいて学習された第１の学習モデルを記憶部に記憶する。コンピュータは、第１の学習モデルのデプロイが可能な情報処理装置に対する指定を受け付け、指定された情報処理装置に対して、記憶部に記憶してある第１の学習モデルをデプロイする。これにより、第１の学習モデルをデプロイされた情報処理装置を、デプロイされた第１の学習モデルに基づいて動作させることができる。【選択図】図１

Description

本開示は、情報処理方法、プログラム及び情報処理装置に関する。

近年、一人暮らしをする高齢者及び単身で施設に入居する高齢者が増加しており、このような高齢者は日常生活において会話の機会が少なく孤立感を感じる人もいる。そこで、例えば特許文献１では、ユーザが発した音声を取得した場合に、予め記憶してある音声を出力することにより、擬似的な会話を行うことができるぬいぐるみが提案されている。特許文献１に開示された技術では、ユーザがぬいぐるみを抱きながらぬいぐるみと擬似的な会話を行うことにより、ユーザに癒しを与えることができ、孤立感を和らげることができる。

特開２０１８−１１７８２１号公報

高齢者に限らず一人暮らしをする人は、例えば自宅に一人で居る場合に会話する相手がいないので、孤独感又は不安を感じるときもある。また、例えば家族又は同居人と暮らす人であっても、自室に一人で居る場合には孤独感又は不安を感じるときもある。しかし、特許文献１に開示された技術は高齢者を対象としており、孤独感又は不安を感じる全ての人に癒しを与えることは難しい。

本開示は、斯かる事情に鑑みてなされたものであり、その目的とするところは、ユーザの孤独感又は不安を和らげることが可能な情報処理方法等を提供することにある。

本開示に係る情報処理方法は、第１ユーザの対話履歴情報に基づいて学習された第１の学習モデルを記憶部に記憶し、前記第１の学習モデルのデプロイが可能な情報処理装置に対する指定を受け付け、指定された前記情報処理装置に対して前記第１の学習モデルをデプロイし、前記第１の学習モデルをデプロイされた前記情報処理装置は、デプロイされた前記第１の学習モデルに基づいて動作する。

本開示では、第１ユーザの対話履歴情報に基づいて学習された第１の学習モデルが、指定された情報処理装置に対してデプロイされる。これにより、情報処理装置は、第１の学習モデルに基づく処理の実行が可能となる。例えば情報処理装置は、第１の学習モデルに基づいて、情報処理装置のユーザとの間で対話を行うことができる。具体的には、情報処理装置のユーザからの対話情報を第１の学習モデルに入力し、第１の学習モデルからの出力情報に基づいて応答情報を生成して情報処理装置のユーザに出力する。よって、情報処理装置のユーザは、情報処理装置との間で対話を行うことができ、ユーザの孤独感又は不安等を和らげることができる。また、第１の学習モデルが、第１ユーザとは異なるユーザの情報処理装置にデプロイされた場合、デプロイされた情報処理装置において、この情報処理装置のユーザ（第１ユーザとは異なるユーザ）との間で対話を行うことができる。なお、第１ユーザとは異なるユーザの情報処理装置で行われた対話の結果を第１ユーザにフィードバックした場合、第１ユーザは自身が行っていない対話を擬似的に体験することができる。よって、ユーザは、自身の学習モデルを介した擬似的な体験を通して、新たな気づきを得て精神的により豊かな生活を送ることができるようになったり、現実の接点の拡大によって実際の行動変化を引き起こしたりすることにより、社会とのつながりを感じることができ、ユーザの孤独感又は不安等を和らげることができる。

情報処理システムの構成例を示す模式図である。ユーザ端末の構成例を示すブロック図である。ユーザモデルの変形例を示すブロック図である。ユーザ端末に記憶されるＤＢの構成例を示す模式図である。ユーザ端末による対話処理手順の一例を示すフローチャートである。ユーザ端末における画面例を示す模式図である。ユーザ端末による行動処理手順の一例を示すフローチャートである。ユーザ端末による対話処理手順の一例を示すフローチャートである。ユーザ端末による対話処理手順の一例を示すフローチャートである。ユーザ端末における画面例を示す模式図である。ユーザ端末による対話処理手順の一例を示すフローチャートである。ユーザ端末による行動処理手順の一例を示すフローチャートである。ユーザ端末による行動処理手順の一例を示すフローチャートである。履歴情報の再生処理手順の一例を示すフローチャートである。ユーザ端末における画面例を示す模式図である。実施形態２の情報処理システムの構成例を示すブロック図である。モデル情報ＤＢの構成例を示す模式図である。貸出モデルの貸出処理手順の一例を示すフローチャートである。ユーザ端末における画面例を示す模式図である。実施形態３の情報処理システムの構成例を示すブロック図である。貸出端末の構成例を示すブロック図である。端末管理サーバの構成例を示す模式図である。端末管理サーバに記憶されるＤＢの構成例を示す模式図である。貸出端末の貸出に対する予約処理手順の一例を示すフローチャートである。ユーザ端末における画面例を示す模式図である。貸出端末の貸出処理手順の一例を示すフローチャートである。貸出端末の貸出処理手順の一例を示すフローチャートである。ユーザ端末及び貸出端末の構成の変形例を示す模式図である。

以下に、本開示の情報処理方法、情報処理装置、プログラム及び情報処理システムについて、その実施形態を示す図面に基づいて詳述する。

（実施形態１）
図１は情報処理システムの構成例を示す模式図である。本実施形態の情報処理システムは、多数のユーザがそれぞれ所有する多数のユーザ端末１０（情報処理装置）を含み、ユーザ端末１０のそれぞれは、インターネット等のネットワークＮを介して相互に情報の送受信を行う。例えば第１ユーザは自身の自宅に第１ユーザ端末１０を所有しており、第２ユーザは自身の自宅に第２ユーザ端末１０を所有しているが、第１ユーザ端末１０及び第２ユーザ端末１０の設置場所は自宅に限定されない。なお、第１ユーザ端末１０及び第２ユーザ端末１０は同様の構成を有しており、まとめてユーザ端末１０として説明する。ユーザ端末１０は、例えば情報処理システムに用いられる専用端末であり、例えばパーソナルコンピュータを用いて構成されている。なお、ユーザ端末１０の外観は様々な形状に形成することができ、例えば図１に示す第１ユーザのユーザ端末１０のような筐型、図１に示す第２ユーザのユーザ端末１０のようなロボット型等に形成されていてもよい。

図１に示す第１ユーザのユーザ端末１０は、例えば四角柱状の筐体１０ｂの一面（図１では上面）に、ミラー１０ａが枢軸（図示せず）により回動可能に取り付けられて構成されている。枢軸は筐体１０ｂの上面の一辺に沿う軸であり、ミラー１０ａは、筐体１０ｂの上面を覆う位置（閉位置）と、筐体１０ｂの上面から立ち上がった位置（開位置）との間で回動可能に支持されている。図１ではミラー１０ａが開位置にある状態のユーザ端末１０を示す。ミラー１０ａは閉位置にある場合に外面（上面）が反射面となるように取り付けられており、ミラー１０ａには表示部１６が内蔵されている。このような構成のユーザ端末１０では、ミラー１０ａによる反射面と、表示部１６による表示面とが切り替えられるように構成されており、例えば表示部１６が動作していないときは、ミラー１０ａの反射面が鏡として使用できる。また、図１に示す第１ユーザのユーザ端末１０は、例えばミラー１０ａの所定箇所にカメラ１９が設けられており、筐体１０ｂの適宜箇所にスピーカ１７及びマイク１８が設けられている。図１に示す例では、ミラー１０ａが開位置にある場合にミラー１０ａの上端部の位置にカメラ１９が設けてあり、筐体１０ｂの上面にスピーカ１７及びマイク１８が設けてあるが、これらの配置位置はこの例に限定されない。例えばカメラ１９は、ミラー１０ａが開位置にある場合に、ミラー１０ａの前方向に居るユーザを撮影できる位置に設けてあればよく、スピーカ１７は、ユーザ端末１０の近傍のユーザに出力音声が届く位置に設けてあればよく、マイク１８は、ユーザ端末１０の近傍のユーザが発する音声を集音できる位置に設けてあればよい。更に、図１に示す第１ユーザのユーザ端末１０は、筐体１０ｂの下面（底面）に複数のタイヤ２０ａが設けられており、移動機構２０（図２参照）によってタイヤ２０ａを回転させることにより自動走行できるように構成されている。

図１に示す第２ユーザのユーザ端末１０は、例えば円柱状の胴体部１０ｄの上に頭部１０ｃが連結されて構成されている。また、図１に示す第２ユーザのユーザ端末１０は、例えば頭部１０ｃの適宜箇所にカメラ１９、表示部１６、スピーカ１７が設けられており、胴体部１０ｄの適宜箇所にマイク１８が設けられている。図１に示す例では、頭部１０ｃの中央に表示部１６が設けてあり、表示部１６の上部及び下部にそれぞれカメラ１９及びスピーカ１７が設けてあり、胴体部１０ｄの上方位置にマイク１８が設けてあるが、これらの配置位置はこの例に限定されない。例えば表示部１６及びカメラ１９は、ユーザ端末１０の同一面（例えば正面側の面）に設けられ、表示部１６は、ユーザ端末１０の正面に居るユーザが視認できる位置に設けてあればよく、カメラ１９は、ユーザを撮影できる位置に設けてあればよい。またスピーカ１７は、ユーザ端末１０の近傍のユーザに出力音声が届く位置に設けてあればよく、マイク１８は、ユーザ端末１０の近傍のユーザが発する音声を集音できる位置に設けてあればよい。更に、図１に示す第２ユーザのユーザ端末１０は、胴体部１０ｄの下面（底面）に複数のタイヤ２０ａが設けられており、移動機構２０（図２参照）によってタイヤ２０ａを回転させることにより自動走行できるように構成されている。なお、図１に示す第２ユーザのユーザ端末１０は、頭部１０ｃが胴体部１０ｄに対して鉛直方向を軸として回転するように、また、頭部１０ｃが水平面に対して適宜角度揺動するように首振り機構を有していてもよい。

本実施形態では、ユーザ端末１０を、図１に示すような外観の専用端末として説明するが、ユーザ端末１０は、表示部１６、スピーカ１７、マイク１８及びカメラ１９を有する端末であれば専用端末でなくてもよい。例えばユーザ端末１０は移動機構２０を備えていなくてもよく、例えばスマートフォン又はタブレット端末等を用いてユーザ端末１０を構成することもできる。本実施形態の情報処理システムにおいて、各ユーザ端末１０は、各ユーザの言動（対話履歴情報及び行動履歴情報）に基づいて各ユーザの固有の情報が蓄積されたユーザモデルを構築しており、それぞれのユーザモデルに基づく各種の処理を実行する。なお、各ユーザ端末１０には各ユーザに対応するアバターが設定してあり、各ユーザ端末１０は、自端末のユーザモデルに基づく処理を実行する際に、必要に応じてアバターを用いる。

図２はユーザ端末１０の構成例を示すブロック図である。ユーザ端末１０は、制御部１１、記憶部１２、処理部１３、通信部１４、入力部１５、表示部１６、スピーカ１７、マイク１８、カメラ１９、移動機構２０、センサ部２１、読み取り部２２等を含み、これらの各部はバスを介して相互に接続されている。制御部１１は、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）又はＧＰＵ（Graphics Processing Unit）等の１又は複数のプロセッサを含む。制御部１１は、記憶部１２に記憶してある制御プログラム１２Ｐを適宜実行することにより、ユーザ端末１０が行うべき種々の情報処理、制御処理等を実行する。

記憶部１２は、ＲＡＭ（Random Access Memory）、フラッシュメモリ、ハードディスク、ＳＳＤ（Solid State Drive）等を含む。記憶部１２は、制御部１１が実行する制御プログラム１２Ｐ及び制御プログラム１２Ｐの実行に必要な各種のデータ等を予め記憶している。また記憶部１２は、制御部１１が制御プログラム１２Ｐを実行する際に発生するデータ等を一時的に記憶する。また記憶部１２は、ユーザ端末１０のユーザの対話履歴及び行動履歴に基づいて収集されたユーザ固有の情報が蓄積されたユーザモデル１２Ｍを記憶する。更に記憶部１２は、後述する宛先情報ＤＢ（データベース）１２ａ、対話履歴ＤＢ１２ｂ及び行動履歴ＤＢ１２ｃを記憶する。宛先情報ＤＢ１２ａ、対話履歴ＤＢ１２ｂ及び行動履歴ＤＢ１２ｃは、ユーザ端末１０に接続された外部記憶装置に記憶されてもよく、ユーザ端末１０が通信可能な外部記憶装置に記憶されてもよい。更に記憶部１２は、ユーザ端末１０のユーザに対応付けて設定されたアバターに関する情報（アバター情報）を記憶する。アバターに関する情報は、アバターを表示するための画像データ、アバターに発話させる際の音声データ、アバターの表示画像に動きを付加するためのモーションデータ等を含む。

ユーザモデル１２Ｍは、例えば深層学習アルゴリズムを用いて学習されたディープラーニングモデルであり、例えばＲＮＮ（Recurrent Neural Network）を用いたSeq2Seq（Sequence to Sequence）モデル、ＣＮＮ（Convolution Neural Network）モデルで構成されている。なお、ユーザモデル１２Ｍは、これらのモデルを用いて構築される構成に限定されず、各種のＤＮＮ（Deep Neural Network ）モデルを用いて構成できる。ユーザモデル１２Ｍは、ユーザ端末１０のユーザの対話履歴及び行動履歴に基づいて学習された学習済みモデルである。具体的には、ユーザモデル１２Ｍは、ユーザに対して提示した対話情報と、提示した対話情報に対してユーザが返答した返答情報とを含む対話履歴情報を教師データに用いて、対話情報が入力された場合に、入力された対話情報に対応する返答情報を出力するように学習されている。このような教師データは、例えばスピーカ１７又は表示部１６を介してユーザに対して所定の対話情報を提示した場合に、提示した対話情報に対してユーザが返答した返答情報をマイク１８又は入力部１５を介して取得することにより得られる。このように得られた教師データを用いてユーザモデル１２Ｍを学習させることにより、ユーザに関する情報、ユーザが返答する可能性の高い対話情報等を出力できるユーザモデル１２Ｍを生成できる。具体的には、例えば「お名前は？」の対話情報を提示したときに、ユーザが「○○○○です」の返答情報を返した場合、ユーザの返答情報からユーザの名前は「○○○○」であるとの教師データが得られ、このような教師データを用いることにより、ユーザモデル１２Ｍに、ユーザの氏名（ユーザ固有情報）が「○○○○」であることを学習させることができる。また、「何かあったの？」の対話情報を提示したときに、ユーザが「今日、お父さんと喧嘩したよ」の返答情報を返した場合、ユーザの返答情報から、ユーザの最近の出来事として「今日お父さんと喧嘩した」との教師データが得られ、このような教師データを用いることにより、ユーザモデル１２Ｍに、ユーザの最近の出来事の情報（ユーザ固有情報）を学習させることができる。更に、「今日どこ行ったの？」の対話情報を提示したときに、ユーザが「○○の映画を観たよ」の返答情報を返した場合、ユーザの返答情報から、ユーザが最近観た映画が「○○」であるとの教師データが得られ、このような教師データを用いることにより、ユーザモデル１２Ｍに、ユーザが最近観た映画の情報（ユーザ固有情報）を学習させることができる。また例えば「おはよう」の対話情報を提示したときに、ユーザが「おはようございます」の返答情報を返した場合、ユーザの返答情報からユーザは「おはよう」の対話情報に対して「おはようございます」と返答するとの教師データが得られ、このような教師データを用いることにより、ユーザモデル１２Ｍに、ユーザの朝の挨拶は「おはようございます」であることを学習させることができる。

また、ユーザ端末１０にインストールされている各種のアプリケーションプログラムによって実行される処理に係る情報から対話履歴情報を収集してもよい。例えばユーザ（ユーザ端末１０）が電子メール、ＬＩＮＥ（登録商標）メッセージ、ＬＩＮＥスタンプ、ＳＮＳ（Social Network Service）等を介して他のユーザ（他のユーザ端末１０）からの対話情報を受信したときに、この対話情報に対してユーザ（ユーザ端末１０）が他のユーザ（他のユーザ端末１０）へ返答情報を返信した場合、この対話情報及び返答情報を含む対話履歴情報を教師データに用いてもよい。また、ユーザ（ユーザ端末１０）がＳＮＳを介してメッセージを閲覧したときに、閲覧したメッセージに対してメッセージを投稿（返信）した場合、閲覧したメッセージ及び投稿したメッセージを含む対話履歴情報を教師データに用いてもよい。このようにネットワークＮを介して提供される各種サービスによって送受信されるデータ等から対話履歴情報を収集して教師データに用いてもよい。

また、ユーザモデル１２Ｍは、ユーザに対して行われたアクションに関する情報（行動情報）と、このアクションに対してユーザが行った行動情報（反応情報）とを含む行動履歴情報を教師データに用いて、行動情報が入力された場合に、入力された行動情報に対応する反応情報を出力するように学習されている。このような教師データは、例えば、ユーザがＬＩＮＥメッセージを受信したときに所定のＬＩＮＥスタンプ又はＬＩＮＥメッセージを返信した場合、ＬＩＮＥメッセージの受信を行動情報とし、所定のＬＩＮＥスタンプ又はＬＩＮＥメッセージの返信を反応情報とすることにより得られる。また例えば、ユーザが電子メール、ＬＩＮＥメッセージ、ＳＮＳ等を介して会議のスケジュールに関する情報を受信したときに、その後、ユーザ端末１０を用いて会議室の使用を予約するための予約アプリ（アプリケーションプログラム）を実行して会議室の予約を行ったとする。この場合、会議のスケジュールに関する情報の受信を行動情報とし、予約アプリを用いた会議室の予約を反応情報とすることによって教師データを取得してもよい。また、ユーザが電子メール、ＬＩＮＥメッセージ、ＳＮＳ等を介して食事のお誘いに関するメッセージを受信したときに、その後、ユーザ端末１０を用いてレストランの予約サイトを介したレストランの予約を行ったとする。この場合、食事のお誘いに関するメッセージの受信を行動情報とし、レストランの予約サイトにアクセスするためのブラウザの起動を反応情報とすることによって教師データを取得してもよい。また、ユーザがネットワークＮ上の旅行の予約サイトを介して旅行の予約を行ったときに、その後、ユーザ端末１０を用いてレストランの予約サイトを介したレストランの予約、又はオプショナルツアーの予約サイトを介したオプショナルツアーの申込を行ったとする。この場合、旅行の予約サイトを介した旅行の予約を行動情報とし、レストランの予約サイト又はオプショナルツアーの予約サイトにアクセスするためのブラウザの起動を反応情報とすることによって教師データを取得してもよい。更に、ユーザが例えば書籍販売サイトから書籍に関する広告情報を受信したときに、その後、ユーザ端末１０を用いて書籍販売サイトを介して書籍の購買注文を行ったとする。この場合、書籍の広告情報の受信を行動情報とし、書籍販売サイトにアクセスするためのブラウザの起動を反応情報とすることによって教師データを取得してもよい。

また、例えばユーザが草花を見たときに写真を撮った場合、草花を見る行動を行動情報とし、写真の撮影を反応情報とすることによって教師データを取得してもよい。また、例えばユーザが自動車の運転を開始する際にユーザ端末１０を用いて音楽の再生を行った場合、自動車の運転を行動情報とし、音楽の再生を反応情報とすることによって教師データを取得してもよい。また、例えばユーザがジョギングを開始する際にユーザ端末１０を用いて音楽の再生を行った場合、ジョギングを行動情報とし、音楽の再生を反応情報とすることによって教師データを取得してもよい。更に、例えばユーザがジョギングを行い、その後、ユーザ端末１０を用いて健康管理アプリを起動して走行時間又は走行距離の入力を行った場合、ジョギングを行動情報とし、健康管理アプリの起動を反応情報とすることによって教師データを取得してもよい。また、例えばユーザが東京駅又は空港等の所定場所に到着した場合に、ユーザ端末１０を用いて交通機関の経路検索アプリを起動して目的地までの経路検索を行った場合、所定場所への到着を行動情報とし、経路検索アプリの起動を反応情報とすることによって教師データを取得してもよい。

上述したような教師データは、例えばユーザが何らかの行動を行っている際に、ユーザ端末１０のカメラ１９、マイク１８及びセンサ部２１を用いてユーザの撮影画像、音声データ及び動作情報を取得し、取得した撮影画像、音声データ及び動作情報に基づいてユーザの行動に係る行動情報及び反応情報を取得することにより得られる。例えば、ユーザが草花の写真を撮っている状況の撮影画像を取得した場合、撮影画像から、ユーザが草花を見たときに写真を撮ることを示す教師データ（草花を見る行動を行動情報とし、写真の撮影を反応情報とする教師データ）を取得できる。また、ユーザが音楽を聴きながら自動車の運転を行っている状況の撮影画像及び音声データを取得した場合、撮影画像及び音声データから、ユーザが自動車を運転するときに音楽を再生することを示す教師データ（自動車の運転を行動情報とし、音楽の再生を反応情報とする教師データ）を取得できる。更に、ユーザが音楽を聴きながらジョギングをしている状況の撮影画像、音声データ及び動作情報を取得した場合、撮影画像、音声データ及び動作情報から、ユーザがジョギングするときに音楽を再生することを示す教師データ（ジョギングを行動情報とし、音楽の再生を反応情報とする教師データ）を取得できる。

上述したような教師データを用いてユーザモデル１２Ｍを学習させることにより、ユーザに対して何らかのアクションが行われた場合にユーザが反応する可能性の高い反応情報（行動情報）又はユーザが返答する可能性の高い対話情報等を出力できるユーザモデル１２Ｍを生成できる。また、ユーザがある行動を行った場合に次に行う可能性の高い行動内容又は対話内容を出力できるユーザモデル１２Ｍを生成できる。ユーザモデル１２Ｍは、上述したようにユーザの対話履歴情報及び行動履歴情報に基づいてユーザに関する各種の情報を収集（学習）し、ユーザの個人情報、趣味、好み、行動履歴、行動傾向、思考傾向等、ユーザに関する様々な情報を蓄積する。なお、学習済みモデルは、入力値に対して所定の演算を行い、演算結果を出力するものであり、この演算を規定する関数の係数や閾値等のデータが、ユーザモデル１２Ｍとして記憶部１２に記憶される。

ユーザモデル１２Ｍは、各ユーザのユーザ端末１０において学習が行われてもよく、他の学習装置において学習された後に各ユーザのユーザ端末１０の記憶部１２に記憶されてもよい。ユーザモデル１２Ｍは、教師データに含まれる対話情報が入力された場合に、教師データに含まれる返答情報が出力されるように学習する。またユーザモデル１２Ｍは、教師データに含まれる行動情報が入力された場合に、教師データに含まれる反応情報が出力されるように学習する。なお、学習処理において、ユーザモデル１２Ｍは、入力データに対して行う所定の演算を規定する関数の係数や閾値等のデータを最適化する。これにより、入力された対話情報又は行動情報に基づいて、ユーザ端末１０のユーザが行う可能性の高い返答情報又は反応情報を出力するように学習されたユーザモデル１２Ｍを生成できる。本実施形態のユーザ端末１０は、上述したように自端末のユーザの対話履歴及び行動履歴に基づいて構築されたユーザモデル１２Ｍに基づく処理を行うことにより、ユーザが行う可能性の高い対話及び行動をユーザに代わって実現するように構成されている。

図３は、ユーザモデル１２Ｍの変形例を示すブロック図である。ユーザモデル１２Ｍは、例えば図３に示すように複数種類の学習モデルを用いて構成されていてもよい。図３に示すユーザモデル１２Ｍは、対話用ユーザモデル１２Ｍ１及び行動用ユーザモデル１２Ｍ２を有し、行動用ユーザモデル１２Ｍ２は更に画像判別モデル１２Ｍ３、音声判別モデル１２Ｍ４及びセンサ出力判別モデル１２Ｍ５を有する。対話用ユーザモデル１２Ｍ１は、例えばSeq2Seqモデルで構成されており、ユーザ端末１０のマイク１８又は入力部１５を介して取得されたユーザからの対話情報が入力された場合に、この対話情報に対応する返答情報を出力する。また、行動用ユーザモデル１２Ｍ２の画像判別モデル１２Ｍ３は、例えばＣＮＮモデルで構成されており、ユーザ端末１０のカメラ１９で撮影したユーザの撮影画像が入力された場合に、この撮影画像に対応する対話情報又は行動情報を出力する。ここでは、画像判別モデル１２Ｍ３は、撮影されたユーザの行動内容に対応してユーザ端末１０が行うべき対話情報又は行動情報を出力する。また、行動用ユーザモデル１２Ｍ２の音声判別モデル１２Ｍ４は、例えばＲＮＮモデル又はＤＮＮモデルで構成されており、ユーザ端末１０のマイク１８で集音したユーザの音声データが入力された場合に、この音声データに対応する対話情報又は行動情報を出力する。ここでは、音声判別モデル１２Ｍ４は、集音されたユーザの発話内容に対応してユーザ端末１０が行うべき対話情報又は行動情報を出力する。更に、行動用ユーザモデル１２Ｍ２のセンサ出力判別モデル１２Ｍ５は、例えばＲＮＮモデルで構成されており、ユーザ端末１０のセンサ部２１が検知したユーザの動作に係る動作情報（センサからの出力信号）が入力された場合に、このセンサからの出力信号に対応する対話情報又は行動情報を出力する。ここでは、センサ出力判別モデル１２Ｍ５は、検知されたユーザの動作内容に対応してユーザ端末１０が行うべき対話情報又は行動情報を出力する。上述した構成のユーザモデル１２Ｍを用いることにより、ユーザからの対話情報又はユーザの行動情報に対応してユーザ端末１０が行うべき対話情報又は行動情報を決定できる。

処理部１３は、対話処理部１３ａ及び行動処理部１３ｂ等を含む。処理部１３の各部は、例えば記憶部１２に記憶してある制御プログラム１２Ｐを制御部１１が実行することによって実現されてもよいし、これらの一部を専用のハードウェア回路で実現してもよい。対話処理部１３ａは、例えばユーザ端末１０のユーザからの指示又はユーザモデル１２Ｍに基づいて対話処理を行う。対話処理部１３ａは、例えばユーザ端末１０のユーザとの対話を行い、この場合、マイク１８を介した音声入力又は入力部１５を介した入力（例えばテキスト入力）によってユーザからの対話情報（発話情報）を取得し、取得した対話情報に対する対話情報（返答情報）を生成し、生成した返答情報をスピーカ１７を介した音声出力又は表示部１６に表示することによってユーザに応答する。これにより、対話処理部１３ａはユーザ端末１０のユーザとの対話を行うことができる。なお、対話処理部１３ａはユーザからの発話情報に対する返答情報を生成する際にユーザモデル１２Ｍを用いることにより、ユーザが返答する可能性の高い対話（返答）を実現できる。具体的には、対話処理部１３ａは、ユーザからの発話情報を取得した場合に、取得した発話情報をユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍから出力される、前記発話情報に対する返答情報を取得し、取得した返答情報を出力する。

なお、対話処理部１３ａは、ユーザからの発話情報に対して行うべき返答情報を予めテンプレートとして複数記憶しておき、ユーザからの発話情報に応じた返答情報をテンプレートから選択して出力することによりユーザとの対話を行ってもよい。また対話処理部１３ａは、挨拶メッセージ及び質問メッセージ等の対話情報（発話情報）を予め記憶しておき、発話情報をスピーカ１７を介した音声出力又は表示部１６に表示することによってユーザに話しかけ、マイク１８を介した音声入力又は入力部１５を介した入力によってユーザからの返答情報を取得することによりユーザとの対話を行ってもよい。この場合、対話処理部１３ａは、挨拶メッセージ及び質問メッセージ等の対話情報を予めテンプレートとして複数記憶しておき、任意のテンプレートを選択して出力することにより、ユーザに話しかけてもよい。

なお、本実施形態では、第１ユーザのユーザモデル１２Ｍ（第１ユーザモデル１２Ｍ、第１の学習モデル）が、第２ユーザの第２ユーザ端末１０に送信されて第２ユーザ端末１０にデプロイされることにより、第２ユーザ端末１０が第１ユーザモデル１２Ｍに基づく処理を実行できるように構成されている。即ち、第２ユーザ端末１０が第１ユーザモデル１２Ｍに基づく処理を行うことにより、第２ユーザ端末１０において、第１ユーザが行う可能性の高い対話を実現できる。この場合、第２ユーザは、第２ユーザ端末１０を介して擬似的な第１ユーザ（第１ユーザモデル１２Ｍ）との対話を行うことができる。なお、第１ユーザモデル１２Ｍが第２ユーザ端末１０にデプロイされた場合、第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づく処理を終了するまで（第１ユーザモデル１２Ｍがアンデプロイされるまで）、第２ユーザ端末１０のハードウェア各部を、第１ユーザモデル１２Ｍに基づく処理によって占有されるように構成されている。即ち、複数のユーザモデル１２Ｍが同時に１つのユーザ端末１０にデプロイすることはできない。具体的には、第２ユーザ端末１０において、第１ユーザモデル１２Ｍがデプロイされた場合、第２ユーザの第２ユーザモデル１２Ｍ（第２の学習モデル）に基づく処理の実行（動作）が禁止される。なお、第２ユーザ端末１０において、第１ユーザモデル１２Ｍがアンデプロイされた場合、制御部１１は、第２ユーザモデル１２Ｍに基づく処理の実行を再開する。第２ユーザモデル１２Ｍに基づく処理の禁止は、例えば第２ユーザモデル１２Ｍを記憶部１２の所定の退避領域に移動させることによって行われてもよく、この場合、処理の再開は、第２ユーザモデル１２Ｍを記憶部１２の所定領域に戻すことによって行うことができる。また、第２ユーザモデル１２Ｍへのアクセスを禁止することによって、第２ユーザモデル１２Ｍに基づく処理を禁止してもよく、この場合、第２ユーザモデル１２Ｍへのアクセスを許可することによって、第２ユーザモデル１２Ｍに基づく処理が再開される。更に本実施形態では、第１ユーザの第１ユーザモデル１２Ｍと、第２ユーザの第２ユーザモデル１２Ｍとの間の対話も実現できる。この場合、例えば第１ユーザ端末１０の対話処理部１３ａは、第２ユーザ端末１０から対話情報（発話情報）を受信し、受信した発話情報に対する返答情報を第１ユーザモデル１２Ｍに基づいて特定し、特定した返答情報を第２ユーザ端末１０へ送信する。一方、第２ユーザ端末１０の対話処理部１３ａは、第２ユーザ端末１０から対話情報（発話情報）を受信し、受信した発話情報に対する返答情報を第２ユーザモデル１２Ｍに基づいて特定し、特定した返答情報を第１ユーザ端末１０へ送信する。これにより、第１ユーザ端末１０は第１ユーザモデル１２Ｍに基づく対話を行い、第２ユーザ端末１０は第２ユーザモデル１２Ｍに基づく対話を行うことにより、第１ユーザと第２ユーザとの擬似的な対話を実現できる。

行動処理部１３ｂは、例えばユーザ端末１０のユーザからの指示又はユーザモデル１２Ｍに基づいて行動処理を行う。行動処理部１３ｂは、例えばカメラ１９及びマイク１８を用いて映像及び音声の取得（撮影）を行い、スピーカ１７及び表示部１６を用いて音声及び映像の出力を行い、移動機構２０を用いて任意の場所への移動を行う。行動処理部１３ｂは、ユーザからの指示又はユーザモデル１２Ｍに基づいて、ユーザ端末１０の設置場所において撮影するか否か、音声及び映像を出力するか否か、移動するか否かを判断する。例えば行動処理部１３ｂは、ユーザ端末１０のユーザが、ユーザ端末１０の設置場所において撮影したいと思っているか否かを判断し、撮影したいと思っていると判断した場合、ユーザ端末１０の設置場所において撮影すると判断する。また行動処理部１３ｂは、ユーザ端末１０のユーザが、ユーザ端末１０の設置場所において音声及び映像を出力したいと思っているか否かを判断し、出力したいと思っていると判断した場合、ユーザ端末１０の設置場所において音声及び映像を出力すると判断する。更に行動処理部１３ｂは、ユーザ端末１０のユーザが、ユーザ端末１０の設置場所において移動したいと思っているか否かを判断し、移動したいと思っていると判断した場合、ユーザ端末１０の設置場所において移動すると判断する。そして行動処理部１３ｂは、撮影すると判断した場合、カメラ１９及びマイク１８を用いて撮影を行い、音声及び映像を出力すると判断した場合、スピーカ１７及び表示部１６を用いて出力を行い、移動すると判断した場合、移動機構２０を用いて移動を行う。

また行動処理部１３ｂは、例えばユーザ端末１０のユーザが対話したい他のユーザがいるか否か、ユーザ端末１０の設置場所から離れてユーザ端末１０のユーザが行きたい場所があるか否か、やりたいと思っていることがあるか否か等を特定する。なお、ユーザモデル１２Ｍはユーザの趣味、好み、行動履歴、行動傾向等を蓄積しているので、行動処理部１３ｂは、ユーザモデル１２Ｍに基づいて、ユーザが対話したい他のユーザ、行きたい場所、やりたいこと等を特定できる。具体的には、行動処理部１３ｂは、例えば「対話したい人は？」のメッセージをユーザモデル１２Ｍに入力することにより、ユーザモデル１２Ｍから出力される、対話したい相手に関する情報を取得できる。また行動処理部１３ｂは、例えば「行きたい場所は？」のメッセージをユーザモデル１２Ｍに入力することにより、ユーザモデル１２Ｍから出力される、行きたい場所に関する情報を取得できる。更に行動処理部１３ｂは、例えば「やりたいことは？」のメッセージをユーザモデル１２Ｍに入力することにより、ユーザモデル１２Ｍから出力される、やりたいことに関する情報を取得できる。行動処理部１３ｂは、対話したい相手、行きたい場所、やりたいこと等を特定した場合、特定結果に対応する他のユーザ端末１０（第２ユーザ端末１０という）を外出先に特定する。例えば行動処理部１３ｂは、対話したい相手を特定した場合、対話したい相手のユーザ端末１０（第２ユーザ端末１０）を外出先に特定し、行きたい場所を特定した場合、行きたい場所に対応するユーザ端末１０（例えば行きたい場所に設置してある第２ユーザ端末１０）を外出先に特定し、やりたいことを特定した場合、やりたいことに対応するユーザ端末１０（例えばやりたいことができる場所に設置してある第２ユーザ端末１０）を外出先に特定する。そして行動処理部１３ｂは、外出先に特定した第２ユーザ端末１０に、自身のユーザ端末１０（第１ユーザ端末１０）の第１ユーザモデル１２Ｍを送信する。

なお、第２ユーザ端末１０は、第１ユーザ端末１０から第１ユーザモデル１２Ｍを受信した場合、受信した第１ユーザモデル１２Ｍを記憶部１２に記憶し、第１ユーザモデル１２Ｍに基づく処理を行えるようにデプロイする。これにより、第２ユーザ端末１０は第１ユーザモデル１２Ｍに基づく処理を実行することができ、第２ユーザ端末１０の対話処理部１３ａが第１ユーザモデル１２Ｍに基づく対話処理を行うことにより、第２ユーザ端末１０において第１ユーザが行う可能性の高い対話を実行することができ、第２ユーザ端末１０の行動処理部１３ｂが第１ユーザモデル１２Ｍに基づく行動処理を行うことにより、第２ユーザ端末１０において第１ユーザが行う可能性の高い行動を実行することができる。上述した処理により、第１ユーザモデル１２Ｍ（擬似的な第１ユーザ）は、第２ユーザの自宅（第２ユーザ端末１０）に擬似的に遊びに行って、第２ユーザ端末１０の対話処理部１３ａによって第２ユーザと対話することができる。また、第１ユーザモデル１２Ｍ（擬似的な第１ユーザ）は、任意の場所（デプロイされる第２ユーザ端末１０）に擬似的に外出し、第２ユーザ端末１０の行動処理部１３ｂによってカメラ１９及びマイク１８を用いた撮影、スピーカ１７及び表示部１６を用いた音声及び映像の出力、移動機構２０を用いた移動等の行動を行うことができる。

通信部１４は、有線通信又は無線通信によってネットワークＮに接続するためのインタフェースであり、ネットワークＮを介して外部装置との間で情報の送受信を行う。入力部１５は、ユーザによる操作入力を受け付け、操作内容に対応した制御信号を制御部１１へ送出する。表示部１６は、液晶ディスプレイ又は有機ＥＬディスプレイ等であり、制御部１１からの指示に従って各種の情報を表示する。入力部１５及び表示部１６は一体として構成されたタッチパネルであってもよい。

スピーカ１７は、増幅器等を有する音声出力装置であり、制御部１１からの指示に従った音声データを増幅器にて増幅した後、音声出力する。マイク１８は、増幅器及びＡ／Ｄ（アナログ／デジタル）変換器等を有する音声入力装置であり、周囲の音声を収集してアナログの音声データを取得し、取得した音声データを増幅器にて増幅し、Ａ／Ｄ変換器にてデジタルの音声データに変換して音声データを取得する。マイク１８は、制御部１１からの指示に従って集音を行い、取得した音声データを逐次制御部１１へ送出する。スピーカ１７及びマイク１８は、ユーザ端末１０に内蔵されていてもよいし、ケーブル等を介してユーザ端末１０に外付けされていてもよいし、ユーザ端末１０と無線通信するように構成されていてもよい。スピーカ１７及びマイク１８は一体として構成されたヘッドセットであってもよい。

カメラ１９は、レンズ及び撮像素子等を有する撮像部であり、レンズを介して入射した光を撮像素子にて光電変換して画像データを取得する。カメラ１９は、制御部１１からの指示に従って撮影を行い、取得した画像データ（撮影画像）を逐次制御部１１へ送出する。カメラ１９は、ユーザ端末１０に内蔵されていてもよいし、ケーブル等を介してユーザ端末１０に外付けされていてもよい。

移動機構２０は、複数のタイヤ２０ａ及び各タイヤ２０ａを回転させるためのモータ（図示せず）等を含む。移動機構２０は、制御部１１からの指示に従ったモータ駆動量で各モータを駆動させることにより各タイヤ２０ａを回転させ、ユーザ端末１０を所定方向に移動又は方向転換させる。移動機構２０は、タイヤ２０ａを用いる二輪走行方式、四輪走行方式、六輪走行方式の移動機構に限定されず、キャタピラ走行方式の移動機構であってもよく、二足歩行方式又は四足歩行方式等の歩行型の移動機構であってもよく、蛇型無足歩行方式又はミミズ型無足歩行方式等の無足歩行型の移動機構であってもよい。また移動機構２０は、床面上又は地面上を移動する構成に限定されず、室内又は屋外を飛行する飛行機構を備えていてもよい。

センサ部２１は、ＧＰＳ（Global Positioning System ）センサ、加速度センサ、地磁気センサ等の各種のセンサを含み、ユーザ端末１０の位置及び動きを検出する。センサ部２１は、ユーザ端末１０の位置及び動きを検出することにより、ユーザ端末１０を携帯しているユーザの位置及び動きを検出できる。センサ部２１は、ユーザ端末１０に内蔵されていてもよいし、ユーザ端末１０と無線通信できるように構成されていてもよい。センサ部２１がユーザ端末１０と無線通信できるように構成されている場合、ユーザはセンサ部２１のみを携帯すればよく、センサ部２１は、検出したユーザの位置及び動きをユーザ端末１０へ送信する。

読み取り部２２は、ＣＤ（Compact Disc）−ＲＯＭ、ＤＶＤ（Digital Versatile Disc）−ＲＯＭ又はＵＳＢ（Universal Serial Bus）メモリを含む可搬型記憶媒体１ａに記憶された情報を読み取る。記憶部１２に記憶される制御プログラム１２Ｐ及び各種のデータは、制御部１１が読み取り部２２を介して可搬型記憶媒体１ａから読み取って記憶部１２に記憶してもよい。また、記憶部１２に記憶される制御プログラム１２Ｐ及び各種のデータは、制御部１１が通信部１４を介して外部装置からダウンロードして記憶部１２に記憶してもよい。更に、制御プログラム１２Ｐ及び各種のデータを半導体メモリ１ｂに記憶しておき、制御部１１が半導体メモリ１ｂから読み出して記憶部１２に記憶してもよい。

図４はユーザ端末１０に記憶されるＤＢ１２ａ〜１２ｃの構成例を示す模式図である。図４Ａは宛先情報ＤＢ１２ａを、図４Ｂは対話履歴ＤＢ１２ｂを、図４Ｃは行動履歴ＤＢ１２ｃをそれぞれ示す。宛先情報ＤＢ１２ａは、ユーザ端末１０がネットワークＮ経由で情報の送受信を行う際に用いる他のユーザ端末１０の宛先情報を記憶するアドレス帳である。図４Ａに示す宛先情報ＤＢ１２ａは、端末ＩＤ列、所有者名列、宛先情報列等を含む。端末ＩＤ列は、他のユーザ端末１０のそれぞれに予め割り当てられた識別情報を記憶し、所有者名列は、端末ＩＤに対応付けて他のユーザ端末１０のユーザの氏名を記憶する。宛先情報列は、端末ＩＤに対応付けて他のユーザ端末１０に割り当てられた宛先情報を記憶する。宛先情報は、例えば他のユーザ端末１０に割り当てられた電話番号、メールアドレス、ＩＰ（Internet Protocol Address ）アドレス、ＬＩＮＥ−ＩＤ等を用いることができる。宛先情報ＤＢ１２ａに記憶される端末ＩＤは、制御部１１が新たな他のユーザ端末１０の情報を入力部１５又は通信部１４を介して取得した場合に、制御部１１によって発行されて記憶される。宛先情報ＤＢ１２ａに記憶される端末ＩＤ以外の各情報は、制御部１１が入力部１５又は通信部１４を介して追加又は変更の指示を取得する都度、制御部１１によって追加又は変更される。宛先情報ＤＢ１２ａの記憶内容は図４Ａに示す例に限定されず、他のユーザ端末１０に関する各種の情報を記憶することができる。

対話履歴ＤＢ１２ｂは、ユーザ端末１０において対話処理部１３ａがユーザモデル１２Ｍに基づいて実行した対話の履歴情報を記憶する。具体的には、第１ユーザ端末１０の対話履歴ＤＢ１２ｂは、第１ユーザ端末１０の対話処理部１３ａが第１ユーザモデル１２Ｍに基づいて実行した第１ユーザとの対話の履歴情報を記憶する。また、第１ユーザ端末１０に第２ユーザモデル１２Ｍがデプロイされた場合、第１ユーザ端末１０の対話処理部１３ａは第２ユーザモデル１２Ｍに基づく対話が可能となる。よって、対話履歴ＤＢ１２ｂは、第１ユーザ端末１０が第２ユーザモデル１２Ｍに基づいて実行した第１ユーザとの対話の履歴情報を記憶する。またユーザモデル１２Ｍ（第１ユーザモデル１２Ｍ）が他のユーザ端末１０（第２ユーザ端末１０）にデプロイされた場合に、第２ユーザ端末１０の対話処理部１３ａが第１ユーザモデル１２Ｍに基づく対話が可能となる。よって、対話履歴ＤＢ１２ｂは、第２ユーザ端末１０の対話処理部１３ａが第１ユーザモデル１２Ｍに基づいて実行した第２ユーザとの対話の履歴情報を記憶する。なお、第２ユーザ端末１０において実行された対話の履歴情報は、第２ユーザ端末１０から第１ユーザ端末１０へ送信され、第１ユーザ端末１０の対話履歴ＤＢ１２ｂに記憶される。

図４Ｂに示す対話履歴ＤＢ１２ｂは、対話ＩＤ列、相手情報列、対話情報列等を含む。対話ＩＤ列は、第１ユーザ端末１０又は第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０の対話処理部１３ａが実行した対話処理のそれぞれに割り当てられた識別情報を記憶する。相手情報列は、対話ＩＤに対応付けて、対話処理における対話相手の情報を記憶する。対話相手は、例えば第１ユーザ端末１０の対話処理部１３ａが第１ユーザ端末１０を介して実行した対話の相手（例えば第１ユーザ）、第２ユーザ端末１０の対話処理部１３ａが第２ユーザ端末１０を介して実行した対話の相手（例えば第２ユーザ）等を含み、対話相手の情報は、例えば対話相手の氏名、対話相手のユーザ端末１０の端末ＩＤ又は宛先情報等を用いることができる。対話情報列は、対話ＩＤに対応付けて、対話処理中に取得した各種のデータ（対話データ）を記憶する。対話データは、例えば第１ユーザ端末１０又は第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０の対話処理部１３ａが対話処理を実行中に第１ユーザ端末１０又は第２ユーザ端末１０のカメラ１９及びマイク１８を用いて取得した映像及び音声のデータ、入力部１５及び表示部１６を用いて取得又は表示したテキストデータ等を含む。なお、対話データは、対話履歴ＤＢ１２ｂに記憶される構成に限定されず、記憶部１２の所定領域又はユーザ端末１０に接続された外部記憶装置に記憶してもよい。この場合、対話情報列には、対話データを読み出すための情報（例えばデータの記憶場所を示すファイル名）を記憶してもよい。対話履歴ＤＢ１２ｂの記憶内容は図４Ｂに示す例に限定されず、第１ユーザ端末１０又は第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０の対話処理部１３ａが実行した対話処理に関する各種の情報を記憶することができる。

行動履歴ＤＢ１２ｃは、ユーザ端末１０において行動処理部１３ｂがユーザモデル１２Ｍに基づいて実行した行動の履歴情報を記憶する。具体的には、第１ユーザ端末１０の行動履歴ＤＢ１２ｃは、第１ユーザ端末１０の行動処理部１３ｂが第１ユーザモデル１２Ｍに基づいて実行したカメラ１９及びマイク１８を用いた撮影、スピーカ１７及び表示部１６を用いた音声及び映像の出力、移動機構２０を用いた移動等の行動の履歴情報を記憶する。また行動履歴ＤＢ１２ｃは、ユーザモデル１２Ｍ（第１ユーザモデル１２Ｍ）が他のユーザ端末１０（第２ユーザ端末１０）にデプロイされた場合に、第２ユーザ端末１０の行動処理部１３ｂが第１ユーザモデル１２Ｍに基づいて実行した行動の履歴情報を記憶する。具体的には、第２ユーザ端末１０の行動処理部１３ｂが第１ユーザモデル１２Ｍに基づいて実行したカメラ１９及びマイク１８を用いた撮影、スピーカ１７及び表示部１６を用いた音声及び映像の出力、移動機構２０を用いた移動等の行動の履歴情報を記憶する。なお、第２ユーザ端末１０において実行された行動の履歴情報は、第２ユーザ端末１０から第１ユーザ端末１０へ送信され、第１ユーザ端末１０の行動履歴ＤＢ１２ｃに記憶される。

図４Ｃに示す行動履歴ＤＢ１２ｃは、行動ＩＤ列、場所情報列、行動情報列等を含む。行動ＩＤ列は、第１ユーザ端末１０又は第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０の行動処理部１３ｂが実行した行動処理のそれぞれに割り当てられた識別情報を記憶する。場所情報列は、行動ＩＤに対応付けて、行動処理における外出先の場所の情報を記憶する。外出先は、第１ユーザ端末１０の行動処理部１３ｂが第１ユーザからの指示又は第１ユーザモデル１２Ｍに基づいて決定した第２ユーザ端末１０であり、第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０を含む。外出先の場所の情報は、例えば外出先に決定された第２ユーザ端末１０の端末ＩＤ、宛先情報又は設置場所の情報、第２ユーザ端末１０の所有者（第２ユーザ）の氏名等を用いることができる。行動情報列は、行動ＩＤに対応付けて、行動処理中に取得した各種のデータ（行動データ）を記憶する。行動データは、例えば第１ユーザ端末１０又は第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０の行動処理部１３ｂが行動処理を実行中に第１ユーザ端末１０又は第２ユーザ端末１０のカメラ１９及びマイク１８を用いて取得した映像及び音声のデータ、入力部１５及び表示部１６を用いて取得及び表示したテキストデータ等を含む。なお、行動データは、行動履歴ＤＢ１２ｃに記憶される構成に限定されず、記憶部１２の所定領域又はユーザ端末１０に接続された外部記憶装置に記憶してもよい。この場合、行動情報列には、行動データを読み出すための情報（例えばデータの記憶場所を示すファイル名）を記憶してもよい。行動履歴ＤＢ１２ｃの記憶内容は図４Ｃに示す例に限定されず、第１ユーザ端末１０又は第１ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０の行動処理部１３ｂが実行した行動処理に関する各種の情報を記憶することができる。例えば、行動処理部１３ｂが実行した行動（外出）に同伴者がいた場合、同伴者の情報を行動履歴ＤＢ１２ｃに記憶してもよい。

以下に、それぞれのユーザ端末１０が行う処理について説明する。以下の処理は、それぞれのユーザ端末１０において、記憶部１２に記憶してある制御プログラム１２Ｐに従って制御部１１によって実行される。なお、本実施形態では、以下の処理を制御部１１が制御プログラム１２Ｐを実行することにより実現するが、一部の処理を専用のハードウェア回路で実現してもよい。図５は、ユーザ端末１０による対話処理手順の一例を示すフローチャート、図６は、ユーザ端末１０における画面例を示す模式図である。

ユーザ端末１０の制御部１１は、マイク１８又は入力部１５を介して、自端末のユーザからのメッセージ（対話情報）を受け付けたか否かを判断する（Ｓ１１）。ユーザ端末１０のユーザは、自身のユーザ端末１０（自身のユーザモデル１２Ｍ）と対話したい場合、話しかけるメッセージを、マイク１８を介した音声入力又は入力部１５を介したテキスト入力等によって入力する。ユーザ端末１０の制御部１１は、ユーザからのメッセージを受け付けたと判断した場合（Ｓ１１：ＹＥＳ）、受け付けたメッセージに対する返答メッセージを対話処理部１３ａによって生成する（Ｓ１２）。制御部１１（対話処理部１３ａ）は、例えば受け付けたメッセージをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて返答メッセージを生成する。なお、ユーザモデル１２Ｍは、メッセージが入力された場合に、入力されたメッセージに対する返答メッセージを出力するように学習されており、制御部１１は、ユーザモデル１２Ｍから出力されたメッセージをそのまま返答メッセージとしてもよい。また、例えば所定のメッセージに対して行うべき返答メッセージをテンプレートとして記憶している場合、制御部１１（対話処理部１３ａ）は、受け付けたメッセージに対する返答メッセージをテンプレートから選択してもよい。

制御部１１は、生成した返答メッセージをスピーカ１７又は表示部１６を介して出力する（Ｓ１３）。具体的には、制御部１１は、返答メッセージをスピーカ１７を介して音声出力するか、表示部１６に表示することによってユーザに応答する。これにより、ユーザ端末１０は、受け付けたユーザからのメッセージに対して返答メッセージを返すことができ、ユーザとの間で対話を行うことができる。なお、制御部１１は、返答メッセージを出力する際に、図６Ａ及びＢに示すように、記憶部１２に記憶してあるアバターに係る画像データに基づいて、ユーザ端末１０のユーザが設定したアバターの画像を表示部１６に表示し、記憶部１２に記憶してあるアバターに係る音声データに基づく音声にて返答メッセージをスピーカ１７から音声出力してもよい。この場合、ユーザは、図６Ａ及びＢに示す画面に表示されたアバターと対面して対話しているように感じることができる。またこのとき、記憶部１２に記憶してあるアバターのモーションデータに基づいて、表示部１６に表示されたアバターに動きを付加することもでき、この場合、ユーザはアバターとの対話をより楽しむことができる。なお、アバターの表示画像は、ユーザ端末１０のユーザの実写画像、人間に似たキャラクタの画像、動物等の画像、動物等のキャラクタの画像等を用いることができる。

ユーザからのメッセージを受け付けていないと判断した場合（Ｓ１１：ＮＯ）、制御部１１は、ユーザ端末１０のユーザとの対話を開始すべきタイミングであるか否かを判断する（Ｓ１４）。例えばユーザから対話開始のタイミングとして任意の日時がタイマ設定されていた場合、制御部１１は、タイマ設定された日時が到来したか否かに応じて、対話開始のタイミングであるか否かを判断する。また例えば制御部１１は、「話したいことはありますか」のようなメッセージをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて、対話開始のタイミングであるか否かを判断してもよい。この場合、例えばユーザとの対話を開始したい旨のメッセージがユーザモデル１２Ｍから出力された場合、制御部１１は、対話開始のタイミングであると判断してもよい。更に、制御部１１は、例えばカメラ１９によってユーザ端末１０の周囲を撮影し、撮影画像に基づいてユーザ端末１０の周囲にユーザが居るか否かを判断し、居る場合に、対話開始のタイミングであると判断してもよい。

対話開始のタイミングであると判断した場合（Ｓ１４：ＹＥＳ）、制御部１１は、ユーザ端末１０のユーザと対話すべき対話メッセージを生成する（Ｓ１５）。制御部１１（対話処理部１３ａ）は、例えば「話したいことはありますか」のようなメッセージをユーザモデル１２Ｍに入力したときに、ユーザモデル１２Ｍからユーザとの対話におけるメッセージが出力された場合、出力されたメッセージを対話メッセージとしてもよい。また、「こんにちは。元気？」のような挨拶メッセージ、「お名前は？」及び「何かあったの？」のようなユーザの情報（個人情報、固有の情報）を収集できるような質問メッセージ等をテンプレートとして記憶している場合、制御部１１（対話処理部１３ａ）は、現時点での日時又は過去のユーザとの対話内容等を考慮したメッセージをテンプレートから選択してもよい。制御部１１は、生成した対話メッセージをスピーカ１７又は表示部１６を介して出力する（Ｓ１６）。ここでも制御部１１は、対話メッセージをスピーカ１７を介して音声出力するか、表示部１６に表示することによってユーザに話しかける。これにより、ユーザ端末１０は、適宜のタイミングでユーザに話しかけることができ、ユーザとの対話を開始できる。ユーザとの対話を開始すべきタイミングでないと判断した場合（Ｓ１４：ＮＯ）、制御部１１は、ステップＳ１５〜Ｓ１６の処理をスキップする。

ステップＳ１３又はステップＳ１６の処理後、制御部１１は、ユーザ端末１０のユーザとの対話を終了するか否かを判断する（Ｓ１７）。例えば制御部１１は、ユーザから「またね」、「バイバイ」等のような対話を終了する際のメッセージをマイク１８又は入力部１５を介して受け付けた場合、対話を終了すると判断する。対話を終了しないと判断した場合（Ｓ１７：ＮＯ）、制御部１１は、ステップＳ１１の処理に戻り、ステップＳ１１〜Ｓ１６の処理を繰り返す。これにより、制御部１１（対話処理部１３ａ）は、ユーザからの対話メッセージに対する応答メッセージを返すことができ、またユーザに話しかけるべき対話メッセージを出力することができ、ユーザとの対話を実現できる。なお、上述した処理により対話処理部１３ａがユーザモデル１２Ｍに基づいてユーザと対話することによって、ユーザへの対話メッセージ及びユーザからの返答メッセージに基づいてユーザモデル１２Ｍがユーザに関することを学習し、ユーザに関する情報（ユーザ固有の情報）がユーザモデル１２Ｍに蓄積される。よって、ユーザが意識することなく、ユーザに関する情報が収集されてユーザモデル１２Ｍに蓄積される。このようにユーザに関する各種の情報が蓄積されたユーザモデル１２Ｍに基づいて対話処理及び行動処理を行うことにより、ユーザが行う可能性の高い対話及び行動を実現できる。

対話を終了すると判断した場合（Ｓ１７：ＹＥＳ）、制御部１１は、ユーザとの間で行われた対話の履歴情報を対話履歴ＤＢ１２ｂに記憶し（Ｓ１８）、処理を終了する。なお、対話処理部１３ａがユーザとの対話を行っている場合、例えば行動処理部１３ｂがカメラ１９及びマイク１８を用いてユーザの映像及び音声のデータを取得（撮影）する。そして、行動処理部１３ｂが取得したユーザの映像及び音声のデータと、対話処理部１３ａがスピーカ１７及び表示部１６を用いて出力したアバターの画像及び音声のデータとを対話情報として対話履歴ＤＢ１２ｂに記憶する。これにより、対話処理部１３ａがユーザとの間で行った対話の履歴情報が対話履歴ＤＢ１２ｂに記憶される。上述した処理により、ユーザは、自身のユーザ端末１０を介して、自身のアバターと対話することができ、孤独感及び不安を和らげることができる。また、自身のアバターはユーザモデル１２Ｍに基づく対話及び行動を行うので、ユーザと似た対話及び行動を実現でき、ユーザは快適な対話を楽しむことができる。

上述した処理において、対話処理部１３ａは、ユーザとの対話を行う際に、対話メッセージ及び返答メッセージを生成するだけでなく、ユーザの撮影画像に基づいてユーザの感情を分析してもよい。この場合、対話処理部１３ａは、撮影画像中のユーザの表情及び姿勢等に基づいて、ユーザの感情が、例えば喜び、怒り、悲しみ、驚き、嫌悪、リラックス等のいずれである可能性が高いかを分析する。そして、対話処理部１３ａは、分析したユーザの感情とユーザからの対話メッセージとをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて返答メッセージ（対話情報）を特定する。またこのとき、ユーザモデル１２Ｍは、返答メッセージに加えて、ユーザの感情に対してユーザモデル１２Ｍ（アバター）が抱くべき感情を特定してもよい。この場合、ユーザモデル１２Ｍは、対話履歴情報及び感情と、これらに応じた対話情報及び行動情報（感情）とを含む教師データを用いて学習している。これにより、ユーザモデル１２Ｍは、対話情報（ユーザからの対話メッセージ）と感情（ユーザの感情）とが入力された場合に、出力すべき対話情報（返答メッセージ）及び感情（ユーザの感情に対して反応する感情）を出力できる。なお、例えば対話相手の感情に応じて自身（ユーザ）が感じる可能性の高い感情をテンプレートとして記憶しておき、対話処理部１３ａが、分析したユーザの感情に対してユーザモデル１２Ｍ（アバター）が抱く可能性の高い感情をテンプレートから特定してもよい。ユーザモデル１２Ｍ（アバター）が抱くべき感情を特定した場合、対話処理部１３ａ又は行動処理部１３ｂは、特定した感情（行動情報）を出力する。例えば対話処理部１３ａは、表示部１６に表示するアバターに、特定した感情に対応する表情又は動きを付加することにより、アバターの感情を表現してもよい。また例えば、行動処理部１３ｂは、図６Ｃに示すように、特定した感情に対応する目の画像を表示部１６に表示することによりアバターの感情を表現してもよい。なお、図６Ｃに示す例では上側の目は喜びの感情を、下側の目は悲しみの感情をそれぞれ表現している。また行動処理部１３ｂは、特定した感情に応じた動きを移動機構２０を用いて行うことにより、ユーザ端末１０の動きによってアバターの感情を表現してもよい。例えば、特定した感情が喜びである場合、行動処理部１３ｂは、移動機構２０を用いてユーザ端末１０を回転又は移動させることによりユーザ端末１０にダンスさせて喜びの感情を表現してもよい。また、ユーザ端末１０が手又は足の部分を有する場合、行動処理部１３ｂは、特定した感情に対応する身振り及び手振りをユーザ端末１０に実行させることによりアバターの感情を表現してもよい。このような構成とした場合、ユーザ端末１０は、ユーザとの間でメッセージのやりとりを行えるだけでなく、感情のやりとりも行うことができ、ユーザはアバターとの間でより現実的な対話を行うことができる。

上述した処理を行うユーザ端末１０において、ユーザモデル１２Ｍがユーザに関する情報を学習する際に、ユーザの心拍数、脳波、筋電図等を計測し、ユーザの心身の状態がリラックスして冷静であるか否かを判断し、冷静である時に行われた対話内容から収集されたユーザに関する情報のみを蓄積するようにしてもよい。この場合、心身の状態が冷静でない興奮状態の時に行われた対話内容から収集されたユーザに関する情報を破棄することにより、ユーザの普段の状態で収集されたユーザに関する情報のみを蓄積（学習）できる。

図７は、ユーザ端末１０による行動処理手順の一例を示すフローチャートである。ユーザ端末１０の制御部１１は、ユーザ端末１０の設置場所の近傍で移動するか否かを判断する（Ｓ２１）。例えば制御部１１は、ユーザからの指示又はユーザモデル１２Ｍに基づいて、自端末のユーザが行きたい場所（移動したい場所）があるか否かを判断し、行きたい場所がある場合に移動すると判断する。例えばユーザが、ユーザ端末１０の設置場所で飼っているペットを定期的に撮影する処理を設定している場合、又はこのような行動傾向を有する場合、制御部１１は、所定のタイミングでペットの近傍に移動して撮影する行動処理を行うことを判断する。この場合、制御部１１は、所定のタイミングでペットの近傍に移動すると判断する。また例えば制御部１１は、「行きたい所はある？」のようなメッセージをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて、行きたい場所があるか否かを判断し、行きたい場所がある場合に移動すると判断してもよい。更に例えばユーザ端末１０のユーザの移動に追随して移動するように設定されている場合、制御部１１は、ユーザの移動に従って移動すると判断してもよい。移動すると判断した場合（Ｓ２１：ＹＥＳ）、制御部１１（行動処理部１３ｂ）は、移動機構２０を用いて行きたい場所まで移動する（Ｓ２２）。例えばペットを撮影する行動を行う場合、行動処理部１３ｂは、移動機構２０を用いてペットを撮影できる位置までユーザ端末１０を移動させる。具体的には、行動処理部１３ｂは、ペットの近くまでの移動を示す移動情報（行動情報）に応じた移動処理命令を含む処理命令を移動機構２０（ハードウェア）に対して出力し、移動機構２０による移動処理を実行させる。なお、このとき、行動処理部１３ｂは、カメラ１９を用いてユーザ端末１０の周囲を撮影し、撮影画像に基づいてペットの位置を確認しながらペットの近傍までユーザ端末１０を移動させる。また、ユーザの移動に追随する場合、行動処理部１３ｂは、カメラ１９を用いてユーザを撮影し、撮影画像に基づいてユーザの位置を確認しながらユーザから所定距離を維持しつつユーザ端末１０を移動させる。移動しないと判断した場合（Ｓ２１：ＮＯ）、制御部１１はステップＳ２２の処理をスキップする。

制御部１１は、ユーザ端末１０の設置場所又は移動後の場所で撮影及び／又は録音するか否かを判断する（Ｓ２３）。例えば制御部１１は、ユーザからの指示又はユーザモデル１２Ｍに基づいて、自端末のユーザが撮影及び／又は録音したいと思っているか否かを判断し、撮影及び／又は録音したいと思っている場合に撮影及び／又は録音すると判断する。例えば制御部１１は、ペットを撮影する行動処理を行うことを判断し、ペットの近傍まで移動した場合、ペットを撮影及び録音すると判断する。また例えば制御部１１は、「撮影したいものはある？」のようなメッセージをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて、撮影したいものがあるか否かを判断し、撮影したいものがある場合に撮影すると判断してもよい。撮影及び／又は録音すると判断した場合（Ｓ２３：ＹＥＳ）、制御部１１（行動処理部１３ｂ）は、カメラ１９及びマイク１８を用いて撮影及び録音を行う（Ｓ２４）。例えばペットを撮影する行動を行う場合、行動処理部１３ｂは、カメラ１９及びマイク１８を用いてペットの撮影画像（映像）及び音声を取得する。具体的には、行動処理部１３ｂは、ペットの撮影及び録音を示す行動情報に応じた処理命令をカメラ１９及びマイク１８（ハードウェア）に対して出力し、カメラ１９及びマイク１８による撮影及び録音処理を実行させる。なお、このとき、行動処理部１３ｂは、カメラ１９で逐次取得する撮影画像に基づいてペットの位置を追跡しながらペットの映像及び音声を取得する。撮影及び録音しないと判断した場合（Ｓ２３：ＮＯ）、制御部１１はステップＳ２４の処理をスキップする。

制御部１１は、ユーザ端末１０の設置場所又は移動後の場所で音声及び／又は映像を出力するか否かを判断する（Ｓ２５）。例えば制御部１１は、ユーザからの指示又はユーザモデル１２Ｍに基づいて、自端末のユーザが音声及び／又は映像を出力したいと思っているか否かを判断し、音声及び／又は映像を出力したいと思っている場合に音声及び／又は映像を出力すると判断する。例えばユーザが部屋（ユーザ端末１０の設置場所）にいる場合に、ユーザに話しかける処理が設定されている場合、又はこのような行動傾向（習慣）を有する場合、制御部１１は、ユーザが部屋にいる場合、音声及び／又は映像を出力する（話しかける）と判断する。また例えば制御部１１は、「出力したい音声又は映像はある？」「話したいことはある？」のようなメッセージをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて、出力したい音声又は映像があるか否かを判断し、出力したい音声又は映像がある場合に音声及び／又は映像を出力すると判断してもよい。音声及び／又は映像を出力すると判断した場合（Ｓ２５：ＹＥＳ）、制御部１１（行動処理部１３ｂ）は、スピーカ１７及び表示部１６を用いて音声及び／又は映像を出力する（Ｓ２６）。例えば部屋にいるユーザに話しかける場合、行動処理部１３ｂは、表示部１６にアバターの画像を表示しつつスピーカ１７から「こんにちは。今は暇？」等のメッセージを音声出力し、ユーザ端末１０の近傍にいるユーザに話しかける。具体的には、行動処理部１３ｂは、音声の出力を示す行動情報に応じた処理命令をスピーカ１７（ハードウェア）に対して出力し、スピーカ１７による音声出力処理を実行させる。音声及び映像を出力しないと判断した場合（Ｓ２５：ＮＯ）、制御部１１はステップＳ２６の処理をスキップする。

制御部１１は、ユーザからの指示又はユーザモデル１２Ｍに基づく行動を終了するか否かを判断する（Ｓ２７）。例えば制御部１１は、ペットを撮影する行動処理を行うことを判断し、ペットの撮影及び録音を完了した場合、行動を終了すると判断する。行動を終了しないと判断した場合（Ｓ２７：ＮＯ）、制御部１１は、ステップＳ２１の処理に戻り、ステップＳ２１〜Ｓ２６の処理を繰り返す。これにより、制御部１１（行動処理部１３ｂ）は、ユーザからの指示又はユーザモデル１２Ｍに基づいて、自端末のユーザが行う可能性の高い行動を行うことができる。

行動を終了すると判断した場合（Ｓ２７：ＹＥＳ）、制御部１１は、ユーザ端末１０が行った行動の履歴情報を行動履歴ＤＢ１２ｃに記憶し（Ｓ２８）、処理を終了する。なお、行動処理部１３ｂは、移動機構２０による移動、スピーカ１７及び表示部１６による音声及び映像の出力を行っている場合に、カメラ１９及びマイク１８を用いてユーザ端末１０の周囲の映像及び音声を取得（撮影）しており、このような映像及び音声のデータを含め、カメラ１９及びマイク１８で取得した映像及び音声のデータを行動情報として行動履歴ＤＢ１２ｃに記憶する。これにより、行動処理部１３ｂが行った行動の履歴情報が行動履歴ＤＢ１２ｃに記憶される。

上述した処理において、行動処理部１３ｂがユーザからの指示又はユーザモデル１２Ｍに基づいて実行した行動についても、ユーザモデル１２Ｍはユーザの行動履歴及び行動傾向としてユーザに関することを学習することができる。よって、ユーザが意識することなく、ユーザの行動履歴及び行動傾向が逐次収集されてユーザモデル１２Ｍに蓄積される。

図８及び図９は、ユーザ端末１０による対話処理手順の一例を示すフローチャート、図１０は、ユーザ端末１０における画面例を示す模式図である。図８及び図９に示す処理は、第１ユーザの第１ユーザモデル１２Ｍ（第１ユーザのアバター）が、第２ユーザ又は第２ユーザの第２ユーザモデル１２Ｍ（第２ユーザのアバター）と対話を行う際の処理である。図８及び図９では左側に第１ユーザ端末１０が行う処理を、右側に第２ユーザ端末１０が行う処理をそれぞれ示す。

第１ユーザ端末１０の制御部１１（行動処理部１３ｂ）は、対話したい第２ユーザがいるか否かを判断する（Ｓ３１）。例えば制御部１１は、第１ユーザからの指示又は第１ユーザモデル１２Ｍに基づいて、第１ユーザが対話したい第２ユーザがいるか否かを判断する。例えば第１ユーザが第１ユーザ端末１０（第１ユーザモデル１２Ｍ）との対話中に「○○さんは元気かな？」と発話していた場合、制御部１１は、第１ユーザは○○さん（第２ユーザ）と対話したいと判断する。また例えば制御部１１は、「誰かと対話したい？」のようなメッセージを第１ユーザモデル１２Ｍに入力し、第１ユーザモデル１２Ｍからの出力情報に基づいて、第１ユーザが対話したい第２ユーザがいるか否かを判断し、対話したい第２ユーザがいる場合、第２ユーザを特定する。このように第１ユーザモデル１２Ｍに基づいて、対話したい第２ユーザを特定することにより、第１ユーザが対話したい可能性の高い第２ユーザを特定できる。対話したい第２ユーザがいないと判断した場合（Ｓ３１：ＮＯ）、制御部１１は待機する。

対話したい第２ユーザがいると判断した場合（Ｓ３１：ＹＥＳ）、制御部１１は、第２ユーザの宛先情報を宛先情報ＤＢ１２ａから読み出す（Ｓ３２）。例えば制御部１１は、第２ユーザの情報（例えば氏名、第２ユーザ端末１０の所有者名）に対応付けて宛先情報ＤＢ１２ａに記憶してある宛先情報を読み出す。そして制御部１１は、読み出した宛先情報に基づいて、第２ユーザの第２ユーザ端末１０に対して対話の実行を要求する（Ｓ３３）。なお、制御部１１は、第２ユーザ端末１０に対して、第２ユーザとの対話の実行を要求する要求信号を送信する。

第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０から対話の要求信号を受信した場合、例えばスピーカ１７又は表示部１６を介して、第１ユーザから対話要求を受け付けたことを出力する（Ｓ３４）。例えば制御部１１は、スピーカ１７から「○○さんから対話要求がきています。どうしますか」等のメッセージを音声出力し、第１ユーザから対話要求があることを第２ユーザに通知する。また制御部１１は、表示部１６に「○○さんから対話要求がきています」等のメッセージと、対話の実行開始を指示するためのＯＫボタンと、対話の実行を拒否するためのキャンセルボタンとを表示し、第１ユーザから対話要求があることを第２ユーザに通知する。

第２ユーザ端末１０の制御部１１は、第２ユーザが第１ユーザのアバター（第１ユーザ端末１０の第１ユーザモデル１２Ｍ）との対話を実行できるか否かを判断する（Ｓ３５）。例えば第２ユーザ端末１０の制御部１１は、マイク１８を介した音声入力によって第２ユーザから対話の可否を示す返答を受け付け、受け付けた返答に応じて、第２ユーザが対話可能であるか否か（第２ユーザによって対話が許可されたか否かを）を判断する。また制御部１１は、表示部１６に表示したＯＫボタン又はキャンセルボタンに対する操作を入力部１５にて受け付け、受け付けた操作に応じて、第２ユーザが対話可能であるか否かを判断してもよい。第２ユーザが対話可能でないと判断した場合（Ｓ３５：ＮＯ）、第２ユーザ端末１０の制御部１１は、第２ユーザの代わりに第２ユーザのアバター（第２ユーザモデル１２Ｍ）が、第１ユーザのアバター（以下、第１アバターという）との対話を実行することを決定し、第２ユーザのアバター（以下、第２アバターという）が対話可能であることを第１ユーザ端末１０に通知する（Ｓ３６）。そして第２ユーザ端末１０の制御部１１（対話処理部１３ａ）は、第２ユーザモデル１２Ｍに基づいて第１アバターとの対話を開始する（Ｓ３７）。具体的には、第２ユーザ端末１０の制御部１１は第２ユーザの代わりに、第２ユーザモデル１２Ｍに基づいて対話メッセージを生成し、生成した対話メッセージを第１ユーザ端末１０へ送信する（Ｓ３８）。

一方、第１ユーザ端末１０の制御部１１（対話処理部１３ａ）は、第２ユーザ端末１０から第２アバターが対話可能であることを通知された場合、第１ユーザモデル１２Ｍに基づいて第２アバターとの対話を開始する（Ｓ３９）。ここでは、第１ユーザ端末１０の制御部１１は第１ユーザの代わりに、第１ユーザモデル１２Ｍに基づいて対話メッセージを生成し、生成した対話メッセージを第２ユーザ端末１０へ送信する（Ｓ４０）。これにより、第１ユーザ端末１０（第１ユーザモデル１２Ｍ）と第２ユーザ端末１０（第２ユーザモデル１２Ｍ）との間でメッセージの送受信が行われる。なお、メッセージの送受信は、例えばチャットアプリ又はメッセージアプリ等を用いることができ、チャットアプリ又はメッセージアプリは、例えばそれぞれのユーザ端末１０の記憶部１２に予め記憶してある。

第１ユーザ端末１０の制御部１１は、例えば第２ユーザ端末１０から受信した対話メッセージを第１ユーザモデル１２Ｍに入力し、第１ユーザモデル１２Ｍからの出力情報に基づいて返答メッセージを生成して第２ユーザ端末１０へ送信する。同様に第２ユーザ端末１０の制御部１１は、例えば第１ユーザ端末１０から受信した対話メッセージを第２ユーザモデル１２Ｍに入力し、第２ユーザモデル１２Ｍからの出力情報に基づいて返答メッセージを生成して第１ユーザ端末１０へ送信する。なお、第１ユーザ端末１０及び第２ユーザ端末１０の制御部１１は、例えば所定のメッセージに対して予め用意してある返答メッセージのテンプレートから、受信した対話メッセージに対する返答メッセージを選択してもよい。

第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０（第２アバター）との対話を終了するか否かを判断する（Ｓ４１）。例えば制御部１１は、第２ユーザ端末１０から対話を終了する際のメッセージを受信した場合、対話を終了すると判断する。制御部１１は、対話を終了しないと判断した場合（Ｓ４１：ＮＯ）、ステップＳ４０の処理を繰り返し、これにより、第１ユーザ端末１０は、第２ユーザ端末１０へ対話メッセージ又は返答メッセージを送信し、第２ユーザ端末１０から返答メッセージ又は対話メッセージを受信し、第２ユーザ端末１０（第２アバター）との対話を実現する。同様に、第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０（第１アバター）との対話を終了するか否かを判断し（Ｓ４３）、対話を終了しないと判断した場合（Ｓ４３：ＮＯ）、ステップＳ３８の処理を繰り返し、これにより、第２ユーザ端末１０は、第１ユーザ端末１０へ対話メッセージ又は返答メッセージを送信し、第１ユーザ端末１０から返答メッセージ又は対話メッセージを受信し、第１ユーザ端末１０（第１アバター）との対話を実現できる。

第１ユーザ端末１０の制御部１１は、第２アバターとの対話を終了すると判断した場合（Ｓ４１：ＹＥＳ）、第２アバターとの間で行われた対話の履歴情報を対話履歴ＤＢ１２ｂに記憶し（Ｓ４２）、処理を終了する。同様に、第２ユーザ端末１０の制御部１１は、第１アバターとの対話を終了すると判断した場合（Ｓ４３：ＹＥＳ）、第１アバターとの間で行われた対話の履歴情報を対話履歴ＤＢ１２ｂに記憶し（Ｓ４４）、処理を終了する。なお、第１アバターと第２アバターとの間で対話が行われている場合、例えばそれぞれのユーザ端末１０からそれぞれのアバターの画像（映像）及び音声のデータが送受信されるように構成することができ、この場合、第１ユーザ端末１０及び第２ユーザ端末１０の間で送受信された各アバターの映像及び音声のデータを対話情報として対話履歴ＤＢ１２ｂに記憶する。これにより、第１アバターと第２アバターとの間で行われた対話の履歴情報が、それぞれのユーザ端末１０の対話履歴ＤＢ１２ｂに記憶される。

上述した処理において、第１ユーザ端末１０の制御部１１が第１ユーザモデル１２Ｍに基づいて第２ユーザとの対話メッセージを生成し、第２ユーザ端末１０の制御部１１が第２ユーザモデル１２Ｍに基づいて第１ユーザとの対話メッセージを生成する。これにより、第１ユーザ端末１０は、第１ユーザの代わりに第１ユーザが行う可能性の高い対話を実現でき、第２ユーザ端末１０は、第２ユーザの代わりに第２ユーザが行う可能性の高い対話を実現できる。よって、第１ユーザ及び第２ユーザが対話できない状況であっても、第１アバターと第２アバターとが対話することによって、第１ユーザと第２ユーザとが擬似的に対話を行うことができる。

ステップＳ３５で第２ユーザが対話可能であると判断した場合（Ｓ３５：ＹＥＳ）、第２ユーザ端末１０の制御部１１は、第２ユーザが対話可能であることを第１ユーザ端末１０に通知する（Ｓ４５）。第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０から第２ユーザが対話可能であることを通知された場合、第１ユーザモデル１２Ｍを第２ユーザ端末１０へ送信する（Ｓ４６）。なお、第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０において第１ユーザモデル１２Ｍに基づく処理を行えるように、第２ユーザ端末１０に対して第１ユーザモデル１２Ｍをデプロイするように指示する。

第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０から第１ユーザモデル１２Ｍを受信した場合、第１ユーザモデル１２Ｍを記憶部１２に記憶し、第１ユーザモデル１２Ｍに基づく処理を行えるようにデプロイする。そして第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づく処理を開始する（Ｓ４７）。具体的には、第２ユーザ端末１０の制御部１１は、マイク１８又は入力部１５を介して、第２ユーザからのメッセージを受け付けたか否かを判断する（Ｓ４８）。第１アバターとの対話を承諾した第２ユーザは、第２ユーザ端末１０を介して第１ユーザモデル１２Ｍ（第１アバター）に話しかけるメッセージを、マイク１８を介した音声入力又は入力部１５を介したテキスト入力等によって入力する。第２ユーザ端末１０の制御部１１は、第２ユーザからのメッセージを受け付けていないと判断した場合（Ｓ４８：ＮＯ）、第１ユーザモデル１２Ｍに基づいて、第２ユーザと対話すべき対話メッセージを生成し（Ｓ４９）、生成した対話メッセージをスピーカ１７又は表示部１６を介して出力する（Ｓ５０）。例えば制御部１１は、「こんにちは」のような対話メッセージを生成し、生成した対話メッセージをスピーカ１７から音声出力するか、表示部１６に表示することによって第２ユーザに話かける。これにより、第２ユーザ端末１０を介して、第１ユーザモデル１２Ｍ（第１アバター）が第２ユーザとの対話を開始する。なお、制御部１１は、対話メッセージを出力する際に、図１０に示すように、第１ユーザモデル１２Ｍに対応する第１アバターの画像を表示部１６に表示し、第１アバターの音声にて返答メッセージをスピーカ１７から音声出力してもよい。

第２ユーザからのメッセージを受け付けたと判断した場合（Ｓ４８：ＹＥＳ）、第２ユーザ端末１０の制御部１１は、受け付けたメッセージに対する返答メッセージを第１ユーザモデル１２Ｍに基づいて生成する（Ｓ５１）。制御部１１は、例えば受け付けたメッセージを第１ユーザモデル１２Ｍに入力し、第１ユーザモデル１２Ｍからの出力情報に基づいて返答メッセージを生成する。制御部１１は、生成した返答メッセージをスピーカ１７又は表示部１６を介して出力する（Ｓ５２）。これにより、第２ユーザ端末１０は、受け付けた第２ユーザからのメッセージに対して返答メッセージを返すことができ、第２ユーザとの間で対話を行うことができる。ここでも制御部１１は、第１アバターの画像を表示部１６に表示し、第１アバターの音声にて返答メッセージをスピーカ１７から音声出力してもよい。

ステップＳ５０又はステップＳ５２の処理後、第２ユーザ端末１０の制御部１１は、第１アバター（第１ユーザモデル１２Ｍ）と第２ユーザとの対話を終了するか否かを判断する（Ｓ５３）。対話を終了しないと判断した場合（Ｓ５３：ＮＯ）、制御部１１は、ステップＳ４８の処理に戻り、ステップＳ４８〜Ｓ５２の処理を繰り返す。これにより、第２ユーザ端末１０は、第２ユーザからの対話メッセージに対する応答メッセージを返すことができ、また第２ユーザに話しかけるべき対話メッセージを出力することができ、第１ユーザモデル１２Ｍに基づいて第２ユーザとの対話を実現できる。

対話を終了すると判断した場合（Ｓ５３：ＹＥＳ）、第２ユーザ端末１０の制御部１１は、第１アバターと第２ユーザとの間で行われた対話の対話情報を第１ユーザ端末１０へ送信する（Ｓ５４）。なお、第２ユーザ端末１０の対話処理部１３ａが第１ユーザモデル１２Ｍに基づいて第２ユーザと対話を行っている場合、制御部１１（行動処理部１３ｂ）はカメラ１９及びマイク１８を用いて第２ユーザを撮影しており、取得した第２ユーザの映像及び音声のデータと、スピーカ１７及び表示部１６を用いて出力した第１アバターの画像及び音声のデータとを対話情報として第１ユーザ端末１０へ送信する。また第２ユーザ端末１０の制御部１１は、送信した対話情報を対話の履歴情報として対話履歴ＤＢ１２ｂに記憶し（Ｓ５５）、処理を終了する。一方、第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０から対話情報を受信した場合、受信した対話情報を、第１アバターが第２ユーザとの間で行った対話の履歴情報として対話履歴ＤＢ１２ｂに記憶し（Ｓ５６）、処理を終了する。

上述した処理により、第２ユーザ端末１０の対話処理部１３ａは、第２ユーザへ出力する対話メッセージを第１ユーザモデル１２Ｍに基づいて生成するので、第１ユーザが発言する可能性の高い対話メッセージを第２ユーザに発することができる。よって、第２ユーザは、第１アバターと対話することによって、第１ユーザと擬似的な対話を行うことができる。また上述した処理により、第１アバターが、第１ユーザの代わりに、第２ユーザ又は第２アバターとの対話を行うことができ、対話結果を示す履歴情報（対話情報）が第１ユーザ端末１０の対話履歴ＤＢ１２ｂに記憶される。よって、第１ユーザは、対話の履歴情報を後日確認することにより、自身の代理の第１アバターが第２ユーザ又は第２アバターとの間で行った対話の内容を確認できる。よって、第１ユーザが第２ユーザと対話する時間がない場合、又は第２ユーザと直接対話し辛い場合に、自身の第１アバターに第２ユーザとの対話を行わせることができ、第１ユーザは、対話の結果を知ることができる。また、第２ユーザも、第１アバターと対話する時間がない場合、又は第１アバターと直接対話したくない場合には、自身の第２アバターに第１アバターとの対話を行わせることができる。

図１１は、ユーザ端末１０による対話処理手順の一例を示すフローチャートである。図１１に示す処理は、第１ユーザが、第１ユーザ端末１０を介して第２ユーザモデル１２Ｍ（第２ユーザのアバター）と対話を行う際の処理である。図１１では左側に第１ユーザ端末１０が行う処理を、右側に第２ユーザ端末１０が行う処理をそれぞれ示す。第１ユーザ端末１０の制御部１１は、第１ユーザからの指示に基づいて、第１ユーザが第２アバターと対話するか否かを判断する（Ｓ６１）。即ち、制御部１１は、第１ユーザが第２アバターを第１ユーザ端末１０に招待したいか否かを判断する。第２アバターは、第１ユーザ以外のユーザ（第２ユーザ）のアバター（第２ユーザモデル１２Ｍ）である。第１ユーザは、例えば第１ユーザ端末１０の入力部１５を介して「○○さんのアバターとおしゃべりしたい」と音声入力し、この場合、制御部１１は、第１ユーザは○○さんのアバター（第２アバター）と対話すると判断する。第１ユーザが第２アバターと対話しないと判断した場合（Ｓ６１：ＮＯ）、制御部１１は待機する。第１ユーザが第２アバターと対話すると判断した場合（Ｓ６１：ＹＥＳ）、制御部１１は、第２ユーザの宛先情報を宛先情報ＤＢ１２ａから読み出す（Ｓ６２）。そして制御部１１は、読み出した宛先情報に基づいて、第２ユーザの第２ユーザ端末１０に対して、第２アバターとの対話の実行を要求する要求信号を送信する（Ｓ６３）。即ち、制御部１１は、第２ユーザ端末１０に対して、第２アバターを第１ユーザ端末１０に招待する招待情報を送信する。

第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０から第２アバターとの対話の要求信号を受信した場合、第２ユーザモデル１２Ｍを第１ユーザ端末１０へ送信する（Ｓ６４）。第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０から第２ユーザモデル１２Ｍを受信した場合、第２ユーザモデル１２Ｍを記憶部１２に記憶し、第２ユーザモデル１２Ｍに基づく処理を行えるようにデプロイする。そして第１ユーザ端末１０の制御部１１は、第２ユーザモデル１２Ｍに基づく処理を開始する（Ｓ６５）。これにより、第１ユーザ端末１０の制御部１１は、図９に示す対話処理において第２ユーザ端末１０が行っていたステップＳ４８〜Ｓ５３の処理と同様の処理を行い（Ｓ６６〜Ｓ７１）、第１ユーザと第２ユーザモデル１２Ｍ（第２アバター）との対話を実現する。具体的には、第１ユーザ端末１０の制御部１１は、第１ユーザからのメッセージを受け付けたか否かを判断し（Ｓ６６）、受け付けていないと判断した場合（Ｓ６６：ＮＯ）、第２ユーザモデル１２Ｍに基づいて第１ユーザと対話すべき対話メッセージを生成し（Ｓ６７）、生成した対話メッセージを出力する（Ｓ６８）。また第１ユーザからのメッセージを受け付けたと判断した場合（Ｓ６６：ＹＥＳ）、第１ユーザ端末１０の制御部１１は、受け付けたメッセージに対する返答メッセージを第２ユーザモデル１２Ｍに基づいて生成し（Ｓ６９）、生成した返答メッセージを出力する（Ｓ７０）。これにより、第１ユーザ端末１０は、第１ユーザに対話メッセージを発することができ、第１ユーザからの対話メッセージに対する応答メッセージを返すことができ、第２ユーザモデル１２Ｍ（第２アバター）と第１ユーザとの間の対話を行うことができる。

ステップＳ６８又はステップＳ７０の処理後、第１ユーザ端末１０の制御部１１は、第１ユーザと第２アバターとの対話を終了するか否かを判断し（Ｓ７１）、終了しないと判断した場合（Ｓ７１：ＮＯ）、ステップＳ６６の処理に戻り、ステップＳ６６〜Ｓ７１の処理を繰り返す。これにより、第１ユーザ端末１０は、第１ユーザからの対話メッセージに対する応答メッセージを返すことができ、また第１ユーザに話しかけるべき対話メッセージを出力することができ、第２ユーザモデル１２Ｍに基づいて第１ユーザとの対話を実現できる。

対話を終了すると判断した場合（Ｓ７１：ＹＥＳ）、第１ユーザ端末１０の制御部１１は、第１ユーザと第２アバターとの間で行われた対話の対話情報を第２ユーザ端末１０へ送信する（Ｓ７２）。なお、対話情報は、第１ユーザを撮影した映像及び音声のデータと、第２アバターの画像及び音声のデータとを含む。また第１ユーザ端末１０の制御部１１は、送信した対話情報を対話の履歴情報として対話履歴ＤＢ１２ｂに記憶し（Ｓ７３）、処理を終了する。一方、第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０から対話情報を受信した場合、受信した対話情報を、第２アバターが第１ユーザとの間で行った対話の履歴情報として対話履歴ＤＢ１２ｂに記憶し（Ｓ７４）、処理を終了する。

上述した処理により、第１ユーザが第２アバターと対話したい場合、第２アバター（第２ユーザモデル１２Ｍ）を第２ユーザ端末１０から第１ユーザ端末１０にダウンロードすることにより、第１ユーザ端末１０において第２アバターとの対話を実現できる。第１ユーザ端末１０は、第２ユーザモデル１２Ｍに基づく対話を行うので、第１ユーザは、第２アバターと対話することによって、第２ユーザと擬似的な対話を行うことができる。上述した処理により、第２アバターが第２ユーザの代わりに、第１ユーザとの対話を行うので、第２ユーザが多忙で対話する時間を確保できない場合であっても、第１ユーザは、第２ユーザが発する可能性の高い対話メッセージを受け取ることができ、また時間を気にすることなく第２アバターとの対話を楽しむことができる。

図１２及び図１３は、ユーザ端末１０による行動処理手順の一例を示すフローチャートである。図１２及び図１３に示す処理は、第１アバター（第１ユーザモデル１２Ｍ）が、第１ユーザが行きたい場所（第２ユーザ端末１０の設置場所）に擬似的に外出する際の処理である。図１２及び図１３では左側に第１ユーザ端末１０が行う処理を、右側に第２ユーザ端末１０が行う処理をそれぞれ示す。第１ユーザ端末１０の制御部１１は、第１ユーザからの指示又は第１ユーザモデル１２Ｍに基づいて、第１ユーザ端末１０の設置場所から離れた場所で第１ユーザが行きたい場所があるか否かを判断する（Ｓ８１）。例えば第１ユーザが第１ユーザ端末１０（第１ユーザモデル１２Ｍ）との対話中に「△△に行ってみたいな」と発話していた場合、制御部１１は、第１ユーザは△△に行きたいと判断する。また例えば制御部１１は、「行きたい所はある？」のようなメッセージを第１ユーザモデル１２Ｍに入力し、第１ユーザモデル１２Ｍからの出力情報に基づいて、第１ユーザが行きたい場所があるか否かを判断してもよい。このように第１ユーザモデル１２Ｍに基づいて、第１ユーザが行きたい場所を特定することにより、第１ユーザが行きたい可能性の高い場所を特定できる。第１ユーザが行きたい場所がないと判断した場合（Ｓ８１：ＮＯ）、制御部１１は待機する。

第１ユーザが行きたい場所があると判断した場合（Ｓ８１：ＹＥＳ）、第１ユーザ端末１０の制御部１１は、第１ユーザが行きたい場所に設置してある第２ユーザ端末１０を特定する（Ｓ８２）。なお、本実施形態の制御部１１は、第１ユーザが行きたい場所として、宛先情報ＤＢ１２ａに登録してある各ユーザ端末１０のいずれかを特定し、特定したユーザ端末１０（第２ユーザ端末１０）の宛先情報を宛先情報ＤＢ１２ａから読み出す（Ｓ８３）。そして制御部１１は、読み出した宛先情報に基づいて、第２ユーザ端末１０に対して貸出を要求する要求信号を送信する（Ｓ８４）。第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０から貸出の要求信号を受信した場合、第２ユーザ端末１０の貸出が可能であるか否かを判断する（Ｓ８５）。例えば第２ユーザ端末１０が既に他のユーザ（ユーザモデル１２Ｍ）に貸し出されている場合、具体的には、他のユーザのユーザモデル１２Ｍが第２ユーザ端末１０にデプロイされている場合、第２ユーザ端末１０の制御部１１は、貸出できないと判断する。また、第２ユーザが第２ユーザ端末１０を用いて第２ユーザモデル１２Ｍと対話中である場合、貸出できないと判断してもよい。更に、第２ユーザ端末１０のユーザによって第２ユーザ端末１０の貸出禁止が設定されている場合、第２ユーザ端末１０の制御部１１は、貸出できないと判断してもよい。なお、第２ユーザ端末１０のユーザによって第２ユーザ端末１０の貸出許可が設定されている場合、第２ユーザ端末１０の制御部１１は、貸出できると判断してもよい。第２ユーザ端末１０の制御部１１は、貸出可能でないと判断した場合（Ｓ８５：ＮＯ）、貸出可能でないこと（貸出不可）を第１ユーザ端末１０に通知する（Ｓ８６）。第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０から貸出不可を受信した場合（Ｓ８７）、何も行わずに処理を終了する。なお、第１ユーザ端末１０の制御部１１は、ステップＳ８１の処理に戻り、第１ユーザが行きたいほかの場所があるか否かを判断し、ほかの場所がある場合にステップＳ８２〜Ｓ８４の処理を繰り返してもよい。

第２ユーザ端末１０の制御部１１は、貸出可能であると判断した場合（Ｓ８５：ＹＥＳ）、貸出可能であることを第１ユーザ端末１０に通知する（Ｓ８８）。第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０から貸出可能であることを通知された場合、第１ユーザモデル１２Ｍを第２ユーザ端末１０へ送信する（Ｓ８９）。第２ユーザ端末１０の制御部１１は、第１ユーザ端末１０から第１ユーザモデル１２Ｍを受信した場合、第１ユーザモデル１２Ｍを記憶部１２に記憶し、第１ユーザモデル１２Ｍに基づく処理を行えるようにデプロイする。そして第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づく処理を開始する（Ｓ９０）。ここでは、第２ユーザ端末１０の制御部１１は、図７に示す行動処理と同様の処理を行い（Ｓ９１〜Ｓ９７）、第２ユーザ端末１０が第１ユーザモデル１２Ｍに基づく行動処理を行うことにより、第１ユーザモデル１２Ｍ（第１アバター）は、第２ユーザ端末１０を用いて各種の行動を行うことができる。

具体的には、第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づいて、第２ユーザ端末１０の設置場所の近傍で、第１ユーザ（第１アバター）が行きたい場所があるか否かを判断し、行きたい場所があるか否かに応じて移動するか否かを判断する（Ｓ９１）。第２ユーザ端末１０の制御部１１（行動処理部１３ｂ）は、移動すると判断した場合（Ｓ９１：ＹＥＳ）、移動機構２０を用いて行きたい場所まで移動し（Ｓ９２）、移動しないと判断した場合（Ｓ９１：ＮＯ）、ステップＳ９２の処理をスキップする。次に第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づいて、第１ユーザが撮影又は録音したいか否かを判断し、撮影又は録音したいか否かに応じて撮影及び／又は録音するか否かを判断する（Ｓ９３）。撮影及び／又は録音すると判断した場合（Ｓ９３：ＹＥＳ）、第２ユーザ端末１０の制御部１１は、カメラ１９及びマイク１８を用いて第２ユーザ端末１０の周囲の撮影及び録音を行う（Ｓ９４）。なお、第２ユーザ端末１０の行動処理部１３ｂは、第１ユーザモデル１２Ｍに基づいて第１ユーザが撮影したい可能性の高い被写体を特定し、特定した被写体の撮影及び録音を行う。撮影及び録音しないと判断した場合（Ｓ９３：ＮＯ）、制御部１１はステップＳ９４の処理をスキップする。

次に第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づいて、第１ユーザが音声又は映像を出力したいか否かを判断し、音声又は映像を出力したいか否かに応じて音声及び／又は映像を出力するか否かを判断する（Ｓ９５）。第２ユーザ端末１０の制御部１１は、音声及び／又は映像を出力すると判断した場合（Ｓ９５：ＹＥＳ）、スピーカ１７又は表示部１６を用いて音声及び／又は映像を出力し（Ｓ９６）、音声及び映像を出力しないと判断した場合（Ｓ９５：ＮＯ）、ステップＳ２６の処理をスキップする。第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づく行動を終了するか否かを判断する（Ｓ９７）。なお、第１ユーザモデル１２Ｍに基づいて第１ユーザが行動（擬似的な外出）を終了したい可能性が高いと判断される場合、行動を終了すると判断してもよい。また例えば第２ユーザ端末１０に貸出可能な時間が設定されており、貸出可能な時間が経過した場合に行動を終了すると判断してもよい。

行動を終了しないと判断した場合（Ｓ９７：ＮＯ）、第２ユーザ端末１０の制御部１１は、ステップＳ９１の処理に戻り、ステップＳ９１〜Ｓ９６の処理を繰り返す。これにより、第２ユーザ端末１０は、第１ユーザモデル１２Ｍに基づいて第１ユーザが行う可能性の高い行動を行うことができる。行動を終了すると判断した場合（Ｓ９７：ＹＥＳ）、第２ユーザ端末１０の制御部１１は、第２ユーザ端末１０が第１ユーザモデル１２Ｍに基づいて行った行動の履歴情報を第１ユーザ端末１０へ送信する（Ｓ９８）。なお、第２ユーザ端末１０は、移動機構２０による移動、スピーカ１７及び表示部１６による音声及び映像の出力等の行動を行っている場合にもカメラ１９及びマイク１８を用いて第２ユーザ端末１０の周囲の映像及び音声を取得（撮影）しており、このような映像及び音声のデータを行動情報として第１ユーザ端末１０へ送信する。第１ユーザ端末１０の制御部１１は、第２ユーザ端末１０から行動の履歴情報（行動情報）を受信した場合、行動履歴ＤＢ１２ｃに記憶し（Ｓ９９）、処理を終了する。これにより、第２ユーザ端末１０において第１ユーザモデル１２Ｍに基づいて行われた行動の履歴情報が第１ユーザ端末１０の行動履歴ＤＢ１２ｃに記憶される。

上述した処理により、第１ユーザモデル１２Ｍが送信された第２ユーザ端末１０において、第２ユーザモデル１２Ｍに基づく行動処理が行われることにより、第１ユーザが行う可能性の高い行動を第２ユーザ端末１０において実行することができる。よって、第１アバターは、第１ユーザが行きたい場所に擬似的に出かけ、出かけた先で第２ユーザ端末１０を用いて、第１ユーザが行う可能性の高い行動を行うことができる。上述した処理により、第１ユーザが実際に外出する代わりに、第１アバターが擬似的に外出し、外出先で撮影した映像及び音声が履歴情報として行動履歴ＤＢ１２ｃに蓄積される。この履歴情報を第１ユーザが後日確認することにより、第１アバターが第２ユーザ端末１０において行った行動を辿ることができ、第１ユーザは自身が体験したように感じることができる。よって、第１ユーザが多忙で外出する時間を確保できない場合であっても、第１ユーザが行う可能性の高い行動を第１アバターが行うことにより、第１ユーザは様々な行動を擬似的に体験できる。

上述した処理において、第２ユーザ端末１０の制御部１１は、第１ユーザモデル１２Ｍに基づく行動を終了した後、例えば所定位置に戻ってくる（移動する）ように構成されていてもよい。この場合、第２ユーザ端末１０が第１ユーザモデル１２Ｍに貸し出された場合であっても、貸出後に所定位置に戻ることができるので、第２ユーザ端末１０の所有者である第２ユーザが例えば第２ユーザ端末１０を回収するような手間が増えない。

図１４は、履歴情報の再生処理手順の一例を示すフローチャート、図１５は、ユーザ端末１０における画面例を示す模式図である。図１４に示す処理は、図５，図８〜図９，図１１に示す対話処理によって対話履歴ＤＢ１２ｂに対話情報（対話の履歴情報）が蓄積され、図７，図１２〜図１３に示す行動処理によって行動履歴ＤＢ１２ｃに行動情報（行動の履歴情報）が蓄積されたユーザ端末１０において、履歴情報が再生される際の処理である。ユーザ端末１０の制御部１１は、対話履歴ＤＢ１２ｂ又は行動履歴ＤＢ１２ｃに蓄積されたいずれかの履歴情報の再生要求を受け付けたか否かを判断する（Ｓ１０１）。ユーザ端末１０のユーザは、対話又は行動の履歴情報を再生したい場合、例えばマイク１８又は入力部１５を介して履歴情報の再生要求を入力する。履歴情報の再生要求を受け付けていないと判断した場合（Ｓ１０１：ＮＯ）、制御部１１は再生要求を受け付けるまで待機する。

履歴情報の再生要求を受け付けたと判断した場合（Ｓ１０１：ＹＥＳ）、制御部１１は、対話履歴ＤＢ１２ｂに蓄積された対話の履歴情報と、行動履歴ＤＢ１２ｃに蓄積された行動の履歴情報とに基づいて、図１５に示すようにそれぞれの履歴情報に関する情報を表示する履歴画面を生成し（Ｓ１０２）、表示部１６に表示する（Ｓ１０３）。図１５に示す履歴画面は、自身のアバターが行った活動（対話及び行動）について、サムネイル画像及び活動内容を示す情報を表示する。具体的には、自身のユーザ端末１０（第１ユーザ端末１０）で第１ユーザモデル１２Ｍに基づいて行われた対話及び行動と、他のユーザ端末１０（第２ユーザ端末１０）で第１ユーザモデル１２Ｍに基づいて行われた対話及び行動とについて、サムネイル画像及び活動内容を示す情報が表示される。なお、サムネイル画像は、対話情報又は行動情報に含まれる画像（映像）から生成することができ、活動内容の情報は、対話については対話相手の情報及び対話した時刻を含み、行動については外出先の場所の情報及び外出した時刻を含む。また履歴画面は、自身のアバターが過去に行った活動（対話及び行動）におけるサムネイル画像及び活動内容を示す情報を表示させるための「過去の履歴」ボタンを表示している。よって、履歴画面において「過去の履歴」ボタンが入力部１５を介して操作された場合、制御部１１は、対話履歴ＤＢ１２ｂ及び行動履歴ＤＢ１２ｃに蓄積してある過去の履歴情報に関する情報を履歴画面に表示するように構成してある。

履歴画面は、表示された履歴情報のいずれかを再生対象に選択できるように構成されており、選択された履歴情報の再生を指示するための再生ボタンと、再生処理を終了するためのキャンセルボタンとを表示している。制御部１１は、履歴画面において入力部１５を介していずれかの履歴情報が選択されて再生ボタンが操作されたか否かに応じて、選択された履歴情報に対する再生指示を受け付けたか否かを判断する（Ｓ１０４）。再生指示を受け付けていないと判断した場合（Ｓ１０４：ＮＯ）、制御部１１は、履歴画面の表示を継続し、再生指示を受け付けるまで待機する。再生指示を受け付けたと判断した場合（Ｓ１０４：ＹＥＳ）、制御部１１は、選択された履歴情報を対話履歴ＤＢ１２ｂ又は行動履歴ＤＢ１２ｃから読み出し（Ｓ１０５）、読み出した履歴情報を表示部１６及びスピーカ１７にて出力する（Ｓ１０６）。制御部１１は、例えば履歴情報に画像データ（映像データ）が含まれる場合、画像データを表示部１６に表示し、履歴情報に音声データが含まれる場合、音声データをスピーカ１７から音声出力する。また履歴情報にテキストデータが含まれる場合、制御部１１は、テキストデータを表示部１６に表示する。これにより、ユーザ端末１０に設定した自身のアバターが、自身の端末（第１ユーザ端末１０）又は他の端末（第２ユーザ端末１０）で行った対話処理及び擬似的な外出処理を再現することができる。なお、ユーザ端末１０がプロジェクタを備える場合、又はプロジェクタが接続されている場合、制御部１１は、履歴情報をプロジェクタによって出力してもよい。

上述した処理により、本実施形態では、ユーザ端末１０のユーザ（自身）に代わってユーザが設定したアバターが、他のユーザ又は他のアバターと対話することができ、また、擬似的な外出を行うことができる。よって、ユーザ端末１０のユーザ（自身）は、蓄積された対話及び行動の履歴情報を再生することにより、アバターが行った対話の内容及び擬似的な外出先の映像及び音声を確認することができ、アバターが行った対話及び行動を辿ることができる。またユーザは、アバターが実行した対話及び行動を参考にして、実際の行動に移すことができ、現実世界での行動範囲の拡大が期待できる。

（実施形態２）
図１６は、実施形態２の情報処理システムの構成例を示すブロック図である。本実施形態の情報処理システムは、貸出用の学習モデルである貸出可能なユーザモデル（以下では貸出モデルという）が予め用意されており、各ユーザは、自身のユーザ端末１０に貸出モデルをダウンロードすることにより、貸出モデルに基づく対話及び行動を自身のユーザ端末１０で実現することができるシステムである。本実施形態の情報処理システムは、多数のユーザ端末１０と、貸出モデルを管理するモデル管理サーバ４０とを含み、ユーザ端末１０及びモデル管理サーバ４０のそれぞれは、ネットワークＮを介して相互に情報の送受信を行う。なお、図１６では１つのユーザ端末１０のみを示しており、ユーザ端末１０は実施形態１と同様の構成を有し、同様の処理を行う。

モデル管理サーバ４０は、パーソナルコンピュータ又はサーバコンピュータ等を用いて構成される。モデル管理サーバ４０は、制御部４１、記憶部４２、通信部４３、入力部４４、表示部４５、読み取り部４６等を含み、これらの各部はバスを介して相互に接続されている。制御部４１、記憶部４２、通信部４３、入力部４４、表示部４５、読み取り部４６の各部は、実施形態１で説明したユーザ端末１０の制御部１１、記憶部１２、通信部１４、入力部１５、表示部１６、読み取り部２２の各部と同様の構成を有するので、構成についての説明は省略する。なお、モデル管理サーバ４０の記憶部４２は、制御プログラム４２Ｐのほかに、複数の貸出モデル４２Ｍ１〜４２Ｍ３と、後述するモデル情報ＤＢ４２ａとを記憶する。図１６に示す例では３つの貸出モデル４２Ｍ１，４２Ｍ２，４２Ｍ３が記憶してあるが、記憶部４２には予め用意された多数の貸出モデルが記憶されている。以下では、第１貸出モデル４２Ｍ１〜第３貸出モデル４２Ｍ３…をまとめて貸出モデル４２Ｍとして説明する。貸出モデル４２Ｍ及びモデル情報ＤＢ４２ａは、モデル管理サーバ４０に接続された外部記憶装置に記憶されてもよく、モデル管理サーバ４０が通信可能な外部記憶装置に記憶されてもよい。

貸出モデル４２Ｍは、実施形態１で説明したユーザモデル１２Ｍと同様の構成を有し、同様の学習処理によって各ユーザの対話履歴及び行動履歴に基づいて各ユーザの固有情報が収集（学習）された学習済みモデルである。貸出モデル４２Ｍは、例えばスポーツ選手、芸能人、医師、看護師、栄養士、スポーツトレーナー、教師、料理の先生、弁護士、税理士等、様々な分野のユーザの固有情報を学習させたユーザモデルである。貸出モデル４２Ｍは、例えば各ユーザが自身のユーザ端末１０において学習させたユーザモデル１２Ｍをモデル管理サーバ４０へ送信して記憶部４２に記憶させたものである。なお、貸出モデル４２Ｍの学習は、モデル管理サーバ４０において行われてもよく、他の学習装置で行われてもよい。

図１７はモデル情報ＤＢ４２ａの構成例を示す模式図である。モデル情報ＤＢ４２ａは、モデル管理サーバ４０の記憶部４２に登録された貸出モデル４２Ｍに関する情報を記憶する。図１７に示すモデル情報ＤＢ４２ａは、貸出モデルＩＤ列、氏名列、プロフィール列、料金列、貸出可能数列、貸出状況列等を含む。貸出モデルＩＤ列は、記憶部４２に記憶された貸出モデル４２Ｍのそれぞれに割り当てられた識別情報を記憶する。氏名列は、貸出モデルＩＤに対応付けて、貸出モデル４２Ｍに対応するユーザの氏名を記憶し、プロフィール列は、貸出モデル４２Ｍに対応するユーザのプロフィールを記憶する。料金列は、貸出モデルＩＤに対応付けて、貸出モデル４２Ｍを貸し出す際の料金（使用料）の情報を記憶する。料金の情報は例えば１時間単位等のような所定時間単位の料金、貸出モデル４２Ｍに対して行いたい質問の個数（対話の実行回数）に応じた料金等を示す。貸出可能数列は、貸出モデルＩＤに対応付けて、例えば同時に貸出できる数（貸出先のユーザ数）を記憶する。なお、貸出料金は、貸出モデル４２Ｍに設定された貸出可能数（同時にデプロイ可能なユーザ端末１０の装置数）に応じた料金としてもよく、例えば貸出可能数が少ないほど高い料金が設定されてもよい。貸出状況列は、貸出モデル４２Ｍの貸出状況を示す情報を記憶する。貸出状況を示す情報は、例えば貸出が行われた日時、貸出が予約された日時等の情報を記憶する。

モデル情報ＤＢ４２ａに記憶される貸出モデルＩＤは、新たな貸出モデル４２Ｍが記憶部４２に記憶される際に、制御部４１によって発行されて記憶される。モデル情報ＤＢ４２ａに記憶される氏名及びプロフィールは、例えば新たな貸出モデル４２Ｍが記憶部４２に記憶される際に、制御部４１が通信部４３を介して取得して記憶される。モデル情報ＤＢ４２ａに記憶される料金及び貸出可能数は、例えば貸出モデル４２Ｍに対応するユーザによって設定され、制御部４１が通信部４３を介して取得して記憶又は変更される。モデル情報ＤＢ４２ａに記憶される貸出状況は、貸出モデル４２Ｍがユーザ端末１０に貸し出された際又は貸出が予約された際に、制御部４１が貸し出した日時又は予約された日時を記憶する。モデル情報ＤＢ４２ａの記憶内容は図１７に示す例に限定されず、貸出モデル４２Ｍに関する各種の情報を記憶することができる。

以下に、ユーザ端末１０がモデル管理サーバ４０から貸出モデル４２Ｍをダウンロードし、貸出モデル４２Ｍに基づく対話及び行動をユーザ端末１０で実行する処理について説明する。図１８は、貸出モデル４２Ｍの貸出処理手順の一例を示すフローチャート、図１９は、ユーザ端末１０における画面例を示す模式図である。図１８では左側にユーザ端末１０が行う処理を、右側にモデル管理サーバ４０が行う処理をそれぞれ示す。

ユーザ端末１０の制御部１１は、マイク１８又は入力部１５を介して自端末のユーザから、貸出モデル４２Ｍの貸出要求を受け付けたか否かを判断する（Ｓ１１１）。ユーザは、モデル管理サーバ４０が管理している貸出可能な貸出モデル４２Ｍを借りたい場合、例えば貸出モデル４２Ｍを借りたい旨のメッセージをマイク１８を介して音声入力する。また、ユーザ端末１０の表示部１６に、貸出モデル４２Ｍの貸出を要求するための貸出ボタンが表示されている場合、ユーザは、入力部１５を介して貸出ボタンを操作する。ユーザ端末１０の制御部１１は、貸出モデル４２Ｍの貸出要求を受け付けていないと判断した場合（Ｓ１１１：ＮＯ）、待機する。貸出モデル４２Ｍの貸出要求を受け付けたと判断した場合（Ｓ１１１：ＹＥＳ）、制御部１１は、モデル管理サーバ４０に、貸出モデル４２Ｍのリストを要求する（Ｓ１１２）。なお、モデル管理サーバ４０の宛先情報は例えば記憶部１２に記憶してある。

モデル管理サーバ４０の制御部４１は、いずれかのユーザ端末１０から貸出モデル４２Ｍのリストを要求された場合、モデル情報ＤＢ４２ａの記憶内容に基づいて、貸出可能な貸出モデル４２Ｍのリストを生成してユーザ端末１０へ送信する（Ｓ１１３）。ユーザ端末１０の制御部１１は、モデル管理サーバ４０から受信した貸出モデル４２Ｍのリストに基づいて、図１９に示すようなリストを表示部１６に表示する（Ｓ１１４）。図１９に示すリストは、貸出モデル４２Ｍに対応するユーザを専門分野毎に分類し、専門分野毎に、各ユーザの氏名、プロフィール、貸出料金等を表示する。図１９に示すリストでは、貸出モデル４２Ｍのユーザとしてスポーツ分野（スポーツ選手）、芸能分野（芸能人）、医療分野（医師）のユーザの固有情報を学習させた貸出モデル４２Ｍのリストが表示されている。リストにおいて各貸出モデル４２Ｍの情報は選択可能に表示されており、ユーザ端末１０のユーザは入力部１５を介して、借りたい貸出モデル４２Ｍを選択して決定ボタンを操作する。ユーザ端末１０の制御部１１は、任意の貸出モデル４２Ｍが選択されて決定ボタンが操作されることにより、選択された貸出モデル４２Ｍの貸出指示を受け付ける。よって、制御部１１は、貸出モデル４２Ｍの貸出指示を受け付けたか否かを判断しており（Ｓ１１５）、受け付けていないと判断した場合（Ｓ１１５：ＮＯ）、貸出モデル４２Ｍのリストの表示を継続する（Ｓ１１４）。

貸出モデル４２Ｍの貸出指示を受け付けたと判断した場合（Ｓ１１５：ＹＥＳ）、制御部１１は、選択された貸出モデル４２Ｍの貸出をモデル管理サーバ４０に要求する（Ｓ１１６）。なお、制御部１１は、例えば貸出モデル４２Ｍのリストを介して、ユーザが希望する貸出時間を受け付け、貸出時間を含み、貸出モデル４２Ｍの貸出を要求する要求信号をモデル管理サーバ４０へ送信する。モデル管理サーバ４０の制御部４１（デプロイ部）は、いずれかのユーザ端末１０から貸出モデル４２Ｍの貸出を要求された場合、要求された貸出モデル４２Ｍを記憶部４２から読み出してユーザ端末１０へ送信（デプロイ）する（Ｓ１１７）。なお、モデル管理サーバ４０の制御部４１は、貸出を要求された貸出モデル４２Ｍについて、貸出状況及び貸出可能数を確認し、貸し出し可能である場合に、貸出モデル４２Ｍをユーザ端末１０へ送信する。

ユーザ端末１０の制御部１１は、モデル管理サーバ４０から送信された貸出モデル４２Ｍを受信し、受信した貸出モデル４２Ｍを記憶部１２に記憶し、貸出モデル４２Ｍに基づく処理を行えるようにデプロイする。なお、制御部１１は、貸出モデル４２Ｍがデプロイされた場合、ユーザ端末１０のハードウェア各部を、貸出モデル４２Ｍに基づく処理によって占有されるように構成されている。これにより、例えばユーザ端末１０のユーザモデル１２Ｍに基づく処理と、貸出モデル４２Ｍに基づく処理とが混在する状況を回避する。そして制御部１１は、貸出モデル４２Ｍに基づく処理を開始する（Ｓ１１８）。これにより、ユーザ端末１０の制御部１１は、図９に示す対話処理において第２ユーザ端末１０が行っていたステップＳ４８〜Ｓ５３の処理と同様の処理を行い（Ｓ１１９〜Ｓ１２４）、貸出モデル４２Ｍに基づいて、ユーザ端末１０のユーザと、貸出モデル４２Ｍのアバターとの対話を実現する。具体的には、ユーザ端末１０の制御部１１は、ユーザ端末１０のユーザからのメッセージを受け付けたか否かを判断し（Ｓ１１９）、受け付けていないと判断した場合（Ｓ１１９：ＮＯ）、貸出モデル４２Ｍに基づいてユーザと対話すべき対話メッセージを生成し（Ｓ１２０）、生成した対話メッセージを出力する（Ｓ１２１）。またユーザからのメッセージを受け付けたと判断した場合（Ｓ１１９：ＹＥＳ）、制御部１１は、受け付けたメッセージに対する返答メッセージを貸出モデル４２Ｍに基づいて生成（特定）し（Ｓ１２２）、生成した返答メッセージを出力する（Ｓ１２３）。これにより、ユーザ端末１０は、貸出モデル４２Ｍに基づく貸出モデル４２Ｍのアバターと、ユーザ端末１０のユーザとの間の対話を行うことができる。

ステップＳ１２１又はステップＳ１２３の処理後、ユーザ端末１０の制御部１１は、貸出モデル４２Ｍのアバターとユーザとの対話を終了するか否かを判断し（Ｓ１２４）、終了しないと判断した場合（Ｓ１２４：ＮＯ）、ステップＳ１１９の処理に戻り、ステップＳ１１９〜Ｓ１２４の処理を繰り返す。対話を終了すると判断した場合（Ｓ１２４：ＹＥＳ）、制御部１１は、ユーザ端末１０のユーザと貸出モデル４２Ｍに基づくアバターとの間で行われた対話の対話情報を対話の履歴情報として記憶部１２の対話履歴ＤＢ１２ｂに記憶し（Ｓ１２５）、処理を終了する。なお、ステップＳ１２４において、制御部１１は、ユーザ端末１０が貸出モデル４２Ｍの貸出をモデル管理サーバ４０に要求する際に指定した貸出時間が経過した場合に貸出モデル４２Ｍに基づく対話を終了すると判断してもよい。また、貸出モデル４２Ｍが、指定された貸出時間が経過した場合に使用禁止となるように構成されていてもよい。この場合、貸出時間が経過すれば貸出モデル４２Ｍの使用ができなくなる。なお、例えばモデル管理サーバ４０の制御部４１は、貸出モデル４２Ｍをユーザ端末１０へ送信した場合、又はユーザ端末１０が貸出モデル４２Ｍの使用を終了した場合、貸出モデル４２Ｍの貸出料金（使用料金）の課金処理を行ってもよい。例えば、モデル管理サーバ４０の制御部４１は、貸出モデル４２Ｍに設定されていた貸出料金の支払いを要求する要求情報をユーザ端末１０へ送信し、ユーザ端末１０の制御部１１は、要求情報に従って貸出料金の支払処理を行ってもよい。

上述した処理により、ユーザは、モデル管理サーバ４０を介して貸出可能な貸出モデル４２Ｍを借り受け、自身のユーザ端末１０において貸出モデル４２Ｍに基づく処理を実行することにより、貸出モデル４２Ｍのアバターと対話することができ、貸出モデル４２Ｍのユーザと疑似的な対話を実現できる。貸出モデル４２Ｍを用いて、貸出モデル４２Ｍのユーザの代わりに、ユーザ端末１０のユーザとの対話を行うので、多忙な有名人又は専門家の代わりに、貸出モデル４２Ｍのアバターがユーザ端末１０のユーザからの質問に回答し、アドバイス等を行うことができる。具体的には、例えばユーザ端末１０に料理の先生のアバター（貸出モデル４２Ｍ）を借り受け、ユーザ端末１０のユーザが、料理の先生のアバターと対話しながら料理することにより、料理の先生のアバターからアドバイスを受けつつ料理することができる。また、ユーザ端末１０のユーザが有名人又は専門家と直接対話し辛い内容であっても、有名人又は専門家のアバターと対話することにより、気軽に相談できるようになる。

本実施形態においても、実施形態１と同様の効果が得られる。また本実施形態では、有名人又は専門家の固有情報を学習させた貸出モデル４２Ｍの貸出が可能であり、各ユーザは、貸出モデル４２Ｍを自身のユーザ端末１０にダウンロードして実行させることにより、有名人又は専門家のそれぞれが行う可能性の高い対話を自身のユーザ端末１０で実現することができる。よって、ユーザは、専門家等の意見を聞きたい場合に、専門家の貸出モデル４２Ｍを借り受けて自身のユーザ端末１０で貸出モデル４２Ｍに基づく対話処理を実行させることにより、専門家のアバターと対話することができ、専門家との疑似的な対話を実現できる。この場合、専門家自身が対応できるユーザの数には限度があるが、貸出モデル４２Ｍを貸し出すことにより、専門家が疑似的に各ユーザの質問等に回答できるので、多数のユーザの悩みを解消できることが期待される。また例えば好きな芸人がいる場合に、劇場に行けない状況であっても、ユーザが、この芸人の貸出モデル４２Ｍを借り受けて自身のユーザ端末１０で貸出モデル４２Ｍに基づく処理を実行させることにより、好きな芸人のアバターと対話することができ、芸人との疑似的な対話を実現できる。なお、ユーザ端末１０は、貸し出された貸出モデル４２Ｍに基づく対話処理だけでなく行動処理を実行してもよく、この場合、貸出モデル４２Ｍのユーザが行う可能性の高い行動をユーザ端末１０において実現できる。よって、ユーザ端末１０のユーザは、貸出モデル４２Ｍのユーザとの擬似的な行動を、ユーザ端末１０が実現する貸出モデル４２Ｍのアバターを介して実現できる。

本実施形態において、貸出モデル４２Ｍは、貸出先のユーザ端末１０において、貸出先のユーザ端末１０のユーザとの間で行った対話処理及び行動処理の内容に基づいて再学習するように構成されていてもよい。これにより、貸出先のユーザ端末１０で行った対話処理及び行動処理の履歴に基づいて、貸出モデル４２Ｍのユーザに関する情報を更に収集（学習）することができ、貸出モデル４２Ｍに蓄積できる。なお、貸出先のユーザ端末１０で再学習された貸出モデル４２Ｍは、モデル管理サーバ４０に返送され、モデル管理サーバ４０の記憶部４２に記憶してある貸出モデル４２Ｍ（再学習前の貸出モデル４２Ｍ）とは別に記憶してもよく、上書き保存してもよい。これにより、再学習された貸出モデル４２Ｍを貸し出し対象のモデルとすることができる。なお、貸出モデル４２Ｍは、貸出先のユーザ端末１０での対話処理及び行動処理の履歴に基づく再学習を行うか否かを選択できるように構成されていてもよい。

（実施形態３）
図２０は、実施形態３の情報処理システムの構成例を示すブロック図である。本実施形態の情報処理システムは、貸出用の情報処理装置である貸出可能な端末（以下では貸出端末という）が予め用意されており、各ユーザのユーザモデル１２Ｍを貸出端末にダウンロードすることにより、貸出端末において各ユーザのユーザモデル１２Ｍに基づく対話及び行動を実現することができるシステムである。本実施形態の情報処理システムは、例えば観光地に分散配置された複数の貸出端末５０と、貸出端末５０を管理する端末管理サーバ７０とを含み、貸出端末５０及び端末管理サーバ７０のそれぞれは、ネットワークＮを介して相互に情報の送受信を行う。なお、図２０では観光地Ａ，Ｂにそれぞれ３つの貸出端末５０が配置されている例を示しているが、各観光地に４つ以上の貸出端末５０が配置されていてもよい。

図２１は、貸出端末５０の構成例を示すブロック図である。貸出端末５０は、実施形態１のユーザ端末１０と同様の構成を有しており、制御部５１、記憶部５２、処理部５３、通信部５４、入力部５５、表示部５６、スピーカ５７、マイク５８、カメラ５９、移動機構６０、センサ部６１等を含む。上述した各部５１〜６１は、実施形態１のユーザ端末１０の各部１１〜２１と同様の構成を有するので、構成についての説明は省略する。なお、貸出端末５０の記憶部５２は、制御プログラム５２Ｐのみを記憶している。また、貸出端末５０は、実施形態１のユーザ端末１０と同様に読み取り部を有する構成でもよい。本実施形態の貸出端末５０は、図２０中の観光地Ａ，Ｂにおける左側の貸出端末５０のように、実施形態１のユーザ端末１０と同様の構成を有する端末であってもよい。また、図２０中の観光地Ａ，Ｂにおける中央の貸出端末５０のように移動機構を備えない端末であってもよく、右側の貸出端末５０のように移動機構として飛行機構を備える端末であってもよい。なお、各貸出端末５０において、それぞれの外形に応じて適切な位置に表示部５６、スピーカ５７、マイク５８、カメラ５９が設けられている。

図２２は、端末管理サーバ７０の構成例を示す模式図である。端末管理サーバ７０は、パーソナルコンピュータ又はサーバコンピュータ等を用いて構成され、制御部７１、記憶部７２、通信部７３、入力部７４、表示部７５、読み取り部７６等を含む。上述した各部７１〜７６は、実施形態２のモデル管理サーバ４０の各部４１〜４６と同様の構成を有するので、構成についての説明は省略する。なお、端末管理サーバ７０の記憶部７２は、制御プログラム７２Ｐのほかに、後述する端末情報ＤＢ７２ａ及び貸出状況ＤＢ７２ｂを記憶している。

図２３は、端末管理サーバ７０に記憶されるＤＢ７２ａ〜７２ｂの構成例を示す模式図である。図２３Ａは端末情報ＤＢ７２ａを、図２３Ｂは貸出状況ＤＢ７２ｂをそれぞれ示す。端末情報ＤＢ７２ａは、貸出可能に観光地等に配置された貸出端末に関する情報を記憶する。図２３に示す端末情報ＤＢ７２ａは、貸出端末ＩＤ列、設置場所列、リソース列、料金列等を含む。貸出端末ＩＤ列は、貸出端末５０のそれぞれに割り当てられた識別情報を記憶する。設置場所列は、貸出端末ＩＤに対応付けて、貸出端末５０の設置場所に関する情報を記憶する。設置場所の情報は、例えば住所、地名、ランドマーク名、緯度及び経度等を用いることができる。リソース列は、貸出端末ＩＤに対応付けて、貸出端末５０が有する機能、ハードウェア資源等に関する情報を記憶する。例えば、貸出端末５０が有するマイク５８及びカメラ５９の性能を示す情報、及び移動機構６０によって移動できる距離、時間、移動方法等がリソース列に記憶される。具体的には、マイク５８の集音方向（指向性）、カメラ５９が全方位カメラであるか否か、カメラ５９のレンズの種類、移動機構６０が飛行可能であるか否か等の情報が記憶される。料金列は、貸出端末ＩＤに対応付けて、貸出端末５０を借りる際の料金（貸出料金）の情報を記憶する。料金の情報は例えば１時間単位等のような所定時間単位の料金、貸出端末５０においてデプロイされるユーザモデル１２Ｍに基づく処理の実行回数（処理回数）に応じた料金等を示す。なお、貸出端末５０に対する貸出料金は、例えば貸出端末５０が有する機能の品質に応じて設定されてもよい。

端末情報ＤＢ７２ａに記憶される貸出端末ＩＤは、新たな貸出端末５０の情報が記憶部７２に記憶される際に、制御部７１によって発行されて記憶される。端末情報ＤＢ７２ａに記憶される設置場所及びリソースの情報は、例えば新たな貸出端末５０が登録される際、又は登録内容が変更される際に、制御部７１が通信部７３を介して取得して記憶される。端末情報ＤＢ７２ａに記憶される料金は、例えば貸出端末５０の所有者によって設定され、制御部７１が通信部７３を介して取得して記憶又は変更される。端末情報ＤＢ７２ａの記憶内容は図２３Ａに示す例に限定されず、貸出端末５０に関する各種の情報を記憶することができる。

貸出状況ＤＢ７２ｂは、端末情報ＤＢ７２ａに登録された貸出端末５０の貸出状況を記憶する。図２３Ｂに示す貸出状況ＤＢ７２ｂは、貸出端末ＩＤ列、予約情報列、予約可能時間帯列等を含む。貸出端末ＩＤ列は、貸出端末５０の識別情報を記憶する。予約情報列は、貸出端末ＩＤに対応付けて、貸出端末５０に対して予約された貸出状況（予約状況）を示す情報を記憶する。具体的には、予約情報列は予約時間帯列及び予約者情報列を含み、予約時間帯列は、貸出端末５０の使用が予約された日時の情報を記憶し、予約者情報列は、貸出端末５０の使用を予約したユーザ（予約者）の情報を記憶する。予約者の情報は例えば予約者の氏名等の情報、予約者のユーザ端末１０を特定するための情報等を用いることができる。予約可能時間帯列は、貸出端末ＩＤに対応付けて、貸出端末５０に設定された貸出可能な時間帯を記憶する。

貸出状況ＤＢ７２ｂに記憶される貸出端末ＩＤは、例えば端末情報ＤＢ７２ａに新たな貸出端末５０の情報が登録された場合に、端末情報ＤＢ７２ａに記憶された貸出端末ＩＤが制御部７１によって記憶される。貸出状況ＤＢ７２ｂに記憶される予約情報は、制御部７１がユーザ端末１０から貸出端末５０の貸出の予約又は予約の変更を受け付け、予約又は予約の変更が成立した場合に、制御部７１によって記憶又は更新される。貸出状況ＤＢ７２ｂに記憶される予約可能時間帯は、例えば貸出端末５０の所有者（ユーザ）によって設定され、制御部７１が通信部７３を介して取得して記憶又は変更される。貸出状況ＤＢ７２ｂの記憶内容は図２３Ｂに示す例に限定されず、貸出端末５０に対する予約状況に関する各種の情報を記憶することができる。

以下に、ユーザ端末１０のユーザが貸出端末５０の貸出を予約し、予約した貸出端末５０に自身のユーザモデル１２Ｍをダウンロードし、自身のユーザモデル１２Ｍに基づく対話及び行動を貸出端末５０で実行する処理について説明する。図２４は、貸出端末５０の貸出に対する予約処理手順の一例を示すフローチャート、図２５は、ユーザ端末１０における画面例を示す模式図である。図２４では左側にユーザ端末１０が行う処理を、右側に端末管理サーバ７０が行う処理をそれぞれ示す。

ユーザ端末１０の制御部１１は、ユーザモデル１２Ｍに基づいて、ユーザ端末１０の設置場所から離れた場所でユーザが行きたい場所があるか否かを判断する（Ｓ１３１）。ユーザモデル１２Ｍに基づいてユーザが行きたい場所を特定することにより、ユーザが行きたい可能性の高い場所を特定できる。ユーザが行きたい場所がないと判断した場合（Ｓ１３１：ＮＯ）、制御部１１は待機する。ユーザが行きたい場所があると判断した場合（Ｓ１３１：ＹＥＳ）、制御部１１は、端末管理サーバ７０に、貸出端末５０のリストを要求する（Ｓ１３２）。なお、端末管理サーバ７０の宛先情報は例えば記憶部１２に記憶してある。

端末管理サーバ７０の制御部７１は、いずれかのユーザ端末１０から貸出端末５０のリストを要求された場合、端末情報ＤＢ７２ａの記憶内容に基づいて、貸出可能な貸出端末５０のリストを生成してユーザ端末１０へ送信する（Ｓ１３３）。ユーザ端末１０の制御部１１は、端末管理サーバ７０から受信した貸出端末５０のリストに基づいて、図２５に示すようなリストを表示部１６に表示する（Ｓ１３４）。図２５に示すリストは、貸出端末５０の設置場所毎（例えば観光地毎）に各貸出端末５０の設置場所、端末リソース、貸出料金等を表示する。なお、各貸出端末５０に端末名が付加されている場合には、リストに各貸出端末５０の端末名を表示してもよい。また、貸出端末５０のリストは、貸出端末５０の貸出を予約したい予約時間帯を入力する入力欄を有する。制御部１１は、ユーザモデル１２Ｍに基づいて予約時間帯を決定し、入力欄に対して予約時間帯を入力する。例えば、制御部１１は、「いつ行く？」のメッセージをユーザモデル１２Ｍに入力し、ユーザモデル１２Ｍからの出力情報に基づいて、予約時間帯を決定することができる。なお、制御部１１は、入力欄に対する予約時間帯の入力を入力部１５を介してユーザから受け付けてもよく、この場合、受け付けた予約時間帯を入力欄に入力する。また、リストにおいて各貸出端末５０の情報は選択可能に表示されており、制御部１１は、ユーザモデル１２Ｍに基づいて特定した、ユーザが行きたい場所に対応する貸出端末５０を選択する。なお、貸出端末５０の選択も入力部１５を介してユーザから受け付けてもよく、この場合、制御部１１は、入力部１５を介して受け付けた貸出端末５０を選択する。ユーザ端末１０の制御部１１は、貸出端末５０を選択し、予約時間帯を決定した場合、貸出端末５０の貸出指示を行うか否かを判断する（Ｓ１３５）。なお、貸出端末５０の選択及び予約時間帯の入力をユーザ端末１０のユーザが行う場合、ユーザは、リストに表示された各貸出端末５０の設置場所及びリソース等を確認し、入力部１５を介して借りたい貸出端末５０を選択して予約時間帯を入力して決定ボタンを操作する。この場合、制御部１１は、入力部１５を介して貸出端末５０の貸出指示を受け付ける。制御部１１は、貸出端末５０の貸出指示を行わないと判断した場合（Ｓ１３５：ＮＯ）、即ち、貸出端末５０の選択及び予約時間帯の決定が完了していない場合、貸出端末５０のリストの表示を継続する（Ｓ１３４）。貸出端末５０の貸出指示を行うと判断した場合（Ｓ１３５：ＹＥＳ）、制御部１１は、選択した貸出端末５０の貸出の予約を端末管理サーバ７０に申し込む（Ｓ１３６）。なお、制御部１１は、貸出端末５０のリストを介して選択した貸出端末５０の情報と、指定した予約時間帯の情報とを含み、貸出端末５０の貸出を予約する予約申込信号を端末管理サーバ７０へ送信する。

端末管理サーバ７０の制御部７１は、いずれかのユーザ端末１０からいずれかの貸出端末５０に対する貸出予約の申込を受け付けた場合、予約申込された貸出端末５０に対して、予約申込された予約時間帯での予約を行う（Ｓ１３７）。具体的には、制御部７１は、予約申込された貸出端末５０の貸出端末ＩＤに対応付けて、予約申込された予約時間帯と、予約申込してきたユーザ（予約者）の情報（予約者情報）とを予約情報として貸出状況ＤＢ７２ｂに記憶して予約処理を行う。なお、制御部７１は、予約申込された予約時間帯での貸出が可能であるか否かを判断し、可能である場合に予約処理を行う。具体的には、制御部７１は、予約申込された予約時間帯が、予約申込された貸出端末５０の予約可能時間帯内であるか否かを判断し、更に、予約申込された予約時間帯に他のユーザの予約があるか否かを判断する。そして制御部７１は、予約時間帯が予約可能時間帯内であり、予約時間帯に他のユーザの予約がない場合に、予約時間帯での予約が可能であると判断する。なお、予約時間帯での貸出が可能でないと判断した場合、即ち、予約時間帯が予約可能時間帯内でない場合、又は予約時間帯に対して既に他のユーザの予約がある場合、制御部７１は、予約時間帯での予約（貸出）ができない旨をユーザ端末１０に通知してもよい。この場合、予約できない旨を通知されたユーザは、予約時間帯を変更して再度予約申込を行うことができる。制御部７１は、予約が完了した後、予約した貸出端末５０の情報及び予約時間帯を含む予約情報をユーザ端末１０に送信し（Ｓ１３８）、予約が完了したことをユーザ端末１０に通知する。なお、制御部７１は、予約処理の際に、予約した貸出端末５０を貸し出す際に貸出端末５０がユーザ端末１０を認証するためのパスワード等の認証情報を生成しており、認証情報も予約情報に含めてユーザ端末１０へ送信する。更に制御部７１は、予約者情報、予約時間帯及び認証情報を含む予約情報を貸出端末５０に送信しておく。

ユーザ端末１０の制御部１１は、端末管理サーバ７０から、予約した貸出端末５０の情報、予約時間帯及び認証情報を含む予約情報を受信し、受信した予約情報を記憶部１２に記憶し（Ｓ１３９）、予約処理を終了する。上述した処理により、ユーザ端末１０のユーザは、端末管理サーバ７０を介して貸出可能な貸出端末５０に対する貸出予約を行うことができる。

図２６及び図２７は、貸出端末５０の貸出処理手順の一例を示すフローチャートである。図２６及び図２７では左側にユーザ端末１０が行う処理を、右側に貸出端末５０が行う処理をそれぞれ示す。ユーザ端末１０の制御部１１は、貸出端末５０の貸出を予約した予約時間が到来したか否かを判断し（Ｓ１５１）、到来していないと判断する場合（Ｓ１５１：ＮＯ）、待機する。予約時間が到来したと判断した場合（Ｓ１５１：ＹＥＳ）、制御部１１は、端末管理サーバ７０から受信した予約情報に基づいて、予約した貸出端末５０に貸出を申し込む（Ｓ１５２）。制御部１１は、予約情報に含まれる貸出端末５０の情報（例えば宛先情報）に基づいて、予約情報に含まれる認証情報を含む貸出申込情報を貸出端末５０に送信する。貸出端末５０の制御部５１は、ユーザ端末１０から貸出申込情報を受信した場合、貸出申込情報に含まれる認証情報に基づいてユーザ端末１０を認証する。具体的には、制御部５１は、貸出申込情報に含まれる認証情報が、端末管理サーバ７０から受信した予約情報に含まれる認証情報に一致するか否かを判断し、一致する場合、貸出申込情報を送信してきたユーザ端末１０は正当な端末であると認証し、一致しない場合は認証しない。

制御部５１は、貸出申込情報を送信してきたユーザ端末１０を認証できたか否かを判断しており（Ｓ１５３）、認証できなかった場合（Ｓ１５３：ＮＯ）、貸出端末５０を貸出できないことをユーザ端末１０へ送信する（Ｓ１５４）。ユーザ端末１０の制御部１１は、貸出申込した貸出端末５０から貸出できないことを受信した場合（Ｓ１５５）、処理を終了する。貸出端末５０の制御部５１は、ユーザ端末１０を認証できたと判断した場合（Ｓ１５３：ＹＥＳ）、貸出端末５０を貸出できることをユーザ端末１０へ送信する（Ｓ１５６）。ユーザ端末１０の制御部１１は、貸出申込した貸出端末５０から貸出できることを受信した場合、自身のユーザモデル１２Ｍを記憶部１２から読み出して貸出端末５０へ送信する（Ｓ１５７）。なお、制御部１１は、端末管理サーバ７０から受信した予約情報に含まれる貸出端末５０の情報に基づいて、ユーザモデル１２Ｍを貸出端末５０へ送信する。

貸出端末５０の制御部５１は、ユーザ端末１０からユーザモデル１２Ｍを受信した場合、ユーザモデル１２Ｍを記憶部５２に記憶し、ユーザモデル１２Ｍに基づく処理を行えるようにデプロイする。そして制御部５１は、ユーザモデル１２Ｍに基づく処理を開始する（Ｓ１５８）。これにより、貸出端末５０の制御部５１は、図７に示す行動処理と同様の処理を行い（Ｓ１５９〜Ｓ１６５）、貸出端末５０がユーザモデル１２Ｍに基づく処理を行うことにより、ユーザモデル１２Ｍ（ユーザのアバター）は、貸出端末５０を用いて各種の行動を行うことができる。

具体的には、貸出端末５０の制御部５１は、ユーザ端末１０から受信したユーザモデル１２Ｍに基づいて、貸出端末５０の設置場所の近傍で、ユーザ端末１０のユーザが行きたい場所があるか否かを判断し、行きたい場所があるか否に応じて移動するか否かを判断する（Ｓ１５９）。なお、ここでの移動は、地表上での移動だけでなく飛行による移動も含まれる。貸出端末５０の制御部５１（行動処理部５３ｂ）は、移動すると判断した場合（Ｓ１５９：ＹＥＳ）、移動機構６０を用いて行きたい場所まで移動し（Ｓ１６０）、移動しないと判断した場合（Ｓ１５９：ＮＯ）、ステップＳ１６０の処理をスキップする。次に制御部５１は、ユーザモデル１２Ｍに基づいて、ユーザが撮影又は録音したいか否かを判断し、撮影又は録音したいか否かに応じて撮影及び／又は録音するか否かを判断する（Ｓ１６１）。撮影及び／又は録音すると判断した場合（Ｓ１６１：ＹＥＳ）、制御部５１は、カメラ５９及びマイク５８を用いて貸出端末５０の周囲の撮影及び録音を行う（Ｓ１６２）。なお、貸出端末５０の行動処理部５３ｂは、ユーザモデル１２Ｍに基づいてユーザが撮影したい可能性の高い被写体を特定し、特定した被写体の撮影及び録音を行う。撮影及び録音しないと判断した場合（Ｓ１６１：ＮＯ）、制御部５１はステップＳ１６２の処理をスキップする。

次に制御部５１は、ユーザモデル１２Ｍに基づいて、ユーザが音声又は映像を出力したいか否かを判断し、音声又は映像を出力したいか否かに応じて音声及び／又は映像を出力するか否かを判断する（Ｓ１６３）。制御部５１は、音声及び／又は映像を出力すると判断した場合（Ｓ１６３：ＹＥＳ）、スピーカ５７又は表示部５６を用いて音声及び／又は映像を出力し（Ｓ１６４）、音声及び映像を出力しないと判断した場合（Ｓ１６３：ＮＯ）、ステップＳ１６４の処理をスキップする。制御部５１は、ユーザモデル１２Ｍに基づく行動を終了するか否かを判断する（Ｓ１６５）。なお、制御部５１は、ユーザモデル１２Ｍに基づいてユーザが行動（疑似的な外出）を終了したい可能性が高いと判断される場合、行動を終了すると判断してもよい。また制御部５１は、端末管理サーバ７０から受信した予約情報に含まれる予約時間が満了した場合に行動を終了すると判断してもよい。更に、貸出端末５０が、予約時間を満了した場合に所定のスタンバイ位置に戻って動作を終了するように構成されていてもよい。この場合、予約時間が満了すれば貸出端末５０の使用ができなくなる。なお、例えば端末管理サーバ７０の制御部７１は、貸出端末５０の予約を行った場合、又はユーザ端末１０のユーザモデル１２Ｍが貸出端末５０にデプロイされた場合に、貸出端末５０の貸出料金（使用料金）の課金処理を行ってもよい。例えば、端末管理サーバ７０の制御部７１は、貸出端末５０に設定されていた貸出料金の支払いを要求する要求情報をユーザ端末１０へ送信し、ユーザ端末１０の制御部１１は、要求情報に従って貸出料金の支払処理を行ってもよい。

行動を終了しないと判断した場合（Ｓ１６５：ＮＯ）、制御部５１は、ステップＳ１５９の処理に戻り、ステップＳ１５９〜Ｓ１６４の処理を繰り返す。これにより、貸出端末５０は、ユーザモデル１２Ｍに基づいてユーザ端末１０のユーザが行う可能性の高い行動を行うことができる。即ち、貸出端末５０は、デプロイされるユーザモデル１２Ｍに基づく処理を実行するので、ユーザモデル１２Ｍ毎に異なる行動を行い、ユーザモデル１２Ｍのユーザの趣味、好み、行動傾向等に応じた行動を実現することができる。行動を終了すると判断した場合（Ｓ１６５：ＹＥＳ）、貸出端末５０の制御部５１は、貸出端末５０がユーザモデル１２Ｍに基づいて行った行動の履歴情報をユーザ端末１０へ送信する（Ｓ１６６）。なお、貸出端末５０は、移動機構６０による移動、スピーカ５７及び表示部５６による音声及び映像の出力等の行動を行っている場合にもカメラ５９及びマイク５８を用いて貸出端末５０の周囲の映像及び音声を取得（撮影）しており、このような映像及び音声のデータを行動情報としてユーザ端末１０へ送信する。

ユーザ端末１０の制御部１１は、貸出端末５０から送信された行動の履歴情報（行動情報、処理結果）を受信し、受信した履歴情報を行動履歴ＤＢ１２ｃに記憶し（Ｓ１６７）、処理を終了する。これにより、貸出端末５０においてユーザモデル１２Ｍに基づいて行われた行動の履歴情報（処理結果）がユーザ端末１０の行動履歴ＤＢ１２ｃに記憶される。

上述した処理により、ユーザ端末１０からユーザモデル１２Ｍが送信された貸出端末５０において、ユーザモデル１２Ｍに基づく行動処理が行われることにより、ユーザが行う可能性の高い行動を貸出端末５０において実行することができる。これにより、ユーザが実際に外出する代わりに、ユーザのアバターが疑似的に外出し、外出先で撮影した映像及び音声が履歴情報として行動履歴ＤＢ１２ｃに蓄積される。この履歴情報（処理結果）をユーザが後日確認することにより、アバターが貸出端末５０において行った行動を辿ることができ、ユーザはアバターの体験を自身の体験のように感じることができ、様々な行動を疑似的に体験できる。

本実施形態においても、実施形態１と同様の効果が得られる。また本実施形態では、観光地等に配置された貸出端末５０の貸出が可能であり、各ユーザのユーザモデル１２Ｍが貸出端末５０にダウンロードされ、貸出端末５０でユーザモデル１２Ｍに基づく処理（対話及び行動）が行われることにより、各ユーザが行う可能性の高い行動を貸出端末５０で実現することができる。これにより、ユーザ自身が観光地等に出向くことなく、ユーザモデル１２Ｍに基づいて貸出端末５０が取得した映像及び音声等を得ることができ、ユーザは擬似的に観光地に行くことができる。また、各ユーザのユーザモデル１２Ｍをダウンロードする貸出端末５０は、ユーザモデル１２Ｍに基づいて決定されるので、ユーザ自身は何も行うことなく、自身が行きたい場所の情報（撮影された映像及び音声等）を収集することができる。なお、ユーザモデル１２Ｍがダウンロードされた貸出端末５０は、ユーザモデル１２Ｍに基づく行動処理だけでなく対話処理を実行してもよい。この場合、貸出端末５０は、観光地等において、ユーザモデル１２Ｍのユーザが行う可能性の高い対話を現地で実現でき、貸出端末５０においてユーザのアバターが現地の人との対話を行うことにより、ユーザは擬似的に現地の人と対話することができる。

本実施形態では、例えば絶景を見ることができる場所に貸出端末５０を設置（固定）しておいた場合、各ユーザが自身のユーザモデル１２Ｍを貸出端末５０にダウンロード（デプロイ）することにより、貸出端末５０を介して絶景を撮影することができる。よって、各ユーザは、ユーザモデル１２Ｍに基づく処理を行う貸出端末５０を介して、擬似的に外出及び旅行することができる。

本実施形態では、所定範囲内に存在するユーザ端末１０及び貸出端末５０（即ち、近い位置にある端末１０，５０）間において、それぞれの端末１０，５０に異なるユーザモデル１２Ｍがデプロイされることにより、ユーザモデル１２Ｍのユーザの代わりにアバター間で対話を行うことができる。よって、例えば複数人で会議を行う際に欠席者がいる場合、欠席者の代わりに欠席者のユーザモデル１２Ｍを会議室内の端末（貸出端末５０又はユーザ端末１０）にダウンロードすることにより、欠席者の代わりに欠席者のアバターが会議に参加できる。例えば５人で会議を行う際に２人の欠席者がいる場合、２人の欠席者のユーザモデル１２Ｍ（例えば第１ユーザモデル１２Ｍ及び第２ユーザモデル１２Ｍ）を、会議室内に設置された端末（第１情報処理装置及び第２情報処理装置）にダウンロード（デプロイ）する。そして、第１情報処理装置が第１ユーザモデル１２Ｍに基づく処理を行い、第２情報処理装置が第２ユーザモデル１２Ｍに基づく処理を行うことにより、欠席者の代わりに欠席者のアバターが会議に参加し、３人の参加者（ユーザ）と、２人の欠席者のアバターとの間で対話を行うことができる。よって、会議の出席者全員の時間調整が難しい場合であっても、欠席者のアバターが会議に出席することにより、会議を円滑に進めることが可能となる。また、このように行われた会議の履歴情報（撮影画像及び集音した音声データ）は、欠席者のユーザ端末１０へ送信されるので、欠席者は履歴情報を確認することにより会議内容を把握でき、擬似的に会議に参加できる。

上述した各実施形態では、各ユーザの固有情報がユーザモデル１２Ｍに蓄積されるので、ユーザモデル１２Ｍに基づいてユーザが行う可能性の高い対話及び行動を再現できる。よって、例えばユーザ本人が病気等で対話できなくなった場合であっても、ユーザモデル１２Ｍに基づく処理によって、ユーザ本人が何を言いたいのか、何をしたいのか等を予測できる。

上述した各実施形態では、ユーザ端末１０、ユーザモデル１２Ｍがデプロイされた第２ユーザ端末１０及び貸出端末５０は、ユーザモデル１２Ｍに基づく処理を行うので、ユーザモデル１２Ｍのユーザが行う可能性の高い対話及び行動を実現する。この構成に加えて、ユーザモデル１２Ｍのユーザが行う可能性の低い対話及び行動を特定し、所定の確率でこのような対話及び行動を実行し、履歴情報をユーザに提供してもよい。また、ユーザ端末１０又は貸出端末５０が、自端末の設置場所で流行っているもの又は流行っていることを特定し、流行っているもの又は流行っていることをユーザモデル１２Ｍに基づいて実行し、履歴情報をユーザに提供してもよい。このような構成とした場合、ユーザが普段しないような対話相手との対話及び行動を擬似的に体験することができ、ユーザの新たな発見が期待できる。

上述した各実施形態において、ユーザ端末１０及び貸出端末５０は、例えば表示部１６，５６の配置位置（配置高さ）を変更できるように構成されていてもよい。図２８は、ユーザ端末１０及び貸出端末５０の構成の変形例を示す模式図である。図２８Ａに示す例は、図１に示したユーザ端末１０の変形例を示しており、図２８Ａの左側に示すように、ユーザ端末１０は、胴体部１０ｄに対する頭部１０ｃの上下方向の位置を調整できる高さ調整機構１０ｅを有してもよい。また、図２８Ａの右側に示すように、ユーザ端末１０は、頭部１０ｃ及び胴体部１０ｄの上下方向の位置を調整できる高さ調整機構１０ｅを有してもよい。更に、図２８Ｂに示すように、ユーザ端末１０及び貸出端末５０は、床面又は地面に接する移動機構２０，６０に対する表示部１６，５６の上下方向の位置を調整できるように構成されていてもよい。このような構成のユーザ端末１０及び貸出端末５０では、自身のユーザモデル１２Ｍ又はデプロイされたユーザモデル１２Ｍに基づく処理を行う際に、ユーザの身体的特徴（特に身長）に応じて、表示部１６，５６の上下方向の位置を変更することができる。これにより、ユーザモデル１２Ｍのユーザの身長に合わせた高さに表示部１６，５６を配置することができ、表示部１６，５６に表示されるアバターを、よりユーザに近い存在として対話することができる。なお、各ユーザの身体的特徴に関する情報も各ユーザのユーザモデル１２Ｍが学習している。

また、表示部１６，５６の配置高さを変更できる構成のほかに、例えば図１に示した第２ユーザのユーザ端末１０における胴体部１０ｄの横幅を変更できるように構成されていてもよい。例えば、胴体部１０ｄを複数の横幅に切り替えられるような構造に構成し、ユーザモデル１２Ｍのユーザの体格に合わせた横幅に切り替えることにより、表示部１６，５６に表示されるアバターに対応するユーザをよりイメージできるユーザ端末１０を実現できる。また、例えば女性タイプ、男性タイプ、落語家タイプ、やせ型、ぽっちゃり型等のタイプに応じた胴体部１０ｄの横幅を予め設定しておき、ユーザモデル１２Ｍのユーザのタイプに合わせた横幅に切り替えるように構成されていてもよい。また、ユーザ端末１０の外面の色を変更できるように構成されていてもよい。例えば、ユーザ端末１０の外面又は胴体部１０ｄの外面に液晶ディスプレイを設けることにより、ユーザモデル１２Ｍのユーザの好み又はイメージに合わせた色合いの外面にすることができる。この場合にも、表示されるアバターに対応するユーザをよりイメージできるユーザ端末１０を実現できる。

上述した各実施形態において、あるユーザモデル１２Ｍ（貸出モデル４２Ｍを含む）があるユーザ端末１０（貸出端末５０を含む）にデプロイされた場合に、ユーザ端末１０の表示部１６に、デプロイされたユーザモデル１２Ｍのユーザに関する情報（例えばユーザの氏名、ニックネーム等）を表示するように構成されていてもよい。例えば第１ユーザのユーザモデル１２Ｍが第２ユーザのユーザ端末１０にデプロイされている場合に、第２ユーザのユーザ端末１０の表示部１６に第１ユーザの情報が表示されてもよい。このような構成とすることにより、ユーザ端末１０を介してアバターと対話しているユーザが、ユーザ端末１０の表示部１６に表示されているアバターが誰のアバターであるかを容易に把握できる。よって、アバターと対話するユーザは、アバターに対してより親近感を抱くことが期待できる。また、例えば複数の欠席者がいる会議において、各欠席者の代わりに出席したアバターが誰のアバターであるかを容易に把握できるので、会議を円滑に行うことができる。

上述した各実施形態では、各ユーザの固有情報はユーザモデル１２Ｍに蓄積される構成であるが、例えばテーブル又はＤＢに蓄積される構成としてもよい。この場合、例えばユーザ端末１０の制御部１１は、対話処理部１３ａがユーザと対話した内容からユーザ固有の情報を抽出し、テーブル又はＤＢに記憶する。このような構成においても、上述した各実施形態と同様の処理が可能であり、同様の効果が得られる。

今回開示された実施形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

１０ユーザ端末（コンピュータ）
１１制御部
１２記憶部
１３処理部
１５入力部
１６表示部
１７スピーカ
１８マイク
１９カメラ
２０移動機構
４０モデル管理サーバ
５０貸出端末
７０端末管理サーバ
１２Ｍユーザモデル
４２Ｍ貸出モデル
１３ａ，５３ａ対話処理部
１３ｂ，５３ｂ行動処理部

Claims

第１ユーザの対話履歴情報に基づいて学習された第１の学習モデルを記憶部に記憶し、
前記第１の学習モデルのデプロイが可能な情報処理装置に対する指定を受け付け、
指定された前記情報処理装置に対して前記第１の学習モデルをデプロイし、
前記第１の学習モデルをデプロイされた前記情報処理装置は、デプロイされた前記第１の学習モデルに基づいて動作する
情報処理方法。
前記第１ユーザとは異なる第２ユーザの対話履歴情報に基づいて学習された第２の学習モデルが前記情報処理装置に対してデプロイされた場合、前記情報処理装置による前記第１の学習モデルに基づく動作が禁止される
請求項１に記載の情報処理方法。
前記情報処理装置にデプロイされた前記第２の学習モデルをアンデプロイした場合、前記情報処理装置は前記第１の学習モデルに基づく動作を再開する
請求項２に記載の情報処理方法。
前記第１ユーザの情報処理装置に対して、前記第１ユーザとは異なる第２ユーザの対話履歴情報に基づいて学習された第２の学習モデルをデプロイする
請求項１から３までのいずれかひとつに記載の情報処理方法。
前記第１ユーザとは異なる複数のユーザのそれぞれの対話履歴情報に基づいて学習された複数の貸出用の学習モデルのいずれかに対する選択を受け付け、
受け付けた前記貸出用の学習モデルを前記第１ユーザの情報処理装置にデプロイする
請求項１から４までのいずれかひとつに記載の情報処理方法。
前記学習モデルは、対話履歴情報及び感情と、前記対話履歴情報及び感情に応じた対話情報及び行動情報とを含む教師データを用いて、前記対話履歴情報及び感情が入力された場合に、前記対話履歴情報及び感情に応じた対話情報及び行動情報を出力するように学習されており、
前記第１ユーザの情報処理装置を通じて前記第１ユーザからの対話情報を受け付けさせ、
撮像部から取得された前記第１ユーザの画像に基づいて前記第１ユーザの感情を前記第１ユーザの情報処理装置を通じて分析させ、
前記第１ユーザとは異なるユーザの学習モデルに、受け付けた前記第１ユーザからの対話情報及び分析された前記第１ユーザの感情を入力することで、前記異なるユーザの学習モデルから出力される対話情報又は行動情報を前記第１ユーザの情報処理装置を通じて出力させる
請求項１から５までのいずれかひとつに記載の情報処理方法。
前記貸出用の学習モデルを前記情報処理装置にデプロイする時間、又は、デプロイされた前記貸出用の学習モデルに基づく処理を前記情報処理装置が実行する回数に応じて、前記貸出用の学習モデルの貸出料金を課金する
請求項５に記載の情報処理方法。
前記貸出用の学習モデルのそれぞれに対して、同時にデプロイ可能な装置数が設定してあり、
前記貸出用の学習モデルのそれぞれに設定された同時にデプロイ可能な装置数に応じた貸出料金を課金する
請求項５に記載の情報処理方法。
前記第１の学習モデルをデプロイされた前記情報処理装置が、前記第１の学習モデルに基づいて、分散配置された複数の貸出用の情報処理装置のいずれかを選択し、
選択した前記貸出用の情報処理装置に対して前記第１の学習モデルをデプロイし、
前記貸出用の情報処理装置に、前記第１の学習モデルに基づいて実行した処理結果を、前記第１ユーザの情報処理装置へ出力させる
請求項１から８までのいずれかひとつに記載の情報処理方法。
前記情報処理装置は、表示部と、前記表示部の配置高さを変更する高さ調整機構とを備え、
前記情報処理装置にデプロイした学習モデルに対応するユーザの身体的特徴に基づいて、前記情報処理装置を通じて前記高さ調整機構により前記表示部の配置高さを変更させる
請求項１から９までのいずれかひとつに記載の情報処理方法。
第１ユーザとは異なる複数のユーザのそれぞれの対話履歴情報に基づいて学習された複数の異なるユーザの学習モデルのいずれかに対する選択を受け付け、
選択された前記異なるユーザの学習モデルを受信し、
受信した前記異なるユーザの学習モデルを記憶部に記憶し、
記憶した前記異なるユーザの学習モデルに基づいて動作する
処理をコンピュータに実行させるプログラム。
請求項１１に記載のプログラムの実行が可能な情報処理装置。
複数のユーザのそれぞれの対話履歴情報に基づいて学習された複数の学習モデルを記憶する記憶部と、
情報処理装置から前記複数の学習モデルのいずれかを要求された場合に、要求された前記学習モデルを前記情報処理装置にデプロイするデプロイ部と
を備える情報処理装置。