WO2024127816A1

WO2024127816A1 - 情報処理装置、情報処理方法および記憶媒体

Info

Publication number: WO2024127816A1
Application number: PCT/JP2023/038167
Authority: WO
Inventors: 美友岩船; 賢次森田; 卓郎野田
Original assignee: ソニーグループ株式会社
Priority date: 2022-12-16
Filing date: 2023-10-23
Publication date: 2024-06-20

Abstract

【課題】ユーザの対話意思を尊重したコミュニケーションを図る。【解決手段】操作対象に対するユーザの興味度を示す興味度情報を取得する取得部と、前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成部と、を備える、情報処理装置。

Description

情報処理装置、情報処理方法および記憶媒体

　本開示は、情報処理装置、情報処理方法および記憶媒体に関する。

　近年、アバターやロボットなどの対象がユーザとコミュニケーションを図る技術が開発されている。例えば、特許文献１では、対話開始条件を満たした場合にユーザの音声取得に適した位置まで当該ユーザの移動を促す移動促進情報をキャラクターから出力させることで当該キャラクターとユーザとの間でコミュニケーションを図らせる技術が開示されている。

国際公開第２０１８／０５６１６９号

　しかし、特許文献１に記載の技術では、ユーザの顔画像の大きさが閾値以上でない場合に、ユーザに近づくように移動を促す音声を出力するため、ユーザがコミュニケーションを図るつもりではない、またはユーザがコミュニケーションを図れない状況においてもキャラクターがユーザに話しかけてしまう恐れがあった。この結果、ユーザがコミュニケーションを望んでいないにも関わらず、ユーザにコミュニケーションを図ることを強いてしまう状況が生じ得た。

　そこで、本開示では、ユーザの対話意思を尊重したコミュニケーションを図ることが可能な、新規かつ改良された情報処理装置、情報処理方法および記憶媒体を提案する。

　本開示によれば、操作対象に対するユーザの興味度を示す興味度情報を取得する取得部と、前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成部と、を備える、情報処理装置が提供される。

　また、本開示によれば、操作対象に対するユーザの興味度を示す興味度情報を取得することと、前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成することと、を含む、コンピュータにより実行される情報処理方法が提供される。

　また、本開示によれば、コンピュータに、操作対象に対するユーザの興味度を示す興味度情報を取得する取得機能と、前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成機能と、を実現させるための、プログラムが記憶されたコンピュータにより読み取り可能な非一時的な記憶媒体が提供される。

本開示に係る情報処理システムの概要を説明するための説明図である。本開示に係る情報処理装置１０の機能構成例を説明するための説明図である。本開示に係る興味度の推定に用いるパラメータの具体例を説明するための説明図である。ユーザとアバターとの間の距離に対応するシグモイド関数の一例を説明するための説明図である。対象ユーザおよびアバターの位置関係の具体例を説明するための説明図である。ユーザの移動状態として「通り過ぎている」が検出される処理の一例を説明するための説明図である。ユーザの移動状態として「コミュニケーションエリアＣＡに向かっている」が検出される処理の一例を説明するための説明図である。アバターの動作情報を決定するためのマトリクスの一例を説明するための説明図である。ユーザによる興味度の対象の他の例を説明するための説明図である。本開示に係る情報処理装置１０の動作処理の一例を説明するための説明図である。本開示の一実施形態に係る情報処理装置９０のハードウェア構成例を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
　　１．概要
　　１．１．情報処理システムの概要
　　１．２．情報処理装置１０の機能構成例
　　２．詳細
　　２．１．興味度の推定
　　２．２．対象ユーザの検出
　　２．３．制御情報の生成
　　２．４．他の実施例
　　３．動作処理例
　　４．ハードウェア構成例
　　５．補足

　＜＜１．概要＞＞
　近年、メタバース環境でのサービスが増加し、仮想空間内でのアバターの店員またはＮＰＣ（Ｎｏｎ　Ｐｌａｙｅｒ　Ｃｈａｒａｃｔｅｒ）等、自律的にユーザに話しかけるシステムの需要が増加している。

　また、現実の世界においても、実店舗でのアバターの店員の活用や、ＮＰＣによるインタラクティブな屋外広告が増えてきており、メタバース環境と同様に、自律的にユーザに話しかけるシステムの需要が増加している。

　メタバース環境と現実の世界のいずれであっても、アバターの店員またはＮＰＣ等は、複数人のユーザが存在する環境において活用されることが想定され得る。なお、以下では、アバターの店員およびＮＰＣ等を総称して、単にアバターと表現する場合がある。

　複数のユーザが存在する環境でアバターが自律的にユーザに話しかけるシステムを活用する場合、当該システムは、複数のユーザのうちからアバターが話しかけるユーザを自律的に決定する必要がある。しかし、システムが選んだユーザは、必ずしもアバターとコミュニケーションを図れる状況ではなく、例えば応答する気がない、または応答できない状況であるにも関わらずアバターがユーザに話しかけてしまうと、ユーザにとって鬱陶しいシステムが生じ得る。

　そのため、アバターが自律的にユーザに話しかけるには、システムは、アバターが話しかけてもよいユーザを適切に判断することが望ましい。換言すると、システムは、ユーザ対話意思を適切に判断することが望ましい。

　ユーザの対話意思を判断する方法として、例えば、ユーザの位置または表情のみから判断する手法が挙げられる。例えば、アバターとの距離が一定以内まで近づいたユーザを、対話意思があるユーザであるという判断基準とする場合が想定される。しかし、このような判断基準の場合、アバターとの対話に興味があるユーザだけでなく、アバターとの対話に興味がないユーザ（例えば、偶然アバターの近くを通ったユーザ）にも声をかける可能性があり、ユーザにとって鬱陶しいシステムが生じ得る。このように、ユーザの位置、視線または表情のみから判断されたユーザの対話意思の有無は、確度が低くなり得る。

　また、ユーザの対話意思の有無の判断を間違えないために、例えば、ユーザに明示的な入力を求める方法も考えられる。具体的には、アバターと対話したいユーザに起動ワードの発話を求めるものなどが想定される。しかし、このようなユーザに明示的な入力を求める場合、システムによる対話意思の有無に係る判断の間違えは減るものの、アバターによる自律的な対話とは言い難い。

　そこで、本開示の一実施形態は、ユーザの対話意思を尊重したコミュニケーションを図ることが可能な情報処理システムに関する。具体的には、本開示に係る情報処理システムによれば、対話前のノンバーバルコミュニケーションをモデル化することで、明示的な入力をユーザに求めることなく、確度高くユーザの対話意思の有無を判断することが可能になる。まず、図１を参照し、本開示に係る情報処理システムの概要を説明する。

　＜１．１．情報処理システムの概要＞
　図１は、本開示に係る情報処理システムの概要を説明するための説明図である。本開示に係る情報処理システムは、図１に示すように、情報処理装置１０と、カメラ２００と、ディスプレイ装置３００と、を有する。

　（情報処理装置１０）
　本開示に係る情報処理装置１０は、操作対象（例えば、図１に示すアバターＡ）に対するユーザの興味度を示す興味度情報を取得する。また、情報処理装置１０は、取得した興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、操作対象（例えば、図１に示すアバターＡ）の動作を制御するための制御情報を生成する。情報処理装置１０の各種構成の詳細は後述する。

　本開示に係る情報処理装置１０は、例えばＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）、ノートＰＣ、タブレット端末、スマートフォン、サーバ、ＨＭＤ（Ｈｅａｄ　Ｍｏｕｎｔｅｄ　Ｄｉｓｐｌａｙ）またはＡＲ（Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）グラス等の各種装置であってもよい。

　（カメラ２００）
　本開示に係るカメラ２００は、例えば、設置された環境を撮影することで、ユーザＵの画像を取得するセンシング装置である。例えば、カメラ２００は、図１に示す環境を撮影することで、ユーザＵ１、ユーザＵ２およびユーザＵ３を含む画像を取得する。そして、カメラ２００は、取得した画像を含む画像データを情報処理装置１０に送信する。

　なお、本開示に係るカメラ２００は、例えばＲＧＢカメラ、ＴｏＦ（Ｔｉｍｅ　ｏｆ　Ｆｌｉｇｈｔ）センサ、ステレオカメラ、赤外カメラであってもよい。

　また、本開示に係る情報処理装置１０は、ＬｉＤＡＲ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｒａｎｇｉｎｇ）またはミリ波レーダ等の各種装置を備えてもよい。

　また、環境における光の変化（例えば、光量の変化）で正確なセンシングが困難な場合、データの取得に用いるセンサが切り替えられてもよい。例えば、暗所では、赤外光を用いたＴｏＦセンサが用いられてもよい。一方、太陽光下では、データの取得に用いるセンサが赤外光を用いたＴｏＦセンサから可視光によるセンサに切り替えられてもよい。また、逆光の場合には、光に依存しないミリ波レーダが用いられてもよい。

　（ディスプレイ装置３００）
　本開示に係るディスプレイ装置３００は、アバターＡの映像を表示する表示部の機能と、アバターＡが発する音声を提示する音声出力部としての機能を包含する装置である。

　例えば、ディスプレイ装置３００は、情報処理装置１０に生成された制御情報に基づき描画されたアバターＡを表示し、更に、当該制御情報に基づく音声を出力する。

　表示部の機能は、例えば、２次元ディスプレイ、透明ディスプレイ、３次元ディスプレイ、多視差ディスプレイまたはＸＲ（Ｅｘｔｅｎｄｅｄ　Ｒｅａｌｉｔｙ）デバイスにより実現されてもよい。また、３次元ディスプレイは、眼鏡型であってもよいし、三次元プロジェクターであってもよい。

　また、ディスプレイの種類は限定されない。例えば、ディスプレイは、ＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）であってもよいし、有機ＥＬ（Ｅｌｅｃｔｒｏ－Ｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイであってもよいし、ＰＤＰ（Ｐｌａｓｍａ　Ｄｉｓｐｌａｙ　Ｐａｎｅｌ）などであってもよい。

　また、ディスプレイ装置３００は、スマートフォン、タブレット端末、またはＨＭＤ等の各種端末であってもよい。ディスプレイ装置３００がＨＭＤである場合、当該ＨＭＤは、ベースステーションまたはＳＬＡＭ（Ｓｉｍｕｌｔａｎｅｏｕｓ　Ｌｏｃａｌｉｚａｔｉｏｎ　ａｎｄ　Ｍａｐｐｉｎｇ）等の位置トラッキングに関する機能と、アイトラッキングに関する機能を有していることが望ましい。

　また、音声出力部の機能は、スピーカにより実現されてもよい。

　続いて、図２を参照し、本開示に係る情報処理装置１０の機能構成例を説明する。

　＜１．２．情報処理装置１０の機能構成例＞
　図２は、本開示に係る情報処理装置１０の機能構成例を説明するための説明図である。本開示に係る情報処理装置１０は、図２に示すように、通信部１１０と、制御部１２０と、を備える。

　（通信部１１０）
　本開示に係る通信部１１０は、カメラ２００の撮影により得られた画像データを、当該カメラ２００から受信する。また、通信部１１０は、後述する動作情報生成部１３７により生成された制御情報に基づく音声を含む音声情報と、後述する描画部１４１により描画されたアバターの映像と、を含む各種情報をディスプレイ装置３００に送信する。

　（制御部１２０）
　本開示に係る制御部１２０は、情報処理装置１０の動作全般を制御する。制御部１２０は、図２に示すように、人検出部１２１と、視線検出部１２５と、興味度推定部１２９と、対話条件検出部１３３と、動作情報生成部１３７と、描画部１４１と、を備える。

　本開示に係る人検出部１２１は、カメラ２００により取得された画像データに基づき、ユーザを検出する。例えば、人検出部１２１は、カメラ２００のセンシング範囲に複数のユーザが存在する場合、当該複数のユーザの各々を検出する。

　また、人検出部１２１は、画像データに基づき、各ユーザの位置を検出してもよい。例えば、人検出部１２１は、各ユーザとアバターの位置関係を検出してもよい。

　なお、人検出部１２１は、ユーザおよびユーザの位置の検出に必ずしも画像データを用いなくてもよい。例えば、人検出部１２１は、ユーザおよびユーザの位置を検出可能なデータをベースにするのであれば画像データをベースにしなくてもよく、例えば、点群データ、デプスデータ、超音波データ等の各種データに基づき、各ユーザおよびアバターの位置関係を検出してもよい。

　また、人検出部１２１は、検出したユーザの位置に基づき、当該ユーザの速度を検出してもよい。例えば、人検出部１２１は、単位時間当たりのユーザの位置の変化に基づき、ユーザの速度を検出してもよい。

　また、人検出部１２１は、ユーザの属性を検出してもよい。例えば、ユーザの属性は、「大人」または「子供」のような年齢層に関する属性を含んでもよいし、「男性」または「女性」のような性別に関する属性を含んでもよい。

　なお、人検出部１２１は、トラッキングに際して、ユーザの顔または服の特徴量を用いてもよい。これにより、人検出部１２１は、例えば人口密度が高いことにより、カメラ２００のセンシング範囲内にいるユーザがセンシングできない場合、また、オクルージョンが生じた際でもユーザを追跡することが可能になり得る。

　本開示に係る視線検出部１２５は、カメラ２００により取得された画像データからユーザの視線の向きを示す視線情報を検出する。なお、視線検出には赤外カメラにより得られたデータを用いてもよい。

　なお、本開示に係る視線情報の検出方法は、画像データに基づく検出方法に限定されない。例えば、視線検出部１２５は、瞳孔角膜反射法を用いて、視線情報を検出してもよい。

　また、視線検出部１２５は、視線の向きに関連する別の部位の向きを検出してもよい。例えば、視線検出部１２５は、ユーザの顔の向きを示す顔情報を検出してもよい。また、視線検出部１２５は、ユーザの体の向きを示す体情報を検出してもよい。

　本開示に係る興味度推定部１２９は、取得部の一例であり、操作対象に対するユーザの興味度を示す興味度情報を取得する。例えば、興味度推定部１２９は、人検出部１２１により検出されたユーザおよびアバターの位置関係と、視線検出部１２５により検出された当該ユーザの視線情報と、に基づき、アバターに対するユーザの興味度を推定してもよい。興味度の推定等の各種処理に係る詳細については後述する。

　本開示に係る対話条件検出部１３３は、検出部の一例であり、興味度推定部１２９により取得された興味度情報に基づき、対話可能性が最も高いユーザとして対象ユーザを検出する。また、対話条件検出部１３３は、検出した対象ユーザの状況に基づき、当該対象ユーザが対話条件を満たしているか否かを判定する。

　また、対話条件検出部１３３は、対象ユーザの状況が所定の基準を満たさなかった際に、興味度情報に基づき、他のユーザを対象ユーザとして再検出してもよい。対象ユーザの検出および対話条件を満たしているか否かの判定等の各種処理に係る詳細については後述する。

　本開示に係る動作情報生成部１３７は、生成部の一例であり、対話条件検出部１３３により判定された、対象ユーザが対話条件を満たしているか否かに基づき、アバターの動作を制御するための制御情報を生成する。

　動作情報生成部１３７は、例えば、対象ユーザが対話条件を満たしている際に、当該対象ユーザに向けて、アバターに対話させる制御情報を生成する。

　また、動作情報生成部１３７は、対象ユーザが対話条件を満たさず、且つ、当該対象ユーザの状況が所定の基準を満たしていた場合に、当該対象ユーザの状況に基づく制御情報を生成してもよい。動作情報生成部１３７により生成される制御情報の詳細については後述する。

　本開示に係る描画部１４１は、動作情報生成部１３７により生成された制御情報に基づき、アバターの映像を描画する。例えば、ディスプレイ装置が多視差ディスプレイである場合、描画部１４１は、多視差に対応する水平方向または垂直方向の各位置に応じて異なる姿勢を有するキャラクターの立体映像を描画してもよい。

　以上、本開示に係る情報処理装置１０の機能構成の一例を説明した。続いて、図３～図９を参照し、本開示に係る情報処理装置１０の各種処理の詳細を説明する。

　＜＜２．詳細＞＞
　＜２．１．興味度の推定＞
　本開示に係る興味度推定部１２９は、操作対象（例えば、アバター）に対するユーザの興味度を推定し、興味度情報を取得する。例えば、興味度推定部１２９は、人検出部１２１および視線検出部１２５により検出された各種パラメータに基づき、興味度を推定してもよい。ここで、図３を参照し、人検出部１２１および視線検出部１２５により検出される各種パラメータの詳細を説明する。

　図３は、本開示に係る興味度の推定に用いるパラメータの具体例を説明するための説明図である。例えば、人検出部１２１は、ユーザＵおよびアバターＡの位置関係を推定する。ここでの位置関係とは、例えば、図３に示すような、ユーザＵからアバターＡまでの距離Ｄであってもよい。

　また、人検出部１２１は、ユーザの位置の変化に基づき、ユーザの速度を検出してもよい。例えば、人検出部１２１は、図３に示すような、ユーザＵから見たアバターＡの方向（以下、単に「アバターＡがいる方向」と表現する場合がある。）に対する法線方向のユーザＵの速度Ｖを検出してもよい。

　視線検出部１２５は、例えば瞳孔角膜反射法を用いて、視線情報を検出してもよい。ここでの、視線情報とは、アバターＡがいる方向からユーザＵの視線の方向ＬＳまでの角度情報（ユーザの視線の角度）を含む。

　また、視線検出部１２５は、ユーザＵの視線の方向ＬＳの代わりに、またはユーザＵの視線の方向ＬＳに加えて、顔情報（ユーザＵの顔の向き）または体情報（ユーザＵの体の向き）を検出してもよい。そして、視線検出部１２５は、アバターＡがいる方向からユーザＵの顔が向いている方向までの角度を角度情報として検出してもよい。または、視線検出部１２５は、アバターＡがいる方向からユーザＵの体が向いている方向までの角度を角度情報として検出してもよい。

　また、視線検出部１２５は、アバターＡがいる方向からユーザＵの視線の方向ＬＳまでの角度の分散または標準偏差を検出してもよい。例えば、視線検出部１２５は、現在時刻から所定時間前の各角度情報を用いて、角度の分散または標準偏差を検出してもよい。

　そして、興味度推定部１２９は、以上説明したような様々なパラメータを用いて、ユーザＵのアバターＡに対する興味度を推定し、興味度情報を取得してもよい。例えば、興味度推定部１２９は、人検出部１２１および視線検出部１２５により検出された各種パラメータに対応する正規化関数を用いて、当該各種パラメータを正規化してもよい。例えば、正規化関数には、シグモイド関数が採用されてもよい。

　図４は、ユーザとアバターとの間の距離に対応するシグモイド関数の一例を説明するための説明図である。例えば、シグモイド関数は、下記数式（１）により表せられる。ここで、ｆ（ｘ）は興味度であり、ｘはパラメータ（図４では、距離）であり、ｋは係数である。

　ｆ（ｘ）＝１／（１＋ｅ^―ｋｘ）
　　　　　　　　　　　　　　　　　　　（１）

　例えば、図４に示すシグモイド関数によれば、興味度推定部１２９は、ユーザとアバターとの間の距離が近ければ近いほど、興味度を大きく推定する。

　換言すると、興味度推定部１２９は、ユーザと、アバターとの間の距離が離れることにより、アバターに対するユーザの興味度を小さく推定する。

　このように、興味度推定部１２９は、正規化関数としてシグモイド関数を用いることで、距離のパラメータを興味度に変換してもよい。また、興味度推定部１２９は、他のパラメータに対応するシグモイド関数を用いて、当該他のパラメータにおいても興味度に変換してもよい。

　例えば、興味度推定部１２９は、法線方向の速度（以下では、法線速度、と表現する。）に対応するシグモイド関数を用いて、当該法線速度を興味度に変換してもよい。ここで、法線速度に対応するシグモイド関数では、数式（１）におけるｘは法線速度である。また、法線速度に対応するシグモイド関数では、例えば、法線速度が小さい程、興味度の値が大きく推定されることが望ましい。

　また、興味度推定部１２９は、ユーザの視線の角度（以下では、視線角度、と表現する。）に対応するシグモイド関数を用いて、当該視線角度を興味度に変換してもよい。ここで、視線角度に対応するシグモイド関数では、数式（１）におけるｘは視線角度である。また、視線角度に対応するシグモイド関数では、例えば、視線角度が小さい程（即ち、ユーザの視線の方向がアバターＡに向いている程）、興味度の値が大きく推定されることが望ましい。

　また、興味度推定部１２９は、ユーザの視線の角度の分散（以下では、視線角度分散、と表現する。）に対応するシグモイド関数を用いて、当該視線角度分散を興味度に変換してもよい。ここで、視線角度分散に対応するシグモイド関数では、数式（１）におけるｘは視線角度分散である。また、視線角度分散に対応するシグモイド関数では、例えば、視線角度分散が小さい程、興味度の値が大きく推定されることが望ましい。

　なお、各シグモイド関数に設定されるパラメータ（例えば、係数ｋ）の設定値は、ユースケースまたはアバターの属性に応じて適宜設定されてもよい。

　そして、興味度推定部１２９は、各種パラメータから推定した各興味度を統合してもよい。例えば、興味度推定部１２９は、距離、法線速度、視線角度および視線角度分散の各々から変換された各興味度の積（または、和）を、一の興味度として統合してもよい。

　また、興味度推定部１２９は、興味度の統合に際して、重み付けを行ってもよい。例えば、距離のパラメータの重要度が高い場合、興味度推定部１２９は、距離のパラメータから変換された興味度に対し第１の重み係数（例えば、０．４）を乗算し、他のパラメータ（法線速度、視線角度および視線角度分散）から変換された興味度に対し第２の重み係数（例えば、０．２５）を乗算する。そして、興味度推定部１２９は、重み係数を乗算した各興味度の積（または、和）を、一の興味度として統合してもよい。

　また、正規化関数は、シグモイド関数に限定されない。例えば、正規化関数には、ステップ関数等の他の関数が採用されてもよい。

　また、興味度の推定には音声が用いられてもよい。例えば、ディスプレイ装置３００が備える図示しないマイクロフォンにより環境の音声情報を取得する。例えば、興味度推定部１２９は、アバターについて話しているユーザの興味度を所定値（例えば、０．８等）で推定してもよい。

　興味度推定部１２９は、以上説明したような推定処理により、カメラ２００のセンシング範囲内に存在する複数のユーザの各興味度（または、統合した興味度）を推定する。

　なお、興味度推定部１２９は、現在時刻の各種パラメータを用いて興味度を推定してもよいし、所定時間前（例えば、数秒前）の各種パラメータを用いて興味度を推定してもよい。

　以上、本開示に係る興味度の推定に係る詳細を説明した。続いて、対象ユーザの検出に係る詳細を説明する。

　＜２．２．対象ユーザの検出＞
　対話条件検出部１３３は、興味度推定部１２９により取得された興味度情報に基づき、対象ユーザを検出する。例えば、対話条件検出部１３３は、興味度が最も高いユーザを対象ユーザとして検出してもよい。

　または、対話条件検出部１３３は、興味度が所定値以上であり、且つ興味度が最も高いユーザを対象ユーザとして検出してもよい。

　また、アバターによる対話の対象となるユーザの属性が予め設定されていてもよい。例えば、アバターによる対話の対象となるユーザの属性が「子供」に設定されていた場合、対話条件検出部１３３は、子供であることが検出されたユーザの中で興味度が最も高いユーザを対象ユーザとして検出してもよい。また、アバターにより話しかけの対象となるユーザの属性が「２０代の女性」に設定されていた場合、対話条件検出部１３３は、２０代の女性であることが検出されたユーザの中で最も興味度が高いユーザを対象ユーザとして検出してもよい。

　また、複数台の情報処理装置１０が連携している場合、対話条件検出部１３３は、別のアバターの働きかけ（対話を含む各種動作）に応じなかったユーザ、または既に対話したユーザを対象ユーザの候補から除外してもよい。

　また、情報処理装置の図示しない記憶部は、ユーザの過去の対話履歴を保持してもよい。この場合、対話条件検出部１３３は、過去にアバターの働きかけに応じたユーザを優先的に対象ユーザとして検出してもよい。例えば、対話条件検出部１３３は、過去にアバターの働きかけに応じていないユーザと比較して、過去にアバターの働きかけに応じたユーザの興味度に高い重み係数を乗算してもよい。そして、対話条件検出部１３３は、重み付けを行った興味度を比較し、比較の結果に基づき対象ユーザを検出してもよい。

　以上、本開示に係る対象ユーザの検出に係る詳細を説明した。続いて、対話条件の検出および制御情報の生成に係る詳細を説明する。

　＜２．３．制御情報の生成＞
　動作情報生成部１３７は、対象ユーザが対話条件を満たしているか否かに基づき、アバターの動作を制御するための制御情報を生成する。

　例えば、対話条件検出部１３３は、対象ユーザの状況に基づき、当該対象ユーザが対話条件を満たしているか否かを判定してもよい。

　例えば、対象ユーザの状況には、対象ユーザおよびアバターの位置関係が含まれてもよい。そして、動作情報生成部１３７は、アバターに対する対象ユーザの位置に基づいて、アバターの動作を制御するための制御情報を生成してもよい。ここで、図５を参照し、対象ユーザおよびアバターの位置関係の具体例を説明する。

　図５は、対象ユーザおよびアバターの位置関係の具体例を説明するための説明図である。例えば、センシング範囲内は、アバターＡを基準として複数のエリアに分けられてもよい。

　例えば、アバターＡからの距離が「７．６ｍ」の内側がセンシング範囲である場合、当該７．６ｍの内側であるセンシング範囲が複数のエリアに区分けされてもよい。

　具体的には、図５に示す例によれば、アバターＡからの距離が「０ｍ」から「２．０ｍ」の範囲内にあるエリア（以下、第１エリアＳＰ１と称する。）と、アバターＡからの距離が「２．０ｍ」から「３．６ｍ」の範囲内にあるエリア（以下、第２エリアＳＰ２と称する。）と、アバターＡからの距離が「３．６ｍ」から「７．６ｍ」の範囲内にあるエリア（以下、第３エリアＳＰ３と称する。）と、にセンシング範囲が区分けされてもよい。

　例えば、図５に示すユーザＵ１が対象ユーザである場合、対話条件検出部１３３は、当該対象ユーザであるユーザＵ１が第３エリアＳＰ３に存在すると判定する。また、図５に示すユーザＵ２が対象ユーザである場合、対話条件検出部１３３は、当該対象ユーザであるユーザＵ２が第２エリアＳＰ２に存在すると判定する。また、図５に示すユーザＵ３が対象ユーザである場合、対話条件検出部１３３は、当該対象ユーザであるユーザＵ３が第１エリアＳＰ１に存在すると判定する。

　また、第１エリアＳＰ１には、ユーザＵとアバターＡが対話可能なエリアとしてコミュニケーションエリアＣＡが含まれてもよい。コミュニケーションエリアＣＡは、アバターＡの前方のエリアであることが望ましく、例えば当該エリアの４隅の座標で定義される。図５に示すユーザＵ４が対象ユーザである場合、対話条件検出部１３３は、当該対象ユーザであるユーザＵ４がコミュニケーションエリアＣＡに存在すると判定する。なお、コミュニケーションエリアＣＡは、所定のエリアの一例である。

　そして、動作情報生成部１３７は、アバターＡに対する対象ユーザの位置（対象ユーザが存在するエリア）に基づき、アバターＡの動作を制御するための制御情報を生成してもよい。

　なお、センシング範囲内の区分けの例として、センシング範囲が第１エリアＳＰ１、第２エリアＳＰ２、第３エリアＳＰ３の３つに分けられ、その一つである第１エリアＳＰ１にコミュニケーションエリアＣＡが含まれる例を挙げたが、本開示に係る区分けは係る例に限定されない。例えば、センシング範囲は、コミュニケーションエリアＣＡとそれ以外のエリアの２つのエリアに分けられてもよいし、２、３または５以上のエリアに分けられてもよい。

　また、コミュニケーションエリアＣＡが第１エリアＳＰ１に含まれる例を説明したが、コミュニケーションエリアＣＡは、第２エリアＳＰ２等の他のエリアに含まれてもよいし、複数のエリア（例えば、第１エリアＳＰ１および第２エリアＳＰ２）に跨って含まれてもよい。

　また、対象ユーザの状況には、アバターに対する当該対象ユーザの移動状態が含まれてもよい。以下では、対象ユーザの移動状態に、「止まっている」、「コミュニケーションエリアＣＡに立ち止まりそう」、「コミュニケーションエリアＣＡに向かっている」、「通りすぎようとしている」および「通り過ぎている」の５種類が含まれる例を主に説明するが、対象ユーザの移動状態は係る例に限定されない。

　例えば、対話条件検出部１３３は、対象ユーザの位置（アバターまでの距離）、速度（アバターに対する速度）、視線方向（視線角度）および移動方向等の各種パラメータに基づき、当該対象ユーザの移動状態を検出してもよい。

　例えば、対話条件検出部１３３は、対象ユーザの速度に基づいて、当該対象ユーザの移動状態が「止まっている」であることを検出してもよい。具体的には、対話条件検出部１３３は、対象ユーザの速度が０または０に限りなく近い場合、当該対象ユーザの移動状態が「止まっている」であると検出してもよい。

　また、対話条件検出部１３３は、対象ユーザの位置および移動方向に基づき、当該対象ユーザの移動状態が「通り過ぎている」であることを検出してもよい。

　図６は、ユーザの移動状態として「通り過ぎている」が検出される処理の一例を説明するための説明図である。対話条件検出部１３３は、対象ユーザＵの正面方向（移動方向、体の向き、または顔の向きであってもよい。）に対して、後ろの範囲にアバターＡが存在する場合に、当該対象ユーザＵの移動状態が「通り過ぎている」であることを検出してもよい。

　具体的には、対話条件検出部１３３は、対象ユーザＵの正面方向のベクトルＤＴと、対象ユーザＵを基準としてアバターＡがいる方向のベクトルＶＡと、のなす角が９０度を上回る場合（即ち、内積が負である場合）、当該対象ユーザＵの移動状態が「通り過ぎている」であることを検出してもよい。

　また、対話条件検出部１３３は、対象ユーザの位置、速度および移動方向に基づき、当該対象ユーザの移動状態が「コミュニケーションエリアＣＡに立ち止まりそう」または「コミュニケーションエリアＣＡに向かっている」であることを検出してもよい。

　図７は、ユーザの移動状態として「コミュニケーションエリアＣＡに向かっている」が検出される処理の一例を説明するための説明図である。対話条件検出部１３３は、対象ユーザＵの移動方向がコミュニケーションエリアＣＡを横切っているか否かに基づいて、当該対象ユーザの移動状態が「コミュニケーションエリアＣＡに向かっている」であるか否かを検出してもよい。

　例えば、対話条件検出部１３３は、対象ユーザＵの正面方向のベクトルＤＴと、対象ユーザＵを基準としてコミュニケーションエリアＣＡの四隅に向かうベクトルＶＣ１～ＶＣ４と、の外積の大きさの符号が一致していない場合に、対象ユーザＵの移動方向がコミュニケーションエリアＣＡを横切っているとして、当該対象ユーザＵの移動状態が「コミュニケーションエリアＣＡに向かっている」であることを検出してもよい。

　対話条件検出部１３３は、対象ユーザＵの速度が一定値以下、または対象ユーザの速度が低下傾向にある場合に、対象ユーザＵの移動状態が「コミュニケーションエリアＣＡに立ち止まりそう」であることを検出してもよい。

　なお、対象ユーザが止まっているか否かを判定する移動速度の閾値、およびコミュニケーションエリアＣＡに立ち止まりそうか否かを判定する閾値は、センシング範囲内の人口密度または分布によって決められてもよい。

　また、対話条件検出部１３３は、対象ユーザの移動状態が上述したいずれでもない場合に、当該対象ユーザの移動状態が「通りすぎようとしている」であることを検出してもよい。

　そして、動作情報生成部１３７は、対話条件検出部１３３により検出された対象ユーザの移動状態に基づき、アバターの動作を制御するための制御情報を生成してもよい。

　また、動作情報生成部１３７は、対話条件検出部１３３により検出された対象ユーザの位置（対象ユーザが存在するエリア）および移動状態の両方を組み合わせて、当該アバターの動作を制御するための制御情報を生成してもよい。

　図８は、アバターの動作情報を決定するためのマトリクスの一例を説明するための説明図である。例えば、動作情報生成部１３７は、図８に示すようなマトリクスを参照して、アバターの動作を制御するための制御情報を生成してもよい。

　図８に示すマトリクスには、行方向の対象ユーザの位置（対象ユーザの存在するエリア）と、列方向の対象ユーザの移動状態の各々に対応する動作区分が含まれる。動作情報生成部１３７は、対象ユーザおよびアバターの位置関係と、当該対象ユーザの移動状態と、の各々に対応する動作区分に応じたアバターの動作を制御するための制御情報を生成してもよい。

　図８に示すマトリクスによれば、対話条件検出部１３３は、例えば、対象ユーザがコミュニケーションエリアＣＡに存在し、且つ止まっていた場合、当該対象ユーザが対話条件を満たしていると判定する。このように対話条件を満たしていると判定された場合、動作情報生成部１３７は、対象ユーザに向けて、アバターに対話を開始させる制御情報を生成してもよい。対象ユーザの状況および当該アバターに対する興味度を考慮して、アバターが対象ユーザへの対話を開始することで、よりユーザの望む状況でのコミュニケーションが実現され得る。

　また、図８に示すマトリクスによれば、動作情報生成部１３７は、対象ユーザが対話条件を満たさず、当該対象ユーザがアバターの前方を通り過ぎていない場合に、当該対象ユーザの状況に基づく制御情報を生成する。

　例えば、動作区分には、図８に示すような対象ユーザの位置の調整を促す位置調整に関する動作区分が含まれてもよい。更に、対話区分には、図８に示すような対象ユーザに停止を依頼する停止依頼に関する動作区分が含まれてもよい。

　ここで、位置調整Ａ～位置調整Ｄおよび停止依頼Ａ～停止依頼Ｅでは、対象ユーザの意識または注目を引く度合（以下では、強度と表現する。）が異なってもよい。例えば、強度は、位置調整および停止依頼の末尾に付くアルファベット（Ａ、Ｂ、Ｃ、Ｄ、Ｅ）の順に大きくてもよい。一例を挙げると、位置調整Ｂは、位置調整Ａより強度が低く、位置調整Ｃおよび位置調整Ｄより強度が高いことを示す。但し、動作区分に応じたアバターの動作は強度に応じて必ずしも異なっていなくてもよい。

　位置調整Ａは、強度が最も高い位置調整に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が位置調整Ａである場合、当該位置調整Ａに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、位置調整Ａに応じたアバターの動作とは、例えば、アバターの胸元で手招きするような動作であってもよいし、「ここにこれるかな？」のような声掛けに係る動作であってもよい。

　また、位置調整Ｂは、位置調整Ａの次に強度が高い位置調整に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が位置調整Ｂである場合、当該位置調整Ｂに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、位置調整Ｂに応じたアバターの動作とは、例えば、アバターの胸元で手招きするような動作であってもよいし、「こっちにこれるかな？」のような声掛けに係る動作であってもよい。

　また、位置調整Ｃは、位置調整Ｂの次に強度が高い位置調整に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が位置調整Ｃである場合、当該位置調整Ｃに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、位置調整Ｃに応じたアバターの動作とは、例えば、両手で手招きするような動作であってもよい。また、位置調整Ｃに応じたアバターの動作には、声掛けに係る動作が含まれていなくてもよい。

　また、位置調整Ｄは、位置調整Ｃの次に強度が高い（図８に示すマトリクスでは、強度が最も低い）位置調整に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が位置調整Ｄである場合、当該位置調整Ｄに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、位置調整Ｄに応じたアバターの動作とは、例えば、アバターの胸元で小さく手招きするような動作であってもよい。また、位置調整Ｄに応じたアバターの動作には、声掛けに係る動作が含まれなくてもよい。

　また、停止依頼Ａは、強度が最も高い停止依頼に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が停止依頼Ａである場合、当該停止依頼Ａに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、停止依頼Ａに応じたアバターの動作とは、例えば、片手を小さく上げるような動作であってもよいし、「すみません」のような声掛けに係る動作であってもよい。

　また、停止依頼Ｂは、停止依頼Ａの次に強度が高い停止依頼に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が停止依頼Ｂである場合、当該停止依頼Ｂに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、停止依頼Ｂに応じたアバターの動作とは、例えば、片手を上げるような動作であってもよいし、「あっ」のような声掛けに係る動作であってもよい。

　また、停止依頼Ｃは、停止依頼Ｂの次に強度が高い停止依頼に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が停止依頼Ｃである場合、当該停止依頼Ｃに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、停止依頼Ｃに応じたアバターの動作とは、例えば、片手を上げるような動作であってもよいし、「あのー」のような小声による声掛けに係る動作であってもよい。

　また、停止依頼Ｄは、停止依頼Ｃの次に強度が高い停止依頼に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が停止依頼Ｄである場合、当該停止依頼Ｄに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、停止依頼Ｄに応じたアバターの動作とは、例えば、体を傾けながら手を前に出す動作であってもよい。また、停止依頼Ｄに応じたアバターの動作には、声掛けに係る動作が含まれなくてもよい。

　また、停止依頼Ｅは、停止依頼Ｄの次に強度が高い（図８に示すマトリクスでは、強度が最も低い）停止依頼に係る動作区分である。例えば、動作情報生成部１３７は、対象ユーザの位置（対象ユーザのエリア）と、当該対象ユーザの移動状態と、の各々に対応する動作区分が停止依頼Ｅである場合、当該停止依頼Ｅに応じたアバターの動作を制御するための制御情報を生成してもよい。ここで、停止依頼Ｅに応じたアバターの動作とは、例えば、片手を上げるような動作であってもよいし、「あっ」のような声掛けに係る動作であってもよい。

　なお、位置調整Ａ～Ｄおよび停止依頼Ａ～Ｅに応じたアバターの動作（振る舞い、声掛け）は上述した例に限定されない。また、同じ動作でも強度の違いによって、振る舞いの大きさ、または声掛けのトーン等が変更されてもよい。例えば、停止依頼Ｂに応じたアバターの動作と、停止依頼Ｃに応じたアバターの動作として、片手を上げるような動作を例示したが、停止依頼Ｂと、停止依頼Ｃとでは、アバターが上げる手の高さ等が異なっていてもよい。

　また、動作情報生成部１３７は、対象ユーザの位置（対象ユーザが存在するエリア）または移動状態に変化があった場合、アバターの動作が切り替わるように適宜制御情報を生成してもよい。

　また、対話条件検出部１３３は、対象ユーザの状況が所定の基準を満たさなかった際に、興味度情報に基づき、他のユーザを対象ユーザとして再検出してもよい。例えば、対話条件検出部１３３は、対象ユーザの移動状態が「通り過ぎている」である際に、興味度情報に基づき、他のユーザを対象ユーザとして再検出してもよい。

　具体的には、対話条件検出部１３３は、現在の対象ユーザの次に興味度が高い他のユーザを対象ユーザとして再検出してもよい。または、対話条件検出部１３３は、興味度が所定値以上で、且つ、現在の対象ユーザの次に興味度が高い他のユーザを対象ユーザとして再検出してもよい。

　また、対話条件検出部１３３は、一定時間以内に対象ユーザが対話条件を満たすことが判定されなかった場合に、興味度情報に基づき、他のユーザを対象ユーザとして再検出してもよい。

　以上、マトリクスによるアバターの動作情報を決定する方法の具体例を説明した。なお、動作情報生成部１３７が動作情報の生成に際して用いる情報、また、対話条件検出部１３３が対象ユーザを再検出する条件は、上述した例に限定されない。

　例えば、動作情報生成部１３７は、対象ユーザの視線方向の推移に応じて、アバターの動作にバリエーションを持たせてもよい。具体的には、動作情報生成部１３７は、対象ユーザがアバターを連続して見ている場合と比較し、細かく繰り返しアバターを見ている場合は、対象ユーザの視線がアバターの方向に向いたタイミングに発話を行うような制御情報を生成してもよい。このような対象ユーザの視線方向の推移は、例えば、視線方向（視線角度）の標準偏差または分散から判断されてもよい。

　また、動作情報生成部１３７は、アバターに設定されたポリシーによって、アバターの動作の内容（声掛けを含む）を変更してもよい。例えば、「積極的」であることが設定されたアバターの場合、動作情報生成部１３７は、アバターと視線が合っていない対象ユーザ等、本来は声掛けを行わない対象ユーザに対してもアバターに声掛けさせるような制御情報を生成してもよい。なお、対象ユーザがアバターを見ていない場合の制御情報には、声掛けのみの動作が含まれてもよい。

　また、多くのユーザを対象ユーザとするような設定がされた場合、対話条件検出部１３３は、対象ユーザを再検出する判断基準を下げてもよい。例えば、対話条件検出部１３３は、対象ユーザとアバターの視線が合わない、且つ当該対象ユーザの移動状態が「通り過ぎようとしている」である場合、対象ユーザの再検出を行ってもよい。

　ユーザの状況には、興味度が含まれてもよい。この場合、動作情報生成部１３７は、対象ユーザ興味度に基づき、アバターの動作を制御するための制御情報を生成してもよい。例えば、動作情報生成部１３７は、対象ユーザの興味度の高さに応じて対象ユーザに対話させるアバターの声色またはトーンを変更してもよい。

　また、人検出部１２１は、対象ユーザの属性をセンシングしてもよい。この場合、動作情報生成部１３７は、対象ユーザの属性に応じて、アバターの動作を変更してもよい。例えば、対象ユーザの属性が子供の場合、動作情報生成部１３７は、アバターの姿勢を屈ませ目線を合わせたうえで、マトリクスの動作区分に応じた動作をアバターに行わせてもよい。

　また、動作情報生成部１３７は、対象ユーザの聴覚または視覚等の特性に応じて、アバターの動作の内容（アバターの表示サイズ、または音量など）を変更してもよい。例えば、対象ユーザが補聴器を装着していた場合、または手話で他のユーザと対話していた場合、動作情報生成部１３７は、アバターに手話による動作、または対話をさせる制御情報を生成してもよい。

　また、人検出部１２１は、イベント情報またはスケジュール情報などからユーザの属性を検出してもよい。例えば、女性限定のイベントである場合、人検出部１２１は、センシング範囲内のユーザの属性が女性であることを検出してもよい。

　また、対象ユーザの年齢層に応じて、各種パラメータ（例えば、対象ユーザが止まっているか否かを判定する移動速度）の閾値が変更されてもよい。また、対象ユーザの年齢層に応じて、アバターの発話時の語尾（ですます調、または口語的に砕けた表現など）が変更されてもよい。

　また、動作情報生成部１３７は、対象ユーザが複数人のグループ（親子、友人同士など）で行動しているユーザであれば、対象ユーザ（代表者）だけでなく、グループ内の他のユーザに対しても順番にアバターに動作を行わせてもよい。このようなグループ内の他のユーザに対してアバターに動作を行わせる場合においても、マトリクスに含まれる動作区分は対象ユーザのセンシング情報から決定されてもよい。

　また、グループメンバーの判断は、対象ユーザの近傍に存在するユーザとの移動速度の一致度から判断されてもよい。ここでの、一致度の条件は、人口密度または分布によって決められてもよい。また、対象ユーザに対するアバターの動作に対し、他のユーザも反応した場合、グループに当該他のユーザが含められてもよい。また、対話条件検出部１３３は、同一グループ内でより興味度が高い他のユーザがいる場合は、対象ユーザを当該興味度が高い他のユーザに変更してもよい。

　また、興味度推定部１２９は、グループ単位での興味度を推定してもよい。例えば、グループ内の各メンバーの平均速度（または最大速度、最小速度等）、または重心位置（または代表者の位置等）等の各種パラメータに基づいて、アバターに対するグループの興味度を推定してもよい。また、動作情報生成部１３７は、グループに向けたアバターの動作を制御するための制御情報を生成してもよい。グループに向けたアバターの動作は、例えば、「君たち」のような複数人に向けた声掛けに関する動作であってもよい。

　また、動作情報生成部１３７は、対象ユーザが用いる言語（例えば、母国語）に応じて、アバターの声掛けに係る言語を変更してもよい。ここで、対象ユーザが用いる言語を判断する手法として、制御部１２０が発話内容などを複数言語でディスプレイ装置３００に表示させ、動作情報生成部１３７は、当該複数言語のうち対象ユーザが見ている言語を、当該対象ユーザが用いる言語として判断してもよい。

　または、動作情報生成部１３７は、メタバース環境（例えば、仮想空間）で対象ユーザの母国語が設定されている場合、当該母国語を対象ユーザが用いる言語として判断してもよい。または、動作情報生成部１３７は、対象ユーザのリアクションした際に発話した言語、パラ言語、またはボディーランゲージなどから、対象ユーザが用いる言語を判断してもよい。そして、動作情報生成部１３７は、対象ユーザが用いる言語に応じて、アバターの動作、声掛けの言語を変更してもよい。

　また、対象ユーザがイヤフォンまたはヘッドホンなどの耳を塞ぐようなデバイスを着用している場合、動作情報生成部１３７は、アバターによる声掛けの音量を調整してもよい。また、動作情報生成部１３７は、アバターと対象ユーザとの間の距離に応じて、アバターによる発話の仕方または音量を変更してもよい。例えば、動作情報生成部１３７は、アバターと対象ユーザとの間の距離が遠い程、声掛けの音量が大きくなるように調整してもよい。

　また、対話するユーザ数などの目標値が設定されていてもよく、この場合、距離または速度の閾値は、ユーザまたは環境の状況に応じて適宜変更されてもよい。例えば、対話するユーザ数などの目標値が大きく設定されている場合、動作情報生成部１３７は、通常のコミュニケーションエリアより遠いエリアに存在する対象ユーザも対話開始の対象にしてもよいし、移動速度が通常より大きい対象ユーザも対話開始の対象になるように対話開始条件を変更してもよい。

　また、動作情報生成部１３７は、通勤時間、休日または平日などの時間帯に応じて、動作情報の決定に用いる各種パラメータ（距離または速度等）の閾値を変更してもよい。

　また、情報処理装置１０の図示しない記憶部が対象ユーザの過去の対話履歴を保持している場合、動作情報生成部１３７は、過去の対話履歴を基に、アバターの動作の内容を決定してもよい。

　また、操作対象と、ユーザによる興味度の対象は必ずしも一致していなくてもよい。図９は、ユーザによる興味度の対象の他の例を示す図である。例えば、店頭販売または商品プロモーションのケースを想定すると、興味度推定部１２９は、操作対象であるアバターＡではなく、商品Ｐに対するユーザＵの興味度を推定してもよい。そして、動作情報生成部１３７は、商品Ｐに対するユーザの興味度に基づく対象ユーザが対話条件を満たしているか否かに基づき、アバターＡの動作を制御するための制御情報を生成してもよい。

　以上説明したような情報処理装置１０の各種処理によれば多様な効果が得られる。例えば、興味度推定部１２９がユーザの興味度を推定し、対話条件検出部１３３は、当該興味度に基づいて対象ユーザを検出する。これにより、アバターとの対話意思がないユーザにはアバターが働きかけ（振る舞い、声掛け）を行わないという判断が可能になる。この結果、ユーザの対話意思に反した動作をアバターが行う可能性が低くなる。更に、興味度に基づいて対象ユーザが検出されることで、複数のユーザの中から対話可能性が高いユーザにのみにアバターが働きかけを行うという判断が可能になる。この結果、アバターがユーザと対話するという目的の成功率を高めることができ、円滑なコミュニケーションを図ることを可能にする。そして、円滑なコミュニケーションが行われることで、店舗への効率的な集客が実現され得る。

　また、興味度の推定により対話可能性が高いと判断された対象ユーザであっても、対話意思があるかを正確に判断することはできない場合がある。また、対話意思のようなユーザの内部状態は明示的に表出される要素ではないため、そのままではセンシングすることが困難になり得る。そこで、動作情報生成部１３７は、アバターから対象ユーザに働きかけを行い、当該対象ユーザの状態変化を促すことで、対話意思をセンシング可能な要素として表出させる。これにより、対話意思の判断の誤りが減ることで、ユーザがアバターに対して感じ得る鬱陶しさが軽減され得る。また、動作情報生成部１３７は、対象ユーザの位置および対象ユーザの移動状態に基づいて、アバターの働きかけの強度（ユーザの意識または注意を引く度合い）および内容を変えることで、自身の行動がアバターに理解されていると対象ユーザに感じさせ、更にアバターに対して人らしさを感じやすくすることが可能になる。これにより、円滑なコミュニケーションを図ることが可能になる。

　なお、本開示に係る情報処理装置１０による各種処理は、図１に示したような屋外デジタル広告（ＤＯＯＨ：Ｄｉｇｉｔａｌ　Ｏｕｔ　Ｏｆ　Ｈｏｍｅ）等において活用可能であるが活用先は係る例に限定されない。続いて、本開示に係る情報処理装置１０として他の実施例を説明する。

　＜２．４．他の実施例＞
　例えば、本開示に係る情報処理装置１０による各種処理は、メタバース環境での活用が可能である。まずは、本開示に係る情報処理装置１０による各種処理を、ＦＰＶ（Ｆｉｒｓｔ　Ｐｅｒｓｏｎ　Ｖｉｅｗ）のメタバース環境で活用する場合について説明する。

　本開示に係る情報処理装置１０による各種処理を、ＦＰＶのメタバース環境で活用する場合、情報処理装置１０は、サーバであってもよく、当該サーバは、ネットワーク介して、ＶＲ（Ｖｉｒｔｕａｌ　Ｒｅａｌｉｔｙ）装置（例えば、ＨＭＤ）等の端末と接続されてもよい。この際に、サーバは、ネットワークを介してＰＣと接続されていてもよく、ＶＲ装置は、当該ＰＣに接続されてもよい。更に、ＰＣには、アバターの操作に用いるコントローラが接続されてもよい。

　また、センシング対象（対象ユーザの候補）は、ユーザが操作するアバターであり、操作対象は、ＮＰＣであってもよい。また、ユーザの位置および移動速度に関しては、ユーザが操作するアバターの位置および移動速度に関する情報が用いられてもよい。なお、仮想空間内において、ユーザ操作に基づいてアバターは移動するが、当該ユーザ操作には、多種多様な手法が想定されるが、特に限定されない。例えば、ユーザ操作は、ユーザが実世界でのコントローラによる操作によりアバターが移動する手法であってもよいし、ユーザが実世界で行った移動をアバターに反映させる手法であってもよい。

　また、視線方向のセンシングには、ＶＲ装置（ＨＭＤ）に内蔵されたアイトラッカーの情報が用いられてもよいし、視線方向の代わりにユーザの顔の向きに関する顔情報が用いられてもよい。

　また、コントローラによるワープ移動を行う際に、ユーザがワープ先を見ると視線がワープ先に外れるため、ＮＰＣに対する興味度が実際よりも低下する場合がある。そこで、興味度推定部１２９は、ワープ移動の操作中において、興味度または対話条件に係る各種パラメータの値を維持してもよい。

　また、動作情報生成部１３７は、ユーザによる設定情報から、ＮＰＣからの働きかけにバリエーションを出してもよい。例えば、動作情報生成部１３７は、ユーザの設定言語に合わせて、ＮＰＣによる声がけまたは動作を変更してもよい。

　また、表示サイズが小さくなる場合または解像度が低い場合など、ユーザにとって視認性が低い場合、動作情報生成部１３７は、ＮＰＣが表出するような視線または動作に関する表示情報を生成してもよいし、見えにくいＮＰＣの表情を見えやすく補助するような表示情報を生成してもよい。具体的には、動作情報生成部１３７は、ＮＰＣの視線方向の表示、アバターに見られている際にユーザが制御するアバターを縁取りする表示、またはＮＰＣの動作を際立たせるようなエフェクトの表示などの各種表示情報を生成してもよい。

　また、本開示に係る情報処理装置１０による各種処理を、ＴＰＶ（Ｔｈｉｒｄ　Ｐｅｒｓｏｎ　Ｖｉｅｗ）のメタバース環境で活用してもよい。以下では、情報処理装置１０による各種処理をＦＰＶのメタバース環境で活用した場合と異なる内容を主に説明する。

　本開示に係る情報処理装置１０による各種処理を、ＴＰＶのメタバース環境で活用する場合、情報処理装置１０は、サーバであってもよく、当該サーバは、ネットワーク介して、スマートフォンまたはＶＲ装置（ＨＭＤ）等の端末と接続されてもよい。また、情報処理装置１０がスマートフォンに接続されている場合、ユーザが操作するアバターおよびＮＰＣの表示と、アバターの操作には、スマートフォンが備える操作表示部（タッチパネル）が用いられてもよい。

　情報処理装置１０がスマートフォンに接続されている場合、視線検出部１２５は、スマートフォンが備えるカメラにより得られた画像データを用いて、ユーザがスマートフォンのディスプレイ内のどこを見ているか（視線方向）を検出してもよい。

　以上説明した情報処理装置１０による各種処理を、ＦＰＶまたはＴＰＶのメタバース環境で活用する例によれば、より自然で人らしいＮＰＣの振る舞いが実現され得る。

　また、興味度の推定または制御情報の生成に用いる各種パラメータの閾値を変えることで、多様な性格（例えば、積極的）をＮＰＣに反映することが可能になる。

　以上、本開示に係る情報処理装置１０の制御に係る詳細を説明した。続いて、本開示に係る情報処理装置１０の動作処理の具体例を説明する。

　＜＜３．動作処理例＞＞
　図１０は、本開示に係る情報処理装置１０の動作処理の一例を説明するための説明図である。まず、人検出部１２１は、センシング範囲内にいる人を検出する（ステップＳ１０１）。この際に、人検出部１２１は、検出した人の位置情報を検出し、視線検出部１２５は、検出された人の視線情報を検出してもよい。

　続いて、興味度推定部１２９は、人検出部１２１により検出された人の興味度を推定し、興味度情報を取得する（ステップＳ１０５）。

　次に、対話条件検出部１３３は、興味度情報に基づき、対象ユーザを検出する（ステップＳ１０９）。例えば、対話条件検出部１３３は、複数のユーザのうち最も高い興味度のユーザを対象ユーザとして検出してもよい。

　そして、対話条件検出部１３３は、人検出部１２１および視線検出部１２５により検出された各種パラメータに基づき、対象ユーザがいるエリアを検出する（ステップＳ１１３）。

　更に、対話条件検出部１３３は、人検出部１２１および視線検出部１２５により検出された各種パラメータに基づき、対象ユーザの移動状態を検出する（ステップＳ１１７）。

　そして、動作情報生成部１３７は、対話条件検出部１３３により検出された対象ユーザがいるエリアおよび対象ユーザの移動状態に基づき、アバターの動作区分を判定する（ステップＳ１２１）。

　次いで、制御部１２０は、アバターの動作区分が対話開始の動作区分であるか否かを判定する（ステップＳ１２５）。アバターの動作区分が対話開始の動作区分である場合（ステップＳ１２５：ＹＥＳ）、処理はステップＳ１２９に進められ、アバターの動作区分が対話開始の動作区分でない場合（ステップＳ１２５：ＮＯ）、処理はステップＳ１３３に進められる。

　アバターの動作区分が対話開始の動作区分である場合（ステップＳ１２５：ＹＥＳ）、動作情報生成部１３７は、対象ユーザとの対話を開始させるようにアバターの動作を制御するための制御情報を生成する（ステップＳ１２９）。そして、描画部１４１は、制御情報に基づいてアバターを描画し、本開示に係る情報処理装置１０は動作処理を終了する。

　アバターの動作区分が対話開始の動作区分でない場合（ステップＳ１２５：ＮＯ）、制御部１２０は、アバターの動作区分が対象ユーザを再選定する動作区分であるか否かを判定する（ステップＳ１３３）。アバターの動作区分が対象ユーザを再選定する動作区分である場合（ステップＳ１３３：ＹＥＳ）、処理はステップＳ１０１に戻り、人検出部１２１により再びセンシング範囲内にいる人が検出される。アバターの動作区分が対象ユーザを再選定する動作区分でない場合（ステップＳ１３３：ＮＯ）、処理はステップＳ１３７に進められる。

　アバターの動作区分が対象ユーザを再選定する動作区分でない場合（ステップＳ１３３：ＮＯ）、動作情報生成部１３７は、動作区分に応じたアバターの動作を制御するための制御情報を生成し（ステップＳ１３７）、描画部１４１は、生成された制御情報に基づいてアバターを描画する。そして、処理はステップＳ１１３に戻り、対話条件検出部１３３により再び対象ユーザがいるエリアが検出される。

　以上、本開示に係る動作処理の具体例を説明した。続いて、図１１を参照し、本開示に係る情報処理装置１０のハードウェア構成の一例を説明する。

　＜＜４．ハードウェア構成例＞＞
　以上、本開示に係る実施形態を説明した。上述した情報処理は、ソフトウェアと、以下に説明する情報処理装置１０のハードウェアとの協働により実現される。

　図１１は、本開示の一実施形態に係る情報処理装置９０のハードウェア構成例を示すブロック図である。情報処理装置９０は、情報処理装置１０と同等のハードウェア構成を有する装置であってよい。

　図１１に示すように、情報処理装置９０は、例えば、プロセッサ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　（プロセッサ８７１）
　プロセッサ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記憶媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

　（ＲＯＭ８７２、ＲＡＭ８７３）
　ＲＯＭ８７２は、プロセッサ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、プロセッサ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

　（ホストバス８７４、ブリッジ８７５、外部バス８７６、インターフェース８７７）
　プロセッサ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

　（入力装置８７８）
　入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

　（出力装置８７９）
　出力装置８７９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

　（ストレージ８８０）
　ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

　（ドライブ８８１）
　ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記憶媒体９０１に記録された情報を読み出し、又はリムーバブル記憶媒体９０１に情報を書き込む装置である。

　（リムーバブル記憶媒体９０１）
　リムーバブル記憶媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記憶媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

　（接続ポート８８２）
　接続ポート８８２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

　（外部接続機器９０２）
　外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

　（通信装置８８３）
　通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデム等である。

　＜＜５．補足＞＞
　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、上述した例では、操作対象が仮想対象（アバター）である例を主に説明したが、本開示に係る操作対象は、仮想対象に限定されない。例えば、本開示に係る操作対象は、コミュニケーションなどの実物の対象であってもよい。但し、コミュニケーションロボットは、視線が合ったことをユーザが感じやすい要素（例えば、目を有する）、表情を表現可能な要素、および身振りを表現できる手足などを有していることが望ましい。

　また、本開示に係るアバターは、目のないアバター（例えば、植物型のアバターなど）であってもよい。この場合、アバターの顔の向きや体の向きを視線方向として各種処理が実行されてもよい。

　また、本開示に係る情報処理装置１０による各種処理は、接客のサポートおよびトレーニングで活用されてもよい。本開示に係る情報処理装置１０による各種処理を、接客のサポートおよびトレーニングで活用する場合、情報処理装置１０は、ＰＣであってもよく、当該ＰＣとネットワーク介して、タブレット端末等のディスプレイを有する端末が接続されてもよい。また、興味度が高い人がどのようなユーザなのか、また、対象ユーザの状況に応じた最適なアバターの動作はなにか、などの各種情報が接客の補助として活用されてもよい。補助方法の具体例として、例えば、モニターやＡＲグラス等が有するディスプレイを使う場合、当該ディスプレイは、センシング範囲内の各ユーザの興味度を可視化した情報を表示してもよいし、対象ユーザに対する働きかけの候補を表示してもよい。また、オペレータは、ディスプレイに表示された興味度を参照し、対象ユーザを手動で選択してもよいし、働きかけの候補から一の働きかけを選択することでアバターに対する動作の指定をしてもよい。

　また、情報処理装置１０は、人検出部１２１、視線検出部１２５および興味度推定部１２９を必ずしも備えていなくてもよい。例えば、人検出部１２１、視線検出部１２５および興味度推定部１２９による各種処理は、他の装置により行われてもよい。そして、情報処理装置１０が備える通信部１１０は、他の装置により検出されたユーザの位置情報および視線情報等の各種パラメータと、興味度情報と、を当該他の装置から受信してもよい。なお、この場合、通信部１１０は、取得部の一例である。

　また、本明細書の情報処理システムの処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、情報処理システムの処理における各ステップは、フローチャートとして記載した順序と異なる順序や並列的に処理されてもよい。

　また、情報処理装置１０に内蔵されるＣＰＵ、ＲＯＭおよびＲＡＭなどのハードウェアに、上述した情報処理装置１０の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、当該コンピュータプログラムを記憶させた非一時的な記憶媒体も提供される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　操作対象に対するユーザの興味度を示す興味度情報を取得する取得部と、
　前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成部と、
を備える、情報処理装置。
（２）
　前記生成部は、
　前記対象ユーザが対話条件を満たしている際に、前記対象ユーザに向けて、前記操作対象に対話させる制御情報を生成する、
前記（１）に記載の情報処理装置。
（３）
　前記興味度情報に基づき対象ユーザを検出し、検出した前記対象ユーザの状況に基づき、前記対象ユーザが対話条件を満たしているか否かを判定する検出部、
を更に備える、
前記（２）に記載の情報処理装置。
（４）
　前記検出部は、
　前記対象ユーザの状況が所定の基準を満たさなかった際に、前記興味度情報に基づき他のユーザを対象ユーザとして再検出する、
前記（３）に記載の情報処理装置。
（５）
　前記対象ユーザの状況には、前記対象ユーザの移動状態が含まれ、
　前記検出部は、
　前記対象ユーザが前記操作対象の前方を通り過ぎた場合に、前記対象ユーザの状況が所定の基準を満たさなかったと判定し、前記興味度情報に基づき他のユーザを対象ユーザとして再検出する、
前記（４）に記載の情報処理装置。
（６）
　前記生成部は、
　前記対象ユーザが対話条件を満たさず、前記対象ユーザが前記操作対象の前方を通り過ぎていない場合に、前記対象ユーザの状況に基づく前記操作対象の動作を制御するための制御情報を生成する、
前記（５）に記載の情報処理装置。
（７）
　前記対象ユーザの状況には、前記対象ユーザおよび前記操作対象の位置関係が含まれ、
　前記生成部は、
　前記対象ユーザの移動状態および前記操作対象に対する前記対象ユーザの位置に基づき、前記操作対象の動作を制御するための制御情報を生成する、
前記（６）に記載の情報処理装置。
（８）
　前記生成部は、
　前記操作対象に対する対象ユーザの位置と、前記対象ユーザの移動状態と、の各々に対応する動作区分に応じた前記操作対象の動作を制御するための制御情報を生成する、
前記（７）に記載の情報処理装置。
（９）
　前記検出部は、
　前記前記対象ユーザが所定のエリア内に止まっていた場合に、前記対象ユーザが対話条件を満たしていると判定する、
前記（８）に記載の情報処理装置。
（１０）
　前記取得部は、
　前記操作対象に対するユーザの位置に基づき、前記興味度情報を取得する、
前記（１）から前記（９）までのうちいずれか一項に記載の情報処理装置。
（１１）
　前記取得部は、
　前記ユーザの移動速度に基づき、前記興味度情報を取得する、
前記（１０）に記載の情報処理装置。
（１２）
　前記取得部は、
　前記ユーザの撮影により得られた画像データに基づき、前記ユーザの位置および前記ユーザの移動速度に関する情報を取得する、
前記（１１）に記載の情報処理装置。
（１３）
　前記ユーザの位置は、前記ユーザの操作するアバターの位置であり、
　前記ユーザの速度は、前記ユーザの操作するアバターの速度である、
前記（１１）に記載の情報処理装置。
（１４）
　前記取得部は、
　前記ユーザの視線方向に基づき、前記興味度情報を取得する、
前記（１）から前記（１３）までのうちいずれか一項に記載の情報処理装置。
（１５）
　前記取得部は、
　瞳孔角膜反射法に基づき、前記ユーザの視線方向に関する情報を取得する、
前記（１４）に記載の情報処理装置。
（１６）
　前記検出部は、
　複数のユーザのうち、前記興味度が最も高いユーザを対象ユーザとして検出し、前記対象ユーザの状況が所定の基準を満たさなかった際に、前記興味度が次に高い他のユーザを対象ユーザとして再検出する、
前記（４）に記載の情報処理装置。
（１７）
　前記検出部は、
　複数のユーザのうち、前記興味度が所定値以上であり、且つ前記興味度が最も高いユーザを対象ユーザとして検出し、前記対象ユーザの状況が所定の基準を満たさなかった際に、前記興味度が前記所定値以上で次に高い他のユーザを対象ユーザとして再検出する、
前記（１６）に記載の情報処理装置。
（１８）
　前記対象ユーザの状況には、前記興味度が含まれ、
　前記生成部は、
　前記対象ユーザの興味度に基づき、前記操作対象の動作を制御するための制御情報を生成する、
前記（２）から前記（９）までのうちいずれか一項に記載の情報処理装置。
（１９）
　操作対象に対するユーザの興味度を示す興味度情報を取得することと、
　前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成することと、
を含む、コンピュータにより実行される情報処理方法。
（２０）
　コンピュータに、
　操作対象に対するユーザの興味度を示す興味度情報を取得する取得機能と、
　前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成機能と、
を実現させるための、プログラムが記憶されたコンピュータにより読み取り可能な非一時的な記憶媒体。

１０　　情報処理装置
１１０　　通信部
１２０　　制御部
　１２１　　人検出部
　１２５　　視線検出部
　１２９　　興味度推定部
　１３３　　対話条件検出部
　１３７　　動作情報生成部
　１４１　　描画部
２００　　カメラ
３００　　ディスプレイ装置

Claims

　操作対象に対するユーザの興味度を示す興味度情報を取得する取得部と、
　前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成部と、
を備える、情報処理装置。
　前記生成部は、
　前記対象ユーザが対話条件を満たしている際に、前記対象ユーザに向けて、前記操作対象に対話させる制御情報を生成する、
請求項１に記載の情報処理装置。
　前記興味度情報に基づき対象ユーザを検出し、検出した前記対象ユーザの状況に基づき、前記対象ユーザが対話条件を満たしているか否かを判定する検出部、
を更に備える、
請求項２に記載の情報処理装置。
　前記検出部は、
　前記対象ユーザの状況が所定の基準を満たさなかった際に、前記興味度情報に基づき他のユーザを対象ユーザとして再検出する、
請求項３に記載の情報処理装置。
　前記対象ユーザの状況には、前記対象ユーザの移動状態が含まれ、
　前記検出部は、
　前記対象ユーザが前記操作対象の前方を通り過ぎた場合に、前記対象ユーザの状況が所定の基準を満たさなかったと判定し、前記興味度情報に基づき他のユーザを対象ユーザとして再検出する、
請求項４に記載の情報処理装置。
　前記生成部は、
　前記対象ユーザが対話条件を満たさず、前記対象ユーザが前記操作対象の前方を通り過ぎていない場合に、前記対象ユーザの状況に基づく前記操作対象の動作を制御するための制御情報を生成する、
請求項５に記載の情報処理装置。
　前記対象ユーザの状況には、前記対象ユーザおよび前記操作対象の位置関係が含まれ、
　前記生成部は、
　前記対象ユーザの移動状態および前記操作対象に対する前記対象ユーザの位置に基づき、前記操作対象の動作を制御するための制御情報を生成する、
請求項６に記載の情報処理装置。
　前記生成部は、
　前記操作対象に対する対象ユーザの位置と、前記対象ユーザの移動状態と、の各々に対応する動作区分に応じた前記操作対象の動作を制御するための制御情報を生成する、
請求項７に記載の情報処理装置。
　前記検出部は、
　前記前記対象ユーザが所定のエリア内に止まっていた場合に、前記対象ユーザが対話条件を満たしていると判定する、
請求項８に記載の情報処理装置。
　前記取得部は、
　前記操作対象に対するユーザの位置に基づき、前記興味度情報を取得する、
請求項１に記載の情報処理装置。
　前記取得部は、
　前記ユーザの移動速度に基づき、前記興味度情報を取得する、
請求項１０に記載の情報処理装置。
　前記取得部は、
　前記ユーザの撮影により得られた画像データに基づき、前記ユーザの位置および前記ユーザの移動速度に関する情報を取得する、
請求項１１に記載の情報処理装置。
　前記ユーザの位置は、前記ユーザの操作するアバターの位置であり、
　前記ユーザの速度は、前記ユーザの操作するアバターの速度である、
請求項１１に記載の情報処理装置。
　前記取得部は、
　前記ユーザの視線方向に基づき、前記興味度情報を取得する、
請求項１に記載の情報処理装置。
　前記取得部は、
　瞳孔角膜反射法に基づき、前記ユーザの視線方向に関する情報を取得する、
請求項１４に記載の情報処理装置。
　前記検出部は、
　複数のユーザのうち、前記興味度が最も高いユーザを対象ユーザとして検出し、前記対象ユーザの状況が所定の基準を満たさなかった際に、前記興味度が次に高い他のユーザを対象ユーザとして再検出する、
請求項４に記載の情報処理装置。
　前記検出部は、
　複数のユーザのうち、前記興味度が所定値以上であり、且つ前記興味度が最も高いユーザを対象ユーザとして検出し、前記対象ユーザの状況が所定の基準を満たさなかった際に、前記興味度が前記所定値以上で次に高い他のユーザを対象ユーザとして再検出する、
請求項１６に記載の情報処理装置。
　前記対象ユーザの状況には、前記興味度が含まれ、
　前記生成部は、
　前記対象ユーザの興味度に基づき、前記操作対象の動作を制御するための制御情報を生成する、
請求項２に記載の情報処理装置。
　操作対象に対するユーザの興味度を示す興味度情報を取得することと、
　前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成することと、
を含む、コンピュータにより実行される情報処理方法。
　コンピュータに、
　操作対象に対するユーザの興味度を示す興味度情報を取得する取得機能と、
　前記興味度情報に基づく対象ユーザが対話条件を満たしているか否かに基づき、前記操作対象の動作を制御するための制御情報を生成する生成機能と、
を実現させるための、プログラムが記憶されたコンピュータにより読み取り可能な非一時的な記憶媒体。