WO2018154942A1

WO2018154942A1 - 表示制御装置、方法及びプログラム

Info

Publication number: WO2018154942A1
Application number: PCT/JP2017/045630
Authority: WO
Inventors: 計人椋; 一真高橋; 修櫻井; 聰赤川; 真一入矢; 誠今村; 悟郎高木
Original assignee: ソニー株式会社
Priority date: 2017-02-24
Filing date: 2017-12-20
Publication date: 2018-08-30
Also published as: CN110291498A; US20200050345A1; DE112017007121T5

Abstract

過去に提示された情報に効率的にアクセスできるユーザインターフェイスを提供する。検出部と制御部と出力部を具備する情報処理装置である。上記検出部は、ユーザの挙動を検出する。上記制御部は、上記検出された挙動に応じて上記ユーザの現在の関心対象を判別し、当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成する。上記出力部は、上記生成された表示情報を出力する。上記制御部は、上記判別された関心対象の変化に応じて、上記出力部により出力された上記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、上記表示情報の表示態様を最適化する。

Description

表示制御装置、方法及びプログラム

　本技術は、情報処理装置、方法及びプログラムに関する。

　特許文献１にはカメラを備えるプロジェクタが開示されている。例えば、特許文献１の段落００９６には、画像が投影されたテーブル上でユーザがハンドジェスチャーを行い、ジェスチャー認識により入力を行うことが記載されている。他方で、特許文献２には、段落００４８ないし００６４に仮想的な音像定位に関する技術が開示されている。

特開２０１３－２５７６８６号公報特開２０１１－１８８２８７号公報

　パーソナルコンピュータ（以下、ＰＣと表記する場合がある）やスマートフォンなどの情報機器には、情報表示に最適化された表示デバイス（例えば、液晶画面など）が設けられているのが普通である。しかしながら、近年では、なんらかの情報表示がなされることが意図されていない平面や空間、例えば、テーブル（特許文献１参照）や壁を、情報の表示面として利用することが考えられている。

　このようにユーザに情報を視覚的に伝達する物理的なインターフェイスが最適化されたものでない場合、過去のあるポイントにおいて提示された情報を、提示されたポイントに戻って取り出すことが効率的に行いにくいという問題点がある。

　以上のような事情に鑑み、本技術の目的は、過去に提示された情報に効率的にアクセスできるユーザインターフェイスを提供することにある。

　上記目的を達成する本技術の一側面は、検出部と制御部と出力部を具備する情報処理装置である。
　上記検出部は、ユーザの挙動を検出する。
　上記制御部は、上記検出された挙動に応じて上記ユーザの現在の関心対象を判別し、当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成する。
　上記出力部は、上記生成された表示情報を出力する。
　上記制御部は、上記判別された関心対象の変化に応じて、上記出力部により出力された上記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、上記表示情報の表示態様を最適化する。

　上記情報処理装置によれば、ユーザが何かアクション（発話、指によるタップなどを含む挙動）を起こすだけで、それに応じたキーワードが選択され、過去に提示された情報の中から一つを選んで最適化された表示画面を生成するので、過去に提示された情報に効率的にアクセスできるユーザインターフェイスが提供される。

　上記制御部は、上記ユーザの挙動に基づいて、上記出力部により過去に出力されたコンテンツが現在の関心対象であると判別された場合、現在の関心対象であると判別された過去に出力されたコンテンツを上記表示情報に含め、当該表示情報の表示態様を最適化してもよい。

　この場合、ユーザの挙動が過去に出力されたコンテンツを指し示す場合（例えば、「さっき」のような発話）、検出された当該ユーザの挙動に基づくコンテンツを、ユーザが話題の中心にしている情報として抽出することができる。

　上記出力部は、上記出力部により過去に出力されたコンテンツにそれぞれ対応する表示エレメントを、出力された順にラインで繋がって出力されるように上記表示情報を生成してもよい。

　複数の過去に出力されたコンテンツの先後関係をライン（線）で繋ぐことで、目に見える形で示すことができる。

　上記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツに絞込みを行うことにより上記表示情報の表示態様を最適化してもよい。

　ユーザが現在関心を持っている対象に絞込みを行うことにより、より最適化された提示が可能になる。

　上記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツに対応する表示エレメントが上記ユーザの視点の中心に来るように上記表示情報を生成してもよい。

　この場合、ＧＵＩにおける表示エレメントのレイアウトを逐次最適化することができる。

　上記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツと共通するレイヤーに属するコンテンツを、現在の関心対象であると判別された過去に出力されたコンテンツと共に上記表示情報に含めてもよい。

　ＧＵＩにおける表示エレメントのレイアウトをさらに最適化することができる。

　上記制御部は、複数のコンテンツが共通するレイヤーに属することを、視覚効果及び／又は共通の枠により示す上記表示情報を生成してもよい。

　上記検出部は、上記ユーザの音声を入力してもよい。また、この場合、上記制御部は、上記検出部により入力された上記ユーザの音声を解析することによって、現在の関心対象を判別してもよい。

　ユーザの（又はユーザ同士の）発話という自然な入力方法を提供することにより、ユーザに負担をかけず効率的なユーザインターフェイスを実現することができる。

　上記目的を達成する本技術の別の一側面は、次のステップを有する情報処理方法である。
・ユーザの挙動を検出する検出ステップ。
・上記検出された挙動に応じて上記ユーザの現在の関心対象を判別するステップ。
・当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成するステップ。
・上記生成された表示情報を出力するステップ。
・上記判別された関心対象の変化に応じて、上記出力部により出力された上記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、上記表示情報の表示態様を最適化するステップ。

　上記情報処理方法によっても、上記情報処理装置と同等の効果が得られる。

　上記目的を達成する本技術の別の一側面は、情報処理装置に、次のステップを実行察せるプログラムである。
・ユーザの挙動を検出する検出ステップ。
・上記検出された挙動に応じて上記ユーザの現在の関心対象を判別するステップ。
・当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成するステップ。
・上記生成された表示情報を出力するステップ。
・上記判別された関心対象の変化に応じて、上記出力部により出力された上記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、上記表示情報の表示態様を最適化するステップ。

　以上のように、本技術によれば、過去に提示された情報に効率的にアクセスできるユーザインターフェイスを提供することができる。
　なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本技術の一実施形態に係る情報処理装置の内部構成例を示す図である。上記実施形態に係る情報処理装置の外観構成例１を示す図である。上記実施形態に係る情報処理装置のハードウェア構成例２を示す図である。上記実施形態に係る情報処理装置のハードウェア構成例２を示す図である。上記実施形態に係る情報処理装置のハードウェア構成例３を示す図である。上記実施形態に係る情報処理装置のハードウェア構成例３を示す図である。上記実施形態に係る情報処理装置のソフトウェア構成例を示す図である。上記実施形態に係る情報処理装置のＧＵＩ部品を示す図である。上記実施形態に係る情報処理装置のＧＵＩの構成を説明するための図である。上記実施形態に係る情報処理装置の基本処理を示すフローチャートである。上記実施形態に係る情報処理装置の基本処理におけるＧＵＩの一例である。上記実施形態に係る情報処理装置の基本処理におけるＧＵＩの一例である。上記実施形態に係る情報処理装置の基本処理におけるＧＵＩの一例である。図１０のＳＴ１５の、表示画面の最適化処理を示すフローチャートである。上記実施形態に係る情報処理装置の表示画面の最適化処理に関する図である。上記実施形態に係る情報処理装置の表示画面の最適化処理に関する図である。上記実施形態に係る情報処理装置の表示画面の最適化処理に関する図である。上記実施形態に係る情報処理装置の表示画面の最適化処理に関する図である。上記実施形態に係る情報処理装置の表示画面の最適化処理に関する図である。上記実施形態に係る情報処理装置の表示画面の最適化処理に関する図である。上記実施形態において過去に提示した情報のデータ構造を簡略化して示す図である。図１０のＳＴ１４の、過去の情報抽出する処理の手順を示すフローチャートである。上記実施形態における情報のレイヤーの概念図である。上記実施形態における情報のレイヤーの概念図である。上記実施形態における情報のレイヤーの概念図である。上記実施形態により提示されるユーザインターフェイスの遷移例である。上記実施形態により提示されるユーザインターフェイスの遷移例である。上記実施形態により提示されるユーザインターフェイスの遷移例である。上記実施形態により提示されるユーザインターフェイスの遷移例である。上記実施形態により提示されるユーザインターフェイスの遷移例である。上記実施形態のさらに異なる変形例としての情報処理装置１のハードウェア構成例とその利用シーン例を示す図である。

　以下、本技術の実施形態を示し、図面を参照しながら説明する。
　説明は以下の順番で行うものとする。
・情報処理装置のハードウェア構成
・情報処理装置のソフトウェア構成
・ＧＵＩ部品の説明
・ＧＵＩと基本処理の説明
・現在の関心対象であるコンテンツの説明
・表示画面の最適化
・情報の管理方法の説明
・過去に提示された情報にアクセスする際に実行される処理とＧＵＩの動き
・キーワードが共通する情報によるレイヤー化
・実施例シナリオ
・変形実施例

（１－１．情報処理装置のハードウェア構成）
　図１に本実施形態に係る情報処理装置のハードウェア構成例を示す。
　図示の情報処理装置１は、汎用のコンピュータと同様に、ハードウェアは、バス１４を介してＣＰＵ（Central Processing Unit: 中央演算装置）１１、ＲＯＭ（Read Only Memory: 読み出し専用記憶装置）１２、ＲＡＭ（Random Access Memory: ランダムアクセスメモリ）１３が接続されて処理制御部を構成してもよい。ＣＰＵ１１は表示情報（例えばプロジェクションする画面全体）を逐次生成する機能も備える。

　バス１４に接続された各種ハードウェアにより構成される処理制御部はさらに、イメージセンサ１５、マイク１６、プロジェクタ１７、スピーカ１８、通信部１９とバス１４で相互に情報通信可能に接続する。

　イメージセンサ１５は撮像機能を備え、マイク１６は音声入力機能を備える。イメージセンサ１５とマイク１６で検出部２０が構成される。イメージセンサ１５は、ユーザの挙動以外の環境（テーブル上の障害物や色）等もセンシングする。検出部２０はユーザの挙動を検出する。

　プロジェクタ１７は表示画像を投影する機能を備え、スピーカ１８は音声出力機能を備える。プロジェクタ１７とスピーカ１８で出力部２１が構成される。

　通信部１９は、外部機器と通信を行う入出力インターフェイスである。検出部２０と出力部２１の両方に属すると捉えてもよい。

　図２に本実施形態に係る情報処理装置１の外観構成例を示す。図示の例で、情報処理装置１はイメージセンサ１５やマイク１６、プロジェクタ１７、スピーカ１８などがすべて円筒形の筐体の中にワンパッケージにまとめられている。

　図２中、情報処理装置１は天井から吊り下げられ、テーブル２００に対して表示画面を投影可能に設置されている。本例では、テーブル２００の上面を表示面２０１としている。

　図３と図４に、図２とは異なる情報処理装置１のハードウェア構成例を示す。図示の例で、情報処理装置１のイメージセンサ１５やマイク１６、プロジェクタ１７、スピーカ１８は、物理的に異なるデバイスにセパレートされている。

　図３において、プロジェクタ１７は表示面２０１上にＧＵＩを投影する。ユーザはＧＵＩを見ながら、表示されている表示エレメントを指差したりタップしたり、発話したりする。これら、ユーザの視線や手の動き、発話といった挙動は、イメージセンサ１５とマイク１６によりセンシングされる。これら検出部２０により入力されたユーザの挙動に対するレスポンスが、プロジェクタ１７により表示されるＧＵＩとスピーカ１８により出力される音声により行われる。

　一部の表示出力や音声出力については、外部装置によりなされてもよい。図４には、ユーザが自分のスマートデバイス２２を持ちながら操作している利用シーンが示されている。情報処理装置１は、第三者に見られることがはばかられるような情報（パスワード入力や、代金決済の実行など）を出力する際は、プライベートなスマートデバイス２２に出力先を変更する。

　図３と図４に示すように、画像を投影する表示面２０１上に実オブジェクトがある場合、情報処理装置１は、プロジェクタ１７の投影するＧＵＩが、実オブジェクトに重複しないように避けながら、実オブジェクト（テーブルや壁などの平面を除く物体）が置かれていないような開いたスペースに展開されるように制御する。図示のように、実オブジェクト（りんご、コーヒーカップ、雑誌等の物体、テーブルや壁などの平面）は、イメージセンサ１５で認識する。イメージセンサ１５は開いたスペース（テーブルや壁などの平面の空き領域）も認識する。

　図５と図６に、もう一つ異なる情報処理装置１のハードウェア構成例とその利用シーン例を示す。図中の人物（ユーザ）は、首掛け（ネックホルダ）式の情報処理装置１を装着している。当該ユーザは、情報処理装置１が壁に投影するＧＵＩを操作する。この壁は表示装置ではないばかりか、そこにＧＵＩが表示されることが想定されたものでもない。

　本実施形態のハードウェア構成を、図５、図６に示すような一体型の首掛け式とすることで、そのようなＧＵＩが表示されることが意図されていない窓や壁のような平面もユーザが情報処理装置を操作し入出力を行うためのインターフェイスとして利用することが可能になる。

　なお、図５と図６に示すように、壁のような立面型の表示面２０１において、窓のようなくぼみがある場合、テーブルに置かれたコーヒーカップや雑誌などと同じように、ＧＵＩの投影されるスペースとしては適さないと判断され、くぼみを避けた箇所にＧＵＩが投影される。くぼみ等の認識はイメージセンサ１５が行い、投影画像の構成などの制御はＣＰＵ１１が行う。

（１－２．情報処理装置のソフトウェア構成）
　次に、情報処理装置１のソフトウェア構成について説明する。図７に情報処理装置１のソフトウェア構成の一例を示す。

　ＲＯＭ１２には、図７に示すような、画像処理ＳＷ１１、音声認識ＳＷ１２、自然言語解析ＳＷ１３、対話型ＵＩコアＳＷ１４、グラフィカル・ユーザ・インターフェイスＳＷ１５、音像定位・音声出力ＳＷ１６が記憶されている。ＣＰＵ１１がこれらを読み出し、ＲＡＭ１３に展開しロードすることで、以下に述べるような本実施形態の機能が提供され、処理が実行される。

　画像処理ＳＷ１１は、イメージセンサ１５の撮影画像に基づいて、ユーザの視点中心を割り出したり、表示面２０１上にある障害物のないエリアを割り出したり、ユーザが指し示している場所を割り出したりする機能を提供する。

　音声認識ＳＷ１２は、マイク１６が集音したユーザの音声を認識するソフトウェアである。自然言語解析ＳＷ１３は、認識された音声を自然言語として解析して、情報処理装置１が扱えるテキストデータや文字列データなどに変換するソフトウェアである。

　対話型ＵＩコア１４は、ユーザの発言や他の周辺情報を統合し、ユーザと対話するように情報をユーザに対して提示するエージェントを成立させる機能を提供する。以下、このようなエージェントを、「ユーザエージェント」と呼ぶ。

　グラフィカル・ユーザ・インターフェイスＳＷ１５は、ユーザエージェントによる情報提示を効率的に、ユーザフレンドリーに視覚的に提示する機能を提供する。グラフィカル・ユーザ・インターフェイスＳＷ１５の出力は、ＣＰＵ１１により表示画面が生成され、同表示画面がプロジェクタ１７から投影されるというプロセスで行われる。なお、以下では、グラフィカル・ユーザ・インターフェイスＳＷ１５が提供するグラフィカル・ユーザ・インターフェイスを単に「ＧＵＩ」と表記する。

　音像定位・音声出力ＳＷ１６は、ユーザエージェントの出力を音声でスピーカ１８から出力する機能を提供する。音像定位・音声出力ＳＷ１６はまた、その際、ＧＵＩにおけるユーザエージェントを表現する表示エレメントから音声が出力されているように、ユーザが感知しうるように、音像定位を行う。具体的には例えば、特許文献２に記載の技術を用いてもよい。

　図７に示したような対話型ＵＩコアＳＷ１４を中核としたソフトウェア群が、図１に示したようなハードウェアリソースを用いて所定の情報処理を実行することで、以下に述べるような本実施形態の機能が提供され、処理が実行される。

　なお、上述のソフトウェア構成は一例に過ぎず、対話型ＵＩコアＳＷ１４とグラフィカル・ユーザ・インターフェイスＳＷ１５が一体のソフトウェアとして構成されていてもよい。また、一部のソフトウェアがＳａａＳとして外部のクラウドから提供されてもよい。

（１－３．ＧＵＩ部品の説明）
　次に、プロジェクタ１７により投影されるＧＵＩにおいて用いられるＧＵＩ部品について図８を参照しながら説明する。

　図８に情報処理装置１が提供するＧＵＩ部品を示す。図示のように、提供されるＧＵＩ部品は、「基本オブジェクト（図８（ａ），（ｂ），（ｃ））として、エージェントアイコン、結節点、結線、データ（書類情報）、データ（見出し情報）を含み、「可変値調整オブジェクト」（図８（ｄ））として、Ｖ字型コントローラ、ダイヤル型コントローラを含む。

　図８（ｂ）を参照する。ドットで表現される「結節点」は、すべてのＧＵＩ部品に現れ、一単位の情報がそこにあることをユーザに示す。「結線」は「結節点」２つをつなぐ直線であり、「結節点」にポイントされる情報同士がつながることを示す。

　図８（ａ）を参照する。「エージェントアイコン」は、「結節点」を中心に、複数の不定形の閉曲線が不規則又は規則的に旋回するアイコンとして表現される。エージェントアイコンは情報処理装置１が提供するＧＵＩの出発点、起点となる。なお、エージェントアイコンの中心の結節点の周りの複数の不規則な閉曲線は、情報の入力中や出力中において、結節点を中心に周回するなどのアニメーションを伴って表示される。

　図８（ｃ）を参照する。基本オブジェクトとしての「データ（書類情報）」と「データ（見出し情報）」は、ユーザに提示するデータの表示枠組みである。その点で二つは同じであるが、書類情報は主に文字が主体のデータを提示し、見出し情報は写真や画像などをアイコン化して提示する。

　図８（ｄ）を参照する。「Ｖ字型コントローラ」はインジケータ内の棒をユーザが左右に動かすことで、量が調節されるようなＧＵＩ部品である。「ダイヤル型コントローラ」はダイヤルをユーザが左右に回転することで、量が調節されるようなＧＵＩ部品である。

　以上に述べたように、本実施形態のＧＵＩでは、ユーザに提示する情報に種々の種類があり、種類に応じて異なるＧＵＩ部品で提示する。ユーザに種類の違いに気づかせることができる。

（１－４．ＧＵＩと基本処理の説明）
　上述のＧＵＩ部品は、図９に示すように結線により各結節点が結ばれ、デイジーチェーン状に連なる。ただし、図９に示した全体が示されることは、特殊な状況を除いて、ない。図９には、表示面２０１上に実オブジェクト（りんご、コーヒーカップ、雑誌等の物体）が置かれている状況も図示されている。図９に示されているように、ＧＵＩ（後述するように、ユーザ操作の履歴を示している）は、実オブジェクトを避けて開いたスペースに展開される。図９に示すように、ＣＰＵ１１は、空き領域のサイズか形状に応じて、表示されるＧＵＩ部品、ないし、ＧＵＩ部品中に使用される表示枠や文字フォントを調整してもよい。

　ＣＰＵ１１はさらに、ユーザ操作の履歴を表すＧＵＩの色の調整をしてもよい。例えば、イメージセンサ１５により撮像されている表示面２０１の色に応じて表示色の調整をする。この場合、黒いテーブルが背景にあり、背景色が黒色ならば、表示は白枠、白文字で行う。その他には、例えば、イメージセンサ１５により撮像されている実オブジェクトに基づいて表示色調整を行う。この場合、赤いりんごを認識している場合、赤に近い色や緑でＧＵＩを表示することを避ける。

　イメージセンサ１５がＧＵＩの表示中に実オブジェクトが動いたことを撮像した場合、移動後の実オブジェクトの位置に応じて各ＧＵＩ部品の配置を、ＣＰＵ１１が再調整する。

　ＣＰＵ１１はイメージセンサ１５の撮影画像に基づいてユーザの目の位置を認識する。あるいは、推定する。例えば、手しか撮像されていないときは手の位置から顔の位置を推定する。そして、ＣＰＵ１１は、認識又は推定した目の位置と、表示するＧＵＩとの間に、実オブジェクトが入らないように、ＧＵＩの配置を調整する。例えば、花瓶などの丈の高い物体があることが認識される場合は、当該花瓶よりも手前にＧＵＩの表示をする。

　図９に全体像を示したＧＵＩが生成される基本処理について、図１０～図１３を参照しながら説明する。図１０は、本実施形態の基本処理の手順を示すフローチャートである。図１１～図１３は本実施形態に係る情報処理装置１の基本処理におけるＧＵＩの一例である。

　ＣＰＵ１１は、まずエージェントアイコンを表示する（ＳＴ１１）。エージェントアイコン（図８（ａ））はＧＵＩの出発点となる。また、この対話型ユーザインターフェイスの音声出力も、エージェントアイコンから聞こえてくるように、音像定位される。エージェントアイコンが表示されたＧＵＩが図１１に示されている。

　次に、検出部２０によりＣＰＵ１１へユーザの挙動が検出される（ＳＴ１２）。ここでいうユーザの挙動には、ユーザの発話や所作を含む。ユーザは複数の場合もある。図１１にはユーザが「Ｇｅｔ＃＃＃＃」と発話した例が示されている。情報処理装置１は、各ユーザの顔や声紋などの情報をあらかじめ登録されており、ユーザごとに挙動を検出することができる。情報処理装置１はユーザの着座している位置によりユーザを判別してもよい。

　次に、ＣＰＵ１１は、ユーザの挙動に応じてキーワードを選択する（ＳＴ１３）。キーワードは、例えば、発話中に含まれる言葉に基づいて決定される。

　次に、ＣＰＵ１１は、選択されたキーワードに基づいて、新規情報を検索するか、又は、過去の情報を抽出する（ＳＴ１４）。新規情報を検索することと、過去の情報を抽出することのどちらを選択するかは、キーワードに基づいてＣＰＵ１１が判断する。

　ＳＴ１３とＳＴ１４の詳細については後述する。ここでは、新規情報が検索されることとする。その場合、図１１から図１２のように遷移する。なお、図９、図１１から図１３においては、最適化された表示画面ではなく、概念的な表示画面を示している。

　図１２のような画面が出力されるとき、ＣＰＵ１１は、検索された情報／抽出された情報に基づいて、最適化した表示画面を生成する（ＳＴ１５）。ＣＰＵ１１はこれと同時に出力音声も生成してもよい。次に、ＣＰＵ１１は、生成した表示画面を音声と共に出力する（ＳＴ１６）。これらの処理の結果として、図１２のような表示画面がプロジェクタ１７から出力される。

　ＳＴ１２からＳＴ１６は、ユーザの入力に対してユーザインターフェイスがレスポンスを返すという流れになっている。ユーザがさらに発話（例えば、Ｓｅａｒｃｈ＃＃＃＃）すると、もう一度ＳＴ１２からＳＴ１６が繰り返され、図１３のような表示画面が出力される。

　図３、図９、図１１～図１３を参照しながら、情報処理装置１の基本処理の概要を再度説明する。

　図３に示すように、本実施形態により提供される対話型ユーザインターフェイスは、ユーザの発する音声言語（マイク１６が入力）と、それに対するシステムからの音声言語反応（スピーカ１８が出力）と、プロジェクタ１７によってテーブル上や壁面などの共用スペース上に投影された画像と、ユーザの視点位置情報（イメージセンサ１５が入力）と、ユーザの手指操作情報（イメージセンサ１５が入力）と、の相互関係によって成立する。なお、プロジェクタ１７は、ＣＰＵ１１により収集される情報や生成される情報のすべて（例えば図９に示すようなもの）を投影するわけではない。

□ユーザの開始命令により、ユーザエージェントのアイコンに相当するエージェントアイコンが表示され、一連の対話時間中、共有表示面上に滞在し続ける（図１１）。エージェントからの返事は、ユーザの要望に応じて、音声のみ、文字のみ、あるいは音声と文字、の各形式で伝えられる。対話が完了し、ユーザが終了命令を発するとエージェントアイコンは消える。

□エージェントアイコンが表示されている状態で、ユーザが特定の要求を発すると、エージェントアイコン中央から結線が伸び、その終端部に位置する結節点を起点に主要回答情報が表示される（図１２、図１３）。この結線を本線または手順線と呼ぶ。

□主要回答情報の項目に派生項目が存在する場合、主要回答情報と同じ結節点から別の結線が伸び（複数可）、終端部の結節点を起点に派生項目が表示される。この結線を支線又は関連線と呼ぶ。この支線、関連線は、図１２や図１３に示されている。

（１－５．現在の関心対象であるコンテンツの説明）
　図１２や図１３に示すように、本実施形態に係る情報処理装置１が提供するＧＵＩにおいては、ユーザの入力に対して、ユーザインターフェイスが直接返すレスポンスとなる情報（主要回答情報）と、当該情報に関連したり派生したりして生成される情報を、ＣＰＵ１１は保持し、また、出力部２１から出力する。

　このユーザインターフェイスが直接返すレスポンスとなる情報（主要回答情報）を「現在の関心対象であるコンテンツ」と呼ぶ（図１２、図１３参照）。関連情報や派生情報は支線又は関連線で結ばれて表示されるが、図１３に示すように、フォーカスされている情報である「現在の関心対象であるコンテンツ」から遠い情報は、フェイドアウトやアイコン化、サイズの縮小などの視覚効果を伴って表示される。あるいは、表示が省略される。

（１－６．表示画面の最適化）
　次に、ＳＴ１４にて、ＣＰＵ１１が実行する表示画面の最適化処理について、図１４～図１８を参照しながら説明する。図１４は、最適化処理の手順を示すフローチャートである。図１５～図１８は、最適化処理の効果を示す画面例である。

　図１４に示す表示画面の最適化処理は、基本処理の流れにおいてはＳＴ１５で実行される。したがって、表示画面の最適化処理は、ユーザの挙動などの入力に応じて、逐次実行される。

　ＣＰＵ１１はフォーカスが移動したか否かを判断する（ＳＴ１５１）。Ｙｅｓの場合、ＣＰＵ１１は、「現在の関心対象であるコンテンツ」をユーザの視点の中心に置く（ＳＴ１５２）。ここで、ユーザの視点の中心とは、イメージセンサ１５により入力される情報に基づいて、ユーザの視点の中心であると判断される点である。

　図１５にユーザの視点の中心の一例を示す。図示の例では、データ（書類情報）にフォーカスがあり、これがユーザの視点の中心に来るように配置されている。ＣＰＵ１１は、このように各ＧＵＩ部品の配置を決定し、表示画面を生成する。

　なお、フォーカスされている情報に該当しない情報群に対応するＧＵＩ部品は、それぞれ結線による連結状態を保ちつつ、徐々に移動・アニメーションする。

　図１６に、図１５の状態から「現在の関心対象であるコンテンツ」が変更された、つまり、フォーカスが移動した場合の表示例を示す。図示のように、新しい情報が検索ないし呼び出された場合、ユーザの視点の中心には、当該新しい情報が配置される。本線又は手順線で結ばれた過去に提示された情報は、表示面２０１上の開いたスペース、開いたエリアに移動する（図１４，ＳＴ１５３）。

　次に、ＣＰＵ１１は、「現在の関心対象であるコンテンツ」から遠い情報を目立たなくする（ＳＴ１５４）。遠い情報とは、例えば、「現在の関心対象であるコンテンツ」から２つ以上のノードを経由して結ばれている情報などというように定められる。

　図１３にＳＴ１４４の一例が示されている。「現在の関心対象であるコンテンツ」からノード２つ分はなれており、且つ、支線又は関連線で結ばれている情報は、目立たないようフェイドアウトして表示されている。なお、目立たないように表示することの態様には、フェイドアウト、透過、サイズの縮小などの視覚効果を含み、非表示にすることも含む。

　図１７を参照すると、「現在の関心対象であるコンテンツ」に、ユーザの手が伸びているところが示されている。このように、ユーザの挙動に変化があると、イメージセンサ１５がそれを検知し、ＣＰＵ１１に入力する。この挙動は新たな情報処理装置１（ユーザインターフェイス）への入力に当たるため、図１０や図１４の基本処理が繰り返される。

　この場合、ユーザの指先によってインジケータが見えにくくならないよう、「現在の関心対象であるコンテンツ」が場所を移動する（図１８）。ＣＰＵ１１は、このように、フォーカスされている情報自体に代わりがない場合でも、フォーカスされる内容が表示内容から操作手段に変わったような場合には、フォーカスされている情報の位置を変更し、表示画面を最適化する。これにより、ユーザの目線を常に誘導することができる。

　次に、図１９と図２０を参照しながら、表示画面の最適化のもう一つの太陽について説明する。図１９には、ダイヤル型コントローラがフォーカスされている情報として表示されている表示画面例が示されている。また、ユーザがこれを操作しようと指を伸ばしているところが示されている。

　このようなケースに、ＣＰＵ１１は、イメージセンサ１５から入力された撮影画像を分析し、ユーザの手がＧＵＩ部品の一部に覆いかぶさっていることを検知すると、ＧＵＩ部品の一部ないし全部を変形する。

　図２０に変形されたＧＵＩ部品を含む表示画面例を示す。図示の例では、ダイヤル型コントローラのレバーが伸び、これの上に指を覆いかぶせるだけでコントローラが制御できるように構成される。本実施形態のＣＰＵ１１は、このような表示画面の最適化を行うことによってユーザビリティを高める。

（１－７．情報の管理方法）
　次に、ＣＰＵ１１が過去に提示した情報（図８で示したようなＧＵＩ部品により示される）を管理する方法について図２１の概念図を用いて説明する。図２１は過去に提示した情報のデータ構造を簡略化して示すものである。図示のデータ全体（情報Ｉ）は、ＲＡＭ１３に記憶されている。

　図２１に示す情報Ｉ（ｘ）は、それぞれが、外部の検索エンジン、写真データベース、情報処理装置１内のストレージなどへの検索結果へのポインタにすぎない（ただし、ｘはノードＩＤ）。

　情報Ｉ（ｘ）は、ノードＩＤ、連結している他のノードのノードＩＤを保持する。また、情報Ｉ（ｘ）は、過去に外部の検索エンジン、写真データベース、情報処理装置１内のストレージなどを検索した場合、その検索結果を保持してもよい。検索結果は一部でもよい。

　情報Ｉ（ｘ）は、対応するＧＵＩ部品の情報も保持する。例えば、その情報Ｉ（ｘ）が外部のインターネット上の検索エンジンの検索結果へのポインタである場合、その情報は「書類情報」に該当し、図８で示した「データ（書類情報）」のＧＵＩ部品を用いるという情報が保持される。

　情報Ｉ（ｘ）は、必要であればアイコンを保持する。例えば、情報Ｉ（ｘ）が写真ストレージの検索結果へのポインタである場合、その検索結果のいくつかをＣＰＵ１１がピックアップして低解像度でアイコン化したものを、情報Ｉ（ｘ）が保持する。

　ＣＰＵ１１は、図２１に示すようなデータ構造で情報Ｉを管理しているため、ノードの連結に必要な情報や、情報が対応する表示エレメント（ＧＵＩ部品）の情報に基づいて、図９に示したようなドットとラインで連結されたＧＵＩを構成することができる。

　情報Ｉ（ｘ）は、当該情報をタグ付けするキーワードを保持する。キーワードは複数でもよい。キーワードの一例としては、この検索結果が提示されたときに使用された検索キーワードがある。特定の場所や、特定の事物（例えば「食べ物」など）がキーワードとして、ＣＰＵ１１により自動的に設定される。例えば、図１０のＳＴ１３において、ＣＰＵ１１により選択されたキーワードが、この情報Ｉ（ｘ）をタグ付けするキーワードとして設定される。

　したがって、ＣＰＵ１１は、情報Ｉ（ｘ）をタグ付けするキーワードを使って、情報Ｉ（ｘ）を呼び出すことができる。実際に、キーワードを用いて、ユーザが話題の中心にしている情報、つまり、フォーカスされている情報を抽出する処理について、以下、図２２を参照しながら説明する。

（１－８．過去に提示された情報にアクセスする際に実行される処理とＧＵＩの動き）
　図２２は、図１０のＳＴ１４における「過去の情報抽出」する処理の手順を示すフローチャートである。

　図２２に示すように、ＣＰＵ１１は、（図１０のＳＴ１２で）入力されたユーザの挙動に基づいて、現在の関心対象が、過去に出力されたコンテンツであるかを判別しようとする（ＳＴ１４１）。この判別は、例えば、「さっき」や「前に」などといった時間的に過去を指し示すような単語が発話の中に含まれるか否かを判定することで行う。その他に、提示されている情報をユーザの指先でクリックするという入力動作があると、現在の関心対象が、過去に出力されたコンテンツであると解釈してもよい。

　ＣＰＵ１１は、ＳＴ１４１で現在の関心対象が過去に出力されたものでないと判断された場合（ＳＴ１４２，Ｎｏ）、当該ユーザの挙動が新規情報検索を指示するものと解釈し、新規情報検索の処理を実行する（ＳＴ１４７）。

　新規情報検索の処理としては、ＳＴ１３で抽出したキーワードに基づいて、ウェブサイトやその他のデータベース（写真ストレージやユーザの健康状態を記録したライフログなどを含む）を検索する。

　ＣＰＵ１１は、ＳＴ１４１で現在の関心対象が過去に出力されたものであると判断された場合（ＳＴ１４２，Ｙｅｓ）、ＳＴ１３で抽出したキーワードと、ユーザの挙動に基づいて、過去に提示された複数の情報Ｉ（ｘ）の中から、現在の関心対象に該当するコンテンツを検索する（ＳＴ１４３）。本実施形態では、「過去に提示された複数の情報Ｉ（ｘ）」の一例として、情報Ｉ全体、つまり、提示済みのすべての情報をＳＴ１４３における検索対象とする。

　続いて、ＣＰＵ１１は、ＳＴ１４３で検索された情報Ｉ（ｘ）を抽出する（ＳＴ１４４）。ＣＰＵ１１は抽出した情報Ｉ（ｘ）にフォーカスを移す（ＳＴ１４６）が、本実施形態ではその前に、情報Ｉ（ｘ）がポイントする検索対象を絞り込む処理を行う（ＳＴ１４５）。

　図２１を参照しながら述べたように、情報Ｉ（ｘ）それ自体は、１又は複数のタグ付けするキーワードを含む、検索結果へのポインタである。例えば、情報Ｉ（ｘ）がウェブサイトの検索であるような場合、検索結果が１億個あるような場合も考えられる。ユーザに提示する情報が多すぎるので、ある程度の絞込みが行われる。

　なお、情報Ｉ（ｘ）がウェブサイトの検索であるような場合、タグ付けするキーワードは検索エンジンへの検索クエリとして入力するキーワードとすることができる。

　ＳＴ１４５の絞込みの具体的な態様として、本実施形態においては、ある情報Ａから提示済みの別の情報Ｂに戻る場合、情報Ａと情報Ｂに至るまでに経由した情報をタグ付けするキーワードを用いて絞込みする方法が用いられる。

　以上のように、図２２に沿った処理が行われることで、既に提示した情報へのアクセスが容易なユーザインターフェイスが提供される。また、ＣＰＵ１１が既に提示した情報にフォーカスを戻す際、絞込みを行う。これにより、情報の最適化がなされる。

（１－９．キーワードが共通する情報によるレイヤー化）
　図２１に示したように、ＣＰＵ１１は、各情報Ｉ（ｘ）をタグ付けするキーワードで管理する。このタグ付けするキーワードは、図２２のＳＴ１４７の新規情報検索の際に、検索エンジンへの検索クエリとして入力される検索キーワードが用いられてもよい。

　その他にもＣＰＵ１１は、そのような検索キーワードを汎化ないし抽象化した単語を、タグ付けするキーワードとして用いてもよい。例えば、旅先での昼食をユーザエージェントに相談しているような文脈で、「そば」や「うどん」などの発話があったとき、情報Ｉ（そば）をタグ付けするキーワードに、「そば」に加えて、そばを汎化した単語「食べ物」が設定される。

　同様に、情報Ｉ（うどん）をタグ付けするキーワードとして「うどん」と「食べ物」が設定される。そのようにすると、ＣＰＵ１１は「食べ物」というキーワードで複数の情報Ｉ（ｘ）を抽出可能になる。同じキーワードで抽出される複数の情報のまとまりを、本実施形態では「レイヤー」と呼ぶ。本実施形態に係る情報処理装置１は、特に、汎化されたキーワードで抽出される情報のレイヤーを利用する。

　図２３～図２５のレイヤーの概念図を参照しながら説明する。情報処理装置１は、ユーザの挙動に応じて図２３に示すような表示画面を生成する。ユーザエージェントアイコンＵＡＩがまず提示され、それにユーザが例えば話しかけることにより情報Ｉ（１）が提示される。その状態で例えば、さらに話しかけることにより情報Ｉ（１１）が提示される。

　本実施形態において、ＣＰＵ１１は、情報Ｉ（１）を最適化して表示する際に、情報Ｉ（１）に関係する情報、例えば、情報Ｉ（１２）や情報Ｉ（１３）もバックグラウンドで検索して保持する。図２４に示す概念図では、情報Ｉ（１１）に対して最適化表示がなされている状態において、情報Ｉ（１２）と情報Ｉ（１３）が保持されている様子を示す。図２５に示す概念図では、情報Ｉ（１１）に対して最適化表示がなされている状態において、情報Ｉ（１２）、情報Ｉ（１３）、情報Ｉ（１４）、情報Ｉ（１５）が保持されている様子を示す。

　ＣＰＵ１１はＳＴ１４７で新規情報を検索した際、検索した情報へのポインタとして情報Ｉ（ｘ）をＲＡＭ１３などに記憶して管理するが、その管理においてはタグが用いられる。ＣＰＵ１１は、タグ付けされるキーワードが共通する情報Ｉを同一のレイヤーに配置可能に管理する。

　図２４、図２５においては、ユーザエージェントアイコンＵＡＩと情報Ｉ（１）と情報Ｉ（１１）が同一のレイヤーＬ１に属するように管理される。情報Ｉ（１２）と情報Ｉ（１３）が同一のレイヤーＬ２に属するように管理される。情報Ｉ（１４）と情報Ｉ（１５）が同一のレイヤーＬ２に属するように管理される。

　限定するものではないが、本実施形態においては、ユーザエージェントアイコンＵＡＩから、フォーカスされている情報までの間に介在して、結節線で接続される情報が、「メインレイヤー」に属するように管理される。例えば、図２５において、フォーカスが情報Ｉ（１１）にあたっている場合、ユーザエージェントアイコンＵＡＩ、情報Ｉ（１）、情報Ｉ（１１）がメインレイヤーに属する。

　一方でそれ以外の情報は、サブレイヤーに属するものとして管理される。また、フォーカスが移動すると、メインレイヤーに属する情報群の入れ替えが行われる。

　さらに本実施形態においては、同じレイヤーに属する情報に対して、共通する視覚効果を施して提示する、又は、共通の枠で囲って提示するという最適化がなされた表示画面が生成される。視覚効果とは、例えば、色、透過率、太字化などが含まれる。共通の枠は、例えば図２３ないし図２５に示しているものが挙げられる。なお、視覚効果と共通の枠は、同時に適用されてもよい。

　以上に述べたような構成によれば、ユーザはレイヤーをまたいだフォーカスの移動に気づきやすくなり、過去の情報に戻ったような場合にどの情報に戻ったのかがわかりやすくなる。つまり、使いやすさが向上する。

□また、図２５において、レイヤーＬ２やＬ３に提示される情報を派生項目と呼ぶ。本実施形態において、派生項目については、関連度に応じて、第２レイヤー、第３レイヤーと奥行方向に遠ざけて保持したうえで非表示あるいは奥行度に比例して半透過させて表示する。

　これにより、各レイヤーの表示強度差によってユーザの思考を明瞭にすることができる。なお、第３レイヤー、第２レイヤーは意図的に判読不可な状態で表示することで、存在だけをユーザに認識させてもよい。

　さらに本実施形態において、外部等から取得し、提示する情報や、それに対応する表示エレメント（ＧＵＩ要素）は、常にユーザの視線方向と手指位置の関係からして視界が遮られることのないように、表示位置とレイアウトを動的に逐次変更される。こ表示画面の最適化は逐次行われる。

（２．実施例シナリオ）
　図２６ないし図３０に情報処理装置１により提示されるユーザインターフェイスの遷移例を示す。以下、実施例により情報処理装置１が提供するユーザエージェントについて説明する。

　本実施例において、情報処理装置１は、ユーザの発話に登場する名詞をタグ付けに用いるキーワードとして選択する。また、情報処理装置１は、発話における声の抑揚や発話内容に基づいてユーザエージェントに対する命令と解釈する。また、情報処理装置１は、「見たい」「行きたい」「気になる」などの肯定的な言葉が含まれた文言をユーザの思考情報としてエージェントに保持する。

　状況は、ユーザＡとユーザＢの２名がテーブル席で雑談しており、エージェントも活動しているというものである。この状況下で、以下のような２名のユーザと会話が、情報処理装置１が提供するエージェントを交えてなされる。（図２６）
・ユーザＡ発話：（雑誌の写真を見て）これ「鬼ヶ島」だって。「鬼ヶ島」って本当にあるんだね。
・ユーザＢ発話：聞いたことがあるよ。でも、場所はどの辺りだっけ？

　ここでの「鬼ヶ島」「場所」といった文言は、キーワードとして抽出される。
　ここでのユーザＢの発話は、声の抑揚や発話内容に基づいて、ＣＰＵ１１によりエージェントへの命令として認識される。

・エージェント応答：「鬼ヶ島」の情報を出します。
・テーブル上：「鬼ヶ島」の地図と関連写真群が表示される。（図２７）
・ユーザＡ発話：かなり遠いね。東京からはどうやって行くの？

・エージェント応答：行き方情報を出します。
・テーブル上：現在地から「鬼ヶ島」までの行き方情報が表示される。（図２８）

・ユーザＡ発話：飛行機乗り継ぎで片道5時間か。普通の週末では行けないね。
・ユーザＢ発話：夏休みに行くなら良いかもね。８月なら休みある？
・エージェント応答：８月11日から15日まで休みがありますよ。
・テーブル上：８月のカレンダーが表示される。（図２９）

・ユーザＢ発話：現地３日なら悪くないね。考えておこう。
・ユーザＡ発話：まだ少し先の話だね。それよりその島で何か美味いもの食べたいね。
・ユーザＢ発話：さっきの情報に食べ物系の写真ってあったかな？

・エージェント応答：さきほどの「鬼ヶ島」関連写真を出します。
・テーブル上：「鬼ヶ島」の関連写真群が再表示される。今度は「食べ物」に絞られている。（図３０）

　ここで、情報処理装置１は、ユーザの発話の中に「さっきの」という時間的条件が存在することを認識し、「写真」というキーワードと「さっきの」という時間的条件に基づいて、図２７で示した関連写真群を抽出する。さらに情報処理装置１は、抽出した関連写真群の中から、「食べ物」というキーワードで絞込みを行うという提示する情報の最適化を行い、表示画面（図３０）を構成する。

（３．変形実施例）
　上述の実施形態は、種々の変形実施が可能である。例えば、情報処理装置１の出力部２１の出力先の一部を変更することが可能である。例えば、図４に示したように、金銭決済処理など個人情報処理を要する操作段階では、一時的に当該操作関連要素のみを、ユーザの所有するスマートフォンなどプライベートなスマートデバイス２２の私有表示面に表示して、ユーザに操作を促し、当該操作段階の完了後は元の共有表示面上に表示場所を戻し、個人情報処理履歴を付記したうえで、以後の操作を続行する。

　すなわち、金銭決済処理、個人情報入力など、機密性の高い操作段階に於いては、一時的に操作画面を登録された個人端末画面上に送付して操作させ、当該操作の完了後、その履歴を元の共有表示面に表示する。

　この構成によれば、公共環境での操作時にも個人情報を保護することができる。金銭決済処理、個人情報入力などの操作時は、個人端末画面上に暫定移動してリレー操作させるという、共有表示面と私有表示面の併用をすることで機密保持を保証することができる。

　上述の実施形態では、テーブルや壁を表示面２０１に設定した実施例を示した。しかしながら、本開示の思想がこれらに限定されないことの例を示すことを意図して、以下、自動車の車内で本開示の思想を適用した実施形態を示す。

　図３１を参照すると、上記実施形態のさらに異なる変形例としての情報処理装置１のハードウェア構成例とその利用シーン例が示されている。同図は、自動車の車内において、安全面に配慮して助手席ユーザにＧＵＩを表示させている。つまり、当該ＧＵＩは助手席ユーザに対応するユーザエージェントのＧＵＩである。

　同図中、ＧＵＩの表示面２０１は、車のフロントガラスという曲率を持った面である。プロジェクタ１７が表示情報をプロジェクションできる領域を「表示可能領域」と呼ぶ。表示可能領域には、フロントガラスのみならず、ダッシュボードなど透明でない領域を含んでもよい。

　この利用シーン特有の課題として、強い日差しの場合、あるいはフロントガラス越しの前方風景が白色の雪景色など明るすぎる場合に、ＧＵＩをプロジェクション投影しても視認性がよくないという点が挙げられる。

　そこで、ＣＰＵ１１は、イメージセンサ１５が撮像する画像に基づいて、上記表示可能領域の内側を「表示適切領域」と「表示不適切領域」に分割する。そして、このうちの「表示適切領域」にのみＧＵＩを表示する。

　ＣＰＵ１１は、日射が照り付けていたり、前方風景が明るすぎたりするなど、コントラストが取りづらいエリアを「表示不適切領域」として判定する。他方、外観建物などによる陰などによって日光が緩和されていたり、あるいはフロントガラス越しの前方風景の明度が充分低かったりすることなどによってコントラストがとりやすいエリアを「表示適切領域」として判定する。

　なお、「表示可能領域」はフロントガラスのみならず、助手席手前のダッシュボードでもよく、ＣＰＵ１１は、日射が照りつけるなどの阻害事情がない場合には、助手席手前のダッシュボード上を「表示適切領域」とする判定を行う。

　表示面２０１の明度や色彩のセンシングはイメージセンサ１５が行うが、この構成に限定されず、車両の内部もしくは外部に専用のセンサを配置してもよい。車両の内部カメラであるイメージセンサ１５が日射状況センサも兼ねる構成に比して、専用の日射状況センサを追加する構成は、明度や色彩の判定において、より精度を向上させることができる。

　この変形例においては、ＧＵＩの配置についても、次に述べる制御を行ってもよい。イメージセンサ１５は、助手席の人の顔の位置をセンシングする。ＣＰＵ１１は、イメージセンサ１５が撮像した助手席の人の顔の位置に基づいて、ＧＵＩの表示位置（主に高さ）を助手席の人の目の高さに調整する。

　また、イメージセンサ１５や上記日照状況センサなど、車両の内部カメラや外部カメラを用いて、背景が比較的変わらない領域をセンシングし、ＣＰＵ１１がその領域の内側で、助手席に座るユーザの視点位置からの見易さに基づいて特定された「表示可能領域」内の領域を、「表示適切領域」として判定してもよい。

（４．まとめ）
　上述の実施形態や実施例においては、検索結果を時系列でシーケンシャルに保持するのではなく、各検索結果データ同士を結節点と結線で繋ぎ、さらに検索コンテキスト別（検索の分岐）、情報テーマ別、などに分類しながら、レイヤー構造を持った履歴として保持する。ユーザにはその時点で注目するテーマのレイヤーのみを見せ、結節点の移動と結線の描画アニメーションで現在注目すべき地点に誘目する。

　上記実施形態、実施例は、これにより、情報検索に最適化されていない空間においても、現在関心のある検索経路を認識することが容易になる。さらに、検索途中で過去の分岐点に戻ったり、過去分岐点から考察視点を変えて再検索したりすることなどが、（複雑なコマンドやＧＵＩを用いることなく）エージェントとの自然な対話を通じて行えるようになる。

　また、上記実施形態によれば、各種サービス固有の操作手続を代行し、ユーザは要望の表明と、結果の確認・利用に専念することができるため、複数サービスを単一の手順で利用できる。

　また、上記実施形態によれば、膨大な関連情報のうち、常にその時点で最重要のものだけに注目させることができるようになるため、ユーザの思考負荷を最小化できる。

　また、上記実施形態によれば、３Ｄレイヤー化したスクリーニング手法により、ユーザの考察経路を保持し、必要に応じ、常に最適な分岐点に戻ることが可能なインターフェイスが提供され、ユーザの再考、比較、確認を効率的に補助することができる。

　また、上記実施形態によれば、手順ラインの保持とトレースにより、利用場所に合わせ、常にユーザの眼前に最重要項目を表示し、さらに手指入力時にＧＵＩと指先を含む視野が妨げられないよう動的にレイアウト調整する。したがって、場所と状況に合わせ視認性が最適化される。

＜付記＞
　なお、本技術は以下のような構成もとることができる。
（１）
　ユーザの挙動を検出する検出部と、
　前記検出された挙動に応じて前記ユーザの現在の関心対象を判別し、当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成する制御部と、
　前記生成された表示情報を出力する出力部と、を具備し、
　前記制御部は、前記判別された関心対象の変化に応じて、前記出力部により出力された前記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、前記表示情報の表示態様を最適化する
　情報処理装置。
（２）
　前記（１）に記載の情報処理装置であって、
　前記制御部は、前記ユーザの挙動に基づいて、前記出力部により過去に出力されたコンテンツが現在の関心対象であると判別された場合、現在の関心対象であると判別された過去に出力されたコンテンツを前記表示情報に含め、当該表示情報の表示態様を最適化する
　情報処理装置。
（３）
　前記（２）に記載の情報処理装置であって、
　前記出力部は、前記出力部により過去に出力されたコンテンツにそれぞれ対応する表示エレメントを、出力された順にラインで繋がって出力されるように前記表示情報を生成する
　情報処理装置。
（４）
　前記（２）又は（３）に記載の情報処理装置であって、
　前記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツに絞込みを行うことにより前記表示情報の表示態様を最適化する
　情報処理装置。
（５）
　前記（２）から（４）のいずれかに記載の情報処理装置であって、
　前記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツに対応する表示エレメントが前記ユーザの視点の中心に来るように前記表示情報を生成する
　情報処理装置。
（６）
　前記（２）から（５）のいずれかに記載の情報処理装置であって、
　前記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツと共通するレイヤーに属するコンテンツを、現在の関心対象であると判別された過去に出力されたコンテンツと共に前記表示情報に含める
　情報処理装置。
（７）
　前記（６）に記載の情報処理装置であって、
　前記制御部は、複数のコンテンツが共通するレイヤーに属することを、視覚効果及び／又は共通の枠により示す前記表示情報を生成する
　情報処理装置。
（８）
　前記（１）から（７）のいずれかに記載の情報処理装置であって、
　前記検出部は、前記ユーザの音声を入力し、
　前記制御部は、前記検出部により入力された前記ユーザの音声を解析することによって、現在の関心対象を判別する
　情報処理装置。
（９）
　ユーザの挙動を検出する検出ステップと、
　前記検出された挙動に応じて前記ユーザの現在の関心対象を判別するステップと、
　当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成するステップと、
　前記生成された表示情報を出力するステップと、
　前記判別された関心対象の変化に応じて、前記出力部により出力された前記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、前記表示情報の表示態様を最適化するステップ
　を有する
　情報処理方法。
（１０）
　情報処理装置に、
　ユーザの挙動を検出する検出ステップと、
　前記検出された挙動に応じて前記ユーザの現在の関心対象を判別するステップと、
　当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成するステップと、
　前記生成された表示情報を出力するステップと、
　前記判別された関心対象の変化に応じて、前記出力部により出力された前記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、前記表示情報の表示態様を最適化するステップ
　を実行させるプログラム。

　１…情報処理装置
　１１…ＣＰＵ
　１２…ＲＯＭ
　１３…ＲＡＭ
　１４…バス
　１５…イメージセンサ
　１６…マイク
　１７…プロジェクタ
　１８…スピーカ
　１９…通信部
　２０…検出部
　２１…出力部
　２２…スマートデバイス
　２００…テーブル
　２０１…表示面

Claims

　ユーザの挙動を検出する検出部と、
　前記検出された挙動に応じて前記ユーザの現在の関心対象を判別し、当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成する制御部と、
　前記生成された表示情報を出力する出力部と、を具備し、
　前記制御部は、前記判別された関心対象の変化に応じて、前記出力部により出力された前記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、前記表示情報の表示態様を最適化する
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記制御部は、前記ユーザの挙動に基づいて、前記出力部により過去に出力されたコンテンツが現在の関心対象であると判別された場合、現在の関心対象であると判別された過去に出力されたコンテンツを前記表示情報に含め、当該表示情報の表示態様を最適化する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記出力部は、前記出力部により過去に出力されたコンテンツにそれぞれ対応する表示エレメントを、出力された順にラインで繋がって出力されるように前記表示情報を生成する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツに絞込みを行うことにより前記表示情報の表示態様を最適化する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツに対応する表示エレメントが前記ユーザの視点の中心に来るように前記表示情報を生成する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記制御部は、現在の関心対象であると判別された過去に出力されたコンテンツと共通するレイヤーに属するコンテンツを、現在の関心対象であると判別された過去に出力されたコンテンツと共に前記表示情報に含める
　情報処理装置。
　請求項６に記載の情報処理装置であって、
　前記制御部は、複数のコンテンツが共通するレイヤーに属することを、視覚効果及び／又は共通の枠により示す前記表示情報を生成する
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記検出部は、前記ユーザの音声を入力し、
　前記制御部は、前記検出部により入力された前記ユーザの音声を解析することによって、現在の関心対象を判別する
　情報処理装置。
　ユーザの挙動を検出する検出ステップと、
　前記検出された挙動に応じて前記ユーザの現在の関心対象を判別するステップと、
　当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成するステップと、
　前記生成された表示情報を出力するステップと、
　前記判別された関心対象の変化に応じて、前記出力部により出力された前記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、前記表示情報の表示態様を最適化するステップ
　を有する
　情報処理方法。
　情報処理装置に、
　ユーザの挙動を検出する検出ステップと、
　前記検出された挙動に応じて前記ユーザの現在の関心対象を判別するステップと、
　当該判別された関心対象に対応するコンテンツを含む表示情報を逐次生成するステップと、
　前記生成された表示情報を出力するステップと、
　前記判別された関心対象の変化に応じて、前記出力部により出力された前記ユーザの過去の関心対象のコンテンツと現在の関心対象のコンテンツとを基に、前記表示情報の表示態様を最適化するステップ
　を実行させるプログラム。