JP2015132878A

JP2015132878A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2015132878A
Application number: JP2014002536A
Authority: JP
Inventors: 淳己大村; Junki Omura; 道成河野; Michinari Kono; 麗子桐原; Reiko Kirihara; 智朝川; Satoshi Asakawa; 伊藤　洋子; Yoko Ito; 洋子伊藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2014-01-09
Filing date: 2014-01-09
Publication date: 2015-07-23
Also published as: WO2015104883A1

Abstract

【課題】ユーザのアクションに対してより柔軟な応答を実現する。
【解決手段】ユーザのアクションを示すデータを取得し、上記取得されたデータに基づいて、上記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、上記期待値を上記情報の出力制御のために提供するように構成されるプロセッサを備える情報処理装置が提供される。
【選択図】図１

Description

本開示は、情報処理装置、情報処理方法およびプログラムに関する。

システムからユーザへの情報提示を最適化するための技術は、これまでに種々提案されている。例えば、特許文献１には、生成された所定個の発話内容の候補から無音を示す候補、および生成された所定個の発話内容の候補の各々に対して形態素解析を行って候補の各々から自立語を抽出し、生成された所定個の発話内容の候補中に無音を示す候補、または自立語を含まない候補が存在する場合には、入力された発話音声を無視し、表示装置およびスピーカから応答内容が応答されないように制御する技術が記載されている。これによって、入力された音声を棄却する場合に、より適切な対応を行うことができる。

また、特許文献２には、音声情報、表情情報および遅延時間情報を利用して、迅速かつ正確に人間とエージェント間の対話を管理するための方法および装置と、これを利用した音声対話システムが記載されている。より具体的には、音声対話システムにおいて、ユーザが発話した音声から分析された対話情報を利用して第１対話順序情報を生成するステップと、ユーザの顔映像から分析された表情情報を利用して第２対話順序情報を生成するステップと、第１対話順序情報、第２対話順序情報、システムの状態情報、ユーザの音声入力の有無およびユーザの無応答時間を利用して、最終的な対話順序を決定するステップとが実行される。

特開２０１０−１５１９４１号公報特開２００４−２０６７０４号公報

上記の特許文献１に記載された技術では、ユーザの発話内容に基づいてシステムの応答の有無を制御する。また、特許文献２に記載された技術では、ユーザの発話や表情、遅延時間に応じてシステムが発話するか否かを決定する。このような技術によって、例えば音声によるユーザへの情報提示をある程度最適化することができる。しかしながら、ユーザの発話や表情というのは、その時にシステムによって提示された情報がユーザにとって適切であるか否かを推定するための断片的な材料にすぎないため、上記のような技術による情報提示の最適化にはなおも改善の余地があった。

そこで、本開示では、ユーザのアクションに対してより柔軟な応答を実現することが可能な、新規かつ改良された情報処理装置、情報処理方法およびプログラムを提案する。

本開示によれば、ユーザのアクションを示すデータを取得し、上記取得されたデータに基づいて、上記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、上記期待値を上記情報の出力制御のために提供するように構成されるプロセッサを備える情報処理装置が提供される。

また、本開示によれば、プロセッサが、ユーザのアクションを示すデータを取得し、上記取得されたデータに基づいて、上記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、上記期待値を上記情報の出力制御のために提供することを含む情報処理方法が提供される。

また、本開示によれば、ユーザのアクションを示すデータを取得し、上記取得されたデータに基づいて、上記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、上記期待値を上記情報の出力制御のために提供する機能をコンピュータに実現させるためのプログラムが提供される。

以上説明したように本開示によれば、ユーザのアクションに対してより柔軟な応答を実現することができる。

なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の一実施形態に係るシステムの概略的な機能構成を示すブロック図である。本開示の一実施形態に係るシステムの装置構成例を示す図である。本開示の一実施形態に係る算出ルールＤＢの例を示す図である。本開示の一実施形態に係る表示方法の選択の例を示すフローチャートである。本開示の一実施形態に係る出力方法の選択の例を示すフローチャートである。図５の例をより具体的に示す図である。本開示の一実施形態に係る表示色選択の例を示す図である。本開示の一実施形態に係る情報のストックの第１の例について説明するための図である。本開示の一実施形態に係る情報のストックの第２の例について説明するための図である。本実施の一実施形態に係る情報のストックのための処理を示すフローチャートである。本開示の実施形態に係る情報処理装置のハードウェア構成例を示すブロック図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

なお、説明は以下の順序で行うものとする。
１．システム構成
２．算出ルールの例
３．出力制御の例
３−１．表示方法の変更の例
３−２．出力方法の変更の例
３−３．その他の例
４．情報のストックの例
５．ハードウェア構成
６．補足

（１．システム構成）
図１は、本開示の一実施形態に係るシステムの概略的な機能構成を示すブロック図である。図１を参照すると、システム１０は、カメラ１０１と、センサ１０３と、マイクロフォン１０５と、アクションデータ取得部１０７と、アクションＤＢ１０９と、行動認識サーバ１１１と、注意力期待値算出部と、出力制御部１１５と、情報生成部１１７と、情報キャッシュＤＢ１１９と、情報サーバ１２１と、ディスプレイ１２３と、スピーカ１２５と、その他出力装置１２７と、フィードバック解析部１２９と、算出ルールＤＢ１３１とを含む。

システム１０は、ユーザに情報を提示するために用いられる。例えば、システム１０は、ユーザが装着または携帯する端末装置を介して、同じユーザに継続的に情報を提示するためのものであってもよい。あるいは、システム１０は、据え置き型の端末装置を介して、その近傍に居合わせた不特定なユーザ（その一部が特定可能であってもよい）に情報を提示するためのものであってもよい。

カメラ１０１は、システム１０のユーザを撮影可能である。カメラ１０１は、ユーザのアクションを示す画像データを取得することが可能である。センサ１０３は、ユーザをセンシング対象とする各種のセンサである。例えば、センサ１０３は、ユーザに装着または携帯される端末装置に搭載される、加速度センサやジャイロセンサ、地磁気センサ、ＧＰＳ受信機などを含む。また、例えば、センサ１０３は、超音波センサや赤外線センサなどを含んでもよい。センサ１０３は、ユーザのアクションを示すセンサデータを取得することが可能である。マイクロフォン１０５は、ユーザの近傍で発生した音声を拾得することが可能である。マイクロフォン１０５は、ユーザのアクションを示す音声データを取得する。マイクロフォン１０５は、音声データに基づいて音源の方向を特定することが可能なようにマイクロフォンアレイを構成していてもよい。上記のカメラ１０１、センサ１０３、およびマイクロフォン１０５の一部または全部によって取得されたデータは、アクションデータ取得部１０７に提供される。

さらに、アクションデータ取得部１０７は、行動認識サーバ１１１からユーザの行動認識情報を取得してもよい。行動認識サーバ１１１は、システム１０に含まれていてもよいし、システム１０の外部のサービスであってもよい。行動認識サーバ１１１は、例えば各種の行動認識技術に基づいて、ユーザの行動を認識する。行動の認識には、例えばシステム１０のセンサ１０３やカメラ１０１、マイクロフォン１０５によって取得されたデータが利用されうる。この場合、データは、センサ１０３や、カメラ１０１、マイクロフォン１０５から、別途行動認識サーバ１１１に送信される（図示せず）。あるいは、行動認識サーバ１１１は、システム１０の外部の端末装置などによって取得されたセンサデータなどに基づいてユーザの行動を認識してもよい。

アクションデータ取得部１０７は、例えば情報処理装置のプロセッサによって実現されるデータ取得／管理機能であり、ユーザのアクションを示す各種のデータを取得／管理する。上述の通り、ユーザのアクションは、カメラ１０１、センサ１０３、マイクロフォン１０５、および／または行動認識サーバ１１１から提供されうる。さらに、アクションデータ取得部１０７は、ユーザがシステム１０に含まれる端末装置、またはそれ以外の端末装置において実行した操作の情報を取得してもよい。この場合、例えば、ウェブブラウザを用いた情報検索のキーワードや、ユーザが利用したコンテンツの情報などが取得されうる。アクションデータ取得部１０７は、提供されたデータ（以下、アクションデータともいう）を必要に応じてアクションＤＢ１０９に格納してから、注意力期待値算出部１１３に提供する。また、アクションデータ取得部１０７は、アクションデータをフィードバック解析部１２９に提供してもよい。

ここで、アクションデータによって示されるユーザのアクションについて説明する。例えば、ユーザのアクションは、ユーザのモーションまたは表情を含んでもよい。この場合、例えば、最新の、または直近のアクションデータに基づいて、注意力期待値算出部１１３が、これから出力される情報に向けられるユーザの注意力の期待値を算出してもよい。また、ユーザのアクションは、ディスプレイ１２３やスピーカ１２５から出力された情報に対するリアクションを含んでもよい。この場合、リアクションを示すアクションデータに基づいて、注意力期待値算出部１１３が、次に情報が出力された場合のユーザの注意力の期待値を算出したり、フィードバック解析部１２９が期待値算出の妥当性の検証を実施したりする。

アクションＤＢ１０９は、例えば情報処理装置のメモリまたはストレージによって実現されるデータベースであり、アクションデータ取得部１０７が取得したアクションデータが一時的または継続的に格納される。例えば、アクションデータ取得部１０７が取得したアクションデータは、アクションＤＢ１０９に一時的に格納された後、またはアクションＤＢ１０９に格納されることなく、注意力期待値算出部１１３に提供されてもよい。この場合、注意力期待値算出部１１３は、ユーザの最新のアクションに基づいて期待値を算出することになる。あるいは、アクションデータ取得部１０７が取得したアクションデータは、アクションＤＢ１０９に継続的に格納されてもよい。この場合、アクションデータ取得部１０７は、アクションＤＢ１０９に蓄積されたアクションデータの中から、必要な期間のデータを読み出して注意力期待値算出部１１３に提供する。この場合、注意力期待値算出部１１３は、ユーザのアクションの履歴に基づいて期待値を算出することになる。

注意力期待値算出部１１３は、例えば情報処理装置のプロセッサによって実現される演算機能であり、アクションデータ取得部１０７によって取得されたアクションデータに基づいて、ユーザに対して出力される情報に向けられる注意力の期待値を算出する。ここで、注意力（attention）は、出力された情報に向けられるユーザの注意の程度を意味する。注意力期待値算出部１１３は、算出した注意力の期待値を、情報の出力制御のために出力制御部１１５に提供する。

ここで、出力される情報に向けられる注意力は、ユーザの状況に応じて変動しうる。例えば、ユーザがディスプレイ１２３などを備える端末装置に向けて視線を向けたり、端末装置に向けて呼びかけたりした場合、出力される情報には多くの注意が払われると予想される。一方、ユーザが他のユーザと会話中であったり、電車に乗っていたりする場合、特に音声で出力される情報に対してはあまり注意が払われない（耳に入らない）可能性が高い。注意力期待値算出部１１３は、例えば、カメラ１０１や、センサ１０３、マイクロフォン１０５、行動認識サーバ１１１などから提供されるアクションデータに基づいてユーザの状況を推定し、状況に応じた注意力の期待値を算出することができる。注意力期待値算出部１１３は、ユーザのアクションと注意力の期待値とを関連付けた算出ルールＤＢ１３１のデータを参照することによって、期待値を算出してもよい。

また、出力される情報に向けられる注意力は、出力される情報の内容によっても変動しうる。例えば、ユーザが興味のあるキーワードがディスプレイ１２３に表示されたり、スピーカ１２５から出力されたりすれば、ユーザは出力される情報に多くの注意を払うと予想される。注意力期待値算出部１１３は、出力される予定の情報の内容を情報生成部１１７から取得し、情報の内容と、アクションデータ、例えばユーザが過去に実行した情報検索のキーワードなどから推定されるユーザが興味のある内容とを比較し、一致または共通する点があれば、注意力の期待値を引き上げることができる。注意力期待値算出部１１３は、情報の内容に関するアクションと注意力の期待値とを関連付けた算出ルールＤＢ１３１のデータを参照することによって、期待値を算出してもよい。

なお、注意力期待値算出部１１３は、上記のようにアクションデータに基づいてユーザの注意力の期待値を算出するにあたり、ユーザの最新のアクションを示すアクションデータだけを利用してもよいし、ユーザのアクションの履歴を示すアクションデータを利用してもよい。最新のアクションに基づいて期待値を算出する場合、演算量を削減し、低負荷で迅速に期待値を算出することができる。一方、アクションの履歴に基づいて期待値を算出する場合、ユーザのアクションの文脈をふまえて期待値を算出することができ、期待値の精度が向上する。例えば、アクションの履歴に基づいて期待値を算出する場合、ユーザの最新のアクションが同じでも、注意力期待値算出部１１３によって算出される注意力の期待値が異なることがありうる。

さらに、注意力期待値算出部１１３は、アクションデータに基づいてユーザの注意力の期待値を算出するにあたり、アクションデータに基づくユーザのアクションの推測の精度に基づいて注意力を補正してもよい。アクションデータは、例えばカメラ１０１によって提供されるユーザの画像データや、センサ１０３によって提供されるユーザのセンシングデータや、マイクロフォン１０５によって提供されるユーザの近傍における音声データを含む。注意力期待値算出部１１３は、これらのデータに基づいてユーザのアクションを推定するが、推定の精度は時によって異なりうる。

出力制御部１１５は、例えば情報処理装置のプロセッサによって実現される演算機能であり、注意力期待値算出部１１３によって算出されたユーザの注意力の期待値に基づいて、ユーザに対する情報の出力を制御する。より具体的には、出力制御部１１５は、ユーザの注意力の期待値に基づいて、情報を出力するか否かを決定してもよい。例えば、情報生成部１１７によって生成された何らかの情報について、出力制御部１１５は、注意力期待値算出部１１３によって算出された期待値を参照し、期待値が閾値を下回る場合には情報の出力を抑止し、そうでない場合には情報の出力を実行してもよい。また、出力制御部１１５は、ユーザの注意力の期待値に基づいて、情報の出力方法を選択してもよい。例えば、情報生成部１１７によって生成される情報が、ディスプレイ１２３を介して画像として出力してもよく、スピーカ１２５を介して音声として出力してもよいような場合に、出力制御部１１５は、注意力期待値算出部１１３によって算出された期待値を参照し、期待値が閾値を下回る場合には情報を画像として出力し、そうでない場合には情報を音声として出力してもよい。

さらに、出力制御部１１５は、ユーザの注意力の期待値が低いために出力されなかった情報を、期待値が高いときに出力してもよい。上述のように、出力制御部１１５は、例えば、注意力期待値算出部１１３によって算出されたユーザの注意力の期待値が閾値を下回る場合に、情報の出力を抑止する。このとき、ユーザは、例えば一時的に忙しい状態であって、その少し後であれば抑止された情報についても提供されることを望んでいる場合もありうる。このような場合に、出力制御部１１５は、先に出力を抑止した結果、情報生成部１１７が情報キャッシュＤＢ１１９に一時的に格納した情報を取得して、ユーザに対して出力してもよい。

情報生成部１１７は、例えば情報処理装置のプロセッサによって実現される演算機能であり、例えば情報サーバ１２１から提供される情報に基づいて、出力制御部１１５を介してユーザに対して出力するための情報を生成する。情報サーバ１２１は、システム１０に含まれていてもよいし、システム１０の外部のサービスであってもよい。例えば、情報サーバ１２１は、行動認識サーバ１１１と連携して、ユーザの行動を支援するための情報（ユーザの現在地の近傍にあるスポットの情報、ユーザのスケジュール情報、または交通情報など）を情報生成部１１７にプッシュ送信する。また、例えば、情報サーバ１２１は、端末装置において提供される他のサービスと連携して、ユーザへのメッセージの着信や新着情報の配信などの通知を情報生成部１１７にプッシュ送信してもよい。あるいは、情報サーバ１２１は、情報生成部１１７が（ユーザ操作によらず）自動的に送信するリクエストに応じて上記のような情報や通知を送信してもよい。

上述のように、情報生成部１１７によって生成された情報は、出力制御部１１５の制御に従って、ディスプレイ１２３、スピーカ１２５、および／またはその他出力装置１２７から、ユーザに対して出力される。従って、情報生成部１１７は、ディスプレイ１２３が表示するための画像データ、スピーカ１２５が出力するための音声データ、および／またはその他出力装置１２７を動作させるための制御信号を生成する。なお、情報生成部１１７は、上記のようなデータまたは信号を情報サーバ１２１から受信してそのまま出力してもよいし、情報サーバ１２１から受信した情報に基づいて上記のようなデータまたは信号を生成してもよい。出力制御部１１５がユーザの注意力の期待値に基づいて情報の出力方法を制御する場合、情報生成部１１７は、選択された出力方法に応じた情報を生成しうる。例えば、出力制御部１１５がディスプレイ１２３を介して情報を出力することを決定した場合、情報生成部１１７は画像データを生成しうる。また、例えば、出力制御部１１５がスピーカ１２５を介して情報を出力することを決定した場合、情報生成部１１７は音声データを生成しうる。

また、情報生成部１１７は、出力制御部１１５がユーザの注意力の期待値に基づいて情報の出力を抑止することを決定した場合に、生成した情報を情報キャッシュＤＢ１１９に一時的に格納する。情報キャッシュＤＢ１１９は、例えば情報処理装置のメモリまたはストレージによって実現されるデータベースであり、情報生成部１１７によって生成された情報を一時的に格納する。情報キャッシュＤＢ１１９には、上記のように出力されなかった情報が格納される他、出力された情報も、例えばユーザから再出力を要求された場合のために所定の期間にわたって格納されてもよい。また、上述のように、注意力期待値算出部１１３によるユーザの注意力の期待値の算出が、出力される予定の情報の内容に基づいて実施される場合もあるため、情報生成部１１７は、生成された情報、またはその内容を示す情報を、出力に先立って注意力期待値算出部１１３に提供してもよい。

ディスプレイ１２３は、システム１０のユーザに向けて画像を表示する。スピーカ１２５は、ユーザに向けて音声を出力する。その他出力装置１２７は、例えば後述するようなイルミネーションやバイブレータなどを含みうる。上述したように、出力制御部１１５は、これらの出力装置を介した情報の出力を、注意力期待値算出部１１３によって算出されたユーザの注意力の期待値に基づいて制御する。ここで、例えばカメラ１０１、センサ１０３、および／またはマイクロフォン１０５（以下、総称して入力装置ともいう）は、ディスプレイ１２３、スピーカ１２５、および／またはその他出力装置１２７（以下、総称して出力装置ともいう）から出力される情報に向けられるユーザの注意力の期待値を算出するために、ユーザのアクションを示すデータを取得する。従って、入力装置と出力装置とは、例えば同一の端末装置、または互いの位置関係が固定された端末装置に設けられていることが望ましい。

フィードバック解析部１２９は、例えば情報処理装置のプロセッサによって実現される演算機能であり、ユーザのアクションを、情報出力に関する出力制御部１１５の制御に対するフィードバックとして解析する。例えば、注意力期待値算出部１１３によって算出された期待値に基づく出力制御部１１５の制御に従って情報の出力が実行された場合に、その情報に対するユーザのリアクションを示すデータから、出力の制御が適切であったかを推測することができる。例えば、ユーザが出力された情報を全く無視していた場合、実際のユーザの注意力は、算出された期待値よりも低かったと推測される。フィードバック解析部１２９は、解析の結果に基づいて、算出ルールＤＢ１３１に格納された算出ルールを修正してもよい。また、フィードバック解析部１２９は、解析の結果に基づいて、注意力期待値算出部１１３での算出処理において使用されるパラメータなどを修正してもよい。

算出ルールＤＢ１３１は、例えば情報処理装置のメモリまたはストレージによって実現されるデータベースであり、ユーザのアクションと注意力の期待値とを関連付けるデータが格納される。算出ルールＤＢ１３１のデータは、例えば予め用意されたものであってもよい。さらに、上記のフィードバック解析部１２９による解析の結果に基づいて、データが修正されてもよい。このような修正が繰り返された場合、算出ルールＤＢ１３１のデータは、出力された情報に対するユーザのリアクションに基づく学習によって形成されているともいえる。例えば、注意力期待値算出部１１３は、アクションデータ取得部１０７が取得したアクションデータによって示されるユーザのアクションに基づいて算出ルールＤＢ１３１を参照し、注意力の期待値を示すスコアを取得する。このとき、注意力期待値算出部１１３は、複数のユーザのアクションに基づいて算出ルールＤＢ１３１を参照し、取得された複数のスコアを重みづけして足し合わせることによって注意力の期待値を算出してもよい。例えば、「電車に乗っている」かつ「他のユーザと会話中」といったように、例えば異なる入力データに基づいて複数のアクションが重複して検出される場合がありうる。

図２は、本開示の一実施形態に係るシステムの装置構成例を示す図である。図２を参照すると、システム１０は、端末装置１５１と、サーバ１５２とを含みうる。また、サーバ１５２は、図示された例のサーバ１５２ａ，１５２ｂのように、複数のサーバを含んでもよい。

端末装置１５１は、例えば、ユーザに対して情報を出力する機能と、ユーザのアクションを示すデータを取得する機能と、情報やデータをサーバ１５２との間でやりとりする機能とを有する。端末装置１５１は、例えば、スマートフォン、ウェアラブル端末、タブレット端末、パーソナルコンピュータ、テレビ、ゲーム機などでありうる。端末装置１５１は、特定のユーザによって携帯されるものであってもよいし、不特定のユーザによって使用される据え置き型のものであってもよい。端末装置１５１は、例えば、後述するような情報処理装置のハードウェア構成によって実現される。

サーバ１５２は、例えば、端末装置１５１から受信されたデータを処理する機能と、端末装置１５１において出力するための情報を送信する機能とを有する。サーバ１５２は、例えば、ネットワーク上の１または複数のサーバ装置によって実現される。それぞれのサーバ装置は、後述するような情報処理装置のハードウェア構成によって実現される。

例えば、図１に示した機能構成のうち、カメラ１０１、センサ１０３、マイクロフォン１０５、ディスプレイ１２３、スピーカ１２５、およびその他出力装置１２７が端末装置１５１において実現され、それ以外の機能構成がサーバ１５２において実現される。このとき、例えばサーバ１５２ｂにおいてアクションデータ取得部１０７が実現され、サーバ１５２ａにおいて注意力期待値算出部１１３および出力制御部１１５が実現される、といったように、複数のサーバの間に機能が分散して実現されてもよい。

別の例では、図１に示した機能構成のうち、行動認識サーバ１１１、および情報サーバ１２１がサーバ１５２において実現され、それ以外の機能構成が端末装置１５１において実現されてもよい。このように、システム１０において、本実施形態に係る情報処理装置、例えば注意力期待値算出部１１３および出力制御部１１５を実現する情報処理装置は、端末装置１５１であってもよく、サーバ１５２であってもよい。サーバ１５２は、上述のように複数のサーバ（図示された例のように２つには限らず、３つ以上であってもよい）を含んでもよい。

さらに、例えば、アクションデータ取得部１０７が行動認識サーバ１１１からのデータを取得せず、情報生成部１１７も情報サーバ１２１からのデータを取得しないような場合には、図１に示したようなシステム１０の機能構成（上記の２つのサーバを除く）の全体が端末装置１５１において実現されてもよい。この場合、システム１０はサーバ１５２を含まなくてもよい。

（２．算出ルールの例）
図３は、本開示の一実施形態に係る算出ルールＤＢの例を示す図である。図３には、算出ルールＤＢに格納されるデータの例として、アクションと、注意力スコアと、ソースと、条件とを関連付けたレコード１３１ａ〜１３１ｅが示されている。

アクションは、アクションデータ取得部１０７が取得するアクションデータが所定の条件を満たした場合に特定されるユーザのアクションである。注意力スコアは、それぞれのアクションが特定された場合に、ユーザに対して出力される情報に向けられる注意力の期待値に対応するスコアである。ソースは、それぞれのアクションを特定するためのアクションデータを提供する。条件は、それぞれのアクションを特定するために、ソースによって提供されるアクションデータが満たすべき条件である。

例えば、レコード１３１ａは、「視線を向ける」というユーザのアクションが、カメラ１０１によってユーザが端末装置に視線を向けたことが検出された場合に特定され、８．０の注意力スコアが与えられることを定義している。なお、図示された例において、注意力スコアは０〜１０の範囲で定義されているため、８．０は比較的高い注意力の期待値を意味する。また、例えば注意力期待値算出部１１３において実行される、ユーザの視線を検出するための画像処理については、公知のさまざまな技術を利用することが可能であるため、詳細な説明は省略する。

また、例えば、レコード１３１ｂは、「呼びかける」というユーザのアクションが、マイクロフォン１０５によってユーザの発話が検出され、かつ他のユーザの発話が検出されなかった場合に特定され、９．０の注意力スコアが与えられることを定義している。なお、例えば注意力期待値算出部１１３において実行される、ユーザの発話音声と他のユーザの発話音声とを識別するための音声処理については、公知のさまざまな技術を利用することが可能であるため、詳細な説明は省略する。また、例えば注意力期待値算出部１１３は、同様に公知の様々な技術を利用して、ユーザの発話内容を検出してもよい。この場合、例えば、「呼びかける」というユーザのアクションを特定するための条件として、ユーザが所定の呼びかけの言葉、例えば「おーい」、「ねえ」などを発話することを定義してもよい。

以下、レコード１３１ｃ、レコード１３１ｄ、レコード１３１ｅ、および図示していない他のレコードでも、同様にしてユーザのアクションと注意力スコア、およびそれを特定するためのソースならびに条件とが関連付けられる。例えば、レコード１３１ｃは、レコード１３１ｂの「呼びかける」の場合と同様にマイクロフォン１０５によってユーザの発話が検出された場合であっても、他のユーザの発話も同時に検出された場合には、「（他のユーザとの）会話」という別のアクションが特定され、注意力スコアが低くなる（「呼びかける」の９．０に対し、「会話」は０．５）ことを定義している。また、レコード１３１ｄは、行動認識サーバ１１１から提供される行動認識データに基づいて、「電車に乗る」というユーザの行動が認識された場合には「電車に乗る」というアクションが特定されることを定義している。

また、レコード１３１ｅは、情報生成部１１７が出力する予定の情報の内容が、ユーザアクション取得部１０７が取得した検索履歴よって示される検索キーワードを含む場合に、「過去に検索」というユーザのアクションが特定されることを定義している。図示された例では、レコード１３１ｅのように、情報の内容に関するアクションと注意力の期待値とを関連付けるレコードが、他のアクションと注意力の期待値とを関連付けるデータと共通の形式で算出ルールＤＢ１３１に格納されているが、他の例では、情報の内容と注意力の期待値とを関連付けるデータが、アクションと注意力の期待値とを関連付けるデータとは別の形式で算出ルールＤＢ１３１に格納されてもよい。

上述のように、注意力期待値算出部１１３は、図示した例のような算出ルールＤＢ１３１を参照して、ユーザに対して出力される情報に向けられる注意力の期待値を算出する。このとき、注意力期待値算出部１１３は、例えば図示された例における注意力スコアをそのまま注意力の期待値として用いてもよいし、複数のアクションが重複して検出された場合には、注意力スコアを重みづけして足し合わせることによって注意力の期待値を算出してもよい。

さらに、注意力期待値算出部１１３は、アクションデータに基づいてユーザのアクションを推測し、推測の精度に基づいて注意力の期待値を調整してもよい。この場合、注意力の期待値は、推測の精度が低ければ、平均値に近づくように調整されてもよい。例えば、注意力スコアが平均値（５．０とする）よりも高いアクション、例えば「視線を向ける」、「呼びかける」などについては、アクションデータに基づく推測の精度が低いと判断される場合（例えば、画像解析の結果において、ユーザが端末装置に視線を向けている確率が優勢ではあるがあまり高くないような場合）に注意力スコアが一時的に引き下げられてもよい。また、注意力スコアが平均値よりも低いアクション、例えば「会話」、「電車に乗る」などについては、アクションデータに基づく推測の精度が低いと判断される場合に注意力スコアが一時的に引き上げられてもよい。これは、推測の精度が低い場合には、特定されたアクションの信頼度を低く見積もり、算出される注意力の期待値をアクションが特定されなかった場合に近づけるための処理である。他の例では、推測の精度が低い場合に、注意力スコアが一律に一時的に引き下げられてもよい。

本実施形態におけるユーザの注意力の期待値の算出の具体的な例について、さらに説明する。以下の具体的な例は、例えば、注意力期待値算出部１１３の処理ロジックによって実現されてもよいし、算出ルールＤＢ１３１に格納されるデータによって実現されてもよい。

例えば、注意力期待値算出部１１３は、ユーザの発話（呼びかけ）に特定の語句が含まれる場合に、算出される注意力の期待値を引き上げてもよい。より具体的には、「急いで」、「ねえ」、「答えて」などの発話を他のアクション（例えば視線を向けるなど）と組み合わせることによって、算出される注意力の期待値が引き上げられる。他にも、特定のコマンド（システムの名称を含むコマンドなど）や、端末装置を指さすアクションによって、注意力の期待値が引き上げられうる。これを利用して、ユーザは、システムが呼びかけに反応しやすいように制御することができる。

また、例えば、注意力期待値算出部１１３は、ユーザのアクションとして推測される周辺環境に基づいて、注意力の期待値を算出してもよい。より具体的には、例えば、注意力期待値算出部１１３は、ユーザが１人だけでいると推定される場合、算出される注意力の期待値を引き上げてもよい。ユーザが１人でいる場合、電話している場合などを除いて独り言を言う可能性は低いため、ユーザの発話が検出された場合、他のユーザがいる場合に比べてそれがシステムへの呼びかけである可能性は高いと推測される。一方、注意力期待値算出部１１３は、テレビの音や、電車の騒音などのノイズが多い環境では、ユーザの発話が検出された場合でも、算出される期待値を引き下げてもよい。例えばスピーカ１２５を介して音声で情報を提供してもユーザの注意が向けられる可能性が低いためである。ただし、スピーカ１２５での音声出力において、ビームフォーミングやノイズキャンセリングなどが十分に可能である場合には、ノイズが多い環境であっても算出される期待値を引き下げなくてもよい。

また、例えば、注意力期待値算出部１１３は、ユーザが同じ内容を続けて発話した場合には、算出される注意力の期待値を引き上げてもよい。この場合、ユーザはシステムに何らかの応答を求めている可能性が高いため、その前にシステムからの音声出力があった場合でもそうでなくても、ユーザが出力される情報に向ける注意力の期待値は高いと推定される。

また、例えば、注意力期待値算出部１１３は、システムとユーザとの間で１回以上の対話が既に発生している場合、その後のユーザのアクションに基づいて算出される注意力の期待値を引き上げてもよい。これは、システムとの対話の後のユーザのアクションは、システムから出力された情報に関連する可能性が高いと推定されるためである。ただし、例えばユーザが対話の後に情報を提供する端末装置から離れたような場合には、注意力の期待値は低くなりうる。

また、例えば、注意力期待値算出部１１３は、ユーザがシステムに対して特徴的な対話をした場合に、算出される注意力の期待値を引き上げてもよい。より具体的には、方言を使ったり、声高に発話したり、語尾または語頭に何らかのキーワードをつけたりした場合、ユーザがシステムに通じるような特徴をつけて発話を実行したものと推定されるため、注意力の期待値は高くなりうる。

また、例えば、注意力期待値算出部１１３は、ユーザの状態に応じて、出力方法ごとに注意力の期待値を算出してもよい。例えば、行動認識結果などから、ユーザが仕事中であったり、会議中であったり、電車で移動中であったりすることが特定される場合、注意力期待値算出部１１３は、音声出力について算出される注意力の期待値を引き下げてもよい。一方、この場合、注意力期待値算出部１１３は、ユーザのジェスチャや簡単なアクション（例えば、端末装置を叩いたり振ったりすること）について算出される注意力の期待値を引き上げてもよい。ユーザが睡眠中であれば、ユーザからの意図的なアクションはないと推測されるため、何らかのアクションが検出された場合にも算出される注意力の期待値が引き下げられるか、一律に０に設定されてもよい。ただし、ユーザの睡眠のログ、例えば寝相、寝言、脈拍、睡眠レベルなどを検出する場合には、この限りではない。

また、例えば、注意力期待値算出部１１３は、ユーザの発話に含まれる語句に応じて、算出される注意力の期待値を補正してもよい。例えば、注意力期待値算出部１１３は、特定の人物（例えば、家族、友人、会社の上司など）や、特定の内容（例えば、記念日、借りた本の返却日、公的書類の提出日など）に関する語句がユーザの発話に含まれる場合に、ユーザが重要度の高い会話をしていると判定し、算出される注意力の期待値を引き上げてもよい。これによって、例えば、ユーザが忘れてはいけない重要な情報をリマインドすることができる。

（３．出力制御の例）
（３−１．表示方法の選択の例）
図４は、本開示の一実施形態に係る表示方法の選択の例を示すフローチャートである。図４を参照すると、出力制御部１１５は、まず、注意力期待値算出部１１３によって算出された注意力の期待値が第１の閾値ｔｈ１を超えているか否かを判定する（Ｓ１０１）。ここで、期待値が第１の閾値ｔｈ１を超えていれば、出力制御部１１５は、ディスプレイ１２３において、最前面に表示されるウインドウで情報を表示させる（Ｓ１０３）。これは、出力される情報に対するユーザの注意力が最も高い（ユーザが出力される情報に対して高い注意を払っている）と推測される場合の処理である。最前面に表示されるウインドウで情報を表示させれば、ユーザは、すぐに多くの情報を得ることができる。

一方、Ｓ１０１において注意力の期待値が第１の閾値ｔｈ１を超えていなかった場合、さらに、出力制御部１１５は、期待値が第２の閾値ｔｈ２を超えているか否かを判定する（Ｓ１０５）。第２の閾値ｔｈ２は、第１の閾値ｔｈ１よりも小さい。ここで、期待値が第２の閾値ｔｈ２を超えていれば、出力制御部１１５は、ディスプレイ１２３において、ポップアップのウインドウで情報を表示させる（Ｓ１０７）。これは、出力される情報に対するユーザの注意力が中程度（ユーザが出力される情報に対して注意を払うかもしれないし、払わないかもしれない）と推測される場合の処理である。ポップアップのウインドウで情報を表示させれば、ユーザが情報を必要としない場合でもあまり邪魔にはならない。

一方、Ｓ１０５において注意力の期待値が第２の閾値ｔｈ２を超えていなかった場合、出力制御部１１５は、情報を出力させることなく処理を終了する。つまり、出力制御部１１５は、情報の出力を抑止する。これは、出力される情報に対するユーザの注意力が低い（ユーザが出力される情報に対してほとんど注意を払わず、むしろ邪魔になるかもしれない）と推測される場合の処理である。なお、この場合に出力されなかった情報は、情報キャッシュＤＢ１１９に格納され、後で出力されてもよい。

（３−２．出力方法の選択の例）
図５は、本開示の一実施形態に係る出力方法の選択の例を示すフローチャートである。図５を参照すると、出力制御部１１５は、まず、注意力期待値算出部１１３によって算出された注意力の期待値が第１の閾値ｔｈ１を超えているか否かを判定する（Ｓ１５１）。ここで、期待値が第１の閾値ｔｈ１を超えていれば、出力制御部１１５は、ディスプレイ１２３およびスピーカ１２５の両方を使用して情報を出力させる（Ｓ１５３）。これは、出力される情報に対するユーザの注意力が最も高い（ユーザが出力される情報に対して高い注意を払っている）と推測される場合の処理である。ディスプレイ１２３およびスピーカ１２５の両方を使用して情報を出力すれば、ユーザは、短時間の間の多くの情報を得ることができる。

一方、Ｓ１５１において注意力の期待値が第１の閾値ｔｈ１を超えていなかった場合、さらに、出力制御部１１５は、期待値が第２の閾値ｔｈ２を超えているか否かを判定する（Ｓ１５５）。第２の閾値ｔｈ２は、第１の閾値ｔｈ１よりも小さい。ここで、期待値が第２の閾値ｔｈ２を超えていれば、出力制御部１１５は、ディスプレイ１２３のみを使用して情報を出力させる（Ｓ１５７）。これは、出力される情報に対するユーザの注意力が中程度（ユーザが出力される情報に対して注意を払うかもしれないし、払わないかもしれない）と推測される場合の処理である。ディスプレイ１２３のみを使用して情報を出力すれば、ユーザが情報を必要としない場合でもあまり邪魔にはならない。

一方、Ｓ１５５において注意力の期待値が第２の閾値ｔｈ２を超えていなかった場合、出力制御部１１５は、情報を出力させることなく処理を終了する。つまり、出力制御部１１５は、情報の出力を抑止する。これは、出力される情報に対するユーザの注意力が低い（ユーザが出力される情報に対してほとんど注意を払わず、むしろ邪魔になるかもしれない）と推測される場合の処理である。図４の例と同様に、出力されなかった情報は情報キャッシュＤＢ１１９に格納され、後で出力されてもよい。

図６は、図５の例をより具体的に示す図である。（ａ）に示すように、ユーザは他のユーザと会話している。この場合、注意力期待値算出部１１３は、例えばマイクロフォン１０５によって取得された音声データに基づいてユーザのアクションを特定し、例えば図３に示したような算出ルールＤＢ１３１のデータを参照して、比較的低い期待値を算出する。図示された例において、この期待値は、第１の閾値ｔｈ１と第２の閾値ｔｈ２との間にある。従って、図５のフローチャートにおけるＳ１５７の処理が実行され、（ｂ）に示すように、ディスプレイ１２３のみを使用して情報が出力される。

ここで、ユーザは、ディスプレイ１２３に表示された情報に興味を示し、（ｃ）に示すように、「それもっと見せて！」と端末装置に向かって呼びかけている。注意力期待値算出部１１３は、例えばマイクロフォン１０５によって取得された音声データに基づいてユーザのアクションを特定し、同様に、ルールＤＢ１３１のデータを参照して、比較的高い期待値を算出する。図示された例において、この期待値は、第１の閾値ｔｈ１を超えている。従って、図５のフローチャートにおけるＳ１５３の処理が実行され、（ｃ）に示すように、ディスプレイ１２３における表示とスピーカ１２５から出力された音声１２５ｖとの両方を使用して情報が出力される。

なお、図６の例では、ユーザの会話の内容（イタリアンレストランについて）に対応した情報が出力されている。このような情報は、例えば、情報生成部１１７が、マイクロフォン１０５によって取得された音声データに基づいてユーザの発話内容を特定し、発話内容に関連する情報を情報サーバ１２１から取得することによって生成される。発話内容の特定のための音声処理については、公知のさまざまな技術を利用することが可能であるため、詳細な説明は省略する。また、この場合、注意力期待値算出部１１３は、出力される予定の情報の内容がユーザの発話内容に含まれることによって、算出される注意力の期待値を引き上げてもよい。

（３−３．その他の例）
図７は、本開示の一実施形態に係る表示色選択の例を示す図である。図７を参照すると、ユーザは、腕輪上のウェアラブル端末装置を装着して街を歩いている。ここで、ユーザは、ある店舗（ＳＨＯＰ）の近傍を通りかかった。この店舗は、ユーザが以前に実行した情報検索における検索キーワード（「イタリアン」とする）に関連する店舗（イタリアンレストラン）であった。この場合、例えば、情報生成部１１７は、センサ１０３に含まれるＧＰＳ受信機によって特定されるユーザの位置情報と、以前にアクションデータ取得部１０７によって取得されたユーザの情報検索の履歴から推定される店舗（ＳＨＯＰ）とユーザとの関係（店舗がユーザの興味の対象である可能性がある）とに基づいて、ユーザに店舗（ＳＨＯＰ）が近くにあることを通知する情報を生成する。あるいは、店舗（ＳＨＯＰ）とユーザとの関係は、外部サービスが保有するユーザのプロフィール情報などを利用して推定されてもよい。例えば、飲食店の店舗情報提供サービスでは、店舗情報のブックマークや、店舗情報の検索履歴、類似した属性を有する他のユーザが登録した店舗情報などが保持されている。ソーシャルメディアのサービスでは、サービスや店舗についてユーザがソーシャルメディア上で表明した評価の情報などが保持されている。情報生成部１１７は、例えばこのような情報に基づいて、店舗（ＳＨＯＰ）とユーザとの関係を推定し、さらにユーザの位置情報に基づいてユーザに店舗（ＳＨＯＰ）が近くにあることを通知する情報を生成してもよい。

図示された例において、ユーザへの通知情報は、その他出力装置１２７に含まれるイルミネーションによって出力される。出力制御部１１５は、注意力期待値算出部１１３によって算出された注意力の期待値に応じて、図７の（ａ）〜（ｃ）に示すように、イルミネーションの表示色を変更してもよい。例えば、出力制御部１１５は、ユーザの注意力の期待値が高い場合には目立つ色でイルミネーションを発光させ、期待値が低い場合には地味な色で発光させるか、発光させなくてもよい。あるいは、出力制御部１１５は、ユーザの注意力の期待値が高い場合には（ユーザが既に気付いている可能性が高いため）地味な色でイルミネーションを発光させ、ユーザの注意力の期待値が低い場合には（ユーザがまだ気付いていない可能性が高いため）目立つ色でイルミネーションを発光させてもよい。

（４．情報のストックの例）
続いて、図８および図９を参照して、本開示の一実施形態に係る情報のストックの例について説明する。なお、以下の図８および図９では、システムによって検出されているユーザとの間のコミュニケーションの状態が、図の右下に示すようなインジケータによって表現されている。インジケータは、例えば端末装置にその他出力装置１２７として設けられるイルミネーションなどによって実際に表示されてもよいし、図８および図９における説明のための表示（実際に表示されるわけではない）として解釈されてもよい。

図８は、本開示の一実施形態に係る情報のストックの第１の例について説明するための図である。図８の例では、（ａ）に示すように、ユーザが「今日の予定は？」と発話している間、システムはユーザが発話中であることを検出している。ここで、（ｂ）に示すように、システムはユーザの発話内容を正しく検出せず、出力された情報に対するユーザの注意力の期待値を低く算出してしまったため、情報生成部１１７が生成した情報を出力せず、ストックしてしまった。ここで、ユーザは、システムからの応答がないことに気づき、「おーい」と呼びかけている。（ｃ）に示すように、ユーザからの呼びかけを正しく検出したシステムは、ユーザの注意力の期待値が高いものと推測し、ストックされた情報を出力する。より具体的には、システムは、「失礼しました。今日は大崎でランチです」という、スピーカ１２５から出力された音声１２５ｖによってユーザに情報を提供する。

図９は、本開示の一実施形態に係る情報のストックの第２の例について説明するための図である。図９の例では、（ａ）に示すように、ユーザが「今日の予定は？」と発話している間、システムはユーザが発話中であることを検出している。さらに、（ｂ）に示すように、ユーザと会話している他のユーザが「空いてるよ」と返答したため、システムはユーザが他のユーザと会話中であることから、出力された情報に対するユーザの注意力の期待値が低いものと推測し、情報生成部１１７が生成した情報を出力せず、ストックした。図８の例とは異なり、ユーザは実際にシステムからの情報を必要としていたわけではなかった（他のユーザとの会話で今日の予定を尋ねただけであった）ため、システムが情報をストックした判断は正しかった。その後、所定の時間が経過した場合、（ｃ）に示すように、システムはストックされた情報を不要になったものとして破棄し、定常状態に戻る。なお、（ｂ）の時点で情報を破棄せずにストックするのは、他のユーザと会話中であることが誤検出されており、ユーザが実際には情報を必要としていたことが分かった場合（図８の（ｂ）のように呼びかけられたりした場合）に情報を出力できる状態を維持するためである。

図１０は、本実施の一実施形態に係る情報のストックのための処理を示すフローチャートである。図１０を参照すると、出力制御部１１５は、まず、注意力期待値算出部１１３によって算出された注意力の期待値が第１の閾値ｔｈ１を超えているか否かを判定する（Ｓ２０１）。ここで、期待値が第１の閾値ｔｈ１を超えていれば、出力制御部１１５は、さらに、情報キャッシュＤＢ１１９にストックされた情報があるか否かを判定する（Ｓ２０３）。ここで、ストックされた情報があった場合、出力制御部１１５は、ストックされた情報を出力する（Ｓ２０５）。これは、例えば図８の例において（ｃ）に示された処理である。続いて、出力制御部１１５は、情報生成部１１７によって生成された他の情報（より新しい情報でありうる）があれば、当該情報を出力する（Ｓ２０７）。

一方、Ｓ２０１において注意力の期待値が第１の閾値ｔｈ１を超えていなかった場合、さらに、出力制御部１１５は、期待値が第２の閾値ｔｈ２を超えているか否かを判定する（Ｓ２０９）。第２の閾値ｔｈ２は、第１の閾値ｔｈ１よりも小さい。ここで、期待値が第２の閾値ｔｈ２を超えていれば、出力制御部１１５は、情報生成部１１７によって生成された情報を出力する（Ｓ２０７）。つまり、図示された例では、注意力の期待値が第１の閾値ｔｈ１と第２の閾値ｔｈ２との間である場合には、ストックされた情報は出力されないが、例えば新たに情報生成部１１７によって生成された情報は出力される。一方、Ｓ２０９で注意力の期待値が第２の閾値ｔｈ２を超えていなかった場合、出力制御部１１５は、情報をストックする（Ｓ２１１）。

なお、上記のような情報のストックの例では、さまざまな変形が可能である。例えば、情報が（例えば誤って）ストックされた場合にユーザがシステムからストックされた情報を引き出すためのアクションとしては、例えば呼びかける、同じことをもう一度言う、見つめる（視線を向ける）、顔を向ける、端末装置のボタンなどを操作する、手をたたく、黙る（システムの応答を待つ）などがありうる。システムでは、これらのアクションが、ストックされた情報を引き出すためのアクションとして登録されていてもよい。この場合、システムは、ストックされた情報を出力するときに、正しく応答できなかったことに対する謝罪のメッセージなどを加えてもよい（例えば図８の例における（ｃ）でのシステムの応答）。また、ストックされている情報を表示する前段階として、認識されているユーザのアクションを表示し（「他のユーザと会話中ではないのですか？」など）、ユーザがそれでもなお情報の提供を要求した場合にストックされた情報を出力してもよい。

また、ストックされている情報が複数ある場合もありうる。その場合は、例えばストックされた情報をディスプレイ１２３において一覧表示させ、どの情報を出力するかをユーザに選択させてもよい。なお、ストックされた情報は、上記の図９の例のように所定の時間が経過した場合には破棄されうるが、そのための時間は任意に設定されうる。例えば、情報の内容に応じて、数分から数時間、または数日などの時間が、ストックされた情報が破棄されるまでの時間として設定されてもよい。

（５．ハードウェア構成）
次に、図１１を参照して、本開示の実施形態に係る情報処理装置のハードウェア構成について説明する。図１１は、本開示の実施形態に係る情報処理装置のハードウェア構成例を示すブロック図である。図示された情報処理装置９００は、例えば、上記の実施形態における端末装置やサーバを実現しうる。

情報処理装置９００は、ＣＰＵ（Central Processing unit）９０１、ＲＯＭ（Read Only Memory）９０３、およびＲＡＭ（Random Access Memory）９０５を含む。また、情報処理装置９００は、ホストバス９０７、ブリッジ９０９、外部バス９１１、インターフェース９１３、入力装置９１５、出力装置９１７、ストレージ装置９１９、ドライブ９２１、接続ポート９２３、通信装置９２５を含んでもよい。さらに、情報処理装置９００は、必要に応じて、撮像装置９３３、およびセンサ９３５を含んでもよい。情報処理装置９００は、ＣＰＵ９０１に代えて、またはこれとともに、ＤＳＰ（Digital Signal Processor）またはＡＳＩＣ（Application Specific Integrated Circuit）と呼ばれるような処理回路を有してもよい。

ＣＰＵ９０１は、演算処理装置および制御装置として機能し、ＲＯＭ９０３、ＲＡＭ９０５、ストレージ装置９１９、またはリムーバブル記録媒体９２７に記録された各種プログラムに従って、情報処理装置９００内の動作全般またはその一部を制御する。ＲＯＭ９０３は、ＣＰＵ９０１が使用するプログラムや演算パラメータなどを記憶する。ＲＡＭ９０５は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータなどを一次記憶する。ＣＰＵ９０１、ＲＯＭ９０３、およびＲＡＭ９０５は、ＣＰＵバスなどの内部バスにより構成されるホストバス９０７により相互に接続されている。さらに、ホストバス９０７は、ブリッジ９０９を介して、ＰＣＩ（Peripheral Component Interconnect/Interface）バスなどの外部バス９１１に接続されている。

入力装置９１５は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなど、ユーザによって操作される装置である。入力装置９１５は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置９００の操作に対応した携帯電話などの外部接続機器９２９であってもよい。入力装置９１５は、ユーザが入力した情報に基づいて入力信号を生成してＣＰＵ９０１に出力する入力制御回路を含む。ユーザは、この入力装置９１５を操作することによって、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりする。

出力装置９１７は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置９１７は、例えば、ＬＣＤ（Liquid Crystal Display）、ＰＤＰ（Plasma Display Panel）、有機ＥＬ（Electro-Luminescence）ディスプレイなどの表示装置、スピーカおよびヘッドホンなどの音声出力装置、ならびにプリンタ装置などでありうる。出力装置９１７は、情報処理装置９００の処理により得られた結果を、テキストまたは画像などの映像として出力したり、音声または音響などの音声として出力したりする。

ストレージ装置９１９は、情報処理装置９００の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置９１９は、例えば、ＨＤＤ（Hard Disk Drive）などの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどにより構成される。このストレージ装置９１９は、ＣＰＵ９０１が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。

ドライブ９２１は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９２７のためのリーダライタであり、情報処理装置９００に内蔵、あるいは外付けされる。ドライブ９２１は、装着されているリムーバブル記録媒体９２７に記録されている情報を読み出して、ＲＡＭ９０５に出力する。また、ドライブ９２１は、装着されているリムーバブル記録媒体９２７に記録を書き込む。

接続ポート９２３は、機器を情報処理装置９００に直接接続するためのポートである。接続ポート９２３は、例えば、ＵＳＢ（Universal Serial Bus）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Small Computer System Interface）ポートなどでありうる。また、接続ポート９２３は、ＲＳ−２３２Ｃポート、光オーディオ端子、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）ポートなどであってもよい。接続ポート９２３に外部接続機器９２９を接続することで、情報処理装置９００と外部接続機器９２９との間で各種のデータが交換されうる。

通信装置９２５は、例えば、通信ネットワーク９３１に接続するための通信デバイスなどで構成された通信インターフェースである。通信装置９２５は、例えば、有線または無線ＬＡＮ（Local Area Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Wireless USB）用の通信カードなどでありうる。また、通信装置９２５は、光通信用のルータ、ＡＤＳＬ（Asymmetric Digital Subscriber Line）用のルータ、または、各種通信用のモデムなどであってもよい。通信装置９２５は、例えば、インターネットや他の通信機器との間で、ＴＣＰ／ＩＰなどの所定のプロトコルを用いて信号などを送受信する。また、通信装置９２５に接続される通信ネットワーク９３１は、有線または無線によって接続されたネットワークであり、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信または衛星通信などである。

撮像装置９３３は、例えば、ＣＣＤ（Charge Coupled Device）またはＣＭＯＳ（Complementary Metal Oxide Semiconductor）などの撮像素子、および撮像素子への被写体像の結像を制御するためのレンズなどの各種の部材を用いて実空間を撮像し、撮像画像を生成する装置である。撮像装置９３３は、静止画を撮像するものであってもよいし、また動画を撮像するものであってもよい。

センサ９３５は、例えば、加速度センサ、ジャイロセンサ、地磁気センサ、光センサ、音センサなどの各種のセンサである。センサ９３５は、例えば情報処理装置９００の筐体の姿勢など、情報処理装置９００自体の状態に関する情報や、情報処理装置９００の周辺の明るさや騒音など、情報処理装置９００の周辺環境に関する情報を取得する。また、センサ９３５は、ＧＰＳ（Global Positioning System）信号を受信して装置の緯度、経度および高度を測定するＧＰＳセンサを含んでもよい。

以上、情報処理装置９００のハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。かかる構成は、実施する時々の技術レベルに応じて適宜変更されうる。

（６．補足）
本開示の実施形態は、例えば、上記で説明したような情報処理装置（端末装置またはサーバ）、システム、情報処理装置またはシステムで実行される情報処理方法、情報処理装置を機能させるためのプログラム、およびプログラムが記録された一時的でない有形の媒体を含みうる。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）ユーザのアクションを示すデータを取得し、
前記取得されたデータに基づいて、前記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、
前記期待値を前記情報の出力制御のために提供する
ように構成されるプロセッサを備える情報処理装置。
（２）前記プロセッサは、前記ユーザの最新のアクションに基づいて前記期待値を算出する、前記（１）に記載の情報処理装置。
（３）前記プロセッサは、前記ユーザのアクションの履歴に基づいて前記期待値を算出する、前記（１）または（２）に記載の情報処理装置。
（４）前記ユーザのアクションは、前記ユーザのモーションまたは表情を含む、前記（１）〜（３）のいずれか１項に記載の情報処理装置。
（５）前記ユーザのアクションは、既に出力された前記情報に対するリアクションを含む、前記（４）に記載の情報処理装置。
（６）前記プロセッサは、さらに、前記リアクションを示すデータに基づいて前記期待値の算出ルールを修正するように構成される、前記（５）に記載の情報処理装置。
（７）前記期待値は、前記情報を出力するか否かを決定するために提供される、前記（１）〜（６）のいずれか１項に記載の情報処理装置。
（８）前記プロセッサは、さらに、前記情報の出力制御を実行し、前記期待値が低いために出力されなかった前記情報を前記期待値が高いときに出力する、前記（７）に記載の情報処理装置。
（９）前記期待値は、前記情報の出力方法を選択するために提供される、前記（１）〜（８）のいずれか１項に記載の情報処理装置。
（１０）前記プロセッサは、前記取得されたデータに基づいて前記ユーザのアクションを推測し、該推測の精度に基づいて前記期待値を調整する、前記（１）〜（９）のいずれか１項に記載の情報処理装置。
（１１）前記プロセッサは、前記推測の精度が低い場合に前記期待値を平均値に近づける、前記（１０）に記載の情報処理装置。
（１２）前記プロセッサは、前記ユーザのアクションに特定の語句の発話が含まれる場合に、前記期待値を引き上げる、前記（１）〜（１１）のいずれか１項に記載の情報処理装置。
（１３）前記プロセッサは、前記ユーザのアクションとして推測されるユーザの周辺環境に基づいて前記期待値を算出する、前記（１）〜（１２）のいずれか１項に記載の情報処理装置。
（１４）プロセッサが、
ユーザのアクションを示すデータを取得し、
前記取得されたデータに基づいて、前記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、
前記期待値を前記情報の出力制御のために提供する
ことを含む情報処理方法。
（１５）ユーザのアクションを示すデータを取得し、
前記取得されたデータに基づいて、前記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、
前記期待値を前記情報の出力制御のために提供する
機能をコンピュータに実現させるためのプログラム。

１０システム
１０１カメラ
１０３センサ
１０５マイクロフォン
１０７アクションデータ取得部
１０９アクションＤＢ
１１３注意力期待値算出部
１１５出力制御部
１１７情報生成部
１１９情報キャッシュＤＢ
１２３ディスプレイ
１２５スピーカ
１２７その他出力装置
１２９フィードバック解析部
１３１算出ルールＤＢ

Claims

ユーザのアクションを示すデータを取得し、
前記取得されたデータに基づいて、前記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、
前記期待値を前記情報の出力制御のために提供する
ように構成されるプロセッサを備える情報処理装置。
前記プロセッサは、前記ユーザの最新のアクションに基づいて前記期待値を算出する、請求項１に記載の情報処理装置。
前記プロセッサは、前記ユーザのアクションの履歴に基づいて前記期待値を算出する、請求項１に記載の情報処理装置。
前記ユーザのアクションは、前記ユーザのモーションまたは表情を含む、請求項１に記載の情報処理装置。
前記ユーザのアクションは、既に出力された前記情報に対するリアクションを含む、請求項４に記載の情報処理装置。
前記プロセッサは、さらに、前記リアクションを示すデータに基づいて前記期待値の算出ルールを修正するように構成される、請求項５に記載の情報処理装置。
前記期待値は、前記情報を出力するか否かを決定するために提供される、請求項１に記載の情報処理装置。
前記プロセッサは、さらに、前記情報の出力制御を実行し、前記期待値が低いために出力されなかった前記情報を前記期待値が高いときに出力する、請求項７に記載の情報処理装置。
前記期待値は、前記情報の出力方法を選択するために提供される、請求項１に記載の情報処理装置。
前記プロセッサは、前記取得されたデータに基づいて前記ユーザのアクションを推測し、該推測の精度に基づいて前記期待値を調整する、請求項１に記載の情報処理装置。
前記プロセッサは、前記推測の精度が低い場合に前記期待値を平均値に近づける、請求項１０に記載の情報処理装置。
前記プロセッサは、前記ユーザのアクションに特定の語句の発話が含まれる場合に、前記期待値を引き上げる、請求項１に記載の情報処理装置。
前記プロセッサは、前記ユーザのアクションとして推測されるユーザの周辺環境に基づいて前記期待値を算出する、請求項１に記載の情報処理装置。
プロセッサが、
ユーザのアクションを示すデータを取得し、
前記取得されたデータに基づいて、前記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、
前記期待値を前記情報の出力制御のために提供する
ことを含む情報処理方法。
ユーザのアクションを示すデータを取得し、
前記取得されたデータに基づいて、前記ユーザに対して出力される情報に向けられる注意力の期待値を算出し、
前記期待値を前記情報の出力制御のために提供する
機能をコンピュータに実現させるためのプログラム。