JP6927331B2

JP6927331B2 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: JP6927331B2
Application number: JP2019560819A
Authority: JP
Inventors: 長坂　英夫; 英夫長坂; 亜世後藤; 裕介土山; 龍青山; 洋二廣瀬
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2017-12-18
Filing date: 2018-10-10
Publication date: 2021-08-25
Anticipated expiration: 2038-10-10
Also published as: US20210076122A1; EP3731067A1; EP3731067A4; JPWO2019123785A1; WO2019123785A1

Description

本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

近年、ユーザに対しコンテンツや機能を提供する種々の装置が普及している。また、上記のような装置を利用するユーザの利便性を高めるための技術が開発されている。例えば、特許文献１には、同一のユーザ操作に対し装置の状態に応じた異なる処理を実行する情報処理装置が開示されている。

特開２０１７−１４７６５２号公報

しかし、特許文献１に開示される情報処理装置の場合、ユーザが意図に沿った処理を装置に実行させるためには、装置の状態に応じた操作パターンを正しく入力することが求められる。

そこで、本開示では、ユーザがより直観的にコンテンツを操作することが可能な、新規かつ改良された情報処理装置、情報処理方法、およびプログラムを提案する。

本開示によれば、認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部と、前記ユーザの動作を検出する検出部と、情報処理サーバと通信を行い、前記検出部により検出された前記ユーザの動作を示す情報を前記情報処理サーバに送信する通信部と、を備え、前記出力制御部は、前記情報処理サーバにより前記ユーザの動作を示す情報に基づき認識されたジェスチャに基づいて、前記コンテンツリストの切り替えを制御する、情報処理装置が提供される。

また、本開示によれば、プロセッサが、認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御することと、前記ユーザの動作を検出することと、情報処理サーバと通信を行い、前記検出することにより検出された前記ユーザの動作を示す情報を前記情報処理サーバに送信することと、を含み、前記制御することは、前記情報処理サーバにより前記ユーザの動作を示す情報に基づき認識されたジェスチャに基づいて、前記コンテンツリストの切り替えを制御すること、をさらに含む、情報処理方法が提供される。

また、本開示によれば、コンピュータを、認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部と、前記ユーザの動作を検出する検出部と、情報処理サーバと通信を行い、前記検出部により検出された前記ユーザの動作を示す情報を前記情報処理サーバに送信する通信部と、を備え、前記出力制御部は、前記情報処理サーバにより前記ユーザの動作を示す情報に基づき認識されたジェスチャに基づいて、前記コンテンツリストの切り替えを制御する、情報処理装置、として機能させるためのプログラムが提供される。

以上説明したように本開示によれば、ユーザがより直観的にコンテンツを操作することが可能となる。

なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の一実施形態に係る情報処理端末の基本構造を示す図である。同実施形態に係る耳穴開放型の情報処理端末がユーザの耳に音波を出力する様子を示す図である。同実施形態に係る情報処理システムの構成例を示すブロック図である。同実施形態に係る情報処理端末の機能構成例を示すブロック図である。同実施形態に係る情報処理サーバの機能構成例を示すブロック図である。同実施形態に係るコンテキストに応じたコンテンツの再生について説明するための図である。同実施形態に係るコンテキストに対応するコンテンツリストの一例を示す図である。同実施形態に係る複数のコンテンツリストの一例を示す図である。同実施形態に係るコンテンツリストの構造と提示制御に係る一例を示す図である。同実施形態に係る機能コマンドに係るコンテンツリストの一例を示す図である。同実施形態に係る情報処理サーバによる制御の流れを示すフローチャートである。本開示の一実施形態に係るハードウェア構成例を示す図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

なお、説明は以下の順序で行うものとする。
１．実施形態
１．１．概要
１．２．情報処理端末１０の一例
１．３．システム構成例
１．４．情報処理端末１０の機能構成例
１．５．情報処理サーバ２０の機能構成例
１．６．コンテンツリストの提示制御
１．７．制御の流れ
２．ハードウェア構成例
３．まとめ

＜１．実施形態＞
＜＜１．１．概要＞＞
まず、本開示の一実施形態の概要について説明する。上述したように、近年では、ユーザに対しコンテンツや機能を提供する種々の装置が普及している。上記のような装置には、例えば、ユーザに対し音声プログラムなどのコンテンツを提供する端末などが含まれる。

また、ユーザの体に装着して利用されるウェアラブル装置も多く開発されている。ウェアラブル装置には、例えば、ユーザの頭部に装着され、視覚情報や音声情報を提供するヘッドマウントディスプレイや、眼鏡型の装置が挙げられる。ヘッドマウントディスプレイなどの場合、ユーザは、ユーザインタフェースに表示される情報を視覚的に確認しながら、装置の操作を詳細に実行することが可能である。

一方、近年では、ユーザの耳に装着されるヒアラブル装置などの、表示装置を有しない端末も普及している。ヒアラブル装置の場合、ユーザは、例えば、機器操作（ボタン押下、タッチ操作など）、発話、頷きや首振りなどのジェスチャにより、装置の操作を行うことができる。

しかし、ヒアラブル装置に配置されるボタンの数や検出し得る操作パターンには制限があり、また、ジェスチャに割り当てられる操作の数にも限界がある。また、発話による操作制御は比較的柔軟に行えると想定されるが、例えば、公共の場所などにおいては、発話による操作が困難な場合も多い。この場合、ユーザは、例えば、ヒアラブル装置と連携するスマートフォンなどの端末を用いて、音声プログラムに対する操作などを行うのが一般的であり、利便性の改善が求められていた。

本開示の一実施形態に係る技術思想は、上記の点に着目して発想されたものであり、ユーザによるより直観的なコンテンツ操作を実現することを可能とする。このために、本開示の一実施形態に係る情報処理装置は、認識されたコンテキストに基づいて、ユーザに対し当該コンテキストに対する複数のコンテンツリストの提供を制御する機能を有する。また、本実施形態に係る情報処理装置は、ユーザの発話、ジェスチャ、機器操作などに基づいて、上記コンテンツリストの切り替えや選択を制御すること、を特徴の一つとする。

本実施形態に係る情報処理装置が有する上記の機能によれば、より直観的かつ簡易な操作によりコンテンツの再生や実行を制御することが可能となり、装置の利便性を一層に高めることが可能となる。

以下、本実施形態に係る情報処理装置が有する特徴と当該特徴が奏する効果について詳細に説明する。なお、以下においては、コンテンツの提供を行う情報処理端末１０がヒアラブル装置である場合を主な例として説明するが、本実施形態に係る情報処理端末１０は係る例に限定されない。本実施形態に係る情報処理端末１０は、ユーザに対しコンテンツを提供する種々の装置であり得る。

＜＜１．２．情報処理端末１０の一例＞＞
まず、本実施形態に係る情報処理端末１０の一例について説明する。本実施形態に係る情報処理端末１０は、情報処理サーバ２０による制御に基づいて、ユーザに対しコンテンツを提供する情報処理装置である。図１は、本実施形態に係る情報処理端末１０の基本構造を示す図である。なお、図１には、本実施形態に係る情報処理端末１０がヒアラブル装置である場合の基本構造の一例が示されている。

図１を参照すると、本実施形態に係る情報処理端末１０は、音響を発生する音響発生部６１０、音響発生部６１０により発せられる音響を一端６２１から取り込む音導部６２０、音導部６２０を他端６２２付近で保持する保持部６３０を備える。音導部６２０は、例えば、内径が１〜５ミリメートルの中空の管材からなり、その両端はともに開放端であってよい。また、音導部６２０の一端６２１は、音響発生部６１０からの発生音の音響入力孔であり、他端６２２は音響出力孔として機能する。したがって、一端６２１が音響発生部６１０に取り付けられることで、音導部６２０は片側開放状態となっている。

また、保持部６３０は、外耳道の入り口付近（例えば、珠間切痕）と係合して、音導部６２０の他端６２２の音響出力孔が外耳道の奥側を向くように、音導部６２０を他端６２２付近で支持する。音導部６２０の少なくとも他端６２２付近の外径は、耳穴の内径よりもはるかに小さくなるように形成されている。したがって、音導部６２０の他端６２２が保持部６３０によって外耳道の入り口付近で保持されている状態でも、ユーザの耳穴を塞ぐことはない。すなわち、耳穴は開放されている。情報処理端末１０は、一般的なイヤホンとは異なり、「耳穴開放型」ということができる。

また、保持部６３０は、音導部６２０を保持した状態でも、外耳道入口（耳穴）を外界に開放する開口部６３１を備えている。図１に示す一例では、保持部６３０はリング状の構造体であり、内側の一部において音導部６２０の他端６２２付近と連結しているので、リング状構造体のそれ以外の部分はすべて開口部６３１となる。なお、保持部６３０は、リング状構造に限定されるものではなく、中空構造を備えていれば、音導部６２０の他端６２２を支持できる任意の形状でよい。

管状の音導部６２０は、音響発生部６１０により発せられる音響をその一端６２１から管内に取り込むと、空気振動を伝搬して、保持部６３０によって外耳道入口付近に保持された他端６２２から外耳道にむけて放出して、鼓膜に伝える。

上述したように、音導部６２０の他端６２２付近を保持する保持部６３０は、外耳道の入口（耳穴）を外界に開放する開口部６３１を備えている。したがって、情報処理端末１０を装着している状態でも、ユーザの耳穴を塞ぐことはない。ユーザは、情報処理端末１０を装着して音響発生部６１０から出力される音響を聴取している間も、開口部６３１を介して周囲音を十分に聴取することができる。

また、本実施形態に係る情報処理端末１０は、耳穴を開放しているが、音響発生部６１０からの発生音（再生音）の外部への漏れを防止することができる。なぜならば、音導部６２０の他端６２２が外耳道の入口付近で奥を向くように取り付けられ、発生音の空気振動を鼓膜の近くで放射することから、出力を小さくしても十分な音質を得ることができるからである。

また、音導部６２０の他端６２２から放射される空気振動の指向性も音漏れの防止に寄与する。図２には、耳穴開放型の情報処理端末１０がユーザの耳に音波を出力する様子が示されている。図２に示すように、音導部６２０の他端６２２から外耳道の内部に向けて空気振動が放射される。外耳道７００は、外耳道入口７０１から始まり鼓膜７０２の内側で終了する穴であり、一般的におよそ２５〜３０ミリメートルの長さがある。外耳道７００は、筒状をした閉空間である。このため、音導部６２０の他端６２２から外耳道７００の奥に向かって放射された空気振動は、参照番号７１１で示すように、指向性を以って鼓膜７０２まで伝搬する。また、空気振動は、外耳道７００内では音圧が上がることから、とりわけ低域の感度（ゲイン）が向上する。他方、外耳道７００の外側すなわち外界は開空間である。このため、音導部６２０の他端６２２から外耳道７００の外に放射された空気振動は、参照番号７１２で示すように、外界では指向性がなく、急峻に減衰する。

再び図１を参照しながら説明する。管状の音導部６２０は、中間部分に耳介の背面側から正面側に折り返す屈曲形状を有している。この屈曲部分は、開閉構造を有するピンチ部６２３となっており、ピンチ力を発生して耳垂を挟持することができる。

また、音導部６２０は、外耳道の入口付近に配設される他端６２２と、屈曲するピンチ部６２３の間に、変形部６２４をさらに有している。変形部６２４は、過度な外力が作用すると変形して、音導部６２０の他端６２２が必要以上に外耳道の奥に入り込まないようにする機能を有する。

＜＜１．３．システム構成例＞＞
次に、本開示の一実施形態に係る情報処理システムの構成例について説明する。図３は、本実施形態に係る情報処理システムの構成例を示すブロック図である。図３を参照すると、本実施形態に係る情報処理システムは、情報処理端末１０、情報処理サーバ２０、センサ装置３０、被制御装置４０を備える。また、上記の各構成は、互いに情報通信が行えるように、ネットワーク５０を介して接続される。

（情報処理端末１０）
本実施形態に係る情報処理端末１０は、情報処理サーバ２０による制御に基づいて、ユーザに対しコンテンツリストを提供する情報処理装置である。本実施形態に係る情報処理端末１０は、図１および図２を用いて説明したように、ヒアラブル装置であってもよい。一方、本実施形態に係る情報処理端末１０は係る例に限定されない。本実施形態に係る情報処理端末１０は、例えば、ウェアラブル装置、据え置き型または自律移動型の専用装置であってもよい。本実施形態に係る情報処理端末１０は、ユーザに対しコンテンツを提供する種々の装置であり得る。

また、本実施形態に係る情報処理端末１０は、ユーザや周囲に係るセンサ情報を収集する機能を有する。情報処理端末１０が収集するセンサ情報は、情報処理サーバ２０によるコンテキストの認識に用いられる。

（情報処理サーバ２０）
本実施形態に係る情報処理サーバ２０は、認識したコンテキストに基づいて、情報処理端末１０による、当該コンテキストに対応する複数のコンテンツリストの提供を制御する情報処理装置である。この際、本実施形態に係る情報処理サーバ２０は、ユーザの発話、ジェスチャ、機器操作などに基づいて、上記のコンテンツリストの切り替えや選択を制御すること、を特徴の一つとする。本実施形態に係る情報処理サーバ２０が有する機能の詳細については別途後述する。

（センサ装置３０）
本実施形態に係るセンサ装置３０は、ユーザや周囲に係るセンサ情報を収集する情報処理装置である。センサ装置３０により収集されたセンサ情報は、情報処理サーバ２０によるコンテキストの認識に用いられる。本実施形態に係るセンサ装置３０は、例えば、携帯電話、スマートフォン、タブレット、ウェアラブル装置、家電機器などであり得る。

（被制御装置４０）
本実施形態に係る被制御装置４０は、情報処理サーバ２０による制御に基づいて種々の機能を実行する装置である。本実施形態に係る被制御装置４０は、例えば、照明、空調機器、テレビジョン装置などの家電機器であってもよい。情報処理サーバ２０は、コンテンツリストに対するユーザの発話、ジェスチャ、機器操作などに基づいて、被制御装置４０に各種の機能を実行させることができる。このように、本実施形態に係るコンテンツリストには、音声プログラムなどのほか、被制御装置４０に実行させる機能を定義する機能コマンドが含まれる。本実施形態に係るコンテンツリストの詳細については別途後述する。

（ネットワーク５０）
ネットワーク５０は、情報処理システムが備える各構成を接続する機能を有する。ネットワーク５０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク５０は、ＩＰ−ＶＰＮ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ−ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）などの専用回線網を含んでもよい。また、ネットワーク５０は、Ｗｉ−Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

以上、本実施形態に係る情報処理システムの構成例について説明した。なお、図３を用いて説明したシステム構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、本実施形態に係る情報処理システムは、センサ装置３０や被制御装置４０を必ずしも備えなくてもよい。また、本実施形態に係る情報処理端末１０および情報処理サーバ２０が有する機能は、単一の装置により実現されてもよい。本実施形態に係る情報処理システムの構成は、仕様や運用に応じて柔軟に変形可能である。

＜＜１．４．情報処理端末１０の機能構成例＞＞
次に、本実施形態に係る情報処理端末１０の機能構成例について説明する。図４は、本実施形態に係る情報処理端末１０の機能構成例を示すブロック図である。図４を参照すると、本実施形態に係る情報処理端末１０は、音声出力部１１０、入力部１２０、センサ部１３０、制御部１４０、およびサーバ通信部１５０を備える。

（音声出力部１１０）
本実施形態に係る音声出力部１１０は、音声発話を含む種々の音を出力する機能を有する。本実施形態に係る音声出力部１１０は、情報処理サーバ２０による制御に基づいて、ユーザに対しコンテンツリストを提供する提供部ともいえる。このために、本実施形態に係る音声出力部１１０は、スピーカやアンプなどの音声出力装置を備える。

（入力部１２０）
本実施形態に係る入力部１２０は、ユーザによる種々の機器操作を検出する機能を有する。上記の機器操作には、例えば、ボタン押下や種々のタッチ動作などが含まれてよい。また、入力部１２０は、ユーザによる発話や、情報処理端末１０の周囲で発生する周囲音などの音情報を収集する機能を有する。入力部１２０が収集する音情報は、情報処理サーバ２０による音声認識や周囲環境の認識などに用いられる。本実施形態に係る入力部１２０は、音情報を収集するためのマイクロフォンを備える。

（センサ部１３０）
本実施形態に係るセンサ部１３０は、周囲環境やユーザの行動、状態に関する種々のセンサ情報を収集する機能を有する。センサ部１３０が収集したセンサ情報は、情報処理サーバ２０によるコンテキストの認識に用いられる。センサ部１３０は、加速度センサ、ジャイロセンサ、地磁気センサ、振動センサ、ＧＮＳＳ（ＧｌｏｂａｌＮａｖｉｇａｔｉｏｎＳａｔｅｌｌｉｔｅＳｙｓｔｅｍ）信号受信装置、撮像素子などを備える。

（制御部１４０）
本実施形態に係る制御部１４０は、情報処理端末１０が備える各構成を制御する機能を有する。制御部１４０は、例えば、各構成の起動や停止を制御する。また、制御部１４０は、情報処理サーバ２０により生成される制御信号を音声出力部１１０に入力する。また、本実施形態に係る制御部１４０は、後述する情報処理サーバ２０の出力制御部２２０と同等の機能を有してもよい。

（サーバ通信部１５０）
本実施形態に係るサーバ通信部１５０は、ネットワーク５０を介して情報処理サーバ２０との情報通信を行う機能を有する。具体的には、サーバ通信部１５０は、入力部１２０が収集した音情報や、センサ部１３０が収集したセンサ情報を情報処理サーバ２０に送信する。また、サーバ通信部１５０は、情報処理サーバ２０からコンテンツリストおよび当該コンテンツリストが含むコンテンツの出力に係る制御信号などを受信する。

以上、本実施形態に係る情報処理端末１０の機能構成例について説明した。なお、図４を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理端末１０の機能構成は係る例に限定されない。例えば、上述したように、本実施形態に係る制御部１４０は、情報処理サーバ２０の出力制御部２２０と同等の機能を有してもよい。本実施形態に係る情報処理端末１０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

＜＜１．５．情報処理サーバ２０の機能構成例＞＞
次に、本実施形態に係る情報処理サーバ２０の機能構成例について説明する。図５は、本実施形態に係る情報処理サーバ２０の機能構成例を示すブロック図である。図５を参照すると、本実施形態に係る情報処理サーバ２０は、認識部２１０、出力制御部２２０、リスト生成部２３０、履歴保持部２４０、通信部２５０を備える。

（認識部２１０）
本実施形態に係る認識部２１０は、情報処理端末１０やセンサ装置３０が収集したセンサ情報に基づいてコンテキストを認識する機能を有する。本実施形態に係るコンテキストとは、ユーザや環境の状態を定義したものともいえる。本実施形態に係るコンテキストは、例えば、「早朝」、「自宅」、「出社前」、「晴れ」、「ユーザの感情：穏やか」、などの状態に係る要素が組み合わされたものであってもよい。本実施形態に係る出力制御部２２０は、上記のようなコンテキストに応じたコンテンツリストの提供を制御することで、ユーザや環境の状態により合致したコンテンツを提供することが可能である。なお、認識部２１０は、収集された画像、音声、加速度情報や角速度情報、位置情報、家電機器の利用情報などに基づいて、種々のコンテキストを認識することが可能である。

また、本実施形態に係る認識部２１０は、情報処理端末１０やセンサ装置３０が収集したユーザの発話に基づいて、音声認識処理を行う機能を有する。さらには、本実施形態に係る認識部２１０は、情報処理端末１０やセンサ装置３０が収集したセンサ情報に基づいて、ユーザのジェスチャを認識する機能を有する。認識部２１０により認識されたユーザの発話やジェスチャは、出力制御部２２０によるコンテンツリストの制御に用いられる。

（出力制御部２２０）
本実施形態に係る出力制御部２２０は、認識部２１０が認識したコンテキストに基づいて、ユーザに対し当該コンテキストに対応する複数のコンテンツリストの提供を制御する機能を有する。この際、本実施形態に係る出力制御部２２０は、認識部２１０が認識したユーザの発話やジェスチャ、また機器操作などに基づいて、上記コンテンツリストの提供を制御すること、を特徴の一つとする。本実施形態に係る出力制御部２２０が有する機能の詳細については別途後述する。

（リスト生成部２３０）
本実施形態に係るリスト生成部２３０は、コンテキストに対応するコンテンツリストの生成や、優先度の制御を行う機能を有する。本実施形態に係るリスト生成部２３０は、例えば、ユーザの嗜好や行動履歴などに基づいて、コンテンツリストの生成や優先度の変更を行ってもよい。本実施形態に係るリスト生成部２３０によるコンテンツリストの生成については、別途詳細に説明する。

（履歴保持部２４０）
本実施形態に係る履歴保持部２４０は、コンテンツリストに対するユーザの操作履歴やフィードバックに係る履歴情報を保持する。また、本実施形態に係る履歴保持部２４０は、被制御装置４０に対するユーザの操作履歴（特に、機能の実行履歴）を保持する。

（通信部２５０）
本実施形態に係る通信部２５０は、ネットワーク５０を介して、情報処理端末１０、センサ装置３０、被制御装置４０との情報通信を行う。例えば、通信部２５０は、情報処理端末１０から音情報やセンサ情報を受信し、コンテンツリストに係る制御信号を情報処理端末１０に送信する。

以上、本実施形態に係る情報処理サーバ２０の機能構成例について説明した。なお、図５を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理サーバ２０の機能構成は係る例に限定されない。例えば、情報処理サーバ２０は、必ずしも図５に示す構成のすべてを備えなくてもよい。認識部２１０、リスト生成部２３０、および履歴保持部２４０は、情報処理サーバ２０とは異なる別の装置に備えることも可能である。本実施形態に係る情報処理サーバ２０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

＜＜１．６．コンテンツリストの提示制御＞＞
次に、本実施形態に係る出力制御部２２０によるコンテンツリストの提示制御について詳細に説明する。上述したように、近年においては、ユーザに対しコンテンツを提供する種々の装置が普及しているが、例えば、ヒアラブル装置のように、表示装置を有しない、あるいは表示装置の大きさに制限がある装置では、視覚情報を通じたコンテンツ操作が困難な場合も想定される。

一方、ヒアラブル装置でも、機器操作、発話またはジェスチャによる操作などが可能であるが、ボタンやジェスチャによる操作では、割り当てられる機能（例えば、再生、停止、次コンテンツへの遷移など）に制限があり、また発話による操作は、場所や時間帯などの状況によっては困難な場合もある。

そこで、上記のような制限に対し、コンテンツ操作に係るユーザの利便性を高める手法として、例えば、認識したコンテキストに基づいて、当該コンテキストに対応したコンテンツを情報処理端末１０に自動的に再生させることも想定される。当該手法によれば、ユーザがあるコンテキストにおいて頻繁に再生する傾向があるコンテンツを自動再生することで、ユーザによる操作なしでも当該ユーザの嗜好に合致したコンテンツを提供することが可能となる。

図６は、コンテキストに応じたコンテンツの再生について説明するための図である。図６には、一日におけるユーザの所在、コンテンツ再生に係るトリガー、コンテキスト、および当該コンテキストに応じて自動再生されるコンテンツの一例が示されている。

例えば、情報処理サーバ２０は、早朝自宅において、情報処理端末１０を装着したことをトリガーとして、認識したコンテキスト「朝支度」に対応するコンテンツ種別「リラックス（リラックスできる楽曲など）」を情報処理端末１０に自動再生させてもよい。

また、例えば、情報処理サーバ２０は、ユーザが自宅を出発したことをトリガーとして、認識したコンテキスト「通勤」に対応するコンテンツ種別「元気（元気が出る楽曲など）」を情報処理端末１０に自動再生させてもよい。

また、例えば、情報処理サーバ２０は、ユーザが職場に到着したことをトリガーとして、認識したコンテキスト「始業」に対応するコンテンツ種別「予定（登録済み予定の読み上げなど）」を情報処理端末１０に自動再生させてもよい。このように、本実施形態に係るコンテンツには、楽曲、予定、ニュース、朗読、学習などに係る種々の音声プログラムが含まれる。

同様に、情報処理サーバ２０は、各種のトリガーや、仕事（作業）、退勤、帰宅後、就寝前などの様々なコンテキストに基づいて、当該コンテキストに対応するコンテンツを情報処理端末１０に自動で再生させることが可能である。なお、情報処理サーバ２０の認識部２１０は、例えば、情報処理端末１０が収集した加速度情報や角速度情報、またＧＮＳＳ信号の受信強度や接続するＷｉ−Ｆｉアクセスポイントの情報などに基づいて、上記のトリガーやコンテキストを認識することができる。

一方、上記のように、コンテキストに対応する単一のコンテンツあるいはコンテンツ種別の自動再生を行う場合、状況によっては、ユーザの意図に沿わないコンテンツが再生されてしまう場合も想定される。例えば、トリガーやコンテキストの認識が正確に行えた場合であっても、情報処理サーバ２０が把握できていない新たなコンテキストは日々発生し、またユーザの嗜好も変化し得る。

この場合、結局、ユーザは、コンテンツを自ら選びなおす操作を行わなくてはならず、二度手間となってしまう可能性も高い。また、上述したように、ヒアラブル装置などが提供可能なユーザインタフェースには制限があるため、機器操作やジェスチャによるコンテンツの選び直しは煩雑となることが予想される。このため、より簡易かつ迅速な操作を行いたい場合、発話による操作のみが選択肢として残ることとなるが、上述したように、発話による操作は、場所や時間帯などの環境によっては困難な場合も多い。

そこで、本実施形態に係る情報処理サーバ２０は、認識したコンテキストに対応する複数のコンテンツリストをユーザに提示し、ユーザの機器操作やジェスチャなどに基づいて、当該コンテンツリストの切り替えや選択を制御することを特徴の一つとする。図７は、本実施形態に係るコンテキストに対応するコンテンツリストの一例を示す図である。図７には、コンテキスト「在宅（朝）」、「外出」、「在宅（夜）」に対応する複数のコンテンツリスト（以下、チャンネル、とも称する）の一例が示されている。例えば、コンテキスト「在宅（朝）」には「在宅用チャンネル１〜３」が、コンテキスト「外出」には「外出用チャンネル１〜３」が、コンテキスト「在宅（夜）」には「帰宅用チャンネル１〜３」がそれぞれ対応付けられている。

この際、本実施形態に係る出力制御部２２０は、認識部２１０が認識したコンテキストに応じた複数のコンテンツリストをユーザに提示することで、嗜好に応じたコンテンツを直観的かつ簡易に選択できるようにサポートすることが可能である。

図８は、本実施形態に係る複数のコンテンツリストの一例を示す図である。図８には、出力制御部２２０が認識されたトリガーおよびコンテキストに基づいて、音声プログラムに係る複数のコンテンツリストを情報処理端末１０に提示させる場合の一例が示されている。

なお、本実施形態に係る複数のコンテンツリストは、ユーザの嗜好等に応じた優先順位を以って提示されてよい。例えば、出力制御部２２０は、トリガー「装着」、コンテキスト「朝支度」において、「元気チャンネル（元気が出る楽曲を複数含むコンテンツリスト）」を第１優先、「リラックスチャンネル（リラックスできる楽曲を複数含むコンテンツリスト）」を第２優先として、当該順で情報処理端末１０に提示させてもよい。

一方、出力制御部２２０は、トリガー「家を出た」、コンテキスト「通勤・通学」において、「行動支援チャンネル（例えば、予定の読み上げや、自己啓発、学習などに係る音声プログラムを複数含むコンテンツリスト）」を第１優先、「元気チャンネル」を第２優先として、当該順で情報処理端末１０に提示させてもよい。なお、図８に示す一例においては、第１優先が密度の高いドット、第２優先が密度の低いドットでそれぞれ示されている。

このように、本実施形態に係る出力制御部２２０によれば、コンテキストに応じた複数のコンテンツリストをユーザに提示することで、ユーザが嗜好に沿ったコンテンツを容易に選択することが可能となる。

なお、本実施形態に係るコンテンツリストは、例えば、複数のコンテンツグループから成る階層構造を有してもよい。例えば、コンテンツリストは、大グループや小グループなどの複数のコンテンツグループを有する。この場合、大グループには、「ロック」などのジャンルが該当し、小グループには、「アーティストＪ」、「アーティストＫ」などの区分が該当してもよい。

また、上記のコンテンツグループは、それぞれ複数のコンテンツから構成されてよい。上記の例に従うと、例えば、小グループの下位には、各アーティストの楽曲が配置される。

この際、ユーザは、例えば、音声による読み上げられるコンテンツリスト名、コンテンツグループ名、コンテンツ名に対し、簡易な機器操作やジェスチャを行うことで、コンテンツリストやコンテンツなどの切り替えや選択を直観的かつ容易に行うことが可能である。

図９は、本実施形態に係るコンテンツリストの構造と提示制御に係る一例を示す図である。出力制御部２２０は、例えば、認識部２１０が認識したコンテキストに基づいて、当該コンテキストに対応する複数のコンテンツリストを取得しリスト名の読み上げを情報処理端末１０に実行させる。この際、出力制御部２２０は、例えば、ユーザの第１ジェスチャが認識されたことに基づいて、コンテンツリストの選択を制御し、当該コンテンツが含むコンテンツグループ名を情報処理端末１０に順次読み上げさせる。ここで、上記の第１ジェスチャは、例えば、頷くなどの動作であってもよい。なお、本実施形態に係るジェスチャは、身体の一部または全体を用いたユーザの特定の動作を広く含む。本実施形態に係る認識部２１０は、画像を含む種々のセンサ情報に基づいて特定の動作をセンシングし、当該特定の動作をジェスチャとして認識することが可能である。

一方、出力制御部２２０は、ユーザによる第２ジェスチャが認識された場合、同一の階層に属する次のコンテンツグループやコンテンツへの切り替えを制御する。例えば、「小グループ１」の名称読み上げ中にユーザの第２ジェスチャが認識された場合、出力制御部２２０は、「小グループ２」の名称読み上げ制御に遷移する。また、例えば、「コンテンツ１」の名称読み上げ中または再生中にユーザの第２ジェスチャが認識された場合、出力制御部２２０は、「コンテンツ２」の名称読み上げまたは再生制御に遷移する。なお、上記の第２ジェスチャは、例えば、首を振るなどの動作であってもよい。

このように、本実施形態に係る出力制御部２２０が有する機能によれば、コンテンツリストの階層構造に従い、コンテンツグループおよびコンテンツを順にユーザに提示し、切り替えや提示などの指示を仰ぐことができる。係る機能によれば、ユーザは、例えば上述したような簡易なジェスチャにより嗜好に合致したコンテンツに係る選択操作を直観的かつ簡易に行うことができ、より柔軟で利便性の高いコンテンツ提供を享受することが可能となる。

なお、図９を用いた上記の説明では、ジェスチャを用いて切り替えや選択を行う場合を例に述べたが、本実施形態に係るコンテンツリスト、コンテンツグループ、およびコンテンツの切り替えや選択は、係る例に限定されない。ユーザは、例えば、ボタン押下やタッチ操作などにより切り替えや選択を行うことが可能である。

また、出力制御部２２０は、例えば、ユーザによる機器操作やジェスチャが所定時間以上検出されない場合には、読み上げ中のコンテンツグループやコンテンツを自動で選択してもよい。

また、本実施形態に係るコンテンツは、上述したように楽曲に限定されない。本実施形態に係るコンテンツは、例えば、ニュース、予定、朗読、学習などに係る種々の音声プログラムを含む。

また、本実施形態に係るコンテンツは、被制御装置４０に所定の機能を実行させるための機能コマンドを含んでよい。すなわち、ユーザは、順次提示される機能コマンドを切り替え、選択することで、任意の機能を容易に被制御装置４０に実行させることができる。

図１０は、本実施形態に係る機能コマンドに係るコンテンツリストの一例を示す図である。図８に示した一例と比較すると、図１０に示す一例では、コンテンツリスト「行動支援チャンネル」が「機能チャンネル」に変わっていることがわかる。

例えば、トリガー「装着」、コンテキスト「休日の朝」の場合、出力制御部２２０は、機能コマンド「テレビをつける」、「エアコンをつける」、「コーヒーを入れる」などを優先度順に提示させ、ユーザが選択した機能コマンドに応じた機能を被制御装置４０に実行させることができる。

また、例えば、トリガー「装着」、コンテキスト「仕事中」の場合、出力制御部２２０は、機能コマンド「エアコンをつける」や「ノイズキャンセル」などを優先度順に提示させ、ユーザが選択した機能コマンドに対応する機能を被制御装置４０に実行させてよい。

なお、本実施形態に係るリスト生成部２３０は、例えば、ユーザの行動履歴に基づいて、上記のような音声プログラムや機能コマンドを含むコンテンツリストの生成や、優先度の設定を行うことができる。ここで、上記の行動履歴には、例えば、コンテンツリストなどに対するユーザの操作履歴や、被制御装置４０の機能の実行履歴が含まれる。

例えば、リスト生成部２３０は、情報処理端末１０に対してユーザが行った発話や機器操作などをコンテキストと対応付けて履歴保持部２４０に記録させ、同一の音声プログラムを選んだ回数などが閾値を超えた場合、コンテンツリストやコンテンツの登録を行ってもよい。リスト生成部２３０は、例えば、ユーザがコンテキスト「朝支度」において「リラックスできる音声プログラム」を再生した回数が閾値を超えた場合、「リラックスできる音声プログラム」に係るコンテンツリストを生成し、割り当てを行うことができる。

また、例えば、リスト生成部２３０は、ユーザによる被制御装置４０の所定機能の実行をコンテキストと対応付けて履歴保持部２４０に記録させ、同一の機能を実行させた回数が閾値を超えた場合、当該機能に対応する機能コマンドを含むコンテンツリストの割り当てを行ってもよい。リスト生成部２３０は、例えば、ユーザがコンテキスト「休日の朝」において「テレビをつける」回数が閾値を超えた場合、「テレビをつける」ための機能コマンドを含むコンテンツリストを生成し、割り当てを行うことができる。

本実施形態に係るリスト生成部２３０が有する上記の機能によれば、所定のコンテキストにおいてユーザが選択する可能性が高いコンテンツリストを優先度順に提示することができ、日々変化するユーザの状態や嗜好に対応した質の高いコンテンツ提供を実現することが可能となる。

なお、コンテンツリストの割り当てについては、ユーザへの問い合わせ、およびユーザの回答を以って実行されてもよい。例えば、リスト生成部２３０は、情報処理端末１０に、「ＸＸＸをチャンネルに割り当てますか？」などの音声を出力させ、ユーザが肯定的な応答を示した場合にコンテンツリストの割り当てを実行することができる。

また、ユーザが所定のコンテキストにおいて常に実行する機能などについては、コンテンツリストへの割り当てを行わず、対応するコンテキストが認識された際に、自動実行されるよう制御が行われてもよい。

また、リスト生成部２３０は、コンテキストの詳細化に伴い、既存のコンテンツリストから新たなコンテンツリストを分離して生成してもよい。例えば、コンテキスト「休日の午後」に対応する機能コマンド「コーヒーを入れる」、「テレビをつける」、「音楽を停止する」が既存で存在する場合を想定する。この際、ユーザの行動履歴の蓄積から、「音楽を停止する」のは、上記コンテキストからさらに詳細化した「休日の午後にエリアＣに居る」場合であることが認識された場合、リスト生成部２３０は、コンテキスト「休日の午後」から機能コマンドを「音楽を停止する」を分離し、新たなコンテキスト「休日の午後にエリアＣに居る」に対応づけたコンテンツリストとして生成することができる。なお、認識部２１０は、例えば、情報処理端末１０が受信するＧＮＳＳ信号や、接続するＷｉ−Ｆｉアクセスポイントなどの情報に基づいて、上記のような場所に係るコンテキストを認識することが可能である。

本実施形態に係るリスト生成部２３０が有する上記の機能によれば、ユーザが選択する音声プログラムや機能コマンドなどを対応付けるコンテキストをより詳細化させることで、細やかな条件に応じた精度の高いコンテンツ提供を実現することが可能である。

また、本実施形態に係るリスト生成部２３０は、ユーザのフィードバックに基づいて、コンテンツリストの生成や優先度の変更を行ってもよい。例えば、ユーザが優先度１に設定したコンテンツよりも優先度２に設定したコンテンツを選択する頻度が高い場合、リスト生成部２３０は、両者の順番を入れ替えるなどの変更を行ってもよい。このように、本実施形態に係るユーザのフィードバックには、提示されたコンテンツに対するユーザの選択行為が含まれる。

また、一方で、リスト生成部２３０は、ユーザがまったく選択しないコンテンツや選択頻度の低いコンテンツについては、優先度を下げる処理や削除処理を実行してもよい。このように、本実施形態に係るユーザのフィードバックには、コンテンツに対して反応がない、などの暗示的なフィードバックも含まれ得る。リスト生成部２３０が有する上記の機能によれば、コンテンツリストの数が増大し、ユーザの選択が煩雑になることを効果的に防止し、常にユーザの嗜好に合致した質の高いコンテンツ提供を実現することができる。なお、コンテンツやコンテンツリストの削除については、ユーザによる問い合わせ、およびユーザの応答を以って実行されてもよい。

以上説明したように本実施形態に係る情報処理サーバ２０は、種々のコンテキストに対応する複数のコンテンツリストの提供を制御し、ユーザの機器操作やジェスチャなどに基づいて、コンテンツリストの切り替えや選択を制御することができる。本実施形態に係る情報処理サーバ２０が有する上記の機能によれば、ユーザの状況や嗜好などに応じた質の高いコンテンツ提供を実現すると共に、より直観的かつ簡易な操作でユーザがコンテンツを選択することが可能となる。

なお、本実施形態に係るコンテンツは音声プログラムや機能コマンドを含むと述べたが、音声プログラムと機能コマンドとは、それぞれ異なるディメンションにおける階層構造として制御されてもよい。例えば、ユーザの顔の傾きが水平に近い場合に、首振りや頷きが認識された場合、出力制御部２２０は、音声プログラムに係るコンテンツリストの切り替えや選択を制御してよい。一方、ユーザの顔の傾きが閾値以上水平方向から離れている場合、例えば、ユーザが下方を向きながら首振りや頷きを行った場合、出力制御部２２０は、機能コマンドに係るコンテンツリストの切り替えや選択を制御してよい。このように、本実施形態に係る情報処理サーバ２０は、ユーザのジェスチャや機器操作を複数のディメンションごとに認識し、当該ディメンションに対応したコンテンツリストの提示を制御することも可能である。本実施形態に係る情報処理サーバ２０が有する上記の機能によれば、視覚情報を用いなくても、より少ない操作指示でより多くのコンテンツの選択を実現することができる。

＜＜１．７．制御の流れ＞＞
次に、本実施形態に係る情報処理サーバ２０による制御の流れについて説明する。図１１は、本実施形態に係る情報処理サーバ２０による制御の流れを示すフローチャートである。

図１１を参照すると、まず、通信部２５０が情報処理端末１０やセンサ装置３０からセンサ情報を受信する（Ｓ１１０１）。

次に、認識部２１０が、ステップＳ１１０１において受信したセンサ情報に基づいて、コンテキストの認識を行う（Ｓ１１０２）。

次に、出力制御部２２０が、ステップＳ１１０２において認識されたコンテキストに基づいて、当該コンテキストに対応する複数のコンテンツリストを取得し、提示する（Ｓ１１０３）。

次に、認識部２１０が、提示されるコンテンツリストに対するユーザの機器操作やジェスチャを認識する（Ｓ１１０４）。

次に、出力制御部２２０が、ステップＳ１１０４において認識された機器操作やジェスチャに基づいて、コンテンツリストに係る切り替えや選択を制御する（Ｓ１１０５）。

続いて、出力制御部２２０は、ステップＳ１１０５において選択されたコンテキストに基づく出力制御を実行する（Ｓ１１０６）。

＜２．ハードウェア構成例＞
次に、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ２０に共通するハードウェア構成例について説明する。図１５は、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ２０のハードウェア構成例を示すブロック図である。図１５を参照すると、情報処理端末１０および情報処理サーバ２０は、例えば、プロセッサ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

（プロセッサ８７１）
プロセッサ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

（ＲＯＭ８７２、ＲＡＭ８７３）
ＲＯＭ８７２は、プロセッサ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、プロセッサ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

（ホストバス８７４、ブリッジ８７５、外部バス８７６、インターフェース８７７）
プロセッサ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

（入力装置８７８）
入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

（出力装置８７９）
出力装置８７９は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

（ストレージ８８０）
ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

（ドライブ８８１）
ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

（リムーバブル記録媒体９０１）
リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ−ｒａｙ（登録商標）メディア、ＨＤＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

（接続ポート８８２）
接続ポート８８２は、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）、ＲＳ−２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

（外部接続機器９０２）
外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

（通信装置８８３）
通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（ＷｉｒｅｌｅｓｓＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（ＡｓｙｍｍｅｔｒｉｃＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ）用のルータ、又は各種通信用のモデム等である。

＜３．まとめ＞
以上説明したように、本開示の一実施形態に係る情報処理サーバ２０は、認識されたコンテキストに基づいて、ユーザに対し当該コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部２２０を備える。また、本開示の一実施形態に係る出力制御部２２０は、ユーザによる機器操作やジェスチャに基づいて、コンテンツリストの切り替えや選択を制御する機能を有する。係る構成によれば、ユーザがより直観的にコンテンツを操作することが可能となる。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

また、本明細書の情報処理サーバ２０の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理サーバ２０の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

また、コンピュータに内蔵されるＣＰＵ、ＲＯＭおよびＲＡＭなどのハードウェアに、情報処理サーバ２０が有する構成と同等の機能を発揮させるためのプログラムも作成可能であり、当該プログラムを記録した、コンピュータに読み取り可能な非一過性の記録媒体も提供され得る。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部、
を備え、
前記出力制御部は、前記ユーザによる機器操作またはジェスチャに基づいて、前記コンテンツリストの切り替えを制御する、
情報処理装置。
（２）
前記コンテンツリストは、複数のコンテンツグループから成る階層構造を有し、
前記出力制御部は、前記ユーザによる機器操作またはジェスチャに基づいて、前記コンテンツリストおよび前記コンテンツグループの切り替え、または選択を制御する、
前記（１）に記載の情報処理装置。
（３）
前記コンテンツグループは、複数のコンテンツから成り、
前記出力制御部は、前記ユーザによる機器操作またはジェスチャに基づいて、前記コンテンツの切り替え、または選択を制御する、
前記（２）に記載の情報処理装置。
（４）
前記出力制御部は、認識された第１ジェスチャに基づいて前記コンテンツリストの決定を制御し、第２ジェスチャに基づいて前記コンテンツリストの切り替えを制御する、
前記（１）〜（３）のいずれかに記載の情報処理装置。
（５）
前記コンテンツリストは、音声により提供される、
前記（１）〜（４）のいずれかに記載の情報処理装置。
（６）
前記コンテンツリストは、音声プログラムに係るリストを含み、
前記出力制御部は、前記ユーザによる機器操作またはジェスチャに基づいて、前記音声プログラムの選択または再生を制御する、
前記（１）〜（５）のいずれかに記載の情報処理装置。
（７）
前記コンテンツリストは、機能コマンドに係るリストを含み、
前記出力制御部は、前記ユーザの音声またはジェスチャに基づいて、前記機能コマンドの選択または実行を制御する、
前記（１）〜（６）のいずれかに記載の情報処理装置。
（８）
前記出力制御部は、ウェアラブル装置による前記コンテンツリストの提供を制御する、
前記（１）〜（７）のいずれかに記載の情報処理装置。
（９）
前記出力制御部は、ヒアラブル装置による前記コンテンツリストの提供を制御する、
前記（１）〜（８）のいずれかに記載の情報処理装置。
（１０）
前記コンテキストに対応する前記コンテンツリストを生成するリスト生成部、
をさらに備える、
前記（１）〜（９）のいずれかに記載の情報処理装置。
（１１）
前記リスト生成部は、前記ユーザの行動履歴に基づいて、前記コンテンツリストの生成、または優先度の変更を行う、
前記（１０）に記載の情報処理装置。
（１２）
前記ユーザの行動履歴は、前記コンテンツリストに対する操作履歴、または装置の機能実行履歴のうち少なくともいずれかを含む、
前記（１１）に記載の情報処理装置。
（１３）
前記リスト生成部は、前記コンテキストの詳細化に伴い、既存の前記コンテンツリストから新たな前記コンテンツリストを生成する、
前記（１０）〜（１２）のいずれかに記載の情報処理装置。
（１４）
前記リスト生成部は、前記ユーザのフィードバックに基づいて、前記コンテンツリストの生成、または優先度の変更を行う、
前記（１０）〜（１３）のいずれかに記載の情報処理装置。
（１５）
前記コンテキストを認識する認識部、
をさらに備える、
前記（１）〜（１４）のいずれかに記載の情報処理装置。
（１６）
前記出力制御部による制御に基づいて前記ユーザに対し前記コンテンツリストを提供する提供部、
をさらに備える、
前記（１）〜（１５）のいずれかに記載の情報処理装置。
（１７）
プロセッサが、認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御すること、
を含み、
前記制御することは、前記ユーザによる機器操作またはジェスチャに基づいて、前記コンテンツリストの切り替えを制御すること、
をさらに含む、
情報処理方法。
（１８）
コンピュータを、
認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部、
を備え、
前記出力制御部は、前記ユーザによる機器操作またはジェスチャに基づいて、前記コンテンツリストの切り替えを制御する、
情報処理装置、
として機能させるためのプログラム。

１０情報処理端末
１１０音声出力部
１２０入力部
１３０センサ部
１４０制御部
１５０サーバ通信部
２０情報処理サーバ
２１０認識部
２２０出力制御部
２３０リスト生成部
２４０履歴保持部
２５０通信部
３０センサ装置
４０被制御装置

Claims

認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部と、
前記ユーザの動作を検出する検出部と、
情報処理サーバと通信を行い、前記検出部により検出された前記ユーザの動作を示す情報を前記情報処理サーバに送信する通信部と、
を備え、
前記出力制御部は、前記情報処理サーバにより前記ユーザの動作を示す情報に基づき認識されたジェスチャに基づいて、前記コンテンツリストの切り替えを制御する、
情報処理装置。
前記コンテンツリストは、複数のコンテンツグループから成る階層構造を有し、
前記出力制御部は、前記ユーザによる機器操作またはジェスチャに基づいて、前記コンテンツリストおよび前記コンテンツグループの切り替え、または選択を制御する、
請求項１に記載の情報処理装置。
前記コンテンツグループは、複数のコンテンツから成り、
前記出力制御部は、前記ユーザによるジェスチャに基づいて、前記コンテンツの切り替え、または選択を制御する、
請求項２に記載の情報処理装置。
前記出力制御部は、それぞれ前記情報処理サーバにより認識された、第１ジェスチャに基づいて前記コンテンツリストの決定を制御し、第２ジェスチャに基づいて前記コンテンツリストの切り替えを制御する、
請求項１に記載の情報処理装置。
前記コンテンツリストは、音声により提供される、
請求項１に記載の情報処理装置。
前記コンテンツリストは、音声プログラムに係るリストを含み、
前記出力制御部は、前記ユーザによるジェスチャに基づいて、前記音声プログラムの選択または再生を制御する、
請求項１に記載の情報処理装置。
前記コンテンツリストは、機能コマンドに係るリストを含み、
前記出力制御部は、前記ユーザの音声またはジェスチャに基づいて、前記機能コマンドの選択または実行を制御する、
請求項１に記載の情報処理装置。
前記出力制御部は、ウェアラブル装置による前記コンテンツリストの提供を制御する、
請求項１に記載の情報処理装置。
前記出力制御部は、ヒアラブル装置による前記コンテンツリストの提供を制御する、
請求項１に記載の情報処理装置。
前記コンテキストに対応する前記コンテンツリストを生成するリスト生成部、
をさらに備える、
請求項１に記載の情報処理装置。
前記リスト生成部は、前記ユーザの行動履歴に基づいて、前記コンテンツリストの生成、または優先度の変更を行う、
請求項１０に記載の情報処理装置。
前記ユーザの行動履歴は、前記コンテンツリストに対する操作履歴、または装置の機能実行履歴のうち少なくともいずれかを含む、
請求項１１に記載の情報処理装置。
前記リスト生成部は、前記コンテキストの詳細化に伴い、既存の前記コンテンツリストから新たな前記コンテンツリストを生成する、
請求項１０に記載の情報処理装置。
前記リスト生成部は、前記ユーザのフィードバックに基づいて、前記コンテンツリストの生成、または優先度の変更を行う、
請求項１０に記載の情報処理装置。
前記コンテキストを認識する認識部、
をさらに備える、
請求項１に記載の情報処理装置。
前記出力制御部による制御に基づいて前記ユーザに対し前記コンテンツリストを提供する提供部、
をさらに備える、
請求項１に記載の情報処理装置。
プロセッサが、認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御することと、
前記ユーザの動作を検出することと、
情報処理サーバと通信を行い、前記検出することにより検出された前記ユーザの動作を示す情報を前記情報処理サーバに送信することと、
を含み、
前記制御することは、前記情報処理サーバにより前記ユーザの動作を示す情報に基づき認識されたジェスチャに基づいて、前記コンテンツリストの切り替えを制御すること、
をさらに含む、
情報処理方法。
コンピュータを、
認識されたコンテキストに基づいて、ユーザに対し前記コンテキストに対応する複数のコンテンツリストの提供を制御する出力制御部と、
前記ユーザの動作を検出する検出部と、
情報処理サーバと通信を行い、前記検出部により検出された前記ユーザの動作を示す情報を前記情報処理サーバに送信する通信部と、
を備え、
前記出力制御部は、前記情報処理サーバにより前記ユーザの動作を示す情報に基づき認識されたジェスチャに基づいて、前記コンテンツリストの切り替えを制御する、
情報処理装置、
として機能させるためのプログラム。