WO2020255767A1

WO2020255767A1 - 情報処理システム、情報処理方法、及び記録媒体

Info

Publication number: WO2020255767A1
Application number: PCT/JP2020/022483
Authority: WO
Inventors: 木下　隆; 龍青山; 泉八木; 洋二廣瀬; 文彬徳久; 長坂　英夫; 正一土居; 山田　真; 小池　薫
Original assignee: ソニー株式会社
Priority date: 2019-06-20
Filing date: 2020-06-08
Publication date: 2020-12-24
Also published as: US20220246135A1; EP3989083A1; CN114008610A; JP2024107029A; KR20220019683A; EP3989083A4; JPWO2020255767A1

Abstract

本技術は、より良いユーザ体験を提供することができるようにする情報処理システム、情報処理方法、及び記録媒体に関する。情報処理システムが、コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、コンテキスト情報と発動条件のデータセットからなるユーザシナリオを生成可能であり、ユーザをリアルタイムでセンシングすることで得られたセンサデータが、ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する制御部を備える。本技術は、例えば、音声サービスを提供するシステムに適用することができる。

Description

情報処理システム、情報処理方法、及び記録媒体

　本技術は、情報処理システム、情報処理方法、及び記録媒体に関し、特に、より良いユーザ体験を提供することができるようにした情報処理システム、情報処理方法、及び記録媒体に関する。

　近年、情報機器の普及に伴い、機器の特性を活かした様々なサービスが提供されている（例えば、特許文献１参照）。

　この種のサービスでは、コンテキストの情報を利用して処理が行われる場合がある。コンテキストに関する技術としては、特許文献２乃至５に開示された技術が知られている。

特許第6463529号公報特開2015-210818号公報国際公開第2013/136792号特開2007-172524号公報国際公開第2016/136104号

　ところで、コンテキストの情報を利用してサービスを提供するに際しては、より良いユーザ体験を提供することが求められる。

　本技術はこのような状況に鑑みてなされたものであり、より良いユーザ体験を提供することができるようにするものである。

　本技術の一側面の情報処理システムは、コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する制御部を備える情報処理システムである。

　本技術の一側面の情報処理方法は、情報処理装置が、コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する情報処理方法である。

　本技術の一側面の記録媒体は、コンピュータを、コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する制御部として機能させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体である。

　本技術の一側面の情報処理システム、情報処理方法、及び記録媒体においては、コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件が設定され、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオが生成され、ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示される。

本技術の概要を示した代表図である。本技術を適用した情報処理システムの構成の例を示す図である。図２のデータ管理サーバの構成の例を示す図である。図２の編集機器の構成の例を示す図である。図２の再生機器の構成の例を示す図である。第１の実施の形態における情報処理の全体像を表した図である。第１の実施の形態における情報処理の詳細な流れを説明するフローチャートである。シナリオＤＢに格納される情報の例を示す図である。ユーザシナリオＤＢに格納される情報の例を示す図である。シナリオＤＢに格納される情報の他の例を示す図である。コンテンツ要素の例を示す図である。コンテンツ要素とコンテキストとの組み合わせの例を示す図である。シナリオの例を示す図である。シナリオ選択・新規作成画面の例を示す図である。シナリオ編集画面の例を示す図である。ジオフェンス編集画面の第１の例を示す図である。ジオフェンス編集画面の第２の例を示す図である。第２の実施の形態における情報処理の全体像を表した図である。第３の実施の形態における情報処理の全体像を表した図である。コンテンツ要素－コンテキスト情報に対する発動条件の設定の例を示す図である。シナリオ選択・再生画面の例を示す図である。発動条件設定画面の例を示す図である。発動条件詳細設定画面の例を示す図である。コンテンツ要素選択画面の例を示す図である。コンテンツ要素編集画面の例を示す図である。シナリオ選択画面の例を示す図である。発動条件設定画面の第１の例を示す図である。発動条件設定画面の第２の例を示す図である。ジオフェンス編集画面の例を示す図である。ユーザシナリオの設定の例を示す図である。第４の実施の形態における情報処理の全体像を表した図である。第４の実施の形態における情報処理の全体像を表した図である。発動条件とセンシング手段の組み合わせの例を示す図である。発動条件が重なった場合の状態の例を示す図である。発動条件が重なった場合の対応の第１の例を示す図である。発動条件が重なった場合の対応の第２の例を示す図である。発動条件が重なった場合の対応の第３の例を示す図である。発動条件が重なった場合の対応の第４の例を示す図である。複数キャラクタを配置する場合における情報処理システムの構成の例を示す図である。キャラクタ配置ＤＢに格納される情報の例を示す図である。位置依存情報ＤＢに格納される情報の例を示す図である。シナリオＤＢに格納される情報の例を示す図である。複数キャラクタ配置の第１の例を示す図である。複数キャラクタ配置の第２の例を示す図である。複数キャラクタ配置の第３の例を示す図である。第６の実施の形態における情報処理の全体像を表した図である。第７の実施の形態における情報処理の全体像を表した図である。第８の実施の形態における情報処理の全体像を表した図である。第９の実施の形態における情報処理の全体像を表した図である。第１０の実施の形態における情報処理の全体像を表した図である。第１１の実施の形態における情報処理の全体像を表した図である。コンピュータの構成例を示す図である。

　以下、図面を参照しながら本技術の実施の形態について説明する。なお、説明は以下の順序で行うものとする。

１．第１の実施の形態：基本構成
２．第２の実施の形態：シナリオＤＢの生成
３．第３の実施の形態：異なるメディアの生成
４．第４の実施の形態：ユーザシナリオＤＢの生成
５．第５の実施の形態：センシング手段の構成
６．第６の実施の形態：発動条件が複数のコンテキスト情報に設定された場合の構成
７．第７の実施の形態：複数の機器が連動した構成
８．第８の実施の形態：別のサービスと協調した構成
９．第９の実施の形態：シナリオを共有した構成
１０．第１０の実施の形態：データの他の例
１１．第１１の実施の形態：ユーザフィードバックを利用した構成
１２．変形例
１３．コンピュータの構成

（代表図）
　図１は、本技術の概要を示した代表図である。

　本技術は、１つのシナリオを、別々の場所に住むユーザが、それぞれ利用することができるようにして、より良いユーザ体験を提供するものである。

　図１においては、制作者が、パーソナルコンピュータ等の編集機器を用いて、コンテンツを構成する要素であるコンテンツ要素に、コンテキストの情報であるコンテキスト情報を付与してシナリオを作成している。このようにして作成されたシナリオは、インターネット上のサーバを介して配信される。

　各ユーザは、スマートフォン等の再生機器を操作して、配信されているシナリオの中から所望のシナリオを選択し、コンテンツ要素を提示するときの条件である発動条件を設定することで、ユーザシナリオをそれぞれ作成する。つまり、図１においては、ユーザＡとユーザＢの２人のユーザが、同一のシナリオに対し、自己の発動条件をそれぞれ設定しているため、ユーザごとに、ユーザシナリオの発動条件が異なっている。

　そのため、同一のシナリオが、ユーザごとに、異なる場所で実施されることになり、１つのシナリオを、別々の場所に住むユーザが、それぞれ利用することが可能となる。

＜１．第１の実施の形態＞

（システムの構成例）
　図２は、本技術を適用した情報処理システムの構成の例を示している。

　情報処理システム１は、データ管理サーバ１０、編集機器２０、及び再生機器３０－１乃至３０－Ｎ（Ｎ：１以上の整数）から構成される。また、情報処理システム１において、データ管理サーバ１０と、編集機器２０及び再生機器３０－１乃至２０－Ｎとは、インターネット４０を介して相互に接続されている。

　データ管理サーバ１０は、データベース等のデータを管理するための１又は複数のサーバから構成され、データセンタ等に設置される。

　編集機器２０は、パーソナルコンピュータ等の情報機器から構成され、サービスを提供する事業者により管理される。編集機器２０は、インターネット４０を介してデータ管理サーバ１０に接続し、データベースに蓄積されたデータに関する編集処理を行い、シナリオを生成する。

　再生機器３０－１は、スマートフォンや携帯電話機、タブレット端末、ウェアラブル機器、携帯音楽プレイヤ、ゲーム機、パーソナルコンピュータなどの情報機器から構成される。

　再生機器３０－１は、インターネット４０を介してデータ管理サーバ１０に接続し、シナリオに対して発動条件を設定してユーザシナリオを生成する。再生機器３０－１は、ユーザシナリオに基づいて、発動条件に応じたコンテンツ要素を再生する。

　再生機器３０－２乃至３０－Ｎは、再生機器３０－１と同様に、スマートフォン等の情報機器から構成され、生成したユーザシナリオに基づいて、発動条件に応じたコンテンツ要素を再生する。

　なお、以下の説明では、再生機器３０－１乃至２０－Ｎを特に区別する必要がない場合、単に、再生機器３０と称する。

（データ管理サーバの構成例）
　図３は、図２のデータ管理サーバ１０の構成の例を示している。

　図３において、データ管理サーバ１０は、制御部１００、入力部１０１、出力部１０２、記憶部１０３、及び通信部１０４を含んで構成される。

　制御部１００は、CPU(Central Processing Unit)等のプロセッサから構成される。制御部１００は、各部の動作の制御や、各種の演算処理を行う中心的な処理装置である。

　入力部１０１は、マウスやキーボード、物理的なボタン等から構成される。入力部１０１は、ユーザの操作に応じた操作信号を、制御部１００に供給する。

　出力部１０２は、ディスプレイやスピーカ等から構成される。出力部１０２は、制御部１００からの制御に従い、映像や音声などを出力する。

　記憶部１０３は、不揮発性メモリや揮発性メモリを含む半導体メモリ、HDD(Hard Disk Drive)などの大容量の記憶装置から構成される。記憶部１０３は、制御部１００からの制御に従い、各種のデータを記憶する。

　通信部１０４は、所定の規格に準拠した無線通信又は有線通信に対応した通信モジュールなどから構成される。通信部１０４は、制御部１００からの制御に従い、他の機器と通信を行う。

　また、制御部１００は、データ管理部１１１、データ処理部１１２、及び通信制御部１１３を含む。

　データ管理部１１１は、記憶部１０３に記憶される各種のデータベースやコンテンツのデータなどを管理する。

　データ処理部１１２は、各種のデータに関するデータ処理を行う。このデータ処理としては、コンテンツに関する処理や、機械学習に関する処理などが含まれる。

　通信制御部１１３は、通信部１０４を制御して、インターネット４０を介して編集機器２０又は再生機器３０との間で、各種のデータをやり取りする。

　なお、図３に示したデータ管理サーバ１０の構成は、一例であって、一部の構成要素を除いたり、あるいは専用の画像処理部などの他の構成要素を追加したりしてもよい。

（編集機器の構成例）
　図４は、図２の編集機器２０の構成の例を示している。

　図４において、編集機器２０は、制御部２００、入力部２０１、出力部２０２、記憶部２０３、及び通信部２０４を含んで構成される。

　制御部２００は、CPU等のプロセッサから構成される。制御部２００は、各部の動作の制御や、各種の演算処理を行う中心的な処理装置である。

　入力部２０１は、マウス２２１やキーボード２２２等の入力装置から構成される。入力部２０１は、ユーザの操作に応じた操作信号を、制御部２００に供給する。

　出力部２０２は、ディスプレイ２３１やスピーカ２３２等の出力装置から構成される。出力部２０２は、制御部２００からの制御に従い、各種のデータに応じた情報を出力する。

　ディスプレイ２３１は、制御部２００からの映像データに応じた映像を表示する。スピーカ２３２は、制御部２００からの音声データに応じた音声（音）を出力する。

　記憶部２０３は、不揮発性メモリ等の半導体メモリ等から構成される。記憶部２０３は、制御部２００からの制御に従い、各種のデータを記憶する。

　通信部２０４は、所定の規格に準拠した無線通信又は有線通信に対応した通信モジュールなどから構成される。通信部２０４は、制御部２００からの制御に従い、他の機器と通信を行う。

　また、制御部２００は、編集処理部２１１、提示制御部２１２、及び通信制御部２１３を含む。

　編集処理部２１１は、各種のデータに関する編集処理を行う。この編集処理としては、後述するシナリオに関する処理などを含む。

　提示制御部２１２は、出力部２０２を制御して、映像データや音声データ等のデータに応じた映像や音声等の情報の提示を制御する。

　通信制御部２１３は、通信部２０４を制御して、インターネット４０を介してデータ管理サーバ１０との間で、各種のデータをやり取りする。

　なお、図４に示した編集機器２０の構成は、一例であって、一部の構成要素を除いたり、あるいは他の構成要素を追加したりしてもよい。

（再生機器の構成例）
　図５は、図２の再生機器３０の構成の例を示している。

　図５において、再生機器３０は、制御部３００、入力部３０１、出力部３０２、記憶部３０３、通信部３０４、センサ部３０５、カメラ部３０６、出力端子３０７、及び電源部３０８を含んで構成される。

　制御部３００は、CPU等のプロセッサから構成される。制御部３００は、各部の動作の制御や、各種の演算処理を行う中心的な処理装置である。

　入力部３０１は、物理的なボタン３２１や、タッチパネル３２２、マイクロフォン等の入力装置から構成される。入力部３０１は、ユーザの操作に応じた操作信号を、制御部３００に供給する。

　出力部３０２は、ディスプレイ３３１及びスピーカ３３２等の出力装置から構成される。出力部３０２は、制御部３００からの制御に従い、各種のデータに応じた情報を出力する。

　ディスプレイ３３１は、制御部３００からの映像データに応じた映像を表示する。スピーカ３３２は、制御部３００からの音声データに応じた音声（音）を出力する。

　記憶部３０３は、不揮発性メモリ等の半導体メモリ等から構成される。記憶部３０３は、制御部３００からの制御に従い、各種のデータを記憶する。

　通信部３０４は、無線LAN(Local Area Network)、セルラー方式の通信（例えばLTE-Advancedや5G等）、若しくはBluetooth（登録商標）などの無線通信、又は有線通信に対応した通信モジュールとして構成される。通信部３０４は、制御部３００からの制御に従い、他の機器と通信を行う。

　センサ部３０５は、各種のセンサデバイス等から構成される。センサ部３０５は、ユーザやその周辺などのセンシングを行い、そのセンシング結果に応じたセンサデータを、制御部３００に供給する。

　ここで、センサ部３０５としては、位置、方位、加速度、及び速度を測定する慣性センサ、生物の持つ心拍数、体温、又は姿勢といった情報を測定する生体センサ、磁場（磁界）の大きさや方向を測定する磁気センサ、近接するものを測定する近接センサなどを含めることができる。なお、慣性センサの代わりに、加速度を測定する加速度センサや、角度（姿勢）や角速度、角加速度を測定するジャイロセンサを用いてもよい。

　カメラ部３０６は、光学系やイメージセンサ、信号処理回路などから構成される。カメラ部３０６は、被写体を撮像して得られる撮像データを、制御部３００に供給する。

　出力端子３０７は、ケーブルを介してイヤホンやヘッドホン等の電気音響変換機器を含む機器と接続される。出力端子３０７は、制御部３００からの音声データ等のデータを出力する。なお、イヤホン等の機器とは、有線に限らず、Bluetooth（登録商標）等の無線通信により接続されてもよい。

　電源部３０８は、二次電池等の電池と電源管理回路から構成され、制御部３００を含む各部に電源を供給する。

　また、制御部３００は、再生処理部３１１、提示制御部３１２、及び通信制御部３１３を含む。

　再生処理部３１１は、各種のコンテンツのデータに関する再生処理を行う。この再生処理としては、楽曲（の一部）や、キャラクタの発話等のデータを再生する処理などが含まれる。

　提示制御部３１２は、出力部３０２を制御して、映像データや音声データ等のデータに応じた映像や音声等の情報の提示を制御する。また、提示制御部３１２は、再生処理部３１１により再生されたデータの提示を制御する。

　通信制御部３１３は、通信部３０４を制御して、インターネット４０を介してデータ管理サーバ１０との間で、各種のデータをやり取りする。

　なお、図５に示した再生機器３０の構成は、一例であって、カメラ部３０６や出力端子３０７等の一部の構成要素を除いたり、あるいは入力端子等の他の構成要素を追加したりしてもよい。

　情報処理システム１は、以上のように構成される。以下、情報処理システム１で実行される情報処理の具体的な内容について説明する。

（処理の全体像）
　まず、図６を参照して、第１の実施の形態における情報処理の全体像を説明する。

　データ管理サーバ１０において、記憶部１０３は、コンテンツ要素－コンテキスト情報ＤＢ１５１、シナリオＤＢ１５２、及びユーザシナリオＤＢ１５３の各データベースを記憶している。また、記憶部１０３は、コンテンツ要素のデータも記憶している。

　コンテンツ要素－コンテキスト情報ＤＢ１５１は、コンテンツ要素とコンテキスト情報とを対応付けたテーブルを格納したデータベースである。

　ここで、コンテンツ要素とは、コンテンツを構成する要素（エレメント）である。例えば、コンテンツ要素には、映像や音楽等のコンテンツから生成される、セリフやBGM、効果音、環境音、楽曲、画像などが含まれる。

　また、コンテキスト情報とは、コンテンツ要素に対して付与されるコンテキストの情報である。例えば、コンテンツ要素の使用が想定される状況に応じて付与されたコンテキスト情報が、当該コンテンツ要素に対応付けられて、コンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積される。なお、ここでは、機械学習の技術を用いて、コンテンツ要素に対してコンテキスト情報を自動的に付与してもよい。

　シナリオＤＢ１５２は、シナリオを格納したデータベースである。

　ここで、シナリオとは、コンテンツ要素とコンテキスト情報の組み合わせからなるデータセット（以下、「コンテンツ要素－コンテキスト情報」とも表記する）を、一定のテーマに基づいて、パッケージ化したものである。

　なお、シナリオＤＢ１５２には、再生機器３０の機能に関する機器機能情報を格納してもよい。この機器機能情報を用いることで、１又は複数の再生機器３０の機能に応じた処理を実行することができる。

　ユーザシナリオＤＢ１５３は、ユーザシナリオを格納したデータベースである。

　ここで、ユーザシナリオとは、コンテンツ要素とコンテキスト情報からなるデータセットをパッケージ化したシナリオに対して発動条件を設定したものである。

　すなわち、ユーザごとに、少なくともコンテキスト情報に対して発動条件が設定可能とされ、コンテキスト情報と発動条件のデータセットを含むユーザシナリオが生成可能とされる。いわば、ユーザシナリオは、ユーザ定義シナリオであると言える。

　発動条件とは、データセットとなるコンテキスト情報に対応付けられたコンテンツ要素を、ユーザに提示するときの条件である。この発動条件としては、例えば、位置や場所などの空間的な条件や、時間的な条件、ユーザの行動などが設定可能である。

　情報処理システム１では、データ管理サーバ１０が上記のデータベースを管理し、当該データベースに格納された情報に、編集機器２０や再生機器３０がアクセスすることで、図６に示すような処理が行われる。

　すなわち、再生機器３０がユーザをリアルタイムでセンシングし（Ｓ１０１）、そのセンシングで得られたセンサデータが、ユーザシナリオに設定される発動条件を満たしたかどうかが判定される（Ｓ１０２）。

　そして、センサデータが発動条件を満たしたとき（Ｓ１０２の「Yes」）、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示される（Ｓ１０３）。

　例えば、シナリオとして、「キャラクタ発話」であるコンテンツ要素に、「自宅」であるコンテキスト情報が対応付けられている場合に、当該コンテキスト情報に対して、「自宅の中心から半径10m」である発動条件が設定された場合を想定する。この場合、センサデータ（位置情報）に基づき、ユーザが自宅から10mの位置に来たとき、当該ユーザが所持する再生機器３０から、所望のキャラクタの発話が出力される。

（処理の流れ）
　次に、図７のフローチャートを参照して、第１の実施の形態における情報処理の詳細な流れを説明する。

　なお、図７に示した処理のうち、ステップＳ１２１乃至Ｓ１２７の処理は、主に、編集機器２０（の制御部２００）によりシナリオ生成ツールが実行されたときの処理とされ、ステップＳ１２８乃至Ｓ１３３の処理は、主に、再生機器３０（の制御部３００）によりユーザシナリオ生成ツールが実行されたときの処理とされる。

　つまり、シナリオ生成ツールを操作するのは、編集機器２０でシナリオを作成する制作者等である一方で、ユーザシナリオ生成ツールを操作するのは、再生機器３０を所持するユーザ等であり、各ツールの操作者が異なっているか、同一の操作者であっても操作するタイミングが異なっている。

　編集機器２０では、シナリオ生成ツールによって、コンテンツが取得され（Ｓ１２１）、コンテンツ要素の候補が提示される（Ｓ１２２）。そして、制作者の操作に応じて、コンテンツからコンテンツ要素が切り出される（Ｓ１２３）。

　また、編集機器２０では、シナリオ生成ツールによって、コンテキスト情報の候補が提示される（Ｓ１２４）。そして、制作者の操作に応じて、コンテンツ要素にコンテキスト情報が付与される（Ｓ１２５）。ただし、ここでは、制作者の操作に限らず、機械学習の技術を用いて自動的に付与してもよい。

　なお、このようにして対応付けられたコンテンツ要素とコンテキスト情報は、データ管理サーバ１０に送られ、コンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積される。

　編集機器２０では、シナリオ生成ツールによって、制作者の操作に応じたシナリオが生成され（Ｓ１２６）、当該シナリオが保存される（Ｓ１２７）。

　すなわち、シナリオ生成ツールにより生成されたシナリオは、データ管理サーバ１０に送られ、シナリオＤＢ１５２に蓄積される。シナリオＤＢ１５２に蓄積されたシナリオは、インターネット４０を介して配信可能となる。

　一方で、再生機器３０では、ユーザシナリオ生成ツールによって、データ管理サーバ１０から配信されるシナリオが取得される（Ｓ１２８）。

　そして、再生機器３０では、ユーザの操作に応じて、発動条件が付与される（Ｓ１２９）。これにより、シナリオから、ユーザの操作に応じたユーザシナリオが生成され、当該ユーザシナリオが保存される（Ｓ１３０）。

　ユーザシナリオ生成ツールにより生成されたユーザシナリオは、データ管理サーバ１０に送られ、ユーザシナリオＤＢ１５３に蓄積される。これにより、ユーザシナリオが他のユーザ等と共有可能とされる。

　ここでは、さらにシナリオを追加する場合（Ｓ１３１の「Yes」）には、上述したステップＳ１２８乃至Ｓ１３０の処理が繰り返される。

　また、再生機器３０では、ユーザシナリオ生成ツールによって、作成済みのユーザシナリオを起動して（Ｓ１３２）、評価することができる（Ｓ１３３）。

　なお、シナリオ生成ツールの詳細は、図１４乃至図１７を参照して後述する。また、ユーザシナリオ生成ツールの詳細は、図２１乃至図２５、及び図２６乃至図２９を参照して後述する。

　以上、情報処理の詳細な流れを説明した。

（データベースの例）
　次に、図８乃至図１０を参照して、データ管理サーバ１０により管理されるデータベースの例を説明する。

　図８に示すように、シナリオＤＢ１５２には、ユーザシナリオ生成ツールの操作に応じて、コンテンツ要素とコンテキスト情報の組み合わせからなるデータセットが蓄積されている。例えば、図８においては、「自宅」であるコンテキスト情報が、「キャラクタ発話＃１」及び「ＢＧＭ＃１」であるコンテンツ要素に対応付けられている。

　また、図９に示すように、ユーザシナリオＤＢ１５３には、コンテンツ要素とコンテキスト情報の組み合わせからなるデータセットとともに、ユーザシナリオ生成ツールの操作に応じて、当該データセットに付与された発動条件が蓄積されている。

　例えば、図９においては、「中心（35.631466, 139.743660）」及び「半径10m」である発動条件が、「キャラクタ発話＃１」及び「ＢＧＭ＃１」であるコンテンツ要素と、「自宅」であるコンテキスト情報に付与されている。ただし、中心（a, b）のa, bは、緯度（北緯）と経度（東経）を意味し、コンテンツ要素の発動範囲を表している。

　なお、図８及び図９に示したデータベースの構成は一例であり、他の構成を用いてもよい。例えば、図１０に示すように、異なる作品（例えば、「映画」である作品Ａと、「アニメ」である作品Ｂと、「文学朗読」である作品Ｃ）に、共通のコンテキスト情報を付与することができる。

　例えば、図１０においては、「自宅」であるコンテキスト情報が、作品Ａの「ＢＧＭ＃２」、作品Ｂの「キャラクタ発話＃１」及び「ＢＧＭ＃１」、並びに作品Ｃの「朗読＃１」であるコンテンツ要素にそれぞれ対応付けられている。

　以上、第１の実施の形態を説明した。この第１の実施の形態では、コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、コンテキスト情報と発動条件のデータセットを含むユーザシナリオを生成可能である。そして、ユーザをリアルタイミングでセンシングすることで得られたセンサデータが、ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示される。

　これにより、シナリオの世界観を、ユーザシナリオ内の発動条件に従って、各ユーザが楽しむことができ、より良いユーザ体験を提供することができる。

＜２．第２の実施の形態＞

　ところで、現在流通・配信されているコンテンツには、例えば、映画やアニメ、ゲーム等の動画、写真や絵画、マンガ等の静止画、音楽やオーディオブック等の音声、書籍等のテキストなどといったフォーマットがあるが、特にストーリ性（劇場性）を持つコンテンツは、セリフや効果、背景のような要素から構成されることが多い。

　ユーザの日常生活の空間への重畳を考慮する場合、上記のコンテンツを流通・配信されている形式でそのまま提示することに加えて、コンテンツの再編集を行うことがある。このコンテンツの再編集としては、例えば、ユーザの現在置かれているコンテキストの空間的・時間的なサイズに合うようにコンテンツの一部を時間的に切り取る、又はコンテキストに合うように上記の要素を取り出して提示する、といったことが行われる。

　以下、この再編集されたコンテンツの一部が、上述したコンテンツ要素に相当している。例えば、図１１に示すように、あるコンテンツのコンテンツ要素としては、セリフや背景、音楽、歌詞、人物、記号、文字、物体などが含まれる。

　このコンテンツ要素に、想定されるコンテキストの情報を、テキストや画像、音声等の形式で表現するかたちで、上述したコンテキスト情報として付与する。また、コンテンツ要素とコンテキスト情報の関連性情報そのもの、又は複数の関連性情報をひとつにまとめたものをシナリオとしてシナリオＤＢ１５２に蓄積する。

　なお、ここでは、１つのコンテンツ要素に対して、１つ以上のコンテキスト・タグを付与してもよく、また、同一のコンテキスト・タグを複数のコンテンツ要素に付与してもよい。

　例えば、図１２に示すように、配信された映画やアニメ、ゲームのように映像と音声から構成されるコンテンツから、あるキャラクタのセリフのみを抜き出して音声コンテンツとし、そのセリフが聞かれると想定されるコンテキストとして、「勇気をもらう」であるテキストを、コンテキスト情報として付与する。

　また、例えば、図１２に示すように、あるシーンで用いられているセリフと背景音楽の組み合わせを１つの音声コンテンツとし、「宿屋での出会い」であるテキストをコンテキスト情報として付与する。

　そして、図１２に示した２つの「コンテンツ要素－コンテキスト情報」のデータセットを、コンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積する。

　例えば、音声データでは、制作途中においてセリフ、効果音、背景音、背景音楽等がマルチトラックとして別々の音源で制作され、その後にミックスダウンして流通・配信されるコンテンツの形態とされる。そのため、コンテンツ要素は、これらミックスダウン前の各トラックから抽出することができる。

　また、例えば、画像においても、人物、背景、物体等が別々に撮影され、その後に合成される手法もあり、合成前のデータからコンテンツ要素を抽出することもできる。

　これらのコンテンツ要素の生成及びコンテキスト情報の付与は、人手で行う場合、人手を介さずに自動で行う場合、又はその組み合わせの場合の３通りが想定される。次に、特に、自動プロセスが関与する場合について述べる。

　機械学習の技術によって、動画若しくは静止画に含まれる画像情報又は音声情報からあるシーンに含まれる人、生物、物体、建築物、風景等の要素を識別する技術があり、これらの技術を用いてコンテンツ要素の範囲を決定し、識別結果、又はその組み合わせから想定される１つ以上のコンテキスト情報を（自動的に）生成することができる。

　これらの情報から、「コンテンツ要素－コンテキスト情報」のデータセットを自動的に生成してもよいし、あるいは、これらの情報を参考情報として、人手で「コンテンツ要素－コンテキスト情報」の設定を行ってもよい。

　シナリオは、１つ以上の「コンテンツ要素－コンテキスト情報」のデータセットを、再編集の元となった作品名、出演するキャラクタ、設定された舞台、喚起される感情など、一定のテーマに沿ってまとめることで構成され、シナリオＤＢ１５２に蓄積される。

　例えば、図１３に示すように、図１２に示した２つの「コンテンツ要素－コンテキスト情報」のデータセットを、「出発の街」であるシナリオとして、シナリオＤＢ１５２に蓄積することができる。

　これにより、ユーザは、利用したい「コンテンツ要素－コンテキスト情報」のデータセットを検索・入手するだけでなく、シナリオをもとにパッケージ化された複数の「コンテンツ要素－コンテキスト情報」のデータセットを検索・入手することもできる。

　ここでは、既に流通・配信されている従来のフォーマットに基づいたコンテンツから、コンテンツ要素を生成してコンテキスト情報を付与する手法について述べたが、本技術で提案する仕組みを前提に、コンテンツ要素に当たる作品を直接創作することもできる。

（シナリオ生成ツールのＵＩの例）
　ここで、図１４乃至図１７を参照して、シナリオを生成するためのシナリオ生成ツールのユーザインターフェースについて説明する。このシナリオ生成ツールは、制作者等により操作される編集機器２０の制御部２００により実行され、各種の画面がディスプレイ２３１に表示される。

　シナリオ生成ツールを起動すると、図１４のシナリオ選択・新規作成画面が表示される。このシナリオ選択・新規作成画面は、地図・シナリオ表示領域２５１、シナリオリスト２５２、及び新規シナリオ作成ボタン２５３を含む。

　シナリオは、地図・シナリオ表示領域２５１において地図上の位置を表すピン２６１Ａに名前が表記されるか、あるいはシナリオリスト２５２においてシナリオ表示バナー２６２Ａが名前順などの所定の順序でリストとして表示される。また、新規シナリオ作成ボタン２５３は、新規のシナリオを作成する場合に操作される。

　制作者は、所望の領域に対応した地図上のピン２６１Ａや、シナリオリスト２５２のシナリオ表示バナー２６２Ａをクリック操作することで、所望のシナリオを選択できる。

　このとき、複数のピン２６１Ａのうち、ピン２６１Ｂに注目すれば、カーソル２６０により選択状態になっているため、「シナリオ＃１」であるピン２６１Ｂに応じたシナリオ名が吹き出し状に表示される。そして、ピン２６１Ｂに応じたシナリオ＃１が選択された状態で、編集ボタン２６２Ｂがクリック操作された場合、図１５のシナリオ編集画面が表示される。

　図１５のシナリオ編集画面は、地図・ジオフェンス表示領域２５４、ジオフェンスリスト２５５、及び編集ツール表示領域２５６を含む。

　ジオフェンスは、地図・ジオフェンス表示領域２５４において地図上のジオフェンスの領域を表すジオフェンス領域２７１Ａ乃至２７１Ｅに名前が表記されるか、あるいはジオフェンスリスト２５５においてジオフェンス表示バナー２７２Ａが名前順などの所定の順序でリストとして表示される。

　なお、ジオフェンス領域２７１Ａ乃至２７１Ｅの形状としては、円形や多角形などの様々な形状を設定可能である。

　地図・ジオフェンス表示領域２５４において、デフォルト値が設定される発動条件（発動範囲）に付与されたコンテキスト情報は、各ジオフェンス内にテキスト等で表示されるか、所望のジオフェンスを選択したときに吹き出し状に表示される。この表示をもとに、制作者は、各コンテンツ要素の発動範囲に紐付くコンテキスト情報を確認することができる。

　これにより、制作者は、所望の領域に対応した地図上のジオフェンス領域２７１Ａ乃至２７１Ｅや、ジオフェンスリスト２５５のジオフェンス表示バナー２７２Ａをクリック操作することで、所望のジオフェンスを選択できる。

　編集ツール表示領域２５６は、円形ジオフェンス作成ボタン２７３、多角形ジオフェンス作成ボタン２７４、ジオフェンス移動ボタン２７５、上書き保存ボタン２７６、新規保存ボタン２７７、削除ボタン２７８、及び戻るボタン２７９を含む。

　円形ジオフェンス作成ボタン２７３は、円形の形状からなるジオフェンスを作成する場合に操作される。多角形ジオフェンス作成ボタン２７４は、多角形の形状からなるジオフェンスを作成する場合に操作される。ジオフェンス移動ボタン２７５は、所望のジオフェンスを移動する場合に操作される。

　上書き保存ボタン２７６は、編集対象のシナリオを、既存のシナリオに上書きして保存する場合に操作される。新規保存ボタン２７７は、編集対象のシナリオを、新規のシナリオとして保存する場合に操作される。削除ボタン２７８は、編集対象のシナリオを削除する場合に操作される。戻るボタン２７９は、シナリオ選択・新規作成画面に戻る場合に操作される。

　ここで、ジオフェンス領域２７１Ａ乃至２７１Ｅのうち、模様が付されたジオフェンス領域２７１Ｃに注目すれば、カーソル２６０により選択状態になっているため、「ジオフェンス＃１」であるジオフェンス領域２７１Ｃに応じたジオフェンス名が吹き出し状に表示されるとともに、ジオフェンスに設定されたコンテンツ要素が再生されてもよい。

　そして、ジオフェンス領域２７１Ｃに応じたジオフェンス＃１が選択された状態で、編集ボタン２７２Ｂがクリック操作された場合、図１６のジオフェンス編集画面が表示される。

　図１６のジオフェンス編集画面は、ジオフェンス詳細設定領域２５７を含む。ジオフェンス詳細設定領域２５７は、ジオフェンスの詳細な設定項目として、ジオフェンス名、中心位置、半径、再生時間、天候、コンテンツ要素、再生範囲、音量、リピート再生、フェードイン・アウト、及び再生優先レベルを含む。

　ただし、ジオフェンス名は、コンテキストの設定項目に相当する。また、中心位置、半径、再生時間、及び天候は、発動条件の設定項目に相当し、ここでは、そのデフォルト値が設定される。さらに、コンテンツ要素、再生範囲、音量、リピート再生、フェードイン・アウト、及び再生優先レベルは、コンテンツ要素と再生条件の設定項目に相当し、ここでは、そのデフォルト値が設定される。

　ジオフェンス名入力欄２８１Ａには、ジオフェンス名として、「ジオフェンス＃１」が入力されている。

　中心位置入力欄２８１Ｂと半径入力欄２８１Ｃには、円形のジオフェンスの中心位置と半径のデフォルト値として、「緯度、経度」と「80m」が入力されている。

　再生時間入力欄２８１Ｄには、再生時間のデフォルト値として、「7:00 - 10:00」が入力されている。なお、天候入力欄２８１Ｅは、「指定なし」となるため、天候のデフォルト値は未設定とされる。

　コンテンツ要素入力欄２８１Ｆには、コンテンツ要素のデフォルト値として、「http:xxx.com/sound/フォルダ＃１/01.mp3」が入力されている。この入力方法としては、選択ボタン２８２をクリック操作することで表示されるコンテンツ要素選択画面２８３を利用することができる。

　コンテンツ要素選択画面２８３には、データ管理サーバ１０の記憶部１０３に記憶されたコンテンツ要素の音声ファイルのデータが表示される。この例では、コンテンツ要素選択画面２８３において、階層構造で表示されるフォルダの中から所望のフォルダを選択することで、当該フォルダ内の所望の音声ファイルを選択することができる。

　なお、ここでは、検索キーワード入力欄２８４Ａに入力された所望のキーワードを検索条件とした検索処理を行い、その検索結果に応じた所望の音声ファイルのリストを提示してもよい。

　再生範囲入力欄２８１Ｇと音量入力欄２８１Ｈには、再生範囲と音量のデフォルト値として、「00:00:08 - 00:01:35」と「5」が入力されている。なお、再生時間と音量は、コンテンツ要素に応じて自動で入力されてもよい。

　リピート再生入力欄２８１Ｉとフェードイン・アウト入力欄２８１Ｊには、音声ファイルのリピート再生とフェードイン及びフェードアウトのデフォルト値として、「リピート再生：する」と「フェードイン・アウト：する」が入力されている。

　再生優先レベル入力欄２８１Ｋには、再生優先レベルのデフォルト値として、「1」が入力されている。この再生優先レベルとしては、「1」乃至「3」の３段階や、「1」乃至「5」の５段階などの所定の段階で、より数値が低いほど優先度が高く、より数値が高いほど優先度が低いなどとすることができる。

　なお、図１６のジオフェンス編集画面では、ジオフェンス＃１の形状が円形である場合を示したが、その形状が多角形（矩形）である場合には、図１７のジオフェンス編集画面が表示される。

　図１７のジオフェンス編集画面は、図１６に示したジオフェンス編集画面と比べて、発動条件の設定項目として、円形のジオフェンスの中心位置と半径の代わりに、矩形のジオフェンスの頂点位置が設けられる点が異なっている。

　また、図１７のジオフェンス編集画面では、図１６の中心位置入力欄２８１Ｂと半径入力欄２８１Ｃのテキストボックスの代わりに、リストボックスからなる頂点位置入力欄２９１Ｂが設けられる。

　この例では、頂点位置入力欄２９１Ｂには、緯度＃１と経度＃１、緯度＃２と経度＃２、緯度＃３と経度＃３、・・・のように、複数の緯度と経度の組み合わせがリストとして表示されるので、当該リストから選択された所望の緯度と経度の組み合わせが、矩形のジオフェンスの頂点位置のデフォルト値として設定される。

　なお、上述したシナリオ生成ツールのユーザインターフェースは一例であり、テキストボックスやラジオボタンの代わりに他のウィジェットを用いるなど、他のユーザインターフェースを用いてもよい。

　例えば、ジオフェンス編集画面において、再生時間入力欄２８１Ｄ、天候入力欄２８１Ｅ、音量入力欄２８１Ｈ、若しくは再生優先レベル入力欄２８１Ｋを構成するテキストボックス、又は頂点位置入力欄２９１Ｂを構成するリストボックスの代わりに、ドロップダウンリストやコンボボックスなどを用いることができる。

（処理の全体像）
　次に、図１８を参照して、第２の実施の形態における情報処理の全体像を説明する。

　図１８に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）と編集機器２０（の制御部２００）が少なくとも連携することで実現される。すなわち、この情報処理は、制御部１００及び制御部２００のうち少なくとも一方の制御部により実行される。

　図１８に示すように、情報処理システム１では、複数のメディア（映像や音声等）からなるコンテンツ（映画やアニメ、ゲーム等）から、少なくとも一部のメディアからなる１つ以上のコンテンツ要素（例えば「キャラクタのセリフ」）が抽出され（Ｓ２０１）、当該コンテンツ要素に対してコンテキスト（例えばそのセリフが聞かれると想定されるコンテキスト）が生成される（Ｓ２０２）。

　そして、情報処理システム１では、各コンテンツ要素（例えば「キャラクタのセリフ」）に対してコンテキスト情報（例えば「勇気をもらう」）が付与される（Ｓ２０３）。これにより、コンテンツ要素－コンテキスト情報ＤＢ１５１には、コンテンツ要素とコンテキスト情報とが対応付けられて蓄積される。

　また、１以上の「コンテンツ要素－コンテキスト情報」のデータセットは、シナリオ（例えば「出発の街」）としてシナリオＤＢ１５２に蓄積される（Ｓ２０４）。ここでは、当該データセットを、一定のテーマ（再編集の元となった作品名、設定された舞台、喚起される感情など）に基づいて、パッケージ化して、シナリオＤＢ１５２に蓄積することができる（Ｓ２１１）。

　ここで、コンテンツ要素としては、例えば、ストリーミング配信コンテンツ（音楽ストリーミング配信サービスで配信される楽曲等）の一部（楽曲の一部等）を含めることができる。このとき、ストリーミング配信コンテンツの一部を識別するために、当該コンテンツのコンテンツIDと再生範囲を指定して（Ｓ２２１）、そのコンテンツIDと再生範囲を示す情報を、対象のコンテキスト情報に対応付けて、コンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積してもよい。

　また、コンテンツ要素に対し、キャラクタ等の紹介コンテンツ（他のコンテンツ要素）を生成して（Ｓ２３１）、コンテンツ要素を再生する前に、紹介コンテンツを提示してもよい。例えば、音楽ストリーミング配信サービスから配信される楽曲（コンテンツ要素）を再生する前に、コンテキスト情報に対応する特定の音声キャラクタ（例えばディスクジョッキー（ＤＪ）のキャラクタ）により紹介文を提示することができる。

　さらに、コンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積されるコンテンツ要素とコンテキスト情報との関係を機械学習することにより（Ｓ２４１）、新たなコンテンツ要素に対して、コンテキスト情報を自動的に付与することができる。

　ここで、機械学習の技術としては、ニューラルネットワーク（NN：Neural Network）などの様々な手法を用いることができるが、例えば、動画若しくは静止画に含まれる画像情報又は音声情報からあるシーンに含まれる人、生物、物体、建築物、風景等の要素を識別する技術を用いて、コンテンツ要素の範囲を決定し、識別結果、又はその組み合わせから想定される１つ以上のコンテキスト情報を自動的に生成することができる。

　以上、第２の実施の形態を説明した。

＜３．第３の実施の形態＞

　ところで、電子書籍の小説のようなテキストのみから構成されるコンテンツから、コンテンツ要素とコンテキスト情報の組み合わせを生成する場合には、抽出されたテキストそのものをコンテンツ要素として利用し、例えば、文字画像として、公共のディスプレイやARグラス等の表示装置に表示することも可能であるが、音声（音）を利用してもよい。なお、ARグラスとは、拡張現実（AR：Augmented Reality）に対応した眼鏡型の機器（デバイス）である。

　すなわち、コンテンツ要素として利用されるテキストデータから、TTS(Text To Speech)の技術を用いて音声データを生成して、当該音声データを、コンテンツ要素とすることができる。

　また、機械学習の技術を用いて、例えば単語や文章を構成するテキストから関連する印象（イメージ）を伴う音声データや画像データ等のデータを検索又は合成して、当該データをコンテンツ要素として利用してもよい。

　一方で、音声データや画像データのみから構成されているコンテンツについて、機械学習の技術を用いて、関連する単語や文章を構成するテキストを検索又は合成することで、当該テキストをコンテンツ要素として利用してもよい。つまり、ここでは、既存のコンテンツに含まれていない内容を追加したり、あるいは触覚など元のコンテンツに含まれていない別のモーダルでの表現を付加したりすることができる。

　なお、TTSの技術は、人間の音声を人工的に作り出す音声合成の技術の一例であり、他の技術を用いて音声を生成してもよい。あるいは、人による朗読を録音したものを利用してもよい。また、上述した説明では、機械学習の技術を用いた場合を示したが、取得したデータの分析を別途行うことで、コンテンツ要素としてのデータを生成してもよい。

（処理の全体像）
　次に、図１９を参照して、第３の実施の形態における情報処理の全体像を説明する。

　図１９に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）と編集機器２０（の制御部２００）が少なくとも連携することで実現される。

　図１９に示すように、情報処理システム１では、複数のメディア（テキスト等）からなるコンテンツ（電子書籍の小説等）から、第１のメディア（テキスト等）からなる１つ以上のコンテンツ要素（例えば小説の一文）が抽出され（Ｓ３０１）、第２のメディア（TTS音声等）からなるコンテンツ要素（例えば小説の一文に応じた音声）が生成される（Ｓ３０２）。

　そして、情報処理システム１では、各コンテンツ要素（例えば小説の一文に応じた音声）に対してコンテキスト情報（例えばその小説の一文の音声が聞かれると想定されるコンテキストの情報）が付与され（Ｓ３０３）、コンテンツ要素とコンテキスト情報とが対応付けられてコンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積される。

　また、１以上の「コンテンツ要素－コンテキスト情報」のデータセットは、シナリオとして、シナリオＤＢ１５２に保存（蓄積）される（Ｓ３０４）。

　ここでは、第１のメディア（テキスト等）と第２のメディア（TTS音声等）との関係をあらかじめ機械学習しておくことで（Ｓ３１１）、その機械学習の結果に基づいて、第１のメディアのコンテンツ要素から第２のメディアのコンテンツ要素を生成することができる。

　以上、第３の実施の形態を説明した。

＜４．第４の実施の形態＞

　ユーザは、ユーザシナリオ生成ツールを利用することで、所望のシナリオや、所望の「コンテンツ要素－コンテキスト情報」のデータセットを、自身が所持する再生機器３０で取得することができる。

　すなわち、再生機器３０においては、ユーザシナリオ生成ツールを実行することで、取得したシナリオに含まれる複数の「コンテンツ要素－コンテキスト情報」のデータセットを表示し、ユーザの周辺の実際の空間に配置するためのユーザインターフェースを用いて、センシング可能な条件の組み合わせからなる発動条件を、それぞれの「コンテンツ要素－コンテキスト情報」のデータセットに対して設定することができる。

　この発動条件としては、例えば、GPS(Global Positioning System)に関する情報や、無線LAN(Local Area Network)のアクセスポイントからの情報から推定される緯度・経度などの位置情報、無線ビーコンや近距離無線通信の履歴から得られる利用状況や認証情報を含めることができる。

　さらには、発動条件として、例えば、カメラにより撮像した撮像画像から推定されるユーザ位置や姿勢、行動、周辺環境に関する情報、環境情報時計で測定される時刻や時間に関する情報、マイクロフォンから得られる音声情報に基づく環境情報や認証情報、慣性センサから得られる身体の姿勢や運動、乗車状態等に関する情報、生体信号情報から推定される呼吸数、脈拍、情動等に関する情報が含まれる。

　例えば、図２０に示すように、「コンテンツ要素－コンテキスト情報」のデータセットとして、あるキャラクタのセリフを抜き出した音声コンテンツに対し、「勇気をもらう」であるテキストが付与されている場合に、GPSに関する情報等から推定される「緯度・経度」を、発動条件として設定することができる。

　この発動条件の設定は、ユーザシナリオ生成ツールを利用して設定することができるが、サービスを利用する前に完了しておくこともできるし、あるいはサービス利用中にツールを起動して設定を行うようにしてもよい。

　ここでは、ユーザシナリオ生成ツールの一例として、地図上に、「コンテンツ要素－コンテキスト情報」のデータセットが表示され、ユーザによって地図上に配置するインターフェースを用いて、センシング可能な発動条件として地図上の範囲及び時間帯を設定する場合について説明する。

　ユーザは、例えばスマートフォン等の再生機器３０、又はパーソナルコンピュータ等の情報機器により実行されるユーザシナリオ生成ツールを操作して、所望のユーザシナリオを作成することができる。なお、ユーザシナリオ生成ツールは、ネイティブアプリケーションとして提供されてもよいし、あるいは、ブラウザを利用したWebアプリケーションとして提供されてもよい。

（ユーザシナリオ生成ツールのＵＩの例）
　ここで、図２１乃至図２５を参照して、スマートフォン等の再生機器３０により実行されるユーザシナリオ生成ツールのユーザインターフェースについて説明する。このユーザシナリオ生成ツールは、例えば、ユーザにより操作される再生機器３０の制御部３００により実行され、各種の画面がディスプレイ３３１に表示される。

　ユーザシナリオ生成ツールを起動すると、図２１のシナリオ選択・再生画面が表示される。このシナリオ選択・再生画面は、地図・シナリオ表示領域４１１、シナリオリスト４１２、及び新規シナリオ作成ボタン４１３を含む。

　シナリオは、地図・シナリオ表示領域４１１において地図上の位置を表すピン４１１Ａに名前が表記されるか、あるいはシナリオリスト４１２において名前順や現在地からの距離が短い順などの所定の順序でリストとして表示される。

　また、新規のユーザシナリオを作成する場合には、新規シナリオ作成ボタン４１３をタップ操作すればよい。また、シナリオ選択・再生画面では、検索キーワード入力欄４１４に入力された所望のキーワードを検索条件とした検索処理を行い、その検索結果に応じたシナリオを提示してもよい。

　ユーザは、所望の領域に対応した地図上のピン４１１Ａや、シナリオリスト４１２のシナリオ表示バナー４１２Ａをタップ操作することで、所望のシナリオを選択できる。

　この例では、シナリオリスト４１２に表示されたシナリオ表示バナー４１２Ａのうち、シナリオ＃１が再生中とされ、シナリオ＃２及びシナリオ＃３が停止中とされる。なお、この例では、３つのシナリオ表示バナー４１２Ａのみを表示しているが、画面をフリック操作してスクロールさせるなどにより他のシナリオが表示される場合も有り得る。

　このとき、地図・シナリオ表示領域４１１において、複数のピン４１１Ａのうち、ピン４１１Ｂに注目すれば、ピン４１１Ｂが選択状態となっているため、「シナリオ＃１」であるピン４１１Ｂに応じたシナリオ名が吹き出し状に表示される。そして、ピン４１１Ｂに応じたシナリオ＃１が選択された状態で、編集ボタン４１２Ｂがタップ操作された場合、シナリオ編集画面として、図２２の発動条件設定画面が表示される。

　図２２の発動条件設定画面は、地図・ジオフェンス表示領域４２１、上書き保存ボタン４２２、新規保存ボタン４２３、削除ボタン４２４、及び戻るボタン４２５を含む。

　地図・ジオフェンス表示領域４２１には、所望の地域の地図上に、ジオフェンス領域４２１Ａ乃至４２１Ｅが表示される。ジオフェンス領域４２１Ａ乃至４２１Ｅの形状としては、円形や多角形などの様々な形状を設定可能である。

　地図・ジオフェンス表示領域４２１において、発動条件（発動範囲）に付与されたコンテキスト情報は、各ジオフェンス内にテキスト等で表示されるか、所望のジオフェンスをタップ操作したときに吹き出し状に表示される。この表示をもとに、ユーザは、各コンテンツ要素の発動範囲に紐付くコンテキスト情報を確認することができる。

　ジオフェンスは、画面上を移動させることができる。ここでは、ジオフェンス領域４２１Ａ乃至４２１Ｅのうち、模様が付されたジオフェンス領域４２１Ｃに注目すれば、選択状態になっているため、「ジオフェンス＃１」であるジオフェンス領域４２１Ｃに応じたジオフェンス名が吹き出し状に表示される。

　ここでは、ユーザが指４００を使って、当該ジオフェンス領域４２１Ｃを選択した状態で、右斜め下の方向（図中の矢印の方向）に動かしてその位置を移動させている。

　また、図示はしていないが、ジオフェンス領域４２１Ｃを選択した状態で、ピンチアウト操作又はピンチイン操作等を行うことでジオフェンス領域４２１Ｃの領域を拡大又は縮小したり、所定の操作に応じてジオフェンス領域４２１Ｃの形状を変形したりしてもよい。

　なお、この発動条件の設定内容をシナリオ＃１として保存する場合には、上書き保存ボタン４２２をタップ操作する一方で、新規のシナリオとして保存する場合には、新規保存ボタン４２３をタップ操作すればよい。また、削除ボタン４２４は、シナリオ＃１を削除する場合に操作される。戻るボタン４２５は、シナリオ選択・再生画面に戻る場合に操作される。

　また、ユーザが指４００を使って、ジオフェンス領域４２１Ｃを長押し操作をした場合には、図２３の発動条件詳細設定画面が表示される。

　図２３の発動条件詳細設定画面は、ジオフェンス詳細設定領域４３１、保存ボタン４３２、及び戻るボタン４３３を含む。

　ジオフェンス詳細設定領域４３１は、ジオフェンス名入力欄４３１Ａ、中心位置入力欄４３１Ｂ、半径入力欄４３１Ｃ、再生時間入力欄４３１Ｄ、天候入力欄４３１Ｅ、コンテンツ要素入力欄４３１Ｆ、再生範囲入力欄４３１Ｇ、音量入力欄４３１Ｈ、リピート再生入力欄４３１Ｉ、フェードイン・アウト入力欄４３１Ｊ、及び再生優先レベル入力欄４３１Ｋを含む。

　ジオフェンス名入力欄４３１Ａ乃至再生優先レベル入力欄４３１Ｋは、図１６のジオフェンス名入力欄２８１Ａ乃至再生優先レベル入力欄２８１Ｋと対応しており、そこでデフォルト値として設定された値がそのまま表示されている。

　なお、保存ボタン４３２は、ジオフェンス＃１の設定内容を保存する場合に操作される。また、戻るボタン４３３は、発動条件設定画面に戻る場合に操作される。

　ユーザは、このジオフェンス＃１のデフォルト値の設定内容をそのまま用いてもよいし、あるいは、所望の設定内容に変更してもよい。例えば、コンテンツ要素入力欄４３１Ｆがタップ操作された場合、図２４のコンテンツ要素選択画面が表示される。

　図２４のコンテンツ要素選択画面は、コンテンツ要素表示領域４４１、選択ボタン４４２、及び戻るボタン４４３を含む。

　コンテンツ要素表示領域４４１には、各コンテンツ要素に応じたアイコン４４１Ａ乃至４４１Ｆが３行２列でタイル状に配置されている。

　なお、選択ボタン４４２は、アイコン４４１Ａ乃至４４１Ｆのうち、所望のアイコンを選択する場合に操作される。また、戻るボタン４４３は、発動条件詳細設定画面に戻る場合に操作される。

　ここでは、ユーザが指４００を使って、アイコン４４１Ａ乃至４４１Ｆのうち、アイコン４４１Ａをタップ操作した場合、コンテンツ要素＃１が再生される。

　また、ユーザが指４００を使って、選択状態のアイコン４４１Ａを長押し操作した場合、図２５のコンテンツ要素編集画面が表示される。

　図２５のコンテンツ要素編集画面は、コンテンツ再生部分表示領域４５１、コンテンツ再生操作領域４５２、曲変更ボタン４５３、及び戻るボタン４５４を含む。

　コンテンツ再生部分表示領域４５１は、楽曲としてのコンテンツ要素＃１を編集するために、コンテンツ要素＃１の楽曲の波形が表示され、スライダ４５１ａ，４５１ｂを左右にスライドさせることで、再生したい部分を指定することができる。

　この例では、コンテンツ要素＃１の楽曲の波形のうち、スライダ４５１ａ，４５１ｂの外側の領域に応じたカット選択領域４５１Ｂ内の楽曲の波形が非再生対象の波形とされ、スライダ４５１ａ，４５１ｂの内側の領域に応じた再生選択領域４５１Ａ内の楽曲の波形が再生対象の波形とされる。なお、シークバー４５１ｃは、再生中のコンテンツ要素＃１の楽曲の再生位置を示している。

　コンテンツ再生操作領域４５２には、コンテンツ要素＃１の楽曲を操作するためのボタンとして、再生ボタン、停止ボタン、スキップボタンなどが表示される。

　ユーザは、コンテンツ再生部分表示領域４５１内の楽曲の波形を確認しながら、コンテンツ再生操作領域４５２内のボタン及びスライダ４５１ａ，４５１ｂ等を操作することで、コンテンツ要素＃１の楽曲のうち、再生したい部分のみを切り出すことができる。

　なお、曲変更ボタン４５３は、編集対象の楽曲を変更する場合に操作される。また、戻るボタン４５４は、発動条件詳細設定画面に戻る場合に操作される。

　このように、ユーザは、スマートフォン等の再生機器３０により実行されるユーザシナリオ生成ツールを操作して、所望のユーザシナリオを作成することができる。

　次に、図２６乃至図２９を参照して、パーソナルコンピュータ等の情報機器により実行されるユーザシナリオ生成ツールのユーザインターフェースについて説明する。

　ユーザシナリオ生成ツールを起動すると、図２６のシナリオ選択画面が表示される。このシナリオ選択画面は、地図・シナリオ表示領域４７１、及びシナリオリスト４７２を含む。

　シナリオは、地図・シナリオ表示領域４７１において地図上の位置を表すピン４７１Ａに名前が表記されるか、あるいは、シナリオリスト４７２においてシナリオ表示バナー４７２Ａが所定の順序でリストとして表示される。

　ユーザは、所望の地図上のピン４７１Ａや、シナリオリスト４７２のシナリオ表示バナー４７２Ａをクリック操作することで、所望のシナリオを選択できる。

　なお、編集ボタン４７２Ｂをクリック操作した場合には、シナリオを編集するためのシナリオ編集画面が表示される。また、新規のシナリオを作成する場合には、新規シナリオ作成ボタン（不図示）が操作される。

　ユーザにより所望のシナリオが選択されると、図２７の発動条件設定画面が表示される。この発動条件設定画面は、地図・ジオフェンス表示領域４８１、及びコンテキストリスト４８２を含む。

　地図・ジオフェンス表示領域４８１には、コンテンツ要素の発動範囲を示すジオフェンス領域４８１Ａが表示される。ジオフェンス領域４８１Ａは、あらかじめ設定された複数の円や多角形などの形状で表される。

　地図・ジオフェンス表示領域４８１において、発動条件（発動範囲）に付与されたコンテキスト情報は、ジオフェンス領域４８１Ａ内にテキスト等で表示されるか、あるいは、所望のジオフェンス領域４８１Ａをクリック操作したときに吹き出し状に表示される。

　ジオフェンス領域４８１Ａは、画面上をドラッグ操作に応じて移動することができる。ここで、複数のジオフェンス領域４８１Ａのうち、模様が付されたジオフェンス領域４８１Ｂに注目すれば、当該ジオフェンス領域４８１Ｂを、ドラッグ操作によって右斜め上の方向（図２８の矢印の方向）に移動させて、図２７に示した位置から、図２８に示した位置に移動させることができる。

　また、ジオフェンス領域４８１Ｂの形状を示す太線上の白丸（〇）にカーソルを合わせて所望の方向にドラッグ操作をすることで、ジオフェンス領域４８１Ｂの形状を、所望の形状に変形することができる。

　このように、ユーザは、ジオフェンス領域４８１Ｂに表示されたコンテキスト情報をもとに、当該ジオフェンス領域４８１Ｂを移動又は変形することで、そのコンテキストが実生活空間のどの位置に当たるのかを自身で設定することができる。

　なお、別途リストの形式でコンテンツ要素を提示してもよい。さらに、利用しないコンテンツ要素を削除したり、別途入手したコンテンツ要素を現在編集中のシナリオに追加したりしてもよい。

　ここで、コンテキストリスト４８２において、ジオフェンス領域４８１Ｂに対応したコンテキスト表示バナー４８２Ａの編集ボタン４８２Ｂがクリック操作されたり、ジオフェンス領域４８１Ｂに対する所定の操作がされたりすると、図２９のジオフェンス編集画面が表示される。

　このジオフェンス編集画面は、ジオフェンス詳細設定領域４９１、選択ボタン４９２、更新ボタン４９３、削除ボタン４９４、及びキャンセルボタン４９５を含む。

　ジオフェンス詳細設定領域４９１は、ジオフェンス名入力欄４９１Ａ、コンテンツ要素入力欄４９１Ｂ、リピート再生入力欄４９１Ｃ、フェードイン・アウト入力欄４９１Ｄ、再生範囲入力欄４９１Ｅ、及び音量入力欄４９１Ｆを含む。これらの設定項目は、図２３のジオフェンス詳細設定領域４３１の設定項目に対応している。

　また、選択ボタン４９２をクリック操作した場合には、図１６の選択ボタン２８２と同様に、コンテンツ要素選択画面を利用して、所望のコンテンツ要素を選択することができる。更新ボタン４９３は、ジオフェンス領域４８１Ｂの設定項目を更新する場合に操作される。削除ボタン４９４は、ジオフェンス領域４８１Ｂを削除する場合に操作される。キャンセルボタン４９５は、編集をキャンセルする際に操作される。

　このように、ユーザは、パーソナルコンピュータ等の情報機器により実行されるユーザシナリオ生成ツールを操作して、所望のユーザシナリオを作成することができる。

　なお、上述した説明では、ユーザシナリオ生成ツールとして、地図を用いたユーザインターフェースを例示したが、地図を用いない他のユーザインターフェースを利用してもよい。以下、地図を用いずに、発動条件を設定する手法を説明する。

　例えば、「駅前の広場のベンチ」など、地図上で表記されていない物体に対してその物体の周辺での発動を設定する場合には、スマートフォン等の再生機器３０のカメラ部３０６で、目的のベンチを撮影することで設定を行うことができる。

　また、ユーザが身につけているウェアラブル機器のカメラで撮影しながら、例えば「ここを撮影して」や「このベンチで設定して」などの音声コマンドを発話して、目的のベンチを撮影することで設定することもできる。さらに、ユーザは、アイウェアなどのカメラを用いて自分の手も含めて撮影可能な場合に、ベンチを囲う形でハンドジェスチャを行い、ジェスチャを認識した時にその囲いの中の物体や景色を記録することで設定することができる。

　また、例えばユーザの生体状態や情動など、地図表現で設定不可能な発動条件の設定時にも、スマートフォン等の再生機器３０上に、例えば「今の気持ち」ボタンを表示し、当該ボタンがタップ操作又はクリック操作された時点で、あるいはその前後一定時間でのデータや認識結果が記録されて発動条件として設定することもできる。なお、上述した場合と同様に、例えば、ユーザの音声やジェスチャコマンド等で入力することもできる。

　ここでは、複数のデータを簡便に設定するために、例えば「今の状況」ボタンを表示するか、又は音声コマンドや特定のジェスチャとしてあらかじめ設定しておき、当該ボタンに入力があった場合には、あらかじめ指定されていた位置や時間、天候、周辺物体、天候、生体データや情動などのデータが一括で取得されるようにしてもよい。

　これらの入力方法、特に画面を介しない入力方法を提供することによって、ユーザはサービスを体験しながら、あるいはサービス停止中に、日常生活の中で容易に入力を行うことができるようになる。

　このようにして、ユーザが画面を用いずに入力されたデータは、例えばデータ管理サーバ１０に送信され、ユーザシナリオＤＢ１５３に蓄積される。これにより、ユーザは、自身が所持する再生機器３０で、ユーザシナリオ生成ツールの画面を表示することができる。そして、ユーザは、この画面に表示された発動条件と、「コンテンツ要素－コンテキスト情報」のデータセットとの紐付けを確認したり、再編集したりすることができる。

　以上の操作は、ユーザが提供されたシナリオ中のコンテンツ要素について発動条件のみを設定する操作であるが、利用条件に応じて、コンテンツ要素を構成する音声データや画像データ等のコンテンツの内容、又はコンテンツ要素に付与されたコンテキスト情報を、ユーザが変更可能な操作として許可するようにしてもよい。

　編集が終了したシナリオは、ユーザシナリオとして、ユーザシナリオＤＢ１５３に蓄積される。なお、ユーザシナリオＤＢ１５３に蓄積されたユーザシナリオは、ソーシャルネットワーキングサービス（SNS：Social Networking Service）などの共有手段を用いて他のユーザに開示することもできる。

　また、シナリオに含まれる複数の「コンテンツ要素－コンテキスト情報」のデータセットを、ユーザシナリオ生成ツール等の編集手段に表示し、ユーザが自身の生活空間の実際の位置や時間帯、環境や自身の動作や情動に対して紐づけを行うことで、例えば、以下のようなサービスに応用することができる。

　すなわち、１つのサービスの例としては、あるアニメ作品に登場する特定のキャラクタが様々なコンテキストで発するセリフで構成された複数の「コンテンツ要素－コンテキスト情報」のデータセットからなるシナリオを取得した場合を想定する。

　この場合において、例えば「自宅」、「駅」、「街路」、「交差点」、「カフェ」、「コンビニ」のように提示されるコンテキスト情報を参照しながら、ユーザシナリオ生成ツール等の編集手段によって、ユーザが実際に生活する「自宅」、「駅」、「街路」、「交差点」、「カフェ」、「コンビニ」の位置をユーザの主観によって発動条件として入力する。これにより、ユーザは、自身が生活する場所で、かつ、自身が想定するコンテキストを持つ場所（例えば交差点）において、所持する再生機器３０によって、コンテキストに応じたコンテンツ要素の再生を受けることができる。

　図３０は、ユーザシナリオの設定の例を示している。

　図３０では、ユーザＡとユーザＢの２人のユーザが、配信されるシナリオに対して発動条件Ａ，Ｂをそれぞれ設定して、それぞれが自己のユーザシナリオを作成している。

　このとき、同一のシナリオに対して発動条件を設定する際に、ユーザＡは発動条件Ａを設定し、ユーザＢは発動条件Ｂを設定するため、ユーザごとに発動条件が異なっている。

　そのため、同一のシナリオを、ユーザごとに、異なる場所で実施することができる。つまり、１つのシナリオを、別々の場所に住むユーザが、それぞれ利用することができる。

　もう１つのサービスの例としては、ストリーミング配信サービスとの連携にかかるものである。

　例えば、従来の音楽ストリーミング配信サービスでは、制作者（クリエイタ）ごと、あるいは利用シーンごとなど、一定のテーマに基づき、既存の楽曲フォーマット（例えばシングル曲等）において複数の作品の音声データをひとまとめにしたプレイリストを制作して配信している。

　それに対して、本技術では、作品そのもの、あるいは作品の中で特定のコンテキストを表現している一部分を抜き出してコンテンツ要素とし、当該コンテンツ要素に対して楽曲を再生する状況（例えば夕暮れの駅）や状態（例えば疲れた帰り道）を表すコンテキスト情報を付与して、シナリオとしてまとめてシナリオＤＢ１５２に蓄積して配信可能にする。

　ユーザは、再生機器３０によって上記のシナリオを取得し、内包される複数の「コンテンツ要素－コンテキスト情報」のデータセットに対して、付与されたコンテキスト情報を参照しながら自分自身の生活圏における具体的な位置と時間帯に配置することでユーザシナリオを作成し、ユーザシナリオＤＢ１５３へ登録することができる。

　ユーザは、ユーザシナリオの編集時に、作品そのものの中から再生したい一部分を、再生範囲として指定するかたちで、コンテンツ要素に指定することもできる。シナリオの中には、コンテンツ要素の再生時又はコンテンツ要素の再生の間に、再生する作品の説明を行う音声キャラクタとしてのコンテンツ要素（他のコンテンツ要素）を含むことができる。

　なお、この音声キャラクタは、シナリオと同一の経路は勿論、シナリオとは異なる経路で取得することも可能であり、例えば、複数の音声キャラクタの中から、ユーザが好むキャラクタに説明を行わせることができる。

　シナリオＤＢ１５２には、制作者によってユーザへの提供を目的として様々なコンテンツ要素に対するコンテキスト情報の組み合わせが蓄積される。

　例えば、このコンテキスト情報を教師データとし、コンテンツ要素のメロディ構造を機械学習した認識器を用いた場合、あるコンテンツ要素のメロディ構造から想起されやすいコンテキストを制作者の主観的な傾向を反映したかたちで推定することができる。そして、この推定結果を用いて、コンテンツ要素へのコンテキスト情報の付与プロセスを自動化したり、一定の相関を持つ複数のコンテキストを提示することで制作者のコンテキスト情報の付与をサポートしたりすることができる。

　また、ユーザシナリオＤＢ１５３には、ユーザによって自身の生活空間の位置や時間、環境、身体状態や情動等からなる発動条件に紐づけられた「コンテンツ要素－コンテキスト情報」のデータセットが順次蓄積されている。

　すなわち、ユーザシナリオＤＢ１５３には、複数のユーザにより発動条件が設定された、多数の「コンテンツ要素－コンテキスト情報」のデータセットが蓄積されているため、この蓄積された情報を機械学習又は分析することで、プロセスの自動化を行うアルゴリズムや、認識器を作成することができる。

　また、例えば、ユーザシナリオＤＢ１５３に蓄積された複数のユーザに関する情報から、ある特定の緯度・経度を持った実世界（実空間）の位置に付与されるコンテキスト情報の傾向を分析することができる。

　例えば、ある実在する駅の出口にある公園に「元気を出す」、あるいはそれに類似したコンテキストが設定される傾向があると分析された場合には、その分析結果を用いて、その公園で元気がでることを期待される食品や書籍を販売するというようなかたちで、別のサービスへのデータ活用をすることができる。

　また、例えば、ある場所からある時間帯に見える風景についてある作品のコンテンツ要素、例えば楽曲の一部のフレーズを歌詞に紐づけた特定のコンテキストが設定されている場合、楽曲の作曲者や作詞者へこの情報をフィードバックすることで、その後の作品の創作時における参考データとして活用することもできる。

（処理の全体像）
　次に、図３１及び図３２を参照して、第４の実施の形態における情報処理の全体像を説明する。

　図３１及び図３２に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）と再生機器３０（の制御部３００）が少なくとも連携することで実現される。すなわち、この情報処理は、制御部１００及び制御部３００のうち少なくとも一方の制御部により実行される。

　図３１に示すように、情報処理システム１では、各コンテンツ要素にコンテキスト情報が付与され、１以上の「コンテンツ要素－コンテキスト情報」のデータセットが、シナリオとしてシナリオＤＢ１５２に蓄積されている（Ｓ４０１）。

　このとき、情報処理システム１では、コンテンツ要素に付与された各コンテキスト情報に対して、ユーザをセンシングすることで得られるセンサデータに応じた発動条件が設定される（Ｓ４０２）。これにより、コンテキスト情報とユーザ固有の発動条件のデータセットからなるユーザシナリオが生成され（Ｓ４０３）、ユーザシナリオＤＢ１５３に蓄積される（Ｓ４０４）。

　ここで、発動条件としては、撮影された画像データや特性操作データなどに応じた発動条件を設定することができる。ここで、画像データとしては、ユーザが視認していると想定される画像のデータを含む。また、特性操作データは、例えばユーザの現在の感情に応じた情報を登録するためのボタン（今の気持ちボタン）の操作のデータを含む。

　また、ユーザシナリオＤＢ１５３に蓄積されるコンテキスト情報（「勇気をもらう」等）と発動条件（特定の駅の出口等）との関係を機械学習することにより（Ｓ４１１）、その機械学習の結果を出力することができる。

　より具体的には、機械学習の結果に応じて、特定の発動条件に対して、自動的にコンテキスト情報を生成可能である（Ｓ４２１）。例えば、センサデータに応じた場所が、勇気をもらえる場所であることが機械学習の結果により特定された場合には、コンテキスト情報として「勇気をもらう」が生成され、対象のコンテンツ要素に付与される。

　また、機械学習の結果に応じて、特定のコンテキスト情報に対して、自動的にユーザに対応した発動条件を生成可能である（Ｓ４３１）。例えば、勇気をもらえる場所が、ユーザの周辺であると、この場所であることが学習の結果により特定された場合には、「勇気をもらう」であるコンテキスト情報に対する発動条件として、当該場所に応じた位置情報が設定される。

　また、図３２に示すように、情報処理システム１では、ユーザ固有の発動条件を設定するための地図を用いたユーザインターフェースとして、ユーザシナリオ生成ツールが提供される。なお、このユーザシナリオ生成ツールが、スマートフォン等の再生機器３０、又はパーソナルコンピュータ等の情報機器により実行されるアプリケーションとして提供されるのは、先に述べた通りである。

　情報処理システム１では、コンテンツから抽出されたコンテンツ要素に付与された各コンテキスト情報に、発動条件が設定される（Ｓ４０１，Ｓ４０２）。

　ここでは、ユーザシナリオ生成ツールを利用することで、所望の地域の地図上に、コンテンツ要素とコンテキスト情報のデータセットを提示し（Ｓ４４１）、当該コンテキスト情報に対する発動条件として、所望の地域の地図上に所定領域を設定する（Ｓ４４２）ことが可能なインターフェースが提供される。

　以上、第４の実施の形態を説明した。

＜５．第５の実施の形態＞

　情報処理システム１においては、ユーザが所持又は装着する再生機器３０、又は当該ユーザの周辺に配置された機器（デバイス）に実装されたセンシング手段によって、センサデータとして、ユーザの位置、身体状態や情動、動作、周辺環境における物体、構造物、建築物、製品、人、動物などの情報、及び現在時刻などのデータが逐次的に取得される。

　そして、これらのデータ、又はデータの組み合わせが、ユーザが設定した発動条件と一致するかどうかが判定手段により逐次判定される。

　ここで、発動条件とセンシング手段によるセンサデータとの一致が判定された場合には、発動条件に紐付けされた「コンテンツ要素－コンテキスト情報」のデータセットに含まれるコンテンツ要素が、あらかじめ指定された機器（例えば再生機器３０）、又は複数の機器の組み合わせ（例えば再生機器３０と周辺に配置された機器）から再生される。

　なお、ここでは、センシング手段によるセンサデータと、発動条件との比較により再生場所やタイミングが決定されるため、判定プロセスにはコンテキストのような主観的な要素や、主観的な要素を含むデータからなる機械学習による認識器を直接的に含まないため、システムとして再現性のある安定した動作が可能となる。

　一方で、発動条件と「コンテンツ要素－コンテキスト情報」のデータセットとの組み合わせをユーザが主体的に行なっているため、ユーザにとっては、適切な状況でのコンテンツ要素の提示であることが理解しやすい、というメリットもある。

　図３３は、発動条件とセンシング手段の組み合わせの例を示している。

　時間的な発動条件としては、時刻や時間などを設定可能であり、時計やタイマなどを用いて測定して判定することが可能である。また、空間的な発動条件として、緯度や経度、特定位置への接近などの位置を設定可能であり、GPSやWi-Fi（登録商標）、無線ビーコンなどを用いて測定して判定することが可能である。

　また、ユーザIDなどの認証情報を発動条件として設定してもよく、Bluetooth（登録商標）等の近接通信などを用いて測定して判定することが可能である。さらに、立つ、座る、寝る等のユーザの姿勢や、電車、自転車、エスカレータ等のユーザの行動などを発動条件として設定してもよく、慣性センサやカメラ、近接通信などを用いて測定して判定することが可能である。

　また、椅子や机、木、建物や部屋、景色やシーンなどの周辺環境情報を発動条件として設定してもよく、カメラやRFタグ、無線ビーコン、超音波などを用いて測定して判定することが可能である。さらに、身体の姿勢や運動、呼吸数や脈拍、情動などの状態を発動条件として設定してもよく、慣性センサや生体センサなどを用いて測定して判定することが可能である。

　なお、図３３の表に示した組み合わせの例は一例であり、発動条件とセンシング手段は、この表に示したものに限定されるものではない。

　以上、第５の実施の形態を説明した。

＜６．第６の実施の形態＞

　ところで、少なくとも１つ以上のシナリオに含まれる、２つ以上のコンテンツ要素に設定される発動条件が同一となる場合も想定される。例えば、発動条件が地図上の一定範囲で設定される複数のコンテンツ要素－コンテンツ情報のデータセットにおいて、２つ以上の発動範囲が同一の地図上の位置を含むように重複して設定される場合がある。

　具体的には、図３４に示すように、地図６５１上において、円形の発動範囲として設定されたジオフェンス６６１と、その円の内部に円形の発動範囲として設定されたジオフェンス６６２Ａ乃至６６２Ｅとが重畳している場合などである。

　このとき、再生機器３０におけるコンテンツ要素の再生としては、例えば、あらかじめ設定されたルールに従い、同時にすべてのコンテンツ要素が再生される場合に、設定された優先順位に基づいて、一部のコンテンツ要素が再生されるときに、すべてのコンテンツ要素が再生されないことも想定される。

　ここでは、ユーザシナリオで発動条件が満たされた場合に参照される提示範囲設定用ユーザシナリオをあらかじめ用意しておくことで、適切にコンテンツ要素を再生することができる。

　具体的には、図３５に示すように、TTS音声による文章の読み上げをコンテンツ要素とし、自宅等を含む全域の発動範囲を含む発動条件ＡにはキャラクタＡによる発話（セリフ）を、自宅等の発動範囲を含む発動条件ＢにはキャラクタＢによる発話（セリフ）を、提示範囲設定用ユーザシナリオに指定した場合を例示する。

　ただし、図３５では、下層Ｌ１がユーザシナリオに相当し、上層Ｌ２が提示範囲設定用ユーザシナリオに相当する。また、下層Ｌ１において、楕円の領域は、ジオフェンスにより設定される発動範囲に相当する。

　このとき、キャラクタの活動範囲設定シナリオの発動条件を排他的とした場合、ユーザシナリオの発動条件Ｃ１が満たされたときの発話はキャラクタＢが行い、発動条件Ｃ２が満たされた場合はキャラクタＡが発話を行う。つまり、この場合においては、キャラクタが常に一人となる。

　一方で、キャラクタの活動範囲設定シナリオの発動条件を排他的としない場合、ユーザシナリオの発動条件Ｃ１が満たされたときの発話はキャラクタＡ又はＢが行う。キャラクタＡ又はＢのどちらが発話するかはランダムに決定してもよいし、あるいは特定のルールを設定してもよい。また、発動条件Ｃ２が満たされたときには、キャラクタＡのみが発話を行う。つまり、この場合、ユーザが自宅にいるときは、キャラクタが２人となる。

　また、設定される優先順位を、センサデータに基づいて設定することができる。例えば、複数のコンテンツ要素が複数のキャラクタによる発話（セリフ）である場合に、ユーザの位置が複数のコンテンツ要素の発動条件が重なった位置となるときに、対応するコンテンツ要素がすべて再生可能な状態にあるときを想定する。

　このとき、図３６に示すように、ユーザ６００の位置と、ジオフェンス６７２Ａ乃至６７２Ｃに応じたコンテンツ要素の発動範囲の特定の位置６７１Ａ乃至６７１Ｃ（例えば円の中心）との相対位置関係と、ユーザ６００の身体の正面の方向（例えば図中の右上方向）のセンサデータから、身体の正面に位置するジオフェンス６７２Ａのコンテンツ要素のみが再生されるようにする。

　なお、このとき、ユーザ６００が再生機器３０に接続されたステレオイヤホンを装着している場合には、当該ユーザ６００の位置と、ジオフェンス６７２Ａ乃至６７２Ｃに応じたコンテンツ要素の発動範囲の特定の位置６７１Ａ乃至６７１Ｃとの相対位置関係に応じて、再生される音源（例えばセリフ）の定位置を立体的に制御（音像定位）することができる。

　以上のような制御により、ユーザ６００が向いた方向のキャラクタの発話の再生を得ることができるため、所望のキャラクタによる音源（例えばセリフ）の提示を、ユーザ６００の身体や頭部などの向きに応じて選択することが可能になる。

　なお、図３７に示すように、ジオフェンス６７２Ａにおけるユーザ６００の位置に応じて、キャラクタによる音源の音量を変化させてもよい。例えば、ユーザ６００が特定の位置６７１Ａに近づくほど音源の音量を上げる一方で、特定の位置６７１Ａから離れるほど音源の音量を下げることができる。

　また、ユーザ６００からの発話コマンドの受付けを発動条件に関連させることで、ユーザ６００がある方向を向いて質問したときに、その方向に設定されたキャラクタがその位置に関連した情報を提示するような案内サービスを実現することができる。

　また、ここでも、提示範囲設定用ユーザシナリオが参照されてもよい。

　具体的には、図３８に示すように、提示範囲設定用ユーザシナリオに、それぞれの発動条件Ｃ１乃至Ｃ４について、発動範囲を設定する情報とともに、音源設定位置Ｐ１乃至Ｐ４を指定する情報を持たせるようにする。ただし、音源設定位置Ｐ１乃至Ｐ４は、発動条件Ｃ１乃至Ｃ４を指定する発動範囲内の位置に限るものではない。

　図３８においては、共通の発動条件領域ＣＡ（図中の斜線）を持つ４つの発動条件Ｃ１乃至Ｃ４を示しており、それぞれの発動条件Ｃ１乃至Ｃ４には音源設定位置Ｐ１乃至Ｐ４（図中の黒丸）が設定されている。

　このとき、ユーザシナリオで発動条件が満たされた場合、すなわち、共通の発動条件領域ＣＡにユーザ６００が侵入した場合、条件が満たされるすべての発動条件に対して、音源設定位置が探索される。

　ここでは、検索された音源設定位置Ｐ１乃至Ｐ４のうち、ユーザ６００が所持する再生機器３０のセンサ部３０５によって測定されたユーザの向き情報から計算された視野角領域ＶＡ内にある音源設定位置Ｐ２が特定される。そして、特定された音源設定位置Ｐ２を持つ発動条件Ｃ２に紐付いたコンテンツ要素が再生される。

　なお、上述した制御は、２つ以上の発動範囲が同一の地図上の位置を含むように重複して設定された場合の制御の一例であり、他の制御が行われてもよい。例えば、同時にすべてのコンテンツ要素が再生される場合に、１つのコンテンツ要素を背景音とし、他のコンテンツ要素を複数のセリフとする制御を行うことで、ユーザが発動範囲内を移動するにしたがって、同一のBGMの中で複数のセリフが再生されるような表現を提示することができる。

（複数キャラクタ配置）
　また、上述した制御は、音声（音）の提示に限るものではなく、拡張現実（AR）に対応した眼鏡型の機器等の表示装置を通じたキャラクタの画像提示についても同様に制御することができる。そこで、次に、図３９乃至図４５を参照して、シナリオに対して複数のキャラクタの配置を設定可能にする場合について説明する。

　図３９は、複数キャラクタの配置を設定可能にする場合における情報処理システム１の構成の例を示している。

　図３９においては、図２の情報処理システム１を構成する装置のうち、データ管理サーバ１０と再生機器３０を図示している。ただし、データ管理サーバ１０により実行される処理のうち、一部の処理が、編集機器２０又は再生機器３０等の他の機器により実行されてもよい。

　再生機器３０において、制御部３００は、ユーザ位置検出部３４１、ユーザ方向検出部３４２、音声認識意図理解部３４３、及びコンテンツ再生部３４４を含む。

　ユーザ位置検出部３４１は、GPSに関する情報等に基づいて、ユーザの位置を検出する。

　ユーザ方向検出部３４２は、センサ部３０５（図５）からのセンサデータに基づいて、ユーザの向いている方向を検出する。

　音声認識意図理解部３４３は、ユーザの発話の音声データに基づいて、音声認識・意図理解処理を行い、ユーザの発話の意図を理解する。

　なお、この音声認識・意図理解処理は、制御部３００に限らず、その一部又は全部の処理を、インターネット４０上のサーバが行ってもよい。また、ユーザの発話の音声データは、マイクロフォンにより収音される。

　ユーザ位置検出部３４１、ユーザ方向検出部３４２、及び音声認識意図理解部３４３により処理された送信データは、通信部３０４（図５）によって、インターネット４０を介してデータ管理サーバ１０に送信される。また、通信部３０４は、インターネット４０を介してデータ管理サーバ１０から送信されてくる応答データを受信する。

　コンテンツ再生部３４４は、受信した応答データに基づいて、コンテンツ要素を再生する。このコンテンツ要素の再生に際しては、キャラクタによる発話（セリフ）をスピーカ３３２から出力するだけでなく、当該キャラクタの映像をディスプレイ３３１に表示することができる。

　データ管理サーバ１０において、制御部１００は、指示キャラクタ選択部１３１、シナリオ処理部１３２、及び応答生成部１３３をさらに含む。また、記憶部１０３（図３）は、キャラクタ配置ＤＢ１６１、位置依存情報ＤＢ１６２、及びシナリオＤＢ１６３をさらに記憶している。

　通信部１０４（図３）は、再生機器３０から送信されてくる送信データを受信する。指示キャラクタ選択部１３１は、受信した送信データに基づいて、キャラクタ配置ＤＢ１６１を参照することで指示キャラクタを選択し、その選択結果をシナリオ処理部１３２に供給する。

　図４０に示すように、キャラクタ配置ＤＢ１６１には、キャラクタごとに、任意の系とその系に応じた配置の場所が設定されている。

　シナリオ処理部１３２は、指示キャラクタ選択部１３１からの選択結果に基づいて、位置依存情報ＤＢ１６２及びシナリオＤＢ１６３を参照することでシナリオを処理し、その処理結果を、応答生成部１３３に供給する。

　図４１に示すように、位置依存情報ＤＢ１６２には、ユニークな値となる情報IDごとに、そのタイプ情報と、緯度・経度等の位置情報と、タイプ情報と位置情報に紐付けられた内容に関する情報が設定されている。

　また、図４２に示すように、シナリオＤＢ１６３には、ユニークな値となるシナリオIDごとに、そのタイプ情報と、タイプ情報に紐付けられた内容に関する情報が設定されている。

　すなわち、キャラクタ配置ＤＢ１６１、位置依存情報ＤＢ１６２、及びシナリオＤＢ１６３に格納された情報のうち、キャラクタや内容に関する情報がコンテンツ要素、系やタイプ情報等がコンテキスト情報、位置情報が発動条件に対応しているとも言える。

　応答生成部１３３は、シナリオ処理部１３２からの処理結果に基づいて、応答データを生成する。この応答データは、通信部１０４（図３）によって、インターネット４０を介して再生機器３０に送信される。

　以上のように構成される情報処理システム１では、シナリオに、ユーザが所望の音声キャラクタを複数設定可能であり、音声再生のトリガを示す発動条件に対し、ユーザの位置と向いている方向を検出し、その検出結果に応じて音声キャラクタを切り替えることができる。

　ここで、現状では、音声キャラクタのサービスを提供するに際し、複数の音声キャラクタを扱う場合に、キャラクタ間での役割分担が難しかったため、図４３に示すように、音声キャラクタ７００Ａ乃至７００Ｃごとに毎回指示をする必要があり、手間であった。

　一方で、情報処理システム１では、音声キャラクタのサービスを提供するに際して、ユーザの位置と方向を検出してその検出結果に応じて音声キャラクタを切り替えることが可能となるため、役割分担された音声キャラクタに所望の動作を指示することが可能となる。よって、複数の音声キャラクタに対する指示が容易になる。

　具体的には、図４４に示すように、ユーザ９００は、仮想空間内のキャラクタ７００Ａ乃至７００Ｃにまとめて指示を与えるだけで、キャラクタ７００Ａ乃至７００Ｃのそれぞれは自身に与えられた指示に従った動作を行うことになる。

　また、図４５に示すように、ユーザ６００は仮想空間内のキャラクタ７００Ｃが存在する方向に向かって音声で質問をするだけで、キャラクタ７００Ｃから質問の回答が得られる。つまり、キャラクタ７００Ｃは、配置された位置の周囲の情報を識別可能になり、いわば、ユーザは、キャラクタ７００Ｃの存在により、周囲の情報へのアクセス権を得ることができる。

　なお、例えば、音声キャラクタ同士が会話するようなユーザシナリオも実現可能であり、排他処理によって、会話が被らないような処理を加えてもよい。さらに、ユーザシナリオに含まれる発動条件が示す発動範囲の周辺の環境情報を取得し、その発動範囲に指定された音声キャラクタによって、ユーザに音声を提供してもよい。

　このように、情報処理システム１では、複数キャラクタの配置を設定可能にした場合に、ユーザが明示的に空間上のキャラクタの位置を指定するに際して、ユーザ座標系におけるキャラクタの位置を指定したり、世界座標系におけるキャラクタの位置を指定したり（緯度経度又はランドマークの指定等）、キャラクタを表示可能な再生機器３０等の機器内に当該キャラクタの位置を指定したりすることができる。

　例えば、ユーザ座標系のキャラクタの配置によって、音だけの空間内でもキャラクタへの指示を方向として、指示の対象となるキャラクタを明確化することができる。また、例えば、ユーザによって世界座標系での指示を与えることで、各キャラクタの役割分担を容易に行うことができる。

（処理の全体像）
　次に、図４６を参照して、第６の実施の形態における情報処理の全体像を説明する。

　図４６に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）と再生機器３０（の制御部３００）が少なくとも連携することで実現される。

　図４６に示すように、情報処理システム１では、リアルタイムのセンシングによるセンサデータが取得される（Ｓ６０１）。このセンサデータから得られる情報が、ユーザシナリオＤＢ１５３に蓄積されたユーザシナリオの発動条件を満たすかどうかが判定される（Ｓ６０２）。

　ステップＳ６０２の判定処理で、発動条件を満たすと判定された場合には、さらに、発動条件を満たす条件が１つのみであるかどうかが判定される（Ｓ６０３）。

　ステップＳ６０３の判定処理で条件が１つのみであると判定された場合には、発動条件を満たすコンテキスト情報に対応したコンテンツ要素が提示される（Ｓ６０４）。

　また、ステップＳ６０３の判定処理で条件が複数あると判定された場合には、提示するコンテンツ要素の順序を決定するルールが参照され（Ｓ６０５）、そのルールに従い、該当する発動条件を満たすコンテキスト情報に対応したコンテンツ要素が提示される（Ｓ６０４）。

　このルールとしては、センサデータにより推定されるユーザの向きに応じて、複数のコンテンツ要素から、提示するコンテンツ要素の順序を決定することができる（Ｓ６１１，Ｓ６０５）。

　また、図３８に示したように、センサデータにより推定されるユーザの向きに応じて、特定の向きのコンテンツ要素のみが提示されてもよい（Ｓ６２１）。さらに、図３５に示したように、センサデータにより推定されるユーザの位置に応じて、特定の位置に設定したコンテンツ要素のみが提示されてもよい（Ｓ６３１）。

　例えば、ユーザの向きが第１の方向のときには、第１のキャラクタに対応するコンテンツ要素を特定して、ユーザに提示し、ユーザの向きが第２の方向のときには、第２のキャラクタに対応するコンテンツ要素を特定し、ユーザに提示することができる。

　以上、第６の実施の形態を説明した。

＜７．第７の実施の形態＞

　コンテンツ要素の再生機器３０は、単一の機器である場合と、複数の機器が連動して動作する場合がある。

　再生機器３０が単一の機器である場合としては、例えば、屋外でユーザが装着したステレオイヤホンから音声が再生される場合が想定される。

　このとき、ユーザの周辺の環境音をコンテンツ要素に重畳して同時に提示できると、提供するコンテンツ要素とユーザの周辺の実世界との整合感や融合感をより高めることができる。ユーザの周辺の環境音を提供する手段としては、例えば、直接周辺音を耳に伝搬できる解放型のイヤホンや、閉鎖型であるがマイクロフォンなどの集音機能により取得した環境音を音声データとして重畳する方法などがある。

　また、歩行などユーザの移動に伴う接近・離脱感覚に整合性を持たせるため、コンテンツ要素の再生開始や停止時にそれぞれ音量を徐々に上げる、下げる効果（フェードイン、フェードアウト）を提示することができる。

　一方で、再生機器３０を含む複数の機器が連携してコンテンツ要素を提示する場合としては、例えば、屋内施設に配置された複数の機器で少なくとも１つのコンテンツ要素を再生する場合が想定される。

　このとき、１つのコンテンツ要素に１つの機器が割り当てられる場合と、１つコンテンツ要素に複数の機器が割り当てられる場合がある。

　例えば、ユーザの周辺に３つのスピーカが配置され、１つはキャラクタのセリフ、もう１つはカフェのざわめき、残りの１つは背景音楽に割り当てて再生することで、立体的な音響環境の提示をすることができる。

　上述した第６の実施の形態における音声キャラクタ（図４５等）のセリフを、ユーザが装着したイヤホン等から再生することもできる。このとき、イヤホンが開放型であれば、ユーザの周辺の他のスピーカからの音も同時に聞くことができるため、連携したコンテンツ要素の提示ができる。

　また、音声キャラクタの音声を、特定の位置に音像定位させ、その位置に対応する周辺のディスプレイに、その音声キャラクタの外観を提示してもよい。この外観提示サービスは、有料のサービスとして提供してもよい。

　あるいは、キャラクタＡのセリフが、３つのスピーカのうち、最も近い位置に設置されたスピーカを検知することで再生され、ユーザの移動に応じて最近接の１つのスピーカから再生されるように追従させることができる。

　このような動作を可能とするため、機器が自己位置とユーザの位置又は他の機器との位置を把握する手段を有する。この手段の一例としては、屋内に設置された各画素にLED(Light Emitting Diode)の点滅符合を通信できる機能を有するカメラを設置し、各再生機器に少なくとも１つ以上のLEDでの符号化発光送信機能を持たせることで、各機器のIDと想定的な配置状況を同時に取得することができる。

　また、再生機器３０が再生することのできる機能について、機器機能情報としてあらかじめ機器機能情報ＤＢ等の専用のデータベース、又はシナリオＤＢ１５２などに登録しておく。ここで、機器機能とは、１つのIDを持つ機器が実現できる再生機能を記述するもので、スピーカの「音声再生」のように１つの機器に１つの機能が割り当てられているものと、テレビ受像機の「画像表示」及び「音声再生」、電球型スピーカの「照度調整」及び「音声再生」のように１つの機器に複数の機能が割り当てられているものがある。

　この機器機能情報を用いることで、ユーザの近接にある再生機器が特定できるだけでなく、テレビ受像機を例えば「音声再生」のみの機器として利用することができるようになる。これを実現するため、テレビ受像機のような１つの機器で複数の機能を有する機器については、従来の機器内部としての機能結合を解除し、各機能を外部の連携信号に基づいて個別に独立に機能させるような仕組みを持つようにする。

（処理の全体像）
　次に、図４７を参照して、第７の実施の形態における情報処理の全体像を説明する。

　図４７に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）と再生機器３０（の制御部３００）を含む複数の機器が少なくとも連携することで実現される。

　図４７に示すように、情報処理システム１では、リアルタイムのセンシングによるセンサデータが取得され（Ｓ７０１）、このセンサデータから得られる情報が、ユーザシナリオの発動条件を満たすかどうかが判定される（Ｓ７０２）。

　ステップＳ７０２の判定処理で、発動条件を満たすと判定された場合、処理は、ステップＳ７０３に進められる。そして、情報処理システム１では、コンテンツ要素を提示可能な機器が探索され（Ｓ７０３）、その探索結果に応じて少なくとも１つ以上の機器が制御される（Ｓ７０４）。

　これにより、制御対象の１以上の機器から、発動条件を満たすコンテキスト情報に対応したコンテンツ要素が提示される（Ｓ７０５）。

　また、このコンテンツ要素の提示に際しては、ユーザが装着したヘッドホン（当該ユーザの耳に装着された電気音響変換機器）から、コンテンツ要素のうちのエージェントの音声を出力する（Ｓ７１１）とともに、ディスプレイに当該エージェントの外観を表示する（Ｓ７１２）ことができる。

　このように、１又は複数の機器で、１又は複数の出力モーダルによって、コンテンツ要素を提示することができる。

　以上、第７の実施の形態を説明した。

＜８．第８の実施の形態＞

　ユーザが現在利用しているシナリオ（ユーザシナリオ）や「コンテンツ要素－コンテキスト情報」のデータセットの内容を外部のサービス提供者に共有することにより、シナリオを構成するコンテンツやコンテキストを利用したサービスを協調して提供することができる。

　その一例として、ここでは、飲食店とのコンテンツ要素の共有によるサービス協調の例を挙げる。

　あるアニメのコンテンツ要素とコンテキスト情報から構成されるシナリオを利用しているユーザが、現在そのシナリオを利用中である場合、飲食店にはシナリオの内容と利用中であるという情報が提供される。

　この飲食店では、アニメに関連するオムライス等のメニューがあらかじめ準備されており、シナリオを利用中のユーザが飲食店の中で開く電子メニューに対してそのメニューが表示されるといった場面が想定される。

　また、他の例として、英会話塾とのコンテキスト共有によるサービスの例を挙げる。

　これまでの例のように、英会話塾の保有する英会話スキットの音声データをコンテンツ要素とし、その会話がなされる状況をコンテキストとして設定したシナリオを作成してユーザへ提供することもできる。

　さらにここでは、上記のアニメの「コンテンツ要素－コンテキスト情報」のデータセットを利用する際にユーザが設定したコンテキスト情報のみを共有し、そのコンテキストに応じた英会話スキットを提供することで、より低コストでのサービス提供が可能となる。さらに、そのスキットの読み上げをアニメのキャラクタで行うなど、相互にユーザの接点を広げるかたちでのサービス設計を行うことができる。

　同様にして、音楽ストリーミング配信サービスと、飲食店や英会話塾等との連携も設定することができる。

　上述したように、配信されている楽曲やその一部をコンテンツ要素としたシナリオを利用中のユーザが飲食店に入ると、その世界観に合致したドリンクが提供される。また、歌詞を含まない楽曲のコンテキストにあった英会話のスキットを同時に提供する。さらに、楽曲と英会話を組み合わせたシナリオを新たに作成して提供したり、楽曲間の説明や新曲の紹介などをユーザが利用しているアニメのキャラクタで行ったりすることもできる。

　また、他のサービスが作成したシナリオで設定されたユーザの日常生活空間におけるコンテキスト情報の分布状況を取得し、コンテキストに応じた音楽をコンテンツ要素として自動的に提供してもよい。

　この機能により、ユーザは自己の設定したコンテキスト情報を持つ場所において、例えば日替わりでそのコンテキストに適合した楽曲又は楽曲の一部の提供を受けることができるため、毎日同じ曲を聴いて飽きるという状況を避けることができる。

　さらに、ユーザからの「いいね」などのフィードバックを得ることで、コンテキスト情報とコンテンツ要素の適合度についての情報を恒常的に取得して機械学習を行うことで、精度を向上することができる。

（処理の全体像）
　次に、図４８を参照して、第８の実施の形態における情報処理の全体像を説明する。

　図４８に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）及び再生機器３０（の制御部３００）とともに、外部のサービスにより提供されるサーバ等が少なくとも連携することで実現される。

　図４８に示すように、情報処理システム１では、複数のメディアからなるコンテンツから、少なくとも１つ以上のコンテンツ要素が抽出され（Ｓ８０１）、各コンテンツ要素にコンテキスト情報が付与され、コンテンツ要素－コンテキスト情報ＤＢ１５１に蓄積される（Ｓ８０２）。

　そして、１以上の「コンテンツ要素－コンテキスト情報」のデータセットは、シナリオとしてシナリオＤＢ１５２に蓄積される（Ｓ８０３）。また、ユーザシナリオが生成された場合には、ユーザシナリオＤＢ１５３に蓄積される（Ｓ８０４）。

　このようにして蓄積された「コンテンツ要素－コンテキスト情報」のデータセット、シナリオ、又はユーザシナリオは、外部のサービスに提供可能である（Ｓ８０５）。これにより、音楽ストリーミング配信サービス等の外部のサービスの事業者は、自己の提供するサービスを、シナリオやユーザシナリオ等にマッチしたものに制御可能となる（Ｓ８１１）。

　また、情報処理システム１では、リアルタイムのセンシングによるセンサデータが取得され（Ｓ８２１）、このセンサデータから得られる情報が、ユーザシナリオの発動条件を満たすかどうかが判定される（Ｓ８２２）。

　ステップＳ８２２の判定処理で、発動条件を満たすと判定された場合、発動条件を満たすコンテキスト情報に対応したコンテンツ要素が提示される（Ｓ８２３）。

　このとき、シナリオやユーザシナリオ等を外部のサービスに提供している場合、当該シナリオやユーザシナリオ等に対応付けられたコンテンツ要素に適したサービス要素が選択され（Ｓ８３１）、当該サービス要素がコンテンツ要素と同時に提示される（Ｓ８３２）。

　例えば、音楽ストリーミング配信サービスでは、ユーザシナリオに対応付けられるコンテンツ要素（楽曲）に対応する音声キャラクタを選択し（Ｓ８４１）、当該サービスで楽曲を紹介するＤＪとして紹介情報を提示する（Ｓ８４２）ことができる。

　以上、第８の実施の形態を説明した。

＜９．第９の実施の形態＞

　ユーザが作成したシナリオ（ユーザシナリオ）は、共有手段を用いてユーザ間で共有することができる。

　ここでは、共有手段としてソーシャルネットワーキングサービス（SNS）等のソーシャルメディアを利用し、ユーザが作成したシナリオ（ユーザシナリオ）を、例えばSNSアカウントごとに公開して、コンテンツ要素の類似度や、コンテキストの類似度、発動条件設定の類似度などに応じて検索・分類が可能である。

　ここで、発動条件の設定の類似度に関しては、共有手段として地図アプリケーションを利用し、ユーザの現在位置を発動条件として含むシナリオを特定して提示することでユーザが新しいシナリオを発見できるようにしてもよい。

　シナリオのコンテンツ要素のもととなる作品や作者の情報、コンテンツ要素の抽出やコンテキストを付与した作者の情報、発動条件を設定したユーザの情報をシナリオと紐づけて得ることができ、シナリオを入手したユーザは、好みの作者やユーザをフォローすることができる。

（処理の全体像）
　次に、図４９を参照して、第９の実施の形態における情報処理の全体像を説明する。

　図４９に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）及び再生機器３０（の制御部３００）とともに、ソーシャルメディアにより提供されるサーバ等が少なくとも連携することで実現される。

　図４９に示すように、情報処理システム１では、複数のメディアからなるコンテンツから、少なくとも１つ以上のコンテンツ要素が抽出され（Ｓ９０１）、各コンテンツ要素にコンテキスト情報が付与される（Ｓ９０２）。

　そして、１以上の「コンテンツ要素－コンテキスト情報」のデータセットは、シナリオとしてシナリオＤＢ１５２に蓄積される（Ｓ９０３）。また、ユーザシナリオが生成された場合には、ユーザシナリオＤＢ１５３に蓄積される（Ｓ９０４）。

　このようにして蓄積されたシナリオやユーザシナリオは、インターネット４０上のソーシャルメディアのサーバへアップロード可能である（Ｓ９０５）。これにより、他のユーザは、ソーシャルメディアで公開されたシナリオやユーザシナリオを閲覧可能である（Ｓ９０６）。なお、ユーザは、入手したシナリオに関して好みの作者やユーザ等をフォローすることができる。

　ステップＳ９１１乃至Ｓ９１３においては、リアルタイムのセンシングによるセンサデータが、ユーザシナリオの発動条件を満たす場合に、当該発動条件を満たすコンテキスト情報に対応したコンテンツ要素が提示される。

　以上、第９の実施の形態を説明した。

＜１０．第１０の実施の形態＞

　上述した実施の形態では、主に音声データと映像データを中心に説明したが、コンテンツ要素を構成するデータは音声や映像に限られるものではなく、例えば、ARグラスなどを用いて動画を再生したり、振動デバイスを持つ靴を利用して地面の触覚を提示したりするなど、画像や触覚、匂い、など、提示可能な機器を有するフォーマット及びデータを含むものとする。

（処理の全体像）
　次に、図５０を参照して、第１０の実施の形態における情報処理の全体像を説明する。

　図５０に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）により実行される。

　図５０に示すように、情報処理システム１では、複数のメディアからなるコンテンツから、少なくとも１つ以上のコンテンツ要素が抽出される（Ｓ１００１）が、この複数のメディアとしては、再生機器３０により提示可能な触覚データ及び匂いデータの少なくとも一方のデータを含めることができる。

　以上、第１０の実施の形態を説明した。

＜１１．第１１の実施の形態＞

　ところで、提示されたコンテンツ要素がユーザに適合しない場合も想定されるため、ユーザからのフィードバックに応じてユーザシナリオを別のものに切り替える制御を行ってもよい。これにより、ユーザは、確実に、自己に適合したコンテンツ要素の提示を受けることができる。

（処理の全体像）
　図５１を参照して、第１１の実施の形態における情報処理の全体像を説明する。

　図５１に示した情報処理は、情報処理システム１におけるデータ管理サーバ１０（の制御部１００）と再生機器３０（の制御部３００）が少なくとも連携することで実現される。

　図５１に示すように、情報処理システム１では、複数のメディアからなるコンテンツから、少なくとも１つ以上のコンテンツ要素が抽出され（Ｓ１１０１）、各コンテンツ要素にコンテキスト情報が付与される（Ｓ１１０２）。

　１以上の「コンテンツ要素－コンテキスト情報」のデータセットは、シナリオとしてシナリオＤＢ１５２に蓄積される。そして、シナリオＤＢ１５２に蓄積されたシナリオに対し、発動条件が設定されることで、ユーザシナリオが生成される（Ｓ１１０３）。

　また、情報処理システム１では、リアルタイムのセンシングによるセンサデータが取得され（Ｓ１１０４）、このセンサデータから得られる情報が、ユーザシナリオの発動条件を満たすかどうかが判定される（Ｓ１１０５）。

　ステップＳＳ１１０５の判定処理で、発動条件を満たすと判定された場合、発動条件を満たすコンテキスト情報に対応したコンテンツ要素が提示される（Ｓ１１０６）。

　その後、ユーザからのフィードバックが入力された場合（Ｓ１１０７）、当該フィードバックに応じてユーザシナリオを変更する（Ｓ１１０８）。これにより、ユーザシナリオを別のものに切り替えた状態で、上述したステップＳ１１０４乃至Ｓ１１０６が繰り返され、よりユーザに適合したコンテンツ要素を提示することができる。

　また、ユーザから入力されたフィードバックを分析することで、コンテンツ要素に対するユーザの嗜好を推定し（Ｓ１１１１）、当該ユーザの嗜好に応じてユーザシナリオを推薦する（Ｓ１１２１）。これにより、推薦されたユーザシナリオに切り替えた状態で、上述したステップＳ１１０４乃至Ｓ１１０６が繰り返され、よりユーザの嗜好に適したコンテンツ要素（例えば好みの音声キャラクタ）を提示することができる。

　なお、ここでは、ユーザシナリオを推薦する代わりに、コンテンツ要素自体を推薦して、推薦されたコンテンツ要素が提示されるようにしてもよい。

　以上、第１１の実施の形態を説明した。

＜１２．変形例＞

　上述した説明では、情報処理システム１が、データ管理サーバ１０、編集機器２０、及び再生機器３０－１乃至３０－Ｎから構成される場合を説明したが、例えば、他の機器を追加するなど、他の構成を用いてもよい。

　具体的には、１つの情報処理装置としてのデータ管理サーバ１０を、専用のデータベースサーバと、シナリオやコンテンツ要素等の配信用の配信サーバなどに分けて、複数の情報処理装置として構成してもよい。同様に、編集機器２０又は再生機器３０についても、１つの情報処理装置として構成されるだけでなく、複数の情報処理装置として構成されてもよい。

　また、情報処理システム１において、データ管理サーバ１０、編集機器２０、及び再生機器３０の各装置を構成する構成要素（制御部）が、どの装置に含まれるかは任意である。例えば、エッジコンピューティングの技術を用いて、上述したデータ管理サーバ１０による情報処理の一部の処理を、再生機器３０が実行したり、再生機器３０に近いネットワーク（ネットワークの周縁部）に接続されたエッジサーバが実行したりしてもよい。

　すなわち、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、各構成要素の通信形態も任意である。換言すれば、各構成要素は、インターネット４０を介して接続されてもよく、ローカルネット（LAN(Local Area Network)又はWAN(Wide Area Network)）を介して接続されてもよい。さらに、各構成要素は、有線で接続されてもよく、無線で接続されてもよい。

　なお、従来の技術では、主に、ユーザによる情報検索作業や機器操作を自動化することで利用の簡便性を実現することを目的としている。この種の自動化は、システムが定義したコンテキスト分類と、ユーザの行動や状態のセンシングにより類推されるコンテキストとが一致するかどうかを判定するのが一般的である。

　このようなシステムは、下記の（ａ）乃至（ｄ）に示すような要素で構成されており、ユーザの行動、操作、身体状態のセンシングの結果から、システムが定義したコンテキストを特定することを特徴としている。

（ａ）ユーザの行動のセンシングデータからコンテキストを直接分析・認識する
（ｂ）ユーザのアクセスしたコンテンツを認識し、当該コンテンツの属性データや内容の分析からコンテキストを認識する
（ｃ）コンテキストとコンテンツの組み合わせのデータベースを持つ
（ｄ）センシングデータとコンテキストを関連づけるデータベースを前提とする

　しかしながら、従来の技術であると、ユーザの行動目的がサービス内で固定されており、作業や操作が一定のルールに基づいている場合には、ユーザのコンテキストをシステム側で定義できるため、ユーザもシステムが定義したコンテキストに同意し易くなる。

　一方で、コンテンツを、ユーザの日常生活へ適応的に分散して連携させながら提示する場合には、ユーザのコンテキストは多岐にわたり、かつ、それぞれ固有の環境が動的に変化するため、システム側で定義したコンテキストをユーザが受容することが困難になる。

　ここで、ユーザが感じるコンテキストへの一致感は、主観的かつ発展的なものであり、これをシステム側で定義したコンテキスト定義に関する事後データの客観的かつ統計的な処理で、予測して適合させることは極めて困難である。仮に、それを可能にするには、膨大なデータの蓄積が必要であり、サービス開始前の投資は非現実的な規模となる。

　また、従来の技術で提示されるコンテンツは、従来のサービスで用いられてきた提供フォーマットを変化させることなく、ユーザに提示される。例えば、コンテキストを認識して選定され、提供されるデータや楽曲は、サービスに対して配信される形態を変化させることなく、そのままの形態でユーザに提示される。

　しかしながら、ユーザの日常生活への提示に際しては、上述した提供フォーマットが、従来の視聴行動を前提に設計されているため、日常生活の自由で多様なユーザ行動を阻害する要因になり得る。例えば、映画や音楽等のコンテンツは、観客として画面やスピーカの前に座って視聴することが要求されるフォーマットであり、従来の視聴行動を前提に設計してしまうと、ユーザ行動を阻害する恐れがある。

　さらに、従来の機器では、やはり従来の視聴行動を前提に設計されているため、個別の機器が個別のサービスを提供するように最適化されており、これらの従来の機器が、一部の機能を融通し合いながら連携してユーザの日常行動に適応する仕組みを持たないことが多いのが現状である。

　例えば、スマートフォン等の携帯機器は、携帯性を追求することにより、ユーザの日常行動に携帯性をもって適応させているが、画面を中心とした視聴行動の前提は従来のままである。そのため、例えば、一般道や公共施設における歩行に関しては、視覚と聴覚を奪う特性から、いわゆる「スマホ歩き」として危険とされている。

　なお、上述した特許文献１には、ユーザが視認しているランドマークを推定し、その情報を用いてユーザの進行方向を示すナビサービスを提供する装置が開示されているが、本技術のような、コンテキストに対して、ユーザごとの発動条件を設定可能な点については、開示も示唆もされていない。

　また、特許文献２には、コンテンツアイテムから、コンテキスト情報とコンテンツ情報を抽出してインデックス生成し、ユーザのコンテキストと、ユーザのクエリの内容に基づき、応答して推奨を生成するシステムが開示されている。しかしながら、特許文献２で、コンテキスト情報としては、検索、最近アクセスされた文書や、動作中のアプリケーション、アクティビティの時間であり、ユーザの物理的位置は含まれていない（段落［００１１］参照）。

　さらに、特許文献３には、コンテンツに複数のオブジェクト（音声含む）として複数の人物の顔が含まれるとき、コンテキスト情報として定義されている２人だけの顔を規定サイズまで拡大する、という編集を自動的に行う処理装置が開示されているが、本技術のような、コンテンツに基づき、コンテキストと音声を対応付けて記録してそれを再利用することについては、開示も示唆もされていない。

　また、特許文献４には、コンテンツの放送予定、放送履歴情報に基づき、コンテンツの視聴に適する視聴者のコンテキスト（時間帯、曜日等）と、コンテンツの特徴量との対応関係を予め学習して、「コンテキスト－コンテンツの特徴量」の対応表を生成しておくことにより、新たなコンテンツに対して、その視聴に適するコンテキストを示す情報を生成し、メタデータとして付与することが開示されている。しかしながら、特許文献４には、既存のコンテンツから、コンテンツを切り出すことについては開示されていない。

　さらに、特許文献５には、ユーザの状態を示すセンシングデータ（動作、音声、心拍、感情等）から抽出されるコンテキスト情報と、そのときにユーザが視聴している映像が全て記録されており、現在のユーザの状態を示すコンテキスト情報を用いて、ユーザの状態に応じたコンテンツを抽出し、「ユーザがサッカー中継をしている際に興奮して腕を突き上げた」ことを示すコンテキスト情報を生成すると、サッカー、興奮などのキーワードや、心拍数、腕の動作に応じて、過去に記録したコンテンツを抽出して、ユーザに提供することができる。しかしながら、特許文献５には、既存のコンテンツから、コンテンツとコンテキストを抜き出すことについては開示されていない。

　このように、特許文献１乃至５に開示されている技術を用いても、コンテキストの情報を利用してサービスを提供するに際して、良いユーザ体験を提供できるとは言い難く、より良いユーザ体験を提供することが求められていた。

　そこで、本技術では、コンテキストの情報を利用してサービスを提供するに際し、１つのシナリオを、別々の場所に住むユーザが、それぞれ利用することができるようにして、より良いユーザ体験を提供することができるようにしている。

＜１３．コンピュータの構成＞

　上述した一連の処理（図６に示した第１の実施の形態における情報処理等の各実施の形態における情報処理）は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、各装置のコンピュータにインストールされる。図５２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　コンピュータにおいて、CPU(Central Processing Unit)１００１、ROM(Read Only Memory)１００２、RAM(Random Access Memory)１００３は、バス１００４により相互に接続されている。バス１００４には、さらに、入出力インターフェース１００５が接続されている。入出力インターフェース１００５には、入力部１００６、出力部１００７、記録部１００８、通信部１００９、及び、ドライブ１０１０が接続されている。

　入力部１００６は、マイクロフォン、キーボード、マウスなどよりなる。出力部１００７は、スピーカ、ディスプレイなどよりなる。記録部１００８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１００９は、ネットワークインターフェースなどよりなる。ドライブ１０１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体１０１１を駆動する。

　以上のように構成されるコンピュータでは、CPU１００１が、ROM１００２や記録部１００８に記録されているプログラムを、入出力インターフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体１０１１をドライブ１０１０に装着することにより、入出力インターフェース１００５を介して、記録部１００８にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部１００９で受信し、記録部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記録部１００８に、あらかじめインストールしておくことができる。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。

　なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　また、各実施の形態における情報処理の各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本技術は、以下のような構成をとることができる。

（１）
　コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、
　ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、
　ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する
　制御部を備える
　情報処理システム。
（２）
　前記制御部は、
　　複数のメディアからなるコンテンツから、
　　少なくとも一部のメディアからなるコンテンツ要素を抽出し、
　　前記コンテンツに基づいて、前記コンテンツ要素に対応するコンテキスト情報を生成し、
　　前記コンテンツ要素と前記コンテキスト情報とを対応付けて蓄積した対応データベースを生成する
　前記（１）に記載の情報処理システム。
（３）
　前記制御部は、前記コンテンツ要素と前記コンテキスト情報からなるデータセットを、一定のテーマに基づいてパッケージ化して蓄積したシナリオデータベースを生成する
　前記（２）に記載の情報処理システム。
（４）
　前記コンテンツ要素は、ストリーミング配信コンテンツの一部であり、
　前記コンテキスト情報に対応付けて、そのコンテンツのIDと再生範囲を示す情報が蓄積されている
　前記（２）に記載の情報処理システム。
（５）
　前記制御部は、前記コンテンツ要素を再生する前に、前記コンテキスト情報に対応する特定の音声キャラクタを含む他のコンテンツ要素を提示する
　前記（４）に記載の情報処理システム。
（６）
　前記制御部は、前記対応データベースに蓄積されるコンテンツ要素と前記コンテキスト情報との関係を機械学習することにより、新たなコンテンツ要素に対してコンテンツ情報を付与する
　前記（２）乃至（５）のいずれかに記載の情報処理システム。
（７）
　前記制御部は、
　　地図情報とともに、前記コンテンツ要素と前記コンテキスト情報のデータセットからなるシナリオを提示し、
　　前記コンテキスト情報に対応する発動条件のデフォルト値として、シナリオを作成する制作者が地図上に所定領域を設定可能なインターフェースを提示する
　前記（３）に記載の情報処理システム。
（８）
　前記制御部は、
　　第１のメディアからなるコンテンツから、
　　前記第１のメディアとは異なる第２のメディアを生成してコンテンツ要素とし、
　　前記コンテンツに基づいて、前記コンテンツ要素に対応するコンテキスト情報を生成し、
　　前記コンテンツ要素と前記コンテキスト情報とを対応付けて蓄積した対応データベースを生成する
　前記（１）乃至（７）のいずれかに記載の情報処理システム。
（９）
　前記第１のメディアは、テキストを含み、
　前記第２のメディアは、TTS(Text To Speech)音声を含む
　前記（８）に記載の情報処理システム。
（１０）
　前記制御部は、
　　前記第１のメディアと前記第２のメディアとの関係をあらかじめ機械学習しておき、
　　当該機械学習の結果に基づいて、前記第１のメディアから、前記第２のメディアを生成する
　前記（８）又は（９）に記載の情報処理システム。
（１１）
　前記制御部は、
　　前記コンテキスト情報に対して、
　　現在、ユーザをセンシングすることで得られるセンサデータに応じた発動条件を設定可能であり、複数の、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオデータベースを生成する
　前記（１）乃至（１０）のいずれかに記載の情報処理システム。
（１２）
　前記制御部は、撮像された画像データに応じた発動条件を設定する
　前記（１１）に記載の情報処理システム。
（１３）
　前記制御部は、ユーザの特性操作に応じて、そのときのセンサデータに応じた発動条件を設定する
　前記（１１）に記載の情報処理システム。
（１４）
　前記制御部は、
　　前記コンテキスト情報と前記発動条件との関係を機械学習し、
　　当該機械学習の結果に応じた情報を出力する
　前記（１１）乃至（１３）のいずれかに記載の情報処理システム。
（１５）
　前記制御部は、前記機械学習の結果に応じて、特定の発動条件に対して、コンテキスト情報を生成する
　前記（１４）に記載の情報処理システム。
（１６）
　前記制御部は、前記機械学習の結果に応じて、特定のコンテキスト情報に対して、ユーザに対応した発動条件を設定する
　前記（１４）に記載の情報処理システム。
（１７）
　前記センシングでは、前記センサデータとして、時間的若しくは空間的な発動条件、又はユーザの行動に応じた発動条件を設定可能なデータを取得する
　前記（１１）乃至（１６）のいずれかに記載の情報処理システム。
（１８）
　前記制御部は、
　　地図情報とともに、あらかじめ対応付けられている前記コンテンツ要素と前記コンテキスト情報のデータセットからなるシナリオを提示し、
　　前記コンテキスト情報に対応する発動条件として、ユーザが地図上に所定領域を設定可能なインターフェースを提示する
　前記（１）、及び（１１）乃至（１７）のいずれかに記載の情報処理システム。
（１９）
　前記制御部は、同一の発動条件が、複数のコンテキスト情報に設定されているとき、所定のルールに従って、当該複数のコンテキスト情報に対応する複数のコンテンツ要素を、ユーザに提示する
　前記（１）乃至（１８）のいずれかに記載の情報処理システム。
（２０）
　前記制御部は、前記センサデータにより推定されるユーザの向きに応じて、前記複数のコンテンツ要素から、一のコンテンツ要素を特定し、ユーザに提示する
　前記（１９）に記載の情報処理システム。
（２１）
　前記制御部は、
　　前記センサデータにより推定されるユーザの向きが第１の向きとなるとき、第１のキャラクタに対応するコンテンツ要素を特定して、ユーザに提示し、
　　ユーザの向きが第２の向きとなるとき、第２のキャラクタに対応するコンテンツ要素を特定して、ユーザに提示する
　前記（２０）に記載の情報処理システム。
（２２）
　前記制御部は、前記第１のキャラクタ又は前記第２のキャラクタの位置に応じてその場所に紐付けられた情報を提供する
　前記（２１）に記載の情報処理システム。
（２３）
　前記制御部は、
　　前記センサデータが前記発動条件を満たしたとき、ユーザの現在位置周辺に、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素を提示可能な機器を探索し、
　　前記コンテンツ要素がユーザに提示されるように、当該機器を制御する
　前記（１）乃至（２２）のいずれかに記載の情報処理システム。
（２４）
　前記制御部は、
　　前記コンテンツ要素に含まれるエージェントの音声が、ユーザに提示されるように、当該ユーザの耳に装着された電気音響変換機器を制御するとともに、
　　前記コンテンツ要素に含まれるエージェントの外観が、ユーザに提示されるように、当該ユーザの周辺に配置されるディスプレイを制御する
　前記（２３）に記載の情報処理システム。
（２５）
　前記制御部は、通信部を介して、特定のユーザシナリオをサービス提供者に提供する
　前記（１）乃至（２４）のいずれかに記載の情報処理システム。
（２６）
　前記制御部は、通信部を介して、前記特定のユーザシナリオを音楽ストリーミング配信サービス業者に提供することにより、当該ユーザシナリオに対応付けられるコンテンツ要素に対応する音声キャラクタを、音楽ストリーミング配信サービスにおいて楽曲を紹介するディスクジョッキー（ＤＪ）として設定する
　前記（２５）に記載の情報処理システム。
（２７）
　前記制御部は、通信部を介して、前記ユーザシナリオを、ソーシャルメディアにアップロードし、他のユーザと共有可能にする
　前記（１）乃至（２４）のいずれかに記載の情報処理システム。
（２８）
　前記コンテンツ要素は、機器により提示可能な触覚データ及び匂いデータの少なくとも一方のデータを含む
　前記（１）乃至（２７）のいずれかに記載の情報処理システム。
（２９）
　前記制御部は、前記コンテンツ要素が提示されたユーザからのフィードバックに応じて、前記ユーザシナリオを、別のユーザシナリオに切り替える
　前記（１）乃至（２８）のいずれかに記載の情報処理システム。
（３０）
　前記制御部は、前記フィードバックを分析することにより、前記コンテンツ要素に対するユーザの嗜好を推定する
　前記（２９）に記載の情報処理システム。
（３１）
　前記制御部は、前記ユーザの嗜好に応じて、前記コンテンツ要素又は前記ユーザシナリオを推薦する
　前記（３０）に記載の情報処理システム。
（３２）
　情報処理装置が、
　コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、
　ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、
　ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する
　情報処理方法。
（３３）
　コンピュータを、
　コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、
　ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、
　ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する制御部として
　機能させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体。

　１　情報処理システム，　１０　データ管理サーバ，　２０　編集機器，　３０，３０－１乃至３０－Ｎ　再生機器，　４０　インターネット，　１００　制御部，　１０１　入力部，　１０２　出力部，　１０３　記憶部，　１０４　通信部，　１１１　データ管理部，　１１２　データ処理部，　１１３　通信制御部，　１３１　提示キャラクタ選択部，　１３２　シナリオ処理部，　１３３　応答生成部，　１５１　コンテンツ要素－コンテキスト情報ＤＢ，　１５２　シナリオＤＢ，　１５３　ユーザシナリオＤＢ，　１６１　キャラクタ配置ＤＢ，　１６２　位置依存情報ＤＢ，　１６３　シナリオＤＢ，　２００　制御部，　２０１　入力部，　２０２　出力部，　２０３　記憶部，　２０４　通信部，　２１１　編集処理部，　２１２　提示制御部，　２１３　通信制御部，　２２１　マウス，　２２２　キーボード，　２３１　ディスプレイ，　２３２　スピーカ，　３００　制御部，　３０１　入力部，　３０２　出力部，　３０３　記憶部，　３０４　通信部，　３０５　センサ部，　３０６　カメラ部，　３０７　出力端子，　３０８　電源部，　３１１　再生処理部，　３１２　提示制御部，　３１３　通信制御部，　３２１　ボタン，　３２２　タッチパネル，　３３１　ディスプレイ，　３３２　スピーカ，　３４１　ユーザ位置検出部，　３４２　ユーザ方向検出部，　３４３　音声認識意図理解部，　３４４　コンテンツ再生部，　１００１　CPU

Claims

　コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、
　ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、
　ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する
　制御部を備える
　情報処理システム。
　前記制御部は、
　　複数のメディアからなるコンテンツから、
　　少なくとも一部のメディアからなるコンテンツ要素を抽出し、
　　前記コンテンツに基づいて、前記コンテンツ要素に対応するコンテキスト情報を生成し、
　　前記コンテンツ要素と前記コンテキスト情報とを対応付けて蓄積した対応データベースを生成する
　請求項１に記載の情報処理システム。
　前記制御部は、前記コンテンツ要素と前記コンテキスト情報からなるデータセットを、一定のテーマに基づいてパッケージ化して蓄積したシナリオデータベースを生成する
　請求項２に記載の情報処理システム。
　前記コンテンツ要素は、ストリーミング配信コンテンツの一部であり、
　前記コンテキスト情報に対応付けて、そのコンテンツのIDと再生範囲を示す情報が蓄積されている
　請求項２に記載の情報処理システム。
　前記制御部は、前記コンテンツ要素を再生する前に、前記コンテキスト情報に対応する特定の音声キャラクタを含む他のコンテンツ要素を提示する
　請求項４に記載の情報処理システム。
　前記制御部は、前記対応データベースに蓄積されるコンテンツ要素と前記コンテキスト情報との関係を機械学習することにより、新たなコンテンツ要素に対してコンテンツ情報を付与する
　請求項２に記載の情報処理システム。
　前記制御部は、
　　地図情報とともに、前記コンテンツ要素と前記コンテキスト情報のデータセットからなるシナリオを提示し、
　　前記コンテキスト情報に対応する発動条件のデフォルト値として、シナリオを作成する制作者が地図上に所定領域を設定可能なインターフェースを提示する
　請求項３に記載の情報処理システム。
　前記制御部は、
　　第１のメディアからなるコンテンツから、
　　前記第１のメディアとは異なる第２のメディアを生成してコンテンツ要素とし、
　　前記コンテンツに基づいて、前記コンテンツ要素に対応するコンテキスト情報を生成し、
　　前記コンテンツ要素と前記コンテキスト情報とを対応付けて蓄積した対応データベースを生成する
　請求項１に記載の情報処理システム。
　前記第１のメディアは、テキストを含み、
　前記第２のメディアは、TTS(Text To Speech)音声を含む
　請求項８に記載の情報処理システム。
　前記制御部は、
　　前記第１のメディアと前記第２のメディアとの関係をあらかじめ機械学習しておき、
　　当該機械学習の結果に基づいて、前記第１のメディアから、前記第２のメディアを生成する
　請求項８に記載の情報処理システム。
　前記制御部は、
　　前記コンテキスト情報に対して、
　　現在、ユーザをセンシングすることで得られるセンサデータに応じた発動条件を設定可能であり、複数の、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオデータベースを生成する
　請求項１に記載の情報処理システム。
　前記制御部は、撮像された画像データに応じた発動条件を設定する
　請求項１１に記載の情報処理システム。
　前記制御部は、ユーザの特性操作に応じて、そのときのセンサデータに応じた発動条件を設定する
　請求項１１に記載の情報処理システム。
　前記制御部は、
　　前記コンテキスト情報と前記発動条件との関係を機械学習し、
　　当該機械学習の結果に応じた情報を出力する
　請求項１１に記載の情報処理システム。
　前記制御部は、前記機械学習の結果に応じて、特定の発動条件に対して、コンテキスト情報を生成する
　請求項１４に記載の情報処理システム。
　前記制御部は、前記機械学習の結果に応じて、特定のコンテキスト情報に対して、ユーザに対応した発動条件を設定する
　請求項１４に記載の情報処理システム。
　前記センシングでは、前記センサデータとして、時間的若しくは空間的な発動条件、又はユーザの行動に応じた発動条件を設定可能なデータを取得する
　請求項１１に記載の情報処理システム。
　前記制御部は、
　　地図情報とともに、あらかじめ対応付けられている前記コンテンツ要素と前記コンテキスト情報のデータセットからなるシナリオを提示し、
　　前記コンテキスト情報に対応する発動条件として、ユーザが地図上に所定領域を設定可能なインターフェースを提示する
　請求項１に記載の情報処理システム。
　前記制御部は、同一の発動条件が、複数のコンテキスト情報に設定されているとき、所定のルールに従って、当該複数のコンテキスト情報に対応する複数のコンテンツ要素を、ユーザに提示する
　請求項１に記載の情報処理システム。
　前記制御部は、前記センサデータにより推定されるユーザの向きに応じて、前記複数のコンテンツ要素から、一のコンテンツ要素を特定し、ユーザに提示する
　請求項１９に記載の情報処理システム。
　前記制御部は、
　　前記センサデータにより推定されるユーザの向きが第１の向きとなるとき、第１のキャラクタに対応するコンテンツ要素を特定して、ユーザに提示し、
　　ユーザの向きが第２の向きとなるとき、第２のキャラクタに対応するコンテンツ要素を特定して、ユーザに提示する
　請求項２０に記載の情報処理システム。
　前記制御部は、前記第１のキャラクタ又は前記第２のキャラクタの位置に応じてその場所に紐付けられた情報を提供する
　請求項２１に記載の情報処理システム。
　前記制御部は、
　　前記センサデータが前記発動条件を満たしたとき、ユーザの現在位置周辺に、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素を提示可能な機器を探索し、
　　前記コンテンツ要素がユーザに提示されるように、当該機器を制御する
　請求項１に記載の情報処理システム。
　前記制御部は、
　　前記コンテンツ要素に含まれるエージェントの音声が、ユーザに提示されるように、当該ユーザの耳に装着された電気音響変換機器を制御するとともに、
　　前記コンテンツ要素に含まれるエージェントの外観が、ユーザに提示されるように、当該ユーザの周辺に配置されるディスプレイを制御する
　請求項２３に記載の情報処理システム。
　前記制御部は、通信部を介して、特定のユーザシナリオをサービス提供者に提供する
　請求項１に記載の情報処理システム。
　前記制御部は、通信部を介して、前記特定のユーザシナリオを音楽ストリーミング配信サービス業者に提供することにより、当該ユーザシナリオに対応付けられるコンテンツ要素に対応する音声キャラクタを、音楽ストリーミング配信サービスにおいて楽曲を紹介するディスクジョッキー（ＤＪ）として設定する
　請求項２５に記載の情報処理システム。
　前記制御部は、通信部を介して、前記ユーザシナリオを、ソーシャルメディアにアップロードし、他のユーザと共有可能にする
　請求項１に記載の情報処理システム。
　前記コンテンツ要素は、機器により提示可能な触覚データ及び匂いデータの少なくとも一方のデータを含む
　請求項１に記載の情報処理システム。
　前記制御部は、前記コンテンツ要素が提示されたユーザからのフィードバックに応じて、前記ユーザシナリオを、別のユーザシナリオに切り替える
　請求項１に記載の情報処理システム。
　前記制御部は、前記フィードバックを分析することにより、前記コンテンツ要素に対するユーザの嗜好を推定する
　請求項２９に記載の情報処理システム。
　前記制御部は、前記ユーザの嗜好に応じて、前記コンテンツ要素又は前記ユーザシナリオを推薦する
　請求項３０に記載の情報処理システム。
　情報処理装置が、
　コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、
　ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、
　ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する
　情報処理方法。
　コンピュータを、
　コンテンツ要素にコンテキスト情報があらかじめ対応付けられ、
　ユーザごとに、少なくとも当該コンテキスト情報に対して発動条件を設定可能で、前記コンテキスト情報と前記発動条件のデータセットからなるユーザシナリオを生成可能であり、
　ユーザをリアルタイムでセンシングすることで得られたセンサデータが、前記ユーザシナリオに設定される発動条件を満たしたとき、当該発動条件に応じたコンテキスト情報に対応付けられたコンテンツ要素がユーザに提示されるように制御する制御部として
　機能させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体。