WO2024080107A1

WO2024080107A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2024080107A1
Application number: PCT/JP2023/034646
Authority: WO
Inventors: 真山田; 隆木下
Original assignee: ソニーグループ株式会社
Priority date: 2022-10-13
Filing date: 2023-09-25
Publication date: 2024-04-18

Abstract

本開示は、より少ない手間で、より良いユーザ体験を提供することができるようにする情報処理装置、情報処理方法、及びプログラムに関する。ユーザの行動を示す行動パターンが予め設定され、実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、特定のユーザに応じた行動パターンを設定し、設定された行動パターンに応じて、複数のコンテンツの中から特定の場所に関連付けられた特定のコンテンツを設定する制御部を備える情報処理装置が提供される。本開示は、例えば、空間コンテンツを提供するサービスで用いられる機器に適用することができる。

Description

情報処理装置、情報処理方法、及びプログラム

　本開示は、情報処理装置、情報処理方法、及びプログラムに関し、特に、より少ない手間で、より良いユーザ体験を提供することができるようにした情報処理装置、情報処理方法、及びプログラムに関する。

　屋外と屋内のいずれの場所においても、それらの様々な場所で、ユーザが自身の多様な行動と合致した音楽を楽しめることは、日常生活において重要な体験である。ユーザの行動に応じた音楽を推薦する技術としては、例えば、特許文献１乃至３に開示された技術がある。

　特許文献１には、ユーザの行動情報に基づいて音楽コンテンツを推薦する技術が開示されている。特許文献２には、サービスプロバイダから取り出されたユーザの行動データから関連付けを確立してレコメンデーションを生成する技術が開示されている。特許文献３には、ユーザの音楽鑑賞上の行動を表す行動情報から、当該ユーザが所望する曲を推測して自動選択し再生する技術が開示されている。

特開2016-048495号公報特表2011-511968号公報特開平11-288420号公報

　特許文献１乃至３に開示された技術では、ユーザの行動に応じて音楽を推薦することはできるものの、特定の場所に音楽コンテンツを配置して、特定のユーザに対しサウンド体験を提供することはできない。

　この種の体験を提供するサービス提供者は、サービスの展開を行うに際して、特定の場所に紐づいたコンテンツを配置するために、特定の場所に対する現地での調査作業やコンテンツの配置作業を行う必要があり、労力や時間がかかることが想定される。そのため、より少ない手間で、より良いユーザ体験を提供することが求められていた。

　本開示はこのような状況に鑑みてなされたものであり、より少ない手間で、より良いユーザ体験を提供することができるようにするものである。

　本開示の一側面の情報処理装置は、ユーザの行動を示す行動パターンが予め設定され、実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する制御部を備える情報処理装置である。

　本開示の一側面の情報処理方法、及びプログラムは、上述した本開示の一側面の情報処理装置に対応する情報処理方法、及びプログラムである。

　本開示の一側面の情報処理装置、情報処理方法、及びプログラムにおいては、ユーザの行動を示す行動パターンが予め設定され、実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンが設定され、設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツが設定される。

　なお、本開示の一側面の情報処理装置は、独立した装置であってもよいし、１つの装置を構成している内部ブロックであってもよい。

本開示を適用したシステムの一実施の形態の構成例を示す図である。図１のサーバのハードウェア構成例を示すブロック図である。図２のサーバにおける制御部の機能的構成例を示すブロック図である。図１のデバイスのハードウェア構成例を示すブロック図である。図４のデバイスにおける制御部の機能的構成例を示すブロック図である。行動パターンのシンボル化を模式的に示した図である。サービス提供者側の処理の流れを説明するフローチャートである。サービス提供者側の処理の流れを説明するフローチャートである。ユーザ側の再生準備処理の流れを説明するフローチャートである。ユーザ側の再生準備処理の流れを説明するフローチャートである。場所設定時におけるUIの第１の例を示す図である。場所設定時におけるUIの第２の例を示す図である。場所設定時におけるUIの第３の例を示す図である。場所意味付け時におけるUIの第１の例を示す図である。場所意味付け時におけるUIの第２の例を示す図である。場所意味付け時におけるUIの第３の例を示す図である。コンテンツ選択時におけるUIの第１の例を示す図である。コンテンツ選択時におけるUIの第２の例を示す図である。コンテンツ選択時におけるUIの第３の例を示す図である。コンテンツ配置時におけるUIの第１の例を示す図である。コンテンツ配置時におけるUIの第２の例を示す図である。コンテンツ配置時におけるUIの第３の例を示す図である。ユーザ側の再生処理の流れを説明するフローチャートである。図４のデバイスにおける制御部の機能的構成の他の例を示す図である。ユーザ側の調整処理の流れを説明するフローチャートである。設定内容調整時におけるUIの第１の例を示す図である。設定内容調整時におけるUIの第２の例を示す図である。設定内容調整時におけるUIの第３の例を示す図である。図４のデバイスにおける制御部の機能的構成のさらに他の例を示す図である。

＜システム構成＞
　図１は、本開示を適用したシステムの一実施の形態の構成例を示す図である。システムとは、複数の装置が論理的に集合したものをいう。

　図１において、システム１は、空間コンテンツを提供するシステムである。以下、空間コンテンツとして、作品の世界観(テーマ)からなる空間を、立体音響等の音により提供する空間サウンドを説明する。空間サウンドは、その作品の世界観に応じた１以上の空間要素コンテンツ(音楽コンテンツ等)を含む。空間コンテンツと空間要素コンテンツを総称してコンテンツともいう。

　システム１は、サーバ１０と、デバイス２０－１乃至２０－Ｎ(Ｎ：１以上の整数)から構成される。サーバ１０と、デバイス２０－１乃至２０－Ｎのそれぞれとは、インターネット等を含むネットワーク３０を介して相互に接続される。

　サーバ１０は、空間サウンドのサービス(以下、単にサービスともいう)を提供するためのサーバで構成される。サーバ１０は、デバイス２０－１乃至２０－Ｎに対し、ネットワーク３０を介して、サービスを提供する。なお、実際には、提供される機能(サービス)ごとに複数のサーバが設けられるが、説明の簡略化のため、図１では、１台のサーバ１０のみを図示している。サーバ１０は、サービス提供者側である事業者により管理される。

　例えば、サーバ１０は、アプリ提供サーバ、データ提供サーバ、アプリ連携サーバ、コンテンツ提供サーバ等のサーバで構成される。アプリ提供サーバは、サービスを利用するためのアプリケーション(以下、単にアプリケーションともいう)を配信する。アプリケーションは、サービス提供者により準備される。データ提供サーバは、アプリケーションで用いられる各種データを提供する。アプリ連携サーバは、アプリケーションと連携して処理を行う。コンテンツ提供サーバは、空間サウンドに含まれる空間要素コンテンツを提供する。

　デバイス２０－１は、スマートフォン、携帯音楽プレイヤ、タブレット端末、ウェアラブル機器、ゲーム機、携帯電話機、PC(Personal Computer)等の情報機器で構成される。デバイス２０－１は、ネットワーク３０を介して、サーバ１０により提供されるサービスを利用することができる。デバイス２０－１は、アプリケーションをダウンロードして、サーバ１０と連携してデータをやり取りすることで、空間サウンドの再生準備を行う。デバイス２０－１は、再生準備の完了後に再生条件を満たしたとき、空間サウンド(が含む空間要素コンテンツ)を再生する。

　デバイス２０－２乃至２０－Ｎは、デバイス２０－１と同様に、スマートフォン等の情報機器で構成され、空間サウンドの再生準備を行い、再生条件を満たしたときに空間サウンド(が含む空間要素コンテンツ)を再生する。デバイス２０－１乃至２０－Ｎは、それぞれ異なるユーザにより使用される。以下の説明では、デバイス２０－１乃至２０－Ｎを特に区別する必要がない場合、デバイス２０という。

＜サーバ構成＞
　図２は、図１のサーバ１０のハードウェア構成例を示すブロック図である。サーバ１０は、本開示を適用した情報処理装置の一例である。

　図２に示すように、サーバ１０において、CPU(Central Processing Unit)１０１、ROM(Read Only Memory)１０２、及びRAM(Random Access Memory)１０３は、バス１０４により相互に接続されている。CPU１０１は、ROM１０２や記憶部１０８に記録されたプログラムを実行することで、サーバ１０の各部の動作を制御する。RAM１０３には、各種データが適宜記憶される。バス１０４にはまた、入出力インターフェース１０５が接続されている。入出力インターフェース１０５には、入力部１０６、出力部１０７、記憶部１０８、通信部１０９、及びドライブ１１０が接続される。

　入力部１０６は、マイクロフォン、キーボード、マウス等の操作系で構成される。出力部１０７は、スピーカ、ディスプレイ等で構成される。記憶部１０８は、HDD(Hard Disk Drive)や半導体メモリ等の補助記憶装置で構成される。通信部１０９は、無線LAN(Local Area Network)を含む無線通信、又はイーサーネット(登録商標)を含む有線通信に対応したNIC(Network Interface Card)等の通信回路で構成される。ドライブ１１０は、半導体メモリ、光ディスク、磁気ディスク、又は光磁気ディスク等のリムーバブル記録媒体１１１を駆動する。

　サーバ１０は、アプリ提供サーバ、データ提供サーバ、アプリ連携サーバ、コンテンツ提供サーバ等の各種機能を提供するサーバとして構成される。各サーバとして構成されるサーバ１０により提供される機能は、CPU１０１によって各種機能に応じたプログラムが実行されることで実現される。プログラムの実行に際しては必要なデータが用いられる。プログラムやデータは、ROM１０２や記憶部１０８に記録される。

　図３は、図２のサーバ１０における制御部の機能的構成例を示すブロック図である。サーバ１０における制御部の機能は、CPU１０１によって、アプリケーションや設定ツール等のプログラムが実行されることで実現される。以下、サーバ１０により実行されるアプリケーションを、デバイス２０で実行されるアプリケーション(デバイス側アプリ)と区別するために、サーバ側アプリともいう。

　図３において、サーバ１０における制御部１５１は、行動パターン設定部１６１、場所タグ紐づけ部１６２、コンテンツタグ紐づけ部１６３、及びアプリ連携処理部１６４を有する。

　行動パターン設定部１６１は、場所の特性とコンテンツの特性に基づいて、行動パターンを設定する。行動パターンに関するデータは、記憶部１０８に記録される。行動パターンの設定は、サービス提供者側のオペレータ等の操作を介して設定してもよいし、あるいは、場所の特性やコンテンツの特性を含むデータの解析処理を行うことで、オペレータ等の操作を介さずに設定(自動設定)されてもよい。

　行動パターンは、日常の中で反復されるユーザの行動を示すパターンであって、サービス提供者により予め用意されるものである。デバイス２０を使用するユーザが、所望の行動パターンを所望の場所に配置することで、行動パターンに合致した空間サウンドを、行動パターンが配置された場所を把握することで提供することができる。行動パターンの詳細については、図６等を参照して後述する。

　場所タグ紐づけ部１６２は、設定された行動パターンに対し、場所の特性を示すタグ(以下、場所タグともいう)を付与する。場所タグによって、場所に適応する行動パターンが紐づけられる。アプリ連携処理部１６４は、デバイス２０側で実行されるアプリケーションと連携して処理を実行する。アプリ連携処理部１６４は、デバイス２０側で実行されるアプリケーションに対し、ユーザにより設定された屋外又は屋内の場所(以下、設定場所という)の特性に応じた行動パターンを提示する。

　コンテンツタグ紐づけ部１６３は、空間サウンドに含まれる空間要素コンテンツに対し、空間要素コンテンツの特性を示すタグ(以下、コンテンツタグともいう)を付与する。また、コンテンツタグ紐づけ部１６３は、設定された行動パターンに対し、コンテンツタグを付与する。コンテンツタグによって、空間要素コンテンツに適応する行動パターンが紐づけられる。アプリ連携処理部１６４は、デバイス２０側で実行されるアプリケーションと連携して、行動パターンと空間サウンドに応じて、複数の空間要素コンテンツの中から、設定場所に関連付けられた(設定場所に紐づく)空間要素コンテンツが配置されるようにする。

＜デバイス構成＞
　図４は、図１のデバイス２０のハードウェア構成例を示すブロック図である。デバイス２０は、本開示を適用した情報処理装置の一例である。

　図４に示すように、デバイス２０において、CPU２０１、ROM２０２、及びRAM２０３は、バス２０４により相互に接続される。CPU２０１は、ROM２０２や記憶部２０８に記録されたプログラムを実行することで、デバイス２０の各部の動作を制御する。RAM２０３には、各種データが適宜記憶される。バス２０４にはまた、入出力インターフェース２０５が接続される。入出力インターフェース２０５には、入力部２０６、出力部２０７、記憶部２０８、通信部２０９、及び近距離無線通信部２１０が接続される。

　入力部２０６は、入力信号を、入出力インターフェース２０５を介してCPU２０１を含む各部に供給する。例えば、入力部２０６は、操作部２２１、カメラ部２２２、センサ部２２３、及びGPS部２２４を有する。

　操作部２２１は、ユーザによって操作され、その操作に対応する操作信号をCPU２０１に供給する。操作部２２１は、物理的なボタンやタッチパネル等で構成される。カメラ部２２２は、そこに入射される被写体からの光を光電変換して、その結果得られる電気信号に対する信号処理を行うことで画像信号を生成し、出力する。カメラ部２２２は、イメージセンサや信号処理回路等で構成される。

　センサ部２２３は、空間情報や時間情報等のセンシングを行い、その結果得られるセンシング信号を出力する。センサ部２２３は、加速度センサやジャイロセンサ等を含む。加速度センサは、XYZ軸の３方向の加速度を測定する。ジャイロセンサは、XYZ軸の３軸の角速度を測定する。なお、IMU(Inertial Measurement Unit)を設けて、３方向の加速度計と３軸のジャイロスコープにより、３次元の加速度と角速度を測定してもよい。また、センサ部２２３は、認識技術によって特徴点を識別したり、測距技術によって距離情報を取得したりする機能を有するセンサを含む。なお、センサ部２２３には、生物の持つ心拍数、体温、又は姿勢といった情報を測定する生体センサ、近接するものを測定する近接センサ、磁場(磁界)の大きさや方向を測定する磁気センサ等の各種センサを含めることができる。

　GPS部２２４は、GPS(Global Positioning System)衛星からの信号を受信して、現在位置の測位を行い、その結果得られる現在位置を示す信号を出力する。なお、GPSは、測位システムの一例であり、他の測位システムを利用しても構わない。

　出力部２０７は、入出力インターフェース２０５を介してCPU２０１からの制御に従い、各種情報を出力する。例えば、出力部２０７は、表示部２３１、及び音出力部２３２を有する。

　表示部２３１は、CPU２０１からの制御に従い、画像信号に応じた画像や映像等を表示する。表示部２３１、液晶パネルやOLED(Organic Light Emitting Diode)パネル等のパネルと信号処理回路等で構成される。音出力部２３２は、CPU２０１からの制御に従い、音信号に応じた音を出力する。音出力部２３２は、スピーカや、出力端子に接続されるヘッドホン等で構成される。

　記憶部２０８は、CPU２０１からの制御に従い、各種データやプログラムを記録する。CPU２０１は、記憶部２０８から各種データを読み出して処理したり、プログラムを実行したりする。記憶部２０８は、半導体メモリ等の補助記憶装置で構成される。記憶部２０８は、内部ストレージとして構成されてもよいし、メモリカード等の外部ストレージであってもよい。

　通信部２０９は、CPU２０１からの制御に従い、ネットワーク３０を介して他の機器と通信を行う。通信部２０９は、セルラー方式の通信(例えばLTE-Advancedや5G等)や、無線LAN等の無線通信、又は有線通信に対応した通信モジュール等の通信回路で構成される。近距離無線通信部２１０は、Bluetooth（登録商標）やNFC(Near Field Communication)等の近距離無線通信規格による無線通信に対応した通信回路で構成される。

　なお、図４に示したデバイス２０の構成は一例であって、一部のブロックを取り除いたり、あるいは新たなブロックを追加したりしてもよい。例えば、入力部２０６としてマイクロフォンを設けたり、GPU(Graphics Processing Unit)等の画像処理回路を設けたりしても構わない。

　図５は、図４のデバイス２０における制御部の機能的構成例を示すブロック図である。デバイス２０における制御部の機能は、CPU２０１によって、サーバ１０からダウンロードされたアプリケーション(デバイス側アプリ)のプログラムが実行されることで実現される。

　図５において、デバイス２０における制御部２５１は、再生準備部２６１、及び再生部２６２を有する。再生準備部２６１は、ユーザの操作に応じて場所に意味付けをして空間サウンドを設定することで、空間サウンド(が含む空間要素コンテンツ)の再生を準備する再生準備処理を行う。再生部２６２は、再生準備処理で設定された設定内容に基づき空間サウンド(が含む空間要素コンテンツ)を再生する再生処理を行う。

　再生準備部２６１は、場所設定部２７１、行動パターン選択部２７２、行動パターン設定部２７３、空間サウンド選択部２７４、及び空間要素コンテンツ設定部２７５を有する。

　場所設定部２７１は、ユーザの操作に応じて、屋外又は屋内の場所を設定する。行動パターン選択部２７２は、サーバ１０から取得した行動パターンを提示して、ユーザからの選択を受け付けることで、設定場所に対する行動パターンを選択する。行動パターン設定部２７３は、設定場所に対し、選択された行動パターンを設定する。

　空間サウンド選択部２７４は、サーバ１０から取得した空間サウンドを提示して、ユーザからの選択を受け付けることで、設定場所に対する空間サウンドを選択する。空間要素コンテンツ設定部２７５は、選択された行動パターンと空間サウンドに応じて、設定場所に関連付けられた(設定場所に紐づく)空間要素コンテンツを配置し、再生条件を満たしたときに再生される空間要素コンテンツとして設定する。

　再生部２６２は、空間要素コンテンツ再生部２８１を有する。空間要素コンテンツ再生部２８１は、再生条件を満たしていると判定された場合に、設定された空間要素コンテンツを再生する。再生条件としては、例えば、デバイス２０を所持したユーザが設定場所に応じた範囲内に存在していることと、予め設定された設定条件を満たしていることを含む。

＜行動パターンによる場所とコンテンツの紐づけ＞
　以上のように構成されるシステム１においては、行動パターンを介して、それぞれの場所における行動(行為や動作を含む)と、選択したいコンテンツとが結び付くことで、ユーザの場所ごとに抱く心象と関連するコンテンツの提示を、より簡単に、かつ、効率的に行うことが可能となる。すなわち、行動パターンを介して、場所とコンテンツとを結び付けることによって、それぞれの場所における行動に関連するコンテンツの選択や配置を容易にすることができる。また、行動パターンは、各ユーザが選択するものであって、ユーザごとに異なるため、個々のユーザごとのカスタマイズも効率的に行うことができる。

　本開示で提案する手法では、行動パターンを用いるに際して、一般的なユーザの日常における基本的な行動の多くは、画一的であり反復性があることに注目している。屋外だけでなく屋内を含む生活圏におけるユーザの活動の場所というものは、大きくは変化しない。さらに、場所と場所とを結ぶ生活行動線も大きく変化することは稀であり、その場所や、場所から場所での行動も類似している。その上で、その類似の行動を、行動パターンとして定義する。行動パターンは、サービス提供者により予め用意される。本開示で提案する手法では、予め用意された行動パターンを、ユーザによって好みの場所に配置してもらうことで、その行動パターンに合致したコンテンツによるユーザ体験を、場所の情報を把握することで提供する。

　行動パターンは、日常の中で反復されるユーザの行動であり、例えば、「通勤する」、「通学する」、「身支度する」、「食べる」、「寝る」などの習慣的な行動が行動パターンに含まれる。つまり、行動パターンは、ユーザの習慣化される特に日常の行動をシンボル的に示したものであって、行動や心象等を明示したものである。

　図６は、行動パターンのシンボル化を模式的に示した図である。図６では、生活圏において、屋外を領域Ａ１、屋内を領域Ａ２で表したときに、屋外と屋内での行動パターンをそれぞれ示している。屋外においては、行動パターンＰ１１乃至Ｐ１４として、「通勤・通学する」、「畏れる」、「集まる」、「交歓する」などが定義される。屋内においては、行動パターンＰ２１乃至Ｐ２３として、「食べる」、「休む」、「つくる」などが定義される。

　サービス提供者は、行動パターンを、ユーザの様々な日常行動のおける行動や心象等を想定して、ユーザが選択しやすいように予め準備しておく。さらに、ユーザによる自然言語等の入力方法により、ユーザ自らの、行動、目的、行為、心象などに関する表現を分析し、様々な機械学習等の技術を活用して、行動パターンの言語化の事例や表現を増やしていくことができる。

　行動パターンには、場所タグやコンテンツタグ等のタグが付与される。タグ付けされた行動パターンを基軸として、関連する場所と、関連するコンテンツとが紐づけされる。行動パターンに付与されるタグは、行動パターンに関するメタ情報の一例である。行動パターン(のタグ)を介した場所とコンテンツとの紐づけ情報は、ユーザによるサービス利用実績に基づき、随時更新することができる。この紐づけ情報は、ユーザの行動に応じて再生されるコンテンツの選択やタイミングの精度向上のための目的だけでなく、個々の場所が持つ場所の意味の蓄積、さらにはコンテンツが持つ意味等を、ユーザが実際に使った実績情報として蓄積や分析を行い、様々な利活用(利用と活用)にも役立てることができる。

　例えば、「通勤・通学する」である行動パターンを、ユーザが自宅から最寄り駅の間にある上り坂に設定した場合を想定する。この場合において、上り坂の存在は、地図情報からも認識されるもので、その坂での移動には通常より多くのエネルギーを要することが容易に想定される。しかし、その坂が通勤や通学の途中に訪れる場所だとすると、ユーザには、通常に坂を上るという行動が要求する肉体的なエネルギー以上に、役務や勉学に向かうための意識の高揚や活力といった精神的なエネルギーの確保への欲求も存在する。後者の要件は、明らかに地図上から読み取れる静的情報から想定される行動とは別であり、ユーザの主観ともいえる行動の目的や心象といった動的情報を基にしたものである。本開示で提案する手法では、このような動的情報が、行動パターンに関連付けられて取得されることにより、上り坂等の屋外の場所において意欲的に役務や勉学に向かうなどのユーザの行動の目的や心象に応じたコンテンツを再生することができる。

　また、屋内でのユーザ体験としては、例えば、次のようなケースが想定される。ユーザが夜の11時頃に、デバイス２０を持って、寝室にあるベッド付近に移動した場合を想定する。このとき、ベッド付近の場所には、「寝る」又は「休む」である行動パターンが予め設定されている。これにより、ユーザの行動の実施が、例えば週末休暇に入る前日の夜である場合に、特に気持ちを静めてくれるようなユーザ体験をもたらすコンテンツを再生することができる。

　このように、本開示で提案する手法では、行動パターン(のタグ)を介して特定の場所と特定のコンテンツとが関連付けられる(紐づけられる)ことで、ユーザの行動や心象等を考慮したコンテンツの選択と再生が行われ、ユーザが、それぞれの場所で適切に再生されることを期待するコンテンツの提供が可能となる。よって、より良いユーザ体験を提供することが可能となる。

＜サービス提供者側の処理＞
　次に、システム１における各装置で実行される処理の詳細を説明する。まず、図７，図８のフローチャートを参照して、サーバ１０の制御部１５１により実行されるサービス提供者側の処理の流れを説明する。

　図７は、行動パターンの場所との紐づけ、及び行動パターンの提示を行う処理の流れを示している。ステップＳ１１１では、行動パターン設定部１６１が、場所の特性とコンテンツの特性に基づいて、行動パターンを設定する。例えば、行動パターンとしては、「通勤・通学する」、「食べる」、「癒す」、「寝る」などが設定される。

　ステップＳ１１２では、場所タグ紐づけ部１６２が、行動パターンに対し、場所の特性を示すタグ(場所タグ)を付与することで、場所タグに適応する行動パターンを紐づける。この紐づけ処理は、ユーザ側の再生準備処理(図９)が行われる前に実行され、場所タグが付与された行動パターンが、紐づけ情報として予め準備される。

　ステップＳ１１３では、行動パターンの提示処理を行うかどうかが判定される。ステップＳ１１３においては、デバイス２０で実行されるアプリケーションからのリクエストを受け付けて、行動パターンの提示処理を行うと判定されるのを待って、処理はステップＳ１１４に進められる。

　ステップＳ１１４では、アプリ連携処理部１６４が、設定場所に応じた行動パターンをデバイス２０に提示する。この提示処理では、ユーザ側の再生準備処理(図９)の実行中に、リクエストを送信してきたアプリケーションに対し、設定場所に応じた場所タグが付与された行動パターンが提示される(図９のＳ２１３)。

　図８は、行動パターンのコンテンツとの紐づけ、及びコンテンツの配置を行う処理の流れを示している。ステップＳ１３１では、制御部１５１が、作品の世界観に応じて空間サウンドを分類する。ステップＳ１３２では、制御部１５１が、空間サウンドに含む空間要素コンテンツの特性をタグ付けする。

　空間サウンドの分類や空間要素コンテンツのタグ付けは、コンテンツを制作したクリエイタや、サービス提供者側のオペレータ等の操作を介して行われてもよいし、あるいは、空間サウンドや空間要素コンテンツのデータの解析処理を行うことで、クリエイタ等の操作を介さずに(自動で)行われてもよい。

　ステップＳ１３３では、コンテンツタグ紐づけ部１６３が、行動パターンに対し、空間要素コンテンツの特性を示すタグ(コンテンツタグ)を付与することで、コンテンツタグに適応する行動パターンを紐づける。すなわち、行動パターンには、空間要素コンテンツの特性を示すタグとのマッチングにより、クリエイタやサービス提供者が意図するコンテンツタグが付与される。この紐づけ処理で用いられる行動パターンは、図７のステップＳ１１１の処理で設定された行動パターンであり、場所タグとの紐づけも行われる(図７のＳ１１２)。また、この紐づけ処理は、ユーザ側の再生準備処理(図９)が行われる前に実行され、コンテンツタグが付与された行動パターンが、紐づけ情報として予め準備される。

　ステップＳ１３４では、コンテンツの配置処理を行うかどうかが判定される。ステップＳ１３４においては、デバイス２０で実行されるアプリケーションからのリクエストを受け付けて、コンテンツの配置処理を行うと判定されるのを待って、処理はステップＳ１３５に進められる。

　ステップＳ１３５では、アプリ連携処理部１６４が、行動パターンと空間サウンドに応じて、場所に紐づく空間要素コンテンツを配置する。この配置処理では、ユーザ側の再生準備処理(図９)の実行中に、リクエストを送信してきたアプリケーションに対し、空間サウンドに含まれる空間要素コンテンツの中から、意味付けされた設定場所に紐づいた空間要素コンテンツが選択されて配置されるようにする。

　以上のように、サービス提供者側の処理では、ユーザ側の再生準備処理(図９)の実行前に、予め準備した行動パターンに対し、場所タグとコンテンツタグが付与され、適応するタグに紐づけられる。また、ユーザ側の再生準備処理(図９)の実行中に、デバイス２０で実行されるアプリケーションと連携することで、行動パターンの提示処理と、コンテンツの配置処理が行われる。

＜ユーザ側の再生準備処理＞
　次に、図９，図１０のフローチャートを参照して、デバイス２０の制御部２５１により実行されるユーザ側の再生準備処理の流れを説明する。図９の説明に際しては、図１１乃至図２２のUI(User Interface)の例を適宜参照しながら説明する。

　ステップＳ２１１では、制御部２５１が、通信部２０９を制御して、ネットワーク３０を介してサーバ１０にリクエストを送信することで、サービスを利用するためのアプリケーションをダウンロードする。ダウンロードされたアプリケーションは、記憶部２０８に記録され、起動される。ユーザは、表示部２３１に表示されるアプリケーションの設定画面を操作(タップ操作等)して、サウンド体験したい場所を登録していくことになる。

　ステップＳ２１２では、場所設定部２７１が、ユーザの操作に応じて、屋外又は屋内の場所を設定する。場所設定時におけるアプリケーションのUIを、図１１乃至図１３に示している。

　屋外の場所を設定する際には、図１１に示すように、「場所設定」の設定画面４０１が表示され、地図４１１上における特定の場所が指定可能となる。ユーザは、自宅や日常的な最寄り駅、よく立ち寄るお店、ジョギングでの休憩場所、散歩でいつも座るベンチ等の所望の場所を地図４１１上で確認し、エリア４１１Ａ乃至４１１Ｃのように指定して設定することができる。

　また、図１２に示すように、屋外の場所は、アプリケーションと連携したカメラ部２２２で撮影した撮影画像に含まれる物体(例えば、公園の噴水や木、建物等の構造物などの実空間に存在する物体)を、認識オブジェクトとして認識することで設定してもよい。認識オブジェクトは、公知の技術を用いて、撮影画像に解析処理を適用することで認識することができる。「オブジェクト認識」の設定画面４０２では、屋外の撮影画像４１２上の点線の枠で囲まれた認識オブジェクト４１２Ａ乃至４１２Ｊが認識され、その場所を設定することができる。

　屋内の場所を設定する際には、図１３に示すように、「オブジェクト認識」の設定画面４０３が表示され、屋内の撮影画像４１３上の点線の枠で囲まれた認識オブジェクト４１３Ａ乃至４１３Ｈ(例えば、家具、家電、部屋等)が認識され、その場所を設定することができる。

　ここでは、アプリケーションと連携したカメラ部２２２で撮影した撮影画像に解析処理を適用するとともに、部屋内に設置された物体を識別する物体認識識別子等を用いて場所の特定を支援する機能を用いることで、家具、家電、部屋(例えば、居間、食卓、寝室、洗面所、台所)等の物体を、認識オブジェクトとして認識することができる。場所特定の支援機能としては、部屋内に設置されたワイヤレススピーカ等の機器と連携されたビーコン、トークン、２次元コード(例えばQRコード(登録商標))、UWB(Ultra Wide Band)、LED(Light Emitting Diode)照明等を利用することができる。

　このように、屋外の場合には、地図上で設定されるエリア、又は認識オブジェクトが指定され、屋内の場合には、認識オブジェクトが指定されることで、屋外又は屋内の場所を設定することができる。すなわち、設定場所は、指定された地図上のエリア又は認識オブジェクトをターゲットとして、実空間におけるユーザとターゲットとの相対的な位置関係により特定される。

　図９に戻り、ステップＳ２１３では、行動パターン選択部２７２が、行動パターンを提示して、ユーザからの選択を受け付ける。行動パターンは、タグが付与されており(図７のＳ１１２)、サーバ１０により提示される(図７のＳ１１４)。つまり、行動パターンの場所タグによって、ステップＳ２１２で設定された設定場所に適応した行動パターンが提示されるので、ユーザは、提示された行動パターンの中から、所望の行動パターンを選択することができる。ステップＳ２１４では、行動パターン設定部２７３が、設定場所に対し、選択された行動パターンを設定する。このように、ユーザにより選択された行動パターンが設定場所に設定されることで、当該設定場所に対する意味付けがなされる。場所意味付け時におけるアプリケーションのUIを、図１４乃至図１６に示している。

　図１４，図１５は、屋外の場所を設定したときの「場所の意味付け」の設定画面を示している。図１４では、地図４１１上に設定されたエリア４１１Ｃに対し、「通勤・通学する」、「食べる」、「癒す」、「語る」等の行動パターンを選択するための選択画面４４１が表示される。例えば、ユーザの操作によって、選択画面４４１から「通勤・通学する」が選択された場合、エリア４１１Ｃの場所に対し、「通勤・通学する」である行動パターンが設定され、当該場所に意味が与えられる。

　図１５では、撮影画像４１２に含まれる認識オブジェクト４１２Ｈに重畳された場所情報４２２Ｈに対し、「通勤・通学する」等の行動パターンを選択するための選択画面４４２が表示される。例えば、ユーザの操作によって、選択画面４４２から「語る」が選択された場合、認識オブジェクト４１２Ｈの場所に対し、「語る」である行動パターンが設定され、当該場所に意味が与えられる。

　図１６は、屋内の場所を設定したときの「場所の意味付け」の設定画面を示している。図１６では、撮影画像４１３に含まれる認識オブジェクト４１３Ｅに重畳された場所情報４２３Ｅに対し、「癒す」、「食べる」、「寝る」、「語る」等の行動パターンを選択するための選択画面４４３が表示される。例えば、ユーザの操作によって、選択画面４４３から「癒す」が選択された場合、認識オブジェクト４１３Ｅの場所に対し、「癒す」である行動パターンが設定され、当該場所に意味が与えられる。

　このように、屋外、屋内ともに、「場所の意味付け」の設定画面において、提示される場所情報に対して、ユーザが所望の行動パターンを選択して配置していく。また、ユーザによる言語入力が行われるようにして、その結果得られる文字や音声等の入力情報に基づき、その内容の分析処理や学習処理を行い、行動パターンを自動生成することで、行動パターンの数と種類を増やしてもよい。なお、繰り返しになるので、説明は省略するが、設定画面において、他の設定場所についても同様に行動パターンを設定して場所に意味を与えることができる。あるいは、他の設定場所に対し、特定の設定場所と同様の意味が与えられてもよい。

　図９に戻り、ステップＳ２１５では、空間サウンド選択部２７４が、空間サウンドを提示して、ユーザからの選択を受け付ける。空間サウンドは、作品の世界観に応じて分類されたものであって、タグが付与された空間要素コンテンツを含んでいる(図８のＳ１３１，Ｓ１３２)。サービス提供者が推薦する空間サウンドを提示することで、ユーザに対し、好みの世界観を有するコンテンツの選択を可能にする。

　なお、空間サウンドに限らず、ユーザが利用している音楽配信サービスのストリーミングのチャネル情報、デバイス２０の記憶部２０８に記録されている音楽コンテンツやそのメタ情報などが参照され、それらの選択肢が選択可能に提示されてもよい。コンテンツ選択時におけるアプリケーションのUIを、図１７乃至図１９に示している。

　図１７，図１８は、屋外の場所を設定したときの「コンテンツ選択」の設定画面を示している。図１７では、「通勤・通学する」である行動パターンが設定されたエリア４１１Ｃの場所に対し、「スポーツに合う音楽」、「元気をくれる音楽」、「ドラマABCの世界」、「ドラマXYZの世界」、「アーティストNMLの世界」等の空間サウンドを選択するための選択画面４５１が表示される。例えば、ユーザの操作によって、選択画面４５１から「スポーツに合う音楽」である空間サウンドが選択される。

　図１８では、「語る」である行動パターンが設定された認識オブジェクト４１２Ｈの場所に対し、空間サウンドを選択するための選択画面４５２が提示される。例えば、ユーザの操作によって、選択画面４５２から「元気をくれる音楽」が選択される。図１９では、「癒す」である行動パターンが設定された認識オブジェクト４１３Ｅの場所に対し、空間サウンドを選択するため選択画面４５３が表示される。例えば、ユーザの操作によって、選択画面４５３から「アーティストNMLの世界」が選択される。

　図９に戻り、ステップＳ２１６では、空間要素コンテンツ設定部２７５が、行動パターンと空間サウンドに応じて、設定場所に紐づく空間要素コンテンツを配置する。ステップＳ２１７では、空間要素コンテンツ設定部２７５が、配置された空間要素コンテンツを、再生条件を満たしたときに再生されるコンテンツとして設定する。

　ここで配置される空間要素コンテンツは、空間サウンドに含まれる空間要素コンテンツであって、行動パターンが設定された設定場所(意味付けされた場所)に紐づいた空間要素コンテンツである。このように、行動パターンと場所の特性との関連性に応じて、設定場所に配置する空間要素コンテンツが選択されている。換言すれば、行動パターンには、タグが付与されているので(図８のＳ１３３)、行動パターンのコンテンツタグによって、ステップＳ２１５で選択された空間サウンドに含まれる空間要素コンテンツの中から、ステップＳ２１４で意味付けされた設定場所に紐づいた空間要素コンテンツが選択されて配置される。このように、行動パターンと空間要素コンテンツの特性との関連性に応じて、設定場所に空間要素コンテンツが配置されている。

　すなわち、上述した一連の設定の後に、ユーザ側のデバイス２０で実行されるアプリケーション(デバイス側アプリ)が、サービス提供者側のサーバ１０で実行されるアプリケーション(サーバ側アプリ)と通信を行う。このようにして、アプリケーションが連携することで、ユーザが選択した情報と行動パターンとが総合的に分析され、その結果として、意味付けされた設定場所に適切な空間サウンド(が含む空間要素コンテンツ)が自動配置される(図８のＳ１３５，図９のＳ２１６)。コンテンツ配置時におけるアプリケーションのUIの例を、図２０乃至図２２に示している。

　図２０，図２１は、屋外の場所を設定したときの「コンテンツ配置」の設定画面を示している。図２０では、地図４１１上のエリア４１１Ａ乃至４１１Ｃの場所に対し、空間要素コンテンツを示すコンテンツ情報４３１Ａ乃至４３１Ｃがそれぞれ配置される。図２１では、撮影画像４１２上の認識オブジェクト４１２Ａ乃至４１２Ｊの場所に対し、空間要素コンテンツを示すコンテンツ情報４３２Ａ乃至４３２Ｊがそれぞれ配置される。

　図２２は、屋内の場所を設定したときの「コンテンツ配置」の設定画面を示している。図２２では、撮影画像４１３上の認識オブジェクト４１３Ａ乃至４１３Ｈの場所に対し、空間要素コンテンツを示すコンテンツ情報４３３Ａ乃至４３３Ｈがそれぞれ配置される。

　図９に戻り、ステップＳ２１１でアプリケーションをダウンロードした後に、ステップＳ２１１乃至Ｓ２１７の処理と並行して、図１０のステップＳ２３１の処理が行われ、センシング環境が設定される。センシング環境の設定では、実空間におけるユーザとターゲットとの相対的な位置関係を測定するためのセンシングに関する設定として、カメラ部２２２、センサ部２２３、GPS部２２４等に関する各種設定が行われる。

　図９のステップＳ２１２乃至Ｓ２１７の処理と、図１０のステップＳ２３１の処理が完了すると、処理はステップＳ２１８に進められる。ステップＳ２１８では、再生準備部２６１が、空間要素コンテンツの再生準備を行う。この再生準備処理では、再生条件の生成や、再生条件を満たしたときに空間要素コンテンツの再生を行うための準備などの処理が行われる。

　再生条件は、例えば、設定場所の範囲や、予め設定された設定条件などにより定められる。設定場所の範囲は、空間要素コンテンツを再生する範囲であり、所定の形状(例えば、設定場所を含む円形や多角形の形状等)により定められる。設定条件は、人的情報や、環境情報、集団情報等の静的又は動的な情報により定められる条件である。人的情報は、生体情報、コンテクスト情報などを含む。環境情報は、日時、曜日、天候などに関する情報を含む。集団情報は、単独と集団(例えば、ユーザ単独か、若しくはユーザ以外に他のユーザも含むか)、集団特性などに関する情報を含む。人的情報、環境情報、集団情報等の情報は、サービス提供者側のサーバ１０で用意され、デバイス２０に提供されてもよい。

　以上のように、ユーザ側の再生準備処理では、ユーザが、アプリケーションの設定画面を操作して、サウンド体験したい場所を登録していくことで、場所に紐づいたコンテンツが自動配置され、コンテンツの再生条件が自動生成される。

　例えば、地図情報を用いて屋外の場所を登録する場合には、図１１の「場所設定」、図１４の「場所の意味付け」、図１７の「コンテンツ選択」、図２０の「コンテンツ配置」の順に設定画面４０１が遷移していくことで、行動パターンを基軸として、地図上のエリアに応じた所望の場所にコンテンツが自動配置され、コンテンツの再生条件が自動生成される。

　認識オブジェクトを用いて屋外の場所を登録する場合、図１２の「オブジェクト認識」、図１５の「場所の意味付け」、図１８の「コンテンツ選択」、図２１の「コンテンツ配置」の順に設定画面４０２が遷移していくことで、行動パターンを基軸として、認識オブジェクトに応じた所望の場所にコンテンツが自動配置され、コンテンツの再生条件が自動生成される。同様に、認識オブジェクトを用いて屋内の場所を登録する場合には、図１３の「オブジェクト認識」、図１６の「場所の意味付け」、図１９の「コンテンツ選択」、図２２の「コンテンツ配置」の順に設定画面４０３が遷移していくことで、コンテンツの再生条件が自動生成される。

　このように、ユーザは、アプリケーションの設定画面を操作して、予め準備された行動パターンを自らの行動範囲内の場所に配置することで、コンテンツの特性を示すタグとの関連性に基づき、クリエイタにより制作された複数のコンテンツを、複数の場所にそれぞれ配置することができる。そのため、サービス提供者やクリエイタの側からすれば、現状の状況や特性等に関する現地での調査作業と、行動パターンやコンテンツ等に関する配置作業を行うことなく、より少ない手間で(より少ない労力や時間で)、サービスを展開していくことができる。

　なお、上述した一連の処理では、空間サウンドを選択することで、意味付けされた場所に、空間サウンドに含まれる空間要素コンテンツを配置する場合を説明したが、空間サウンドを選択せずに、場所に紐づいた空間要素コンテンツを配置してもよい。要は、行動パターンに応じて、場所に紐づけた空間要素コンテンツが配置できればよく、その分類としての空間サウンドを定義するかどうかは任意である。また、空間サウンドの代わりに、例えば、音楽配信サービスのストリーミングのチャネル情報を用いた場合には、ユーザが選択したチャネル情報に含まれる音楽コンテンツが、場所に紐づくコンテンツとして配置される。

　上述した一連の処理において、アプリケーションの設定画面に対するユーザの操作としては、タップ操作、ドラッグ＆ドロップ操作、ピンチアウト操作、ピンチイン操作などのタッチパネル操作が行われる。タッチパネル操作に限らず、例えば、物理的なボタンの操作や、音声入力を用いたユーザの声での操作など、他の操作が行われてもよい。

＜ユーザ側の再生処理＞
　次に、図２３のフローチャートを参照して、デバイス２０の制御部２５１により実行されるユーザ側の再生処理の流れを説明する。再生処理は、上述した再生準備処理(図９)が完了した後に実行される。

　ステップＳ２５１では、カメラ部２２２、センサ部２２３、及びGPS部２２４等が、制御部２５１からの制御に従い、設定場所におけるユーザの行動をセンシングする。ステップＳ２５２では、制御部２５１が、センシング結果と再生条件に基づいて、設定場所の範囲内、かつ、予め設定された設定条件を満たすかどうかを判定する。設定場所は、実空間におけるユーザとターゲットとの相対的な位置関係により特定される。この判定処理では、例えば、次のような判定が行われる。

　すなわち、第１に、デバイス２０を所持したユーザの位置が、所定の形状により定められる設定場所の範囲内、すなわち、空間要素コンテンツを再生する範囲内にあるかどうかが判定される。例えば、屋外の場合に地図上でエリアを設定したとき、当該エリアにより指定されたターゲットの緯度経度を示す情報は、地図情報から取得可能である。そのため、デバイス２０のGPS部２２４によるGPSを利用した測定で得られる緯度経度を示す情報を、ターゲットに対する相対位置に変換して、当該相対位置をターゲットの位置と比較することで、ユーザが設定場所の範囲内にいるかを判定可能である。ここでは、地図サービスにより提供される地図情報のほか、SLAM(Simultaneous Localization and Mapping)等を利用しても構わない。屋内の場合には、画像マーカやビーコン等を利用することができる。要は、ユーザが設定場所の範囲内にいるかを判定できればよく、その手法は任意である。

　第２に、判定時において、人的情報(生体情報、コンテクスト情報等)、環境情報(日時、曜日、天候等)、集団情報(単独と集団、集団特性等)等の情報により予め設定される設定条件を満たしているかどうかが判定される。人的情報等の情報は、サーバ１０から適宜提供されてもよい。

　ステップＳ２５２において、設定場所の範囲内で、かつ、設定条件を満たすと判定されたかった場合、処理はステップＳ２５１に戻り、センシングとセンシング結果に基づいた判定処理が繰り返される。一方で、ステップＳ２５２において、設定場所の範囲内で、かつ、設定条件を満たすと判定された場合、処理はステップＳ２５３に進められる。

　ステップＳ２５３では、空間要素コンテンツ再生部２８１が、再生準備処理(図９)で設定された空間要素コンテンツを再生する。これにより、デバイス２０では、スピーカやヘッドホン等で構成される音出力部２３２から、再生対象の空間要素コンテンツの音が出力される。すなわち、ユーザが、アプリケーションをダウンロードしたデバイス２０を身に着けた状態で、設定場所の範囲内に入ったときに、予め設定された条件を満たしている場合には、デバイス２０で空間要素コンテンツの再生が開始される。これにより、ユーザは、所望の場所でのサウンド体験を実現できる。

　ステップＳ２５４では、制御部２５１が、空間要素コンテンツの再生を継続するかどうかを判定する。ステップＳ２５４において、再生を継続すると判定された場合、処理はステップＳ２５３に戻り、空間要素コンテンツの再生が継続される。一方で、ステップＳ２５４において、再生を継続しないと判定された場合、空間要素コンテンツの再生が停止され、一連の処理は終了される。例えば、ユーザが移動して設定場所の範囲内から出たとき、設定条件を満たさなくなったとき、ユーザにより明示的に再生の終了が指示されたとき、空間要素コンテンツの再生が最後まで終わったときなどに、再生を継続しないと判定される。

　以上のように、ユーザ側の再生処理では、センサ部２２３等によるセンシングが行われ、再生準備処理で生成された再生条件を満たすと判定された場合に、再生準備処理で設定されたコンテンツが再生される。なお、再生条件として、設定場所の範囲と、予め設定された設定条件を用いた場合を示したが、設定条件は必ずしも用いる必要はない。

＜デバイス他構成＞
　図２４は、図４のデバイス２０における制御部２５１の機能的構成の他の例を示す図である。

　図２４の制御部２５１Ａは、図５の制御部２５１と比べて、再生準備部２６１、及び再生部２６２に加えて、調整部２６３がさらに設けられる。

　調整部２６３は、ユーザの操作に応じて、再生準備部２６１による再生準備処理で設定された設定内容を調整する調整処理を行う。調整処理としては、例えば、場所設定部２７１により設定された設定場所、空間サウンド選択部２７４により選択された空間サウンドの選択内容、空間要素コンテンツ設定部２７５により設定された空間要素コンテンツの配置などが調整される。

＜ユーザ側の調整処理＞
　次に、図２５のフローチャートを参照して、デバイス２０の制御部２５１Ａにより実行されるユーザ側の調整処理の流れを説明する。図２５の説明に際しては、図２６乃至図２８のUIの例を適宜参照しながら説明する。

　ステップＳ２７１では、制御部２５１Ａが、設定内容を調整するかどうかを判定する。ステップＳ２７１においては、ユーザからの指示を受け付けて、設定内容を調整すると判定されるのを待って、処理はステップＳ２７２に進められる。

　ステップＳ２７２では、調整部２６３が、ユーザの操作に応じて、設定場所、空間サウンド、又は空間要素コンテンツ等の設定内容を調整する。設定内容調整時におけるアプリケーションUIを、図２６乃至図２８に示している。

　屋外の設定場所を調整する際には、図２６に示すように、「場所調整」の設定画面４０１が表示され、地図４１１上に設定されたエリア４１１Ａ乃至４１１Ｃを所望の場所に移動させることで、場所の調整が実現される。例えば、ユーザＵは、エリア４１１Ａをドラッグ＆ドロップ操作することで、地図４１１上の所望の場所に移動させて、調整することができる。これにより、エリア４１１Ａ内の空間要素コンテンツが配置された場所が調整される。

　また、屋外の認識オブジェクトの場所を調整する際には、図２７に示すように、「場所調整」の設定画面４０２が表示され、撮影画像４１２に含まれる認識オブジェクト４１２Ａ乃至４１２Ｊを所望の場所に移動させることで、場所の調整が実現される。例えば、ユーザＵは、認識オブジェクト４１２Ｊの場所を調整する場合、認識オブジェクト４１２Ｊに重畳された場所情報４２２Ｊをドラッグ＆ドロップ操作することで、撮影画像４１２上の所望の場所に移動させて、調整することができる。これにより、場所情報４２２Ｊに対応して配置される空間要素コンテンツの場所が調整される。なお、場所情報４２２Ｊの代わりに、その場所に対応して配置されるコンテンツ情報４３２Ｊを操作してもよい。

　図示は省略するが、屋内の認識オブジェクトの場所の調整は、屋外の認識オブジェクトの場所の調整と同様に、撮影画像４１３に含まれる認識オブジェクト４１３Ａ乃至４１３Ｈに重畳された場所情報４２３(又はコンテンツ情報４３３)を所望の場所に移動させることで、場所の調整が実現される。

　認識オブジェクトの場所に紐づく空間要素コンテンツの場所調整については、物理的に移動可能な物体の場合、例えば、次のように行われる。すなわち、実空間において、物体を移動させた後に、その移動させた物体を含む状況を、改めて「場所調整」の設定画面の機能に含まれるカメラ機能によって、認識オブジェクトを再認識させることで、その変更点と空間サウンドとの関係性が自動更新される。これにより、ユーザの取り巻く空間内での場所調整や空間編集を行うことが可能となる。

　具体的には、図２８に示すように、実空間において、部屋の奥に設置されていた観葉植物が手前のテーブル付近に移動された場合、観葉植物の移動が画像認識で判別され、認識された認識オブジェクト４１３Ｄの位置変更に伴う場所情報４２３Ｄ(又はコンテンツ情報４３３Ｄ)の位置変更が行われる。ここでは、説明の都合上、同一の部屋内での物体(例えば、観葉植物)の移動を例示したが、物体は、他の場所(例えば、寝室等の他の部屋)から移動したものであってもよい。

　なお、ユーザ側の調整処理は、上述した再生準備処理と同様に、デバイス２０で実行されるアプリケーション(デバイス側アプリ)が、サーバ１０で実行されるアプリケーション(サーバ側アプリ)と連携して処理を行うことで実現することができる。

　以上のように、ユーザ側の調整処理では、ユーザにより設定された場所や空間サウンド、あるいは、サービス提供者がシステムを活用して配置した空間要素コンテンツの場所などの設定内容を、ユーザが自由に変更することができる。例えば、ユーザは、行動パターンによって場所に紐づいた空間サウンドを、自ら利用し得られる体感に応じて調整することができる。より具体的には、空間サウンドの選択内容、空間要素コンテンツの配置、再生条件などの調整が可能であるため、ユーザは、自身の利用状況と感覚に最適化されたサウンド空間を構築することができる。

＜デバイス他構成＞
　図２９は、図４のデバイス２０における制御部２５１の機能的構成のさらに他の例を示す図である。

　図２９の制御部２５１Ｂは、図２４の制御部２５１Ａと比べて、再生準備部２６１、再生部２６２、及び調整部２６３に加えて、学習部２６４がさらに設けられる。

　学習部２６４は、学習データを用いた機械学習を行い、学習済みモデルを生成し、再生準備部２６１に供給する。学習データとしては、再生準備部２６１、再生部２６２、及び調整部２６３から入力されるデータを用いることができる。調整部２６３では、ユーザの操作に応じて、再生準備部２６１による再生準備処理で設定された設定内容を調整する調整処理が行われるが、設定内容や調整内容に関するデータを、学習データとして用いることができる。また、学習データには、再生部２６２による再生処理で再生された再生内容に関するデータを含めてもよい。学習データは、外部から入力されるデータでもよい。

　これらの学習データを用いることで、学習部２６４では、例えば、ユーザによる空間サウンドの選択と変更の状況、空間要素コンテンツの設定と変更の状況、空間要素コンテンツの再生状況などが学習される。学習済みモデルは、学習データとしての設定内容、調整内容、再生内容に関するデータを入力とし、補正後の設定内容に関するデータを出力として学習したDNN(Deep Neural Network)を用いることができる。このようなDNNをベースとしたアルゴリズムは、公知の技術を用いることができる。例えば、学習に際して、調整内容に関するデータを教師データとして用いることで、ユーザの調整が加味された設定内容が、補正後の設定内容として出力される。

　再生準備部２６１には、学習部２６４から学習済みモデルが供給される。再生準備部２６１は、再生準備処理を行うに際して、学習済みモデルに対し、ユーザの操作に応じた設定内容のデータを入力することで、その出力として補正後の設定内容のデータを得ることができる。再生準備処理では、少なくとも一部の処理で学習済みモデルを用いて処理を行うことができる。例えば、再生準備処理では、学習済みモデルを用いて、行動パターンによる場所と空間要素コンテンツの組み合わせの設定内容を補正し、空間要素コンテンツの配置場所の精度を向上させることができる。

　以上のように、学習部２６４を設けて、ユーザが自ら利用し得られる体感に応じて設定内容を変更した場合に、設定内容、調整内容、再生内容に関するデータを学習データとして用いて機械学習を行うことで、再生準備処理において、機械学習で得られた学習済みモデルを用いた処理を行うことができる。なお、図２９では、学習部２６４を、デバイス２０側の制御部２５１Ｂに設けた構成を示したが、サーバ１０側の制御部１５１に設けても構わない。制御部１５１が学習部２６４を有する場合、設定内容、調整内容、再生内容に関するデータがデバイス２０からサーバ１０に送られるようにして、学習部２６４が、それらのデータを用いて機械学習を行い、学習済みモデルを生成する。学習済みモデルは、サーバ１０からデバイス２０に送られ、記憶部２０８に記録される。

　以上、本開示で提案するシステム構成と各装置で実行される処理について説明した。本開示で提案する手法では、予め準備した行動パターンにより場所とコンテンツとを紐づけることで、ユーザの行動に応じて、場所に関連付けられたコンテンツを再生することができる。

　屋外と屋内のいずれの場所においても、それらの様々な場所で、ユーザが多様な行動や動作と合致した音楽を楽しめることは、日常生活において重要な体験である。しかし、多くの場合は、その場所や居合わせるタイミングにおいて、ユーザが、自らの心象にあった所望する音楽コンテンツを、音楽配信サービスのストリーミングチャネルから選曲したり、デバイスに蓄積している音楽コンテンツのファイルにアクセスしたりすることで、音楽コンテンツの選択や再生を行うのが一般的である。

　近年、スマートフォンや携帯音楽プレイヤ等のデバイスには、位置情報や生体情報を把握する機能が搭載されているものがあり、これらの情報を活用して、ユーザが再生した音楽コンテンツの選択状況や視聴状況から、楽曲の推薦を行う機能が提供されている。

　一方、主に屋外の事例であるが、テーマパークや遊園地、さらに特定の街中において、それらの特定の場所にて、事業主や興行主等が提供する様々な体験価値を高めることを目的に、場所を特定し、音楽や効果音、ナレーション等を再生するケースは増えてきている。この種のケースでは、事業主や興行主等が、予め地図上に音楽コンテンツ等を配置して、ユーザが所持するスマートフォン等のデバイスのGPS機能を活用し、ユーザが配置場所に入ったり出たりする状況を検知することで、音楽コンテンツ等を再生するシステムが用いられる。

　上述のテーマパークや遊園地、さらに特定の街中といったいわば特別設定される非日常的体験の場合は、事業主や興行主等は、ユーザと予め合意したエリアにおいて体験を提供することを約束するモデルであるので、エリアが限定された上に、そのエリア内の個々の場所の特性を把握することで、音楽コンテンツを配置して再生条件の設定を行うことができる。

　しかながら、ユーザの移動先が特定しにくい場合や、日常の生活圏という特定が難しい場合においては、ユーザが音楽を聴きたいと思う場所を特定することは容易ではなく、ユーザ自らの心象にあった所望する音楽コンテンツの選択や提示のタイミングを設定することは容易ではない。当然のことではあるが、事業主や興行主等に含まれるサービス提供者やクリエイタが、個々のユーザの動向や嗜好を調査し、場所を特定して音楽コンテンツを配置していくことも、その負荷を考えると現実的ではない。

　本開示で提案する手法では、ユーザがアプリケーションの設定画面を操作することで、予め準備された行動パターンにより場所とコンテンツとが紐づけられる。そのため、サービス提供者やクリエイタが、個々のユーザの動向や嗜好を調査したり、場所を特定して音楽コンテンツを配置したりすることなく、より少ない手間で(より少ない労力や時間で)サービスを展開していくことができる。また、ユーザが、それぞれの場所で適切に再生されることを期待するコンテンツの提供が可能となるため、より良いユーザ体験を提供することが可能となる。

＜変形例＞
　上述した説明では、デバイス２０の制御部２５１の機能的構成を、図５に示したが、制御部２５１における再生準備部２６１と再生部２６２の機能のうち、一部の機能がサーバ１０の制御部１５１に設けられてもよい。すなわち、上述した一連の処理は、サービス提供者側のサーバ１０(の制御部１５１)と、ユーザ側のデバイス２０(の制御部２５１)とが協働して動作することで実現することができる。換言すれば、本開示の実施の形態は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　上述した説明では、「実空間におけるユーザとターゲットとの相対的な位置関係」について述べたが、ユーザの位置は、ユーザが所持するデバイス２０の位置と等価であるため、相対的な位置関係とは、ユーザが所持するデバイス２０と、ターゲット(地図上のエリア又は認識オブジェクトにより指定されるターゲット)との位置関係であると捉えることもできる。

　上述した説明では、空間コンテンツとして、作品の世界観からなる空間を音により提供する空間サウンドを例示したが、映像や画像等の他の情報が提示されてもよい。例えば、空間コンテンツは、「癒し」、「パワー」、「思い出」等のテーマからなる空間を、立体音響等による音や、映像、画像等により提供することができる。例えば、「癒し」である空間コンテンツには、「Bird」、「Forest」、「Creek」等の空間要素コンテンツ(音楽コンテンツ)を含む。「Bird」である空間要素コンテンツは、心地よい鳥の鳴き声などにより、ユーザに対して「癒し」の空間を提供する。「Forest」である空間要素コンテンツは、木の葉を揺らす風の音などの森を感じることができる音により、ユーザに対して「癒し」の空間を提供する。「Creek」である空間要素コンテンツは、ゆるやかな小川の流れなどの水の音により、ユーザに対して「癒し」の空間を提供する。

　図１２の「オブジェクト認識」の設定画面４０２、又は図１３の「オブジェクト認識」の設定画面４０３では、アプリケーションと連携したカメラ部２２２で撮影した撮影画像に含まれる認識オブジェクトを自動で認識し、その場所を設定するとして説明したが、撮影画像に含まれる物体(公園の噴水等の実空間に存在する物体)をユーザが手動で指定することで、指定された物体が認識オブジェクトとして認識されて場所が設定されてもよい。なお、本明細書において、「自動」と記載した場合、サーバ１０、デバイス２０等の機器が、ユーザ、サービス提供者、クリエイタ等の直接的な操作を介さずに処理を行うことを意味し、「手動」と記載した場合、ユーザ等の直接的な操作を介して機器が処理を行うことを意味する。

＜コンピュータ構成＞
　上述したフローチャートの各ステップの処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、各装置のコンピュータにインストールされる。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体をドライブに装着することにより、入出力インターフェースを介して、記憶部にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部で受信し、記憶部にインストールすることができる。その他、プログラムは、ROMや記憶部に、あらかじめインストールしておくことができる。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。また、プログラムは、１のコンピュータ(プロセッサ)により処理されてもよいし、複数のコンピュータによって分散処理されてもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されてもよい。

　上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　また、本開示は、以下のような構成をとることができる。

（１）
　ユーザの行動を示す行動パターンが予め設定され、
　実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、
　設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する
　制御部を備える
　情報処理装置。
（２）
　前記行動パターンには、場所の特性を示すメタ情報とコンテンツの特性を示すメタ情報とに適応したメタ情報が付与されており、
　前記行動パターンに付与された前記メタ情報を介して、前記特定の場所と前記特定のコンテンツとが関連付けられる
　前記（１）に記載の情報処理装置。
（３）
　前記制御部は、前記行動パターンと前記コンテンツの特性との関連性に応じて、前記特定の場所に前記特定のコンテンツを配置する
　前記（２）に記載の情報処理装置。
（４）
　前記制御部は、前記行動パターンと前記場所の特性との関連性に応じて、前記特定の場所に配置する前記特定のコンテンツを選択する
　前記（２）に記載の情報処理装置。
（５）
　前記行動パターンには、前記コンテンツの特性を示すメタ情報とのマッチングにより、前記コンテンツを制作するクリエイタ又は前記コンテンツを提供する提供者が意図するメタ情報が付与されている
　前記（２）に記載の情報処理装置。
（６）
　前記制御部は、前記特定のユーザの操作に応じて、前記特定の場所及び前記特定のコンテンツの少なくとも一方の設定内容を調整する
　前記（１）に記載の情報処理装置。
（７）
　前記制御部は、前記特定の場所及び前記特定のコンテンツの設定内容に関するデータと、前記ユーザの操作に応じた調整内容に関するデータとを学習データとして用いた機械学習を行い、学習済みモデルを生成する
　前記（６）に記載の情報処理装置。
（８）
　前記学習済みモデルは、前記設定内容と前記調整内容に関するデータを入力とし、補正後の設定内容に関するデータを出力として学習したDNNであり、
　前記制御部は、前記学習済みモデルを用い、前記特定の場所及び前記特定のコンテンツの少なくとも一方の設定内容を補正する
　前記（７）に記載の情報処理装置。
（９）
　前記制御部は、前記特定の場所に応じた再生条件を満たした場合に、前記特定のコンテンツを再生する
　前記（１）に記載の情報処理装置。
（１０）
　前記制御部は、前記ユーザが前記特定の場所に応じた範囲内に存在し、かつ、予め設定された設定条件を満たす場合、前記特定のコンテンツを再生する
　前記（９）に記載の情報処理装置。
（１１）
　前記複数のコンテンツは、空間コンテンツにより分類される空間要素コンテンツを含み、
　前記制御部は、前記ユーザの操作に応じた前記空間コンテンツを選択し、選択した前記空間コンテンツに含まれる前記空間要素コンテンツを、前記特定の場所に関連付けられた前記特定のコンテンツとして配置する
　前記（１）乃至（１０）のいずれかに記載の情報処理装置。
（１２）
　前記空間コンテンツは、作品の世界観からなる空間を音により提供する空間サウンドであり、
　前記空間要素コンテンツは、音楽コンテンツである
　前記（１１）に記載の情報処理装置。
（１３）
　前記ターゲットは、地図上で設定されるエリア、又は実空間に存在する物体を認識した認識オブジェクトにより指定される
　前記（１）乃至（１０）のいずれかに記載の情報処理装置。
（１４）
　情報処理装置が、
　ユーザの行動を示す行動パターンが予め設定され、
　実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、
　設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する
　情報処理方法。
（１５）
　コンピュータを、
　ユーザの行動を示す行動パターンが予め設定され、
　実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、
　設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する
　制御部として機能させるプログラム。

　１　システム，　１０　サーバ，　２０，２０－１乃至２０－Ｎ　デバイス，　３０　ネットワーク，１０１　CPU，　１５１　制御部，　１６１　行動パターン設定部，　１６２　場所ダグ紐づけ部，　１６３　コンテンツタグ紐づけ部，　１６４　アプリ連携処理部，　２０１　CPU，　２５１，２５１Ａ，２５１Ｂ　制御部，　２６１　再生準備部，　２６２　再生部，　２６３　調整部，　２６４　学習部，　２７１　場所設定部，　２７２　行動パターン選択部，　２７３　行動パターン設定部，　２７４　空間サウンド選択部，　２７５　空間要素コンテンツ設定部，　２８１　空間要素コンテンツ再生部

Claims

　ユーザの行動を示す行動パターンが予め設定され、
　実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、
　設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する
　制御部を備える
　情報処理装置。
　前記行動パターンには、場所の特性を示すメタ情報とコンテンツの特性を示すメタ情報とに適応したメタ情報が付与されており、
　前記行動パターンに付与された前記メタ情報を介して、前記特定の場所と前記特定のコンテンツとが関連付けられる
　請求項１に記載の情報処理装置。
　前記制御部は、前記行動パターンと前記コンテンツの特性との関連性に応じて、前記特定の場所に前記特定のコンテンツを配置する
　請求項２に記載の情報処理装置。
　前記制御部は、前記行動パターンと前記場所の特性との関連性に応じて、前記特定の場所に配置する前記特定のコンテンツを選択する
　請求項２に記載の情報処理装置。
　前記行動パターンには、前記コンテンツの特性を示すメタ情報とのマッチングにより、前記コンテンツを制作するクリエイタ又は前記コンテンツを提供する提供者が意図するメタ情報が付与されている
　請求項２に記載の情報処理装置。
　前記制御部は、前記特定のユーザの操作に応じて、前記特定の場所及び前記特定のコンテンツの少なくとも一方の設定内容を調整する
　請求項１に記載の情報処理装置。
　前記制御部は、前記特定の場所及び前記特定のコンテンツの設定内容に関するデータと、前記ユーザの操作に応じた調整内容に関するデータとを学習データとして用いた機械学習を行い、学習済みモデルを生成する
　請求項６に記載の情報処理装置。
　前記学習済みモデルは、前記設定内容と前記調整内容に関するデータを入力とし、補正後の設定内容に関するデータを出力として学習したDNNであり、
　前記制御部は、前記学習済みモデルを用い、前記特定の場所及び前記特定のコンテンツの少なくとも一方の設定内容を補正する
　請求項７に記載の情報処理装置。
　前記制御部は、前記特定の場所に応じた再生条件を満たした場合に、前記特定のコンテンツを再生する
　請求項１に記載の情報処理装置。
　前記制御部は、前記ユーザが前記特定の場所に応じた範囲内に存在し、かつ、予め設定された設定条件を満たす場合、前記特定のコンテンツを再生する
　請求項９に記載の情報処理装置。
　前記複数のコンテンツは、空間コンテンツにより分類される空間要素コンテンツを含み、
　前記制御部は、前記ユーザの操作に応じた前記空間コンテンツを選択し、選択した前記空間コンテンツに含まれる前記空間要素コンテンツを、前記特定の場所に関連付けられた前記特定のコンテンツとして配置する
　請求項１に記載の情報処理装置。
　前記空間コンテンツは、作品の世界観からなる空間を音により提供する空間サウンドであり、
　前記空間要素コンテンツは、音楽コンテンツである
　請求項１１に記載の情報処理装置。
　前記ターゲットは、地図上で設定されるエリア、又は実空間に存在する物体を認識した認識オブジェクトにより指定される
　請求項１に記載の情報処理装置。
　情報処理装置が、
　ユーザの行動を示す行動パターンが予め設定され、
　実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、
　設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する
　情報処理方法。
　コンピュータを、
　ユーザの行動を示す行動パターンが予め設定され、
　実空間における特定のユーザとターゲットとの相対的な位置関係により特定される特定の場所に対し、前記特定のユーザに応じた前記行動パターンを設定し、
　設定された前記行動パターンに応じて、複数のコンテンツの中から前記特定の場所に関連付けられた特定のコンテンツを設定する
　制御部として機能させるプログラム。