WO2023157782A1

WO2023157782A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2023157782A1
Application number: PCT/JP2023/004681
Authority: WO
Inventors: 勇斗横山; 智博大井; 遼深澤; 正行井上; 和典淺山
Original assignee: ソニーグループ株式会社
Priority date: 2022-02-21
Filing date: 2023-02-13
Publication date: 2023-08-24

Abstract

実施形態に係る情報処理装置は、自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得する取得部と、前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する生成部と、を備える。

Description

情報処理装置、情報処理方法及びプログラム

　本開示は、情報処理装置、情報処理方法及びプログラムに関する。

　近年、ボリュメトリック映像技術で撮影された映像コンテンツや、３Ｄゲームやメタバースなどの仮想空間内を視聴できる映像コンテンツなど、視点を自由に変更することができる３次元映像コンテンツ（以下、自由視点コンテンツともいう）が広く普及してきている。

特開２０１８－１８２５６６号公報特開２０１２－３９５５０号公報国際公開第２０１８／０７９１６６号

　例えば、サッカーや野球等のスポーツ、演劇やミュージカル等の舞台、コンサートや野外フェス等の演奏会など、長時間のイベントを映像化した長尺の自由視点コンテンツにおいては、視聴者はコンテンツ内のどの時間のどのシーンが見どころであるかを知ることが困難である。そのため、視聴者が見るべきシーンを見逃してしまうなどの課題が存在した。

　そこで本開示では、視聴者が見どころであるシーンを見逃してしまうことを抑制することが可能な情報処理装置、情報処理方法及びプログラムを提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得する取得部と、前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する生成部と、を備える。

一実施形態に係る情報処理システムの概略構成例を示すブロック図である。一実施形態に係る情報処理システムの機能構成例を示す機能ブロック図である。一実施形態に係る情報処理システムの概略動作例を示すフローチャートである。一実施形態に係る見どころ時間を計算する際の動作フロー例を示す図である。一実施形態に係る見どころ位置を計算する際の動作フロー例を示す図である。一実施形態に係るイベントデータの位置的重要度の計算例を説明するための図である。一実施形態に係るイベントデータの時間的密度の計算例を説明するための図である。一実施形態に係るイベントデータの位置的密度の計算例を説明するための図である。一実施形態に係る視聴重要度における位置的重要度の計算例を説明するための図である。一実施形態に係るヒートマップから求まるヒートマップ重要度の計算例を説明するための図である。一実施形態に係る視聴者数から求まる重要度（以下、視聴者数重要度）の計算例を説明するための図である。一実施形態に係る見どころ視点の決定フロー例を説明するための図である（その１）。一実施形態に係る見どころ視点の決定フロー例を説明するための図である（その２）。一実施形態に係る見どころ視点の決定フロー例を説明するための図である（その３）。一実施形態に係る見どころ視点の決定フロー例を説明するための図である（その４）。一実施形態に係る見どころ視点の決定フロー例を説明するための図である（その５）。一実施形態に係る自由視点コンテンツの表示画面の一例を示す図である。本開示に係る各種処理を実行する情報処理装置一例を示すハードウエア構成図である。

　以下に、本開示の一実施形態について図面に基づいて詳細に説明する。なお、以下の実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　また、以下に示す項目順序に従って本開示を説明する。
　　０．はじめに
　　１．一実施形態
　　　１．１　システム構成例
　　　１．２　機能構成例
　　　１．３　動作フロー例
　　　１．４　動作フローの詳細例
　　　　１．４．１　イベント重要度計算フロー例
　　　　１．４．２　動き重要度計算フロー例
　　　　１．４．３　視聴重要度計算フロー例
　　　　１．４．４　見どころ情報生成フロー例
　　　　１．４．５　見どころ視点決定フロー例
　　　１．５　見どころ情報及び見どころ視点の利用例
　　　　１．５．１　ダイジェスト映像の生成
　　　　１．５．２　視聴位置（視点位置）のサジェスチョン
　　　　１．５．３　コーチング目的のプレイダイジェスト映像の生成
　　　　１．５．４　メタ情報の活用
　　　１．６　まとめ
　　　１．７　変形例
　　　　１．７．１　重要度計算部の変形例
　　　　１．７．２　見どころ情報及び見どころ視点の組み合わせ変形例
　　　　１．７．３　リモートの場合の変形例
　　　　１．７．４　見どころ視点の俯瞰固定
　　　　１．７．５　３Ｄ酔い／映像酔いの軽減
　　２．ハードウエア構成

　０．はじめに
　視点を自由に変更することができる自由視点コンテンツは、ＨＭＤ（Head　Mounted　Display）、パーソナルコンピュータ、スマートフォン、タブレット端末などを用いて様々な視点から視聴することが可能である。このような自由視点コンテンツに対しては、今後、全体を見るのではなく一部の重要なシーンを見たいや、総集編のような重要なシーンのダイジェスト動画を作成したいなどの要望が生じることが予測される。

　従来、２次元の映像コンテンツに対しては、ダイジェスト動画を作成するなどの取り組みが存在したが、これまで長尺の自由視点コンテンツを利用するシーンはあまり存在しなかった。そのため、従来では、自由視点コンテンツからダイジェスト動画を作成する試みがなされていなかった。

　また、対象コンテンツが２次元から３次元に変化することで、２次元コンテンツでは利用できたが３次元コンテンツでは使えなくなった要素や、３次元コンテンツとなることで新しく使えるようになった要素が存在することも、自由視点コンテンツからダイジェスト動画を作成することの障害となっていた。
（使えなくなった要素の例）
・撮影カメラの移動方向
・映像中の画素変化
・シーンの切り替え
（新たに使えるようになった要素の例）
・視聴者の視点移動
・視聴者の視聴時間
・人等のオブジェクトの３次元位置情報
・コンテンツ中に発生したイベントの情報

　このように、２次元コンテンツで培われた技術をそのまま利用して自由視点コンテンツからダイジェスト映像を生成することは不可能であった。例えば、２次元コンテンツでは視点位置を自由に移動させることができないため、ダイジェスト映像の生成では見どころとなる時間の推定のみが行われ、位置の推定が行われていなかった。また、２次元映像中のオブジェクトの動きの情報だけでは見どころとなるシーン（時間帯、位置等）を正確に推定することは困難であった。なお、本説明におけるダイジェスト映像とは、元々の映像コンテンツの時間的長さよりも短い長さの映像コンテンツであってよい。

　これに対し、自由視点コンテンツから見どころとなるシーンを抽出するためには、時間の推定に加えて、見どころとなる位置の推定と、推定された位置をどの方向から観るかという視聴位置の推定とを行う必要がある。そのため、自由視点コンテンツの視聴では視聴者が自らの意思により視点を操作するが、適切に操作できないと肝心な場面を見逃してしまう可能性があり、「どこ見ればいいかわからない」という利用者が多数存在し得る。

　そこで、以下の実施形態では、自由視点コンテンツから見るべき時間帯並びに視点位置及び視聴方向、つまり見どころとなるシーンを推定し、それを視聴者に提供することで、視聴者が見どころであるシーンを見逃してしまうことを抑制することを可能とする。

　１．一実施形態
　以下に、本開示の一実施形態に係る情報処理装置、情報処理方法及びプログラムを、図面を参照して詳細に説明する。

　本実施形態で対象とする自由視点コンテンツは、例えば、ボリュメトリック映像技術やHawkEye（登録商標）システムを用いて現実空間から仮想空間内に取り込まれたオブジェクト（ヒトやモノ等）の動きを含む３次元映像コンテンツや、３Ｄゲームやメタバースやアバターアニメーションなど、仮想空間内にオブジェクト（アバターやモノ）の動きが作り込まれた３次元映像コンテンツ等であってよい。ただし、これらに限定されず、３次元的にヒトやモノなどのオブジェクトの位置や動きが表現されたものであれば、種々のコンテンツを対象とすることが可能である。なお、以下の説明では、明確化のため、サッカーなどのスポーツの撮影データから生成された自由視点コンテンツを例に挙げる。

　なお、自由視点コンテンツには、大別して、「３６０°動画を球体の内側から視聴するもの」と、「３Ｄモデルを様々な方向から見るもの」との２種類がある。両者は同じ自由視点コンテンツと呼ばれるものであるが、利用形態や作成フローなどが大きく異なる。以下の実施形態では、自由視点コンテンツとして「３Ｄモデルを様々な方向から見るもの」が採用された場合を例示するが、本開示はこれに限定されず、「３６０°動画を球体の内側から視聴するもの」など、種々の自由視点コンテンツが採用されてよい。

　また、スポーツの撮影データから生成されたコンテンツに限られず、自由視点コンテンツには、以下のような要素が含まれ得る。
・任意の方法で生成されたモーション（例えば、選手やボールの区別された動き）
・手動又は自動で生成されたイベントデータ（例えば、Ａ選手が座標Ｘでシュートした、得点が入った等）
・会場や日時といったメタ情報

　１．１　システム構成例
　図１は、本実施形態に係る情報処理システムの概略構成例を示すブロック図である。図１に示すように、本実施形態に係る情報処理システム１は、サーバ１００と、データベース（ＤＢ）１１０と、１台以上のユーザ端末１２０ａ、１２０ｂ、…（以下、個々のユーザ端末を区別しない場合、その符号を１２０とする）とが、ネットワーク１３０を介して接続された構成を備える。

　サーバ１００は、例えば、本開示に係る情報処理装置の一例であり、ユーザ（視聴者又は利用者ともいう）へ自由視点コンテンツを視聴するためのサービスを提供する。なお、サーバ１００は、１台のサーバで構成されてもよいし、複数台のサーバで構成されてもよい。また、サーバ１００は、ネットワーク１３０上に配置された１以上のクラウドサーバにより構成されてもよい。

　データベース１１０は、ユーザへ提供する自由視点コンテンツやこの自由視点コンテンツのメタ情報など、自由視点コンテンツに関連する情報の他、ユーザから収集した視聴履歴など、自由視点コンテンツを視聴するユーザに関連する情報も蓄積する。なお、データベース１１０は、サーバ１００の一部であってもよいし、サーバ１００とは別の構成であってもよい。

　ユーザ端末１２０は、例えば、データベース１１０から直接又はサーバ１００を経由して提供される自由視点コンテンツをユーザが視聴・利用するための情報処理装置であり、例えば、ＨＭＤ、パーソナルコンピュータ、スマートフォン、タブレット端末などであってよい。

　ネットワーク１３０は、例えば、有線又は無線ＬＡＮ（Local　Area　Network）（ＷｉＦｉを含む）やＷＡＮ（Wide　Area　Network）やインターネットや移動通信システム（４Ｇ（4th　Generation　Mobile　Communication　System）、４Ｇ－ＬＴＥ（Long　Term　Evolution）、５Ｇ等を含む）などの相互通信可能な種々のネットワークであってよい。

　１．２　機能構成例
　図２は、本実施形態に係る情報処理システムの機能構成例を示す機能ブロック図である。図２に示すように、情報処理システム１は、その機能要素として、イベント重要度計算部１０１と、動き重要度計算部１０２と、視聴重要度計算部１０３と、見どころ情報生成部１０４と、見どころ視点決定部１０５と、コンテンツデータベース１１１と、視聴履歴データベース１１２と、コンテンツ視聴部１２１と、見どころ利用部１２２とを備える。

　上記構成において、イベント重要度計算部１０１、動き重要度計算部１０２、視聴重要度計算部１０３、見どころ情報生成部１０４及び見どころ視点決定部１０５は、例えば、サーバ１００に実装され、コンテンツデータベース１１１及び視聴履歴データベース１１２は、データベース１１０に実装され、コンテンツ視聴部１２１及び見どころ利用部１２２は、ユーザ端末１２０に実装されてよい。

　ただし、これに限定されず、例えば、イベント重要度計算部１０１、動き重要度計算部１０２、視聴重要度計算部１０３、見どころ情報生成部１０４及び見どころ視点決定部１０５のうち、見どころ情報生成部１０４及び／又は見どころ視点決定部１０５を含む１以上の機能要素は、ユーザ端末１２０に実装されてもよい。

　（コンテンツデータベース１１１）
　コンテンツデータベース１１１は、１以上の自由視点コンテンツと、各自由視点コンテンツから抽出されたメタイベント情報（イベントデータともいう）とを含む、自由視点コンテンツに関連する情報を格納する。メタイベント情報（イベントデータ）は、自由視点コンテンツに紐づけられた、アバターやオブジェクトがその時点でどのような動きをしているのかというラベルであってもよい。例えば、選手Ａが地点Ｘにおいてジャンプをしている／シュートをしている／得点を決めた等の情報や、役者Ｂが地点Ｙにおいて「おはよう」という発話を行った、などのラベルがイベントデータとして自由視点コンテンツの時間軸に紐づけられる。

　自由視点コンテンツからのイベントデータの抽出は、手動であってもよいし、自動であってもよい。手動でイベントデータを抽出する場合、オペレータは、例えば、自由視点コンテンツ内で発生したイベントに関する情報を示すイベントデータを例えば支援システム等を利用して手作業で作成する。一方、自動でイベントデータを抽出する場合、例えば、予め用意しておいた学習済みモデルなどの解析用アプリケーションに自由視点コンテンツが入力され、その結果として自由視点コンテンツの時間軸に紐づけられた１以上のイベントデータが出力される。このようにして抽出されたイベントデータは、例えば、自由視点コンテンツに関連付けられてコンテンツデータベース１１１に格納される。

　（コンテンツ視聴部１２１）
　コンテンツ視聴部１２１は、例えば、入力部と処理部と表示部とを含み、データベース１１０から直接又はサーバ１００を経由して提供される自由視点コンテンツの映像をユーザへ向けて再生する。

　例えば、ユーザは、視聴したい自由視点コンテンツの指定や視聴開始の指示をユーザ端末１２０の入力部から入力する。また、自由視点コンテンツの視聴中、ユーザは、自由視点コンテンツで展開されている仮想空間内での視点位置や視聴方向に関する指示を入力部を介して入力する。処理部は、視聴対象の自由視点コンテンツの指定や視聴開始の指示が入力されると、データベース１１０から直接又はサーバ１００から自由視点コンテンツを取得する。そして、処理部は、入力部に入力された視点位置や視聴方向に基づいて画角内の自由視点コンテンツをレンダリングすることで、ユーザへ提供する映像を生成する。このようにして生成された映像は、表示部に表示されることでユーザに提示される。

　（視聴履歴データベース１１２）
　視聴履歴データベース１１２は、自由視点コンテンツごとのユーザの視聴履歴を含む、自由視点コンテンツを視聴するユーザに関連する情報を蓄積する。蓄積される視聴履歴は、ユーザごとであってもよいし、ユーザが属するカテゴリ（年代、性別、趣味・嗜好等）ごとであってもよいし、ユーザを区別しない全体であってもよい。また、各視聴履歴には、ユーザが自由視点コンテンツにおけるどのシーン（位置及び時間）を視聴したかを示す情報（後述する視聴時間情報、視聴位置情報及びリアクション情報を含む）が含まれてよい。さらに、視聴履歴には、ユーザに関する情報（年代、性別、趣味・嗜好等）が含まれてもよい。

　（イベント重要度計算部１０１）
　イベント重要度計算部１０１は、その詳細な動作については後述するが、自由視点コンテンツ内のイベントに関する重要度（以下、イベント重要度ともいう）を計算する。

　（動き重要度計算部１０２）
　動き重要度計算部１０２は、その詳細な動作については後述するが、自由視点コンテンツ内のオブジェクトの動きに関する重要度（以下、動き重要度ともいう）を計算する。なお、アバターやオブジェクトの動きとは、自由視点コンテンツを構成する要素の一つであってよい。

　（視聴重要度計算部１０３）
　視聴重要度計算部１０３は、その詳細な動作については後述するが、自由視点コンテンツに対するユーザの視聴履歴に基づいた重要度（以下、視聴重要度ともいう）を計算する。

　（見どころ情報生成部１０４）
　見どころ情報生成部１０４は、その詳細な動作については後述するが、イベント重要度計算部１０１、動き重要度計算部１０２及び視聴重要度計算部１０３のうちの１つ以上で計算された重要度に基づいて、自由視点コンテンツ内の見どころとなるシーンを特定するための情報（以下、見どころ情報ともいう）を生成する。生成される見どころ情報には、例えば、見どころとなるシーンの位置（例えば、座標）や時間（以下、見どころ位置・時間ともいう）を示す情報が含まれ得る。見どころ時間は、元々の自由視点コンテンツの時間的長さよりも短い長さを示す視聴時間であってよい。

　（見どころ視点決定部１０５）
　見どころ視点決定部１０５は、その詳細な動作については後述するが、見どころ情報生成部１０４で特定された見どころとなるシーンをレンダリングするのに最適な視点位置及び視聴方向（以下、見どころ視点ともいう）を決定する。

　（見どころ利用部１２２）
　見どころ利用部１２２は、見どころ情報生成部１０４から提供された見どころ情報に基づくことで、ユーザに対して見どころとなるシーンを特定するための情報や、見どころとなるシーンの映像をユーザに提示する。その際、見どころ利用部１２２は、見どころ視点決定部１０５から取得した視点位置及び視聴方向に基づいて自由視点コンテンツをレンダリングすることで、ユーザに提示する映像を生成してもよいし、見どころ視点決定部１０５から取得した視点位置及び視聴方向をユーザに提示することで、どの時間のどの位置のシーンが見どころであるかをユーザに提示してもよい。

　１．３　動作フロー例
　次に、本実施形態に係る情報処理システム１の概略動作例を図３を用いて説明する。

　図３に示すように、本動作ではまず、コンテンツデータベース１１１から対象の自由視点コンテンツ及びこれに関連付けられているイベントデータが取得され（ステップＳ１０１）、イベント重要度計算部１０１及び動き重要度計算部１０２それぞれに入力される。なお、サーバ１００は、コンテンツデータベース１１１から自由視点コンテンツを取得した際に、自由視点コンテンツからイベントデータを抽出してもよい。その場合、コンテンツデータベース１１１には、イベントデータが格納されていなくてもよい。

　イベント重要度計算部１０１は、入力された自由視点コンテンツ及びイベントデータからイベント重要度を計算し（ステップＳ１０２）、計算されたイベント重要度を見どころ情報生成部１０４へ入力する。

　一方、動き重要度計算部１０２は、入力された自由視点コンテンツ及びイベントデータから動き重要度を計算し（ステップＳ１０３）、計算された動き重要度を見どころ情報生成部１０４へ入力する。なお、ステップＳ１０２とステップＳ１０３とは、並行して実行されてよい。

　また、ステップＳ１０１～Ｓ１０３の動作と並行して、視聴履歴データベース１１２に蓄積されている自由視点コンテンツの視聴履歴が取得され（ステップＳ１０４）、視聴重要度計算部１０３に入力される。視聴履歴データベース１１２には、特定又は不特定のユーザによる自由視点コンテンツの視聴履歴が随時蓄積されてよい。

　視聴重要度計算部１０３は、入力された視聴履歴から視聴重要度を計算し（ステップＳ１０５）、計算された視聴重要度を見どころ情報生成部１０４へ入力する。

　見どころ情報生成部１０４は、入力されたイベント重要度、動き重要度及び視聴重要度のうちの１つ以上に基づいて、見るべきシーンの位置（例えば、座標）及び時間を示す見どころ情報を生成し（ステップＳ１０６）、生成された見どころ情報を見どころ視点決定部１０５へ入力する。

　見どころ視点決定部１０５は、見どころ情報に含まれる見るべきシーンの位置と、このシーンにおける自由視点コンテンツ内の遮蔽物との位置関係から、どの位置からどの方向へ視聴するのが適切かを示す見どころ視点を決定する（ステップＳ１０７）。

　以上のようにして得られた見どころ情報及び見どころ視点は、自由視点コンテンツと共にネットワーク１３０を介してユーザ端末１２０へ送信され（ステップＳ１０８）、ユーザ端末１２０において自由視点コンテンツの視聴に利用される。例えば、ユーザ端末１２０において見どころ情報及び見どころ視点を用いて自由視点コンテンツのダイジェスト映像が作成され、ユーザに向けて再生されてもよい。

　その後、例えば、サーバ１００において本動作を終了するか否かが判定され（ステップＳ１０９）、終了する場合（ステップＳ１０９のＹＥＳ）、本動作が終了される。一方、終了しない場合（ステップＳ１０９のＮＯ）、本動作がステップＳ１０１へ戻り、以降の動作が実行される。

　なお、上記で例示した動作では、見どころとなるシーンの位置及び時間と、このシーンを視聴する際の視点位置及び視聴方向を決定してユーザに滞京したが、自由視点コンテンツの特性や視聴形態によっては、これらすべての情報をユーザに提供する必要はなく、１以上の情報がユーザへ提供されて自由視点コンテンツの視聴に利用されてもよい。

　１．４　動作フローの詳細例
　つづいて、上述した動作フローにおける各ステップの詳細について、図４及び図５に示す動作フロー例を参照しつつ説明する。図４は、本実施形態に係る見どころ時間を計算する際の動作フロー例を示し、図５は、本実施形態に係る見どころ位置を計算する際の動作フロー例を示している。なお、以下の動作例は、自由視点コンテンツの制作に用いた題材の種類によって各要素の適切な計算方法が変わるものであってよい。以下の説明では、明確化のため、引き続き、サッカーなどのスポーツを題材とした自由視点コンテンツを利用する場合を例に挙げる。

　１．４．１　イベント重要度計算フロー例
　まず、図３のステップＳ１０２に示すイベント重要度の計算フローについて、例を挙げて説明する。イベント重要度の計算フローでは、自由視点コンテンツに含まれるイベントデータを基に、自由視点コンテンツ内の位置的な重要度（以下、位置的重要度ともいう）と、時間的な重要度（以下、時間的重要度ともいう）とがそれぞれ計算される。したがって、本実施形態に係るイベント重要度には、イベントデータの位置的重要度と時間的重要度とが含まれ得る。

　（位置的重要度計算例）
　まず、イベントデータの位置的重要度の計算例について説明する。図６は、本実施形態に係るイベントデータの位置的重要度の計算例を説明するための図である。なお、図６には、例として、サッカーの試合において、ある時間ｔから５秒（例えば、後述の単位時間に相当）以内に起こったイベントが示されているものとする。また、本説明では、明確化のため、自由視点コンテンツの仮想空間を２次元平面で表現するが、実際には３次元空間であってよい。

　図６に示すように、本実施形態では、自由視点コンテンツの仮想空間ＶＳがグリッド状（３次元空間であれば、キューブ状）の複数の領域（以下、グリッドともいう）に分割される。図６に示す例では、（１）～（２）の２行と（Ｉ）～（ＩＩＩ）の３列とからなる２行３列の計６つのグリッド（Ｉ，１）～（ＩＩＩ，２）に分割されている。

　イベント重要度の計算では、以上のように分割されたグリッド（Ｉ，１）～（ＩＩＩ，２）ごとに、時間スロットごとのイベントデータの地理的密度が計算される（図５のステップＳ３０１参照）。時間スロットとは、侍従視点コンテンツの時間軸を所定の時間（以下、単位時間ともいう）ごとに区切った場合の各期間であってよい。

　図６に示す例では、左上隅のグリッド（Ｉ，１）においてゴール前の攻防が行われている。そのため、複数の選手ａ～ｄがグリッド（Ｉ，１）内に密集して短時間に多くの行動を行っている。一方で、それ以外のグリッド（ＩＩ，１）～（ＩＩＩ，２）では、ボールを伴う攻防が行われておらず、選手が例えば単純に移動しているか待機しているかの状態であるため、選手間の距離が疎で、各選手の動きは少ない。

　このようなシーンでは、左上隅のグリッド（Ｉ，１）におけるイベントの地理的密度が高くなることから、このグリッド（Ｉ，１）が見どころである蓋然性が高い。

　このような考え方のもと、イベント重要度計算部１０１は、各時間スロットにおける、グリッドごとのイベントデータの地理的密度（以下、イベント密度ともいう）を求め、その値を０～１の範囲で正規化することで、ある時間（時間スロット）、ある地点（グリッド）におけるイベントデータの位置的重要度を計算する（図５のステップＳ３０２参照）。その際、イベントデータごとに予め設定しておいた重みが乗算されてもよい。これは、スポーツの種類やコンサートなど、題材としたコンテンツによってイベントデータの重要度に差が生じ得るためである。

　（時間的重要度計算例）
　次に、イベントデータの時間的重要度の計算例について説明する。イベントデータの時間的重要度は、例えば、時間スロットごとにおける、イベントデータの密度（以下、時間的密度ともいう）と、イベントデータの位置的な密度（以下、位置的密度ともいう）との２つの要素を合算することで計算される。

　・イベントデータの時間的密度
　イベントデータの時間的密度は、例えば、時間スロットごとのイベントデータの密集度に基づいて計算される。図７は、本実施形態に係るイベントデータの時間的密度の計算例を説明するための図である。

　図７に示す例では、自由視点コンテンツの時間軸を例えばスロット＃Ａ～＃Ｃを含む複数の時間スロットに分割した場合に、スロット＃Ａにはイベントデータとしてある選手ｘのドリブル（イベントデータｘとする）が含まれ、スロット＃Ｂにはイベントデータとしてボールのラインアウト（イベントデータｙとする）が含まれ、スロット＃Ｃにはイベントデータとしてある選手ａによるキック（イベントデータａとする）と、ある選手ｂによるヘディング（イベントデータｂとする）と、ある選手ｃによるシュート（イベントデータｃとする）と、ある選手ｄによるキャッチ（イベントデータｄとする）とが含まれている。

　このような例では、スロット＃Ｃに含まれるイベントデータの数（４つ）が、他のスロット＃Ａ及び＃Ｂに含まれるイベントデータの数（１つ）よりも大きいことから、スロット＃Ｃが見どころである蓋然性が高い。

　このような考え方のもと、イベント重要度計算部１０１は、各時間スロットにおけるイベントデータの時間的密度を求め、その値を０～１の範囲で正規化する（図４のステップＳ２０１参照）。

　・イベントデータの位置的密度
　イベントデータの位置的密度は、例えば、時間スロットごとにおけるグリッドごとのイベントデータの密集度に基づいて計算される。図８は、本実施形態に係るイベントデータの位置的密度の計算例を説明するための図である。

　図８には、ある時間スロットにおいて、左上隅のグリッド（Ｉ，１）にて４人の選手ａ１～ｄ１がゴール前の攻防を行っている場合（Ａ）と、グラウンドの中央上のグリッド（ＩＩ，１）及び（ＩＩ，２）にて４人の選手ａ２～ｄ２が左方向へ単純に移動している場合（Ｂ）とが示されている。（Ａ）に示される時間スロットに含まれるイベントデータの数と、（Ｂ）に示される時間スロットに含まれるイベントデータの数とは共に４つであり、それぞれのシーンで発生したイベントデータの数は同じであるが、（Ｂ）のシーンよりも（Ａ）のシーンの方が、各イベントデータが関連付けられている仮想空間内の位置の間隔が近い。

　このような例では、１つのグリッド内に含まれるイベントデータの数が、（Ｂ）のシーンよりも（Ａ）のシーンの方が大きいため、（Ａ）のシーン（時間スロット）が見どころである蓋然性が高い。

　このような考え方のもと、イベント重要度計算部１０１は、時間スロットごとに、各グリッドにおけるイベントデータの位置的密度を求め、その値を０～１の範囲で正規化する（図４のステップＳ２０２参照）。

　・時間的重要度
　イベントデータの時間的重要度は、例えば、以上のように算出した時間的密度及び位置的密度を合算し、合算後の値を０～１の範囲で正規化することで求められる（図４のステップＳ２０３参照）。その際、時間的密度及び位置的密度それぞれに予め設定しておいた重みが乗算されてもよい。これは、スポーツの種類やコンサートなど、題材としたコンテンツによってイベントの重要度に差が生じ得るためである。例えば、サッカーやバスケットボールなどでは密度が大きい方が重要なシーンである可能性が高いと考えられるが、アメリカンフットボールや演劇などでは密度が低い方が重要なシーンである可能性が高いと考えられるためである。

　その他、イベントデータに基づいた重要度の算出では、イベントごとに異なる重みが設定されて乗算されてもよい。これは、例えば、「ただジャンプしている」というイベントよりも「シュートしている」といったイベントの方が見どころである可能性が高く、このように、コンテンツごと、イベントごとに重要度が変化する可能性があるためである。

　１．４．２　動き重要度計算フロー例
　次に、図３のステップＳ１０３に示す動き重要度の計算フローについて、例を挙げて説明する。動き重要度の計算フローでは、自由視点コンテンツに含まれるオブジェクトの動きの密度、速度、加速度等を基に、自由視点コンテンツ内の位置的重要度と時間的重要度とがそれぞれ計算される。したがって、本実施形態に係る動き重要度には、イベント重要度と同様に、オブジェクトの動きの位置的重要度と時間的重要度とが含まれ得る。

　（位置的重要度計算例）
　まず、動きの位置的重要度の計算例について説明する。動きの位置的重要度は、例えば、時間スロットごとにおける、各グリッド内のオブジェクトの密度（以下、オブジェクト密度ともいう）（図５のステップＳ３０３参照）と、各グリッド内でのオブジェクトの速度や加速度等の平均（以下、動きパラメータともいう）（図５のステップＳ３０４参照）との２つの要素を合算することで計算される。動きパラメータは平均に限定されず、中央値や標準偏差や積算値など、種々変形されてよい。

　例えば、サッカーであれば、重要なシーンであるほど、選手やボールが密集して激しく動いていると考えられる。そのため、このようなシーンでは、オブジェクト密度や動きパラメータが大きな値になると予想される。そこで、動き重要度計算部１０２は、オブジェクト密度と動きパラメータとをそれぞれ０～１の範囲で正規化し、正規化され得た値を合算し、再度、合算後の値を正規化することで、各時間スロットにおけるグリッドごとのオブジェクトの動きに関する位置的重要度を算出する（図５のステップＳ３０５参照）。その際、オブジェクト密度及び動きパラメータそれぞれに予め設定しておいた重みが乗算されてもよい。これは、イベントデータの時間的重要度と同様に、スポーツの種類やコンサートなど、題材としたコンテンツによってオブジェクトの動きの重要度に差が生じ得るためである。

　（時間的重要度計算例）
　次に、動きの時間的重要度の計算例について説明する。動きの時間的重要度は、例えば、時間スロットごとにおける、全グリッドのオブジェクト密度の平均（以下、オブジェクト密度平均ともいう）（図４のステップＳ２０４参照）と、全グリッドの動きパラメータの平均（以下、動きパラメータ平均ともいう）（図４のステップＳ２０５参照）との２つの要素を合算することで計算される（図４のステップＳ２０６参照）。オブジェクト密度平均及び／又は動きパラメータ平均は、平均に限定されず、中央値や標準偏差や積算値など、種々変形されてよい。

　なお、時間的重要度の計算において、時間スロットごとにおける各グリッドのオブジェクト密度と動きパラメータとは、上述した位置的重要度の計算において算出された値が流用されてもよい。その場合、動き重要度計算部１０２は、位置的重要度の計算において時間スロットごとに算出された全グリッドのオブジェクト密度と動きパラメータとをそれぞれ平均化することで、時間スロットごとにおける、全グリッドのオブジェクト密度平均と動きパラメータ平均とを算出してよい。その際、オブジェクト密度及び動きパラメータそれぞれに予め設定しておいた重みが乗算されてもよい。これは、位置的重要度と同様に、スポーツの種類やコンサートなど、題材としたコンテンツによってオブジェクトの動きの重要度に差が生じ得るためである。

　１．４．３　視聴重要度計算フロー例
　次に、図３のステップＳ１０５に示す視聴重要度の計算フローについて、例を挙げて説明する。

　自由視点コンテンツを視聴する際、ユーザは見たいシーンへのシークや視聴する際の視点位置及び視聴方向の制御などの各種操作をユーザ端末１２０から入力することになるが、多くのユーザが視聴したシーンは見どころとなるシーンである可能性が高く、また、各シーンで多くのユーザが設定した視点位置及び視聴方向はそのシーンを視聴する際の最適な視点位置及び視聴方向である可能性が高い。

　そこで、自由視点コンテンツが特定又は不特定のユーザにより視聴された際のシーク操作に関する情報（以下、視聴時間情報ともいう）や視点位置及び視聴方向の操作に関する情報（以下、視聴位置情報ともいう）を視聴履歴として収集しておくことで、蓄積された視聴履歴に基づいて各シーン（時間スロット）の重要度やそのシーンでの最適な視点位置及び視聴方向を計算することが可能となる。

　また、本実施形態に係る視聴履歴には、視聴時間情報及び視聴位置情報の他に、自由視点コンテンツを視聴中にユーザが発した音声やリアクションなどに関する情報（以下、リアクション情報ともいう）が含まれてもよい。これは、盛り上がりのある瞬間には、視聴者の発する歓声がそれ以外の場面よりも大きくなっている可能性が高く、また、ボイスチャットやテキストチャットなどが行われている場合は、そこでの会話も活発になる可能性が高いためである。

　そこで、本実施形態では、コンテンツ視聴部１２１が、視聴中にユーザが発した音声を入力する機能や、ユーザ間でボイスチャットやテキストチャットなどを行うための機能（以下、意思表示ツールともいう）を搭載する。特定の自由視点コンテンツを視聴中に特定又は不特定のユーザから意思表示ツールにより収集されたリアクション情報は、当該自由視点コンテンツに関連付けられた視聴履歴の一部として視聴履歴データベース１１２に蓄積される。なお、リアクション情報を含む視聴履歴は、見どころ利用部１２２を介した見どころ情報等の提供が行われていない状況で収集されてもよいし、見どころ情報等の提供が行われている状況で収集されてもよい。

　本実施形態に係る視聴重要度には、イベント重要度及び動き重要度と同様に、位置的重要度と時間的重要度とが含まれ得る。

　（位置的重要度計算例）
　まず、位置的重要度の計算例について説明する。図９は、本実施形態に係る視聴重要度における位置的重要度の計算例を説明するための図である。図９に示すように、視聴重要度における位置的重要度の計算では、視聴履歴データベース１１２に蓄積された視聴履歴に基づいて、視聴履歴のヒートマップが生成される。なお、図９では、ある時間スロットにおいて多くのユーザが視聴している領域ほど、濃いハッチングが付与されている。

　ある時間スロットにおいて、特定の位置を視聴しているユーザが多い場合は、仮想空間ＶＳ内が満遍なく視聴されている場合よりも、重要な視聴位置があると予想される。そこで、視聴重要度計算部１０３は、例えば、視聴履歴に基づいて作成したヒートマップを用いて、ある時間スロットにおける各グリッド内の視聴履歴の集中度を計算し（図５のステップＳ３０６参照）、視聴履歴が最も集中している位置（例えば、グリッド）の視聴履歴の集中度と、その他の位置（グリッド）の視聴履歴の集中度の平均値との差を、特定した位置（グリッド）の位置的重要度として計算する（図５のステップＳ３０７参照）。

　（時間的重要度計算例）
　次に、時間的重要度の計算例について説明する。視聴重要度における時間的重要度は、例えば、時間スロットごとにおける視聴履歴のヒートマップと、時間スロットごとの視聴者数と、時間スロットごとのリアクション情報とのそれぞれから求まる重要度に基づいて計算され得る。

　・ヒートマップから求まる重要度（ヒートマップ重要度）
　図１０は、本実施形態に係るヒートマップから求まる重要度（以下、ヒートマップ重要度ともいう）の計算例を説明するための図である。図１０に示すように、時間スロットごとのヒートマップを作成した場合、（Ａ）に示すように、ユーザによる視聴場所（グリッド）が集中しているシーンは、（Ｂ）のように、視聴場所が広い領域に分散しているシーンよりも、試合が盛り上がっている可能性が高い。そこで、視聴重要度計算部１０３は、時間スロットごとに各グリッドの視聴位置の集中度を算出し、算出された集中度のうちの最大値を、当該時間スロットの重要度の指標とする。そして、視聴重要度計算部１０３は、時間スロットごとに決定した重要度の指標を０～１の範囲で正規化することで、各時間スロットにおけるヒートマップ重要度を計算する（図４のステップＳ２０７参照）。

　・視聴者数から求まる重要度（視聴者数重要度）
　図１１は、本実施形態に係る視聴者数から求まる重要度（以下、視聴者数重要度）の計算例を説明するための図である。図１１に示すように、視聴履歴データベース１１２に蓄積された視聴履歴を解析することで、自由視点コンテンツの時間軸に沿った視聴者数の推移を特定することが可能である。

　例えば、ユーザ端末１２０の表示部にＵＩ（ユーザインタフェース）として表示されたシークバーなどをユーザが操作することで時間軸上の視聴位置が移動可能である場合、多くのユーザがシークせずに視聴している時間帯（すなわち、視聴者数が多い時間スロット）は、試合が盛り上がっている時間帯である可能性が高い。そこで、視聴重要度計算部１０３は、時間スロットごとの視聴者数を０～１の範囲で正規化することで、各時間スロットにおける視聴者数重要度を計算する（図４のステップＳ２０８参照）。

　・リアクション情報から求まる重要度（リアクション重要度）
　意思表示ツールで収集されるリアクション情報には、視聴中にユーザが発した音声（音量や内容等を含み得る）や、意思表示ツールにおけるボイスチャット機能やテキストチャット機能などを利用してユーザ間でやり取りされた内容等が含まれ得る。そこで、視聴重要度計算部１０３は、リアクション情報として収集された音声や内容等に基づいて、リアクション重要度を計算する。

　例えば、視聴中にユーザが発した音声に関しては、ボイスチャット機能にて入力された音声や単にユーザが漏らした音声を録音し、その音量の変化量からリアクション重要度が算出されてもよい。

　具体的には、例えば、全ユーザに関し、時間スロットごとの最大音量と最小音量との差を算出し、算出された差を０～１の範囲で正規化する。そして、正規化後の値が大きい時間スロットを見どころのシーンに相当する時間帯とみなし、全ユーザに関して算出された値（正規化後）の平均をリアクション重要度として計算する（図４のステップＳ２０９参照）。

　なお、意思表示ツールがスタンプやライクなどの単純なメッセージを発信する機能を備える場合、ユーザはこの機能を用いて自身の感情を表すことも考えられる。また、スタンプやライクなどの単純なメッセージを発信する機能以外にも、テキストチャットなど、視聴者が能動的に自身の意見を発信する機能を意思表示ツールが備えることも考えられる。そこで、視聴重要度計算部１０３は、意思表示ツールを用いてユーザが発信した意思（リアクション情報）の時間的密度を計算し、それを０～１の範囲で正規化することでリアクション重要度が算出されてもよい（図４のステップＳ２１０参照）。

　・時間的重要度
　視聴重要度における時間的重要度は、以上のようにして計算されたヒートマップ重要度、視聴者数重要度及びリアクション重要度のうちの少なくとも１つを合算し、合算後の値を０～１の範囲で正規化することで求められる（図４のステップＳ２１１参照）。その際、ヒートマップ重要度、視聴者数重要度及びリアクション重要度それぞれに予め設定しておいた重みが乗算されてもよい。

　１．４．４　見どころ情報生成フロー例
　図３のステップＳ１０６に示す見どころ情報の生成では、以上のようにして取得されたイベント重要度（位置的重要度及び時間的重要度）、動き重要度（位置的重要度及び時間的重要度）及び視聴重要度（位置的重要度及び時間的重要度）の計６つの重要度に基づいて、見どころ情報が生成される。

　例えば、見どころ情報生成部１０４は、上記６つの重要度を合算することで、見どころとなるシーンの時間（時間スロット）と位置（グリッド）とを含む見どころ情報を生成してもよい。例えば、見どころ情報生成部１０４は、イベントデータの時間的重要度と、オブジェクトの動きの時間的重要度と、視聴履歴の時間的重要度を合算することで、見どころ時間を計算してもよい（図４のステップＳ２１２参照）。また、見どころ情報生成部１０４は、イベントデータの位置的重要度と、オブジェクトの動きの位置的重要度と、視聴履歴の位置的重要度を合算することで、見どころ位置を計算してもよい（図５のステップＳ３０８参照）。

　その際、６つの重要度それぞれに予め設定しておいた重みが乗算されてもよい。これは、例えば、視聴重要度は蓄積されている視聴情報の数が少ない場合は正しい値が求まらない可能性が高いことや、自由視点コンテンツによってはイベント重要度と動き重要度とに偏りがある可能性があるためである。また、ここでいうグリッドの位置とは、例えば、グリッドにおける中心の座標や四隅のうちの何れかの座標など、グリッドに対して予め設定しておいた基準となる位置であってよい。

　１．４．５　見どころ視点決定フロー例
　上述した見どころ情報の生成までの流れでは、見どころとなるシーンの位置（グリッド）、つまり「どこを見るべきか」を求めた。しかしながら、自由視点コンテンツでは、視点、つまり「どこから見るべきか」を決定する必要もある。そこで、図３のステップＳ１０７では、見どころ情報におけるシーンの位置（グリッド）と、そのシーンでの自由視点コンテンツ内の遮蔽物（オブジェクト（建造物などを含んでよい）等）の位置との関係から、見どころ位置を視聴するのに最適な見どころ視点（視点位置及び視聴方向）の決定を行う。

　図１２～図１６は、本実施形態に係る見どころ視点の決定フロー例を説明するための図である。

　例えば、ある時間スロット（これをフレームＮとする）において、オブジェクトＯＢ１１～ＯＢ１４及び見どころ位置Ｐ１が図１２に例示する位置に存在し、次の時間スロット（これをフレームＮ＋１とする）において、オブジェクトＯＢ１～ＯＢ４及び見どころ位置Ｐ２が図１３に例示する位置に存在する場合、フレームＮで見どころ位置Ｐ１がオブジェクトＯＢ１～ＯＢ４によって遮蔽されてしまう領域（すなわち、死角となる領域。以下、遮蔽領域ともいう）は図１４においてハッチングされた領域となり、フレームＮ＋１で見どころ位置Ｐ２がオブジェクトＯＢ１～ＯＢ４による遮蔽領域は図１５においてハッチングされた領域となる。なお、フレーム間でオブジェクトの数は増減してもよい。

　各フレームにおける遮蔽領域は、見どころ位置とオブジェクトとの位置関係から直線の方程式などを用いて幾何的・数学的に算出する方法や、ＳＬＡＭ（Simultaneous　Localization　and　Mapping）等で用いられるような、見どころ位置から当たり判定を持つＲＡＹを発生させて計測する方法など、種々の方法で求めることができる。

　ここで、あるシーンを視聴中に視点位置が大きく変動することは、視聴者に酔いなどの不快感を与える可能性があり、また、映像のクオリティを低下させる要因ともなる。例えば、図１４に示す遮蔽領域に基づいてフレームＮで設定した視点位置が、図１５に示すフレームＮ＋１の遮蔽領域に含まれていると、頻繁に視点位置の変更が発生し得ることとなり、視聴者に映像酔いなどの不快感を与えてしまう可能性が存在する。

　そこで、図１６に例示されるように、見どころ視点決定部１０５は、見どころとなるシーンに含まれる連続する複数のフレームについて遮蔽領域を重畳することで、この複数のフレームにおいて遮蔽領域とならない領域（図１６においてハッチングされていない領域）を特定し、特定された領域内に見どころ視点Ｃ１、Ｃ２を設定して、見どころ位置Ｐ１及びＰ２を視聴するのに最適な見どころ視点（視点位置及び視聴方向）を決定する。

　なお、本説明では、簡略化のため、仮想空間を２次元で表現したが、３次元である場合も同様の手法で視点位置を決定することができる。

　見どころ視点決定部１０５は、以上のようにして特定された１以上の見どころ視点Ｃ１、Ｃ２の全てを見どころ利用部１２２へ通知してもよいし、特定された複数の見どころ視点Ｃ１、Ｃ２の中からオブジェクトの位置関係や見どころ位置Ｐ１及びＰ２からの距離等に基づいて最適な見どころ視点を１つ決定し、決定された見どころ視点を見どころ利用部１２２へ通知してもよい。若しくは、見どころ視点決定部１０５は、次の視点位置として決定した１以上の見どころ視点Ｃ１、Ｃ２のうち、直前の視点位置からの距離が最も短い視点位置を、１つの見どころ視点として決定してもよい。

　１．５　見どころ情報及び見どころ視点の利用例
　以上のようにして生成又は決定された見どころ情報及び見どころ視点は、自由視点コンテンツと共にユーザ端末１２０へ送信され（図３のステップＳ１０８）、ユーザ端末１２０の見どころ利用部１２２で利用される。見どころ情報及び見どころ視点の利用としては様々な形態が考えられる。以下にそのいくつかを例示する。

　１．５．１　ダイジェスト映像の生成
　見どころ情報及び見どころ視点に基づくことで、例えば、「あるシーンがどの程度重要か」、「そのシーンを見るにはどこからどこを見るのが適切か」という情報を特定することが可能である。そこで、見どころ利用部１２２は、見どころ情報から特定可能なシーンの重要度に対して閾値を設定することで、自由視点コンテンツから見どころとなるシーンが抽出されたダイジェスト映像を自動的に生成することが可能である。その際、ユーザによる閾値の調整を可能とすることで、見どころ利用部１２２は、ユーザごとに異なるダイジェスト映像を生成することも可能となる。

　なお、見どころ利用部１２２がユーザ端末１２０に実装されている場合は、ユーザ端末１２０において見どころ情報及び見どころ視点に基づいて自由視点コンテンツのレンダリングが行われてダイジェスト映像が生成されてよい。一方、見どころ利用部１２２がサーバ１００に実装されている場合は、サーバ１００において見どころ情報及び見どころ視点に基づいて自由視点コンテンツのレンダリングが行われてダイジェスト映像が生成され、生成されたダイジェスト映像がネットワーク１３０を介してユーザ端末１２０に送信され、ユーザ端末１２０のコンテンツ視聴部１２１においてユーザへ向けて再生されてよい。

　１．５．２　視聴位置（視点位置）のサジェスチョン
　また、見どころ情報及び見どころ視点に基づくことで、例えば、「この視点から見るのが良い」、「見どころポイントはこの時間にある」という情報を特定することも可能である。これらの情報は、例えばタグのような形態でユーザに提供されてもよい。図１７は、本実施形態に係る自由視点コンテンツの表示画面の一例を示す図である。

　図１７に示すように、例えば、「この視点から見るのが良い」という情報は、自由視点コンテンツ内の該当位置（提案する視点位置）にオブジェクト４０２として配置され、表示画面４０１を介してユーザに提供されてもよい。また、図１７に示すように、例えば、「見どころポイントはこの時間にある」という情報は、表示画面４０１にＵＩとして表示されるシークバー４０３に付随するタグ４０４としてユーザに提供されてもよい。

　このように、例えば、「この視点から見るのが良い」、「見どころポイントはこの時間にある」という情報をユーザへ提供することで、より円滑・高速でクオリティの高い視聴体験をユーザに提供することが可能となる。

　なお、ユーザによっては、自身で視聴時間や視聴位置を選択したい場合もあるため、見どころ利用部１２２からの提案を利用するか否かをユーザによって選択できてもよい。

　このように、情報処理システム１側で強制的に視聴時間や視聴位置を制御しない構成とすることで、ユーザが３Ｄ酔いや画面酔いなどの不快感を持つことを抑制することが可能となる。

　１．５．３　コーチング目的のプレイダイジェスト映像の生成
　例えば、イベント重要度計算部１０１においてイベントデータから重要度（位置的重要度及び／又は時間的重要度）を算出する際、アバターごとに異なる重みを付与可能な構成とすることで、特定の選手や役者等が写っているシーンを抜粋してダイジェスト映像を生成することが可能となる。そして、このようにして生成されたダイジェスト映像は、例えば、スポーツや演劇のコーチング目的に用いることが好適であると考えられる。なお、特定の選手や役者等に対する重みの設定は、例えば、ユーザ端末１２０の入力部からイベント重要度計算部１０１に対して設定できるように構成されてもよい。

　１．５．４　メタ情報の活用
　自由視点コンテンツの対象を演劇やコンサートなどとした場合、台本や歌詞などをイベントデータやメタデータとして用いることができるため、見どころ情報の生成や見どころ位置の決定の際に、歌詞のサビや作劇上のクライマックスの情報を考慮するように構成することも可能である。

　１．６　まとめ
　以上のように、本実施形態によれば、イベントデータ、オブジェクトの動き、視聴履歴に基づいて、自由視点コンテンツにおけるどのシーンが見どころであるかや、どこから見るのが適切かを特定することが可能となるため、見どころであるシーンのユーザへの提案や見どころとなるシーンのダイジェスト映像の自動生成などを実行することが可能となる。それにより、視聴者が見どころであるシーンを見逃してしまうことを抑制することが可能となる。

　１．７　変形例
　次に、上述した実施形態の変形例について、いくつか例を挙げて説明する。

　１．７．１　重要度計算部の変形例
　上述した実施形態では、各種重要度を求める際（例えば、動き重要度における時間的重要度の計算）に平均値（例えば、オブジェクト密度の平均や全グリッドの動きパラメータの平均）を使用していたが、これに限定されず、上述したように、例えば、中央値や標準偏差や積算値などが用いられてもよい。

　また、上述した実施形態では、重要度を求める際のパラメータ（例えば、イベント密度、イベントデータの時間的密度及び位置的密度並びにそれらを合算した値、オブジェクト密度及び動きパラメータそれらを合算した値、時間スロットごとに決定した重要度の指標、時間スロットごとの視聴者数、時間スロットごとの最大音量と最小音量との差、リアクション情報の時間的密度、ヒートマップ重要度、視聴者数重要度及びリアクション重要度のうちの少なくとも１つを合算した値）を０～１の範囲で正規化していたが、これに限定されず、種々の正規化手法が採用されてもよい。

　さらに、動き重要度の算出には、オブジェクトの速度や加速度のみならず、角速度や角加速度など、オブジェクトの動きを表す種々の指標が使用されてもよい。

　このように、重要度の計算手法は、上記実施形態で例示した手法に限定されず、例えば、対象の自由視点コンテンツやユーザなどに応じて設計されるなど、種々変形されてもよい。

　１．７．２　見どころ情報及び見どころ視点の組み合わせ変形例
　上述した実施形態では、見どころ利用部１２２が見どころ情報（見どころ位置及び見どころ視点）と見どころ視点との全てを利用する場合を例示したが、これに限定されず、見どころ利用部１２２が利用する情報及び／又は見どころ利用部１２２へ送信される情報は、見どころ情報（見どころ位置及び見どころ視点）と見どころ視点とのうちの一部であってもよい。その際、システム側又はユーザ側でどの情報を使用しないかを選択できてもよい。

　１．７．３　リモートの場合の変形例
　コンサートや演劇などをコンテンツ化して自由視点コンテンツとして利用する場合にも、上記した実施形態を適用することが可能であるが、その際には、イベント重要度の重みを他の重要度の重みよりも大きくしたり、台本などの自然言語的なメタ情報を計算に加えたりすることで、より見どころのあるシーンのダイジェスト映像や示唆をユーザに提供することが可能となる。

　１．７．４　見どころ視点の俯瞰固定
　サッカーや野球などのスポーツの映像には、テレビ番組などで定番とされる俯瞰視点が存在する。そのため、スポーツを自由視点コンテンツの対象とした場合、見どころ視点が俯瞰や固定カメラなどの特定の視点に固定されてもよい。

　１．７．５　３Ｄ酔い／映像酔いの軽減
　自由視点コンテンツを視聴する際、急激な視点の変更は視聴者の３Ｄ酔いや映像酔いを誘発する恐れがある。すなわち、上述した実施形態では、自由視点コンテンツから得られた情報（イベントデータ、オブジェクトの動き、視聴履歴）を用いて見どころ視点を計算したが、この場合、視聴者が自身の視聴動作と見どころ視点の利用とを併用した場合、視点位置が頻繁に大きく変更し、３Ｄ酔いや映像酔いが誘発されてしまう可能性がある。そこで、見どころ視点決定部１０５は、視聴者が利用している視点（例えば、直前の視点位置及び視聴方向）になるべく近い位置の視点となるように、見どころ視点を決定してもよい。それにより、視点位置が頻繁に大きく変更されることを抑制できるため、３Ｄ酔いや映像酔いの誘発を軽減することが可能となる。

　２．ハードウエア構成
　上述してきた実施形態及びその変形例に係るサーバ１００及びユーザ端末１２０のうちの少なくとも１つは、例えば図１８に示すような構成のコンピュータ１０００によって実現され得る。図１８は、サーバ１００及びユーザ端末１２０のうちの少なくとも１つの機能を実現するコンピュータ１０００の一例を示すハードウエア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read　Only　Memory）１３００、ＨＤＤ（Hard　Disk　Drive）１４００、通信インタフェース１５００、及び入出力インタフェース１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウエアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る各動作を実行するためのプログラムを記録する記録媒体である。

　通信インタフェース１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインタフェースである。例えば、ＣＰＵ１１００は、通信インタフェース１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インタフェース１６００は、上述したＩ／Ｆ部１８を含む構成であり、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインタフェースである。例えば、ＣＰＵ１１００は、入出力インタフェース１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インタフェース１６００を介して、ディスプレイやスピーカやプリンタ等の出力デバイスにデータを送信する。また、入出力インタフェース１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインタフェースとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が上述の実施形態に係るサーバ１００／ユーザ端末１２０として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、サーバ１００／ユーザ端末１２０のうちの少なくとも１つの機能を実現する。また、ＨＤＤ１４００には、本開示に係るプログラム等が格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

　以上、本開示の実施形態について説明したが、本開示の技術的範囲は、上述の各実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

　さらに、上述した各実施形態は、それぞれ単独で使用されてもよいし、他の実施形態と組み合わせて使用されてもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得する取得部と、
　前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する生成部と、
　を備える情報処理装置。
（２）
　前記生成部は、前記自由視点コンテンツの時間的長さよりも短い長さを示す前記視聴時間を生成する
　前記（１）に記載の情報処理装置。
（３）
　前記視聴時間及び前記視聴位置を所定のネットワークを介して外部へ出力する出力部をさらに備える
　前記（１）又は（２）に記載の情報処理装置。
（４）
　前記視聴時間及び前記視聴位置に基づいて前記自由視点コンテンツのダイジェスト映像を生成する利用部をさらに備える
　前記（１）～（３）の何れか１つに記載の情報処理装置。
（５）
　前記視聴位置の映像を生成する際に使用される前記自由視点コンテンツ内の視点位置及び視聴方向を決定する決定部をさらに備える
　前記（１）～（４）の何れか１つに記載の情報処理装置。
（６）
　前記決定部は、前記視点位置から前記視聴位置を見た際に前記視聴位置が前記自由視点コンテンツ内の１以上のオブジェクトで遮蔽されない領域内に前記視点位置を設定する
　前記（５）に記載の情報処理装置。
（７）
　前記決定部は、連続する複数のフレームにおいて、前記視点位置から前記視聴位置を見た際に前記視聴位置が前記１以上のオブジェクトで遮蔽されない領域内に前記視点位置を設定する
　前記（６）に記載の情報処理装置。
（８）
　前記決定部は、次の視点位置として１以上の視点位置を決定し、決定された前記１以上の視点位置のうち直前の視点位置からの距離が最も短い視点位置を、次の視点位置に決定する
　前記（５）～（７）の何れか１つに記載の情報処理装置。
（９）
　前記自由視点コンテンツに関連する情報に基づいて前記自由視点コンテンツの時間帯ごとの重要度を計算する重要度計算部をさらに備え、
　前記生成部は、前記重要度に基づいて視聴時間及び視聴位置を生成する
　前記（１）～（８）の何れか１つに記載の情報処理装置。
（１０）
　前記重要度は、前記自由視点コンテンツが表現する仮想空間における位置ごとの第１重要度と、前記時間帯ごとの第２重要度とを含む
　前記（９）に記載の情報処理装置。
（１１）
　前記重要度計算部は、前記第１重要度と前記第２重要度とを合算することで、前記重要度を計算する
　前記（１０）に記載の情報処理装置。
（１２）
　前記重要度計算部は、前記第１重要度及び前記第２重要度に対して予め設定された重みを乗算し、前記重みが乗算された前記第１重要度及び前記第２重要度を合算することで、前記重要度を計算する
　前記（１１）に記載の情報処理装置。
（１３）
　前記重要度計算部は、前記自由視点コンテンツが表現する仮想空間を複数の領域に分割し、分割された前記領域ごとに前記第１重要度を計算する
　前記（１０）～（１２）の何れか１つに記載の情報処理装置。
（１４）
　前記自由視点コンテンツに関連する情報は、前記自由視点コンテンツ内で発生したイベントを示すイベントデータ、前記自由視点コンテンツに含まれる１以上のオブジェクトの動き、及び、前記自由視点コンテンツの視聴履歴のうちの少なくとも１つを含み、
　前記重要度計算部は、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴のうちの少なくとも１つを用いて前記重要度を計算する
　前記（９）～（１３）の何れか１つに記載の情報処理装置。
（１５）
　前記重要度計算部は、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴のうちの少なくとも２つそれぞれに基づいて第３重要度を計算し、計算された第３重要度を合算することで、前記重要度を計算する
　前記（１４）に記載の情報処理装置。
（１６）
　前記重要度計算部は、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴のうちの少なくとも２つそれぞれに基づいて計算された前記第３重要度に対し、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴ごとに設定された重みを乗算し、前記重みが乗算された前記第３重要度を合算することで、前記重要度を計算する
　前記（１５）に記載の情報処理装置。
（１７）
　前記ユーザに関連する情報は、年代、性別、趣味及び嗜好のうちの少なくとも１つを含む
　前記（１）～（１６）の何れか１つに記載の情報処理装置。
（１８）
　前記自由視点コンテンツに関連する情報は、前記自由視点コンテンツ内で発生したイベントを示すイベントデータ、前記自由視点コンテンツに含まれる１以上のオブジェクトの動き、前記自由視点コンテンツの視聴履歴、及び、前記自由視点コンテンツに付与されたメタ情報のうちの少なくとも１つを含む
　前記（１）～（１７）の何れか１つに記載の情報処理装置。
（１９）
　所定のネットワークを介して接続されたユーザ端末へ自由視点コンテンツの視聴サービスを提供する情報処理装置において実行される情報処理方法であって、
　前記自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得し、
　前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する
　ことを含む情報処理方法。
（２０）
　所定のネットワークを介して接続されたユーザ端末へ自由視点コンテンツの視聴サービスを提供する情報処理装置が備えるプロセッサを機能させるためのプログラムであって、
　前記自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得する処理と、
　前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する処理と、
　を前記プロセッサに実行させるためのプログラム。

　１　情報処理システム
　１００　サーバ
　１１０　データベース
　１２０、１２０ａ、１２０ｂ、…　ユーザ端末
　１３０　ネットワーク
　１０１　イベント重要度計算部
　１０２　動き重要度計算部
　１０３　視聴重要度計算部
　１０４　見どころ情報生成部
　１０５　見どころ視点決定部
　１１１　コンテンツデータベース
　１１２　視聴履歴データベース
　１２１　コンテンツ視聴部
　１２２　見どころ利用部
　４０１　表示画面
　４０２　オブジェクト
　４０３　シークバー
　４０４　タグ

Claims

　自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得する取得部と、
　前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する生成部と、
　を備える情報処理装置。
　前記生成部は、前記自由視点コンテンツの時間的長さよりも短い長さを示す前記視聴時間を生成する
　請求項１に記載の情報処理装置。
　前記視聴時間及び前記視聴位置を所定のネットワークを介して外部へ出力する出力部をさらに備える
　請求項１に記載の情報処理装置。
　前記視聴時間及び前記視聴位置に基づいて前記自由視点コンテンツのダイジェスト映像を生成する利用部をさらに備える
　請求項１に記載の情報処理装置。
　前記視聴位置の映像を生成する際に使用される前記自由視点コンテンツ内の視点位置及び視聴方向を決定する決定部をさらに備える
　請求項１に記載の情報処理装置。
　前記決定部は、前記視点位置から前記視聴位置を見た際に前記視聴位置が前記自由視点コンテンツ内の１以上のオブジェクトで遮蔽されない領域内に前記視点位置を設定する
　請求項５に記載の情報処理装置。
　前記決定部は、連続する複数のフレームにおいて、前記視点位置から前記視聴位置を見た際に前記視聴位置が前記１以上のオブジェクトで遮蔽されない領域内に前記視点位置を設定する
　請求項６に記載の情報処理装置。
　前記決定部は、次の視点位置として１以上の視点位置を決定し、決定された前記１以上の視点位置のうち直前の視点位置からの距離が最も短い視点位置を、次の視点位置に決定する
　請求項５に記載の情報処理装置。
　前記自由視点コンテンツに関連する情報に基づいて前記自由視点コンテンツの時間帯ごとの重要度を計算する重要度計算部をさらに備え、
　前記生成部は、前記重要度に基づいて視聴時間及び視聴位置を生成する
　請求項１に記載の情報処理装置。
　前記重要度は、前記自由視点コンテンツが表現する仮想空間における位置ごとの第１重要度と、前記時間帯ごとの第２重要度とを含む
　請求項９に記載の情報処理装置。
　前記重要度計算部は、前記第１重要度と前記第２重要度とを合算することで、前記重要度を計算する
　請求項１０に記載の情報処理装置。
　前記重要度計算部は、前記第１重要度及び前記第２重要度に対して予め設定された重みを乗算し、前記重みが乗算された前記第１重要度及び前記第２重要度を合算することで、前記重要度を計算する
　請求項１１に記載の情報処理装置。
　前記重要度計算部は、前記自由視点コンテンツが表現する仮想空間を複数の領域に分割し、分割された前記領域ごとに前記第１重要度を計算する
　請求項１０に記載の情報処理装置。
　前記自由視点コンテンツに関連する情報は、前記自由視点コンテンツ内で発生したイベントを示すイベントデータ、前記自由視点コンテンツに含まれる１以上のオブジェクトの動き、及び、前記自由視点コンテンツの視聴履歴のうちの少なくとも１つを含み、
　前記重要度計算部は、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴のうちの少なくとも１つを用いて前記重要度を計算する
　請求項９に記載の情報処理装置。
　前記重要度計算部は、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴のうちの少なくとも２つそれぞれに基づいて第３重要度を計算し、計算された第３重要度を合算することで、前記重要度を計算する
　請求項１４に記載の情報処理装置。
　前記重要度計算部は、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴のうちの少なくとも２つそれぞれに基づいて計算された前記第３重要度に対し、前記イベントデータ、前記１以上のオブジェクトの動き及び前記視聴履歴ごとに設定された重みを乗算し、前記重みが乗算された前記第３重要度を合算することで、前記重要度を計算する
　請求項１５に記載の情報処理装置。
　前記ユーザに関連する情報は、年代、性別、趣味及び嗜好のうちの少なくとも１つを含む
　請求項１に記載の情報処理装置。
　前記自由視点コンテンツに関連する情報は、前記自由視点コンテンツ内で発生したイベントを示すイベントデータ、前記自由視点コンテンツに含まれる１以上のオブジェクトの動き、前記自由視点コンテンツの視聴履歴、及び、前記自由視点コンテンツに付与されたメタ情報のうちの少なくとも１つを含む
　請求項１に記載の情報処理装置。
　所定のネットワークを介して接続されたユーザ端末へ自由視点コンテンツの視聴サービスを提供する情報処理装置において実行される情報処理方法であって、
　前記自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得し、
　前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する
　ことを含む情報処理方法。
　所定のネットワークを介して接続されたユーザ端末へ自由視点コンテンツの視聴サービスを提供する情報処理装置が備えるプロセッサを機能させるためのプログラムであって、
　前記自由視点コンテンツを視聴するユーザに関連する情報又は前記自由視点コンテンツに関連する情報のうち少なくとも１つを取得する処理と、
　前記ユーザに関連する情報及び前記自由視点コンテンツに関連する情報のうちの前記少なくとも１つに基づいて前記自由視点コンテンツの視聴時間及び視聴位置を生成する処理と、
　を前記プロセッサに実行させるためのプログラム。