WO2022230253A1

WO2022230253A1 - 情報処理装置及び情報処理方法

Info

Publication number: WO2022230253A1
Application number: PCT/JP2022/001268
Authority: WO
Inventors: 俊也浜田
Original assignee: ソニーグループ株式会社
Priority date: 2021-04-28
Filing date: 2022-01-17
Publication date: 2022-11-03
Also published as: JPWO2022230253A1

Abstract

本情報処理装置は、レンダリング部を具備する。前記レンダリング部は、ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成する。また、前記レンダリング部は、前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定し、前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出し、前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させる。

Description

情報処理装置及び情報処理方法

　本技術は、ＶＲ（Virtual Reality：仮想現実）映像の配信等に適用可能な情報処理装置、及び情報処理方法に関する。

　近年、全天周カメラ等により撮影された、全方位を見回すことが可能な全天周映像が、ＶＲ映像として配信されるようになってきている。さらに最近では、視聴者（ユーザ）が、全方位見回し（視線方向を自由に選択）することができ、３次元空間中を自由に移動することができる（視点位置を自由に選択することができる）６ＤｏＦ（Degree of Freedom）映像（６ＤｏＦコンテンツとも称する）を配信する技術の開発が進んでいる。
　このような６ＤｏＦコンテンツは、時刻毎に、視聴者の視点位置、視線方向及び視野角（視野範囲）に応じて、１つもしくは複数の３次元オブジェクトで３次元空間を動的に再現するものである。
　このような映像配信においては、視聴者の視野範囲に応じて、視聴者に提示する映像データを動的に調整（レンダリング）することが求められる。例えば、このような技術の一例としては、特許文献１に開示の技術を挙げることができる。

特表２００７－５２０９２５号公報

　ＶＲ映像等の仮想的な映像（仮想映像）の配信は普及していくと考えられ、高品質な仮想映像の配信を可能とする技術が求められている。

　以上のような事情に鑑み、本技術の目的は、高品質な仮想映像の配信を実現することが可能な情報処理装置、及び情報処理方法を提供することにある。

　上記目的を達成するため、本技術の一形態に係る情報処理装置は、レンダリング部を具備する。
　前記レンダリング部は、ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成する。
　また、前記レンダリング部は、前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定し、前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出し、前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させる。

　この情報処理装置では、レンダリング対象となる２次元映像データの表示領域に対して、注目領域と非注目領域とが設定される。そして、注目領域内の注視オブジェクトが高解像度でレンダリングされ、注目領域内の非注視オブジェクトのデータ量が低減される。これにより、高品質な仮想映像の配信を実現することが可能となる。

　前記レンダリング処理に関するパラメータは、レンダリング対象となるオブジェクトまでの距離情報を含んでもよい。この場合、前記レンダリング部は、前記距離情報に基づいて、前記注目領域内の前記非注視オブジェクトのデータ量を低減させてもよい。

　前記レンダリング部は、前記注目領域内の前記非注視オブジェクトに対して、ぼかし処理を実行してもよい。

　前記レンダリング部は、実世界のレンズの被写界深度に基づくぼけをシミュレートすることで、前記ぼかし処理を実行してもよい。

　前記レンダリング部は、前記非注視オブジェクトまでの距離と、所定の基準距離との差分が大きくなるほど、前記非注視オブジェクトに対するぼかし強度を高く設定してもよい。　

　前記レンダリング部は、前記非注視オブジェクトまでの距離と所定の基準距離との差分に関して複数の範囲を設定し、前記複数の範囲の各々に対して、ぼかし強度を設定してもよい。

　前記レンダリング部は、前記非注視オブジェクトまでの距離と所定の基準距離との差分が０から第１の距離までの第１の範囲と、前記差分が前記第1の距離から前記第１の距離よりも大きい第２の距離までの第２の範囲とを設定し、前記第１の範囲に第１のぼかし強度を設定し、前記第２の範囲に前記第１のぼかし強度よりも高い第２のぼかし強度を設定してもよい。

　前記レンダリング部は、前記差分が前記第２の距離から前記第２の距離よりも大きい第３の距離までの第３の範囲を設定し、前記第３の範囲に第２のぼかし強度よりも高い第３のぼかし強度を設定してもよい。

　前記レンダリング部は、所定の基準距離よりも近い範囲に位置する前記非注視オブジェクトよりも、前記基準距離よりも遠い範囲に位置する前記非注視オブジェクトの方が強くぼけるように、前記ぼかし強度を設定してもよい。

　前記レンダリング部は、前記非注視オブジェクトを高解像度でレンダリングした後に、前記非注視オブジェクトに対して前記ぼかし処理を実行してもよい。

　前記レンダリング部は、前記非注視オブジェクトを、前記ぼかし処理が実行された場合の解像度でレンダリングしてもよい。

　前記レンダリング部は、前記非注目領域内に前記注視オブジェクトが存在する場合には、前記非注目領域内の前記注視オブジェクトを高解像度でレンダリングしてもよい。

　前記レンダリング部は、前記注目領域内の前記注視オブジェクトを第１の解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトを前記第１の解像度よりも低い第２の解像度でレンダリングしてもよい。

　前記レンダリング部は、前記視野情報に基づいて、前記注目領域、及び前記非注目領域を設定してもよい。

　前記情報処理装置は、さらに、前記２次元映像データに対して量子化パラメータを設定し、設定された前記量子化パラメータに基づき前記２次元映像データに対してエンコード処理を実行するエンコード部を具備してもよい。

　前記エンコード部は、前記注目領域に対して第１の量子化パラメータを設定し、前記非注目領域に対して、前記第１の量子化パラメータよりも大きい第２の量子化パラメータを設定してもよい。

　前記エンコード部は、前記注目領域内の前記注視オブジェクトに対して第１の量子化パラメータを設定し、前記注目領域内の前記非注視オブジェクトに対して前記第１の量子化パラメータよりも大きい第２の量子化パラメータを設定し、前記非注目領域に対して前記第２の量子化パラメータよりも大きい第３の量子化パラメータを設定してもよい。

　前記３次元空間データは、全天周映像データ、又は空間映像データの少なくとも一方を含んでもよい。

　本技術の一形態に係る情報処理方法は、コンピュータシステムが実行する情報処理方法であって、ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成するレンダリングステップを具備する。
　前記レンダリングステップは、
　前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定するステップと、
　前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出するステップと、
　前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させるステップと
　を含む。

サーバサイドレンダリングシステムの基本的な構成例を示す模式図である。ユーザが視聴可能な仮想映像の一例を説明するための模式図である。レンダリング処理を説明するための模式図である。サーバサイドレンダリングシステムの機能的な構成例を示す模式図である。レンダリングの基本動作例を示すフローチャートである。フォービエイテッドレンダリングの一例を説明するための模式図である。レンダリング情報の一例を説明するための模式図である。図４に示すレンダリング部及びエンコード部の具体的な構成例を示す模式図である。レンダリング映像の生成の一例を示すフローチャートである。図９に示す各ステップを説明するための模式図である。図９に示す各ステップを説明するための模式図である。図９に示す各ステップを説明するための模式図である。図９に示す各ステップを説明するための模式図である。図９に示す各ステップを説明するための模式図である。図９に示す各ステップを説明するための模式図である。デプスマップを用いたぼかし処理について説明するための模式図である。デプスマップを用いたぼかし処理について説明するための模式図である。他の実施形態に係るレンダリングの一例を示す模式図である。サーバ装置及びクライアント装置を実現可能なコンピュータ（情報処理装置）のハードウェア構成例を示すブロック図である。

　以下、本技術に係る実施形態を、図面を参照しながら説明する。

　［サーバサイドレンダリングシステム］
　本技術に係る一実施形態として、サーバサイドレンダリングシステムを構成する。まず図１～図３を参照して、サーバサイドレンダリングシステムの基本的な構成例及び基本的な動作例について説明する。
　図１は、サーバサイドレンダリングシステムの基本的な構成例を示す模式図である。
　図２は、ユーザが視聴可能な仮想映像の一例を説明するための模式図である。
　図３は、レンダリング処理を説明するための模式図である。
　なお、サーバサイドレンダリングシステムを、サーバレンダリング型のメディア配信システムと呼ぶことも可能である。

　図１に示すように、サーバサイドレンダリングシステム１は、ＨＭＤ（Head Mounted Display）２と、クライアント装置３と、サーバ装置４とを含む。
　ＨＭＤ２は、ユーザ５に仮想映像を表示するために用いられるデバイスである。ＨＭＤ２は、ユーザ５の頭部に装着されて使用される。
　例えば、仮想映像としてＶＲ映像が配信される場合には、ユーザ５の視野を覆うように構成された没入型のＨＭＤ２が用いられる。
　仮想映像として、ＡＲ（Augmented Reality：拡張現実）映像が配信される場合には、ＡＲグラス等が、ＨＭＤ２として用いられる。
　ユーザ５に仮想映像を提供するためのデバイスとして、ＨＭＤ２以外のデバイスが用いられてもよい。例えば、テレビ、スマートフォン、タブレット端末、及びＰＣ（Personal Computer）等に備えられたディスプレイにより、仮想映像が表示されてもよい。

　図２に示すように、本実施形態では、没入型のＨＭＤ２を装着したユーザ５に対して、全天球映像６がＶＲ映像として提供される。また全天球映像６は、６ＤｏＦ映像としてユーザ５に提供される。
　ユーザ５は、３次元空間からなる仮想空間Ｓ内において、前後、左右、及び上下の全周囲３６０°の範囲で映像を視聴することが可能となる。例えばユーザ５は、仮想空間Ｓ内にて、視点の位置や視線方向等を自由に動かし、自分の視野（視野範囲）７を自由に変更させる。このユーザ５の視野７の変更に応じて、ユーザ５に表示される映像８が切替えられる。ユーザ５は、顔の向きを変える、顔を傾ける、振り返るといった動作をすることで、現実世界と同じような感覚で、仮想空間Ｓ内にて周囲を視聴することが可能となる。
　このように、本実施形態に係るサーバサイドレンダリングシステム１では、フォトリアルな自由視点映像を配信することが可能となり、自由な視点位置での視聴体験を提供することが可能となる。

　図１に示すように、本実施形態では、ＨＭＤ２により、視野情報が取得される。
　視野情報は、ユーザ５の視野７に関する情報である。具体的には、視野情報は、仮想空間Ｓ内におけるユーザ５の視野７を特定することが可能な任意の情報を含む。
　例えば、視野情報として、視点の位置、視線方向、視線の回転角度等が挙げられる。また視野情報として、ユーザ５の頭の位置、ユーザ５の頭の回転角度等が挙げられる。ユーザの頭の位置や回転角度を、Head Motion情報ということも可能である。
　視線の回転角度は、例えば、視線方向に延在する軸を回転軸とする回転角度により規定することが可能である。またユーザ５の頭の回転角度は、頭に対して設定される互いに直交する３つの軸をロール軸、ピッチ軸、ヨー軸とした場合の、ロール角度、ピッチ角度、ヨー角度により規定することが可能である。
　例えば、顔の正面方向に延在する軸をロール軸とする。ユーザ５の顔を正面から見た場合に左右方向に延在する軸をピッチ軸とし、上下方向に延在する軸をヨー軸とする。これらロール軸、ピッチ軸、ヨー軸に対する、ロール角度、ピッチ角度、ヨー角度が、頭の回転角度として算出される。なお、ロール軸の方向を、視線方向として用いることも可能である。
　その他、ユーザ５の視野を特定可能な任意の情報が用いられてよい。視野情報として、上記で例示した情報が１つ用いられてもよいし、複数の情報が組み合わされて用いられてもよい。

　視野情報を取得する方法は限定されない。例えば、ＨＭＤ２に備えられたセンサ装置（カメラを含む）による検出結果（センシング結果）に基づいて、視野情報を取得することが可能である。
　例えば、ＨＭＤ２に、ユーザ５の周囲を検出範囲とするカメラや測距センサ、ユーザ５の左右の目を撮像可能な内向きカメラ等が設けられる。また、ＨＭＤ２に、ＩＭＵ（Inertial Measurement Unit）センサやＧＰＳが設けられる。
　例えば、ＧＰＳにより取得されるＨＭＤ２の位置情報を、ユーザ５の視点位置や、ユーザ５の頭の位置として用いることが可能である。もちろん、ユーザ５の左右の目の位置等がさらに詳しく算出されてもよい。
　また、ユーザ５の左右の目の撮像画像から、視線方向を検出することも可能である。
　また、ＩＭＵの検出結果から、視線の回転角度や、ユーザ５の頭の回転角度を検出することも可能である。

　また、ＨＭＤ２に備えらえたセンサ装置による検出結果に基づいて、ユーザ５（ＨＭＤ２）の自己位置推定が実行されてもよい。例えば、自己位置推定により、ＨＭＤ２の位置情報、及びＨＭＤ２がどの方向を向いているか等の姿勢情報を算出することが可能である。当該位置情報や姿勢情報から、視野情報を取得することが可能である。
　ＨＭＤ２の自己位置を推定するためのアルゴリズムも限定されず、ＳＬＡＭ（Simultaneous Localization and Mapping）等の任意のアルゴリズムが用いられてもよい。
　また、ユーザ５の頭の動きを検出するヘッドトラッキングや、ユーザ５の左右の視線の動きを検出するアイトラッキングが実行されてもよい。

　その他、視野情報を取得するために、任意のデバイスや任意のアルゴリズムが用いられてもよい。例えば、ユーザ５に対して仮想映像を表示するデバイスとして、スマートフォン等が用いられる場合等では、ユーザ５の顔（頭）等が撮像され、その撮像画像に基づいて視野情報が取得されてもよい。
　あるいは、ユーザ５の頭や目の周辺に、カメラやＩＭＵ等を備えるデバイスが装着されてもよい。
　視野情報を生成するために、例えばＤＮＮ（Deep Neural Network：深層ニューラルネットワーク）等を用いた任意の機械学習アルゴリズムが用いられてもよい。例えばディープラーニング（深層学習）を行うＡＩ（人工知能）等を用いることで、視野情報の生成精度を向上させることが可能となる。
　なお機械学習アルゴリズムの適用は、本開示内の任意の処理に対して実行されてよい。

　ＨＭＤ２と、クライアント装置３とは、互いに通信可能に接続されている。両デバイスを通信可能に接続するための通信形態は限定されず、任意の通信技術が用いられてよい。例えば、ＷｉＦｉ等の無線ネットワーク通信や、Bluetooth（登録商標）等の近距離無線通信等を用いることが可能である。
　ＨＭＤ２は、視野情報を、クライアント装置３に送信する。
　なお、ＨＭＤ２とクライアント装置３とが一体的構成されてもよい。すなわちＨＭＤ２に、クライアント装置３の機能が搭載されてもよい。

　クライアント装置３、及びサーバ装置４は、例えばＣＰＵ、ＲＯＭ、ＲＡＭ、及びＨＤＤ等のコンピュータの構成に必要なハードウェアを有する（図１９参照）。ＣＰＵがＲＯＭ等に予め記録されている本技術に係るプログラムをＲＡＭにロードして実行することにより、本技術に係る情報処理方法が実行される。
　例えばＰＣ（Personal Computer）等の任意のコンピュータにより、クライアント装置３、及びサーバ装置４を実現することが可能である。もちろんＦＰＧＡ、ＡＳＩＣ等のハードウェアが用いられてもよい。
　もちろん、クライアント装置３とサーバ装置４とが互いに同じ構成を有する場合に限定される訳ではない。

　クライアント装置３とサーバ装置４とは、ネットワーク９を介して、通信可能に接続されている。
　ネットワーク９は、例えばインターネットや広域通信回線網等により構築される。その他、任意のＷＡＮ（Wide Area Network）やＬＡＮ（Local Area Network）等が用いられてよく、ネットワーク９を構築するためのプロトコルは限定されない。

　クライアント装置３は、ＨＭＤ２から送信された視野情報を受信する。またクライアント装置３は、視野情報を、ネットワーク９を介して、サーバ装置４に送信する。

　サーバ装置４は、クライアント装置３から送信された視野情報を受信する。またサーバ装置４は、視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、ユーザ５の視野７に応じた２次元映像データ（レンダリング映像）を生成する。
　サーバ装置４は、本技術に係る情報処理装置の一実施形態に相当する。サーバ装置４により、本技術に係る情報処理方法の一実施形態が実行される。

　図３に示すように、３次元空間データは、シーン記述情報と、３次元オブジェクトデータとを含む。
　シーン記述情報は、３次元空間（仮想空間Ｓ）の構成を定義する３次元空間記述データに相当する。シーン記述情報は、オブジェクトの属性情報等、６ＤｏＦコンテンツの各シーンを再現するための種々のメタデータを含む。
　３次元オブジェクトデータは、３次元空間における３次元オブジェクトを定義するデータである。すなわち６ＤｏＦコンテンツの各シーンを構成する各オブジェクトのデータとなる。
　例えば、人物や動物等の３次元オブジェクトのデータや、建物や木等の３次元オブジェクトのデータが格納される。あるいは、背景等を構成する空や海等の３次元オブジェクトのデータが格納される。複数の種類の物体がまとめて１つの３次元オブジェクトとして構成され、そのデータが格納されてもよい。
　３次元オブジェクトデータは、例えば、多面体の形状データとして表すことのできるメッシュデータとその面に張り付けるデータであるテクスチャデータとにより構成される。あるいは、複数の点の集合（点群）で構成される（Point Cloud）。

　図３に示すように、サーバ装置４は、シーン記述情報に基づいて、３次元空間に３次元オブジェクトを配置することにより、３次元空間を再現する。この３次元空間は、演算によりメモリ上で再現される。
　再現された３次元空間を基準として、ユーザ５から見た映像を切り出すことにより（レンダリング処理）、ユーザ５が視聴する２次元映像であるレンダリング映像を生成する。
　サーバ装置４は、生成したレンダリング映像をエンコードし、ネットワーク９を介してクライアント装置３に送信する。
　なお、ユーザの視野７に応じたレンダリング映像は、ユーザの視野７に応じたビューポート（表示領域）の映像ともいえる。

　クライアント装置３は、サーバ装置４から送信された、エンコードされたレンダリング映像をデコードする。また、クライアント装置３は、デコードしたレンダリング映像を、ＨＭＤ２に送信する。
　図２に示すように、ＨＭＤ２により、レンダリング映像が再生され、ユーザ５に対して表示される。以下、ＨＭＤ２によりユーザ５に対して表示される映像８を、レンダリング映像８と記載する場合がある。

　［サーバサイドレンダリングシステムの利点］
　図２に例示するような全天球映像６（６ＤｏＦ映像）の他の配信システムとして、クライアントサイドレンダリングシステムが挙げられる。
　クライアントサイドレンダリングシステムでは、クライアント装置３により、視野情報に基づいて３次元空間データに対してレンダリング処理が実行され、２次元映像データ（レンダリング映像８）が生成される。クライアントサイドレンダリングシステムを、クライアントレンダリング型のメディア配信システムと呼ぶことも可能である。
　クライアントサイドレンダリングシステムでは、サーバ装置４からクライアント装置３に、３次元空間データ（３次元空間記述データ及び３次元オブジェクトデータ）を配信する必要がある。
　３次元オブジェクトデータは、メッシュデータにより構成されたり、点群データ（Point Cloud）により構成される。従ってサーバ装置４からクライアント装置３への配信データ量は、膨大になってしまう。また、レンダリング処理を実行するために、クライアント装置３には、かなり高い処理能力が求められる。

　これに対して、本実施形態に係るサーバサイドレンダリングシステム１では、レンダリング後のレンダリング映像８がクライアント装置３に配信される。これにより、配信データ量を十分に抑えることが可能となる。すなわち少ない配信データ量にて、ユーザ５に対して、膨大な３次元オブジェクトデータから構成される大空間の６ＤｏＦ映像を、体験させることが可能となる。
　また、クライアント装置３側の処理負荷を、サーバ装置４側にオフロードすることが可能となり、処理能力が低いクライアント装置３が用いられる場合でも、ユーザ５に対して６ＤｏＦ映像を体験させることが可能となる。

　また、ユーザの視野情報に応じて、予め用意されたデータサイズ（品質）が異なる複数の３Ｄオブジェクトデータ（例えば高解像度及び低解像度の２種類）の中から最適な３Ｄオブジェクトデータを選択する、クライアントサイドレンダリングの配信方法もある。
　この配信方法と比較すると、サーバサイドレンダリングでは、視野が変更されても２種類の品質の３Ｄオブジェクトデータの切り替えが行われないため、視野が変更されてもシームレスな再生が可能となり利点がある。
　またクライアントサイドレンダリングでは、視野情報がサーバ装置４に送られないため、レンダリング映像８内の所定の領域にぼかし等の処理を仮に行う場合には、クライアント装置３側で行う必要がある。そのとき、クライアント装置３に送信されるのはぼかす前の３Ｄオブジェクトデータであるから、やはり配信データ量の削減は見込めない。

　図４は、サーバサイドレンダリングシステム１の機能的な構成例を示す模式図である。
　ＨＭＤ２は、ユーザ５の視野情報をリアルタイムで取得する。
　例えばＨＭＤ２は、所定のフレームレートで視野情報を取得し、クライアント装置３に送信する。同様にクライアント装置３からサーバ装置４にも、所定のフレームレートで視野情報が、繰り返し送信される。

　視野情報取得のフレームレート（視野情報の取得回数／秒）は、例えば、レンダリング映像８のフレームレートに同期するように設定される。
　例えば、レンダリング映像８は、時系列に連続する複数のフレーム画像により構成される。各フレーム画像は、所定のフレームレートで生成される。このレンダリング映像８のフレームレートと同期するように、視野情報取得のフレームレートが設定される。もちろんこれに限定される訳ではない。
　また上記したように、ユーザ５に対して、仮想映像を表示するデバイスとして、ＡＲグラスやディスプレイが用いられてもよい。

　サーバ装置４は、データ入力部１１と、視野情報取得部１２と、レンダリング部１４と、エンコード部１５と、通信部１６とを有する。
　これらの機能ブロックは、例えばＣＰＵが本技術に係るプログラムを実行することで実現され、本実施形態に係る情報処理方法が実行される。なお各機能ブロックを実現するために、ＩＣ（集積回路）等の専用のハードウェアが適宜用いられてもよい。

　データ入力部１１は、３次元空間データ（シーン記述情報、及び３次元オブジェクトデータ）を読み出し、レンダリング部１４に出力する。
　なお、３次元空間データは、例えば、サーバ装置４内の記憶部６８（図１９参照）に格納されている。あるいは、サーバ装置４と通信可能に接続されたコンテンツサーバ等により、３次元空間データが管理されてもよい。この場合、データ入力部１１は、コンテンツサーバにアクセスすることで、３次元空間データを取得する。

　通信部１６は、他のデバイスとの間で、ネットワーク通信や近距離無線通信等を実行するためのモジュールである。例えばＷｉＦｉ等の無線ＬＡＮモジュールや、Bluetooth（登録商標）等の通信モジュールが設けられる。
　本実施形態では、通信部１６により、ネットワーク９を介したクライアント装置３との通信が実現される。

　視野情報取得部１２は、通信部１６を介してクライアント装置３から視野情報を取得する。取得された視野情報が、記憶部６８（図１９参照）等に記録されてもよい。例えば、視野情報を記録するためのバッファ等が構成されてもよい。

　レンダリング部１４は、図３に例示するレンダリング処理を実行する。すなわち、リアルタイムで取得された視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、ユーザ５の視野７に応じたレンダリング映像８を生成する。
　本実施形態では、所定のフレームレートで取得される視野情報に基づいて、レンダリング映像８を構成するフレーム画像１９が、リアルタイムで生成される。

　エンコード部１５は、レンダリング映像８（フレーム画像１９）に対してエンコード処理（圧縮符号化）を実行し、配信データを生成する。配信データは、通信部１６にてパケット化され、クライアント装置３に送信される。
　これにより、リアルタイムで取得される視野情報に応じて、リアルタイムでフレーム画像１９を配信することが可能となる。

　本実施形態において、レンダリング部１４は、本技術に係るレンダリング部の一実施形態として機能する。エンコード部１５は、本技術に係るエンコード部の一実施形態として機能する。

　クライアント装置３は、通信部２３と、デコード部２４と、レンダリング部２５とを有する。
　これらの機能ブロックは、例えばＣＰＵが本技術に係るプログラムを実行することで実現され、本実施形態に係る情報処理方法が実行される。なお各機能ブロックを実現するために、ＩＣ（集積回路）等の専用のハードウェアが適宜用いられてもよい。

　通信部２３は、他のデバイスとの間で、ネットワーク通信や近距離無線通信等を実行するためのモジュールである。例えばＷｉＦｉ等の無線ＬＡＮモジュールや、Bluetooth（登録商標）等の通信モジュールが設けられる。
　デコード部２４は、配信データに対してデコード処理を実行する。これにより、エンコードされたレンダリング映像８（フレーム画像１９）がデコードされる。
　レンダリング部２５は、デコードされたレンダリング映像８（フレーム画像１９）がＨＭＤ２により表示可能なように、レンダリング処理を実行する。
　レンダリングされたフレーム画像１９は、ＨＭＤ２に送信され、ユーザ５に対して表示される。これにより、ユーザ５の視野７の変更に応じて、リアルタイムでフレーム画像１９を表示することが可能となる。

　［本技術に係るレンダリングの基本動作例］
　本発明者は、サーバサイドレンダリングシステム１において、高品質な仮想画像の配信を実現するために検討を重ねた。特に、「レンダリング処理負荷」と、「リアルタイムエンコードによる画質劣化」という２つの観点について考察を重ねた。
　その結果、図５に示す各処理を基本的な動作例とするレンダリングを新たに考案した。図５に示す処理は、レンダリング部１４により実行される。

　ステップ１０１では、２次元映像データ（フレーム画像１９）の表示領域に対して、注目領域と、非注目領域とが設定される。
　フレーム画像１９の表示領域は、ユーザ５の視野７に応じたビューポートであり、レンダリングされるフレーム画像１９の画像領域に相当する。フレーム画像１９の表示領域は、レンダリングの対象となる領域であり、レンダリング対象領域やレンダリング領域ともいえる。
　注目領域は、高解像度でのレンダリングの対象となる領域である。非注目領域は、低解像度でのレンダリングの対象となる非注目領域である。
　なお、レンダリングされるフレーム画像の解像度（Ｖ×Ｈの画素数）は、変わらない。本開示では、ある領域（画素領域）に対してレンダリングされる画像の解像度が相対的に高い場合、高解像度でレンダリングされるという表現をする。またある領域（画素領域）に対してレンダリングされる画像の解像度が相対的に低い場合、低解像度でレンダリングされるという表現をする。
　例えば、フレーム画像１９の画素１つ１つに対して、互いに異なる画素値（階調値）が設定されるようにレンダリングが行われる場合、フレーム画像１９の解像度にて画像がレンダリングされることになる。一方で、４つ等の複数の画素を１つのグループとして、グループ内の画素に対して同じ画素値が設定されるようにレンダリングが行われる場合、レンダリングされる画像の解像度は、フレーム画像１９の解像度よりも低くなる。
　例えば、高解像度でのレンダリングの対象となる注目領域を、フレーム画像１９の解像度にてレンダリングが行われる領域として設定することが可能である。そして、低解像度でのレンダリングの対象となる非注目領域を、フレーム画像１９の解像度よりも低い解像でレンダリングされる領域として設定することが可能である。もちろんこのような設定に限定されない。
　以下、レンダリングされる画像の解像度を、レンダリング解像度と記載する場合がある。

　ステップ１０１を実現するために、本実施形態では、フォービエイテッドレンダリング（foveated rendering）が実行される。フォービエイテッドレンダリングは、中心窩レンダリングとも呼ばれる。

　図６は、フォービエイテッドレンダリングの一例を説明するための模式図である。
　フォービエイテッドレンダリングは、視野中央の分解能は高く、視野周辺に行くにつれて分解能が下がる人の視覚特性に合わせたレンダリングとなる。
　例えば、図６Ａ及びＢに示すように、矩形や円形などで区切った視野中央領域２７にて高解像度でのレンダリングが実行される。そして、その周辺領域２８をさらに矩形や同心円などの領域に分け、低解像度でのレンダリングが実行される。
　図６Ａ及びＢに示す例では、視野中央領域２７が、最大解像度でレンダリングされる。例えば、フレーム画像１９の解像度でレンダリングされる。
　周辺領域２８は、３つの領域に分けられ、視野の周辺に行くにつれて、最大解像度の１／４の解像度、最大解像度の１／８の解像度、最大解像度の１／１６の解像度でそれぞれレンダリングされる。
　図６Ａ及びＢに示す例では、視野中央領域２７が、注目領域２９として設定される。また周辺領域２８が非注目領域３０として設定される。図６Ａ及びＢに示すように、非注目領域３０が複数の領域に分割され、段階的にレンダリング解像度が低減されてもよい。

　このようにフォービエイテッドレンダリングでは、ビューポート（表示領域）３１内での２次元的な位置に応じて、レンダリング解像度が設定される。
　なお、図６Ａ及びＢに示す例では、視野中央領域２７（注目領域２９）、及び周辺領域２８（非注目領域３０）の位置が固定されている。このようなフォービエイテッドレンダリングは、固定フォービエイテッドレンダリング（fixed foveated rendering）とも呼ばれる。

　これに限定されず、ユーザ５が注視している注視点に基づいて、高解像度でレンダリングされる注目領域２９が動的に設定されてもよい。設定された注目領域２９の周辺が、低解像度でレンダリングされる非注目領域３０となる。
　なお、ユーザ５の注視点は、ユーザ５の視野情報に基づいて算出することが可能である。例えば、視線方向やHead Motion情報等に基づいて、注視点を算出することが可能である。もちろん、注視点自体も、視野情報に含まれる。すなわち視野情報として注視点が用いられてもよい。
　このように、ユーザ５の視野情報に基づいて、注目領域２９、及び非注目領域３０が動的に設定されてもよい。

　ステップ１０２では、注視オブジェクトが抽出される。
　注視オブジェクトは、レンダリングされるオブジェクトのうち、ユーザ５の注視対象となるオブジェクトのことである。
　例えば、ユーザ５の注視点が位置するオブジェクトが、注視オブジェクトとして抽出される。あるいは、ビューポート３１の中央に位置するオブジェクトが、注視オブジェクトとして抽出されてもよい。
　ほとんどの場合、注視オブジェクトは、少なくとも一部の領域が、フォービエイテッドレンダリングにより設定される注目領域２９内に含まれる。
　なお、注視オブジェクトに該当するか否かの判定条件として、少なくとも一部の領域が注目領域２９内に含まれている点が設定されてもよい。

　注視オブジェクトは、レンダリング処理に関するパラメータと、視野情報とに基づいて抽出される。
　レンダリング処理に関するパラメータは、レンダリング映像８を生成するために用いられる任意の情報を含む。またレンダリング処理に関するパラメータは、レンダリング映像８を生成するために用いられる情報を用いて生成することが可能な任意の情報を含む。
　例えば、レンダリング部１４により、３次元空間データと、視野情報とに基づいて、レンダリング処理に関するパラメータが生成される。もちろんこのような生成方法に限定される訳ではない。
　以下、レンダリング処理に関するパラメータを、レンダリング情報と記載する場合がある。

　図７は、レンダリング情報の一例を説明するための模式図である。
　図７Ａ、レンダリング処理により生成されるフレーム画像１９を示す模式図である。図７Ｂは、フレーム画像１９に対応するデプスマップ（デプスマップ画像）３３を示す模式図である。
　レンダリング情報として、デプスマップ３３を用いることが可能である。デプスマップ３３は、レンダリング対象となるオブジェクトまでの距離情報（奥行情報）を含むデータである。デプスマップ３３を、奥行情報マップ、距離情報マップということも可能である。
　例えば、距離を輝度に変換した画像データを、デプスマップ３３として用いることも可能である。もちろんこのような形式に限定されない。

　デプスマップ３３は、例えば、３次元空間データと、視野情報とに基づいて生成することが可能である。
　例えば、３Ｄレンダリングでは、あるオブジェクトをレンダリングする際に、すでにレンダリング済みのオブジェクト達との前後関係を確認する必要がある。その際に、Ｚバッファというものを使用する。
　Ｚバッファとは、現在のレンダリング画像のデプス情報（レンダリング画像と同じ解像度）を一時的にためておくバッファのことである。
　レンダリング部１４は、オブジェクトをレンダリングする際に、該当ピクセルにすでにレンダリングされている別オブジェクトがある場合、それとの前後関係を確認する。そして、現在のオブジェクトの方が前であれば、レンダリングを行い、そうでなければ、レンダリングをしないという判断をピクセルごとに行う。
　その際の確認に使用するのが、このＺバッファで、これまでにレンダリングしたオブジェクトのデプス値が該当ピクセルに書かれており、それを参照して確認する。そして、確認と共に新たにレンダリングを行ったピクセルにはそのデプス値をセットし、更新していく。
　つまり、レンダリング部１４はフレーム画像１９のレンダリングが完成するタイミングにおいて、内部に該当フレームのデプスマップ画像データも合わせて保持している。
　なお、レンダリング情報としてのデプスマップ３３の取得方法は限定されず、任意の方法が採用されてよい。
　その他、レンダリング情報として、レンダリング対象となるオブジェクトの動き情報を含む動きベクトルマップや、レンダリング対象となるオブジェクトの輝度情報、レンダリング対象となるオブジェクトの色情報等、種々の情報を取得可能である。

　ステップ１０２では、注視オブジェクトの形状及び輪郭を正確に検出し、注視オブジェクトと、その他のオブジェクト（以下、非注視オブジェクトと記載する）を高精度に分離することが望ましい。
　全天球映像６や２Ｄ動画に対してオブジェクトの認識及び分離を実行する技術として、様々な画像解析技術が挙げられる。例えば、輝度分布やエッジ検出による基本的な形状認識をはじめ、画像に対して様々なオブジェクト認識技術が提案されているが、その処理負荷は高く、誤検出によるエラーを完全には無くせないという課題が残っている。また動画のリアルタイム解析は、処理負荷の観点でより難易度が非常に高い。

　図７Ｂに示すような、レンダリング情報として取得されるデプスマップ画像３３は、フレーム画像１９に対して画像解析等を実行することで推定したデプス値ではなく、レンダリング工程で得られた正確な値である。
　すなわち、サーバサイドレンダリングシステム１では、ユーザ５が視聴する２Ｄ映像を自身でレンダリングしているため、レンダリング後の２Ｄ映像を解析するという画像解析の処理負荷なしに、正確なデプスマップ３３を取得することが可能である。
　デプスマップ３３を用いることで、３次元空間（仮想空間）Ｓに配置されるオブジェクトの前後関係を検出することが可能となり、各オブジェクトの形状及び輪郭を正確に検出することが可能となる。

　本実施形態ではステップ１０２にて、デプスマップ３３と、視野情報とに基づいて、注視オブジェクトを、非常に高い精度で抽出することが可能となる。なお、注視オブジェクトの抽出のために、３次元オブジェクトデータが用いられてもよい。これにより、注視オブジェクトの抽出精度の向上を図ることが可能となる。
　注視オブジェクトの形状及び輪郭を正確に検出することが可能となるので、高解像度にレンダリングする範囲を必要な領域のみに抑えることが可能となり、フレーム画像１９のデータ量（情報量）を削減することが可能となる。

　ステップ１０３では、注目領域２９内の注視オブジェクトが高解像度でレンダリングされる。また注目領域２９内の注視オブジェクト以外の非注視オブジェクトのデータ量が低減される。
　例えば、注目領域２９の全体を高解像度でレンダリングした後に、非注視オブジェクトに対して、データ量を低減させるためのデータ量低減処理が実行されてもよい。すなわち、高解像度でレンダリングされた非注視オブジェクトに対して、データ量低減処理が実行されてもよい。
　または、非注視オブジェクトに対して、データ量低減処理が実行された場合のレンダリング解像度が算出される。そして、算出されたレンダリング解像度にて、非注視オブジェクトがレンダリングされてもよい。
　データ量低減処理としては、ぼかし処理、レンダリング解像度の削減、グレースケール化、画像の階調値の削減、画像の表示形式の変換等、画像の画像データ量を低減させる任意の処理が含まれる。
　例えば、注目領域２９に設定されているレンダリング解像度よりも低いレンダリング解像度で、注目領域２９内の非注視オブジェクトをレンダリングすることも、非注視オブジェクトに対するデータ量低減処理に含まれる。

　ステップ１０４では、非注目領域３０が、低解像度でレンダリングされる。これにより、フレーム画像１９の全体がレンダリングされる。
　なお、図５に示す各ステップが実行される順番は限定されない。また図５に示す各ステップが時系列的に順番に実行される場合に限定されず、複数のステップが並列的に実行されてもよい。例えば、ステップ１０１の注目領域２９及び非注目領域３０の設定と、ステップ１０２の注視オブジェクトの抽出について、処理の順番が逆の場合もあり得る。またステップ１０１とステップ１０２とが、並列的に実行される場合もあり得る。
　また図５の示す各ステップの中の複数のステップが、統合的に実行される場合もあり得る。例えば、注目領域２９内の注視オブジェクトに対するレンダリング解像度、注目領域２９内の非注視オブジェクトのデータ量低減処理後のレンダリング解像度、及び非注目領域３０のレンダリング解像度がそれぞれ設定される。そして、設定されたレンダリング解像度にて、フレーム画像１９の全体がレンダリングされる。
　このような処理が実行された場合、ステップ１０３及びステップ１０４が統合的に実行されたといえる。

　フレーム画像１９のエンコードに関して、高解像度にレンダリングされた領域はデータ量が多く、エンコード（圧縮符号化）時の圧縮率が一定であれば、符号化後のビットレートは圧縮前の画像のデータ量に比例して高くなる。
　ここで符号化の圧縮率を上げればビットレートを下げることが可能であるが、圧縮率を上げると、圧縮に伴う画質劣化が目立ってくるというデメリットがある。
　図５に示す本実施形態に係るレンダリングでは、注目領域２９内のユーザ５が注視している注視オブジェクトが高解像度でレンダリングされる。一方、注目領域２９内の非注視オブジェクトのデータ量は低減される。
　これにより、フレーム画像１９の実質的なデータ量を、主観的な画質を損なわない範囲で、必要最小限に削減することが可能となる。この結果、後段のエンコード部１５において、ビットレートを上げることなく実質的なデータ圧縮率を下げることができ、圧縮起因での画質劣化も抑えることが可能となる。

　［２次元映像データ（レンダリング映像）の生成動作］
　図５に示すレンダリングが適用された、レンダリング映像の生成例について説明する。
　図８は、図４に示すレンダリング部１４、及びエンコード部１５の各々の具体的な構成例を示す模式図である。
　本実施形態では、サーバ装置４内に、機能ブロックとして、再現部３５と、レンダラ３６と、エンコーダ３７と、コントローラ３８とが構築される。
　これらの機能ブロックは、例えばＣＰＵが本技術に係るプログラムを実行することで実現され、本実施形態に係る情報処理方法が実行される。なお各機能ブロックを実現するために、ＩＣ（集積回路）等の専用のハードウェアが適宜用いられてもよい。

　再現部３５は、シーン記述情報に基づいて３次元オブジェクトを配置することにより、３次元空間を再現する。
　コントローラ３８は、シーン記述情報と、視野情報とに基づいて、レンダラ３６がレンダリングをどのように実行するかを指示するためのレンダリングパラメータを生成する。
　例えば、コントローラ３８により、フォービエイテッドレンダリングの領域指定、注視オブジェクトの指定、レンダリング解像度の指定、データ量低減処理に関するパラメータの指定等が実行される。
　例えば注目領域２９内の注視オブジェクトに対するレンダリング解像度、注目領域２９内の非注視オブジェクトのデータ量低減処理後のレンダリング解像度、及び非注目領域３０のレンダリング解像度を含む解像度マップ（レンダリング解像度マップ）等を、レンダリングパラメータとして用いることが可能である。

　また、コントローラ３８は、レンダラ３６に指示したレンダリングパラメータに基づいて、エンコーダ３７がエンコードをどのように実行するかを指示するためのエンコードパラメータを生成する。
　本実施形態では、コントローラ３８により、ＱＰマップが生成される。ＱＰマップは、２次元映像データに対して設定される量子化パラメータに相当する。
　例えば、レンダリングされたフレーム画像１９内で量子化精度（ＱＰ：Quantization Parameter）を領域ごとに切り替えることにより、フレーム画像１９内の着目点や重要領域の圧縮による画質劣化を抑えることが可能となる。
　このようにすることで、ユーザ５にとって重要な領域については十分な映像の品質を維持しつつ、配信データや処理の負荷を増加させることを抑えることができる。なお、ここでＱＰ値とは、非可逆圧縮の際の量子化の刻みを示す値である。ＱＰ値が高いと符号化量が小さくなって、圧縮効率が高くなり、圧縮による画質劣化が進む。一方、ＱＰ値が低いと符号化量が大きくなり、圧縮効率が低くなり、圧縮による画質劣化を抑えることができる。

　レンダラ３６は、コントローラ３８から出力されるレンダリングパラメータに基づいて、レンダリングを実行する。エンコーダ３７は、コントローラ３８から出力されるＱＰマップに基づいて、２次元映像データに対してエンコード処理（圧縮符号化）を実行する。
　図８に示す例では、再現部３５、コントローラ３８、及びレンダラ３６により、図４に示すレンダリング部１４が構成される。またコントローラ３８及びエンコーダ３７により、図４に示すエンコード部１５が構成される。

　図９は、レンダリング映像の生成の一例を示すフローチャートである。図９では、レンダラ・エンコーダ連携処理として、サーバ装置４によるレンダリング映像８（フレーム画像１９）の生成例を説明する。
　図１０～図１５は、図９に示す各ステップを説明するための模式図である。
　ここでは、図１０に示すシーンのフレーム画像１９が生成される場合を例に挙げる。
　すなわち、３人の人物Ｐ１～Ｐ３、木Ｔ、草Ｇ、道路Ｒ、及び建物Ｂの各オブジェクトを含むフレーム画像１９が生成されるものとする。なお、実際にはフレーム画像１９内の複数の木Ｔの各々や、複数の草Ｇの各々が、互いに異なるオブジェクトとして処理されるが、ここではまとめて木Ｔや草Ｇとしている。

　通信部１６により、クライアント装置３からユーザ５の視野情報が取得される（ステップ２０１）。
　データ入力部１１により、シーンを構成する３次元オブジェクトデータが取得される（ステップ２０２）。本実施形態では、図１０に示す、３人の人物Ｐ１～Ｐ３、木Ｔ、草Ｇ、道路Ｒ、及び建物Ｂの各オブジェクトの３次元オブジェクトデータが取得される。取得された３次元オブジェクトデータは、再現部３５に出力される。
　再現部３５により、３次元オブジェクトが配置され、３次元空間（シーン）が再現される（ステップ２０３）。本実施形態では、図１０に示す、３人の人物Ｐ１～Ｐ３、木Ｔ、草Ｇ、道路Ｒ、及び建物Ｂの各オブジェクトの３次元オブジェクトデータが配置され、３次元空間が再現される。

　コントローラ３８により、視野情報に基づいて、注視オブジェクトが抽出される（ステップ２０４）。本実施形態では、ビューポート（表示領域）３１の中央に位置する人物Ｐ１が注視オブジェクト４０として抽出される。本ステップ２０４により、図５に示すステップ１０２が実行される。
　図１１に示すように、コントローラ３８により、フォービエイテッドレンダリングの各領域が設定される。本実施形態では、図６Ａに例示するフォービエイテッドレンダリングが実行される。従って、視野中央領域２７が注目領域２９として設定され、周辺領域２８が非注目領域３０として設定される。
　なお、図１１では、非注目領域３０内の、レンダリング解像度が段階的に低くなる複数の領域の区分けは、図示が省略されている。この点は、図１２～図１５等でも同様である。
　本ステップ２０４により、図５に示すステップ１０１が実行される。

　コントローラ３８により、注目領域２９内の非注視オブジェクト４１に対するぼかし強度が設定される（ステップ２０５）。
　図１２～図１４に示すように、本実施形態では、人物Ｐ１の注目領域２９に含まれる領域が、注目領域２９内の注視オブジェクト４０となる。
　また、他のオブジェクト（人物Ｐ２及びＰ３、木Ｔ、草Ｇ、道路Ｒ、建物Ｂ）の注目領域２９に含まれる領域が、注目領域２９内の非注視オブジェクト４１となる。注目領域２９内の非注視オブジェクト４１は、注目領域２９内の、注視オブジェクト４０以外の領域ともいえる。

　本実施形態では、注目領域２９内の非注視オブジェクト４１に対するデータ量低減処理として、ぼかし処理が実行される。
　本実施形態では、ぼかし処理として、複数の画素をグループとして、グループ内の各画素に対して同じ画素値が設定される。例えば、グループ化された複数の画素の各々の画素値を統合（平均等）することで、グループに設定される画素値が算出される。従って、本実施形態では、ぼかし処理として、レンダリング解像度の削減が実行される。
　グループ化される画素数が多いほどぼかし強度が大きくなり、グループ化される画素数が少ないほどぼかし強度は小さくなる。従って、グループ化される画素数を、ほかし強度を規定するパラメータとして用いることが可能である。なお、ぼかし強度は、データ量低減処理に関するパラメータとして用いられる。
　本実施形態では、図７Ｂに例示したデプスマップ３３に基づいて、ぼかし強度が算出される。すなわち、各オブジェクトまでの距離情報（奥行情報）に基づいて、非注視オブジェクト４１に対してぼかし強度が設定される。ぼかし強度の設定については、後に詳しく説明する。

　データ量低減処理として、レンダリング解像度の削減が実行される場合、例えば注目領域２９内の注視オブジェクト４０は第１の解像度でレンダリングされる。注目領域２９内の注視オブジェクト４０以外の非注視オブジェクト４１は、第１の解像度よりも低い第２の解像度でレンダリングされる。もちろん、レンダリング解像度の削減として、ぼかし処理以外のデータ量低減処理が実行されてもよい。

　コントローラ３８により、各オブジェクトのレンダリング解像度が設定される（ステップ２０７）。
　図１５に示すように、フォービエイテッドレンダリングの非注目領域３０内の各オブジェクト（人物Ｐ１～Ｐ３、木Ｔ、草Ｇ、道路Ｒ、建物Ｂ）に対しては、図６Ａに例示する周辺領域２８の段階的に低くなるレンダリング解像度が設定される。
　すなわち、各オブジェクト（人物Ｐ１～Ｐ３、木Ｔ、草Ｇ、道路Ｒ、建物Ｂ）の、非注目領域３０に含まれる領域は、低解像度でレンダリングされる。

　図１３に示すように、注目領域２９内の注視オブジェクト４０（人物Ｐ１）に対しては、図６Ａに例示する最大解像度が設定される。本実施形態では、フレーム画像１９の解像度が設定される。
　図１４に示すように、注目領域２９内の非注視オブジェクト４１については、ぼかし処理が実行された場合のレンダリング解像度が設定される。例えば、非注視オブジェクト４１が最大解像度でレンダリングされる場合の画像データ（画素データ）を基準として、ぼかし処理が実行された後のレンダリング解像度が演算により算出される。算出されたレンダリング解像度が、非注視オブジェクト４１のレンダリング解像度として設定される。
　典型的には、ステップ２０５にて、ぼかし処理の実行後のレンダリング解像度が非注目領域３０の解像度より高くなるように、ぼかし強度が設定される。もちろんこれに限定される訳ではない。

　レンダラ３６により、設定されたレンダリング解像度にて、フレーム画像１９がレンダリングされる（ステップ２０８）。レンダリングされたフレーム画像１９は、エンコーダ３７に出力される。
　コントローラ３８により、フレーム画像１９の解像度分布（解像度マップ）に基づいて、ＱＰマップが生成される（ステップ２０９）。
　本実施形態では、高解像度の領域ではＱＰ値が低く設定され、低解像度の領域ではＱＰ値が高く設定されたＱＰマップが生成される。
　例えば、注目領域２９に対して第１の量子化パラメータ（ＱＰ値）が設定され、非注目領域３０に対して、第１の量子化パラメータ（ＱＰ値）よりも大きい第２の量子化パラメータ（ＱＰ値）が設定される。
　あるいは、注目領域２９内の注視オブジェクト４０に対して第１の量子化パラメータ（ＱＰ値）が設定され、注目領域２９内の非注視オブジェクト４１に対して第１の量子化パラメータ（ＱＰ値）よりも大きい第２の量子化パラメータ（ＱＰ値）が設定され、非注目領域３０に対して第２の量子化パラメータ（ＱＰ値）よりも大きい第３の量子化パラメータ（ＱＰ値）が設定される。
　その他、解像度マップに基づいてＱＰマップを生成する方法として、任意の方法が採用されてもよい。

　エンコーダ３７により、ＱＰマップに基づいて、フレーム画像１９に対して、エンコード処理（圧縮符号化）が実行される（ステップ２１０）。
　本実施形態では、高解像度の領域ではＱＰ値が低いので、符号化量が大きくなる。従って、圧縮効率が低くなるので、圧縮による画質劣化を抑えることができる。一方、低解像度の領域ではＱＰ値が高いので、符号化量が小さくなり、圧縮効率が高くなる。
　これにより、ユーザ５にとって十分な映像の品質を維持しつつ、配信データや処理の負荷を増加させることを抑え、加えて、リアルタイムでのエンコード処理に非常に有利となる。
　また本実施形態では、レンダリング部１４から出力される解像度マップを利用することが可能であるので、エンコード部１５にてフレーム画像１９を解析するといった処理が不要である。この結果、エンコード部１５での処理負荷を低減し、リアルタイムエンコード処理に有利となる。

　図９に示す処理では、ステップ２０５～ステップ２０８により、図５に示すステップ１０３及びステップ１０４が統合的に実行される。
　また、図９に示す処理では、ぼかし処理がレンダリングと同時に実行される。これにより、レンダリング処理負荷を抑制することが可能となる。
　これに限定されず、レンダリング後のフレーム画像１９に対して、フィルタ処理等により、ぼかし処理が実行されてもよい。

　［ぼかし処理］
　図１６及び図１７は、デプスマップ３３を用いたぼかし処理について説明するための模式図である。
　図１６Ａに示すように、実世界のレンズの被写界深度（ＤｏＦ：Depth of field）に基づくぼけをシミュレートすることで、ぼかし処理を実行することが可能である。すなわち、現実世界をカメラで撮影したときに生じるぼけと同じ仕組みで、ぼかし処理を実行する。
　例えば、被写界深度が浅い物理レンズのぼけをシミュレートすることで、非注視オブジェクト４１に対するぼかし強度が設定される。
　物理レンズのボケのシミュレーションでは、焦点位置（ピント位置）から前後に距離が離れていくにつれて連続的にぼけが強くなる。これを２Ｄ画像に施すには、各オブジェクトの前後関係の情報が必要である。一般の２Ｄ画像ではそのような情報が付加されていないので、オブジェクトごとにぼかし強度を決定することが難しい。
　本実施形態では、レンダラ３６で非常に精度の高いデプスマップ３３を生成することが可能なので、ぼかし強度を高精度に容易に算出することが可能である。
　すなわち、本実施形態では、高精度のデプスマップ３３に基づいて、注視オブジェクト４０及び非注視オブジェクト４１の高精度の抽出（分離）のみならず、データ量削減処理としてのぼかし処理を高精度に実行可能である点も、大きな特徴となっている。

　例えば、非注視オブジェクト４１に対して、所定の基準位置として、焦点位置が設定される。例えば、注視オブジェクト４０の位置が、焦点位置として設定されてもよい。
　図１６Ａに示すように、非注視オブジェクト４１までの距離と、焦点位置（所定の基準位置）との差分が大きくなるほど、非注視オブジェクト４１に対するぼかし強度が高く設定される。
　図１６Ａに示す例では、焦点位置よりも近い範囲と、焦点位置よりも遠い範囲との各々において、互いに同じ態様（同じ割合）で距離に応じたほかし強度が設定される。従って、図１６Ａに示すように、焦点位置よりも近い範囲と、焦点位置よりも遠い範囲との各々において、ほかし強度は対称的に設定される。
　なお、ぼかし処理は、非注視オブジェクト４１のデータ量を削減するために実行される。従って、図１６及び図１７では、被写界深度内にある非注視オブジェクト４１に対してもぼけが発生するように、ぼかし強度が設定される。
　例えば、被写界深度内にある非注視オブジェクト４１に対して一定のぼかし強度がオフセット値として設定されてもよい。あるいは、被写界深度内においても、距離に応じてぼかし強度が増加するように、ぼかし強度が設定されてもよい。これにより、非注視オブジェクト４１のデータ量を効率よく削減することが可能となる。
　また、非注視オブジェクト４１の多くが、注視オブジェクト４０と同じ位置に存在する場合、非注視オブジェクト４１に対するぼかし強度が低くなり、データ量の削減量が小さくなる場合もあり得る。このような場合等において、焦点位置（所定の基準位置）が、注視オブジェクト４０の位置から前方（近づく方向）又は後方（遠ざかる方向）にオフセットされてもよい。

　後段のエンコーダ３７でのエンコード効率をより高めることを目的として、距離に応じたぼかし強度の設定について、様々なバリエーションも考えられる。
　そもそも、ユーザから見て注視オブジェクト４０と同じ距離にある（注目領域２９内の）非注視オブジェクト４１は、現実のレンズシミュレーションであれば、フォーカスが合って高解像度にレンダリングされるべきである。
　被写界深度内にある非注視オブジェクト４１をぼかすのも、現実のレンズシミュレーションが目的ではなくエンコード効率を高める目的があるからである。ぼけの強さについても、必ずしも現実のレンズの焦点距離、Ｆ値、絞りなどのパラメータに基づくシミュレーションに沿う必要はない。

　図１６Ｂに示す例では、非注視オブジェクト４１に対して、焦点位置からの距離以上に大きくぼかしが発生するように、ぼかし強度が設定される。
　例えば、非注視オブジェクト４１までの距離と焦点位置（所定の基準距離）との差分に関して複数の範囲が設定される。そして、複数の範囲の各々に対して、ぼかし強度が設定される。
　図１６Ｂに示す例では、非注視オブジェクト４１までの距離と所定の基準距離との差分が０から第１の距離までの第１の範囲と、差分が第1の距離から第１の距離よりも大きい第２の距離までの第２の範囲とが設定される。図１６Ｂに示す例では、第１の範囲は、被写界深度の範囲となる。もちろんこれに限定されない。
　第１の範囲には、第１のぼかし強度が設定され、第２の範囲には、第１のぼかし強度よりも高い第２のぼかし強度が設定される。
　また、図１６Ｂに示す例では、差分が第２の距離から第２の距離よりも大きい第３の距離までの第３の範囲が設定され、第３の範囲に第２のぼかし強度よりも高い第３のぼかし強度が設定される。
　このような現実の物理レンズとは異なる態様のぼかし処理が実行されてもよい。すなわち同じ範囲内の非注視オブジェクト４１に対しては、一律にぼかしが発生するように、ぼかし強度が設定される。
　これにより、非注視オブジェクト４１のデータ量をより大きく削減することが可能となり、エンコーダ入力前の画像のデータ量をより効率的に削減することが可能となる。

　図１６Ａ及びＢに示す例では、焦点位置よりも近い範囲と、焦点位置よりも遠い範囲との各々において、ほかし強度が対称的に設定される。
　これに限定されず、焦点位置よりも近い範囲と、焦点位置よりも遠い範囲との各々において、互いに異なる態様で、ぼかし強度が設定されてもよい。すなわち、焦点位置よりも近い範囲と、焦点位置よりも遠い範囲との各々において、ほかし強度が非対称的に設定されてもよい。
　図１７Ａ及びＢに示す例では、焦点位置よりも近い範囲に位置する非注視オブジェクト４１より、焦点位置よりも遠い範囲に位置する非注視オブジェクト４１の方が強くぼけるように、ぼかし設定が設定される。
　ユーザ５にとって、距離が近い非注視オブジェクト４１の方が目に入りやすいと考えられる。従って、距離が近い範囲の非注視オブジェクト４１よりも距離が遠い範囲の非注視オブジェクト４１の方が強くぼかされるように、ぼかし強度が設定される。これにより、ユーザ５にとって視聴しやすいフレーム画像１９となる。
　これに限定されず、焦点位置よりも遠い範囲に位置する非注視オブジェクト４１より、焦点位置よりも近い範囲に位置する非注視オブジェクト４１の方が強くぼけるように、ぼかし設定が設定されてもよい。
　また、図１６Ａに示すような焦点位置からの差分が大きくなるにつれて徐々にぼかし強度が強くなる設定と、図１６Ｂに示すような焦点位置からの差分が複数の範囲に分けられる設定とが、組み合わされてもよい。
　例えば、焦点位置よりも近い範囲では、図１６Ａの設定が採用される。焦点位置よりも遠い範囲では、図１６Ｂの設定が採用される。このようなぼかし強度の設定も可能である。

　非注視オブジェクト４１に対するデータ量低減処理として、注視オブジェクト４０も含めた注目領域２９の全体に対して、ぼかし処理が実行されてもよい。この場合、注視オブジェクト４０は、焦点位置に位置するものとされる（ぼかし強度０）。なお注視オブジェクト４０が奥行き方向に長い場合は、注視オブジェクト４０はどの部分にもフォーカスが合っているようなぼかし処理が実行される。

　ぼかし処理として、平均化フィルタ等のぼかしフィルタを用いた処理が実行されてもよい。このぼかし処理は、ターゲット画素に対して、円形カーネルが設定され、ターゲット画素の画素値が、円形カーネル内に含まれる各画素の画素値の平均に変換される。
　本ぼかし処理では、平均化フィルタのフィルタ半径（円形カーネルの半径）をぼかし強度として用いることが可能である。フィルタ半径が大きいほどぼかし強度は大きくなり、フィルタ変形が小さいほどぼかし強度は小さくなる。
　本ぼかし処理でも、実世界のレンズの被写界深度（ＤｏＦ）に基づくぼけをシミュレートすることが可能である。また図１６及び図１７で例示したようなぼかし強度の設定が可能である。
　本ぼかし処理では、画素ごとに画素値が算出される処理であるので、非注視オブジェクト４１のレンダリング解像度が削減されない場合もあり得るが、データ量は低減させることが可能である。従って、後段のエンコーダ３７でのエンコード効率を高めることが可能となる。

　データ量低減処理として、色成分の削減が実行されてもよい。すなわち表現可能な色の種類が削減されてもよい。例えば、注目領域２９内の非注視オブジェクト４１の領域が、グレー色あるいはその領域の主要な色の単色で表現される。これにより、非注視オブジェクト４１のデータ量を削減することが可能となる。
　もちろん、ぼかし処理と色成分の削除が併用されてもよい。その他、任意のデータ量低減処理が実行されてよい。

　以上、本実施形態に係るサーバサイドレンダリングシステム１では、サーバ装置４により、レンダリング対象となる２次元映像データの表示領域３１に対して、注目領域２９と非注目領域３０とが設定される。そして、注目領域２９内の注視オブジェクト４０が高解像度でレンダリングされ、注目領域２９内の非注視オブジェクト４１のデータ量が低減される。これにより、高品質な仮想映像の配信を実現することが可能となる。

　本実施形態では、フォービエイテッドレンダリングが実行され、ビューポート（表示領域）３１に対して、高解像度でレンダリングされる対象となる注目領域２９と、低解像度でレンダリングされる対象となる非注目領域３０とが設定される。これにより、レンダリング処理負荷を低減させることが可能となり、リアルタイム動作の実現に有利となる。
　フォービエイテッドレンダリングは、表示画像の内容や画像内のオブジェクトの形状とは無関係に領域分割が行われる。従って、画像の圧縮符号化の観点で見ると、ユーザ５が注視している注視オブジェクト４０以外の周辺の領域（非注視オブジェクト４１）も、高解像度にレンダリングされることになる。
　後段のエンコーダ３７で注目領域２９をエンコードする際、圧縮符号化に起因する画質劣化を小さくするために、品質指定のパラメータ、例えばＣＲＦ（Constant Rate Factor）を小さな値に設定する方法がある。
　しかしながら、小さなＣＲＦ値でエンコードすると、発生ビット量が多くなる。注目領域２９を小さなＣＲＦ値で圧縮符号化すると、元々情報量が多い領域が低圧縮率で符号化されることになる。従って、注目領域２９で発生するビット量が、画像全体の発生ビット量に対して支配的な割合を占め、画像全体のビットレートは上昇してしまう。エンコーダ３７での圧縮率を上げればビットレートは下がるが、一般に画質も低下する。

　本実施形態では、注目領域２９内の注視オブジェクト４０が抽出され、高解像度にレンダリングされる。また、注目領域２９内の非注視オブジェクト４１に対してデータ量低減処理が実行され、データ量が低減される。
　これにより、主観画質を損なわずに注目領域２９内のデータ量を効率的に削減することが可能となり、ＣＦＲ値を小さくしなくても、注目領域２９の画質を維持しつつ発生ビット量を抑えることが可能となる。すなわち、後段のエンコードでの実質圧縮率を軽減させ、画質低下抑制とビットレート低減とを両立させることが可能となる。
　このように本実施形態では、レンダリング処理負荷の軽減（すなわちリアルタイム動作実現）、及びリアルタイムエンコードによる画質劣化の抑制を実現することが可能となる。
　また、サーバサイドレンダリングシステム１が採用されているので、例えば、処理負荷の重い画像の解析を実行することなく、オブジェクト単位でエンコード前のデータ量をコントロールすることが可能となり、送出ビットストリームのエンコード効率を向上させることが可能となる、

　なお、データ量低減処理としてぼかし処理が実行される場合、非注視オブジェクト４１はぼかされる。非注視オブジェクト４１をぼかしても、非注視オブジェクト４１を構成する画素数自体が大きく変わるというわけではない。
　従って、画素数から算出されるデータレートとしては変わらないが、圧縮符号化すると、ぼけている領域はＤＣＴ（離散コサイン変換）して量子化した際の係数列が短くなるため、ぼかす前と比較して発生データ量が小さくなる。ぼけている領域は空間周波数の高い周波数成分がカットされ、実質的なデータ量が少なくなっているためである。
　本開示において、データ量の削減は、このような実質的なデータ量の削減を含む。

　フォービエイテッドレンダリングとぼかし処理とは、共にデータ量を削減する処理といえる。一方で、フォービエイテッドレンダリングは画像の２次元面の位置をパラメータとしてデータ量を削減しているが、ぼかし処理はユーザ位置から各オブジェクトまでの距離をパラメータとしてデータ量を削減している点で考え方が異なる。
　本実施形態では、フォービエイテッドレンダリングを行うサーバサイドレンダリングシステム１において、注目領域２９内における注視オブジェクト４０以外のデータ量を下げるために、デプスマップ３３を利用したぼかし処理を導入する点が特徴で、これにより注目領域２９を圧縮符号化した際の主観画質の低下抑制と発生ビット量削減を両立するという効果が実現されている。
　もちろん、本技術の適用が、デプスマップ３３を利用したぼかし処理を導入するという点に限定される訳ではない。

　＜その他の実施形態＞
　本技術は、以上説明した実施形態に限定されず、他の種々の実施形態を実現することができる。

　図１８は、他の実施形態に係るレンダリングの一例を示す模式図である。
　図１８に示すように、非注目領域３０内に、注視オブジェクト４０が存在する場合には、非注目領域３０内の注視オブジェクト４０が高解像度でレンダリングされてもよい。
　すなわち、注視オブジェクト４０である人物Ｐ１の全体（非注目領域３０に含まれる部分も合わせて）、高解像度にレンダリングされてもよい。

　固定フォービエイテッドレンダリングでは、注目領域２９が固定であるため、注視オブジェクト４０が注目領域外にまたがることもあり得る。注視点に合わせて、注目領域２９が動的に設定される場合でも、注視オブジェクト４０のサイズが大きい場合等では、注視オブジェクト４０が注目領域外にまたがることもあり得る。
　このように、注目領域２９内の注視オブジェクト４０の一部が非注目領域（低解像度領域）３０に存在する場合には、その部分も含めて高解像度にレンダリングする。これにより、注視オブジェクト４０を注視するユーザ５が視線を移動させた場合に、同じ注視オブジェクト４０であるにもかかわらず、解像度の低い部分が見えてしまうといったことを抑制することが可能となる。
　図１８に示す例では、人物Ｐ１のおでこよりも上の部分が、急に低い解像度で見えてしまい、ユーザ５にとって違和感となってしまうといったことを抑制することが可能となる。

　また、特に固定フォービエイテッドレンダリングでは、ユーザ５の視線移動に対してマージンをもたせるために、注目領域（高解像度領域）２９を広めにとる必要がある。そうすると、注目領域２９のデータ量は多くなってしまう。
　図１８に示すレンダリングを実行することで、注目領域２９のサイズを小さくすることが可能となり、注目領域２９のデータ量を低減させることが可能となる。この結果、レンダリング処理負荷の軽減、及びリアルタイムエンコードによる画質劣化の抑制に有利となる。
　上記したように、本実施形態では、レンダリング情報として取得される高精度のデプスマップ３３に基づいて、注視オブジェクト４０の輪郭を正確に把握することが可能であり、図１８に示すレンダリングの実現に非常に有利である。

　上記では、仮想画像として、３６０度の空間映像データ等を含む全天球映像６（６ＤｏＦ映像）が配信される場合を例に挙げた。これに限定されず、３ＤｏＦ映像や２Ｄ映像等が配信される場合にも、本技術は適用可能である。また仮想画像として、ＶＲ映像ではなく、ＡＲ映像等が配信されてもよい。
　また、３Ｄ画像を視聴するためのステレオ映像（例えば右目画像及び左目画像等）についても、本技術は適用可能である。

　図１９は、サーバ装置４及びクライアント装置３を実現可能なコンピュータ（情報処理装置）６０のハードウェア構成例を示すブロック図である。
　コンピュータ６０は、ＣＰＵ６１、ＲＯＭ（Read Only Memory）６２、ＲＡＭ６３、入出力インタフェース６５、及びこれらを互いに接続するバス６４を備える。入出力インタフェース６５には、表示部６６、入力部６７、記憶部６８、通信部６９、及びドライブ部７０等が接続される。
　表示部６６は、例えば液晶、ＥＬ等を用いた表示デバイスである。入力部６７は、例えばキーボード、ポインティングデバイス、タッチパネル、その他の操作装置である。入力部６７がタッチパネルを含む場合、そのタッチパネルは表示部６６と一体となり得る。
　記憶部６８は、不揮発性の記憶デバイスであり、例えばＨＤＤ、フラッシュメモリ、その他の固体メモリである。ドライブ部７０は、例えば光学記録媒体、磁気記録テープ等、リムーバブルの記録媒体７１を駆動することが可能なデバイスである。
　通信部６９は、ＬＡＮ、ＷＡＮ等に接続可能な、他のデバイスと通信するためのモデム、ルータ、その他の通信機器である。通信部６９は、有線及び無線のどちらを利用して通信するものであってもよい。通信部６９は、コンピュータ６０とは別体で使用される場合が多い。
　上記のようなハードウェア構成を有するコンピュータ６０による情報処理は、記憶部６８またはＲＯＭ６２等に記憶されたソフトウェアと、コンピュータ６０のハードウェア資源との協働により実現される。具体的には、ＲＯＭ６２等に記憶された、ソフトウェアを構成するプログラムをＲＡＭ６３にロードして実行することにより、本技術に係る情報処理方法が実現される。
　プログラムは、例えば記録媒体６１を介してコンピュータ６０にインストールされる。あるいは、グローバルネットワーク等を介してプログラムがコンピュータ６０にインストールされてもよい。その他、コンピュータ読み取り可能な非一過性の任意の記憶媒体が用いられてよい。

　ネットワーク等を介して通信可能に接続された複数のコンピュータが協働することで、本技術に係る情報処理方法及びプログラムが実行され、本技術に係る情報処理装置が構築されてもよい。
　すなわち本技術に係る情報処理方法、及びプログラムは、単体のコンピュータにより構成されたコンピュータシステムのみならず、複数のコンピュータが連動して動作するコンピュータシステムにおいても実行可能である。
　なお本開示において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれもシステムである。
　コンピュータシステムによる本技術に係る情報処理方法、及びプログラムの実行は、例えば視野情報の取得、レンダリング処理の実行、レンダリング情報の生成等が、単体のコンピュータにより実行される場合、及び各処理が異なるコンピュータにより実行される場合の両方を含む。また所定のコンピュータによる各処理の実行は、当該処理の一部または全部を他のコンピュータに実行させその結果を取得することを含む。
　すなわち本技術に係る情報処理方法及びプログラムは、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成にも適用することが可能である。

　各図面を参照して説明したサーバサイドレンダリングシステム、ＨＭＤ、サーバ装置、クライアント装置等の各構成、各処理フロー等はあくまで一実施形態であり、本技術の趣旨を逸脱しない範囲で、任意に変形可能である。すなわち本技術を実施するための他の任意の構成やアルゴリズム等が採用されてよい。

　本開示において、説明の理解を容易とするために、「略」「ほぼ」「おおよそ」等の文言が適宜使用されている。一方で、これら「略」「ほぼ」「おおよそ」等の文言を使用する場合と使用しない場合とで、明確な差異が規定されるわけではない。
　すなわち、本開示において、「中心」「中央」「均一」「等しい」「同じ」「直交」「平行」「対称」「延在」「軸方向」「円柱形状」「円筒形状」「リング形状」「円環形状」等の、形状、サイズ、位置関係、状態等を規定する概念は、「実質的に中心」「実質的に中央」「実質的に均一」「実質的に等しい」「実質的に同じ」「実質的に直交」「実質的に平行」「実質的に対称」「実質的に延在」「実質的に軸方向」「実質的に円柱形状」「実質的に円筒形状」「実質的にリング形状」「実質的に円環形状」等を含む概念とする。
　例えば「完全に中心」「完全に中央」「完全に均一」「完全に等しい」「完全に同じ」「完全に直交」「完全に平行」「完全に対称」「完全に延在」「完全に軸方向」「完全に円柱形状」「完全に円筒形状」「完全にリング形状」「完全に円環形状」等を基準とした所定の範囲（例えば±１０％の範囲）に含まれる状態も含まれる。
　従って、「略」「ほぼ」「おおよそ」等の文言が付加されていない場合でも、いわゆる「略」「ほぼ」「おおよそ」等を付加して表現され得る概念が含まれ得る。反対に、「略」「ほぼ」「おおよそ」等を付加して表現された状態について、完全な状態が必ず排除されるというわけではない。

　本開示において、「Ａより大きい」「Ａより小さい」といった「より」を使った表現は、Ａと同等である場合を含む概念と、Ａと同等である場合を含まない概念の両方を包括的に含む表現である。例えば「Ａより大きい」は、Ａと同等は含まない場合に限定されず、「Ａ以上」も含む。また「Ａより小さい」は、「Ａ未満」に限定されず、「Ａ以下」も含む。
　本技術を実施する際には、上記で説明した効果が発揮されるように、「Ａより大きい」及び「Ａより小さい」に含まれる概念から、具体的な設定等を適宜採用すればよい。

　以上説明した本技術に係る特徴部分のうち、少なくとも２つの特徴部分を組み合わせることも可能である。すなわち各実施形態で説明した種々の特徴部分は、各実施形態の区別なく、任意に組み合わされてもよい。また上記で記載した種々の効果は、あくまで例示であって限定されるものではなく、また他の効果が発揮されてもよい。

　なお、本技術は以下のような構成も採ることができる。
（１）
　ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成するレンダリング部を具備し、
　前記レンダリング部は、
　前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定し、
　前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出し、
　前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させる
　情報処理装置。
（２）（１）に記載の情報処理装置であって、
　前記レンダリング処理に関するパラメータは、レンダリング対象となるオブジェクトまでの距離情報を含み、
　前記レンダリング部は、前記距離情報に基づいて、前記注目領域内の前記非注視オブジェクトのデータ量を低減させる
　情報処理装置。
（３）（２）に記載の情報処理装置であって、
　前記レンダリング部は、前記注目領域内の前記非注視オブジェクトに対して、ぼかし処理を実行する
　情報処理装置。
（４）（３）に記載の情報処理装置であって、
　前記レンダリング部は、実世界のレンズの被写界深度に基づくぼけをシミュレートすることで、前記ぼかし処理を実行する
　情報処理装置。
（５）（３）又は（４）に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトまでの距離と、所定の基準距離との差分が大きくなるほど、前記非注視オブジェクトに対するぼかし強度を高く設定する
　情報処理装置。
（６）（３）又は（４）に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトまでの距離と所定の基準距離との差分に関して複数の範囲を設定し、前記複数の範囲の各々に対して、ぼかし強度を設定する
　情報処理装置。
（７）（６）に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトまでの距離と所定の基準距離との差分が０から第１の距離までの第１の範囲と、前記差分が前記第1の距離から前記第１の距離よりも大きい第２の距離までの第２の範囲とを設定し、前記第１の範囲に第１のぼかし強度を設定し、前記第２の範囲に前記第１のぼかし強度よりも高い第２のぼかし強度を設定する
　情報処理装置。
（８）（７）に記載の情報処理装置であって、
　前記レンダリング部は、前記差分が前記第２の距離から前記第２の距離よりも大きい第３の距離までの第３の範囲を設定し、前記第３の範囲に第２のぼかし強度よりも高い第３のぼかし強度を設定する
　情報処理装置。
（９）（３）から（８）のうちいずれか１つに記載の情報処理装置であって、
　前記レンダリング部は、所定の基準距離よりも近い範囲に位置する前記非注視オブジェクトよりも、前記基準距離よりも遠い範囲に位置する前記非注視オブジェクトの方が強くぼけるように、前記ぼかし強度を設定する
　情報処理装置。
（１０）（３）から（９）のうちいずれか１つに記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトを高解像度でレンダリングした後に、前記非注視オブジェクトに対して前記ぼかし処理を実行する
　情報処理装置。
（１１）（３）から（９）のうちいずれか１つに記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトを、前記ぼかし処理が実行された場合の解像度でレンダリングする
　情報処理装置。
（１２）（１）から（１１）のうちいずれか１つに記載の情報処理装置であって、
　前記レンダリング部は、前記非注目領域内に前記注視オブジェクトが存在する場合には、前記非注目領域内の前記注視オブジェクトを高解像度でレンダリングする
　情報処理装置。
（１３）（１）に記載の情報処理装置であって、
　前記レンダリング部は、前記注目領域内の前記注視オブジェクトを第１の解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトを前記第１の解像度よりも低い第２の解像度でレンダリングする
　情報処理装置。
（１４）（１）から（１３）のうちいずれか１つに記載の情報処理装置であって、
　前記レンダリング部は、前記視野情報に基づいて、前記注目領域、及び前記非注目領域を設定する
　情報処理装置。
（１５）（１）から（１４）のうちいずれか１つに記載の情報処理装置であって、さらに、
　前記２次元映像データに対して量子化パラメータを設定し、設定された前記量子化パラメータに基づき前記２次元映像データに対してエンコード処理を実行するエンコード部を具備する
　情報処理装置。
（１６）（１５）に記載の情報処理装置であって、
　前記エンコード部は、前記注目領域に対して第１の量子化パラメータを設定し、前記非注目領域に対して、前記第１の量子化パラメータよりも大きい第２の量子化パラメータを設定する
　情報処理装置。
（１７）（１５）に記載の情報処理装置であって、
　前記エンコード部は、前記注目領域内の前記注視オブジェクトに対して第１の量子化パラメータを設定し、前記注目領域内の前記非注視オブジェクトに対して前記第１の量子化パラメータよりも大きい第２の量子化パラメータを設定し、前記非注目領域に対して前記第２の量子化パラメータよりも大きい第３の量子化パラメータを設定する
　情報処理装置。
（１８）（１）から（１７）のうちいずれか１つに記載の情報処理装置であって、
　前記３次元空間データは、全天周映像データ、又は空間映像データの少なくとも一方を含む
　情報処理装置。
（１９）
　コンピュータシステムが実行する情報処理方法であって、
　ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成するレンダリングステップを具備し、
　前記レンダリングステップは、
　前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定するステップと、
　前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出するステップと、
　前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させるステップと
　を含む
　情報処理方法。

　１…サーバサイドレンダリングシステム
　２…ＨＭＤ
　３…クライアント装置
　４…サーバ装置
　５…ユーザ
　６…全天球映像
　８…レンダリング映像
　１２…視野情報取得部
　１４…レンダリング部
　１５…エンコード部
　１６…通信部
　１９…フレーム画像
　２９…注目領域
　３０…非注目領域
　３１…ビューポート（表示領域）
　３３…デプスマップ
　３５…再現部
　３６…レンダラ
　３７…エンコーダ
　３８…コントローラ
　４０…注視オブジェクト
　４１…非注視オブジェクト
　６０…コンピュータ

Claims

　ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成するレンダリング部を具備し、
　前記レンダリング部は、
　前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定し、
　前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出し、
　前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させる
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記レンダリング処理に関するパラメータは、レンダリング対象となるオブジェクトまでの距離情報を含み、
　前記レンダリング部は、前記距離情報に基づいて、前記注目領域内の前記非注視オブジェクトのデータ量を低減させる
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記レンダリング部は、前記注目領域内の前記非注視オブジェクトに対して、ぼかし処理を実行する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記レンダリング部は、実世界のレンズの被写界深度に基づくぼけをシミュレートすることで、前記ぼかし処理を実行する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトまでの距離と、所定の基準距離との差分が大きくなるほど、前記非注視オブジェクトに対するぼかし強度を高く設定する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトまでの距離と所定の基準距離との差分に関して複数の範囲を設定し、前記複数の範囲の各々に対して、ぼかし強度を設定する
　情報処理装置。
　請求項６に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトまでの距離と所定の基準距離との差分が０から第１の距離までの第１の範囲と、前記差分が前記第1の距離から前記第１の距離よりも大きい第２の距離までの第２の範囲とを設定し、前記第１の範囲に第１のぼかし強度を設定し、前記第２の範囲に前記第１のぼかし強度よりも高い第２のぼかし強度を設定する
　情報処理装置。
　請求項７に記載の情報処理装置であって、
　前記レンダリング部は、前記差分が前記第２の距離から前記第２の距離よりも大きい第３の距離までの第３の範囲を設定し、前記第３の範囲に第２のぼかし強度よりも高い第３のぼかし強度を設定する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記レンダリング部は、所定の基準距離よりも近い範囲に位置する前記非注視オブジェクトよりも、前記基準距離よりも遠い範囲に位置する前記非注視オブジェクトの方が強くぼけるように、前記ぼかし強度を設定する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトを高解像度でレンダリングした後に、前記非注視オブジェクトに対して前記ぼかし処理を実行する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記レンダリング部は、前記非注視オブジェクトを、前記ぼかし処理が実行された場合の解像度でレンダリングする
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記レンダリング部は、前記非注目領域内に前記注視オブジェクトが存在する場合には、前記非注目領域内の前記注視オブジェクトを高解像度でレンダリングする
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記レンダリング部は、前記注目領域内の前記注視オブジェクトを第１の解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトを前記第１の解像度よりも低い第２の解像度でレンダリングする
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記レンダリング部は、前記視野情報に基づいて、前記注目領域、及び前記非注目領域を設定する
　情報処理装置。
　請求項１に記載の情報処理装置であって、さらに、
　前記２次元映像データに対して量子化パラメータを設定し、設定された前記量子化パラメータに基づき前記２次元映像データに対してエンコード処理を実行するエンコード部を具備する
　情報処理装置。
　請求１５に記載の情報処理装置であって、
　前記エンコード部は、前記注目領域に対して第１の量子化パラメータを設定し、前記非注目領域に対して、前記第１の量子化パラメータよりも大きい第２の量子化パラメータを設定する
　情報処理装置。
　請求項１５に記載の情報処理装置であって、
　前記エンコード部は、前記注目領域内の前記注視オブジェクトに対して第１の量子化パラメータを設定し、前記注目領域内の前記非注視オブジェクトに対して前記第１の量子化パラメータよりも大きい第２の量子化パラメータを設定し、前記非注目領域に対して前記第２の量子化パラメータよりも大きい第３の量子化パラメータを設定する
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記３次元空間データは、全天周映像データ、又は空間映像データの少なくとも一方を含む
　情報処理装置。
　コンピュータシステムが実行する情報処理方法であって、
　ユーザの視野に関する視野情報に基づいて、３次元空間データに対してレンダリング処理を実行することにより、前記ユーザの視野に応じた２次元映像データを生成するレンダリングステップを具備し、
　前記レンダリングステップは、
　前記２次元映像データの表示領域に対して、高解像度でのレンダリングの対象となる注目領域と、低解像度でのレンダリングの対象となる非注目領域とを設定するステップと、
　前記レンダリング処理に関するパラメータと前記視野情報とに基づいて、前記ユーザの注視対象となる注視オブジェクトを抽出するステップと、
　前記注目領域内の前記注視オブジェクトを高解像度でレンダリングし、前記注目領域内の前記注視オブジェクト以外の非注視オブジェクトのデータ量を低減させるステップと
　を含む
　情報処理方法。