JP2021057770A

JP2021057770A - 画像データ転送装置および画像圧縮方法

Info

Publication number: JP2021057770A
Application number: JP2019179441A
Authority: JP
Inventors: 活志大塚; Katsuyuki Otsuka
Original assignee: Sony Interactive Entertainment LLC
Current assignee: Sony Interactive Entertainment LLC
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-04-08
Also published as: WO2021065633A1; US20220377349A1

Abstract

【課題】通信によるデータ伝送を伴う画像表示において、画質と遅延時間の低減を両立させる。【解決手段】サーバ４００の圧縮符号化部４２２において注目度推定部４６０は、画像生成部４２０が生成し動画像が表す内容に基づき、フレーム平面を分割してなる単位領域ごとに注目度を推定する。圧縮符号化処理部４６４は、注目度の分布に基づきフレーム平面で圧縮率を異ならせ、動画像を圧縮符号化する。通信部４２６は圧縮符号化されたデータを画像処理装置２００に送信する。【選択図】図３３

Description

この発明は、表示対象の動画像のデータを処理する画像データ転送装置および画像圧縮方法に関する。

近年の情報処理技術や画像表示技術の向上により、様々な形態で映像世界を体験することができるようになってきた。例えばヘッドマウントディスプレイにパノラマ映像を表示し、ユーザの視線に対応する画像を表示させることにより、映像世界への没入感を高めたり、ゲームなどのアプリケーションの操作性を向上させたりできる。また、潤沢なリソースを有するサーバからストリーミング転送された画像データを表示させることにより、ユーザは場所や規模によらず高精細な動画像やゲーム画面を楽しむことができる。

ネットワークを介して伝送された画像のデータをクライアント端末に即時表示させる技術においては、当該クライアント端末とサーバ間の通信による遅延時間が問題となり得る。例えばクライアント端末側でのユーザ操作を表示画像に反映させる場合、ユーザ操作のサーバへの送信と、サーバからクライアント端末への画像データの送信といったデータの行き来が必要になり、看過できない遅延時間を生むことがある。ヘッドマウントディスプレイを表示先とする場合は、ユーザの頭部の動きに対し表示が遅れることにより、臨場感が損なわれたり映像酔いを引き起こしたりすることも考えられる。この問題は、高い画質を追求するほど顕在化しやすい。

本発明はこうした課題に鑑みてなされたものであり、その目的は、通信によるデータ伝送を伴う画像表示において、画質と遅延時間の低減を両立させることのできる技術を提供することにある。

上記課題を解決するために、本発明のある態様は画像データ転送装置に関する。この画像データ転送装置は、表示対象の動画像を描画する描画部と、前記動画像が表す内容に係る情報を取得する画像内容取得部と、動画像のフレーム平面を分割してなる単位領域ごとに、動画像が表す内容に応じた注目度を推定する注目度推定部と、注目度の分布に基づきフレーム平面で圧縮率を異ならせ、動画像のデータを圧縮符号化する圧縮符号化部と、圧縮符号化された動画像のデータを送信する通信部と、を備えたことを特徴とする。

本発明の別の態様は画像圧縮方法に関する。この画像圧縮方法は画像データ転送装置が、表示対象の動画像を描画するステップと、前記動画像が表す内容に係る情報を取得するステップと、動画像のフレーム平面を分割してなる単位領域ごとに、動画像が表す内容に応じた注目度を推定するステップと、注目度の分布に基づきフレーム平面で圧縮率を異ならせ、動画像のデータを圧縮符号化するステップと、圧縮符号化された動画像のデータを送信するステップと、を含むことを特徴とする。

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。

本発明によれば、通信によるデータ伝送を伴う画像表示において、画質と遅延時間の低減を両立させることができる。

本実施の形態における画像処理システムの構成例を示す図である。本実施の形態のヘッドマウントディスプレイの外観例を示す図である。本実施の形態におけるサーバと画像処理装置の基本的な構成を示す図である。本実施の形態における、画像の描画から表示までの処理の様子を概念的に示す図である。本実施の形態のサーバおよび画像処理装置の機能ブロックを示す図である。本実施の形態においてサーバと画像処理装置が、部分画像単位でパイプライン処理を行う効果を説明するための図である。本実施の形態におけるサーバと画像処理装置間での部分画像のデータの伝送状況を例示する図である。本実施の形態において表示制御部が、出力対象や出力タイミングを調整しつつ、表示パネルへ部分画像のデータを出力する処理手順の例を示すフローチャートである。本実施の形態においてリプロジェクション機能を有する画像処理装置の機能ブロックの構成を示す図である。本実施の形態において第１補正部が実施するリプロジェクションと接眼レンズのための歪み補正を説明するための図である。本実施の形態において第１補正部が行う補正処理の手順の例を説明するための図である。本実施の形態において画像処理装置がリプロジェクションを行う際に、表示制御部の出力対象決定部が出力対象を調整する処理手順を示すフローチャートである。図１２のＳ９４において、ユーザの視点に基づきデータ欠落の度合いを数値化する手法を説明するための図である。図１２のＳ９６において評価する、リプロジェクションに必要なデータを説明するための図である。本実施の形態の画像処理装置においてリプロジェクションを行う場合に、サーバと画像処理装置が実施する処理の手順を示すフローチャートである。本実施の形態において、形態の異なる複数の表示装置への表示に対応できるサーバと画像処理装置の機能ブロックの構成を示す図である。本実施の形態で実現できる画像の形式の変遷を例示する図である。本実施の形態においてユーザ側（クライアント側）での表示装置の接続方式のバリエーションを例示する図である。本実施の形態においてサーバが表示形態に応じて決定した形式で画像のデータを送信する処理手順を示すフローチャートである。本実施の形態において、複数視点の画像を高率で圧縮する機能を有するサーバと、それを処理する画像処理装置の機能ブロックの構成を示す図である。本実施の形態において第１符号化部と第２符号化部が圧縮符号化する画像ブロックと、そのために圧縮符号化結果を参照する画像ブロックの関係を例示する図である。本実施の形態においてサーバが、複数視点の画像の類似性を利用して画像ブロック単位で圧縮符号化する効果を説明するための図である。本実施の形態において、スケーラブル映像符号化を実施する場合の、圧縮符号化部の機能ブロックの構成を示す図である。本実施の形態において、スケーラブル映像符号化を実施する場合の、第１符号化部と第２符号化部が圧縮符号化する画像ブロックと、そのために圧縮符号化結果を参照する画像ブロックの関係を例示する図である。本実施の形態において、スケーラブル映像符号化を実施する場合の、第１符号化部と第２符号化部が圧縮符号化する画像ブロックと、そのために圧縮符号化結果を参照する画像ブロックの関係を例示する図である。本実施の形態においてデータサイズ削減手段を最適化する機能を有するサーバの機能ブロックの構成を示す図である。本実施の形態において、動画像の内容に応じてスコアを決定する事例を示す図である。本実施の形態において、動画像の内容に応じてスコアを決定する事例を示す図である。本実施の形態において、動画像の内容に応じてスコアを決定する事例を示す図である。本実施の形態において、動画像の内容に応じてスコアを決定する事例を示す図である。本実施の形態において、動画像の内容に応じてスコアを決定する事例を示す図である。本実施の形態においてサーバが通信状況に応じてデータサイズを調整する処理手順を示すフローチャートである。本実施の形態において、動画像が表す内容に基づき、フレーム上の領域によって圧縮率を変化させる機能を有するサーバの機能ブロックの構成を示す図である。本実施の形態において注目度推定部が画像平面における注目度の分布を推定する処理を説明するための図である。本実施の形態においてサーバが画像平面の領域ごとに圧縮率を制御する処理手順を示すフローチャートである。本実施の形態において、ユーザの注視点に基づき、フレーム上の領域によって圧縮率を変化させる機能を有するサーバの機能ブロックの構成を示す図である。本実施の形態において注目度推定部が画像平面における注目度の分布を推定する処理を説明するための図である。本実施の形態において圧縮符号化処理部が注視点に基づき圧縮率の分布を決定する手法について説明するための図である。

１．システムの全体構成
図１は、本実施の形態における画像処理システムの構成例を示す。画像表示システム１は、画像処理装置２００、ヘッドマウントディスプレイ１００、平板型ディスプレイ３０２、およびサーバ４００を含む。画像処理装置２００は、ヘッドマウントディスプレイ１００および平板型ディスプレイ３０２と、無線通信またはＵＳＢＴｙｐｅ−Ｃ、ＨＤＭＩ（登録商標）などのインターフェース３００により接続される。画像処理装置２００はさらに、インターネットやＬＡＮ（Local Area Network）などのネットワーク３０６を介してサーバ４００に接続される。

サーバ４００は、画像データ転送装置として、表示対象の画像の少なくとも一部を生成して画像処理装置２００に送信する。ここでサーバ４００は、クラウドゲームなど各種配信サービスを提供する企業などのサーバでもよいし、任意の端末にデータを送信する家庭内サーバなどでもよい。したがってネットワーク３０６は、インターネットなどの公衆ネットワークやＬＡＮ（Local Area Network）など、その規模は限定されない。例えばネットワーク３０６は携帯電話キャリアネットワークや、街中にあるＷｉ−Ｆｉスポット、家庭にあるＷｉ−Ｆｉアクセスポイントを経由したものでもよい。あるいは画像処理装置２００とサーバ４００は、ビデオインターフェースにより直接接続されてもよい。

画像処理装置２００は、サーバ４００から送信された画像のデータに必要な処理を施し、ヘッドマウントディスプレイ１００および平板型ディスプレイ３０２の少なくともいずれかに出力する。例えばサーバ４００は、各自ヘッドマウントディスプレイ１００を装着した複数のユーザの頭部の動きやユーザ操作を、各ヘッドマウントディスプレイ１００に接続された複数の画像処理装置２００から受信する。そして、ユーザ操作に応じて変化させた仮想世界を、各ユーザの頭部の動きに対応する視野で描画したうえ、それぞれの画像処理装置２００に送信する。

画像処理装置２００は送信された画像のデータを、必要に応じて、ヘッドマウントディスプレイ１００や平板型ディスプレイ３０２に適した形式に変換したうえ、適切なタイミングでヘッドマウントディスプレイ１００や平板型ディスプレイ３０２に出力する。このような処理を、動画像のフレームごとに繰り返せば、複数のユーザが参加するクラウドゲームシステムを実現できる。この際、画像処理装置２００は、サーバ４００から送信された画像に、別途準備したＵＩ（User Interface）プレーン画像（あるいはＯＳＤ（On Screen Display)プレーン画像とも呼ぶ)や、ヘッドマウントディスプレイ１００が備えるカメラによる撮影画像を合成してから、ヘッドマウントディスプレイ１００や平板型ディスプレイ３０２に出力してもよい。

画像処理装置２００はまた、サーバ４００から送信された画像を、ヘッドマウントディスプレイ１００の表示直前の位置や姿勢に基づき補正することにより、頭部の動きに対する表示の追随性を高めてもよい。画像処理装置２００は、平板型ディスプレイ３０２にも同様の視野で画像を表示させることにより、ヘッドマウントディスプレイ１００を装着しているユーザがどのような画像を見ているかを、その他の人が見られるようにしてもよい。

ただし本実施の形態において表示対象とする動画像の内容や、その表示先は特に限定されない。例えばサーバ４００は、図示しないカメラによって撮影された画像を表示対象とし、画像処理装置２００にライブ配信してもよい。このときサーバ４００は、スポーツ競技やコンサートなどのイベント会場を複数のカメラで撮影した多視点画像を取得し、それを用いてヘッドマウントディスプレイ１００の動きに応じた視野での画像を作り出すことにより、自由視点のライブ映像を生成し、各画像処理装置２００に配信してもよい。

また本実施の形態を適用できるシステムの構成は図示するものに限定されない。例えば画像処理装置２００に接続する表示装置はヘッドマウントディスプレイ１００と平板型ディスプレイ３０２のどちらか一方でもよいし、複数のヘッドマウントディスプレイ１００であってもよい。また画像処理装置２００はヘッドマウントディスプレイ１００や平板型ディスプレイ３０２に内蔵されていてもよい。例えば平板型のディスプレイと画像処理装置を、それらを一体的に備えたパーソナルコンピュータや携帯端末（ポータブルゲーム機、高機能携帯電話、タブレット端末）としてもよい。

これらの装置にさらにヘッドマウントディスプレイ１００および平板型ディスプレイ３０２の少なくともいずれかを必要に応じて接続できるようにしてもよい。画像処理装置２００やこれらの端末に、図示しない入力装置を内蔵もしくは接続してもよい。またサーバ４００に接続される画像処理装置２００の数も限定されない。さらにサーバ４００は、各自の平板型ディスプレイ３０２を視聴している複数のユーザの操作内容を、各平板型ディスプレイ３０２に接続された複数の画像処理装置２００から受信し、それに対応する画像を生成したうえ、それぞれの画像処理装置２００に送信してもよい。

図２は、ヘッドマウントディスプレイ１００の外観例を示す。この例においてヘッドマウントディスプレイ１００は、出力機構部１０２および装着機構部１０４で構成される。装着機構部１０４は、ユーザが被ることにより頭部を一周し装置の固定を実現する装着バンド１０６を含む。出力機構部１０２は、ヘッドマウントディスプレイ１００をユーザが装着した状態において左右の目を覆うような形状の筐体１０８を含み、内部には装着時に目に正対するように表示パネルを備える。

筐体１０８内部にはさらに、ヘッドマウントディスプレイ１００の装着時に表示パネルとユーザの目との間に位置し、画像を拡大して見せる接眼レンズを備える。またヘッドマウントディスプレイ１００はさらに、装着時にユーザの耳に対応する位置にスピーカーやイヤホンを備えてよい。またヘッドマウントディスプレイ１００はモーションセンサを内蔵し、ヘッドマウントディスプレイ１００を装着したユーザの頭部の並進運動や回転運動、ひいては各時刻の位置や姿勢を検出してもよい。

ヘッドマウントディスプレイ１００はさらに、筐体１０８の前面にステレオカメラ１１０、中央に広視野角の単眼カメラ１１１、左上、右上、左下、右下の四隅に広視野角の４つのカメラ１１２を備え、ユーザの顔の向きに対応する方向の実空間を動画撮影する。ある態様においてヘッドマウントディスプレイ１００は、ステレオカメラ１１０が撮影した動画像を即時表示させることにより、ユーザが向いた方向の実空間の様子をそのまま見せるシースルーモードを提供する。

またステレオカメラ１１０、単眼カメラ１１１、４つのカメラ１１２による撮影画像の少なくともいずれかを、表示画像の生成に利用してもよい。例えばＳＬＡＭ（Simultaneous Localization and Mapping）により周囲の空間に対するヘッドマウントディスプレイ１００、ひいてはユーザの頭部の位置や姿勢を所定のレートで取得し、サーバ４００において生成する画像の視野を決定したり、画像処理装置２００において当該画像を補正したりしてもよい。あるいは画像処理装置２００において、サーバ４００から送信された画像に撮影画像を合成し表示画像としてもよい。

またヘッドマウントディスプレイ１００は、内部に加速度センサ、ジャイロセンサ、地磁気センサなど、ヘッドマウントディスプレイ１００の位置、姿勢、動きを導出するためのモーションセンサのいずれかを備えてよい。この場合、画像処理装置２００は、当該モーションセンサの計測値に基づき、ユーザ頭部の位置や姿勢の情報を所定のレートで取得する。この情報は、サーバ４００において生成する画像の視野を決定したり、画像処理装置２００において当該画像を補正したりするのに用いることができる。

図３は、本実施の形態におけるサーバ４００と画像処理装置２００の基本的な構成を示している。本実施の形態におけるサーバ４００および画像処理装置２００は、表示画像の１フレームより小さい部分画像を記憶するローカルメモリを要所に備える。そしてサーバ４００における画像データの圧縮符号化および送信、画像処理装置２００におけるデータの受信、復号伸張、各種画像処理、表示装置への出力を、当該部分画像の単位でパイプライン処理する。これにより、サーバ４００での画像の描画から、画像処理装置２００に接続された表示装置への表示までの遅延時間を軽減させる。

サーバ４００において、描画制御部４０２はＣＰＵ（Central Processing Unit）で実現され、画像描画部４０４における画像の描画を制御する。上述のとおり本実施の形態において表示させる画像の内容は特に限定されないが、描画制御部４０２は例えば、クラウドゲームを進捗させ、その結果を表す動画像のフレームを画像描画部４０４に描画させる。この際、描画制御部４０２は、画像処理装置２００からユーザの頭部の位置や姿勢に係る情報を取得し、それに対応する視野で各フレームを描画するように制御してもよい。

画像描画部４０４はＧＰＵ（Graphics Processing Unit）で実現され、描画制御部４０２の制御のもと、所定または可変のレートで動画像のフレームを描画し、その結果をフレームバッファ４０６に格納する。フレームバッファ４０６はＲＡＭ（Random Access Memory）によって実現される。ビデオエンコーダ４０８は、描画制御部４０２の制御のもと、フレームバッファ４０６に格納された画像のデータを、１フレームより小さい部分画像の単位で圧縮符号化する。部分画像は、フレームの画像平面を所定サイズに分割してなる各領域の画像である。すなわち部分画像は、例えば画像平面を横方向、縦方向、縦横双方向、または斜め方向に設定した境界線で分割してなる、各領域の画像である。

ビデオエンコーダ４０８はこの際、画像描画部４０４による１フレーム分の描画が終了次第、サーバの垂直同期信号を待たずに、当該フレームの圧縮符号化を開始してよい。フレームの描画や圧縮符号化など各種処理を、垂直同期信号を基準として同期させる従来技術によれば、画像の描画から表示までの各処理に与える時間をフレーム単位で揃えることにより、フレーム順の管理が容易である。しかしながらこの場合、フレームの内容によって描画処理が早く終了しても、圧縮符号化処理を次の垂直同期信号まで待機する必要がある。本実施の形態では後に述べるように、部分画像単位でその生成時刻を管理することにより、無駄な待機時間が生じないようにする。

ビデオエンコーダ４０８が圧縮符号化に用いる符号化方式は、Ｈ．２６４／ＡＶＣやＨ．２６５／ＨＥＶＣなど一般的なものでよい。ビデオエンコーダ４０８は、圧縮符号化した部分画像単位の画像のデータを部分画像記憶部４１０に格納する。部分画像記憶部４１０はＳＲＡＭ(Static Random Access Memory)などで実現されるローカルメモリであり、１フレームより小さい部分画像のデータサイズに対応する記憶領域を有する。以後に述べる「部分画像記憶部」も同様である。ビデオストリーム制御部４１４は、圧縮符号化された部分画像のデータが部分画像記憶部４１０に格納される都度、当該データを読み出し、オーディオデータや制御情報などを必要に応じて含めたうえでパケット化する。

制御部４１２は、部分画像記憶部４１０に対するビデオエンコーダ４０８のデータ書き込み状況や、ビデオストリーム制御部４１４のデータを読み出し状況などを常に監視し、両者の動作を適切に制御する。例えば制御部４１２は、部分画像記憶部４１０にデータ欠乏、すなわちバッファアンダーランや、データ溢れ、すなわちバッファオーバーランが起きないように制御する。

入出力インターフェース４１６は画像処理装置２００と通信を確立し、ビデオストリーム制御部４１４がパケット化したデータを、ネットワーク３０６を介して順次送信する。入出力インターフェース４１６は画像データのほか、オーディオデータなども適宜送信してよい。また上述のとおり、入出力インターフェース４１６はさらに、ユーザ操作やユーザの頭部の位置や姿勢に係る情報を画像処理装置２００から取得し、描画制御部４０２に供給してもよい。画像処理装置２００において入出力インターフェース２０２は、サーバ４００から送信された画像やオーディオのデータを順次取得する。

入出力インターフェース２０２はさらに、ユーザ操作やユーザの頭部の位置や姿勢に係る情報をヘッドマウントディスプレイ１００や図示しない入力装置などから適宜取得し、サーバ４００に送信してもよい。入出力インターフェース２０２は、サーバ４００から取得したパケットを復号のうえ、取り出した画像のデータを部分画像記憶部２０４に格納する。部分画像記憶部２０４は入出力インターフェース２０２とビデオデコーダ２０８の間に設けたローカルメモリであり、圧縮データ記憶部を構成している。制御部２０６は、部分画像記憶部２０４に対する入出力インターフェース２０２のデータ書き込み状況や、ビデオデコーダ２０８のデータを読み出し状況などを常に監視し、両者の動作を適切に制御する。

ビデオデコーダ２０８は、復号伸張部として、部分画像のデータが部分画像記憶部２０４に格納される都度、当該データを読み出し、符号化方式に応じた手順で復号伸張したうえ、部分画像記憶部２１０に順次格納する。部分画像記憶部２１０はビデオデコーダ２０８と画像処理部２１４の間に設けたローカルメモリであり、復号後データ記憶部を構成している。制御部２１２は、部分画像記憶部２１０に対するビデオデコーダ２０８のデータ書き込み状況や、画像処理部２１４のデータを読み出し状況などを常に監視し、両者の動作を適切に制御する。

画像処理部２１４は、復号伸張された部分画像のデータが部分画像記憶部２１０に格納される都度、当該データを読み出し、表示に必要な処理を施す。例えばヘッドマウントディスプレイ１００において、接眼レンズを介して見たときに歪みのない画像を視認させるために、接眼レンズによる歪みと逆の歪みを与える補正処理を実施する。

あるいは画像処理部２１４は、別途準備したＵＩプレーン画像を参照し、サーバ４００から送信された画像に合成（スーパーインポーズ）してもよい。また画像処理部２１４は、ヘッドマウントディスプレイ１００が備えるカメラによる撮影画像を、サーバ４００から送信された画像に合成してもよい。画像処理部２１４はまた、処理の時点におけるユーザの頭部の位置や姿勢に対応する視野となるように、サーバ４００から送信された画像を補正してもよい。画像処理部２１４はまた、超解像処理など平板型ディスプレイ３０２へ出力するのに適した画像処理を行ってもよい。

いずれにしろ画像処理部２１４は、部分画像記憶部２１０に格納された部分画像の単位で処理を施し、部分画像記憶部２１６に順次格納していく。部分画像記憶部２１６は画像処理部２１４とディスプレイコントローラ２２０の間に設けたローカルメモリである。制御部２１８は、部分画像記憶部２１６に対する画像処理部２１４のデータ書き込み状況や、ディスプレイコントローラ２２０のデータを読み出し状況などを常に監視し、両者の動作を適切に制御する。

ディスプレイコントローラ２２０は、画像処理後の部分画像のデータが部分画像記憶部２１６に格納される都度、当該データを読み出し、ヘッドマウントディスプレイ１００や平板型ディスプレイ３０２に適切なタイミングで出力する。具体的には、それらのディスプレイの垂直同期信号に合致するタイミングで、各フレームの最上段の部分画像のデータを出力し、その後、下方に向けて部分画像のデータを順次出力していく。

２．部分画像ごとのパイプライン処理
次に、画像の描画から表示までにサーバ４００および画像処理装置２００において実現される、部分画像のパイプライン処理について説明する。図４は、本実施の形態における、画像の描画から表示までの処理の様子を概念的に示している。上述のとおりサーバ４００は、動画像のフレーム９０を所定または可変のレートで生成する。図示する例でフレーム９０は、左右に二等分した領域に左目用、右目用の画像をそれぞれ表した構成を有するが、サーバ４００で生成する画像の構成をこれに限る趣旨ではない。

サーバ４００は上述のとおり、フレーム９０を部分画像ごとに圧縮符号化する。図では画像平面を水平方向に５分割し、部分画像９２ａ、９２ｂ、９２ｃ、９２ｄ、９２ｅとしている。これにより、部分画像はこの順で次々に圧縮符号化され、矢印に示すように画像処理装置２００へ伝送され表示される。すなわち最上段の部分画像９２ａに対し、圧縮符号化、送信、復号伸張、表示パネル９４への出力といった処理が施されている間に、その下の部分画像９２ｂ、さらに下の部分画像９２ｃ、というように順次部分画像が伝送され表示される。これにより、画像の描画から表示までに必要な各種処理を並列に実施でき、転送時間が介在しても最低限の遅延で表示を進捗させることができる。

図５は、本実施の形態のサーバ４００および画像処理装置２００の機能ブロックを示している。同図に示す各機能ブロックは、ハードウェア的にはＣＰＵ、ＧＰＵ、エンコーダ、デコーダ、演算器、各種メモリなどで実現でき、ソフトウェア的には、記録媒体からメモリにロードした、情報処理機能、画像描画機能、データ入出力機能、通信機能などの諸機能を発揮するプログラムで実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。後述する機能ブロックも同様である。

サーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を備える。画像生成部４２０は図３の描画制御部４０２、画像描画部４０４、フレームバッファ４０６で構成され、ゲーム画像など画像処理装置２００に送信すべき動画像のフレームを、所定または可変のレートで生成する。あるいは画像生成部４２０は、図示しないカメラや記憶装置などから動画像のデータを取得してもよい。この場合、画像生成部４２０は、画像取得部と読み替えることができる。以後の説明でも同様である。

圧縮符号化部４２２は、図３のビデオエンコーダ４０８、部分画像記憶部４１０、制御部４１２で構成され、画像生成部４２０が生成した画像のデータを、部分画像の単位で圧縮符号化する。ここで圧縮符号化部４２２は、１行、２行など所定数の行の領域や、１６×１６画素、６４×６４画素など所定サイズの矩形領域を単位として動き補償や符号化を行う。したがって圧縮符号化部４２２は、圧縮符号化に必要な最小単位の領域のデータが画像生成部４２０により生成されたら、圧縮符号化を開始してよい。

なお圧縮符号化や送信におけるパイプライン処理の単位である部分画像は、当該最小単位の領域と同じでもよいしそれより大きな領域としてもよい。パケット化部４２４は、図３のビデオストリーム制御部４１４、制御部４１２で構成され、圧縮符号化された部分画像のデータを、利用する通信のプロトコルに応じた形式でパケット化する。この際、当該部分画像が描画された時刻（以下、「生成時刻」と呼ぶ）を、画像生成部４２０または圧縮符号化部４２２から取得することにより、部分画像のデータと対応づけておく。

通信部４２６は、図３の入出力インターフェース４１６で構成され、圧縮符号化された部分画像のデータとその生成時刻を含めたパケットを、画像処理装置２００に送信する。これらの構成によりサーバ４００は、圧縮符号化、パケット化、送信を、１フレームより小さい部分画像単位でパイプライン処理することにより並列に行う。画像処理装置２００は、画像データ取得部２４０、復号伸張部２４２、画像処理部２４４、および表示制御部２４６を備える。

なお復号伸張部２４２と画像処理部２４４は、部分画像のデータに所定の処理を施し表示用の部分画像のデータを生成するという意味で共通の機能を有し、それらの少なくともいずれかを「画像処理部」と総称することもできる。画像データ取得部２４０は、図３の入出力インターフェース２０２、部分画像記憶部２０４、および制御部２０６で構成され、圧縮符号化された部分画像のデータを、その生成時刻とともにサーバ４００から取得する。

復号伸張部２４２は、図３のビデオデコーダ２０８、部分画像記憶部２１０、制御部２０６、制御部２１２で構成され、圧縮符号化された部分画像のデータを復号伸張する。ここで復号伸張部２４２は、動き補償や符号化など圧縮符号化に必要な最小単位の領域のデータが画像データ取得部２４０により取得されたら、復号伸張処理を開始してよい。画像処理部２４４は図３の画像処理部２１４、部分画像記憶部２１６、制御部２１２、制御部２１８で構成され、部分画像のデータに所定の処理を施し、表示用の部分画像のデータを生成する。例えば上述のとおり画像処理部２４４は、ヘッドマウントディスプレイ１００が備える接眼レンズの歪みを考慮して逆の歪みを与える補正を施す。

あるいは画像処理部２４４は、ＵＩプレーン画像など、動画像とともに表示させるべき画像を、部分画像単位で合成する。または画像処理部２４４は、その時点でのユーザ頭部の位置や姿勢を取得し、サーバ４００が生成した画像を、正しく表示時の視野になるように補正する。これにより、サーバ４００からの転送時間によって、ユーザの頭部の動きと表示画像の間に生じる時間的なずれを最小限にすることができる。

画像処理部２４４はそのほか、一般的になされる画像処理のいずれかまたは組み合わせを実施してもよい。例えば画像処理部２４４は、ガンマーカーブ補正、トーンカーブ補正、コントラスト強調などを行ってもよい。すなわち表示装置の特性やユーザ指定に基づき、復号伸張した画像データの画素値・輝度値について必要なオフセット補正をしてもよい。また画像処理部２４４は、近傍画素を参照し、重畳・加重平均・平滑化などの処理を行うノイズ除去処理を行ってもよい。

また画像処理部２４４は、画像データの解像度と、表示パネルの解像度を合わせたり、近傍画素を参照し、バイリニア・トライリニアなど、加重平均・オーバーサンプリングなどを行ったりしてもよい。また画像処理部２４４は、近傍画素を参照し、画像テクスチャの種類を判定し、それに応じた、デノイズ・エッジ強調・平滑化・トーン／ガンマ／コントラスト補正を選択的に処理してもよい。このとき画像処理部２４４は、画像サイズのアップスケーラ・ダウンスケーラと合わせて処理してもよい。

また画像処理部２４４は、画像データの画素フォーマットと、表示パネルの画素フォーマットが異なる場合にフォーマット変換を行ってもよい。例えばＹＵＶからＲＧＢ、ＲＧＢからＹＵＶ、ＹＵＶにおける４４４、４２２、４２０間の変換、ＲＧＢにおける８、１０、１２ビットカラー間の変換などを行ってもよい。また画像処理部２４４は、デコードした画像データがＨＤＲ(High Dynamic Range)の輝度レンジ対応フォーマットである一方、表示ディスプレイのＨＤＲの輝度レンジ対応範囲が狭い場合（表示可能な輝度ダイナミックレンジがＨＤＲフォーマット規定より狭いなど）、できるだけＨＤＲ画像の特徴を残しながら、表示パネル対応可能な範囲のＨＤＲの輝度レンジフォーマットへ変換する疑似ＨＤＲ処理（色空間変更）を行ってもよい。

また画像処理部２４４は、デコードした画像データがＨＤＲ対応フォーマットだったが、表示ディスプレイがＳＤＲ(Standard Dynamic Range)のみに対応している場合、できるだけＨＤＲ画像の特徴を残しながら、ＳＤＲフォーマットへ色空間変換してもよい。デコードした画像データがＳＤＲ対応フォーマットだったが、表示ディスプレイがＨＤＲに対応している場合、画像処理部２４４はできるだけＨＤＲパネルの特性にあわせて、ＨＤＲフォーマットへエンハンス変換してもよい。

また画像処理部２４４は、表示ディスプレイの階調表現能力が低い場合、誤差拡散付加をしてもよいし、画素フォーマット変換とあわせて処理するディザリング処理を実施してもよい。また画像処理部２４４は、ネットワーク転送データの欠落やビット化けにより、デコードした画像データに部分的な欠損や異常がある場合に、その領域を補正処理してもよい。また画像処理部２４４は、単色塗りつぶし、近傍画素複製による補正、前フレーム近傍画素による補正、適応型欠損補正により過去フレームや現フレームの周辺から推測した画素による補正をしてもよい。

また画像処理部２４４は、画像処理装置２００から表示装置へ出力するインターフェースの必要帯域を削減するために、画像処理部２４４は画像圧縮を行ってもよい。この際、画像処理部２４４は、近傍画素参照によるライトウェイトなエントロピー符号化、インデックス値参照符号化、ハフマン符号化などを行ってもよい。また表示装置が液晶パネルを採用した場合、高解像度化が可能な反面、反応速度が遅い。表示装置が有機ＥＬパネルを採用した場合は反応速度が速い反面、高解像度化が難しく、また黒色領域とその周辺で色にじみが発生するBlack Smearingと呼ばれる現象が生じ得る。

そこで画像処理部２４４は、このような表示パネルによる様々な悪影響を解消するように補正を行ってもよい。例えば液晶パネルの場合、画像処理部２４４はフレーム間に黒い画像を挿入することにより液晶をリセットし、反応速度を向上させる。また有機ＥＬパネルの場合、画像処理部２４４は輝度値や、ガンマ補正におけるガンマ値にオフセットをかけBlack Smearingによる色にじみを目立ちにくくする。

表示制御部２４６は、図３のディスプレイコントローラ２２０と制御部２１８で構成され、表示用の部分画像のデータを順次、ヘッドマウントディスプレイ１００や平板型ディスプレイ３０２の表示パネルに表示させる。ただし本実施の形態では、部分画像の圧縮符号化データをサーバ４００から個別に取得するため、通信状況によっては取得順が入れ替わったり、パケットロスにより部分画像のデータ自体が取得できなかったりすることが考えられる。

そこで表示制御部２４６は、部分画像が描画されてからの経過時間を、各部分画像の生成時刻から導出したうえ、サーバ４００での描画タイミングを再現するように、表示パネルへの部分画像の出力タイミングを調整する。具体的には表示制御部２４６は、データ取得状況特定部２４８、出力対象決定部２５０、および出力部２５２を備える。データ取得状況特定部２４８は、部分画像のデータの生成時刻、および／または生成時刻からの経過時間に基づき、部分画像のデータの本来の表示順や表示タイミング、部分画像のデータの欠落量などのデータ取得状況を特定する。

出力対象決定部２５０はデータ取得状況に応じて、表示パネルへの出力対象を変化させたり、出力順や出力タイミングを適切に調整したりする。例えば出力対象決定部２５０はデータ取得状況に応じて、次のフレームに含まれる本来の部分画像のデータを出力するか、それより前のフレームに含まれる部分画像のデータを再度出力するかを決定する。出力対象決定部２５０は、次のフレームの表示開始時刻である垂直同期信号のタイミングまでにそのような出力対象を決定する。

例えば出力対象決定部２５０は、フレーム中、所定値以上の割合で部分画像が欠落している場合に、出力対象を前のフレームのデータに置き換えるなど、取得された部分画像の量（割合）に応じて出力対象を変化させてもよい。また出力対象決定部２５０は、過去のフレームの出力実績や、生成時刻からの経過時間に応じて、次のフレーム表示期間の出力対象を変化させてもよい。出力部２５２は、出力対象決定部２５０が決定した順序およびタイミングで、出力対象として決定された部分画像のデータを表示パネルに出力する。

図６は、本実施の形態においてサーバ４００と画像処理装置２００が、部分画像単位でパイプライン処理を行う効果を説明するための図である。図の横方向は時間経過を表し、各処理時間を、処理名とともに矢印で示している。そのうちサーバ４００側の処理を細線、画像処理装置２００側の処理を太線で示している。処理名に併記する括弧内の記載は、フレーム番号ｍの１フレーム分の処理を（ｍ）、フレーム番号ｍのうちｎ番目の部分画像の処理を（ｍ／ｎ）としている。

またサーバ４００側の垂直同期信号をｖｓｙｎｃ（サーバ）、画像処理装置２００および表示装置側の垂直同期信号をｖｓｙｎｃ（クライアント）と表記している。まず（ａ）は、１フレーム単位で処理を進捗させる従来の態様を比較として示している。この例でサーバ４００は、垂直同期信号により各フレームに対する処理を制御している。このためサーバ４００は、フレームバッファに格納された１フレーム目のデータの圧縮符号化を、垂直同期信号に合わせて開始する。

そしてサーバ４００は、２フレーム目のデータの圧縮符号化を、次の垂直同期信号に合わせて開始するとともに、圧縮符号化済みの１フレーム目のデータを所定単位でパケット化して送出する。画像処理装置２００は、到達したフレーム順に復号伸張処理を施す。ただし復号伸張が完了し表示が可能な状態になっても、次に到来する垂直同期信号のタイミングまでその表示は待機される。結果として図示する例では、サーバ４００で１フレームの描画が完了し圧縮符号化処理が開始されてから表示開始までに、２フレーム分の表示周期以上の遅延が発生する。

サーバ４００と画像処理装置２００間の通信時間や、両者の垂直同期信号のタイミングの差などによっては、それ以上の遅延が生じる可能性もある。（ｂ）に示す本実施の形態によれば、サーバ４００は、１フレーム目の１番目の部分画像の圧縮符号化が完了した時点で、当該部分画像のデータの送出を開始する。そのデータがネットワーク３０６を伝送している間に、２番目の部分画像の圧縮符号化および伝送、３番目の部分画像の圧縮符号化および伝送、・・・というように部分画像単位で伝送処理を進捗させる。

画像処理装置２００側では、取得した部分画像のデータを順番に復号伸張していく。その結果、１番目の部分画像のデータは（ａ）の場合と比較し格段に早く、表示が可能な状態に到達する。なお１番目の部分画像のデータは、次に到来する垂直同期信号のタイミングまで表示を待機する。後続の部分画像については、１番目の部分画像の出力に続けて順次出力していく。１フレームの表示時間自体は（ａ）と同様のため、次の垂直同期信号までに、ｎ番目の部分画像の表示が完了することになる。

このように、画像データの圧縮符号化から表示までを、１フレームより細かい単位で並列に進捗させることにより、図示する例では、（ａ）の場合より１フレーム分早いタイミングでの表示を実現できる。なお図示する例では（ｂ）の場合も、サーバ４００による圧縮符号化を、垂直同期信号を契機に開始しているが、上述のとおり垂直同期信号を待たずに圧縮符号化を行えば、遅延時間をさらに短縮できる。

また画像処理装置２００の表示制御部２４６は、部分画像のデータが表示可能な状態になったタイミングに応じて、表示装置が許容する範囲内で垂直同期信号および水平同期信号の少なくともいずれかのタイミングをずらしてもよい。例えば表示制御部２４６は、全ての表示タイミングのベースとなるピクセルクロックの動作周波数を所定の微小時間変更したり、水平帰線期間や垂直帰線期間を所定の微小時間変更したりすることにより、表示パネルへの出力の準備ができてから実際に出力するまでの待機時間を短縮してもよい。表示制御部２４６はこの変更を毎フレームで繰り返すことにより、一度の大きな変更で表示が破綻しないようにしてもよい。

図６で示した例は、サーバ４００から独立に送出された部分画像のデータが滞りなく、およそ同じ伝送時間で画像処理装置２００に到達する理想的なケースを示している。一方、処理単位の粒度を細かくすることにより、画像処理装置２００におけるデータの取得状況に変化が生じやすくなる。図７は、サーバ４００と画像処理装置２００間での部分画像のデータの伝送状況を例示している。

図の縦方向は時間経過を表し、サーバ４００の軸に示した１番目から７番目の部分画像のデータが、画像処理装置２００へ到達するまでの時間を矢印で示している。サーバ４００と画像処理装置２００の間の通信状況は常に変化し得、圧縮符号化された後の部分画像のデータサイズも毎回変化し得るため、個々の部分画像のデータの伝送時間も様々となる。そのため、サーバ４００から同程度の周期で、順番に部分画像のデータを送出しても、画像処理装置２００での取得時に、その状態が維持されているとは限らない。

図示する例では、１番目と２番目の部分画像のデータの取得間隔ｔ１と、２番目と３番目の部分画像のデータの取得間隔ｔ２は大きく異なっている。また４番目と５番目の部分画像のデータは取得順が逆転している。さらに、６番目の部分画像のデータのように、パケットロスにより画像処理装置２００に到達しないデータも発生し得る。このような状況において画像処理装置２００が、取得した部分画像のデータをそのままの順序で表示パネルに出力すれば、当然、本来の画像が表示されなかったり、表示のサイクルが破綻したりすることが起こり得る。

そこでデータ取得状況特定部２４８が、サーバ４００側での各部分画像の生成時刻を参照し、図７に示した各種状況を把握する。これにより出力対象決定部２５０が、各フレームの表示期間における出力対象や、部分画像の出力タイミングを最適化する。このためサーバ４００の通信部４２６は、部分画像のデータおよびその生成時刻とともに、送信済みの所定数の部分画像の生成時刻の履歴を、画像処理装置２００に送信するようにしてもよい。

例えば通信部４２６は、直近に送信した６４個の部分画像の生成時刻を、次の部分画像のデータとともに送信する。画像処理装置２００のデータ取得状況特定部２４８は、当該生成時刻の履歴と、実際に取得した部分画像の生成時刻とを照合することにより、データの欠落や取得順の逆転を把握できる。すなわちデータの欠落が生じた際、データ取得状況特定部２４８は、その部分画像の生成時刻を、後続の部分画像とともに送信された生成時刻の履歴から取得できるようにする。

図８は、本実施の形態において表示制御部２４６が、出力対象や出力タイミングを調整しつつ、表示パネルへ部分画像のデータを出力する処理手順の例を示すフローチャートである。このフローチャートは、表示パネルの垂直同期信号のタイミングより前の所定のタイミングで、当該垂直同期信号に合わせて表示を開始すべきフレームに対し実施する処理の手順を示している。すなわちフレームごとに、図示した処理を繰り返す。

まず表示制御部２４６のデータ取得状況特定部２４８は、対象フレームに含まれる部分画像の取得状況を特定する（Ｓ１０）。データ取得状況特定部２４８はさらに、それまでのフレームにおける部分画像の出力実績を記録しておき、それを参照してもよい。ここで出力実績とは例えば、次のようなデータの少なくともいずれかである。
１．後述する３つの分類のうち過去の所定期間に選択された分類の履歴
２．過去の所定期間に後述する第１分類において欠落した部分画像の履歴、発生率、部分画像の欠落の面積割合
３．最後に表示画像が更新されてからの経過時間

すると出力対象決定部２５０は、特定されたそれらの状況が、あらかじめ準備しておいた分類のいずれに当てはまるかを判定する（Ｓ１２）。出力対象決定部２５０は基本的に、様々な観点から総合的な判定を行い、ユーザ体験が最良となるように出力対象を決定する。そのためデータ取得状況特定部２４８はＳ１０において、次のようなパラメータの少なくともいずれかを取得する。

１．対象フレームを構成する部分画像のうち取得済みの部分画像の量
２．対象フレームにおける部分画像の欠落範囲
３．同じ画像フレームの表示継続時間
４．後述するブラックアウトの継続時間
５．部分画像の生成時刻からの経過時間
上記パラメータのそれぞれには、１つまたは複数のしきい値を設定しておく。

そして出力対象決定部２５０は、対象フレームについて取得したパラメータがどの範囲に該当するかに応じてスコアを与えるなどして状況を分類する。例えばＳ１０で取得したパラメータのそれぞれに、あらかじめ定めたテーブルに基づきスコアを与え、全パラメータのスコアの分布に基づき状況を分類する。図示する例では３つの分類を準備している。第１分類に当てはまる場合、出力対象決定部２５０は、それまでに得られた最新の部分画像のデータを出力対象と決定し、出力部２５２にそれを出力させる（Ｓ１４）。

例えば構成する部分画像が所定値（所定割合）以上、取得済みで、なおかつ部分画像の生成時刻からの経過時間が許容範囲の場合、出力対象決定部２５０はスコア判定に基づき対象フレームを第１分類とする。このとき出力対象決定部２５０は、各生成時刻に対応する順序で部分画像が出力されるようにタイミングを調整する。理想的には図６で示したように、フレームの上段の部分画像から順次出力していく。

ただし途中に欠落している部分画像がある場合、各欠落箇所について下記パラメータのスコア化をさらに行い、前のフレームの同じ位置の部分画像を再利用するか、その部分についてはブラックアウトさせるか、判定してもよい。
１．同じ画像フレームの表示継続時間
２．後述するブラックアウトの継続時間
３．部分画像の生成時刻からの経過時間

なお、それまでに本来の画像を表示できない状況が所定時間以上、続いている場合、出力対象決定部２５０は、対象フレームの部分画像が所定値（所定割合）以上、取得済みでなくても第１分類としてもよい。前述のスコアを決めるテーブルをそのように設定しておいてもよい。これにより、一部であっても可能な範囲で画像の動きを表現できる。なお欠落した画像を、画像処理部２４４が推測のうえ修復してもよい。

第２分類に当てはまる場合、出力対象決定部２５０は、対象フレームより前のフレームの画像のデータを出力対象と決定し、出力部２５２にそれを出力させる（Ｓ１６）。この場合、表示パネルには同じフレームが表示され続けることになる。例えば、対象フレームの部分画像が所定値（所定割合）以上、取得できず、前の所定時間内のフレームにおいては部分画像が所定値（所定割合）以上、取得されている場合、出力対象決定部２５０は対象フレームを第２分類とする。前述のスコアを決めるテーブルをそのように設定しておいてもよい。

第３分類に当てはまる場合、出力対象決定部２５０は、対象フレームのデータを出力すべき期間、何も出力しないことを決定する（Ｓ１８）。この場合、表示パネルには１フレーム分のブラックアウト期間が発生する。例えば、対象フレームの部分画像が所定値（所定割合）以上、取得できず、表示済み画像を引き続き表示するには生成時刻からの経過が長すぎる場合、出力対象決定部２５０は対象フレームを第３分類とする。前述のスコアを決めるテーブルをそのように設定しておいてもよい。なおブラックアウトは、黒の塗りつぶし画像を表示することを基本とするが、あらかじめ設定した別の色を用いてもよい。

第２分類や第３分類での表示が所定時間継続したら、上述のとおり部分画像の取得状況にかかわらず第１分類に分岐させることにより、一部であっても何らかの画像の更新を行ってもよい。なお第１分類から第３分類に進むにつれて、ユーザ体験は損なわれやすくなる。そのためＳ１０で取得した各パラメータに対して、ユーザ体験を良好にすべきときに高いスコアを与えるようにテーブルを決めておく。

そのうえで、Ｓ１２では、Ｓ１０で得たパラメータについて、テーブルに基づきスコアを与え、得られた複数のスコアを合算する。その合計値がどの程度大きいかで、第１から第３の分類の表示方法分類を選択する。ここで、合計値が大きい側が、第１分類、小さい側が第３分類とするしきい値をあらかじめ決めておく。

なお図示した例は一態様に過ぎず、データ取得状況特定部２４８が取得する情報の種類、出力対象決定部２５０による分類の判定基準、および各分類における出力対象は、表示対象の動画像の内容、許容できる欠落の度合いや欠落の継続時間、許容できる表示遅延や表示停止時間などに基づき適宜決定しておく。また表示制御部２４６は、次の垂直同期信号まで待機している間に蓄積される画像、一定範囲の表示済み画像、生成時刻、Ｓ１０やＳ１２での判定結果やスコアを図示しないメモリなどに保持してもよい。

さらに出力対象決定部２５０は、Ｓ１２における判定とは別に、対象フレームに係る状況が、ユーザへ警告すべき条件に該当するか否かを判定する（Ｓ２０）。例えば出力対象決定部２５０は、単位時間あたりにブラックアウトさせた時間や、部分画像の欠落の発生量がしきい値を超えたことを条件に、ユーザへの警告が必要と判定する（Ｓ２０のＹ）。このとき出力対象決定部２５０は、通信状況が画像表示に影響を与えている旨のメッセージを表示させる（Ｓ２２）。

当該メッセージは、画像処理部２４４が部分画像に重畳させることにより表示されるようにしてもよい。これによりユーザは、表示される画像の不具合の原因を知ることができる。警告条件に該当しない場合はメッセージを表示しない（Ｓ２０のＮ）。以上の手順により対象フレームに関する処理を終了するとともに、次のフレームについて処理を開始する。

なおデータ取得状況特定部２４８は、Ｓ１０で取得した部分画像の生成時刻からの処理時までの経過時間に基づき、データの送信遅延時間の傾向を導出してもよい。例えばデータ取得状況特定部２４８は、過去に取得済みの所定数の部分画像の、生成時刻からの経過時間のヒストグラムを生成する。そしてデータ取得状況特定部２４８は、基準値以上、経過時間が長くなる方向にヒストグラムが偏るなどしたときに、経過時間の増加の傾向を検知する。

このときデータ取得状況特定部２４８は、画像データ取得部２４０などを介してサーバ４００に、送信する画像データのサイズの抑制を要求してもよい。例えばデータ取得状況特定部２４８は、１フレーム分の画像のデータ送信をスキップするように要求したり、圧縮率を所定量上げるように要求したりする。画面解像度を所定量下げるように要求してもよい。あるいはデータ取得状況特定部２４８は、出力対象決定部２５０に、１フレーム分の画像のデータ出力をスキップするように要求してもよい。

あるいはデータ取得状況特定部２４８はサーバ４００に、部分画像の生成時刻から取得までの経過時間を送信してもよい。サーバ４００の通信部４２６はこれを取得し、圧縮符号化部４２２が、ヒストグラムを生成して経過時間が長くなる方向にヒストグラムが偏るなどしたときに、経過時間の増加の傾向を検知し、送信する画像データのサイズを抑制してもよい。またはデータ取得状況特定部２４８はサーバ４００に、上記の第１〜第３の分類の発生量を通知してもよい。これらの対策により、遅延時間の増加が進み、後続のフレームの表示が著しく滞ったりデータが欠落したりするのを防止できる。

以上述べた部分画像ごとのパイプライン処理によれば、サーバ４００が生成した画像のデータを、クライアントである画像処理装置２００が受信し表示させる形態のシステムにおいて、サーバ４００は、１フレームより小さい部分画像の単位で画像のデータを圧縮符号化し送信する。画像処理装置２００においても部分画像の単位で復号伸張するとともに、必要な処理を施して表示パネルに順次出力する。これにより、サーバ４００と画像処理装置２００の双方で、１フレームより細かい粒度でのパイプライン処理が可能となる。

結果として、１フレームごとの処理より待機時間を減らすことができ、描画から表示までの遅延時間を軽減させることができる。またサーバ４００が、部分画像のデータとともにその生成時刻を伝送することにより、独立したデータが短い周期で次々に送信されても、画像処理装置２００は、サーバ４００が画像を生成した順序を再現するようにして表示を進捗させることができる。

また生成時刻に基づき、欠落している部分画像を把握できるため、表示内容や表示ポリシーなどに応じて、最新のデータを表示させるか前のフレームのデータを再利用するか、何も出力しないかといった態様を適切に選択することができる。データ伝送に係る様々な状況に対しとり得る対策が増えるため、ユーザ体験を悪化させないように対策することで、支障を抑えつつ低遅延での表示が可能となる。

３．画像処理部におけるリプロジェクション処理
次に、リプロジェクションの機能を有する画像処理装置２００について説明する。図９は、リプロジェクション機能を有する画像処理装置２００と、対応する機能を有するサーバ４００の機能ブロックの構成を示している。リプロジェクションとは、ヘッドマウントディスプレイ１００を利用し、ユーザの頭部の動きに応じた視野で画像を表示させる態様において、一旦描画された画像を、表示直前の頭部の位置や姿勢に対応するように補正する処理を指す。

例えば本実施の形態のように、サーバ４００から画像データを送信する場合、サーバ側でヘッドマウントディスプレイ１００の位置や姿勢を取得し、それに対応する画像を生成しても、当該データの伝送期間に変化した位置や姿勢は画像に反映されない。画像処理装置２００側で、頭部の位置や姿勢に応じた補正をするにしても、フレーム単位で補正をする場合、当該補正処理の間に生じた位置や姿勢の変化はやはり画像に反映されない。

その結果、頭部の動きに対し表示画像に看過できない遅延が生じ、仮想現実における没入感が損なわれたり、映像酔いを引き起こしたりしてユーザ体験の質が低下する。上述のように、部分画像単位でのパイプライン処理を実施したうえ、表示の直前に、部分画像ごとに頭部の位置や姿勢を反映させる補正を行うことにより、より応答性の高い表示を実現できる。

なおフレーム単位でリプロジェクションを実施するためのレンダリング装置とヘッドマウントディスプレイについては、例えば国際公開第２０１９／０２６７６５号に開示されている。この技術ではレンダリング装置が、フレーム表示時のヘッドマウントディスプレイの位置や姿勢を予測して画像を描画し、ヘッドマウントディスプレイは当該予測値と、最新の位置や姿勢との差に基づきさらに画像を補正したうえで表示を行う。ここでレンダリング装置をサーバとした場合、ヘッドマウントディスプレイまでの伝送経路、ひいては伝送時間が様々となり、位置や姿勢の予測値と表示時の実際の位置や姿勢との間に補正困難な乖離が生じることも考えられる。

そこで本実施の形態では、部分画像単位でのパイプライン処理により画像生成から表示までの時間を短縮するとともに、乖離の程度などに応じて表示対象を変化させる。図９においてサーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を含む。画像処理装置２００は、画像データ取得部２４０、復号伸張部２４２、画像処理部２４４、および表示制御部２４６を含む。

サーバ４００の圧縮符号化部４２２、パケット化部４２４、通信部４２６、および画像データ取得部２４０、復号伸張部２４２は、図５で説明したのと同様の機能を有する。ただしそれらの機能を限定する趣旨ではなく、例えば画像データ取得部２４０は、圧縮符号化されていない部分画像のデータをサーバ４００から取得してもよい。この場合、サーバ４００における圧縮符号化部４２２と、画像処理装置２００における復号伸張部２４２の機能を省略できる。一方で、サーバ４００での圧縮符号化処理や、画像処理装置２００での復号伸張処理などを実施する場合、描画から表示までにその分の時間が必要になるため遅延が顕在化しやすく、リプロジェクションの効果をより発揮しやすい。

またサーバ４００は、複数のプレイヤが参加するマルチプレイヤゲームやスポーツ競技のライブ配信などを実現してもよい。この場合、サーバ４００は、複数のユーザそれぞれの頭部の動きを継続して取得し、それに対応する視野で画像を生成したうえ、ユーザ個々の画像処理装置２００へストリーミング配信する。マルチプレイヤゲームであれば、サーバ４００は３次元空間での各プレイヤのフットプリントに基づき、それぞれの視点から見た仮想世界を描画する。またスポーツ中継の場合、サーバ４００は、分散配置された複数のカメラで競技の様子を撮影した画像に基づき、各ユーザの視点に対応する画像を生成する。

サーバ４００の画像生成部４２０は、位置姿勢取得部２８４、位置姿勢予測部２８６、描画部２８８を備える。位置姿勢取得部２８４は画像処理装置２００から、ヘッドマウントディスプレイ１００を装着するユーザ頭部の位置や姿勢の情報を所定のレートで取得する。位置姿勢予測部２８６は、生成した画像フレームが表示される時点におけるユーザの位置や姿勢を予測する。すなわち位置姿勢予測部２８６は、画像フレームを生成してからヘッドマウントディスプレイ１００に表示されるまでの遅延時間を求め、位置姿勢取得部２８４が取得した位置や姿勢が当該遅延時間の経過後にどう変化するかを予測する。

遅延時間は、サーバ４００や画像処理装置２００の処理性能や、伝送路における遅延時間などに基づいて導出する。そしてヘッドマウントディスプレイ１００の並進速度や角速度に遅延時間を乗じることで位置や姿勢の変化量を求め、位置姿勢取得部２８４が取得した位置や姿勢に加算する。描画部２８８は、予測された位置や姿勢の情報に基づきビュースクリーンを設定し、画像フレームを描画する。この場合、パケット化部４２４は、画像フレームの生成時刻とともに、当該画像フレームを描画した際に前提として用いられた、ユーザ頭部の位置や姿勢の予測値も画像生成部４２０から取得し、部分画像のデータと対応づける。

結果として画像処理装置２００の画像データ取得部２４０は、部分画像のデータとともに、その生成時刻および、ユーザ頭部の位置や姿勢の予測値を取得する。なお部分画像のデータが伝送途中で欠落したり画像処理装置２００への到達順が逆転したりする場合に備え、サーバ４００の通信部４２６は、直近に送信した所定数の位置姿勢の予測値を、次の部分画像のデータとともに送信してもよい。なおリプロジェクション処理に着目した場合、画像処理装置２００は、部分画像ごとの生成時刻の代わりに、１フレームごとの生成時刻をサーバ４００から取得してもよい。後者の場合、以下に述べる遅延時間はフレーム単位となる。

画像処理装置２００の画像処理部２４４は、位置姿勢追跡部２６０、第１補正部２６２、合成部２６４、および第２補正部２６６を備える。位置姿勢追跡部２６０は、ヘッドマウントディスプレイが備える各カメラの少なくともいずれかによる撮影画像、あるいはヘッドマウントディスプレイ１００が内蔵するモーションセンサの計測値を取得し、ユーザの頭部の位置や姿勢を所定のレートで導出する。

頭部の位置や姿勢の導出には、上述のとおり従来実用化されている各種手法のいずれを用いてもよい。あるいはヘッドマウントディスプレイ１００の内部でそれらの情報を導出し、位置姿勢追跡部２６０は当該情報を所定のレートでヘッドマウントディスプレイ１００から取得するのみでもよい。この情報は、画像データ取得部２４０を介してサーバ４００に送信する。この際、送信対象の、頭部の位置や姿勢の情報の元となった撮影画像やモーションセンサの計測値が得られた時刻を対応づけて送信する。

第１補正部２６２は、位置姿勢追跡部２６０が直近に取得した、頭部の位置や姿勢と、サーバ４００において部分画像が生成された時点でのそれらの予測値との差分に基づき、サーバ４００から送信された部分画像にリプロジェクションの処理を施す。なおリプロジェクションの根拠とする差分は、ユーザ頭部の位置およびユーザ頭部の姿勢、の少なくともいずれかでよいが、それらを「位置姿勢」と総称している。

第１補正部２６２は、所定の時間間隔で取得される位置姿勢情報を補間することにより、補正時点での最新の位置姿勢情報を厳密に求めてもよい。そして第１補正部２６２は、補正時点での位置姿勢と、その予測値との差分を導出することにより補正を行う。より具体的には第１補正部２６２は、補正前の画像における画素が、補正によってどの位置に変位するかを示す変位ベクトルを画像平面に表した変位ベクトルマップを作成する。

そして部分画像を構成する画素ごとに、変位ベクトルマップを参照して変位先の画素位置を取得することにより、補正後の部分画像を生成する。このとき、補正前の部分画像から生成できる補正後の画像は、その面積が変化することがあり得る。第１補正部２６２は、補正後の部分画像のデータを生成するのに必要な、補正前の部分画像のデータが、前段のローカルメモリに格納された時点で、変位ベクトルマップを参照した補正処理を開始する。これにより、補正後の画像についても部分画像単位での処理が可能になる。

サーバ４００から送信された画像が、接眼レンズのための歪みを有しない場合、第１補正部２６２はさらに、当該歪みを与える補正を同時に実施してもよい。この場合、変位ベクトルマップが画素ごとに表す変位ベクトルは、リプロジェクションのための変位ベクトルと、歪み補正のための変位ベクトルを合成したベクトルとなる。このうち歪み補正のための変位ベクトルは、接眼レンズ固有のデータとなりユーザの動き等によらないため、事前に作成しておくことができる。

第１補正部２６２は、そのようにして準備しておいた、歪み補正のための変位ベクトルに、リプロジェクションに必要な変位ベクトルを合成することにより、変位ベクトルマップを更新したうえで補正を行う。これにより、部分画像の各画素について一度の変位で、リプロジェクションと接眼レンズのための歪み補正を同時に行うことができる。なお変位ベクトルマップについても、部分画像に対応する領域ごとに更新し、直前の頭部の位置や姿勢を反映させることにより、フレーム全体において、頭部の動きからの遅延の少ない画像を表示できる。

合成部２６４はリプロジェクションなどの補正が施された部分画像に、ＵＩプレーン画像を部分画像単位で合成する。ただし合成部２６４が部分画像に合成する対象はＵＩプレーン画像に限らず、ヘッドマウントディスプレイ１００のカメラが撮影した画像など任意の画像でよい。いずれにしろヘッドマウントディスプレイ１００に表示させる場合、合成する画像についてもあらかじめ、接眼レンズのための歪みを与えておく。

なお合成部２６４による合成処理は、第１補正部２６２によるリプロジェクションや歪み補正の前に行ってもよい。この場合、合成する画像には歪みを与えておかず、合成後の画像に対し一括して歪みなどの補正を施せばよい。また合成すべき画像がなければ合成部２６４の処理は省略できる。第２補正部２６６は、表示画像になすべき補正のうち、残りの補正処理を実施する。例えば色収差を補正する場合、第１補正部２６２において、表示パネルの原色によらず接眼レンズに対応する共通の歪みを与えておく。

例えば表示パネルを見る人間の目の特性を考慮し、まず緑色に対する補正を行う。そして第２補正部２６６では、赤の変位ベクトルと緑の変位ベクトルの差分だけ補正することにより、赤成分の部分画像を生成する。また青の変位ベクトルと緑の変位ベクトルの差分だけ補正することにより、青成分の部分画像を生成する。そのため第２補正部２６６には、赤および青の画像を生成するための差分を表す変位ベクトルを画像平面に表した変位ベクトルマップを準備しておく。

これにより赤、緑、青の原色ごとに異なる補正がなされた表示用の部分画像を生成できる。なお第１補正部２６２、合成部２６４、第２補正部２６６は、それぞれの処理を部分画像単位で行うことでパイプライン処理を実施してよい。この場合、図３で示した部分画像記憶部と制御部を、各機能ブロックに設けてよい。また第１補正部２６２、合成部２６４、第２補正部２６６で行われる処理の内容や順序は限定されない。例えば第１補正部２６２が原色ごとの変位ベクトルマップを参照し、他の補正と同時に色収差を補正してもよい。

表示制御部２４６は、基本的には図５で示したのと同様の機能を有するが、部分画像が描画されてからの経過時間に加え、位置姿勢の予測値と実際の位置姿勢との差分によっても、表示パネルへの出力対象を変化させる。すなわちデータ取得状況特定部２４８ａは、上記生成時刻からの経過時間に加え、位置姿勢の予測値と実際の位置姿勢との差分に基づき、部分画像のデータの本来の表示順や表示タイミング、部分画像のデータの欠落量などのデータ取得状況を特定する。

出力対象決定部２５０ｂは、それらの結果に応じて、表示パネルへの出力対象を変化させたり、出力順や出力タイミングを適切に調整したりする。この際、出力対象決定部２５０ｂは、図８で示した各種分類に、リプロジェクションを行って表示が破綻しないか、といったユーザ頭部の位置姿勢に起因する基準を加える。そして破綻しないと判定された場合に、画像処理部２４４がリプロジェクションを実施し、それを出力部２５２が表示パネルに出力する。すなわちこのケースでは、表示制御部２４６によって出力対象が決定したあと、画像処理部２４４におけるリプロジェクションを含む各種処理を実施する。あるいは両者を並列に実行する。

図１０は、第１補正部２６２が実施するリプロジェクションと接眼レンズのための歪み補正を説明するための図である。（ａ）に模式的に示すように、サーバ４００は、ユーザ１２０の頭部の位置姿勢を予測し、それに対応する位置および向きでビュースクリーン１２２を設定する。そしてサーバ４００は、表示対象の空間のうち視錐台１２４の内部に存在する物をビュースクリーン１２２に射影する。

そしてサーバ４００は、部分画像ごとに適宜圧縮符号化するなどして画像処理装置２００に送信する。画像処理装置２００ではその画像を適宜復号伸張するなどして表示パネルに順次出力するが、このときサーバ４００での位置姿勢の予測値と実際の位置姿勢の差が大きいと、頭部の動きと表示が連動せずユーザに違和感を与えたり映像酔いを生じさせたりし得る。そこで第１補正部２６２は、当該差分だけ画像上の像をずらすことにより、直近の頭部の位置姿勢が表示に反映されるようにする。

図示する例では、ユーザ１２０の頭部（顔面）が、画像描画時よりわずかに右下を向くように動いたことを想定している。このとき第１補正部２６２は、最新の位置姿勢に対応するように新たなビュースクリーン１２６を設定する。ビュースクリーン１２６は、元のビュースクリーン１２２を右下にずらしたものである。（ｂ）に示すように、ビュースクリーン１２２を右下にずらしビュースクリーン１２６とする場合、像としては逆方向、すなわち左上に移動する。

したがって第１補正部２６２は、ビュースクリーンの変位方向と逆方向に、ビュースクリーンの変位量だけ像を変位させる補正を行う。なおビュースクリーンは２次元での平行移動に限らず、頭部の動きによっては３次元空間での姿勢を変化させてよい。この場合、像の変位量は画像平面での位置によって変化し得るが、コンピュータグラフィクスで用いられる一般的な変換式により、その変位ベクトルを計算できる。

上述のとおり第１補正部２６２はさらに、接眼レンズのための歪み補正を同時に行ってもよい。すなわち（ｂ）の下段に示すように、接眼レンズを介して見たときに本来の像が歪みなく視認されるように、元の像に歪みを与えておく。この処理に用いる計算式には、レンズ歪みの補正に係る一般的なものを用いることができる。

ただし本実施の形態では上述のとおり、必要な補正量および補正方向を画素ごとに計算しておき、変位ベクトルマップとして準備しておく。第１補正部２６２は、この歪み補正のための変位ベクトルに、リアルタイムで得られるリプロジェクションのための変位ベクトルを合成することで変位ベクトルマップを生成し、それを参照することによって、２つの補正を一括して実現する。

図１１は、第１補正部２６２が行う補正処理の手順の例を説明するための図である。（ａ）は補正前の画像、（ｂ）は補正後の画像の平面を示している。補正前の画像平面におけるＳ００、Ｓ０１、Ｓ０２・・・は変位ベクトルマップにおいて変位ベクトルを設定する位置を表す。例えば画像平面の水平方向、垂直方向に離散的に（例えば、８画素あるいは１６画素ごとなど等間隔に）変位ベクトルを設定する。

補正後の画像平面におけるＤ００、Ｄ０１、Ｄ０２、・・・はそれぞれ、Ｓ００、Ｓ０１、Ｓ０２、・・・の変位先の位置を表す。図では一例として、Ｓ００からＤ００への変位ベクトル（Δｘ，Δｙ）を白抜き矢印で示している。第１補正部２６２は、変位ベクトルを設定する画素を頂点とする最小の三角形の単位で、補正前の画像を補正後の画像にマッピングする。例えば補正前の画像のＳ００、Ｓ０１、Ｓ１０を頂点とする三角形を、補正後の画像のＤ００、Ｄ０１、Ｄ１０を頂点とする三角形にマッピングする。

ここで三角形の内部の画素は、Ｄ００、Ｄ０１、Ｄ１０との距離に応じて線形に、あるいはバイリニア、トライリニアなどにより補間した位置に変位させる。そして第１補正部２６２は、接続されたローカルメモリに格納された、補正前の部分画像の対応する画素の値を読み出すことにより、補正後の画像の画素値を決定する。この際、補正前の画像における読み出し先の位置から所定範囲内にある複数の画素の値を、バイリニア、トライリニアなどにより補間することで、補正後の画像の画素値を導出する。

これにより第１補正部２６２は、補正前の画像の三角形の変位先である三角形の単位で、補正後の画像を画素列順に描画していくことができる。なお上述のとおり、第１補正部２６２はリアルタイムでの頭部の位置や姿勢を反映させた補正を実現するため、部分画像に対応する領域単位で変位ベクトルマップを更新してもよい。第２補正部２６６も同様に、第１補正部２６２と異なる変位ベクトルマップを参照し、最小の三角形ごとに画素をマッピングしていけばよい。例えば色収差を補正する場合は、原色ごとに異なる変位ベクトルマップを用いることにより、各原色成分の画像を生成できる。

図１２は、画像処理装置２００がリプロジェクションを行う際に、表示制御部２４６の出力対象決定部２５０ｂが出力対象を調整する処理手順を示すフローチャートである。このフローチャートは、図８で示したフローチャートにおいてＳ１２の判定処理の後に実施する。より具体的には出力対象決定部２５０ｂは、Ｓ１２の判定処理において第１分類または第２分類に当てはまるとしたフレームであっても、必要に応じて第３分類に変更するために追加で判定を行う。したがって図８のＳ１２において、部分画像の取得状況から、対象フレームが第３分類に当てはまると判定した場合は、出力対象決定部２５０ｂはそのまま処理を終了する（Ｓ９０のＮ）。

一方、第１分類または第２分類に当てはまると判定した場合（Ｓ９０のＹ）、出力対象決定部２５０ｂはまず、サーバ４００が画像フレームを生成する際に予測した、ユーザ頭部の位置姿勢と、最新の位置姿勢との差分が許容範囲にあるか否かを判定する（Ｓ９２）。上述のとおり、ヘッドマウントディスプレイ１００の近傍にあるレンダリング装置から画像データを送信する場合と比較し、クラウドサーバなどからデータを送信する場合は転送に時間を要することが多い。そのため位置姿勢の予測値と実際の値に生じるずれが広がる可能性が高くなる。

そこで位置姿勢の予測値と実際との差分が、リプロジェクションではカバーできないほど大きいときは、当該フレームのデータを表示パネルに出力しないようにする。すなわち差分が許容範囲を超えている場合、出力対象決定部２５０ｂは、第１分類または第２分類とされた対象フレームの分類を第３分類に変更する（Ｓ９２のＮ、Ｓ９８）。この場合、表示はブラックアウトとなる。あるいは元が第１分類の場合に第１分類のままとし、図８のＳ１４において、欠落部分の表示に過去のフレームを用いないようにしてもよい。

位置姿勢の差分が許容範囲か否かの判定基準は、フレームの全領域を最新の部分画像でまかなえるか（第１分類）、一部でも過去のフレームの部分画像を用いるか（第１分類または第２分類）、によって異ならせてよい。具体的には、位置姿勢の差分が小さいほど、過去のフレームの部分画像を用いることを許容してよい。許容範囲か否かは、位置姿勢の差分に設定したしきい値との大小関係により判定してもよいし、許容範囲とするスコア値として、位置姿勢の差分が大きいほど低くなるような関数を与え、図８の判定に用いたスコア値などと合算して総合的に判定してもよい。

位置姿勢の差分が許容範囲であると判定したら（Ｓ９２のＹ）、出力対象決定部２５０ｂは次に、対象フレームにおけるデータ欠落の度合いを、ユーザの視点の観点から評価した結果が許容範囲にあるか否かを判定する（Ｓ９４）。具体的には、ユーザの注視点に近いほど大きい重みづけでデータ欠落の度合いを数値化し、当該数値がしきい値を超えた場合に、データ欠落の度合いが許容範囲にないと判定する。欠落の度合いが許容範囲にない場合（Ｓ９４のＮ）、出力対象決定部２５０ｂは、第１分類とされた対象フレームを第２分類または第３分類に変更する。

あるいは第２分類とされた対象フレームを第３分類に変更する（Ｓ９８）。これにより、ユーザが視認しやすい部分でのデータ欠落が多いほど、当該フレームを出力させずに過去のフレームを再利用したりブラックアウトとしたりするように調整する。なおＳ９４の判定処理は、図８のＳ１２の判定処理と同時に行ってもよい。データ欠落の度合いが許容範囲であると判定したら（Ｓ９４のＹ）、出力対象決定部２５０ｂは次に、リプロジェクションに必要なデータが十分にあるかを判定する（Ｓ９６）。

すなわちリプロジェクションにより視野をずらした場合に、当該視野に含まれる部分画像のデータが十分に得られているか否かを判定する。十分なデータが得られていない場合（Ｓ９６のＮ）、出力対象決定部２５０ｂは、第１分類とされた対象フレームを第２分類または第３分類に変更する。あるいは第２分類とされた対象フレームを第３分類に変更する（Ｓ９８）。十分なデータが得られている場合は、出力対象決定部２５０ｂは元の分類のまま処理を終了する（Ｓ９６のＹ）。

なおＳ９２、Ｓ９４、Ｓ９６はそれぞれ独立に判定するのに限らず、各判定基準に基づきスコアを求め、それらを合算することにより、分類や表示内容の変更が必要か否かを総合的かつ同時に判定してもよい。このように追加で判定をした結果として、図８のＳ１４、Ｓ１６、Ｓ１８の処理のいずれかを実施する。ただしＳ１４、Ｓ１６の処理に際して画像処理部２４４は、上述のとおりリプロジェクションを含む補正処理を実施する。すなわち第１分類の場合、画像処理部２４４は最新の画像フレーム、または欠落部分に過去のフレームを用いた画像フレームに対しリプロジェクションを実施する。

第２分類の場合は、出力対象とされた過去のフレームに対しリプロジェクションを実施する。これらの処理において画像処理部２４４は、処理対象の部分画像のリプロジェクションに用いる範囲の画像データが前段の部分画像記憶部に全て到着してから補正処理を開始する。過去フレームを用いる場合、画像処理部２４４は、表示制御部２４６の図示しないメモリから該当データを読み出す。リプロジェクションに用いる画像の範囲は、位置姿勢の予測値と実際の位置姿勢との差分によって決定する。

図１３は、図１２のＳ９４において、ユーザの視点に基づきデータ欠落の度合いを数値化する手法を説明するための図である。この例ではユーザの注視点２９２が、表示画面２９０の中央付近に存在するとしている。ヘッドマウントディスプレイ１００を装着しているユーザは通常、見たい方向に顔を向けるため、表示画面２９０の中央を注視点２９２と見なすこともできる。

一般的な人の視覚特性として、瞳孔から注視点へ向かう視線を中心軸として５°以内に対応する領域２９４は弁別視野と呼ばれ、視力などの視機能が優れている。また水平方向に約３０°、垂直方向に約２０°以内に対応する領域２９６は有効視野と呼ばれ、眼球運動だけで瞬時に情報を受容できる。さらに水平方向に６０〜９０°、垂直方向に４５〜７０°以内に対応する領域２９８は安定注視野、水平方向に１００〜２００°、垂直方向に８５〜１３０°以内に対応する領域２９９は補助視野、というように、注視点２９２から離れるほど情報の識別能力が低くなる。

そこで図の上と左に示すように、表示画面２９０の平面において注視点２９２に近いほど大きくなる重みづけ関数３２０ａ、３２０ｂを設定する。なおこの図では、表示画面２９０の平面における水平方向、垂直方向の１次元での位置に対する重みづけ関数３２０ａ、３２０ｂを示しているが、実際には当該平面上の２次元の位置座標に対する関数、あるいはテーブルとする。出力対象決定部２５０ｂは例えば部分画像の欠落面積に、当該欠落が生じている位置座標に基づく重みを乗算し、それを対象フレームの全領域で合計することにより、欠落の度合いを数値として導出する。

これにより、同じ欠落面積でもより視認されやすい領域が欠落している場合は欠落の度合いを高く見積もることができ、見た目の印象を加味して許容範囲か否かを判定できる。なお図示する重みづけ関数３２０ａ、３２０ｂの形状はあくまで例示であり、上述した各範囲の視覚特性などに基づき形状を最適化したり、不連続な関数としたりしてよい。またヘッドマウントディスプレイ１００に注視点検出器を設ける場合、注視点２９２は表示画面２９０の中央に限らずより厳密に求められる。この場合、出力対象決定部２５０ｂは注視点２９２の移動に応じて、重みづけ関数３２０ａ、３２０ｂが最大となる位置を移動させればよい。

図１４は、図１２のＳ９６において評価する、リプロジェクションに必要なデータを説明するための図である。まず（ａ）は、サーバ４００で予測した位置姿勢に対応するようにビュースクリーン３４０ａを設定した様子を示している。サーバ４００は、当該ビュースクリーン３４０ａによって定まる視錐台３４２ａに含まれる像３４４をビュースクリーン３４０ａに描画する。ここで矢印のように、表示時の位置姿勢が、予測された位置姿勢よりやや左側を向いていたとする。

この場合、画像処理装置２００の画像処理部２４４は、（ｂ）に示すように、ビュースクリーン３４０ｂをやや左に向け、それに対応する像となるように画像を補正する。ところが新たに設定した視錐台３４２ｂに含まれる像のうち、サーバ４００から送信されていない領域３４６が大きいほど、リプロジェクションが困難になる。したがってリプロジェクション後の表示領域のうち、データを取得していない領域３４６が所定割合以上、ある場合などに、データが十分でないと判定する。

一方、サーバ４００から送信された画像には、新たに設定した視錐台３４２ｂには含まれない領域３４８も発生する。つまり領域３４８のデータは、リプロジェクション後には不必要な領域となるため、欠落していても表示に支障がない。そこで出力対象決定部２５０ｂは、図８のＳ１２において欠落面積などを評価する際、当該領域３４８を評価対象から除外してもよい。なおリプロジェクションに必要な画像データを十分に取得していても、サーバ４００が予測した位置姿勢と、実際の位置姿勢との差分があまりに大きいと、リプロジェクション後の画像が不自然になることが考えられる。

すなわちリプロジェクションは、サーバ４００によって描画された画像に対する２次元の補正のため、表示対象の３次元オブジェクトに対する視線の変化を厳密に表現することはできない。そのため出力対象決定部２５０ｂは図１２に示すように、Ｓ９６の判定とは別にＳ９２の判定を実施することで、位置姿勢の差分が大きい場合には表示パネルへの出力をキャンセルする。いずれにしろ図１４に示す、リプロジェクションに必要な領域のうちデータを取得していない領域３４６は、ユーザ頭部の動きによらずなるべく少なくすることが望ましい。

そこでサーバ４００は、領域３４６の画像を投機的に生成し画像処理装置２００に送信しておくことで、リプロジェクションが正常に行われる確率を上げてもよい。図１５は、画像処理装置２００においてリプロジェクションを行う場合に、サーバ４００と画像処理装置２００が実施する処理の手順を示すフローチャートである。このフローチャートは基本的に、動画像のフレーム単位で行われる。まず画像処理装置２００の画像データ取得部２４０は、ユーザ頭部の最新の位置姿勢を位置姿勢追跡部２６０から取得し、サーバ４００に送信する（Ｓ１００）。

また画像データ取得部２４０は、過去のフレームに対し得られた、サーバ４００における生成時刻から画像処理装置２００で処理されるまでの遅延時間の履歴と、ユーザ頭部の位置姿勢の予測値と実際との差分の履歴を表示制御部２４６から取得し、サーバ４００に送信する（Ｓ１０２）。なおＳ１００、Ｓ１０２の送信処理は、フレームと同期しない任意のタイミングで行ってもよい。またＳ１０２においては、過去の所定数のフレームについての履歴を送信することにより、送信の失敗に備えることができる。

サーバ４００の位置姿勢取得部２８４はそれらの情報を受信し、位置姿勢予測部２８６がユーザ頭部の位置姿勢を予測する（Ｓ１０４）。すなわち画像処理装置２００で処理されるまでの遅延時間後の位置姿勢を、画像処理装置２００から送信された位置姿勢を用いて予測する。次に描画部２８８は、予測された位置姿勢に対応する画像を描画する（Ｓ１０６）。この際、描画部２８８は、画像処理装置２００から送信された、上記遅延時間の履歴および位置姿勢の差分の履歴に基づき、直近に予測される遅延時間に位置姿勢がどの程度ずれる可能性があるかを特定する。つまり図１４の（ａ）に示す矢印のように、位置姿勢の予測値に対し最も確からしいずれ量およびずれの方向を表すベクトルを予測する。

そして描画部２８８は、当該ベクトル分だけビュースクリーンを変位させた方向に描画対象を拡張する。すなわち図１４の（ｂ）における領域３４６のような、位置姿勢の予測値に対応するフレームの外側の領域を、予測されたずれを表すベクトルに基づき決定し、その画像を追加で描画する。そしてパケット化部４２４は必要に応じて、描画された画像を部分画像単位でパケット化し、通信部４２６から画像処理装置２００に順次送信する。この際、通信部４２６は、部分画像の生成時刻、描画に用いた位置姿勢の予測値を部分画像に対応づけて送信する（Ｓ１０８）。

通信部４２６はさらに、送信済みの所定数の部分画像の、生成時刻の履歴と位置姿勢の予測値の履歴も送信することにより、画像処理装置２００への送信失敗に備える。画像処理装置２００の画像データ取得部２４０がそれらのデータを受信すると、表示制御部２４６は、部分画像が生成されてからの遅延時間および、位置姿勢の予測値と実際との差分を取得する（Ｓ１１０）。そして表示制御部２４６は、それらのデータに基づきフレームを分類するなどして出力対象を制御する（Ｓ１１２）。

第３分類によりブラックアウトさせる場合以外は、画像処理部２４４は、表示制御部２４６が決定した現フレーム、あるいは前のフレームに対し、その時点での位置姿勢に基づくリプロジェクションを部分画像の単位で施し、出力部２５２が表示パネルに出力する（Ｓ１１４）。このとき画像処理部２４４は、サーバ４００が予測のずれを踏まえ追加で描画した画像を必要に応じて利用する。

上述のとおり画像処理部２４４は、リプロジェクションとともにレンズ歪みを除去する補正や色収差補正を適宜実施してよい。なおリプロジェクションに着目した場合、各処理を部分画像単位で行わずフレーム単位で実行しても有効に機能する。その際も、位置姿勢の予測値からのずれを踏まえサーバ４００が追加で生成した画像データについては、サーバ４００から画像処理装置２００へ部分画像単位で送信してよい。

以上述べた、画像処理部におけるリプロジェクション処理によれば、サーバは、表示時のユーザ頭部の位置姿勢を予測し、それに対応する視野で画像を生成する。そして画像処理装置は、サーバから送信された画像を、表示の直前で、その時点での頭部の位置や姿勢に対応するように補正する。これにより、サーバからストリーミング配信された画像をヘッドマウントディスプレイに表示させる態様においてネックとなりやすい、頭部の動きに対する表示の追随性を良好にすることができる。

またサーバでの描画からヘッドマウントディスプレイでの表示までの一連の処理を部分画像単位のパイプライン処理とすることにより、描画から表示までの遅延時間を短縮できるため、リプロジェクションのための補正は僅かでよくなる。結果として、大幅な補正が必要なケースと比較し、簡易な計算で精度のよいリプロジェクションを行える。

さらにリプロジェクションにおいては、補正量や補正方向の分布を画像平面に表した変位ベクトルマップを用いることにより、画素ごとに独立した補正が可能となる。これにより部分画像単位であっても高精度な補正を実現できる。さらに接眼レンズのための歪み補正の成分も変位ベクトルに含めることにより一括した補正が可能となり、リプロジェクションのために必要な時間を最小限に抑えることができる。

さらに画像処理装置は、リプロジェクションの前段階として、サーバが予測した位置姿勢と実際の位置姿勢との差分、ユーザの視点の観点から評価したデータ欠落の度合い、リプロジェクションに用いる画像データの取得率、などに基づき出力対象を制御する。例えば最新のデータによるリプロジェクションの結果が良好でないと予測される場合は表示させないようにしたり、過去のフレームのデータをリプロジェクションの対象としたりする。またサーバにおいて、予測した位置姿勢のずれをさらに予測し、対応する領域の画像を投機的に生成しておく。これらの処理により、リプロジェクションの結果をできる限り良好にでき、高品質の画像を応答性よく表示できる。

４．異なる表示形態のためのデータ形成処理
図１で示したように、本実施の形態の画像表示システム１は、ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２に、同じ内容の画像を同時に表示させる機能を有する。ヘッドマウントディスプレイ１００を用いた仮想現実などのゲームの場合、ヘッドマウントディスプレイ１００を装着しているユーザ以外の者には表示内容がわからない。そのため複数のユーザが共にゲーム進行を視聴し、一体となって臨場感を共有することができない。

そこで上述のとおり、ヘッドマウントディスプレイ１００に表示されている内容を平板型ディスプレイ３０２にも同時に表示させ、複数のユーザで共有できるようにすることが考えられる。また、複数のユーザがそれぞれヘッドマウントディスプレイ１００を用いて共通のコンテンツを視聴する場合、各ユーザの頭部の位置姿勢に基づき、異なる視点からの画像を生成、表示させる必要がある。

ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２では、表示させる画像の形式が大きく異なるが、サーバ４００において形式が異なる複数の画像のデータを生成し送信するのは、伝送帯域や処理負荷の面で非効率な場合がある。そこでサーバ４００と画像処理装置２００の連携により、データの形式変換の分担やタイミングを適切に選択することで、効率的に複数形態の画像表示を行えるようにする。

図１６は、形態の異なる複数の表示装置への表示に対応できるサーバ４００と画像処理装置２００の機能ブロックの構成を示している。サーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を含む。画像処理装置２００は、画像データ取得部２４０、復号伸張部２４２、画像処理部２４４、および表示制御部２４６を含む。サーバ４００の圧縮符号化部４２２、パケット化部４２４、通信部４２６、および画像処理装置２００の画像データ取得部２４０、復号伸張部２４２は、図５で説明したのと同様の機能を有する。

ただしそれらの機能を限定する趣旨ではなく、例えばサーバ４００は、圧縮符号化されていない部分画像のデータを送信してもよい。この場合、サーバ４００の圧縮符号化部４２２と画像処理装置２００の復号伸張部２４２の機能を省略できる。また画像処理装置２００の画像処理部２４４は、図９で示した各種機能の少なくともいずれかをさらに有していてもよい。

サーバ４００の画像生成部４２０は、描画部４３０、形成内容切り替え部４３２およびデータ形成部４３４を備える。なお描画部４３０およびデータ形成部４３４は、図３の画像描画部４０４（ＧＰＵ）と、描画制御部４０２（ＣＰＵ）およびソフトウェアの組み合わせによって実現されてもよい。形成内容切り替え部４３２は図３の描画制御部４０２（ＣＰＵ）およびソフトウェアの組み合わせによって実現されてもよい。描画部４３０は、動画像のフレームを所定または可変のレートで生成する。ここで描画する画像は、画像処理装置２００に接続される表示装置の形態に依存しない一般的な画像であってもよい。あるいは描画部４３０は、撮影された動画像のフレームを、図示しないカメラから順次取得してもよい。

形成内容切り替え部４３２は、画像処理装置２００に接続される表示装置の表示形態に対応する形式とするのに必要な形成処理のうち、サーバ４００で実施すべき処理の内容を所定規則で切り替える。最も単純には、形成内容切り替え部４３２は、画像処理装置２００にヘッドマウントディスプレイ１００が接続されているか否かによって、左目用、右目用の画像を準備したうえ接眼レンズに対応する歪みを与えるか否かを決定する。

ヘッドマウントディスプレイ１００が接続されている画像処理装置２００には、サーバ４００側でそれらの加工を施したうえで画像を送信すれば、画像処理装置２００での補正処理の少なくとも一部を省略できる。処理リソースが潤沢でない画像処理装置２００を用いる場合は特に、サーバ４００から送信されたデータをほぼそのまま表示できることは、低遅延での表示に有利に働く。

一方で、画像処理装置２００にさらに平板型ディスプレイ３０２が接続されている場合、接眼レンズのための歪みが与えられた左目用、右目用の画像をサーバ４００から送信すると、一方の画像を切り出したり歪みを取り除いたりする処理が必要となり、却って処理の負荷が増えることもある。サーバ４００から複数形式の画像を送信すると、必要な伝送帯域が増大する。

そこで形成内容切り替え部４３２は、状況に応じてサーバ４００側でなすべき処理を適切に選択することにより、伝送帯域を増大させることなく最も効率のよい形式の画像を画像処理装置２００に送信できるようにする。また、用途に応じて画質や表示遅延が最良となる形式の画像を送信できるようにする。具体的には形成内容切り替え部４３２は、画像処理装置２００に接続される表示装置の形態、画像処理装置２００においてさらなる形成処理を行う補正部の処理性能、動画像の特徴、画像処理装置２００との通信状況、の少なくともいずれかに基づき処理内容を決定する。

ここで表示装置の形態とは例えば、解像度、対応可能なフレームレート、対応色空間、レンズを介して見る場合の光学パラメータ、表示装置の個数、などである。通信状況とは例えば、その時点で実現されている通信帯域幅や通信遅延などである。それらの情報は、画像処理装置２００の画像データ取得部２４０から取得してもよい。

形成内容切り替え部４３２はそれらの情報に基づき、ヘッドマウントディスプレイ１００の表示形態に合わせた左目用、右目用の画像を生成するか否か、接眼レンズのための歪み補正を実施するか否か、などを決定する。ただし個々のユーザの画像処理装置２００で実現したい表示形態によって、必要な処理はこれに限らず、解像度の削減、画像の変形など様々に考えられる。したがって形成内容切り替え部４３２が決定する処理内容の候補も、それに応じて適宜設定しておく。

データ形成部４３４は、形成内容切り替え部４３２の決定に従い、動画像の各フレームを、画像処理装置２００で実現される表示形態に対応する形式とするのに必要な形成処理の一部を実施する。通信部４２６は、そのようにして適切に形成された画像のデータを、画像処理装置２００に送信する。複数の画像処理装置２００を送信先とする場合、データ形成部４３４は、それぞれの画像処理装置２００に適した形成処理を実施する。

１つの画像処理装置２００に対しては、接続された表示装置が複数の表示形態を有していても、適切に選択された１つの形式の画像データを送信することにより、必要な通信帯域の増大を防止する。通信部４２６は、画像のデータとともに、サーバ４００側でどのような形成処理を実施したかを示す情報を付加して送信する。異なる表示形態を実現する複数の画像処理装置２００には、それぞれに適合した形式の画像のデータと、形成処理の内容を示す情報とを対応づけて送信する。

画像処理装置２００の画像処理部２４４は、補正部として、サーバ４００から送信された画像を、実現する表示形態に対応する形式とする第１形成部２７０ａ（第１の補正部）および第２形成部２７０ｂ（第２の補正部）を含む。図示する例では、ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２が接続された画像処理装置２００を想定しているため、それらに対応するように第１、第２の２つの形成部を設けているが、当然、実現すべき表示形態の数だけ形成部を設けてよい。

すなわち画像処理部２４４は、サーバ４００から送信された１つのフレームから、形式が異なる複数のフレームを生成する機能を有し、その数は実現すべき表示形態の数に依存する。第１形成部２７０ａおよび第２形成部２７０ｂは、サーバ４００から画像データとともに送信された、サーバ４００側でなされた形成処理の内容に基づき、各表示形態に対応する形式とするために必要な処理を決定する。

なおサーバ４００側でなされた形成処理の内容によっては、第１形成部２７０ａまたは第２形成部２７０ｂはその機能を省略できる。例えば、ヘッドマウントディスプレイ１００にそのまま表示できる画像のデータがサーバ４００から送信された場合、ヘッドマウントディスプレイ１００に対応する第１形成部２７０ａはその処理を省略できる。

また変形例として、第１形成部２７０ａまたは第２形成部２７０ｂのどちらか一方は、他方が形成した画像に対し必要な形成処理を実施してもよい。例えば第１形成部２７０ａが形成してなるヘッドマウントディスプレイ１００用の画像に対し、第２形成部２７０ｂが形成処理を施すことで、平板型ディスプレイ３０２用の画像を生成してもよい。

また図９の画像処理部２４４において示した各種画像処理と、表示形態に合わせた形成処理を適宜組み合わせてもよい。例えば第１形成部２７０ａ、第２形成部２７０ｂの直前に合成部２６４を組み入れる。そしてサーバ４００から送信されたフレームに、ヘッドマウントディスプレイ１００が備えるカメラによる撮影画像やＵＩプレーン画像を合成したうえで、第１形成部２７０ａはヘッドマウントディスプレイ１００の表示形式の画像とし、第２形成部２７０ｂは平板型ディスプレイ３０２の表示形式の画像とする。

合成部２６４は、第１形成部２７０ａ、第２形成部２７０ｂの直後に組み入れてもよい。この場合、合成対象の画像は、第１形成部２７０ａおよび第２形成部２７０ｂによって形成された画像にそれぞれ対応する形式としておく必要がある。また第１形成部２７０ａに、図９で示した第１補正部２６２の機能を含めることにより、リプロジェクションを行ってもよい。

いずれにしろ第１形成部２７０ａ、第２形成部２７０ｂは、上述のように変位ベクトルマップを生成し、それに基づき部分画像ごとに補正を行う。第１形成部２７０ａがリプロジェクションや歪み補正を行う場合、それらの変位ベクトルを合成してなる変位ベクトルマップを生成することにより、第１形成部２７０ａは複数の補正を一括して行ってよい。

表示制御部２４６は、第１制御部２７２ａ、第２制御部２７２ｂを含み、それぞれ第１形成部２７０ａ、第２形成部２７０ｂが形成してなる画像をヘッドマウントディスプレイ１００、平板型ディスプレイ３０２の表示パネルに出力する。上述したように、第１形成部２７０ａ、第２形成部２７０ｂの処理を含め、サーバ４００からの送信および画像処理装置２００内部での処理は部分画像単位で順次実施する。そのため第１制御部２７２ａ、第２制御部２７２ｂはそれぞれ、形成処理後のデータを格納する部分画像記憶部を備える。

図１７は、本実施の形態で実現できる画像の形式の変遷を例示している。図１６で示したように、画像処理装置２００にはヘッドマウントディスプレイ１００と平板型ディスプレイ３０２が接続されているとする。図では（ａ）、（ｂ）、（ｃ）、（ｄ）の４つのパターンを示しているが、ヘッドマウントディスプレイ１００および平板型ディスプレイ３０２に表示すべき画像の最終形式はパターンによらない。

すなわちヘッドマウントディスプレイ１００に表示すべき画像１３２は、左目用画像と右目用画像からなり、それぞれが接眼レンズのための歪みを与えられた形式（第１の形式）を有する。平板型ディスプレイ３０２に表示すべき画像１３４は、両眼で共通の１つの像からなり、レンズ歪みなどのない一般的な画像の形式（第２の形式）を有する。

これに対し（ａ）は、サーバ４００側で、左目用画像と右目用画像の対１３０ａを生成しておくパターンである。この場合、画像処理装置２００の第１形成部２７０ａは、送信された画像に対し、ヘッドマウントディスプレイ１００の接眼レンズのための歪みを与える。上述のとおり第１補正部２６２と組み合わせ、さらにリプロジェクション等の補正を実施してもよい。第２形成部２７０ｂは、左目用画像と右目用画像のどちらかの画像を切り出し、適切な画像サイズとする。

（ｂ）は、サーバ４００から、平板型ディスプレイに適した画像１３０ｂを送信するパターンである。この場合、サーバ４００のデータ形成部４３４は、描画部４３０が描画した画像に対し何らの形成処理を行わなくてよい。そして画像処理装置２００の第１形成部２７０ａは、送信された画像から左目用、右目用の画像を生成したうえ、接眼レンズのための歪みを与える。上述のとおり第１補正部２６２と組み合わせ、さらにリプロジェクション等の補正を実施してもよい。この場合、第２形成部２７０ｂは形成処理を省略できる。

（ｃ）は、サーバ４００側で、ヘッドマウントディスプレイ１００用の左目用、右目用の画像を生成したうえ、接眼レンズのための歪みを与えた画像１３０ｃを生成するパターンである。この場合、画像処理装置２００の第１形成部２７０ａは形成処理を省略できる。ただし第１補正部２６２によって、リプロジェクション等の補正を実施してもよい。第２形成部２７０ｂは、左目用画像と右目用画像のどちらかの画像を切り出し、歪みを除去する補正を施したうえ適切な画像サイズとする。

（ｄ）はサーバ４００からパノラマ画像１３０ｄを送信するパターンである。ここでパノラマ画像１３０ｄは一般に、正距円筒図法によって表される全天球の画像（３６０°画像）である。ただし画像の形式は限定されず、多円錐図法、等距離射法、その他、魚眼レンズの画像表現に用いられる様々な形式のいずれを用いてもよい。また魚眼レンズによる画像を用いる場合、サーバ４００は、２眼分の画像を用いて３６０°のパノラマ画像を生成してもよい。

ただしパノラマ画像は、カメラによる撮影画像に限らず、仮想的な複数の始点から見た画像をサーバ４００が描画してもよい。この場合、サーバ４００のデータ形成部４３４は、描画部４３０が描画したパノラマ画像に対し何らの形成処理を行わなくてもよい。そして画像処理装置２００の第１形成部２７０ａは送信された画像のうち、ユーザ頭部の最新の位置姿勢に対応する、左目および右目の視野の領域を切り出し、左目用、右目用の画像を生成する。

さらに第１形成部２７０ａは、送信された画像にカメラのレンズによる歪みや、正距円筒図法、多円錐図法、等距離射影法などによる歪みがある場合はそれを除去したうえで、ヘッドマウントディスプレイ１００の接眼レンズのための歪みを与える。多円錐図法の画像においては円錐間の隙間を、接眼レンズの歪みを考慮してつなぎあわせる。また画像処理部２４４について上述した様々な補正の少なくともいずれかと組み合わせ、変位ベクトルマップを用いて一括して補正を行ってよい。

第２形成部２７０ｂは、送信された画像から両眼による視野の領域を切り出し、カメラのレンズによる歪みがある場合はそれを除去する。なおこの場合、ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２へ表示させる画像は、図示するように異なる範囲のものでもよいし、同一の範囲であってもよい。例えばヘッドマウントディスプレイ１００に表示させる画像は、ユーザ頭部の位置姿勢に対応する範囲のものとする一方、平板型ディスプレイ３０２へ表示させる画像は、ゲームコントローラを介したユーザ操作などによって別途指定された範囲のものでもよい。

ヘッドマウントディスプレイ１００へ出力する画像１３２については、表示の直前にリプロジェクションを行うとすると、（ａ）のパターンは、画像処理装置２００において歪み補正とリプロジェクションを同時に実施できる。一方、（ｃ）はサーバ４００での歪み補正と、画像処理装置２００でのリプロジェクションが個別になされるため、サーバ４００と画像処理装置２００が同じ処理能力をもち、同じ変位ベクトルや画素補間処理を行う場合、ヘッドマウントディスプレイ１００への出力までに要する時間は（ａ）の方が短くできる可能性が高い。

（ｄ）のパターンは、表示の直前に最新のユーザの視野に対応する領域を切り出すため、あらかじめ生成されたパノラマ映像のビデオコンテンツであっても、リアルタイムで生成されたゲーム画像であっても、前述のリプロジェクションに相当する処理は必要ない。また、送信される画像の範囲に制限がないため、リプロジェクションによる表示画像の生成に必要なデータが不足するといった事態が生じない。

（ａ）のパターンは、平板型ディスプレイ３０２へ出力する画像１３４も、サーバ４００から送信された画像の一部を切り出すのみで生成できるため、（ｂ）のパターンでの平板型ディスプレイ３０２への出力とほぼ同等の速度での出力が可能となる。なお（ｂ）や（ｄ）のパターンにおいてサーバ４００から送信される画像には、視差や奥行きの情報が含まれないため、ヘッドマウントディスプレイ１００へ出力する画像１３２は、視差のない画像となる。

（ｃ）のパターンにおいて平板型ディスプレイ３０２へ出力する画像１３４は、サーバ４００において変形させた画像を、画像処理装置２００側で元に戻す処理が含まれるため、（ａ）、（ｂ）のパターンより出力速度が遅くなる。また、一旦歪ませた画像を元に戻す処理により、（ａ）、（ｂ）のパターンと比較し画質が低下する可能性が高くなる。

（ｄ）のパターンは表示側の視点が様々であっても、サーバ４００は１種類の画像データを送信すればすむため処理を効率化できる。一方、表示に不必要な領域のデータも送信するため、（ａ）、（ｂ）、（ｃ）と同じ帯域幅でデータ送信し、１視点の表示画像を生成する場合は、それらのパターンより画質が低下する場合がある。このように各パターンには特性があるため、形成内容切り替え部４３２は、当該特性を踏まえて設定した規則に従い、いずれかのパターンを決定する。

図１８は、ユーザ側（クライアント側）での表示装置の接続方式のバリエーションを例示している。まず（ａ）は、分配器の役割を果たすプロセッサユニット１４０にヘッドマウントディスプレイ１００および平板型ディスプレイ３０２が並列に接続された構成を示す。なおプロセッサユニット１４０は、ヘッドマウントディスプレイ１００および平板型ディスプレイ３０２とは一体的でない画像処理装置２００に内蔵してよい。（ｂ）は、ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２が直列に接続された構成を示す。

（ｃ）は、ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２が異なる場所にあり、それぞれがサーバ４００からデータを取得する構成を示す。この場合、サーバ４００は、送信先の表示形態に合わせて異なる形式のデータを送信してもよい。ただしこの構成では、ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２が直接、接続されていないため、ヘッドマウントディスプレイ１００のカメラによる撮影画像を合成して表示させる場合、平板型ディスプレイ３０２にそれを反映させることが難しい。

いずれにしろ、図１７で説明した４つの送信パターンは、図１８で示される接続体系のいずれにも適用できる。例えば画像処理装置２００を、ヘッドマウントディスプレイ１００および平板型ディスプレイ３０２のそれぞれに一体的に設けた場合、第１形成部２７０ａ、第２形成部２７０ｂは、図１８で示した（ａ）、（ｂ）、（ｃ）の接続体系と、サーバ４００から送信されるデータの形式との組み合わせに応じて、自らを動作させるか否か、動作させる場合はその処理内容を決定する。そして第１制御部２７２ａ、第２制御部２７２ｂを、対応する表示形態に合わせて動作させれば、図１８に示すどの構成であっても、各表示装置の形態に合わせた画像の表示が可能となる。

図１９は、サーバ４００が表示形態に応じて決定した形式で画像のデータを送信する処理手順を示すフローチャートである。このフローチャートは、ユーザが画像処理装置２００に対し、プレイしたいゲームや鑑賞したい動画などを選択することによって開始される。これに応じて画像処理装置２００の画像データ取得部２４０が、サーバ４００へその旨を要求することにより、サーバ４００が当該画像処理装置２００と通信を確立する（Ｓ３０）。するとサーバ４００の形成内容切り替え部４３２は、画像処理装置２００とのハンドシェイクにより必要な情報を確認する（Ｓ３１のＹ、Ｓ３２）。具体的には、次の項目の少なくともいずれかを確認する。

１．図１７で示したような送信パターンのうち画像処理装置２００側で対応可能なパターン
２．平板型ディスプレイ３０２にヘッドマウントディスプレイ１００と同じ視点での画像を表示させるか否か
３．サーバ側で出力できる形式
４．遅延時間、画質、左右の視差の有無に係る要求値
５．通信速度（通信帯域または転送帯域、通信遅延または転送遅延）
６．画像処理装置２００の画像処理部２４４で処理できる内容（処理能力）
７．ヘッドマウントディスプレイ１００と平板型ディスプレイ３０２の解像度・フレームレート・色空間・接眼レンズの光学パラメータ

なお上記５の通信帯域や通信遅延については、システム立ち上げ後における実績値や、同一のサーバ４００／画像処理装置２００間での実績値を参照してもよい。そして形成内容切り替え部４３２は、確認した情報に基づき、あらかじめ設定された規則に従い、サーバ４００側で実施すべき画像の形成内容を決定する（Ｓ３４）。例えば図１７で示したパターンのうち、ヘッドマウントディスプレイ１００への出力遅延時間は（ｃ）≒（ｄ）＞（ｂ）＞（ａ）であり、平板型ディスプレイ３０２への出力遅延時間は（ｃ）≒（ｄ）＞（ａ）＞（ｂ）である。また平板型ディスプレイ３０２に表示させる画像の質は（ｂ）が最も高く（ｃ）が最も低い。

またヘッドマウントディスプレイ１００へ表示する際の画質は、サーバ４００と画像処理装置２００が同じ変位ベクトルや画素補間処理を行う場合、レンズ歪みとリプロジェクションを一括でおこなう（ａ)の方が、（ｃ）より優位性がある。しかし、一般にサーバ４００は画像処理装置２００より処理能力が潤沢にあり、高密度な変位ベクトルマップや、より多タップの画素補間処理など画質向上のための処理を短時間で実施できる。そのため、ヘッドマウントディスプレイ１００用の画像が２回にわたって補正される（ｃ）でも、画質において優位となる場合がある。なお（ａ）、（ｃ）と（ｂ）の間では、視差処理の有無などにより、一概に画質を比較できない。

そのような遅延時間と画質のバランスや、画像処理装置２００およびサーバ４００で実行可能なパターンなどに応じて、最適なパターンを選択できるように規則を設定しておく。この際、上述のとおり通信帯域（転送帯域）、通信遅延（転送遅延）も考慮する。ここでトータルの遅延時間は、サーバ４００での処理時間、通信遅延、画像処理装置２００での処理時間の合計となる。パターン選択のための規則として、トータルの遅延時間に対し許容できるレベルをあらかじめ決めておいてもよい。

例えば通信遅延（転送遅延）が当該レベルより大きい場合、画質を犠牲にしてでも、トータルの遅延時間が短くなるパターンを選択する。このようなときには、画像処理装置２００にて標準的な画質でレンズ歪みとリプロジェクションの処理を一括でおこなう前提で（ａ）のパターンを選択してもよい。通信遅延（転送遅延）がそれより小さい場合は、サーバ４００や画像処理装置２００での処理時間が長いパターンを選択し、画質を向上させてもよい。

例えばサーバ４００の処理能力が高い場合、ヘッドマウントディスプレイ１００への表示において、図１７の（ａ）でなく（ｃ）のパターンを選択してもよい。また、例えば画像処理装置２００の画像処理部２４４がもつ第２形成部２７０ｂが、歪みを除去する補正に対応していない場合、（ｃ）のパターンを選択できず、（ａ）もしくは（ｂ）のパターンを選択する必要がある。

データ形成部４３４は描画部４３０が描画したフレームに、決定された内容で形成処理を施す（Ｓ３６）。なおデータ形成部４３４が、描画部４３０が描画したフレームのまま送信することを決定した場合は、形成処理を省略する。その後、必要に応じて圧縮符号化部４２２が画像データを圧縮符号化し、パケット化部４２４が、画像のデータと当該データに適用済みの形成内容とを対応づけてパケットとすることにより、通信部４２６が画像処理装置２００へ送信する（Ｓ３８）。なおＳ３６、Ｓ３８の処理は実際には上述のとおり、部分画像の単位で順次進捗させる。

また、Ｓ３４で決定した内容で形成したデータを転送するには通信帯域（転送帯域）が不足している場合、後述する制御により、データ圧縮時の量子化パラメータ、解像度、フレームレート、色空間などの少なくともいずれかを変更することにより、データサイズを削減してもよい。この場合、画像処理装置２００の画像処理部２４４は、画像サイズのアップスケールなどを行ってよい。画像処理装置２００に対するユーザ操作などにより、画像の送信を停止する必要がなければ（Ｓ４０のＮ）、後続のフレームについて描画、形成処理、送信を繰り返す（Ｓ３１のＮ、Ｓ３６、Ｓ３８）。

ただしサーバ４００側での画像の形成内容を切り替えるタイミングにおいては、形成内容切り替え部４３２がＳ３２、Ｓ３４の処理により形成内容を更新する（Ｓ３１のＹ）。ここで画像の形成内容を切り替えるタイミングとは、画像処理装置２００で実施しているアプリケーションの切り替わり時、当該アプリケーション内でのモードの切り替わり時、画像処理装置２００に対するユーザ操作により指定されたタイミングなどに生じ得る。

なおサーバ４００と画像処理装置２００の間の通信状況は変化し得るため、形成内容切り替え部４３２はさらに、通信速度を常時監視し、必要に応じて形成内容を動的に切り替えてもよい。画像の送信を停止する必要が生じたら、サーバ４００は全ての処理を終了させる（Ｓ４０のＹ）。

以上述べた、異なる表示形態のためのデータ形成処理によれば、サーバ４００は、画像データの送信先である画像処理装置２００において実現すべき表示形態を踏まえ、表示までに必要なデータ形成処理の一部を実施する。画像処理装置２００に接続される表示装置の種類、画像処理装置の処理性能、通信状況、表示対象の動画の内容などによって、当該形成処理の内容を決定することにより、与えられた環境下で表示の応答性や画質を最良の状態とすることができる。

また、異なる表示形態の複数の表示装置に同じ動画を表示させる場合に、サーバ４００が好適なデータ形式を１つ選択して形成処理を施したうえで送信することにより、表示形態の数によらず同様の通信帯域でデータを送信できる。これにより画像処理装置２００側では、各表示形態に応じたデータを少ない処理で形成できる。また、リプロジェクションなど各種補正や、他の画像との合成などとの組み合わせも容易である。結果として、実現したい表示形態の種類や数によらず、ネットワークを介して提供される画像を低遅延、高画質で表示させることができる。

５．各フレームに対応する複数の画像の圧縮符号化
動画像のデータとして、各フレームが複数の画像によって構成されている場合の圧縮符号化手法について説明する。まず動画像の各フレームが、異なる視点に対し得られた複数の画像により構成される場合を考える。例えば、人の左右の目に対応する視点で表示画像を生成し、それをヘッドマウントディスプレイ１００の左目領域、右目領域に表示させれば、ユーザは臨場感のある画像世界を楽しむことができる。一例として、スポーツ競技などのイベントを、空間に配置した複数のカメラで撮影し、それを利用して、ヘッドマウントディスプレイ１００の頭部の動きに応じた左目用、右目用の画像を生成、表示することにより、ユーザは会場にいるのと同様の感覚で、自由な視点からイベントを見ることができる。

このような技術において、サーバ４００から送信すべき左目用、右目用の画像は、基本的に同じ空間の像を表しているため類似性が高い。そこでサーバ４００の圧縮符号化部４２２は、一方の画像を圧縮符号したうえ、他方のデータはそれとの差分を表す情報とすることで、より高い圧縮率を実現する。あるいは圧縮符号化部４２２は、過去のフレームの対応する視点の圧縮符号化結果との差分を表す情報を取得してもよい。つまり圧縮符号化部４２２は、動画像のデータのうち同じ時刻の像を表す別の画像、または過去のフレームの画像、の少なくともいずれかの圧縮符号化結果を参照して予測符号化を行う。

図２０は、複数視点の画像を高率で圧縮する機能を有するサーバ４００と、それを処理する画像処理装置２００の機能ブロックの構成を示している。サーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を含む。画像処理装置２００は、画像データ取得部２４０、復号伸張部２４２、画像処理部２４４、および表示制御部２４６を含む。サーバ４００の画像生成部４２０、パケット化部４２４、通信部４２６、および画像処理装置２００の画像データ取得部２４０、画像処理部２４４、表示制御部２４６は、図５あるいは図１６で説明したのと同様の機能を有する。

ただし画像処理装置２００の画像処理部２４４は、図９で示した各種機能を有していてもよい。またサーバ４００の画像生成部４２０は、異なる視点に対し得られた複数の動画像のデータを取得する。例えば画像生成部４２０は、異なる位置に配置された複数のカメラで撮影された画像を取得したり、仮想的な複数の視点から見た画像を描画したりしてよい。すなわち画像生成部４２０は、自らが画像を生成するのに限らず、外部のカメラなどから画像のデータを取得してもよい。

画像生成部４２０はまた、一旦、取得した複数視点の画像に基づき、ヘッドマウントディスプレイ１００を装着したユーザの視点に対応する視野で、左目用、右目用の画像を生成してもよい。左目用、右目用に限らず複数視点の画像をサーバ４００による送信対象とし、送信先の画像処理装置２００で左目用、右目用の画像を生成するようにしてもよい。あるいは画像処理装置２００は、送信された複数視点の画像を用いて何らかの画像解析を行ってもよい。

いずれにしろ画像生成部４２０は、表される対象物の少なくとも一部が共通している複数の動画像のフレームを、所定または可変のレートで取得あるいは生成し、圧縮符号化部４２２に順次供給する。圧縮符号化部４２２は、分割部４４０、第１符号化部４４２、第２符号化部４４４を備える。分割部４４０は、複数の動画像の対応するフレームを、画像平面の共通の境界で分割することにより、画像ブロックを形成する。第１符号化部４４２は、視点の異なる複数のフレームのうち、一つの視点のフレームを、画像ブロック単位で圧縮符号化する。

第２符号化部４４４は、第１符号化部４４２が圧縮符号化したデータを用いて、その他の視点のフレームを、画像ブロック単位で圧縮符号化する。符号化方式は特に限定されないが、フレームの全体を用いることなく部分的な領域ごとに独立して圧縮しても、画質の劣化が小さい方式を採用することが望ましい。これにより、１フレームより小さい単位で複数視点のフレームを順次圧縮符号化でき、これまで述べたのと同様のパイプライン処理により、少ない遅延時間で部分画像ごとに画像処理装置２００へ送信できる。

このため画像ブロックの境界は、画像平面において画像生成部４２０がデータを取得する順序に応じて適切に設定する。すなわち先に取得される領域ほど先に圧縮符号化され送出されるように、画像ブロックの境界を決定する。例えば画像生成部４２０が、画像平面の各行の画素列のデータを上から順に取得する場合、分割部４４０は水平方向に境界線を設定することにより、所定数の行からなる画像ブロックを形成する。

ただし画像生成部４２０が取得するデータの順序や画像の分割方向は特に限定されない。例えば画像生成部４２０が、縦方向の画素列のデータを順次取得する場合は、分割部４４０は垂直方向に境界線を設定する。境界線は一方向に限らず、縦横双方向に区切ることにより画像ブロックをタイル状としてもよい。あるいは画像生成部４２０は、一度の走査で１行おきに画素列のデータを取得し、次の走査で残りの行のデータを取得するインターレース方式でデータを取得してもよいし、画像平面を蛇行するようにデータを取得していってもよい。後者の場合、分割部４４０は画像平面の斜め方向に分割の境界線を設定する。

いずれにしろ上述のとおり、画像生成部４２０が先に取得した領域のデータが先に圧縮符号化されるように、データの取得順に対応する分割パターンを適切に設定しておき、分割部４４０は、画像生成部４２０のデータ取得順に応じたパターンで画像平面を分割する。ここで分割部４４０は、動き補償や符号化を行うのに必要な最小単位の領域を、最小の分割単位とする。第１符号化部４４２および第２符号化部４４４は、分割部４４０がこのように分割した画像ブロックの単位で圧縮符号化を行う。

ここで第２符号化部４４４は上述のとおり、第１符号化部４４２が圧縮符号化した画像データを用いることにより、他の視点の画像データの圧縮率を高める。なお第１符号化部４４２と第２符号化部４４４はさらに、過去のフレームの同じ位置の画像ブロックの圧縮符号化データを用いて、現フレームの各画像ブロックを圧縮符号化してもよい。

図２１は、第１符号化部４４２と第２符号化部４４４が圧縮符号化する画像ブロックと、そのために圧縮符号化結果を参照する画像ブロックの関係を例示している。同図は、接眼レンズのための歪みを与えた左目用、右目用画像を処理対象とした場合の画像平面を表しており、Ｎを自然数として左がＮフレーム目、右がＮ＋１フレーム目を示している。例えばＮフレーム目に示すように、第１符号化部４４２が左目用画像３５０ａを、画像ブロック（１−１）、（１−２）、・・・、（１−ｎ）の単位で圧縮符号化し、第２符号化部４４４は右目用画像３５０ｂを、画像ブロック（２−１）、（２−２）、・・・、（２−ｎ）の単位で圧縮符号化する。

ここで第２符号化部４４４は実線矢印（例えば実線矢印３５２）のように、第１符号化部４４２が圧縮符号化した、左目用画像（例えば左目用画像３５０ａ）の画像ブロックのデータを参照先として用い、右目用画像（例えば右目用画像３５０ｂ）の各画像ブロックを圧縮符号化する。あるいは第２符号化部４４４は、一点鎖線矢印（例えば一点鎖線矢印３５４）のように、Ｎフレーム目の右目用画像３５０ｂにおける画像ブロックの圧縮符号化結果を参照先として用い、１つ後のＮ＋１フレーム目の右目用画像における同じ位置の画像ブロックを圧縮符号化してもよい。

または第２符号化部４４４は、実線矢印および一点鎖線矢印で示した参照先の双方を同時に用いて、対象の画像ブロックを圧縮符号化してもよい。同様に第１符号化部４４２は、破線矢印（例えば破線矢印３５６）のように、Ｎフレーム目の左目用画像３５０ａにおける画像ブロックの圧縮符号化結果を参照先として用い、Ｎ＋１フレーム目の左目用画像における同じ位置の画像ブロックを圧縮符号化してもよい。これらの態様において、例えば多視点映像の符号化方式であるＭＶＣ（Multiview Video Coding）のアルゴリズムを用いることができる。

ＭＶＣは、多視点で撮影された画像のうち、ＡＶＣ（Ｈ２６４、ＭＰＥＧ−４）などの方式で圧縮符号化した視点の復号画像を用いて別視点の画像を予測し、それと実際の画像との差分を当該別視点の圧縮符号化対象とすることを基本とする。ただし符号化のフォーマットは特に限定されず、例えばＨＥＶＣ（High Efficiency Video Coding）に対する多視点符号化の拡張規格であるＭＶ−ＨＥＶＣ（多視点映像符号化拡張）でもよい。またベースとなる符号化方式はそのほか、ＶＰ９、ＡＶ１（AOMedia Video 1）、ＶＶＣ（Versatile Video Coding）などでもよい。

いずれにしろ本実施の形態では、当該圧縮符号化処理を画像ブロック単位で行うことにより、送出までの遅延時間を短縮する。例えば第１符号化部が、一の視点のフレームにおけるｎ番目（ｎは自然数）の画像ブロックを圧縮符号化している間に、第２符号化部は、その他の視点のフレームにおけるｎ−１番目の画像ブロックを圧縮符号化する。これによりフレームのデータを取得した順序で、順次並列にパイプライン同時動作でき、圧縮処理を高速化できる。

第１符号化部４４２および第２符号化部４４４で圧縮符号化の対象とする視点はそれぞれ、１つでも複数でもよい。第１符号化部４４２および第２符号化部４４４で圧縮符号化された複数視点の動画像のフレームは、順次、パケット化部４２４に供給され、通信部４２６から画像処理装置２００に送信される。この際、各データには、第１符号化部４４２および第２符号化部４４４のどちらで圧縮されたデータかを区別する情報を対応づけておく。

なお圧縮単位である画像ブロックは、これまで述べたパイプライン処理の単位である部分画像と同一でもよいし、１つの部分画像に複数の画像ブロックのデータが含まれていてもよい。画像処理装置２００の復号伸張部２４２は、第１復号部２８０および第２復号部２８２を備える。第１復号部２８０は、第１符号化部４４２で圧縮符号化された視点の画像を復号伸張する。第２復号部２８２は、第２符号化部４４４で圧縮符号化された視点の画像を復号伸張する。

すなわち第１復号部２８０は、第１符号化部４４２で圧縮符号化されたデータのみを用いて、符号化方式に応じた一般的な復号処理により、一部の視点の動画像のフレームを復号する。第２復号部２８２は、第１符号化部４４２で圧縮符号化されたデータと、第２符号化部４４４で圧縮符号化されたデータを用いて、残りの視点の動画像のフレームを復号する。例えば前者により対象とする視点の画像を予測し、第２符号化部４４４で圧縮符号化されたデータの復号結果を加算することにより、当該視点の画像を復号する。

なお第１復号部２８０、第２復号部２８２は機能ブロックとして分けて示しているが、実際には一つの回路やソフトウェアモジュールが２種類の処理を順に実施できることは当業者には理解されるところである。これまで述べたように復号伸張部２４２は、画像データ取得部２４０から圧縮符号化された部分画像のデータを取得し、その単位で復号伸張したうえで画像処理部２４４に供給する。ここで複数視点の画像の類似性を利用して予測符号化を行うことにより、サーバ４００から伝送すべきデータサイズを縮小でき、通信帯域を圧迫することなく遅延の少ない画像表示を実現できる。

図２２は、本実施の形態においてサーバ４００が、複数視点の画像の類似性を利用して画像ブロック単位で圧縮符号化する効果を説明するための図である。同図上段は、接眼レンズのための歪みを与えた左目用、右目用画像を処理対象とした場合の、画像の区分を例示している。同図下段の横方向は時間経過を表し、それぞれの領域に対する圧縮符号化処理の時間を、上段に示した各領域の番号とともに矢印で示している。

（ａ）の手順は、まず（１）の左目用画像全体を圧縮符号化し、その結果を用いた右目用画像の予測画像と実際との差分を、（２）の右目用画像の圧縮対象とする場合を、比較として示している。この手順では、（２）の右目用画像の圧縮符号化に際し、まず左目用画像全体の圧縮符号化の完了を待機し、さらに当該データを用いて予測を行ったり、実際の画像との差分を求めたりする必要がある。その結果、下段に示すように、双方の画像を圧縮符号化し終えるまでに比較的長い時間を要する。

（ｂ）の手順は、左目用画像と右目用画像を接続した１つの画像として扱い、水平方向に分割してなる画像ブロック（１）、（２）、・・・、（ｎ）の単位で圧縮符号化する場合を、比較として示している。この手順では、下段に示すように、一旦圧縮符号化したデータから予測を行ったり差分を求めたりする処理が含まれない分、（ａ）の手順より圧縮符号化に要する時間を短縮できる。ただし予測符号化を用いないため圧縮率は（ａ）より低下する。

（ｃ）の手順は、本実施の形態で上述したように、第１符号化部４４２が左目用画像を、画像ブロック（１−１）、（１−２）、・・・、（１−ｎ）の単位で圧縮符号化し、第２符号化部４４４は、それぞれのデータを用いた右目用画像の予測画像と実際との差分を圧縮することにより、画像ブロック（２−１）、（２−２）、・・・、（２−ｎ）の単位の右目用画像の圧縮符号化データとする場合である。この手順では下段（ｃ）に示すように、右目用画像の画像ブロック（２−１）、（２−２）、・・・、（２−ｎ）の圧縮符号化を、左目用画像の対応する画像ブロック（１−１）、（１−２）、・・・、（１−ｎ）の圧縮符号化の完了直後に開始できる。

また、左目用画像の圧縮符号化時に一度に処理する面積が小さいことと、右目用画像の圧縮符号化時に参照すべき、左目用画像の面積が小さいことから、各画像ブロックの圧縮符号化時間は、（ａ）において画像ブロック当たりに換算した圧縮符号化時間より短くなる。結果として（ｂ）の手順と同程度の短時間で、より高い圧縮率を実現できる。さらにこれまで述べたように、圧縮符号化済みの画像ブロックは順次、パケット化して画像処理装置２００に送信されるため、（ａ）の手順と比較し表示までの遅延を格段に抑えることができる。

なお（ｃ）の手順において、第１符号化部４４２、第２符号化部４４４は機能ブロックとして分けて示しているが、実際には一つの回路やソフトウェアモジュールが２種類の処理を順に実施できる。一方、図の下段に示した（ｃ）’は、第１符号化部４４２と第２符号化部４４４が並列に圧縮符号化を行えるように構成した場合を示している。この場合、第１符号化部４４２が、左目用画像における画像ブロック（１−２）、・・・、（１−ｎ）を圧縮符号化している各期間において、第２符号化部４４４は、右目用画像における一つ前の画像ブロック、すなわち画像ブロック（２−１）、・・・、（２−（ｎ−１））番目の画像ブロックを圧縮符号化する。

これにより、（ｃ）の場合よりさらに、圧縮符号化に要する時間を短縮できる。（ｃ）’’の手順は（ｃ）’の手順の変形例であり、左目用の画像の画像ブロックのうち所定単位の領域を圧縮符号化した時点で、当該データを用いて右目用の画像の対応する領域の圧縮符号化を開始する場合を示している。左目用と右目用の画像では、同じ対象物の像が視差分だけずれた位置に表れるため、原理的には当該ずれ量を見込んだ数画素から数十画素程度の範囲の参照画像があれば、他方の画像の予測符号化が可能である。

また上述のとおり圧縮符号化において動き補償や符号化を行うのに必要な最小単位の領域は、１行、２行など所定数の行の領域や、１６×１６画素、６４×６４画素など所定サイズの矩形領域である。したがって第２符号化部４４４は、参照先として必要な領域の左目用画像の圧縮符号化が第１符号化部４４２において完了した時点で圧縮符号化を開始でき、その最小単位は、動き補償や符号化を行うのに必要な単位領域である。

例えば第１符号化部４４２が、左目用画像の画像ブロックを端から順に圧縮符号化していくケースでは、当該画像ブロック全体の圧縮符号化が完了する前に、第２符号化部４４４が、右目用画像の対応する画像ブロックの圧縮符号化を開始できる。このようにすると、（ｃ）’の場合と比較してさらに圧縮符号化に要する時間を短縮できる。

なお圧縮符号化部４２２は全体として、圧縮符号化に必要な最小単位の領域のデータが用意され次第、圧縮符号化を開始することで、圧縮符号化処理に要する時間を短縮できる。これまでは主に、複数視点の画像の圧縮符号化について述べたが、動画像の各フレームに対応する複数の画像において、視点以外のパラメータが異なっていても、同様の処理により低遅延で高効率の圧縮符号化および転送を実現できる。例えば１つの動画像を圧縮符号化するときに、解像度、画質、フレームレートを異ならせて階層化させ、冗長性を持たせたデータを生成するスケーラブル映像符号化技術において、各階層のデータは類似性が高い。

そのためベース階層の画像を圧縮符号したうえ、他の階層のデータはそれとの差分を表す情報とすることで、より高い圧縮率を実現する。すなわち動画像のデータのうち同じ時刻の同じ像を表す別の画像、または過去のフレームの画像、の少なくともいずれかの圧縮符号化結果を参照して予測符号化を行う。ここで、動画像のデータのうち同じ時刻の同じ像を表す別の画像とは、階層的に定義された異なる解像度や画質を持つ。

例えば、同じ像を表す画像で、解像度が４Ｋ（３８４０×２１６０画素）、ＨＤ（１９２０×１０８０画素）、画質が量子化パラメータ（ＱＰ）でｌｅｖｅｌ０と１といった段階を持つ。ここで、過去のフレームの画像とは、階層的に定義された異なるフレームレートにおける直前のフレームなどを指す。例えば、フレームレートが６０ｆｐｓと３０ｆｐｓといった段階を持つなかで、３０ｆｐｓの階層における直前のフレームとは、すなわち１／３０秒前のフレームを指し、これは６０ｆｐｓの階層においては２フレーム前となる。このような特徴を持つスケーラブル映像符号化技術においても、各階層の圧縮符号化を画像ブロック単位で行ってもよい。

スケーラブル映像符号化としては、例えばＡＶＣ（Ｈ２６４、ＭＰＥＧ−４）の拡張規格であるＳＶＣ（Scalable Video Coding）や、ＨＥＶＣの拡張規格であるＳＨＶＣ（Scalable High Efficiency Video Coding）などが知られており（例えば、木本崇博、「ＭＰＥＧにおけるスケーラブルビデオ符号化の標準化動向」、社団法人情報処理学会研究報告、２００５年、ＡＶＭ−４８（１０）、ｐ．５５−６０参照）、本実施の形態ではそのいずれを採用してもよい。なおベースとなる符号化方式はそのほか、ＶＰ９、ＡＶ１、ＶＶＣなどでもよい。

図２３は、スケーラブル映像符号化を実施する場合の、圧縮符号化部４２２の機能ブロックの構成を示している。その他の機能ブロックは、図２０で示したのと同様である。この場合の圧縮符号化部４２２は、図２０で示した分割部４４０、第１符号化部４４２、第２符号化部４４４に加え、解像度変換部３６０、通信状況取得部４５２、および送信対象調整部３６２を備える。解像度変換部３６０は、画像生成部４２０が生成あるいは取得する動画像の各フレームを段階的に縮小して複数解像度の画像とする。

分割部４４０は、当該複数解像度の画像を、画像平面の共通の境界で分割することにより、画像ブロックを形成する。分割規則は上述したのと同様でよい。第１符号化部４４２は、最も低い解像度の画像を画像ブロック単位で圧縮符号化する。上述のとおりこの際の圧縮符号化は、当該画像のみ、あるいはさらに、同じ解像度の過去フレームの画像における同じ位置の画像ブロックを参照して実施する。

第２符号化部４４４は、第１符号化部４４２が圧縮符号化した結果を利用して、高解像度の画像を画像ブロック単位で圧縮符号化する。図では解像度が２階層のケースを想定し、第１符号化部４４２、第２符号化部４４４の２つを示しているが、解像度を３階層以上とする場合、階層数だけ符号化部を設け、解像度が一段階下の画像の圧縮符号化結果を用いて予測符号化を行う。

この際さらに、同じ解像度の過去フレームの画像における同じ位置の画像ブロックを参照してもよい。またそれらの符号化部においては必要に応じて、フレームレートを調整したり、用いる量子化パラメータを調整したりして、階層間でフレームレートや画質に差を設けてもよい。

例えばフレームレートに階層を設ける場合、圧縮符号化部４２２における処理のフレームレートは、最も高いフレームレート階層のレートとなる。そして過去のフレームを参照先として圧縮符号化する場合、フレームレートによって参照先のフレームが変化する。また画質に階層を設ける場合、第１符号化部４４２が量子化パラメータでベース画質となるＱＰｌｅｖｅｌ０を選択し、第２符号化部４４４やそれより上の第ｎ符号化部側が、より高画質のＱＰｌｅｖｅｌを選択することで実現させる。

例えば解像度がＨＤ、画質がＱＰｌｅｖｅｌ０のベース階層と、解像度が４Ｋ、画質がＱＰｌｅｖｅｌ１の階層があるとき、第１符号化部４４２は前者を、第２符号化部４４４が後者を処理する。さらに解像度が４Ｋ、画質がＱＰｌｅｖｅｌ２の階層があるときは、当該階層の処理を、図示しない第３符号化部が担う。すなわち同じ解像度でもＱＰｌｅｖｅｌが異なる場合は、その分の符号化部を設ける。なお解像度、画質、フレームレートの階層の組み合わせはこれに限らない。

いずれにしろこの場合も、第１符号化部４４２が、最小解像度（最下層）の画像におけるｎ番目（ｎは自然数）の画像ブロックを圧縮符号化している間に、第２符号化部４４４は、その上の階層の画像におけるｎ−１番目の画像ブロックを圧縮符号化する。３階層以上とする場合は、３番目の階層の画像におけるｎ−２番目の画像ブロック、４番目の階層の画像におけるｎ−３番目、・・・というように、各符号化部が、階層が上がるにつれ１つずつ前にずれた画像ブロックの圧縮符号化を並列に実施する。本実施の形態で実現するスケーラブル映像符号化の各パラメータの例を次に示す。

通信状況取得部４５２は、画像処理装置２００との通信状況を所定のレートで取得する。例えば通信状況取得部４５２は、画像データを送信してから画像処理装置２００に到達するまでの遅延時間を、画像処理装置２００からの応答信号に基づき取得するか、画像処理装置２００の集計情報に基づき取得する。あるいは通信状況取得部４５２は、送信済みの画像データのパケットのうち画像処理装置２００に到達したパケットの割合を、データ到達率として画像処理装置２００から取得する。さらに、これらの情報に基づき単位時間当たりに送信できたデータ量、すなわち、利用可能な帯域を取得する。通信状況取得部４５２はこれらの情報の少なくともいずれかを所定のレートで取得することにより、通信状況を監視する。

送信対象調整部３６２は、通信状況に応じて、スケーラブル映像符号化により圧縮符号化された階層データのうち、画像処理装置２００に送信すべき対象を決定する。ここで送信対象調整部３６２は当該階層データのうち、第１符号化部４４２が圧縮符号化した最低解像度の画像のデータを最優先とする。さらに送信対象調整部３６２は通信状況に応じて、送信対象を上位階層方向に拡張するか否かを決定する。例えば利用可能な転送帯域に複数のしきい値を設定し、当該しきい値を超える都度、送信対象を上の階層の画像データに段階的に拡張していく。

逆に、利用可能な転送帯域が最低のしきい値を超えない場合は、最低解像度の画像のデータのみを送信対象とする。あるいはプライオリティ制御を適用し、サーバ４００は、通信状況によらず全ての階層のデータを送信対象としてもよい。この場合、送信対象調整部３６２は通信状況に応じて、各階層に付与する転送優先順位を通信状況に応じて調整する。例えば送信対象調整部３６２は、上位階層のデータの転送優先順位を必要に応じて下げる。ここで転送優先順位は多段階であってよい。

このときパケット化部４２４は、画像のデータとともに付与された転送優先順位を示す情報をパケット化し、通信部４２６から送信する。ただしネットワーク３０６のノードにあるルーターなどにおいて、処理能力を超過する転送が発生した場合に、必要に応じてパケットを破棄してよい。ストリーミング系のデータ転送においては、低遅延化と高転送効率を実現するために、一般にＵＤＰなどのハンドシェイクを省略した転送プロトコルを用いるため、その場合においては、送信したサーバー４００は、ネットワーク３０６の経路の途中でパケットが破棄されたかどうかも関知しない。このときルーターなどは、付与された転送優先順位に基づき、上位階層から順に廃棄対象とする。サーバ４００から複数の画像処理装置２００へ階層化されたデータを同時に送信する場合、各画像処理装置２００が有する復号伸張部２４２の処理能力や、各画像処理装置２００までのネットワークの通信性能は様々である。

送信対象調整部３６２は上述のとおり、各画像処理装置２００の状況に応じて個別に送信対象を決定してもよいが、その場合、複数の通信セッションを別々に調整する必要があり処理負荷が非常に高い。一方、上記プライオリティ制御によれば、サーバ４００は複数の通信セッションに対して同じ条件で対応でき、処理効率を高められる。なお送信対象調整部３６２等は、上述のとおり送信対象自体を制御する態様と、プライオリティ制御を行う態様を組み合わせて実施してもよい。

変形例として、サーバ４００は図示しない中継サーバへ、圧縮符号化された階層データを送信し、当該中継サーバが、複数の画像処理装置２００へ同時にデータ送信するようにしてもよい。この場合、サーバ４００は上記プライオリティ制御により全階層のデータを中継サーバに送信し、中継サーバが、各画像処理装置２００の状況に応じて個別に送信対象を決定し送信してもよい。送信対象調整部３６２はさらに、通信状況および後述する動画像が表す内容の少なくともいずれかに基づいて、（１）各階層が用いるパラメータを変更する、および／または（２）階層関係を変更してよい。

（１）のケースでは、送信対象調整部３６２は例えば、解像度の階層として４Ｋ（３８４０×２１６０画素）の階層があるとき、４Ｋに代わりＷＱＨＤ（２５６０×１４４０画素）の階層とする。なおＷＱＨＤの階層を追加するわけではない。このような変更は、複数ある実現帯域に対するしきい値のうち、高帯域側のしきい値を下回るケースが多いときに実施してもよい。あるいは送信対象調整部３６２は、画質の階層としてＱＰｌｅｖｅｌ１の階層があるとき、ＱＰｌｅｖｅｌ１に代わりＱＰｌｅｖｅｌ２の階層とする。この場合もＱＰｌｅｖｅｌ２の階層を追加するわけではない。

このような変更は、複数ある実現帯域に対するしきい値のうち、高帯域側のしきい値を上回るケースが多いときに実施してもよい。もしくは画像解析の結果、画質を重視すべきシーンであったときに実施してもよい。（２）のケースについては後述する。（１）、（２）のケースにおいて、送信対象調整部３６２は、必要に応じて決定した条件での処理を解像度変換部３６０、第１符号化部４４２、第２符号化部４４４に要求してもよい。調整の根拠とする、動画像が表す内容の具体例は後に述べる。

図２４は、スケーラブル映像符号化を実施する場合の、第１符号化部４４２と第２符号化部４４４が圧縮符号化する画像ブロックと、そのために圧縮符号化結果を参照する画像ブロックの関係を例示している。この例は、解像度の階層が２レベルあり、フレームレートと画質には階層がない場合を想定しており、Ｎを自然数として左がＮフレーム目、右がＮ＋１フレーム目を示している。この場合、第１符号化部４４２は、各フレームのうち低解像度の画像４８０ａ、４８０ｂを、画像ブロック（１−１）、（１−２）、・・・、（１−ｎ）の単位で圧縮符号化する。

第２符号化部４４４は、高解像度の画像４８２ａ、４８２ｂを、画像ブロック（２−１）、（２−２）、・・・、（２−ｎ）の単位で圧縮符号化する。ここで第２符号化部４４４は実線矢印（例えば実線矢印４８４ａ、４８４ｂ）のように、第１符号化部４４２が圧縮符号化した、同じフレームにおける低解像度画像４８０ａ、４８０ｂの対応する位置の画像ブロックのデータを参照先として用い、高解像度画像４８２ａ、４８２ｂの各画像ブロックを圧縮符号化する。

あるいは第２符号化部４４４は、一点鎖線矢印（例えば一点鎖線矢印４８８）のように、Ｎフレーム目の高解像度画像４８２ａにおける画像ブロックの圧縮符号化結果を参照先として用い、１つ後のＮ＋１フレーム目の高解像度画像４８２ｂにおける同じ位置の画像ブロックを圧縮符号化してもよい。または第２符号化部４４４は、実線矢印および一点鎖線矢印で示した参照先の双方を同時に用いて、対象の画像ブロックを圧縮符号化してもよい。

同様に第１符号化部４４２は、破線矢印（例えば破線矢印４８６）のように、Ｎフレーム目の低解像度画像４８０ａにおける画像ブロックの圧縮符号化結果を参照先として用い、Ｎ＋１フレーム目の低解像度画像４８０ｂにおける同じ位置の画像ブロックを圧縮符号化してもよい。図２５も、スケーラブル映像符号化を実施する場合の、第１符号化部４４２と第２符号化部４４４が圧縮符号化する画像ブロックと、そのために圧縮符号化結果を参照する画像ブロックの関係を例示している。

この例は、解像度の階層とフレームレートの階層がともに２レベルある場合を想定している。図の横方向が時間軸であり、左から１フレーム目、２フレーム目、３フレーム目、４フレーム目を示している。図示するように１フレーム目はＩフレーム（イントラフレーム）であり、その他のフレームはＰフレーム（前方予測フレーム）である。ただしフレームの具体的な数を限定する趣旨ではない。

また図の縦方向がフレームレートの階層を示しており、各階層（レベル０、レベル１）に２レベルの解像度の画像があることを示している。また、各画像の左上に、階層の組み合わせを識別するａ〜ｄの符号を付している。フレーム番号とａ〜ｄの符号との組み合わせで各画像を表すと、第１符号化部４４２が圧縮符号化する画像は、１ａ、２ｃ、３ａ、４ｃの順となる。第２符号化部４４４が圧縮符号化する画像は、１ｂ、２ｄ、３ｂ、４ｄの順となる。通信帯域が最も小さい場合に、画像処理装置２００側で表示される画像は１ａ、３ａ、・・・の順となる。通信帯域が最も大きい場合に、画像処理装置２００側で表示される画像は１ｂ、２ｄ、３ｂ、４ｄの順となる。

各符号化部は、上述したように画像ブロックの単位で圧縮符号化する。ここで第２符号化部４４４は、実線矢印（例えば実線矢印５００ａ、５００ｂ）のように、第１符号化部４４２が圧縮符号化した、同じフレームにおける低解像度画像の対応する位置の画像ブロックのデータを参照先として用い、高解像度画像の各画像ブロックを圧縮符号化する。また第１符号化部４４２、第２符号化部４４４は、破線矢印（例えば破線矢印５０２ａ、５０２ｂ）のように、同じフレームレートの階層における同じ解像度の画像の画像ブロックの圧縮符号化結果を参照先として用い、次のフレームの同じ位置の画像ブロックを圧縮符号化してもよい。

また第１符号化部４４２、第２符号化部４４４は、一点鎖線矢印（例えば一点鎖線矢印５０４ａ、５０４ｂ）のように、異なるフレームレートの階層における同じ解像度の画像の画像ブロックの圧縮符号化結果を参照先として用い、次のフレームの同じ位置の画像ブロックを圧縮符号化してもよい。第１符号化部４４２、第２符号化部４４４はこれらの参照先のいずれかを用いて圧縮符号化してもよいし、複数の参照先を同時に用いて圧縮符号化してもよい。

また各画像ブロックの圧縮符号化の処理手順は、図２２に示した（ｃ）、（ｃ）’、および（ｃ）’’のいずれを採用してもよい。具体的には、第１符号化部４４２と第２符号化部４４４が実際には一つの回路またはソフトウェアモジュールであり順番に処理を実施する場合は（ｃ）の手順、第１符号化部４４２と第２符号化部４４４において並列処理が可能な場合は（ｃ）’または（ｃ）’’の手順とする。なお上記（２）のとおり、通信状況および動画像が表す内容の少なくともいずれかに基づいて階層関係を変更するケースでは、送信対象調整部３６２は、解像度・画質・フレームレートの、少なくともいずれかで、階層の数を変更する。または圧縮符号化時の参照先の階層を変更する。例えば送信対象調整部３６２は次のように参照先を変更する。

図２５の場合、例えばフレームレート階層にレベル１とレベル０があり、レベル１はレベル０を毎回参照しているとき、フレームシーケンスは
フレーム１レベル０
フレーム２レベル１（直前レベル０フレーム１を参照)
フレーム３レベル０（直前レベル０フレーム１を参照)
フレーム４レベル１ (直前レベル０フレーム３を参照)
フレーム５レベル０ (直前レベル０フレーム３を参照)
フレーム６レベル１ (直前レベル０フレーム５を参照)
フレーム７レベル０（直前レベル０フレーム５を参照)
・・・
となる。送信対象調整部３６２はこれを変更し、例えば次のようにレベル１間の参照数を増やす。

フレーム１レベル０
フレーム２レベル１（直前レベル０フレーム１を参照)
フレーム３レベル１（直前レベル１フレーム２を参照)
フレーム４レベル０（直前レベル０フレーム１を参照)
フレーム５レベル１（直前レベル０フレーム４を参照)
フレーム６レベル１ (直前レベル１フレーム５を参照)
フレーム７レベル０ (直前レベル０フレーム参照)
・・・
このような変更は、画像処理装置２００へのデータの到達率が、所定のしきい値を上回るケースが多いときに実施してもよい。

以上述べた各フレームに対応する複数の画像の圧縮符号化によれば、動画像の各フレームに対応する複数の画像を、画像データの取得順に応じた規則で画像ブロックに分割し、その単位で圧縮符号化する。この際、ある画像の圧縮符号化結果を用いて、別の画像を圧縮符号化することにより圧縮率を向上させる。これにより、圧縮符号化自体に要する時間を短縮できるうえ、圧縮符号化が完了した画像ブロックから送信が可能になるため、ネットワークを介した画像の配信においても低遅延での画像表示が可能である。

また送信すべきデータのサイズを軽減できるため、通信状況の変化に対し頑健性をもたらす。例えば３つ以上の画像データを送信する態様においても、各画像全体を送信する場合と比較し必要な通信帯域幅を軽減できるとともに、画像ブロック単位でデータが完結しているため通信中にデータが損失してもリカバリが容易である。結果として遅延時間の少ない画像を高い画質で表示させることができる。さらに送信先の画像処理装置の数、通信状況、画像処理装置の処理性能など様々な環境に臨機応変に対応できる。例えばゲーム実況中継（ｅＳｐｏｒｔｓ中継）や、多人数参加のクラウドゲーミングにおいて、高い柔軟性で、高効率、低遅延と画高質を両立できる。

６．データサイズ削減手段の最適化
サーバ４００から画像処理装置２００へ、低遅延で安定的にデータを送信するには、送信対象のデータのサイズを極力小さくすることが望ましい。一方で、表示世界への臨場感や没入感など高いレベルでのユーザ体験を提供するには、解像度やフレームレートをある程度維持したり、圧縮率を上げないようにしたりすることが望ましく、ジレンマが生じる。両者のバランスを好適にとるため、サーバ４００は、画像の内容によって転送データ削減手段を最適化する。

図２６は、データサイズ削減手段を最適化する機能を有するサーバ４００の機能ブロックの構成を示している。サーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を含む。画像生成部４２０、パケット化部４２４、および通信部４２６は、図５、１２で説明したのと同様の機能を有する。ここで画像生成部４２０は、送信対象の動画像をその場で描画する、すなわちそれまで存在していなかった映像を動的に描画する場合があることに留意する。

また各フレームに対応する複数の画像を送信する場合、圧縮符号化部４２２は図２０、２３で示した分割部４４０、第２符号化部４４４、送信対象調整部３６２などをさらに備えてもよい。圧縮符号化部４２２は、画像内容取得部４５０、通信状況取得部４５２、および圧縮符号化処理部４５４を備える。画像内容取得部４５０は、処理対象の動画像が表す内容に係る情報を取得する。

画像内容取得部４５０は例えば、画像生成部４２０が描画している画像の特徴をフレームごと、シーンの切り替わり時、動画像の処理開始時など所定のタイミングで画像生成部４２０から取得する。本実施の形態では基本的に、表示中の動画像をリアルタイムで生成したり取得したりしているため、画像内容取得部４５０はフレームごとなど細かい単位であっても、処理の負荷を増大させることなく内容に係る正確な情報を取得できる。

例えば画像内容取得部４５０は、シーンの切り替えタイミングか否か、フレームに表されている画像テクスチャの種類、特徴点の分布、奥行き情報、オブジェクトの量、３次元グラフィクスに用いているミップマップテクスチャの各レベルの使用量、ＬＯＤ（Level Of Detail）、テッセレーションの各レベルの使用量、文字および記号の量、表されるシーンの種類などの情報を画像生成部４２０から得ることができる。

ここで画像テクスチャの種類とは、画像上でテクスチャにより表現される領域の種類であり、例えばエッジ領域、フラット領域、密度の高い領域、詳細な領域、群衆の領域などである。なおエッジとは、画像上での輝度値の変化の割合が所定値以上の箇所である。特徴点の分布とは、画像平面における特徴点やエッジの位置やエッジの強度、すなわち輝度値の変化の割合などを指す。上述した各種テクスチャ領域は３次元グラフィックスとして描画された結果である２次元画像において、どのようなテクスチャとなっているかを２次元的に判定する。したがって３次元グラフィックス生成に使っているテクスチャとは異なる。

奥行き情報は、各画素が表すオブジェクトまでの距離であり、３次元グラフィクスにおいてはＺ値として得られる。またオブジェクトの量とは、椅子や車など表す対象物の数や画像平面に占める面積を指す。ミップマップテクスチャのレベルとは、オブジェクトの表面を表すテクスチャのデータを複数解像度で準備しておき、オブジェクトの距離、ひいては見かけ上のサイズによって適切な解像度のテクスチャを用いるミップマップの手法において、選択された解像度のレベルである。

ＬＯＤおよびテッセレーションのレベルは、オブジェクトの距離、ひいては見かけ上のサイズに依存してポリゴンの数を調整することにより適切な詳細度で表現する技術における詳細度のレベルである。表されるシーンの種類とは、画像生成部４２０が実施しているゲームなどのコンテンツの出力上の状況やジャンルなどであり、例えばムービー画面、メニュー画面、設定画面、ローディング画面、主観視線描画、俯瞰視線描画、２次元ドット絵ゲーム、３次元描画ゲーム、ファーストパーソン・シューティングゲーム、レースゲーム、スポーツゲーム、アクションゲーム、シミュレーションゲーム、アドベンチャー・ノベルゲームなどの種別を指す。

画像内容取得部４５０は、それらの情報の少なくともいずれかを画像生成部４２０から取得する。なお画像内容取得部４５０および後述するスコアの算出機能は、画像生成部４２０に設けてもよい。具体的には画像生成部４２０で動作するソフトウェアフレームワークであるゲームエンジンなどがそれらの機能を実現してもよい。また画像内容取得部４５０は、画像処理装置２００から送信される、ゲームなど動画像を規定するコンテンツに対するユーザ操作のタイミング、当該タイミングの間隔、ユーザ操作の内容、画像生成部４２０が把握するコンテンツの状況、および当該コンテンツで発生させるオーディオの状況、の少なくともいずれかを取得してもよい。

ユーザ操作のタイミングは、画像生成部４２０における動画像のフレーム描画のタイミングと異なる場合があるため、シーンの切り替わりの検出などに用いることにより、データサイズの調整手段や調整量の切り替えに利用できる。コンテンツの状況とは例えば、ａ）ユーザ操作が必要でコンテンツの処理内容に影響を与えるシーンであるか、ｂ）ユーザ操作が必要ないムービーシーンであるか、ｃ）ユーザ操作が必要ない、ムービーシーン以外のシーンであるか、ｄ）ユーザ操作が必要だがコンテンツの本編でないシーンであるか、の少なくともいずれかを判別する情報を画像生成部４２０から取得する。

これにより、ユーザ操作への応答性を優先するか、画質を優先するか、といった観点でデータサイズの調整手段や調整量を最適化できる。またオーディオの状況とはオーディオの有無、オーディオのチャネル数、バックグランドミュージックの内容、効果音（ＳＥ）の内容、の少なくともいずれかを判別する情報であり、図示しないオーディオ生成装置から取得する。

あるいは画像内容取得部４５０は、画像生成部４２０が生成した画像を自らが解析することにより、上述のような情報の少なくともいずれかを取得してもよい。この場合も、解析処理のタイミングは特に限定されない。さらに画像内容取得部４５０は、サーバ４００が動画像の配信を開始する際などに、その書誌情報を図示しない記憶装置などから読み出すことにより、上述のシーンの種類などを取得してもよい。

画像内容取得部４５０はまた、圧縮符号化処理部４５４が行う圧縮符号化処理において取得した情報を利用して、動画像の内容に係る情報を取得してもよい。例えば圧縮符号化処理において動き補償を実施する場合、オプティカルフローの量、すなわちどの方向に画素が動いているかや、画素領域が動く速さなどが得られる。モーションエスティメーション（ＭＥ）によっても、画像上の矩形領域がどの方向に動いているか、動いている場合はその速度などが得られる。

さらに圧縮符号化処理においては、圧縮符号化処理部４５４が処理に用いる符号化ユニットの割り当て状況や、イントラフレームを挿入するタイミングなども得られる。後者は動画におけるシーンの切り替わりのタイミングを特定する根拠となる。なお画像内容取得部４５０は後述の「シーンの切り替わりタイミングにおけるスコア制御規則」に示したようなパラメータのいずれを取得してもよい。画像内容取得部４５０は、これらの情報の少なくともいずれかを圧縮符号化処理部４５４から取得してもよいし、自らが画像を解析することにより必要な情報を取得してもよい。この場合も取得タイミングは特に限定されない。

通信状況取得部４５２は、図２３で説明したとおり画像処理装置２００との通信状況を所定のレートで取得する。圧縮符号化処理部４５４は、通信状況の変化に応じて、動画像が表す内容に基づき決定した手段により、動画像のデータサイズが適切になるように圧縮符号化する。具体的には圧縮符号化処理部４５４は、動画像のフレームレート、解像度、および量子化パラメータの少なくともいずれかを変化させることにより、通信状況によって定まるデータサイズとなるようにする。基本的には、画像の内容を多角的な観点から評価し、それに対し最適な（フレームレート、解像度、量子化パラメータ）の数値の組み合わせを決定する。

この際、圧縮符号化処理部４５４は、限られた通信帯域や処理リソースの条件下で、ユーザ体験を最良にするために優先すべき事項に基づき、調整対象の手段や調整量を決定する。例えば、像の動きが速く、ユーザ入力に対する即座の連動性も求められる、ファーストパーソン・シューティングのシーンや格闘アクションのシーン、あるいは仮想現実や拡張現実を実現する場合などは、フレームレートを優先することが望ましい。緻密なオブジェクトが多く、文字や記号、標識、ドット絵を読み取ることが必要なシーンでは、解像度を優先することが望ましい。

像の動きが遅いが、絵としてのコントラストやダイナミックレンジが高く、階調表現において圧縮破綻が少なく高画質であることが必要なシーンは、量子化のクオリティを優先することが望ましい。このように画像の内容によって優先すべき事項が異なるため、圧縮符号化処理部４５４はそれを踏まえたうえで、通信状況が悪化してもユーザ体験が可能な限り維持される手段でデータサイズが適切になるようにする。

動画像の内容から調整手段と調整量を決定する規則は、テーブルあるいは計算モデルなどの形式で前もって準備し、圧縮符号化処理部４５４の内部で保持しておく。ただし動画像の内容を示す情報は上述のとおり多岐にわたるため、それらを総合的に見て複数の調整手段を最適化する必要がある。そこで圧縮符号化処理部４５４は、次のような規則の少なくともいずれかにより、調整手段と調整量を決定するためのスコアを導出する。

１．コンテンツの状況に基づくバランスの決定規則
コンテンツの出力上の状況が、上述したａ〜ｄのいずれであるかによって、フレームレート、解像度、および量子化のクオリティに与える重みのバランス（優先順位）を決定する。具体的には、ａ）ユーザ操作が必要でコンテンツの処理内容に影響を与えるシーンの場合、以下に述べるスコアの決定規則の少なくともいずれかに従う。ｂ）ユーザ操作が必要ないムービーシーンの場合は、量子化のクオリティまたは解像度を、フレームレートより優先する。ｃ）ユーザ操作が必要ない、ムービーシーン以外のシーンの場合は、解像度またはフレームレートを量子化のクオリティより優先する。ｄ）ユーザ操作が必要だがコンテンツの本編でないシーンの場合は、解像度または量子化のクオリティをフレームレートより優先する。

２．コンテンツのジャンルに基づくバランスの決定規則
上記ａ、すなわち、ユーザ操作が必要でコンテンツの処理内容に影響を与えるシーンの場合、実施しているコンテンツのジャンルを記憶装置などから読み出し、別途テーブルとして準備した、各ジャンルにて一般的に推奨される解像度、フレームレート、量子化パラメータの重みを表すスコアのバランスを参照する。なお以後述べる複数の規則を並列に適用し、それらの結果を総合判定して最終的に用いるスコアを決定する場合も、本規則を初期値として用いてもよい。

３．画像上の像の大きさに基づくスコア決定規則
ＬＯＤ、ミップマップテクスチャ、テッセレーション、オブジェクトの大きさを参照し、所定値より高精細なオブジェクトがあり、かつ、画像全体においてそれが占める面積の割合が大きい（ビュースクリーンの近くに大きな高精細オブジェクトがある）ほど量子化のクオリティと解像度の重みを表すスコアを高くする。

４．オブジェクトの細かさに基づくスコア決定規則
所定値より小さなオブジェクト、緻密な文字や記号・標識・ドット絵の発生量が多く、画像全体においてそれらが占める面積の割合が所定値より大きい（ビュースクリーンの近くに大きな高精細オブジェクトがない）ほど解像度の重みを表すスコアを高くする。

５．コントラスト、ダイナミックレンジに基づくスコア決定規則
画素値の分布に基づくコントラストや、輝度の分布に基づくダイナミックレンジを参照し、所定基準より高コントラストの領域や高ダイナミックレンジの領域の、画像全体に占める面積の割合が大きいほど、量子化のクオリティの重みを表すスコアを高くする。
６．像の動きに基づくスコア決定規則
オブジェクトの像の移動量、オプティカルフロー、モーションエスティメーションの大きさと量を参照し、移動量が所定値より大きいオブジェクトの量、および画像全体においてそれらが占める面積の割合が大きいほど、フレームレートの重みを表すスコアを高くする。

７．テクスチャの種類に基づくスコア決定規則
画像平面を分割してなる各単位領域の画像テクスチャの種類を集計し、画像全体において密度の高い領域、詳細な領域、群衆の領域の占める面積の割合が大きいほど解像度の重みを表すスコアを高くする。

８．シーンの切り替わりタイミングにおけるスコア制御規則
画像生成部４２０から切り替わりのタイミングについての情報を得る。もしくはオブジェクト量、特徴点、エッジ、オプティカルフロー、モーションエスティメーション、画素コントラスト、輝度のダイナミックレンジ、オーディオの有無、オーディオのチャネル数、オーディオのモードのいずれかが、時系列方向で急変したりリセットされたりしたときにスコアを切り替える。この際、少なくとも２フレーム以上を参照する。なお圧縮符号化処理部４５４は、圧縮符号化においてイントラフレームとするフレームの必要性を把握するため、前フレームとの相関性に基づきシーンの切り替わりを検出することもできる。

このとき従来方式の圧縮符号化処理部４５４による判定のみによらず、上述したスコア決定規則も併用し、切り替わりの検出精度を上げてよい。このようにして検出したシーンの切り替わりにはイントラフレームが必要となり、データサイズがサージ的に増加しやすいため、量子化パラメータと解像度の重みを表すスコアを、対象のフレームおよび後続の所定数のフレームで低減させる。またシーンが速やかに切り替わることを重視し、シーンの切り替わりまではフレームレートの重みを表すスコアを高くし、切り替わり後は当該制約を外してもよい。

９．ユーザ操作のタイミングに基づくスコア決定規則
画像生成部４２０が実施しているゲームなどのコンテンツにおいて、ユーザ操作の間隔が長いほどフレームレートを下げやすいため、フレームレートの重みを表すスコアを低くする（ユーザ操作の間隔が短いほど他のパラメータの重みを表すスコアを低くする）。

１０．ユーザ操作の内容に基づくスコア決定規則
画像生成部４２０が実施しているゲームなどのコンテンツにおいて、直前の所定期間におけるユーザ操作の変化量が大きい場合、ユーザはコンテンツからの高い応答性を期待していると推定される。したがって当該変化量が大きいほど、フレームレートの重みを表すスコアを高くする。操作がなされていても変化量が小さい場合は、当該スコアのレベルを一段階下げる。

なおユーザ操作は、ゲームコントローラ、キーボード、マウスなど図示しない入力装置が取得した入力情報、ヘッドマウントディスプレイ１００の位置、姿勢、動き、ヘッドマウントディスプレイ１００のカメラまたは図示しない外部カメラが撮影した画像を解析した結果に基づくジェスチャ（ハンドサイン）指示、図示しないマイクが取得した音声指示などを画像処理装置２００から取得する。

１１．ユーザの操作対象のオブジェクトに対するスコア決定規則
直前の所定期間においてユーザ操作が反映されると見なされる所定の基準を満たすオブジェクトが画面に存在するとき、他の決定規則により導出されたスコアを引き上げる方向に調整する。ここでユーザは一人でもよいし、同じ画像処理装置２００を共有する、あるいは同じサーバ４００に接続された異なる画像処理装置２００を有する複数人でもよい。ユーザ操作が反映される画面内のオブジェクトとは、ユーザの操作対象である、人、アバター、ロボット、乗り物や機械などのオブジェクトや、そのような主たるオブジェクトと対峙するオブジェクト、ゲームにおけるプレイヤのライフステータス、保有武器ステータス、ゲームスコアなど、プレイヤに情報を通知することが目的のインジケータを含む単位領域など、通常はユーザが最も注目している対象である。

ユーザの操作内容と画面内のオブジェクトとの関連性を示す情報は、原則として画像生成部４２０から取得する。画像内容取得部４５０が当該情報を推測してもよい。そのようなオブジェクトが所定の基準により検出されたら、圧縮符号化処理部４５４は例えば、上記３〜９、１０のスコア決定において、スコアをその他の場合より引き上げる。すなわちこの決定規則は、ユーザの操作対象のオブジェクトについて、優先的に上記決定規則を適用させる作用を持つ。例えば３の、像の大きさに基づく画面全体のスコアの総括により、量子化のクオリティと解像度の重みが高くなる基準スコアに僅かに不足していたら、圧縮符号化処理部４５４は当該基準までスコアを引き上げる。

６の、像の動きに基づく画面全体のスコアの総括により、フレームレートの重みが高くなる基準スコアに僅かに不足していたら、圧縮符号化処理部４５４は当該基準までスコアを引き上げる。８の、シーンの切り替わりタイミングについて、ユーザの操作対象のオブジェクトの領域に急激な変化があったにも関わらず、画面全体のスコアの総括により、イントラフレームを挟むと判定するスコアに僅かに不足していたら、圧縮符号化処理部４５４は当該基準までスコアを引き上げる。

１２．調整対象と調整量の切り替え頻度の制御
直前の所定期間に採用された（フレームレート、解像度、量子化パラメータ）の履歴を参照し、ユーザ体験の観点から切り替えが許容範囲となるように、各パラメータの重みを表すスコアを調整する。「許容範囲」は、あらかじめ定義したテーブルやモデルに基づいて決定する。

圧縮符号化処理部４５４は、以上の規則のうちいずれかにより、あるいは複数の規則で得られたスコアの合計値により、フレームレート、解像度、量子化パラメータの最終的な重みを総合的に決定する。なお圧縮符号化処理部４５４は、上記１〜８の規則において、オブジェクトの位置、投影される順序、大きさ、ビュースクリーンからの相対距離を把握するためにＺ値を参照してもよい。

なお上述した決定規則はそれ自体を最適化していくことが望ましい。そこで、過去の様々なケースにおける調整結果を収集しながら、機械学習または深層学習によって決定規則を最適化していってもよい。ここで機械学習を行う場合、最適化の対象は決定規則を定義したテーブルでもよいし計算モデルでもよい。深層学習の場合は、計算モデルを最適化する。

これらの学習技術においては、例えば、人手によって作成されたスコアデータベースや、ユーザによるゲームプレイ体感などを教師データとする。また主観描画のケースを計算モデルの制約条件としたり、画質を示すＰＳＮＲ（Peak Signal-to-Noise Ratio）やＳＳＩＭ(Structural Similarity)、パラメータ切り替え頻度、時系列スムースネスなどを指標としたりして学習させる。この例でパラメータの切り替え頻度は、解像度やフレームレートを小刻みに切り替え過ぎるとユーザ体験が却って悪化することを考慮して指標に加えている。

このようにして圧縮符号化処理部４５４はフレームレート、解像度、および量子化のクオリティのそれぞれに与える重みを表す最終的なスコアを導出し、記通信状況に応じたデータサイズが得られ、かつ前記スコアが表すバランスに従うように、（フレームレート、解像度、量子化パラメータ）の値の組み合わせを決定する。より具体的には圧縮符号化処理部４５４は、通信状況に応じて決定した、目標とするデータサイズを満たすように各値の組み合わせを予測計算するが、その際に重みが高いパラメータをできるだけ下げないように制御する。

最適な組み合わせを決定したら、圧縮符号化処理部４５４は、それに応じてデータを圧縮符号化する。例えばフレームレートを低下させる場合、圧縮符号化処理部４５４は画像生成部４２０が生成したフレームを、単位時間当たり所定量だけ間引く。解像度を低下させる場合、圧縮符号化処理部４５４は画像生成部４２０が生成した画像に対し、ニアレストネイバー法、バイリニア法、バイキュービック法など既存の演算を施す。

また圧縮符号化処理部４５４は、調整された量子化パラメータにより、画像生成部４２０が生成した画像を適切な圧縮率で圧縮符号化する。圧縮符号化処理部４５４は、これらの処理をいずれも、画像生成部４２０が生成したフレームの部分画像単位で実施し、パケット化部４２４に順次供給する。この際、そのフレームレート、解像度、量子化パラメータのデータを対応づけて供給することにより、パケット化部４２４はそれらのデータとともに部分画像のデータをパケット化する。

これにより、これまで述べたのと同様に、圧縮符号化された部分画像のデータが通信部４２６を介して画像処理装置２００に送信される。なお圧縮符号化処理部４５４がデータサイズの調整手段や調整量を適正化する単位は、圧縮符号化の単位である部分画像の単位でもよいし、１フレーム単位や、所定数のフレーム単位などでもよい。画像処理装置２００の復号伸張部２４２は、画像データとともに送信された量子化パラメータに基づき逆量子化を行う。

また解像度やフレームレートが本来の値より低減されている場合は、接続された表示装置の画面サイズに合致したサイズとしたり、同じフレームを数回出力したりして画像を表示させる。このような、解像度やフレームレートの変化に応じた表示処理の手順には一般的な技術を用いることができる。なおサーバ４００の圧縮符号化部４２２が解像度を低下させた場合、サーバ４００からは、当該低解像度の画像のみでは特定不能な付加データを一緒に送信してもよい。

ここで付加データとは例えば、画像生成部４２０が生成した元の画像における特徴量や、圧縮符号化部４２２が圧縮符号化時に決定した各種パラメータを含む。特徴量は、元の画像の特徴点、エッジ強度、元の画像に含まれる各画素の奥行き、テクスチャの種類、オプティカルフロー、モーションエスティメーションの情報の少なくともいずれかを含んでよい。あるいは付加データは、圧縮符号化部４２２が実施した物体認識処理により特定された、元の画像が表す物体を示すデータを含んでもよい。この場合、画像処理装置２００の復号伸張部２４２は、送信された画像データと付加データに基づいて、解像度の高い表示画像を正確に生成する。なおこの特徴は、特願２０１９−０８６２８６号として本発明者により出願されている。

図２７〜３１は、動画像の内容に応じてスコアを決定する事例を示している。図２７は上記３の、画像上の像の大きさに基づくスコア決定規則を適用する例を示している。図示する３つの画像は、同じ動画像の異なるフレームを表している。どのフレームにおいても、同じオブジェクトモデルを用いたオブジェクト１５２ａ、１５２ｂ、１５２ｃが描画されている。オブジェクトモデルは実際には、ポリゴンとテクスチャで構成される３次元の情報を有する。

画像生成部４２０は、オブジェクトモデルを描画対象の空間に配置し、それをビュースクリーンに射影することでオブジェクト１５２ａ、１５２ｂ、１５２ｃなどを描画する。この際、ビュースクリーンからの距離によって、オブジェクト１５２ａ、１５２ｂ、１５２ｃの見かけ上のサイズが変化するため、画像生成部４２０は適宜、描画に用いるポリゴンの数やテクスチャの解像度を調整する。

例えばオブジェクトモデル１５０が１００万個のポリゴンで定義されているのに対し、ビュースクリーンから離れているオブジェクト１５２ｃは１万個のポリゴンで、ビュースクリーンの近くにいるオブジェクト１５２ａは１０万個のポリゴンで、それぞれ描画される。またテクスチャの解像度はオブジェクト１５２ａ＞オブジェクト１５２ｂ＞オブジェクト１５２ｃとなる。画像内容取得部４５０はそのような情報、すなわちビュースクリーンから見たオブジェクトのＬＯＤ、ミップマップテクスチャのレベル、テッセレーションのレベル、像の大きさなどを、画像が表す内容に係る情報として画像生成部４２０から取得する。

そして圧縮符号化処理部４５４は、通信状況に対応するデータサイズとするため、当該画像が表す内容に係る情報に基づきフレームレート、解像度、量子化パラメータを調整する。すなわちシーンに登場する全オブジェクトについて、オブジェクトのＬＯＤ、ミップマップテクスチャのレベル、テッセレーションのレベルと、像のサイズを集計し、調整対象のパラメータに与えるスコアを計算する。図示する例では左の画像ほど、高精細に描かれたオブジェクトがあり、かつ画像全体における当該オブジェクトの占める面積の割合が大きい（全体として人やアバターが高精細に描画されている）ため、量子化のクオリティと解像度の重みを表すスコアを高くする。

図２８は上記４の、オブジェクトの細かさに基づくスコア決定規則を適用する例を示している。図示する２つの画像は、同じ動画像の異なるフレームを表している。それぞれは、同じ風景をズームイン・ズームアウトしたフレームである。画像が表す内容としてオブジェクトの像の大きさと量を集計すると、左の画像ほど小さなオブジェクトの量が多く、かつ画像全体においてそれらが占める面積の割合が大きい（全体として緻密なオブジェクト、文字や記号、標識、ドット絵が多い）。したがってこの例では圧縮符号化処理部４５４は、左の画像ほど解像度の重みを表すスコアを高くする。

図２９は上記５の、コントラスト、ダイナミックレンジに基づくスコア決定規則を適用する例を示している。画像が表す内容として、画像平面を所定サイズに分割してなる単位領域ごとのコントラストやダイナミックレンジを集計すると、左の画像ほど画像全体に占める高コントラストあるいは高ダイナミックレンジの領域の面積が大きい。したがってこの例では圧縮符号化処理部４５４は、左の画像ほど量子化のクオリティの重みを表すスコアを高くする。

図３０は上記６の、像の動きに基づくスコア決定規則を適用する例を示している。図示する２つの画像は、同じ動画像の異なるフレームを表している。画像が表す内容として、画像平面でのオブジェクトの移動量（ベクトル）の絶対値や、画像平面を所定サイズに分割してなる単位領域ごとのオプティカルフローやモーションエスティメーションの大きさと量を集計する。すると動きの大きいオブジェクト１５２ｄ〜１５２ｇの存在により、左の画像ほど移動量が大きいオブジェクトが多く、かつ画像全体における面積の割合が大きい、すなわち画像全体における移動量（ベクトル）の絶対値の合計が大きい。したがってこの例では圧縮符号化処理部４５４は、左の画像ほどフレームレートの重みを表すスコアを高くする。

図３１は上記７の、テクスチャの種類に基づくスコア決定規則を適用する例を示している。図示する２つの画像は、同じ動画像の異なるフレームを表している。画像が表す内容として、画像平面を所定サイズに分割してなる単位領域ごとの画像テクスチャの種類を集計すると、オブジェクト１５２ｈ〜１５２ｊとオブジェクト１５２ｋの差により、左の画像ほど画像全体における密度の高い領域、詳細な領域、群衆の領域の占める面積の割合が大きい。したがってこの例では圧縮符号化処理部４５４は、左の画像ほど解像度の重みを表すスコアを高くする。

図３２は、サーバ４００が通信状況に応じてデータサイズを調整する処理手順を示すフローチャートである。このフローチャートは、ユーザが画像処理装置２００に対し、プレイしたいゲームや鑑賞したい動画などを選択することによって開始される。これに対しサーバ４００の通信状況取得部４５２は、画像処理装置２００へのストリーミングに用いる通信の状況取得を開始する（Ｓ５０）。

通信状況は上述のとおり、画像処理装置２００との信号送受によって判明するため、通信状況取得部４５２は通信部４２６から必要な情報を取得する。具体的には通信状況取得部４５２は、画像処理装置２００へ送信した画像データの到達遅延時間や、画像データの到達率を取得し、それらの情報から、通信状況を表す指標を導出する。導出規則については前もって設定しておく。一方、画像生成部４２０は、動画像の生成を開始する（Ｓ５２）。ただし画像生成部４２０は、コンピュータグラフィクスを描画するのに限らず、撮影画像をカメラから取得してもよい。

一方、圧縮符号化部４２２の画像内容取得部４５０は、動画像の内容に係る情報の取得を開始する（Ｓ５４）。上述のとおり画像内容取得部４５０は、画像生成部４２０、圧縮符号化処理部４５４から情報を取得したり、自らが画像を解析したりすることにより、所定の情報を任意のタイミングで取得する。次に圧縮符号化処理部４５４は、通信状況取得部４５２が取得した直近の通信状況に応じて、画像データの送信サイズを決定する（Ｓ５６）。

そして圧縮符号化処理部４５４はまず、その時点で画像内容取得部４５０が取得している動画像の内容から、上述した規則の少なくともいずれかに従いスコアを取得する（Ｓ５８）。次に圧縮符号化処理部４５４は、得られたスコアに基づき、データサイズの調整手段や調整量を導出する（Ｓ６０）。すなわちスコアを合計するなどして、フレームレート、解像度、量子化パラメータに対する総合的な重みを算出し、当該重みに従うバランスで、目標とするデータサイズに合うように各パラメータの値を決定する。

動画像の内容を示すパラメータからスコアを得る手段、および、スコアから調整手段や調整量を導出する手段は、それぞれの対応づけを表すテーブルを準備してもよいし、導出規則をモデル化しプログラムなどで実現してもよい。この際、通信状況のレベルによって、調整手段や調整量が変化するようにしてもよい。なお通信状況が安定しており、送信可能なデータサイズが変化しない場合も、圧縮符号化処理部４５４は動画像の内容に対応するスコアを継続して導出し、送信サイズは同じであってもフレームレート、解像度、量子化パラメータの各値の組み合わせを変化させてもよい。

異常状態を除き送信を継続できる間は通信状況に特定のしきい値を設けず、通信状況に合わせてデータの送信サイズを多段階で決定し、それに合わせてフレームレート、解像度、量子化パラメータの組み合わせを調整する。また上述のとおり、導出規則を定義するテーブルや計算モデルは、機械学習や深層学習を用いて随時最適化していってもよい。なお図示する手順では、Ｓ５８で動画の内容からスコア値を取得し、それに基づきＳ６０で調整手段や調整量を求める２段階の処理としたが、動画の内容から直接、調整手段や調整量が求められるように決定規則を準備してもよい。

圧縮符号化処理部４５４はこのようにして決定した調整手段や調整量によって、データサイズを調整しながら部分画像単位で圧縮符号化を行い、当該画像のデータを、順次パケット化部４２４に供給する（Ｓ６２）。この際、解像度、フレームレート、量子化パラメータの情報も対応づけて供給する。パケット化部４２４はそれをパケット化し、通信部４２６から画像処理装置２００に送信する。なお圧縮符号化処理部４５４は、スコアの取得と調整手段や調整量の導出を、圧縮符号化処理のバックグラウンドで行ってもよい。また実際には、Ｓ５６におけるデータサイズの決定頻度と、Ｓ６２における部分画像単位での圧縮符号化および送信の頻度は、同じであっても異なっていてもよい。

これにより圧縮符号化処理部４５４は、データサイズの調整に用いる手段および調整量を、所定の時間間隔で再設定してもよい。画像処理装置２００に対するユーザ操作などにより、画像の送信を停止する必要がなければ（Ｓ６４のＮ）、後続のフレームについて、必要に応じて調整手段や調整量を変化させながら圧縮符号化と送信の処理を繰り返す（Ｓ５６、Ｓ５８、Ｓ６０、Ｓ６２）。ただし上記１１のように圧縮符号化処理部４５４は、直前の所定期間における調整手段や調整量の変化の履歴を参照したうえ、ユーザ体験が悪化しないような許容範囲内で調整する。画像の送信を停止する必要が生じたら、サーバ４００は全ての処理を終了させる（Ｓ６４のＹ）。

以上述べた、データサイズ削減手段の最適化によれば、サーバ４００から画像処理装置２００へのストリーミングに用いる通信の状況に応じて、送信している動画像が表す内容に係る情報に適した手段および量で、画像のデータサイズを調整する。ここで、解像度、フレームレート、量子化パラメータといった複数の調整手段の組み合わせで調整を行うことにより、１つのパラメータのみを調整するより、とり得る状態変化のバリエーションを格段に増やすことができる。結果として、可能な限りユーザが許容できる範囲での画質の劣化に抑えることができる。

また動画像の内容に係る情報として、リアルタイムで画像を生成している画像生成部や、圧縮符号化している圧縮符号化処理部から情報を得ることにより、より正確かつ詳細なデータに基づき対策を講じることができる。ここで画像生成部や圧縮符号化処理部は通常の処理を行っていればよいため、処理の負荷を増大させることなく、各時点で最適な方法でデータサイズの調整を行える。

７．領域ごとの圧縮率制御
７−１．動画像が表す内容に基づく制御
上記６では、動画像が表す内容に係る各種情報に基づき、フレームを最小単位として解像度、フレームレート、量子化パラメータの組み合わせを調整することによりデータサイズを制御した。一方、表示された画像中でユーザが注目している領域は限定されるため、当該領域により多くの通信帯域を割り当てることにより、同じ条件下でもユーザの体感画質を向上させることができる。

図３３は、動画像が表す内容に基づき、フレーム上の領域によって圧縮率を変化させる機能を有するサーバ４００の機能ブロックの構成を示している。サーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を含む。画像生成部４２０、パケット化部４２４、および通信部４２６は、図５、１６、２４で説明したのと同様の機能を有する。上述のとおり画像生成部４２０は、送信対象の動画像をその場で描画する、すなわちそれまで存在していなかった映像を動的に描画する場合があることに留意する。

また各フレームに対応する複数の画像を送信する場合、圧縮符号化部４２２は図２０、２３で示した分割部４４０、第２符号化部４４４、送信対象調整部３６２などをさらに備えてもよい。圧縮符号化部４２２は、画像内容取得部４５０、注目度推定部４６０、通信状況取得部４６２、および圧縮符号化処理部４６４を備える。画像内容取得部４５０は図２６で説明したように、処理対象の動画像が表す内容に係る情報を、画像処理装置２００、画像生成部４２０、圧縮符号化処理部４６４から取得するか、自らが画像解析を行うことにより取得する。

注目度推定部４６０は、動画像が表す内容に係る情報に基づき、動画像のフレーム平面を分割してなる単位領域ごとに、表される内容に応じたユーザの注目度を推定する。ここで注目度は、ユーザが注目している度合いを示す数値などの指標である。例えば主たるオブジェクトが写っている領域や、文字が表されている領域などを含む単位領域については高い注目度が推定される。このため画像内容取得部４５０は、図２６について例示した動画像の内容に係る情報に加え、画像に表されるオブジェクトの種類やその位置に係る情報も取得してよい。

当該情報は、画像内容取得部４５０自らが画像認識処理を実行することにより取得してもよいし、画像生成部４２０などから画像描画の結果として通知を受けてもよい。前者の場合、画像内容取得部４５０は、取得済みのオプティカルフロー、モーションエスティメーション、符号化ユニットの割り当て状況、シーンの切り替わりのタイミングか否か、フレームに表されている画像テクスチャの種類、特徴点の分布、奥行き情報などの少なくともいずれかを利用して画像認識を行ったり、認識したオブジェクトの注目度を推定したりしてよい。

通信状況取得部４６２は、図２３、２６の通信状況取得部４５２と同様の機能を有する。圧縮符号化処理部４６４は、注目度推定部４６０が推定した注目度の分布に基づき、画像平面で圧縮率を異ならせたうえ画像データを圧縮符号化する。この際、圧縮符号化処理部４６４は、注目度、データ伝送に用いることのできる通信帯域幅、フレームレート、および解像度の組み合わせに基づき、フレーム平面における圧縮率、ひいては量子化パラメータの分布を決定する。

圧縮符号化処理部４６４は定性的には、高い注目度が推定される単位量域については量子化パラメータの値を下げることにより圧縮率を下げ、より多くのビットレートを割り当てる。ただし推定される注目度の高さのみを基準として量子化パラメータを決定すると、利用できる通信帯域に対し必要以上に圧縮してしまったり、圧縮が不十分であったりすることが起こり得る。

そこで上述のとおり圧縮符号化処理部４６４は、フレームレート、および解像度を加味したうえで、フレーム全体のデータサイズが、利用できる通信帯域に見合うように、画像平面における圧縮率の分布を決定する。ただし圧縮符号化処理部４６４はこれまで述べたように、画像生成部４２０が生成したフレームの部分画像単位で圧縮符号化を実施する。ここで部分画像は、例えば注目度を推定する単位領域の整数倍の大きさとする。圧縮符号化処理部４６４は、単位領域ごとに量子化パラメータを決定し、部分画像が内包する単位領域ごとに、決定した量子化パラメータを用いて圧縮符号化する。この際、圧縮符号化処理部４６４は、部分画像ごとに合計のデータサイズを把握する。

圧縮符号化処理部４６４は、そのようにして圧縮符号化した部分画像のデータを、パケット化部４２４に順次供給する。この際、当該部分画像の単位領域に適用した量子化パラメータを対応づけて供給することにより、パケット化部４２４はそれらのデータとともに部分画像のデータをパケット化する。これにより、これまで述べたのと同様に、圧縮符号化された部分画像のデータが通信部４２６を介して画像処理装置２００に送信される。画像処理装置２００の復号伸張部２４２は、画像データとともに送信された量子化パラメータに基づき逆量子化を行う。

図３４は、注目度推定部４６０が画像平面における注目度の分布を推定する処理を説明するための図である。画像１６０は動画像のデータのうち、あるフレームを表している。画像１６０にはオブジェクト１６２ａ、１６２ｂやＧＵＩ１６２ｃが表されている。注目度推定部４６０は当該画像平面を、破線で示すように縦横双方向に所定間隔で区切ることにより単位領域（例えば単位領域１６４）を形成する。そして各単位領域に対し、注目度を推定する。

図では、一点鎖線で囲まれた、オブジェクト１６２ａ、１６２ｂが表される単位領域の集合１６６ａ、１６６ｂに対し、他の単位領域より高い注目度が推定されることを示している。ただし実際には、より多くのオブジェクトが表されていることを踏まえ、上記「６．データサイズ削減手段の最適化」において例示したような様々な情報に基づき注目度を推定する。また注目度は０または１、すなわち注目されていないか注目されているかの２値でもよいし、より多くの階調で表してもよい。例えば注目度推定部４６０は、次のような規則の少なくともいずれかにより、注目度を表すスコアを導出し、その合計によって単位領域ごとの注目度を総合的に決定してもよい。

１．オブジェクトの重要性に基づくスコア決定規則
ユーザの操作対象である、人、アバター、ロボット、乗り物や機械などのオブジェクトや、そのような主たるオブジェクトと対峙するオブジェクト、ゲームにおけるプレイヤのライフステータス、保有武器ステータス、ゲームスコアなど、プレイヤに情報を通知することが目的のインジケータを含む単位領域など、重要性の高さに対する条件を満たすオブジェクトを含む単位領域を他より高いスコアとする。それらのオブジェクトは、画像内容取得部４５０が、画像生成部４２０から情報を得るか、画像認識で特定したオブジェクトとユーザ操作との連動性から推定する。なおユーザは一人でもよいし、同じ画像処理装置２００を共有する、あるいは同じサーバ４００に接続された異なる画像処理装置２００を有する複数人でもよい。

２．オブジェクトの像の面積割合に基づくスコア決定規則
人や、それに類する特徴を有するアバター、ロボットなどのオブジェクトが画像全体に占める面積の割合が大きいほど、それを含む単位領域を他より高いスコアとする。それらのオブジェクトは、画像内容取得部４５０が、画像生成部４２０から情報を得るか、画像認識で特定する。画像認識においては一般的な顔検出アルゴリズムなどを用いてよい。例えば、目鼻口の特徴量を示す位置が、Ｔ字型で相対的に位置する箇所を画像内から検索することで顔を検出する。

３．提示内容に基づくスコア決定規則
ゲームにおけるプレイヤのライフステータス、保有武器ステータス、ゲームスコアなど、プレイヤに情報を通知することが目的のインジケータを含む単位領域を他より高スコアとする。当該インジケータは、画像内容取得部４５０が、画像生成部４２０から情報を得るか、画像認識で特定する。

４．オブジェクトの細かさに基づくスコア決定規則
緻密名文字、記号、標識、ドット絵などのオブジェクトが画像全体に占める面積の割合が小さい場合、それらを含む単位領域を他より高いスコアとする。当該オブジェクトは画像内容取得部４５０が、画像生成部４２０から情報を得るか、画像認識で特定する。

５．画像上の像の大きさに基づくスコア決定規則
ＬＯＤ、ミップマップテクスチャ、テッセレーション、オブジェクトの大きさを参照し、所定値より高精細なオブジェクトがあり、かつ、画像全体においてそれが占める面積の割合が大きい（ビュースクリーンの近くに大きな高精細オブジェクトがある）ほど、当該オブジェクトを含む単位領域を他より高いスコアとする。

６．コントラスト、ダイナミックレンジに基づくスコア決定規則
画素値の分布に基づくコントラストや、輝度の分布に基づくダイナミックレンジを参照し、コントラストあるいはダイナミックレンジが高い単位領域ほどを高スコアとする。
７．像の動きに基づくスコア決定規則
オブジェクトの像の移動量、オプティカルフロー、モーションエスティメーションの大きさと量を参照し、移動量が所定値より大きいオブジェクトが多く、かつ画像全体においてそれらが占める面積の割合が大きい単位領域ほどを高スコアとする。

８．テクスチャの種類に基づくスコア決定規則
各単位領域の画像テクスチャの種類を集計し、画像全体において密度の高い領域、詳細な領域、群衆の領域の占める面積の割合が大きいとき、当該テクスチャを含む単位領域を他より高いスコアとする。

９．シーンの切り替わりタイミングにおけるスコア制御規則
画像生成部４２０から切り替わりのタイミングについての情報を得る。もしくはオブジェクト量、特徴点、エッジ、オプティカルフロー、モーションエスティメーション、画素コントラスト、輝度のダイナミックレンジ、オーディオの有無、オーディオのチャネル数、オーディオのモードのいずれかが、時系列方向で急変したりリセットされたりしたときにスコアを切り替える。この際、少なくとも２フレーム以上を参照する。なお圧縮符号化処理部４５４は、圧縮符号化においてイントラフレームとするフレームの必要性を把握するため、前フレームとの相関性に基づきシーンの切り替わりを検出することもできる。

このとき従来方式の圧縮符号化処理部４５４による判定のみによらず、上述したスコア決定規則も併用し、切り替わりの検出精度を上げてよい。シーンの切り替わりでないと判定されたとき、それまでのフレームについて、他のスコア決定規則に基づいて設定された、高スコアの単位領域のスコアをさらに高くする。シーンの切り替わりであると判定されたときは、高スコアとされていた単位領域のスコアを一旦、リセットする。検出したシーンの切り替わりにはイントラフレームが必要となり、データサイズがサージ的に増加しやすいため、対象のフレームおよび後続の所定数のフレームで、全ての単位領域の合計スコアを低減させる。

１０．ユーザ操作の内容に基づくスコア決定規則
画像生成部４２０が実施しているゲームなどのコンテンツにおいて、直前の所定期間におけるユーザ操作の変化量が所定値以上のとき、ユーザはコンテンツからの高い応答性を期待しており、注目領域があると推定される。したがって他のスコア決定規則により所定値以上のスコアが与えられている単位領域のスコアをさらに増幅させる。操作がなされていても変化量が小さい場合は、当該スコアのレベルを、増幅結果より一段階下げる。なおユーザ操作は、ゲームコントローラ、キーボード、マウスなど図示しない入力装置が取得した入力情報、ヘッドマウントディスプレイ１００の位置、姿勢、動き、ヘッドマウントディスプレイ１００のカメラまたは図示しない外部カメラが撮影した画像を解析した結果に基づくジェスチャ（ハンドサイン）指示、図示しないマイクが取得した音声指示などを画像処理装置２００から取得する。

１１．圧縮率の分布の切り替え頻度の制御
直前の所定期間に決定した注目度の履歴を参照し、ユーザ体験の観点から切り替えが許容範囲となるようにスコアを調整する。「許容範囲」は、あらかじめ定義したテーブルやモデルに基づいて決定する。

注目度推定部４６０は、以上の規則のうちいずれかにより、あるいは複数の規則で得られたスコアの合計値により、各単位領域の注目度を総合的に決定する。なお圧縮符号化処理部４５４は、上記１〜９の規則において、オブジェクトの位置、投影される順序、大きさ、ビュースクリーンからの相対距離を把握するためにＺ値を参照してもよい。なお上述した決定規則は、テーブルあるいは計算モデルなどの形式で前もって準備し、注目度推定部４６０の内部で保持しておく。

圧縮符号化処理部４６４は、このようにして推定された注目度の分布に基づき、各単位領域の圧縮率（量子化パラメータ）を決定する。例えば図示する例で、単位領域１行分を部分画像とした場合、注目度が高いと判定された単位領域がない最上段の部分画像１６８ａと最下段の部分画像１６８ｂは、それ以外の中間部分の部分画像より圧縮率を高くする。さらに、オブジェクト１６２ｂよりオブジェクト１６２ａの方が注目度が高い場合、オブジェクト１６２ｂが表された単位領域の集合１６６ｂは、単位領域の集合１６６ａより圧縮率を高くすることも考えられる。

いずれにしろ圧縮符号化処理部４６４は、部分画像単位、１フレーム単位、所定数のフレーム単位、所定の時間間隔、のいずれかで、圧縮率の分布を更新することにより、データサイズが最新の通信状況に合うようにする。例えば利用可能な通信帯域幅、解像度、フレームレートが同じであれば、注目度が高いと推定される単位領域が多いほど、注目領域と非注目領域の間で圧縮率の差を小さくする。このような調整は、注目度の高さに応じて、単位領域の集合１６６ａ、１６６ｂごとに個別に行ってもよい。場合によっては一部の単位領域の集合（例えば単位領域の集合１６６ｂ）を、判定された注目度の優先順位に基づいて、圧縮率を下げる対象から除外してもよい。

さらに、利用可能な通信帯域幅が同じなかで、解像度やフレームレートが高ければ、全体的に圧縮率を上げたり、注目領域と非注目領域の間で圧縮率の差を小さくしたりすることによりフレームごとのデータサイズを調整し、ビットレートを適正化する。送信対象は部分画像単位である一方、データサイズの制御は、部分画像単位、１フレーム単位、および所定数のフレーム単位、所定の時間単位、のいずれでもよい。各単位領域の注目度、利用できる通信帯域幅、フレームレート、および解像度の組み合わせに基づき、量子化パラメータの分布を決定するための規則は、テーブルあるいは計算モデルなどの形式で前もって準備しておく。

ただし動画像の内容を示す情報は上述のとおり多岐にわたるため、それらを総合的に見て最適な量子化パラメータを決定するためには、決定規則自体を最適化していくことが望ましい。そこで上記「６．データサイズ削減手段の最適化」について説明したのと同様、過去の様々なケースにおける調整結果を収集しながら、機械学習または深層学習によって決定規則を最適化していってもよい。

図３５は、サーバ４００が画像平面の領域ごとに圧縮率を制御する処理手順を示すフローチャートである。このフローチャートは、ユーザが画像処理装置２００に対し、プレイしたいゲームや鑑賞したい動画などを選択することによって開始される。これに対しサーバ４００の通信状況取得部４６２は、画像処理装置２００へのストリーミングに用いる通信の状況取得を開始する（Ｓ７０）。通信状況は上述のとおり、画像処理装置２００との信号送受によって判明するため、通信状況取得部４６２は通信部４２６から必要な情報を取得する。

また画像生成部４２０は、対応する動画像の生成を開始する（Ｓ７２）。ただし画像生成部４２０は、コンピュータグラフィクスを描画するのに限らず、撮影画像をカメラから取得してもよい。一方、圧縮符号化部４２２の画像内容取得部４５０は、動画像の内容に係る情報の取得を開始する（Ｓ７３）。次に圧縮符号化処理部４６４は、通信状況取得部４６２が取得した直近の通信状況に応じて、画像データの送信サイズを決定する（Ｓ７４）。そして圧縮符号化部４２２の注目度推定部４６０は、動画像の内容に係る情報に基づき、処理対象のフレームに対し注目度の分布を推定する（Ｓ７５）。すなわちフレームの平面を単位領域に分割し、それぞれについて注目度を導出する。

注目度の導出には、上述した規則の少なくともいずれかに従いスコアを取得できるテーブルを参照するか、計算モデルを利用する。そして様々な観点から得られたスコアを合算して、最終的な注目度を単位領域ごとに求める。圧縮符号化処理部４６４は、注目度の分布に基づき量子化パラメータの分布を決定する（Ｓ７６）。上述のとおり量子化パラメータは、注目度のほか、利用できる通信帯域幅、解像度、フレームレートを考慮して決定する。

圧縮符号化処理部４６４は、テーブルを参照したり、計算モデルを利用したりして、それらのパラメータから適切な量子化パラメータの分布を導出する。そして圧縮符号化処理部４６４は、決定した量子化パラメータを用いて部分画像に内包される単位領域を圧縮符号化していき、順次パケット化部４２４に供給することにより、通信部４２６が画像処理装置２００に送信する（Ｓ８０）。

圧縮符号化処理部４６４は処理対象のフレームについて、全ての部分画像のデータの圧縮符号化および送信を繰り返す（Ｓ８２のＮ、Ｓ８０）。画像処理装置２００に対するユーザ操作などにより、画像の送信を停止する必要がなければ（Ｓ８４のＮ）、後続のフレームについてもデータサイズの決定、注目度分布の推定、量子化パラメータ分布の決定、部分画像の圧縮符号化および送信を繰り返す（Ｓ８４のＮ、Ｓ７４、Ｓ７５、Ｓ７６、Ｓ８０、Ｓ８２）。

なお実際には、部分画像単位のパイプライン処理となるため、前のフレームの部分画像の圧縮符号化や送信処理の間に、次のフレームの注目度分布推定や量子化パラメータの分布決定を行える。また実際には、Ｓ７４におけるデータサイズの決定頻度と、Ｓ８０における部分画像単位での圧縮符号化および送信の頻度は、同じであっても異なっていてもよい。画像の送信を停止する必要が生じたら、サーバ４００は全ての処理を終了させる（Ｓ８４のＹ）。

以上述べた、動画像が表す内容に基づく領域ごとの圧縮率制御によれば、サーバ４００は、動画像が表す内容に基づきユーザの注目度を単位領域ごとに推定する。そして注目度が高いほど圧縮率が低くなるように量子化パラメータの分布を決定したうえ圧縮符号化し画像処理装置２００に送信する。これにより、限られた通信帯域幅やリソース環境下で、ユーザ体験の質を向上させることができる。

また動画像の内容に係る情報として、リアルタイムで画像を生成している画像生成部や、圧縮符号化している圧縮符号化処理部から多角的な情報を得ることにより、より正確かつ詳細に注目度の分布を推定することができる。注目度を分布として扱い、さらに当該分布に応じて圧縮率の分布を決定することにより、解像度、フレームレート、通信状況の変化に対し圧縮率を細かく制御でき、様々な状況変化に臨機応変に対応できる。

７−２．ユーザの注視点に基づく制御
上記７−１では、動画像が表す内容に基づき注目度を推定したが、実際にユーザが注目している箇所に基づき注目度を推定することもできる。この場合、サーバ４００は、ヘッドマウントディスプレイ１００や平板型ディスプレイ３０２を見ているユーザの注視点を検出する装置から、画面上の注視点の位置情報を取得し、それに基づき注目度の分布を推定する。なお動画像が表す内容と、ユーザの注視点の双方に基づき注目度の分布を導出してもよい。

図３６は、ユーザの注視点に基づき、フレーム上の領域によって圧縮率を変化させる機能を有するサーバ４００の機能ブロックの構成を示している。サーバ４００は、画像生成部４２０、圧縮符号化部４２２、パケット化部４２４、および通信部４２６を含む。画像生成部４２０、パケット化部４２４、および通信部４２６は、図５、９、１６、２６、３３で説明したのと同様の機能を有する。また複数視点の画像を送信する場合、圧縮符号化部４２２は図２０、２３で示した分割部４４０、第２符号化部４４４、送信対象調整部３６２などをさらに備えてもよい。

圧縮符号化部４２２は、注視点取得部４７０、注目度推定部４７２、通信状況取得部４７４、および圧縮符号化処理部４７６を備える。注視点取得部４７０は、ヘッドマウントディスプレイ１００や平板型ディスプレイ３０２など、画像処理装置２００に接続された表示装置に表示された、描画済みの動画像に対するユーザの注視点の位置情報を取得する。例えばヘッドマウントディスプレイ１００の内部に注視点検出器を設けたり、平板型ディスプレイ３０２を見ているユーザに注視点検出器を装着させたりし、当該注視点検出器による計測結果を取得する。

そして画像処理装置２００の画像データ取得部２４０からサーバ４００の通信部４２６に、注視点の位置座標情報を所定のレートで送信することにより、注視点取得部４７０がそれを取得する。注視点検出器は、例えば赤外線などの参照光をユーザの眼球に照射し、その反射光をセンサにより検出して得られる瞳孔の方向から注視点を特定する一般的な装置でよい。注視点取得部４７０は好適には、動画像のフレームレートより高い頻度で注視点の位置情報を取得する。

あるいは注視点取得部４７０は、画像処理装置２００から取得した注視点の位置情報を時間的に補間することにより、好適な頻度で位置情報を生成してもよい。なお画像処理装置２００からの送信失敗に備え、注視点取得部４７０は注視点の位置情報の最新値とともに、所定数の履歴値を画像処理装置２００から同時に取得するようにしてもよい。

注目度推定部４７２は、注視点の位置に基づき、動画像のフレーム平面を分割してなる単位領域ごとに注目度を推定する。具体的には注目度推定部４７２は、注視点が含まれる頻度、注視点の滞留時間、サッケードの有無、瞬きの有無、の少なくともいずれかに基づき注目度を推定する。定性的には注目度推定部４７２は、単位時間当たりに注視点が含まれる頻度、あるいは滞留時間が多いほど、単位領域の注目度を高くする。

サッケードは対象物に視線を向ける際などに発生する眼球の高速運動であり、サッケードが発生している期間は視覚信号の脳での処理が中断していることが知られている。瞬きをしている期間は当然、画像が認識されない。そのため注目度推定部４７２は、それらの期間において、注目度の高低差を縮めたりなくしたりするように変化させる。サッケードや瞬きの期間を検出する手法は、例えば米国特許出願公開第２０１７／０２８５７３６号明細書に開示されている。

ここで注視点取得部４７０が、動画像のフレームレート（例えば１２０Ｈｚ）より高い頻度（例えば２４０Ｈｚ）で注視点の位置情報を取得、あるいは生成する場合、注目度推定部４７２は、新たな位置情報が得られる都度、注目度を更新してよい。すなわち１フレーム分の圧縮符号化処理の途中で、注目度の分布が変化する場合があってよい。上述のとおり注目度推定部４７２はさらに、７−１において説明した注目度推定部４６０と同様に、動画像に表される内容に基づく注目度を単位領域ごとに推定し、注視点の位置に基づく注目度と統合することで最終的な注目度の分布を取得してもよい。通信状況取得部４７４は、図２６の通信状況取得部４５２と同様の機能を有する。

圧縮符号化処理部４７６は基本的には、図３３の圧縮符号化処理部４６４と同様の機能を有する。すなわち圧縮符号化処理部４７６は、注目度推定部４７２が推定した注目度の分布に基づき、画像平面で圧縮率を異ならせたうえ画像データを圧縮符号化する。この際、圧縮符号化処理部４７６は、データ伝送に用いることのできる通信帯域幅、フレームレート、および解像度の組み合わせに基づき、フレーム平面における圧縮率、ひいては量子化パラメータの分布を決定する。

例えば圧縮符号化処理部４７６は、直近の所定数のフレームのデータサイズと、通信状況取得部４７４が取得する、利用できる通信帯域幅との比較に基づき、圧縮率の分布を調整する。一方、一般に注視点の動きは複雑であり、安定した精度で注目度が得られない可能性がある。そこで圧縮符号化処理部４７６は、注目度推定部４７２が推定した注目度の分布以外に、直近のフレームにおける圧縮結果を参照し、処理対象のフレームの圧縮率の決定精度を高めてもよい。

例えば圧縮符号化処理部４７６は、直近の所定数のフレームの圧縮符号化結果、すなわち圧縮率を高めた領域やその圧縮率などに基づき、処理対象のフレームの圧縮率の分布を調整してもよい。これにより圧縮率の分布の偏りを緩和できる。あるいは圧縮符号化処理部４７６は、単位領域ごとの注目度の有効性を判定し、有効でないと判定した場合に、直近の所定数のフレームの圧縮符号化結果を参照して圧縮率の分布を決定してもよい。

例えば注目度が高い領域が激しく分散している場合や、注目度が有効範囲外にある場合、圧縮符号化処理部４７６は、直近の所定数のフレームで定めた圧縮率の分布をそのまま採用したり、分布の変化を外挿したりして、処理対象のフレームの圧縮率の分布を決定する。また圧縮符号化処理部４７６は、７−１で上述したように、フレームレートおよび解像度を加味したうえで、フレーム全体のデータサイズが、利用できる通信帯域に見合うように、画像平面における圧縮率の分布を決定する。以後の処理は７−１で上述したのと同様である。

図３７は、注目度推定部４７２が画像平面における注目度の分布を推定する処理を説明するための図である。画像１８０は動画像のデータのうち、あるフレームを表している。画像上に表した円（例えば円１８２）は、注視点が滞留していた位置を表し、円の大きさによって滞留時間の長さを表している。ここで「滞留」とは、所定時間以上、同じ位置と見なされる所定範囲内に注視点が留まっていることを指す。また線（例えば線１８４）は、注視点の移動経路のうち所定値以上の頻度で発生した移動経路を表している。

注目度推定部４７２は注視点取得部４７０から所定周期で注視点の位置情報を取得し、図示するような情報を生成する。そして単位領域ごとに、注視点が含まれる頻度、滞留時間、サッケードの有無、瞬きの有無などに基づき注目度を推定する。図では例えば、一点鎖線で囲まれた領域１８６ａ、１８６ｂ、１８６ｃに含まれる単位領域に対し、他の単位領域より高い注目度が推定される。さらに、しきい値以上の高い頻度で視点移動の経路となった単位領域についても、高い注目度としてもよい。この態様でも、注目度は０または１、すなわち注目されていないか注目されているかの２値でもよいし、より多くの階調で表してもよい。

図３８は、圧縮符号化処理部４７６が注視点に基づき圧縮率の分布を決定する手法について説明するための図である。基本として圧縮符号化処理部４７６は対象フレームの圧縮符号化を開始する際に、最新の注目度の分布と利用可能な通信帯域幅に基づいて、部分画像ごとに圧縮率（量子化パラメータ）を決定し圧縮符号化する。しかしながら圧縮結果であるデータサイズは画像の内容によって変動し得るうえ、注視点情報は対象フレーム内の未処理の部分画像において更新され得る。

よって対象フレームの圧縮符号化を開始した時点でのデータサイズの目論見と実際の結果がずれてくる場合がある。そのため利用可能な通信帯域幅を一時的に超過した場合、または超過しそうな場合に、注目度に基づく圧縮率引き下げの指定をキャンセルし、データサイズの辻褄を合わせることを、対象フレームあるいは後続のフレームの圧縮符号化処理において実施する。同図の場合、上段に示すように画像１９０の平面を水平方向に等分してなる７つの部分領域（例えば部分領域１９２）を形成している

圧縮符号化処理部４７６は例えば、各部分画像を圧縮符号化する際、圧縮率を低めるべき単位領域が当該部分画像に含まれる場合、あるいは当該部分画像が圧縮率を低めるべき単位領域である場合、当該部分画像を対象として量子化パラメータを低くすることで圧縮率を低下させる。また画像１９０の上段の部分画像から順に圧縮符号化していく間に、新たな注視点の位置情報が得られたら、注目度推定部４７２は単位領域ごとの注目度をそれに応じて更新し、圧縮符号化処理部４７６は、直近の注目度に基づき部分画像の圧縮率を決定する。すなわち圧縮符号化処理部４７６は、処理対象のフレームの処理開始時以降に注目度が更新されたとき、その直近の注目度の分布に基づく圧縮率で、部分画像を圧縮符号化する。

このような圧縮率の決定においては上述のとおり、それまでの圧縮符号化結果を参照して圧縮率を調整してもよい。図の下段における棒グラフは圧縮符号化結果として、連続した４フレーム（「Ｆｒａｍｅ０」〜「Ｆｒａｍｅ３」）における部分画像ごとの圧縮符号化後のデータサイズをビットレート（ｂｉｔ／ｓｅｃ）で示している。また各フレームについて、１フレーム当たりの圧縮符号化後のビットレートを折れ線グラフ１９６で示している。

ここでビットレート「Ａ」は、サーバ４００と画像処理装置２００との通信に利用できる通信帯域幅を示している。ただし実際には当該通信帯域幅は時間変動する。圧縮符号化処理部４７６は例えば、１フレーム当たりのビットレートを、利用できる通信帯域幅と比較することで、各部分画像の圧縮率、ひいては量子化パラメータを調整する。図の例では、「Ｆｒａｍｅ０」の１フレーム当たりのビットレートが、通信帯域幅より十分下回っているのに対し、次の「Ｆｒａｍｅ１」では通信帯域幅に接近している。

圧縮符号化処理部４７６は、各部分画像の圧縮符号化処理において１フレーム当たりのビットレートを予測し、「Ｆｒａｍｅ１」のように通信帯域幅との差が所定のしきい値より小さくなることが判明したら、いずれかの部分画像の圧縮率を高くする。図では、「Ｆｒａｍｅ１」の７番目の部分画像の圧縮率を、当初の決定より高くすることにより、ビットレートが低下したことを矢印で示している。

また次の「Ｆｒａｍｅ２」では、１フレーム当たりのビットレートが通信帯域幅を超えている。このとき圧縮符号化処理部４７６は、その次のフレームである「Ｆｒａｍｅ３」に対し圧縮率の調整を行ってもよい。図では「Ｆｒａｍｅ３」の１番目の部分画像の圧縮率を、当初の決定より高くすることにより、ビットレートが低下したことを矢印で示している。

なおこの例は注目度を、注目されていないか注目されているかの２値で表し、当初注目されている領域としていた「Ｆｒａｍｅ１」の７番目の部分画像や、「Ｆｒａｍｅ３」の１番目の部分画像を、注目されている領域から除外する操作に相当する。すなわち圧縮符号化処理部４７６は、１フレーム当たりのビットレートが通信帯域幅を超えたとき、または両者の差が所定値より小さくなったとき、圧縮率を低めるべき高い注目度の単位領域を含む部分画像であっても圧縮率の低減をキャンセルする。

この場合、注目されていない他の領域と同じ圧縮率を与えてもよいし、所定値分だけ圧縮率を上げるようにしてもよい。ただし調整手法は図示するものに限らず、注目度を多段階で表す場合は特に、注目度の高さに応じて圧縮率の変化量を異ならせたり、圧縮率の分布全体を変化させたりしてもよい。このように圧縮符号化処理部４７６は、処理対象のフレームのみに基づき量子化パラメータを決定してもよいし、直近の所定数のフレームにおける圧縮符号化結果も参照することにより量子化パラメータを決定してもよい。

このとき圧縮符号化処理部４７６は、過去のフレームにおける量子化パラメータの分布、利用できる通信帯域幅、フレーム全体のデータサイズといったパラメータの時間変化を多角的に確認し、それに基づき処理対象のフレームにおける量子化パラメータの分布を決定してよい。注目度に基づき量子化パラメータの分布を決定する規則や、過去のフレームにおける量子化パラメータの分布、利用できる通信帯域幅、フレーム全体のデータサイズといったパラメータの時間変化に基づき量子化パラメータの分布を決定する規則は、過去の様々なケースにおける調整結果を収集しながら、機械学習または深層学習によって最適化していってもよい。

なおサーバ４００が画像平面の領域ごとに圧縮率を制御する処理手順は図３５で示したのと同様でよい。ただし注目度の推定処理は、注視点の位置情報が得られる都度、必要に応じて更新し、量子化パラメータは、それに応じて随時変更してよい。

以上述べた、ユーザの注視点に基づく領域ごとの圧縮率制御によれば、サーバ４００は、ユーザの実際の視線の動きを取得し、その結果に基づきユーザの注目度を単位領域ごとに推定する。これにより実際に注目されている対象を正確に求めることができ、当該対象に優先的にリソースを割り当てることにより、ユーザの認識上で画質を向上させることができる。

また直近の圧縮符号化結果を圧縮率の決定に利用することにより、注目度の推定に誤差が含まれる場合でも圧縮率の設定精度を維持することができる。さらにフレーム全体での圧縮符号化後のデータサイズを監視することにより、当初の設定で注目度が高いと判定される領域が多すぎたり、当該領域の圧縮率を過度に低めすぎたりしても、それらの値を適切に調整することができる。また７−１と同様、注目度を分布として扱い、さらに当該分布に応じて圧縮率の分布を決定することにより、解像度、フレームレート、通信状況の変化に対し圧縮率を細かく制御でき、様々な状況変化に臨機応変に対応できる。

なお変形例として、注視点取得部４７０と注目度推定部４７２を画像処理装置２００側に設け、サーバ４００は、単位領域ごとに推定された注目度の情報を画像処理装置２００から取得するようにしてもよい。この場合、注視点取得部４７０は上述した注視点検出器から、計測結果である注視点の位置情報を取得する。注目度推定部４７２はサーバ４００に設けた場合と同様にして、注視点の位置情報に基づき単位領域ごとに注目度を推定する。

注視点の位置情報をフレームレートより高い頻度で取得し、それに応じて注目度の分布を随時更新してもよいことは上述したとおりである。注目度推定部４７２により推定された注目度の情報は、例えば画像データ取得部２４０を介してサーバ４００の通信部４２６に所定のレートで送信する。この場合も注目度推定部４７２は送信失敗に備え、注目度の推定結果の最新値とともに、所定数の履歴値を同時に送信してよい。サーバ４００の通信状況取得部４７４、圧縮符号化処理部４７６の動作は上述と同様である。このような構成によっても、上述したのと同様の作用効果を実現できる。

以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

１画像表示システム、１００ヘッドマウントディスプレイ、２００画像処理装置、２０２入出力インターフェース、２０４部分画像記憶部、２０６制御部、２０８ビデオデコーダ、２１０部分画像記憶部、２１２制御部、２１４画像処理部、２１６部分画像記憶部、２１８制御部、２２０ディスプレイコントローラ、２４０画像データ取得部、２４２復号伸張部、２４４画像処理部、２４６表示制御部、２４８データ取得状況特定部、２５０出力対象決定部、２５２出力部、２６０位置姿勢追跡部、２６２第１補正部、２６４合成部、２６６第２補正部、２７０ａ第１形成部、２７０ｂ第２形成部、２７２ａ第１制御部、２７２ｂ第２制御部、２８０第１復号部、２８２第２復号部、３０２平板型ディスプレイ、４００サーバ、４０２描画制御部、４０４画像描画部、４０６フレームバッファ、４０８ビデオエンコーダ、４１０部分画像記憶部、４１２制御部、４１４ビデオストリーム制御部、４１６入出力インターフェース、４２０画像生成部、４２２圧縮符号化部、４２４パケット化部、４２６通信部、４３０描画部、４３２形成内容切り替え部、４３４データ形成部、４４０分割部、４４２第１符号化部、４４４第２符号化部、４５０画像内容取得部、４５２通信状況取得部、４５４圧縮符号化処理部、４６０注目度推定部、４６２通信状況取得部、４６４圧縮符号化処理部、４７０注視点取得部、４７２注目度推定部、４７４通信状況取得部、４７６圧縮符号化処理部。

Claims

表示対象の動画像を描画する描画部と、
前記動画像が表す内容に係る情報を取得する画像内容取得部と、
前記動画像のフレーム平面を分割してなる単位領域ごとに、前記動画像が表す内容に応じた注目度を推定する注目度推定部と、
前記注目度の分布に基づきフレーム平面で圧縮率を異ならせ、前記動画像のデータを圧縮符号化する圧縮符号化部と、
圧縮符号化された動画像のデータを送信する通信部と、
を備えたことを特徴とする画像データ転送装置。
前記描画部は、それまで存在していなかった送信対象の動画像を動的に描画することを特徴とする請求項１に記載の画像データ転送装置。
前記画像内容取得部は、前記描画部からの通知、および描画された動画像の解析結果、の少なくともいずれかにより前記動画像が表す内容に係る情報を取得することを特徴とする請求項１または２に記載の画像データ転送装置。
前記画像内容取得部は、前記動画像の解析結果として、前記圧縮符号化部が圧縮符号化処理において取得した情報を利用することを特徴とする請求項３に記載の画像データ転送装置。
前記画像内容取得部は、前記動画像を規定するコンテンツに対するユーザ操作のタイミング、当該タイミングの間隔、当該ユーザ操作の内容、前記コンテンツの状況、および当該コンテンツで発生させるオーディオの状況、の少なくともいずれかを、前記内容に係る情報として取得することを特徴とする請求項１から４のいずれかに記載の画像データ転送装置。
前記画像内容取得部は前記コンテンツの状況として、ａ）ユーザ操作が必要で前記コンテンツの処理内容に影響を与えるシーンであるか、ｂ）ユーザ操作が必要ないムービーシーンであるか、ｃ）ユーザ操作が必要ない、ムービーシーン以外のシーンであるか、ｄ）ユーザ操作が必要だが前記コンテンツの本編でないシーンであるか、の少なくともいずれかを判別する情報を前記描画部から取得することを特徴とする請求項５に記載の画像データ転送装置。
前記注目度推定部は、オプティカルフローの量、モーションエスティメーションの量、符号化ユニットの割り当て状況、シーンの切り替えタイミングか否か、フレームに表される画像テクスチャの種類、特徴点、奥行き情報、オブジェクトの量、３次元グラフィクスに用いているミップマップテクスチャの各レベルの使用量、ＬＯＤ（Level Of Detail）、テッセレーションの各レベルの使用量、文字および記号の量、表されるシーンの種類、表されるオブジェクトの種類、の少なくともいずれかに基づき、前記注目度を推定することを特徴とする請求項１から６のいずれかに記載の画像データ転送装置。
送信先の装置における前記動画像のデータ到達率および遅延時間の少なくともいずれかを所定の時間間隔で取得することにより、動画像のストリーミングに用いる通信状況を求める通信状況取得部をさらに備え、
前記圧縮符号化部は、前記注目度、前記通信状況、フレームレート、および解像度の組み合わせに基づき、前記フレーム平面における量子化パラメータの分布を決定することを特徴とする請求項１から７のいずれかに記載の画像データ転送装置。
前記注目度推定部は、前記動画像が表す内容を反映させた、注目度を表すスコアを複数の規則に基づき前記単位領域ごとに決定し、当該スコアの合計に基づき、前記単位領域ごとに圧縮率を決定することを特徴とする請求項１から８のいずれかに記載の画像データ転送装置。
前記注目度推定部は、重要性の高さに対する条件を満たすオブジェクトを含む単位領域のスコアを他より大きくすることを特徴とする請求項９に記載の画像データ転送装置。
前記注目度推定部は、直前の所定期間における、前記動画像を規定するコンテンツに対するユーザ操作の入力値の変化量が所定値以上のとき、他の規則により所定値以上のスコアが与えられている前記単位領域のスコアを増幅させることを特徴とする請求項９または１０に記載の画像データ転送装置。
前記圧縮符号化部は、機械学習または深層学習により最適化された規則に基づき前記圧縮率を決定することを特徴とする請求項１から１１のいずれかに記載の画像データ転送装置。
前記圧縮符号化部は、前記フレーム平面における圧縮率の分布を、フレーム全体のデータサイズに基づき決定することを特徴とする請求項１から１２のいずれかに記載の画像データ転送装置。
前記圧縮符号化部は、１フレームより小さい部分画像の単位で動画像を圧縮符号化し、当該部分画像単位、１フレーム単位、および所定数のフレーム単位、所定の時間間隔、のいずれかで圧縮率の分布を更新することを特徴とする請求項１から１３のいずれかに記載の画像データ転送装置。
前記通信部は、前記圧縮符号化部が、前記フレーム平面を分割してなる圧縮単位ごとに圧縮符号化したデータを順次送信し、
前記圧縮符号化部は、前記圧縮単位に圧縮率を低めるべき単位領域が含まれる場合、当該単位領域の圧縮率を低下させることを特徴とする請求項１から１４のいずれかに記載の画像データ転送装置。
表示対象の動画像を描画するステップと、
前記動画像が表す内容に係る情報を取得するステップと、
前記動画像のフレーム平面を分割してなる単位領域ごとに、前記動画像が表す内容に応じた注目度を推定するステップと、
前記注目度の分布に基づきフレーム平面で圧縮率を異ならせ、前記動画像のデータを圧縮符号化するステップと、
圧縮符号化された動画像のデータを送信するステップと、
を含むことを特徴とする画像データ転送装置による画像圧縮方法。
表示対象の動画像を描画する機能と、
前記動画像が表す内容に係る情報を取得する機能と、
前記動画像のフレーム平面を分割してなる単位領域ごとに、前記動画像が表す内容に応じた注目度を推定する機能と、
前記注目度の分布に基づきフレーム平面で圧縮率を異ならせ、前記動画像のデータを圧縮符号化する機能と、
圧縮符号化された動画像のデータを送信する機能と、
をコンピュータに実現させることを特徴とするコンピュータプログラム。