JP2022180545A

JP2022180545A - 低レイテンシ動画符号化及び送信のレート制御

Info

Publication number: JP2022180545A
Application number: JP2022151361A
Authority: JP
Inventors: ハオパン; Hao Pan; ジムシーチョウ; C Chou Jim; フィリックスシーフェルナンデス; C Fernandes Felix
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2018-06-28
Filing date: 2022-09-22
Publication date: 2022-12-06
Anticipated expiration: 2039-06-27
Also published as: KR20210009367A; KR102449052B1; KR20220143127A; KR102541392B1; US20230009707A1; JP2021526774A; DE112019003203T5; US11451788B2; JP7249364B2; CN112313951A; JP7490726B2; US20210127117A1; WO2020006287A1

Abstract

【課題】高解像度動画ソースを、低レイテンシで符号化することができる動画符号化システムを提供する。【解決手段】画素データが符号化前に周波数帯域（複数）に分解される動画符号化システムであって、フレームのスライスの周波数帯域は、符号化前に周波数帯域にわたって複雑度統計値を計算することができるようにバッファリングされる。複雑度統計値は、現在のスライスの符号化器内のレートを調節するための周波数帯域の量子化パラメータを決定する際に、レート制御構成要素によって使用される。周波数帯域の量子化パラメータは、受信デバイス上での復号器による再構成及びウェーブレット合成後の表示されたフレームの品質を最適化するために、合同して計算される。以前に処理された１つ以上のフレームに関する情報は、現在のスライスの量子化パラメータを決定する際に、現在のスライスの統計値と組み合わせて使用される。【選択図】図８

Description

仮想現実（Virtual reality、ＶＲ）は、ユーザが没入型人工環境を体験及び／又はそれと相互作用して、それにより、ユーザが物理的にその環境内にいるかのように感じることを可能にする。例えば、仮想現実システムは、奥行きの錯覚を作り出すために、立体的シーンをユーザに表示してもよく、コンピュータは、シーンコンテンツをリアルタイムで調整して、ユーザがシーン内で移動する錯覚を提供することができる。ユーザが仮想現実システムを介して画像を見る場合、ユーザは、このように一人称の視点からシーン内で移動しているかのように感じることができる。同様に、複合現実（mixed reality、ＭＲ）は、コンピュータ生成情報（仮想コンテンツと呼ばれる）を実世界画像又は実世界視野と組み合わせてユーザの世界に対する視野を増強又はそのコンテンツを追加する。あるいは、複合現実は実世界のオブジェクトの仮想表現を３次元（３Ｄ）仮想世界のビューに組み合わせる。したがって、仮想現実のシミュレートされた環境及び／又は複合現実の複合環境を利用して、複数のアプリケーションの相互作用型ユーザエクスペリエンスを提供することができる。

高解像度動画ソースを、通信リンク（例えば、無線リンク）を介してデバイスに送信して、復号し、表示するために、低レイテンシで符号化することができる動画符号化システムの各種実施形態が記載される。動画符号化システムの実施形態はまた、デバイスに送信される符号化動画のグレースフルデグラデーションを提供し、通信リンクのチャネル容量の変化などの変動する条件下で、所望のフレームレートを維持することができる。動画符号化システムの例示的な適用は、仮想コンテンツを含む動画フレームがレンダリングされ、符号化され、基地局によってデバイス（例えば、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、又はユーザによって装着され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのヘッドマウントディスプレイ（head-mounted display、ＨＭＤ）に送信されて復号され表示される、仮想又は複合現実システムにおける。

いくつかの実施形態では、動画符号化システムは、符号化する前の画素データに対してウェーブレット変換を実行し、画素データを周波数帯域に分解することができる。次いで、周波数帯域は、ブロックベースの符号化器に提供されるブロックに編成され、符号化／圧縮される。符号化された周波数データは、次いで、無線インタフェースに送られ、符号化された周波数データはパケット化され、パケットは受信デバイスに送信される。受信デバイス上で、符号化されたデータは、パケット復号され、ブロックベースの復号器を通過して、周波数帯域を復元する。次いで、復元された周波数帯域でウェーブレット合成を実行して、表示する画素データを再構成する。

動画符号化システムによって、様々な方法及び装置が実装されてもよく、それによって、無線リンクを介しての目標フレームレートを維持し、フレームのレンダリング、伝達、及び表示のレイテンシを最小化し、デバイスに送信された符号化動画のグレースフルデグラデーションを提供して、無線接続のチャネル容量変化などの変動する条件下で所望のフレームレートを維持することができる。

動画符号化システムの実施形態を実装するシステムの目標は、エラー（例えば、パケット廃棄）を最小限に抑え、無線接続を介する帯域幅の使用を最大化しつつ、仮想コンテンツが基地局上にレンダリングされる時間と、仮想コンテンツがデバイス上に表示される時間との間の、非常に低いレイテンシ（例えば、４～５ミリ秒）を提供することであってもよい。動画符号化システムの実施形態は、無線接続を介してデバイスに送信されるデータを符号化するときに、システムの目標とする低レイテンシを達成するのに役立つレート制御方法を実装することができる。

いくつかの実施形態では、動画符号化システムは、画素のブロックをフレームのスライスから複数の異なる周波数帯域に分解する２層ウェーブレット分解を実行するウェーブレット変換構成要素と、続いて、周波数帯域を符号化するＨＥＶＣなどのブロックベースの符号化器とを含む。いくつかの実施形態では、レート制御構成要素は、ＶＲ／ＭＲシステムの厳密なレイテンシ要件下でレート制御を実行するために、１フレーム又は２フレームの時定数にわたって動作する代わりに、各スライスの符号化器パラメータ（例えば、周波数帯域の量子化パラメータ）を調整することができる。いくつかの実施形態では、スライスの周波数帯域は、ウェーブレット変換後にローカルメモリ内にバッファリングされてもよく、それにより、複雑度統計値は、例えば、動画符号化システムの複雑度分析構成要素によって、符号化の前に、周波数帯域にわたって計算され得る。いくつかの実施形態では、複雑度統計値は、ＣＴＵブロックの画素勾配及びサイズの分散のうちの１つ以上を含んでもよいが、これらに限定されない。複雑度統計値は、次に、現在のスライスの符号化器内のレートを調節するための周波数帯域の量子化パラメータを決定する際に、レート制御構成要素によって使用されてもよい。バッファリングされた周波数帯域上の複雑度統計値を計算することにより、動画符号化システムは、スライスを符号化する前にスライスにおける複雑さの量を推定することができる。

いくつかの実施形態では、レート制御構成要素は、１つ以上の以前に処理されたフレームに関する統計値を検査して、フレームの同一場所の（co-sited）ブロック又はスライスを符号化するために使用されたビットの実際の数を決定することができる。次に、この情報は、現在のスライスの量子化パラメータを決定する際に、現在のスライスの複雑度統計値と組み合わせて使用され得る。

いくつかの実施形態では、周波数帯域の量子化パラメータは、復号器による再構成及びウェーブレット合成がデバイス上で実行された後のフレームの全体的な表示品質を最適化するために、合同して計算されてもよい。周波数帯域間のレート割り当てのための方法は、動作レート歪み曲線上で等しい勾配をもたらす周波数帯域のそれぞれにおける動作点を見つけることである。いくつかの実施形態では、動作レート歪み曲線は、係数のレートが６ステップの量子化パラメータによく近似し得るという事実により、符号化器パイプラインのエントロピー符号化ステージからの統計値の組み合わせを使用して推定されてもよい。

いくつかの実施形態では、同一画像内において周囲の領域（例えば、周辺領域）よりも高い解像度を有するべき関心領域（例えば、中心窩領域）が画像内に存在してもよい。いくつかの実施形態では、前のフレームからの複雑度統計値は、前のフレームからの中心窩領域と共に記憶され、現在のフレームのスライスにおける周波数帯域の量子化パラメータを計算する際に使用され得る。一例として、符号化される各ブロックについて、前のフレームの中心窩領域を使用して、前のフレームについて計算された複雑度統計値を調節することができる。これにより得られた複雑度統計値は、次いで、量子化パラメータを決定する際に、現在のフレームのスライスについて計算された複雑度統計値に加えて使用され得る。

いくつかの実施形態では、レート制御構成要素は、スライスレベルではなくブロックレベルで符号化器パラメータ（例えば、周波数帯域又は優先順位レベルの量子化パラメータ）を調整してもよい。いくつかの実施形態では、スライスの各ブロックについて複雑度統計値を計算することができ、ブロックについて量子化パラメータを決定することができる。

少なくともいくつかの実施形態に係る、符号化前にウェーブレット変換を使用して画素データを周波数帯域に分解する動画符号化システムを示すブロック図である。少なくともいくつかの実施形態に係る、フレームからのタイルを並行して処理する複数の符号化器を含む動画符号化システムを示す。少なくともいくつかの実施形態に係る、スライス及びタイルに分割された例示的なフレームを示す。少なくともいくつかの実施形態に係る、ブロックに分割されたタイルの例を示す。少なくともいくつかの実施形態に係る、符号化前に、画素データを記憶して周波数帯域データを生成する画素ブロックのウェーブレット変換を実行することを示す。少なくともいくつかの実施形態に係る、図１及び図２に示すような動画符号化システムを含むＶＲ／ＭＲシステムの動作方法の高レベルフローチャートである。少なくともいくつかの実施形態に係る、図１に示すような動画符号化システムの動作方法のフローチャートである。少なくともいくつかの実施形態に係る、図２に示すような動画符号化システムの動作方法のフローチャートである。少なくともいくつかの実施形態に係る、周波数帯域の複雑度統計値が計算され、符号化のための量子化パラメータを生成する際に使用される、図１又は２に示すような動画符号化システムを示すブロック図である。少なくともいくつかの実施形態に係る、図７に示すような動画符号化システムの動作方法のフローチャートである。少なくともいくつかの実施形態に係る、動画符号化システムを実装することができる例示的なＶＲ／ＭＲシステムを示す。少なくともいくつかの実施形態に係る、図９に示すようなＶＲ／ＭＲシステムの構成要素を示すブロック図である。

本明細書は、「ｏｎｅｅｍｂｏｄｉｍｅｎｔ（一実施形態）」又は「ａｎｅｍｂｏｄｉｍｅｎｔ（実施形態）」に対する参照を含む。「ｉｎｏｎｅｅｍｂｏｄｉｍｅｎｔ（一実施形態において）」又は「ｉｎａｎｅｍｂｏｄｉｍｅｎｔ（ある実施形態において）」という語句表現は、必ずしも同一の実施形態を指すわけではない。特定の特徴、構造、又は特性は、本開示と一貫性を有するいずれかの好適な方式で組み合わされてもよい。

「ｃｏｍｐｒｉｓｉｎｇ（備える、含む）」。この用語はオープンエンドである。特許請求の範囲で使用されるとき、この用語は、追加の構造又はステップを除外しない。「１つ以上のプロセッサユニット．．．を備えた装置」と記載される請求項を検討する。このような請求項は、装置が追加の構成要素（例えば、ネットワークインタフェースユニット、グラフィック回路など）を含むことを除外しない。

「ｃｏｎｆｉｇｕｒｅｄｔｏ（ように構成されている）」。様々なユニット、回路、又は他の構成要素は、タスク又はタスク（複数）を実行する「ように構成されている」と説明又は請求されてもよい。このような文脈では、「構成されている」は、ユニット／回路／構成要素が、動作の間にそれらのタスク又はタスク（複数）を実行する構造（例えば、回路）を含むことを示すことによって構造を暗示するときに使用される。そのように、ユニット／回路／構成要素は、指定されたユニット／回路／構成要素が現在動作可能でない（例えば、オンの状態でない）ときでさえ、タスクを実行するように構成されていると言うことができる。「構成されている」という言葉と共に使用されるユニット／回路／構成要素は、ハードウェア、例えば、演算を実施するように実行可能なプログラム命令を記憶した回路、メモリなどを含む。ユニット／回路／構成要素が１つ以上のタスクを実行するように「構成されている」と記述することは、そのユニット／回路／構成要素に対して米国特許法第１１２条、段落（ｆ）が適用されないことが明示的に意図されている。加えて、「構成されている」は、ソフトウェア及び／又はファームウェア（例えば、ＦＰＧＡ又はソフトウェアを実行する汎用プロセッサ）によって操作され、対象のタスク（単数又は複数）を実行可能な方式で動作する一般的な構造体（例えば、一般的な回路）を含むことができる。「構成されている」はまた、１つ以上のタスクを実施又は実行するように適合されたデバイス（例えば、集積回路）を組み立てるように製造工程（例えば、半導体組み立て設備）を適合させることを含んでもよい。

「第１」、「第２」など。本明細書で使用されるように、これらの用語は、続く名詞の標識として使用され、いかなるタイプの順序付け（例えば、空間的、時間的、論理的など）も意味しない。例えば、バッファ回路は、「第１」及び「第２」の値に対する書き込み演算を実行するものとして本明細書で説明されてもよい。用語「第１」及び「第２」は、必ずしも第１の値が第２の値の前に書き込まれなければならないことを含意していない。

「基づいて」又は「従って」。本明細書で使用されるように、それらの用語は、判定に影響を及ぼす１つ以上の要因を説明するために使用される。それらの用語は、判定に影響を及ぼすことがある追加の要因を排除しない。すなわち、判定はそれらの要因のみに基づいているか、又は少なくとも部分的にそれらの要因に基づいていることがある。「Ｂに基づいてＡを判定する」というフレーズを検討する。このケースでは、ＢはＡの判定に影響を及ぼす要因であるが、このようなフレーズはＡの判定がＣにも基づいていることを除外しない。他の例では、ＡはＢのみに基づいて判定されてもよい。

「又は」。特許請求の範囲で使用されるとき、用語「又は」は、包括的論理和として使用され、排他的論理和として使用されない。例えば、語句「ｘ、ｙ、又はｚのうちの少なくとも１つ」は、ｘ、ｙ、及びｚのいずれか１つ、並びにこれらの任意の組み合わせを意味する。

動画符号化システムの各種実施形態を説明する。動画符号化システムの実施形態は、高解像度動画ソースを、通信リンク（例えば、無線リンク）を介してデバイスに送信して、復号し、表示するために、低レイテンシで符号化することができる。動画符号化システムの実施形態はまた、デバイスに送信される符号化動画のグレースフルデグラデーションを提供し、通信リンクのチャネル容量の変化などの変動する条件下で、所望のフレームレートを維持することができる。

動画符号化システムの例示的な適用は、仮想コンテンツを含む動画フレームがレンダリングされ、符号化され、デバイスに送信されて復号され表示される、仮想又は複合現実システムにおける。仮想又は複合現実システム（本明細書ではＶＲ／ＭＲシステムと呼ばれる）の実施形態が記載され、動画符号化システムの実施形態が実装され得る。いくつかの実施形態では、ＶＲ／ＭＲシステムは、デバイス（例えば、パッド若しくはタブレットデバイス、スマートフォン、又はユーザにより着用され、本明細書ではヘッドマウントディスプレイ（ＨＭＤ）と呼ばれる、ヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡）と、本明細書では基地局と称する別個のコンピューティングデバイスとを含んでもよい。いくつかの実施形態では、デバイス及び基地局は、無線接続を介してデバイス及び基地局がデータを通信し交換することを可能にする無線通信技術をそれぞれ含み得る。いくつかの実施形態では、デバイスは、ユーザの環境に関する情報（例えば、動画、深度情報、照明情報など）、及びユーザに関する情報（例えば、ユーザの表情、眼の動き、手のジェスチャなど）を収集するセンサを含んでもよい。センサによって収集された情報は、無線接続を介して基地局に送信されてもよい。基地局は、無線接続を介してデバイスから受信したセンサ情報に少なくとも部分的に基づいて仮想コンテンツを含むフレームを生成しレンダリングするように構成されたソフトウェア及びハードウェア（例えば、プロセッサ（システムオンチップ（system on a chip、ＳＯＣ）、ＣＰＵ、画像信号プロセッサ（image signal processor、ＩＳＰ）、グラフィック処理ユニット（graphics processing unit、ＧＰＵ）、符号化器／復号器（コーデック）など）、メモリなど）を含み得る。基地局はまた、レンダリングされたフレームを予めフィルタリングし、圧縮し、無線接続を介してデバイスに送信して、表示することができる、本明細書に記載されるような動画符号化システムの実施形態を含んでもよい。

いくつかの実施形態では、ＶＲ／ＭＲシステムは、デバイスと基地局との間に高指向性の無線リンクを提供する独自の無線通信技術を実装することができる。いくつかの実施形態では、無線通信技術の指向性及び帯域幅は、複数のデバイスが同時に基地局と通信することをサポートすることができ、それにより、複数のユーザが共同設置環境において同時にシステムを使用することを可能にし得る。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈ（登録商標）など）又は独自の無線通信技術がサポートされてもよい。

無線リンクに関して考慮される主要な制約は、帯域幅及びレイテンシを含む。ＶＲ／ＭＲシステムの目標は、高解像度の広視野（field of view、ＦＯＶ）な仮想表示を、高品質のＶＲ／ＭＲ視野をユーザに提供するフレームレートで提供することである。別の目標は、フレームが基地局によってレンダリングされる時間と、フレームがデバイスによって表示される時間との間のレイテンシを最小化することである。しかしながら、無線リンクのチャネル容量は時間と共に変化することがあり、したがって、無線リンクは、任意の所与の時間に送信される情報のうち一定量のみをサポートする場合がある。

無線リンクを介して目標フレームレートを維持し、フレームのレンダリング、伝達、及び表示におけるレイテンシを最小化するために、動画符号化システムによって実施され得る様々な方法及び装置が本明細書に記載される。加えて、方法及び装置は、通信リンクのチャネル容量の変化などの変動する条件下で所望のフレームレートを維持するために、デバイスに送信された符号化動画のグレースフルデグラデーションを提供することができる。

いくつかの実施形態では、動画符号化システムは、符号化する前の符号画素データに対してウェーブレット変換を実行し、画素データを周波数帯域に分解することができる。次いで、周波数帯域は、ブロックベースの符号化器に提供されるブロックに編成され、符号化／圧縮される。一例として、フレームは１２８×１２８のブロックに分割され、２レベルのウェーブレット分解を１２８×１２８のブロックのそれぞれに適用して、３２×３２の周波数データのブロックを１６個生成することができる。１６個の３２×３２の周波数データブロックは、７つの周波数帯域を表しており、次いで、符号化器（例えば、高効率動画符号化（High Efficiency Video Coding、ＨＥＶＣ）符号化器）に送信され、符号化されてもよい。符号化された周波数データは、次いで、符号化された周波数データをパケット化する無線インタフェースに送られ、無線インタフェースはパケットを受信デバイス（例えば、ＨＭＤ、パッド又はタブレットデバイス、スマートフォンなど）に送信する。受信デバイス上で、符号化されたデータは、パケット復号され、ブロックベースの復号器を通過して、周波数帯域を復元する。次いで、復元された周波数帯域でウェーブレット合成を実行して、表示する画素データを再構成する。

ウェーブレット変換は、動画フレームからの画素ブロックそれぞれに適用される２レベルのウェーブレット分解が一般に記載されるが、各種実施形態では、ウェーブレット分解は、任意の数のレベル（例えば、１レベル、２レベル、３レベル、４レベルなど）であってよく、符号化された画像の品質と符号化されるブロックの複雑度とをトレードオフするように調整されてもよい。

いくつかの実施形態では、動画符号化システムは、スライスベースのレンダリング、符号化、及び伝達を実行することができる。フレーム全体をレンダリング、符号化、及び送信することは、各フレームが完了し、記憶され、次いでＶＲ／ＭＲシステムの次のステージに送信される必要があるため、レイテンシ及びメモリへの影響を有し得る。スライスベースのレンダリングでは、フレーム全体を基地局内でレンダリングして符号化し、レンダリングされたフレームをデバイスに送信するのではなく、基地局は、フレームの一部（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを準備でき次第デバイスに送信してもよい。スライスは、例えば、１２８×１２８ブロック行、又は２つ以上のブロック行であってもよい。スライスベースのレンダリング及び符号化は、レイテンシを低減するのに役立ち得、バッファに必要とされるメモリの量もまた低減することができ、これにより、チップ（単数又は複数）又はプロセッサ（単数又は複数）上のメモリの接地面積、並びに必要電力を低減することができる。

いくつかの実施形態では、動画符号化システムは、タイルベースのレンダリング、符号化、及び伝達を実行することができる。タイルベースのレンダリング、符号化、及び伝達において、各スライスは、複数のタイル（例えば、４つのタイル）に分割されてもよく、基地局は、タイルをレンダリングして符号化し、符号化されたタイルを準備でき次第デバイスに送信してもよい。

いくつかの実施形態では、動画符号化システムは、単一の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルを処理することができる。しかしながら、いくつかの実施形態では、動画符号化システムは、複数の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。例えば、いくつかの実施形態では、各スライスは４つのタイルに分割されてもよく、各タイルは複数の１２８×１２８ブロックを含み、２つの符号化器（ｅ０及びｅ１）は、各スライスからの２つのタイルで動作してもよい（例えば、ｅ０はｔ０及びｔ１で動作し、ｅ１は、ｔ２及びｔ３で動作する）。各符号化器は、１６の時間単位を同じ周波数帯域からのブロックの処理の間で可能とするように、異なる周波数帯域からのブロックの処理を２つのタイルの間で多重化してもよい。ブロックの処理を２つのタイル間で多重化することにより、周波数帯域のブロック間の依存関係に適切に対処することができる。各スライスが４つのタイルに分割され、２つの符号化器が各スライスからのそれぞれのタイル上で動作する実施形態が記載されているが、いくつかの実施形態では、スライスをより多くのタイル（例えば、６つ又は８つのタイル）に分割することができ、いくつかの実施形態では、より多くの符号化器（例えば、３つ又は４つの符号化器）が使用されてもよい。

いくつかの実施形態では、動画符号化システムは、ウェーブレット変換の前にフレーム内で画素データのプレフィルタリングを実行することができる。プレフィルタリングは、例えば、フレームのウェーブレット変換、符号化、及び無線リンクを介してデバイスへの送信を実行する前に、基地局によってレンダリングされるフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。

デバイスがＨＭＤであるいくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープ（lens warp）を実行することを含んでもよい。レンズワープは、画像が閲覧されるＨＭＤ上のレンズによって導入される画像の歪みを補正するために実施され、それによって画像の品質を改善する。いくつかの実施形態では、ＨＭＤは、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続を介してレンズワープデータを基地局に提供することができる。次いで、基地局は、そのＨＭＤに関するレンズワープデータに基づいて、フレーム上でレンズワープを実行することができる。従来のＶＲ／ＭＲシステムでは、レンズワープは、復号後表示前にＨＭＤで実行される。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にＨＭＤで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、ＨＭＤ上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、プレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングを含んでもよい。この方法では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。人間の眼は、周辺領域よりも中心窩領域においてより高い解像度を知覚することができる。したがって、中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。いくつかの実施形態では、周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。いくつかの実施形態では、周辺領域に適用されるフィルタリングの量は、フレームの周辺に向かって伸びつつ増加してもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

図１は、少なくともいくつかの実施形態に係る、符号化前のウェーブレット変換を使用して画素データを周波数帯域に分解する動画符号化システム１２０を示すブロック図である。ＶＲ／ＭＲシステム１０は、少なくとも１つのデバイス１５０（例えば、パッド若しくはタブレットデバイス、スマートフォン、又は、ユーザによって装着され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのＨＭＤ）及びコンピューティングデバイス１００（本明細書では基地局と呼ばれる）を含んでもよい。基地局１００は、仮想コンテンツを含むＶＲ又はＭＲフレームをレンダリングし、フレームを符号化し、デバイス１５０によって復号され表示されるように、符号化されたフレームを無線接続１８０を介してデバイス１５０に送信する。

いくつかの実施形態では、ＨＭＤ１５０は、ユーザ１９０の環境に関する情報（例えば、動画、深度情報、照明情報など）、及びユーザ１９０に関する情報（例えば、ユーザの表情、眼の動き、視線の方向、手のジェスチャなど）を収集するセンサ１６０を含んでもよい。デバイス１５０は、センサ１６０によって収集された情報の少なくとも一部を、無線接続１８０を介して基地局１００に送信してもよい。基地局１００は、センサ１６０から取得された様々な情報に少なくとも部分的に基づいて、仮想コンテンツを含むデバイス１５０によって表示するためのフレームをレンダリングし、フレームを符号化し、符号化されたフレームを、復号しユーザに対し表示するために、無線接続１８０を介してデバイス１５０に送信することができる。

基地局１００及びデバイス１５０は、基地局１００及びデバイス１５０が無線接続１８０を介してデータを通信し交換することを可能にする無線通信技術を実装してもよい。いくつかの実施形態では、無線接続１８０は、デバイス１５０と基地局１００との間に高指向性無線リンクを提供する独自の無線通信技術に従って実装されてもよい。しかしながら、いくつかの実施形態では、他の商用の（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

ＶＲ／ＭＲシステム１０内のデバイス１５０と基地局１００との間の無線接続１８０に関して考慮される主要な制約は、帯域幅及びレイテンシを含む。例えば、いくつかの実施形態では、目標は、高解像度の広角視野（ＦＯＶ）仮想表示を、高品質のＶＲ／ＭＲ視野をユーザに提供するフレームレートでユーザに提供することである。別の目標は、動画フレームがデバイスによってキャプチャされた時間と、動画フレームに基づいてレンダリングされたＶＲ／ＭＲフレームがデバイスにより表示される時間との間のレイテンシを最小化することである。

基地局１００は、本明細書に記載されるような動画及び／又は画像をレンダリング、フィルタリング、符号化、並びに送信するための様々なハードウェア構成要素、例えば、様々なタイプのプロセッサ、集積回路（ＩＣ）、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などを含んでもよい。基地局１００は、ＧＰＵレンダリング１１０構成要素、無線インタフェース１３０構成要素、並びに無線接続１８０を介して目標フレームレートを維持し、フレームレンダリング、符号化、伝達、及び表示におけるレイテンシを最小化するのに役立ち得る様々な方法を実装する１つ以上のハードウェア構成要素を含み得る、動画符号化システム１２０を含み得るが、これらに限定されない。動画符号化システム１２０は、プレフィルタ１２２構成要素（例えば、Ｎチャネルのフィルタバンク）、ウェーブレット変換１２４構成要素、及び符号化器１２６構成要素を含み得るが、これらに限定されない。

ＧＰＵレンダリング１１０は、センサ１６０から取得された様々な情報に少なくとも部分的に基づいて、仮想コンテンツを含むデバイス１５０によって表示するためのフレームをレンダリングすることができる１つ以上のハードウェア構成要素を含み得る。

いくつかの実施形態では、動画符号化システム１２０は、ウェーブレット変換１２４を実行する前にレンダリングされたフレーム内の画素データをプレフィルタリング１２２する１つ以上のハードウェア構成要素を含んでもよい。プレフィルタ１２２は、例えば、フレームのウェーブレット変換１２４、符号化１２６、無線接続１８０を介してデバイス１５０への送信を実行する前に、基地局１００上でレンダリングされたフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線接続１８０上でのレイテンシ及び帯域幅の使用を低減することができる。

いくつかの実施形態では、プレフィルタ１２２は、ウェーブレット変換１２４の前に、基地局１００上のフレームに対してレンズワープを実行してもよい。レンズワープは、画像が閲覧されるデバイス上のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。いくつかの実施形態では、デバイス１５０は、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続１８０を介してレンズワープデータを基地局１００に提供することができる。次いで、動画符号化システム１２０のプレフィルタ１２２構成要素は、そのデバイス１５０のレンズワープデータに基づいてフレーム上でレンズワープを実行することができる。従来のＶＲ／ＭＲシステムでは、レンズワープは、復号後表示前にデバイス１５０上で実行される。プレフィルタ１２２ステージにおいて基地局１００上でレンズワープを実行することによって、ウェーブレット変換１２４及び符号化１２６を実行する前にフレームの解像度を低減することができる。これにより圧縮の改善に役立ち得、無線接続１８０上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイス１５０で行うのではなく、プレフィルタ１２２ステージにおいて基地局１００で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化１２６の前に解像度を低減するために基地局１００でフィルタリングを実行し、次いで、デバイス１５０上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、プレフィルタ１２２はまた、中心窩領域内ではより高い解像度を維持しつつ、周辺領域内の解像度を低減する、１つ以上のフィルタを適用してもよい。この方法では、デバイス１５０から取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。人間の眼は、周辺領域よりも中心窩領域においてより高い解像度を知覚することができる。したがって、中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。いくつかの実施形態では、周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。いくつかの実施形態では、周辺領域に適用されるフィルタリングの量は、フレームの周辺に向かって伸びつつ増加してもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

いくつかの実施形態では、動画符号化システム１２０のウェーブレット変換１２４構成要素は、符号化する前の画素データに対してウェーブレット変換を実行し、画素データを周波数帯域に分解する、１つ以上のハードウェア構成要素（例えば、Ｎチャネルのフィルタバンク）を含んでもよい。次いで、周波数帯域は、ブロックベースの符号化器１２６に提供されるブロックに編成され、符号化／圧縮される。一例として、図３Ａ～３Ｃに示されるように、フレームは１２８×１２８のブロックに分割され、２レベルのウェーブレット分解を１２８×１２８のブロックのそれぞれに適用して、３２×３２のブロックを１６個生成することができる。１６個の３２×３２の周波数データブロックは、７つの周波数帯域を表しており、次いで、ブロックベースの符号化器（例えば、高効率動画符号化（ＨＥＶＣ）符号化器）１２６に送信され、符号化されてもよい。符号化された周波数データは、次いで、１つ以上のハードウェア構成要素を実装した無線インタフェース１３０に送信される。これにより、データはパケット化され、パケットは無線接続１８０を介してデバイス１５０に送信される。

デバイス１５０は、本明細書に記載されるような動画及び／又は画像を復号し表示するための様々なハードウェア構成要素、例えば、様々なタイプのプロセッサ、集積回路（ＩＣ）、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などを含んでもよい。デバイス１５０は、無線インタフェース１５２、復号器１５４構成要素（例えば、高効率動画符号化（ＨＥＶＣ）復号器）、ウェーブレット合成１５６構成要素、及びディスプレイ１５８構成要素を含み得るが、これらに限定されない。デバイス１５０上で、無線インタフェース１５２は、基地局１００によって無線接続１８０を介して送信されたパケットを受信する。符号化されたデータは、パケット復号され、ブロックベースの復号器１５４（例えば、高効率動画符号化（ＨＥＶＣ）復号器）を通過して、周波数帯域を復元する。次いで、ウェーブレット合成１５６が復元された周波数データ上で実行されて、ディスプレイ１５８のための画素データを再構成する。

いくつかの実施形態では、動画符号化システム１２０は、スライスベースのレンダリング、符号化、及び伝達を実行することができる。フレーム全体をレンダリング、符号化、及び送信することは、各フレームが完了し、記憶され、次いでＶＲ／ＭＲシステム１０の次のステージに送信される必要があるため、レイテンシ及びメモリへの影響を有し得る。スライスベースのレンダリングでは、フレーム全体を基地局１００内でレンダリングして符号化し、レンダリングされたフレームをデバイス１５０に送信するのではなく、基地局１００は、フレームの一部（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを準備でき次第デバイス１５０に送信してもよい。スライスは、例えば、１２８×１２８のブロック行であってもよい。スライスベースのレンダリング及び符号化は、レイテンシを低減するのに役立ち得、バッファに必要とされるメモリの量もまた低減することができ、これにより、チップ（単数又は複数）又はプロセッサ（単数又は複数）上のメモリの接地面積、並びに必要電力を低減する。

いくつかの実施形態では、動画符号化システム１２０は、タイルベースのレンダリング、符号化、及び伝達を実行することができる。タイルベースのレンダリング、符号化、及び伝達において、各スライスは、複数のタイル（例えば、４つのタイル）に分割されてもよく、基地局１００は、タイルをレンダリングして符号化し、符号化されたタイルを準備でき次第デバイス１５０に送信してもよい。

いくつかの実施形態では、動画符号化システム１２０は、単一の符号器１２６を使用して、タイルベースのレンダリング、符号化、及び伝達を実行し、各スライスからのタイルを処理することができる。しかしながら、いくつかの実施形態では、動画符号化システム１２０は、複数の符号化器１２６を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。図２は、少なくともいくつかの実施形態に係る、レンダリングされたフレームからのタイルを並行して処理する複数の符号化器（この例では２つの符号化器２２６Ａ及び２２６Ｂ）を含む動画符号化システム２２０を示す。

基地局２００のＧＰＵレンダリング２１０構成要素は、ディスプレイのためのフレーム（又はフレームのスライス）をレンダリングする１つ以上のＧＰＵ及び／又は他の構成要素を含み得る。フレームは、例えば図３Ａに示すように、スライスに分割されてもよい。図３Ａに示すように、各スライスは、複数のタイル（この例では４つ）に分割されてもよく、各タイルは複数のブロックを含む。図３Ｂは、４個の１２８×１２８のブロックを含む例示的なタイルを示す。しかしながら、いくつかの実施形態では、他のサイズ（例えば、６４×６４、３２×３２など）のブロックが使用されてもよく、タイルは、より多い又は、より少ないブロックを含んでもよい。

動画符号化システム２２０のプレフィルタ２２２及びウェーブレット変換２２４構成要素は、次いで、符号化２２６の前に各タイルを処理することができる。いくつかの実施形態では、動画符号化システム２２０は、各タイルを処理するための別個のプレフィルタ２２２構成要素及びウェーブレット変換２２４構成要素を含むことができる。この例では、プレフィルタ２２２Ａ構成要素及びウェーブレット変換２２４Ａ構成要素がタイル０を処理し、プレフィルタ２２２Ｂ構成要素及びウェーブレット変換２２４Ｂ構成要素がタイル１を処理し、プレフィルタ２２２Ｃ構成要素及びウェーブレット変換２２４Ｃ構成要素がタイル２を処理し、プレフィルタ２２２Ｄ構成要素及びウェーブレット変換２２４Ｄ構成要素がタイル３を処理する。プレフィルタ２２２構成要素は、本明細書に記載されるようなタイルのプレフィルタリングを実行し、ウェーブレット変換２２４構成要素は、本明細書に記載されるように、タイルを周波数帯域に分解する。しかしながら、いくつかの実施形態では、動画符号化システム２２０は、タイルを処理する単一のプレフィルタ２２２構成要素及び単一のウェーブレット変換２２４構成要素を含むことができる。いくつかの実施形態では、動画符号化システム２２０は、複数の（例えば、２つの）プレフィルタ２２２構成要素及び複数の（例えば、２つの）ウェーブレット変換２２４構成要素を含むことができ、それぞれが複数の（例えば、２つの）タイルを処理する。

２つの符号化器２２６Ａ及び２２６Ｂは、各スライスからの２つのタイル上で動作してもよい（例えば、符号化器２２６Ａはタイル０及びタイル１で動作し、符号化器２２６Ｂはタイル２及びタイル３上で動作する）。各符号化器２２６は、１６の時間単位を同じ周波数帯域からのブロックの処理の間で可能とするように、異なる周波数帯域（すなわち、図３Ｃに例示される３２×３２のブロック１６個）からのブロックの処理を２つのタイルの間で多重化してもよい。ブロックの処理を２つのタイル間で多重化することにより、同じ周波数帯域におけるブロック間の依存関係に適切に対処することができる。

各スライスが４つのタイルに分割され、２つの符号化器が各スライスからそれぞれのタイル上で動作する実施形態が記載されているが、いくつかの実施形態では、スライスをより多くのタイル（例えば、６つ又は８つのタイル）に分割することができ、いくつかの実施形態では、より多くの符号化器（例えば、３つ、４つ、又はそれ以上の符号化器）を使用することができる。

図３Ｃは、少なくともいくつかの実施形態に係る、符号化前に、画素データを記憶して周波数帯域データを生成する画素ブロックのウェーブレット変換を実行することを示す。この実施例では、ウェーブレット変換３２４構成要素によって２レベルウェーブレット分解が１２８×１２８の画素ブロック３００に適用されて、７つの周波数帯域を表す周波数データである１６個の３２×３２のブロック３０２を生成する。次いで、周波数ブロック３０２は、符号化のために符号化器３２６に提供される。例えば、周波数ブロック３０２は、ウェーブレット変換３２４構成要素によってバッファに書き込まれ、符号化器３２６構成要素によってバッファから読み出されてもよい。

周波数ブロック３０２のラベルにおいて、文字Ｌはローパスフィルタを表し、文字Ｈはハイパスフィルタを表す。ラベルが２文字のブロック３０２は、１レベル（２Ｄ）のウェーブレット変換又は分解を表す。ラベルが２文字のブロック３０２（７つの周波数帯域のうちの３つであるＬＨ、ＨＬ、及びＨＨを表す）において、第１の文字は、１番目に実行される垂直フィルタ（高又は低のいずれか）を表し、第２の文字は、２番目に実行される水平フィルタ（高又は低のいずれか）を表す。ラベルが４文字のブロック３０２は、２レベルのウェーブレット変換又は分解を表す。ラベルが４文字のブロック３０２において、第１の２文字（ＬＬ）は、最初に垂直ローパスフィルタが存在し、水平ローパスフィルタが続くことを示す。第２の２文字は、その結果生じたＬＬブロックがＬＬ、ＬＨ、ＨＬ、及びＨＨの４通りにフィルタリングされた（したがって、７つの周波数帯域のうちの４つ（ＬＬＬＬ、ＬＬＬＨ、ＬＬＨＬ、及びＬＬＨＨ）が生成されている）ことを示す。

図３Ｃに示すように画素データを周波数帯域に分解することにより、周波数帯域は、符号化器３２６によって別個のストリームとしてバッファリングされ、処理されることが可能となる。周波数帯域を別個のストリームとして処理することにより、符号化器３２６の構成要素は、独立したストリームの処理を多重化することが可能となる。ＨＥＶＣ符号化などのブロックベースの符号化方法では、ブロック（符号化ツリーユニット（ＣＴＵ）と呼ばれる）は、ブロック処理パイプラインにおいて複数のステージで処理される。２つ以上のブロックは、所与のクロックサイクルにおいてパイプラインの異なるステージにあってもよく、ブロックは、クロックのサイクルが進むにつれてパイプラインを通って移動する。所与のブロックの処理は、以前に処理された１つ以上の近隣ブロック、例えば、所与のブロックの上の行の１つ以上のブロック、及び／又は、所与のブロックの左側のブロックへの依存関係を有し得る。周波数帯域データのストリームの処理を多重化することによって、符号化器３２６は、所与のストリーム内のブロックの処理を間をあけて配置し、それにより、所与のブロックが依存関係を有する近隣ブロックを処理するために追加のクロックサイクルを提供する。例えば、所与のブロックが以前に処理された近隣ブロックに依存するステージに到達したときに、所与のブロックの左側のブロックは、パイプライン内で所与のブロックに数ステージ先行するブロックであってもよい。これにより、符号化器３２６は、以前に処理されたブロックに対する依存関係により適切に対処可能となり、隣接ブロックに依存するステージにおける所与のブロックの処理を行前に、パイプライン内の近隣ブロックの処理の完了を待つ必要性を低減又は排除することができる。

加えて、図３Ｃに示すように画素データを周波数帯域に分解することにより、符号化器３２６及び無線インタフェースによって周波数帯域の優先が可能となる。典型的に、画像及び動画送信では、より低い周波数がより重要である一方、より高い周波数の重要性は薄い。より高い周波数は、通常、画像の詳細に対応し、したがって、優先度は、より低いと見なすことができる。より高い周波数帯域には、画像内のエネルギーのより小さい割合が含まれる。エネルギーの大部分は、より低い周波数帯域に含まれる。このように、画素データを周波数帯域に分解することにより、データストリームを符号化及び送信するときに符号化器３２６及び無線インタフェースによって活用され得るデータストリームへの優先順位付けを提供する。例えば、いくつかの実施形態では、異なる圧縮技術を異なる周波数帯域に使用することができ、より低い優先度の帯域により積極的な圧縮を適用し、より高い優先度の帯域にはより控えめな圧縮を適用してもよい。別の例として、周波数帯域の優先順位付けは、ＶＲ／ＭＲシステムのグレースフルデグラデーションを提供するのに役立ち得る。無線接続の性能を監視することができ、デバイスからのフィードバックを考慮して、システム全体のパフォーマンスを追跡することができる。何らかの理由でシステムの性能が低下した場合、例えば、無線接続の質が低下し、無線接続の帯域幅容量が閾値を下回る場合、符号化器３２６及び無線インタフェースは、より低い周波数帯域の１つ以上の符号化及び送信を優先することができ、より低い優先度レベルを割り当てられた１つ以上の周波数レベル、例えば、１つ以上のより高い周波数帯域の符号化及び／若しくは送信を低減又は低下させることができる。

上述のように、ウェーブレット変換は、画像を周波数帯域に分解する。いくつかの実施形態では、これは、異なる解像度のディスプレイに同じ信号を送信するために活用されてもよい。一例として、２レベルのウェーブレット分解が適用されて、７つの帯域に信号を分解すると仮定する。４つのバンドが送信される場合（ＬＬＬＬ、ＬＬＬＨ、ＬＬＨＬ及びＬＬＨＨ）、帯域は、元の意図された解像度に、より低い視覚品質で再構成されてもよい。代替的に、帯域はまた、より低い表示解像度を有するディスプレイパネルに好適であり得る１／４解像度（各寸法において１／２）で再構成されてもよい。

図４は、少なくともいくつかの実施形態に係る、図１及び図２に示すような動画符号化システムを含むＶＲ／ＭＲシステムの動作方法の高レベルフローチャートである。４００で示されるように、デバイスは、無線接続を介して基地局にデータを送信する。４１０で示されるように、基地局は、デバイスのデータに少なくとも部分的に基づいて仮想コンテンツを含むフレームをレンダリングする。４２０で示されるように、基地局は、レンダリングされたデータを圧縮し、圧縮されたデータを無線接続を介してデバイスに送信する。４３０で示されるように、デバイスは、仮想コンテンツを展開して表示して、ユーザによる閲覧のための３Ｄ仮想ビューを生成する。４３０から４００に戻る矢印によって示されるように、この方法は、ユーザがＶＲ／ＭＲシステムを使用している限り継続する。

いくつかの実施形態では、フレーム全体を基地局内でレンダリングして符号化し、レンダリングされたフレームをデバイスに送信するのではなく、基地局は、フレームの一部（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを準備でき次第デバイスに送信してもよい。スライスは、例えば、１２８×１２８のブロック行であってもよい。いくつかの実施形態では、動画符号化システムは、タイルベースのレンダリング、符号化、及び伝達を実行することができる。タイルベースのレンダリング、符号化、及び伝達において、各スライスはそれぞれ１つ以上のブロックを含む複数のタイル（例えば、それぞれ４個のブロックを含む４つのタイル）に分割されてもよく、基地局は、タイルをレンダリングして符号化し、符号化されたタイルを準備でき次第デバイスに送信してもよい。

図５は、少なくともいくつかの実施形態に係る、図１に示すような動画符号化システムの動作方法のフローチャートである。図５の方法は、例えば、図４の４２０において実行されてもよい。図５の方法は、スライスベースの符号化及び送信が実行されていると仮定する。しかしながら、いくつかの実施形態では、タイルベースの符号化及び送信が実行されてもよい。

５１０で示されるように、プレフィルタ構成要素は、フレームのスライス内の画素ブロックにレンズワープ及び／又は中心窩フィルタを適用する。いくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープを実行することを含んでもよい。レンズワープは、画像が閲覧されるデバイス上のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。いくつかの実施形態では、デバイスは、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続を介してレンズワープデータを基地局に提供することができる。次いで、基地局は、そのデバイスのレンズワープデータに基づいて、フレーム上でレンズワープを実行することができる。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイスで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、デバイス上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、５１０でのプレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングもまた含んでもよい。いくつかの実施形態では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

５２０で示されるように、ウェーブレット変換構成要素は、画素ブロックにウェーブレット変換技術を適用して、画素データをＮ個の（例えば、７つの）周波数帯域に分解する。次いで、周波数帯域は、ブロックベースの符号化器に提供されるブロックに編成され、符号化／圧縮される。一例として、フレームを１２８×１２８のブロックに分割することができ、２レベルのウェーブレット分解を各１２８×１２８のブロックに適用して、例えば図３Ｃに示すように、７つの周波数帯域を表す周波数データの３２×３２ブロックを１６個生成することができる。

５３０で示されるように、符号化器は、符号化技術をブロック内の周波数帯域に適用して、データを圧縮する。符号化器は、例えば、高効率動画符号化（ＨＥＶＣ）符号化器であってもよい。しかしながら、いくつかの実施形態では、他の符号化技術が使用されてもよい。要素５２０で示されるように画素データを周波数帯域に分解することにより、周波数帯域は、符号化器によって別個のストリームとしてバッファリングされ、処理されることが可能となる。別個のストリームとして周波数帯域を処理することにより、符号化器の構成要素は、独立したストリームの処理を多重化することが可となる。ＨＥＶＣ符号化などのブロックベースの符号化方法では、ブロック（符号化ツリーユニット（ＣＴＵ）と呼ばれる）は、パイプラインにおいて複数のステージで処理される。２つ以上のブロックは、所与のクロックサイクルにおいてパイプラインの異なるステージにあってもよく、ブロックは、クロックのサイクルが進むにつれてパイプラインを通って移動する。所与のブロックの処理は、以前に処理された１つ以上の近隣ブロック、例えば、所与のブロックの上の行の１つ以上のブロック、及び／又は、所与のブロックの左側のブロックへの依存関係を有し得る。ストリームの処理を多重化することによって、符号化器は、所与のストリーム内のブロックの処理を間をあけて配置し、それにより、所与のブロックが依存関係を有する近隣ブロックを処理するために追加のクロックサイクルを提供する。例えば、所与のブロックが以前に処理された近隣ブロックに依存するステージに到達したときに、所与のブロックの左側のブロックは、パイプライン内で所与のブロックに数ステージ先行するブロックであってもよい。これにより、符号化器は、以前に処理されたブロックに対する依存関係により適切に対処可能となり、隣接ブロックに依存するステージにおける所与のブロックの処理を行う前に、パイプライン内の近隣ブロックの処理の完了を待つ必要性を低減又は排除することができる。

５４０で示されるように、無線インタフェースは、圧縮されたデータをパケット化し、無線接続を介してパケットをデバイスに送信する。

要素５２０で示されるように画素データを周波数帯域に分解することにより、要素５３０での符号化器及び要素５４０での無線インタフェースによって周波数帯域の優先が可能となる。典型的に、画像及び動画送信では、より低い周波数がより重要である一方、より高い周波数の重要性は薄い。より高い周波数は、通常、画像の詳細に対応し、したがって、優先度は、より低いと見なすことができる。より高い周波数帯域には、画像内のエネルギーのより小さい割合が含まれる。エネルギーの大部分は、より低い周波数帯域に含まれる。このように、画素データを周波数帯域に分解することにより、データストリームを符号化及び送信するときに符号化器及び無線インタフェースによって活用され得るデータストリームへの優先順位付けを提供する。例えば、いくつかの実施形態では、異なる圧縮技術を異なる周波数帯域に使用することができ、より低い優先度の帯域により積極的な圧縮を適用し、より高い優先度の帯域にはより控えめな圧縮を適用してもよい。別の例として、周波数帯域の優先順位付けは、ＶＲ／ＭＲシステムのグレースフルデグラデーションを提供するのに役立ち得る。無線接続の性能を監視することができ、デバイスからのフィードバックを考慮して、システム全体のパフォーマンスを追跡することができる。何らかの理由でシステムの性能が低下した場合、例えば、無線接続の質が低下し、無線接続の帯域幅容量が閾値を下回る場合、符号化器及び無線インタフェースは、より低い周波数帯域の１つ以上の符号化及び送信を優先することができ、より低い優先度レベルを割り当てられた１つ以上の周波数レベル、例えば、１つ以上のより高い周波数帯域の符号化及び／若しくは送信を低減又は低下させることができる。

５５０において、符号化及び送信されるスライスが更に存在する場合、方法は、要素５１０に戻り、次のスライスを処理する。さもなければ、５６０において、符号化及び送信されるフレームが更に存在する場合、方法は要素５１０に戻り、次のフレームの処理を開始する。

図６は、少なくともいくつかの実施形態に係る、図２に示すような動画符号化システムの動作方法のフローチャートである。図６の方法は、例えば、図４の４２０において実行されてもよい。図６の方法では、動画符号化システムは、複数の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。

６００で示されるように、レンダリングエンジンは、複数のタイル（この例では４つのタイル）を含むスライスをレンダリングし、各タイルは、複数の画素ブロック（この例では、４個の１２８×１２８の画素ブロック）を含む。

６１０で示されるように、プレフィルタ構成要素は、レンズワープ及び／又は中心窩フィルタをスライスに適用する。いくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープを実行することを含んでもよい。レンズワープは、画像が閲覧されるデバイス上のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。いくつかの実施形態では、デバイスは、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続を介してレンズワープデータを基地局に提供することができる。次いで、基地局は、そのデバイスのレンズワープデータに基づいて、フレーム上でレンズワープを実行することができる。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイスで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、デバイス上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、６１０でのプレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングもまた含んでもよい。いくつかの実施形態では、デバイスによって取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

いくつかの実施形態では、動画符号化システムは、タイルを処理する単一のプレフィルタ構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、各タイルを処理するための別個のプレフィルタ構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、それぞれが複数の（例えば、２つの）タイルを処理する、複数の（例えば、２つの）プレフィルタ構成要素を含み得る。

６２０で示されるように、ウェーブレット変換構成要素は、スライス内の画素ブロックにウェーブレット変換技術を適用して、画素データをＮ個の（例えば、７つの）周波数帯域に分解する。次いで、周波数帯域は、ブロックベースの符号化器に提供され得るブロック（例えば、ＣＴＵ）に編成される、符号化／圧縮される。一例として、フレームを１２８×１２８のブロックに分割することができ、２レベルのウェーブレット分解を各１２８×１２８のブロックに適用して、例えば図３Ｃに示すように、７つの周波数帯域を表す周波数データの３２×３２ブロックを１６個生成することができる。

いくつかの実施形態では、動画符号化システムは、タイルを処理する単一のウェーブレット変換構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、各タイルを処理するための別個のウェーブレット変換構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、それぞれが複数の（例えば、２つの）タイルを処理する、複数の（例えば、２つの）ウェーブレット変換構成要素を含み得る。

図６の方法では、例示的な動画符号化システムは、要素６２０において並行して生成されるスライスのうちの異なるものから周波数データのブロックを符号化するように構成された２つの符号化器を含む。例えば、第１の符号化器は、スライス０及び１からブロックを符号化するように構成されてもよく、第２の符号化器は、スライス２及び３からブロックを符号化するように構成されてもよい。６３０Ａで示されるように、第１の符号化器は、符号化技術をタイル０及び１のブロック内の周波数帯域に適用し、２つの異なるタイル間で異なる周波数帯域からブロックの処理を多重化する。６３０Ｂで示されるように、第２の符号化器は、符号化技術をタイル２及び３のブロック内の周波数帯域に適用し、２つの異なるタイル間で異なる周波数帯域からブロックの処理を多重化する。

符号化器は、例えば、高効率動画符号化（ＨＥＶＣ）符号化器であってもよい。しかしながら、いくつかの実施形態では、他の符号化技術が使用されてもよい。要素６２０で示されるように画素データを周波数帯域に分解することにより、周波数帯域は、要素６３０Ａ及び６３０Ｂでの符号化器によって別個のストリームとしてバッファリングされ、処理されることが可能となる。別個のストリームとして周波数帯域を処理することにより、符号化器は、独立したストリームの処理を多重化することが可能となる。ＨＥＶＣ符号化などのブロックベースの符号化方法では、ブロック（符号化ツリーユニット（ＣＴＵ）と呼ばれる）は、パイプラインにおいて複数のステージで処理される。２つ以上のブロックは、所与のクロックサイクルにおいてパイプラインの異なるステージにあってもよく、ブロックは、クロックのサイクルが進むにつれてパイプラインを通って移動する。所与のブロックの処理は、以前に処理された１つ以上の近隣ブロック、例えば、所与のブロックの上の行の１つ以上のブロック、及び／又は、所与のブロックの左側のブロックへの依存関係を有し得る。ストリームの処理を多重化することによって、符号化器は、所与のストリーム内のブロックの処理を間をあけて配置し、それにより、所与のブロックが依存関係を有する近隣ブロックを処理するために追加のクロックサイクルを提供する。例えば、所与のブロックが以前に処理された近隣ブロックに依存するステージに到達したときに、所与のブロックの左側のブロックは、パイプライン内で所与のブロックに数ステージ先行するブロックであってもよい。これにより、符号化器は、以前に処理されたブロックに対する依存関係により適切に対処可能となり、隣接ブロックに依存するステージにおける所与のブロックの処理を行う前に、パイプライン内の近隣ブロックの処理の完了を待つ必要性を低減又は排除することができる。

６４０で示されるように、無線インタフェースは、要素５３０で符号化器によって生成された圧縮データをパケット化し、無線接続を介してパケットをデバイスに送信する。６５０から６００に戻る矢印によって示されるように、この方法は、ユーザがＶＲ／ＭＲシステムを使用している限り継続する。

要素６２０で示されるように画素データを周波数帯域に分解することにより、要素６３０Ａ及び６３０Ｂでの符号化器並びに要素６４０での無線インタフェースによって周波数帯域の優先が可能となる。典型的に、画像及び動画送信では、より低い周波数がより重要である一方、より高い周波数の重要性は薄い。より高い周波数は、通常、画像の詳細に対応し、したがって、優先度は、より低いと見なすことができる。より高い周波数帯域には、画像内のエネルギーのより小さい割合が含まれる。エネルギーの大部分は、より低い周波数帯域に含まれる。このように、画素データを周波数帯域に分解することにより、データストリームを符号化及び送信するときに符号化器及び無線インタフェースによって活用され得るデータストリームへの優先順位付けを提供する。例えば、いくつかの実施形態では、異なる圧縮技術を異なる周波数帯域に使用することができ、より低い優先度の帯域により積極的な圧縮を適用し、より高い優先度の帯域にはより控えめな圧縮を適用してもよい。別の例として、周波数帯域の優先順位付けは、ＶＲ／ＭＲシステムのグレースフルデグラデーションを提供するのに役立ち得る。無線接続の性能を監視することができ、デバイスからのフィードバックを考慮して、システム全体のパフォーマンスを追跡することができる。何らかの理由でシステムの性能が低下した場合、例えば、無線接続の質が低下し、無線接続の帯域幅容量が閾値を下回る場合、符号化器及び無線インタフェースは、より低い周波数帯域の１つ以上の符号化及び送信を優先することができ、より低い優先度レベルを割り当てられた１つ以上の周波数レベル、例えば、１つ以上のより高い周波数帯域の符号化及び／若しくは送信を低減又は低下させることができる。

各スライスが４つのタイルに分割され、２つの符号化器が各スライスからのそれぞれのタイル上で動作する実施形態が記載されているが、いくつかの実施形態では、スライスをより多くのタイル（例えば、６つ又は８つのタイル）に分割することができ、いくつかの実施形態では、より多くの符号化器（例えば、３つ又は４つの符号化器）が使用されてもよい。
レート制御

符号化器は、目標ビットレートを達成するために符号化器パラメータを動的に調整するレート制御方法又はアルゴリズムを採用することができる。レート制御方法は、無線接続の利用可能な帯域幅に基づいて、動画ビットレートを推定することができる。推定ビットレートは、符号化ビットストリームが利用可能な帯域幅の使用を最適化しながら首尾よく送信され得ることを確実にするために、符号化器パラメータを調整するために使用され得る。典型的には、動画ストリーミングシステムのレート制御方法は、動画ビットレートを推定し、それに応じて符号化器パラメータを調整するために、フレーム又は２フレームの時間定数にわたって機能する。

本明細書に記載されるような動画符号化システムの実施形態を実装するＶＲ／ＭＲシステムの目標は、エラー（例えば、パケット廃棄）を最小限に抑え、無線接続を介する帯域幅の使用を最大化しつつ、仮想コンテンツが基地局上にレンダリングされる時間と、仮想コンテンツがデバイス上に表示される時間との間の、非常に低いレイテンシ（例えば、４～５ミリ秒）を提供することであってもよい。システムの目標とする低レイテンシは、デバイスへの無線接続を介して送信されるデータを符号化する際の符号化器におけるレート制御のための課題である。

いくつかの実施形態では、動画符号化システムは、フレームのスライスからの画素のブロック（例えば、６４×６４の又は１２８×１２８のブロック）を、複数の（例えば、７つの）異なる周波数帯域に分解する２層ウェーブレット分解を実行するウェーブレット変換構成要素と、続いて、周波数帯域を符号化するＨＥＶＣなどのブロックベースの符号化器とを含む。いくつかの実施形態では、レート制御構成要素は、ＶＲ／ＭＲシステムの厳密なレイテンシ要件下でレート制御を実行するために、１フレーム又は２フレームの時定数にわたって動作する代わりに、各スライスの符号化器パラメータ（例えば、周波数帯域の量子化パラメータ）を調整することができる。いくつかの実施形態では、スライスの周波数帯域は、ウェーブレット変換後にローカルメモリ内にバッファリングされてもよく、それにより、複雑度統計値は、例えば、動画符号化システムの複雑性分析構成要素によって、符号化の前に、周波数帯域にわたって計算され得る。いくつかの実施形態では、複雑度統計値は、ＣＴＵブロックの画素勾配及びサイズの分散のうちの１つ以上を含んでもよいが、これらに限定されない。複雑度統計値は、次に、現在のスライスの符号化器内のレートを調節するための周波数帯域の量子化パラメータを決定する際に、レート制御構成要素によって使用されてもよい。バッファリングされた周波数帯域上の複雑度統計値を計算することにより、動画符号化システムは、スライスを符号化する前にスライスにおける複雑さの量を推定することができる。

いくつかの実施形態では、レート制御構成要素は、１つ以上の以前に処理されたフレームに関する統計値を検査して、フレームの同一場所のブロック又はスライスを符号化するために使用されたビットの実際の数を決定することができる。次に、この情報は、現在のスライスの量子化パラメータを決定する際に、現在のスライスの複雑性統計値と組み合わせて使用され得る。

図７は、少なくともいくつかの実施形態に係る、周波数帯域の複雑度統計値が符号化の前に計算され、符号化のための量子化パラメータを生成する際に使用される、図１又は２に示すような動画符号化システムを示すブロック図である。

いくつかの実施形態では、画素データを含むフレームのレンダリングされたスライスは、最初に、プレフィルタ１００４構成要素、例えば、Ｎチャネルのフィルタバンクによって処理される。いくつかの実施形態では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。

プレフィルタ１００４の出力は、ウェーブレット変換１００６構成要素によって処理される。いくつかの実施形態では、ウェーブレット変換１００６構成要素は、フレームのスライスからの画素のブロック（例えば、６４×６４又は１２８×１２８のブロック）を複数の（例えば、７つの）異なる周波数帯域に分解する、２層ウェーブレット分解を実行する。スライスの周波数帯域は、ウェーブレット変換１００５の後にバッファ１００８されてもよく、それにより、複雑度統計値は、符号化の前に動画符号化システムの複雑度分析１０５０構成要素によって、スライスの周波数帯域にわたって計算され得る。いくつかの実施形態では、複雑度統計値は、ＣＴＵブロックの画素勾配及びサイズの分散のうちの１つ以上を含んでもよいが、これらに限定されない。複雑度分析１０５０構成要素は、スライス内の周波数帯域の複雑度統計値を符号化器１００８のレート制御１０１８構成要素に提供する。次いで、レート制御１０１８構成要素は、複雑度統計値に少なくとも部分的に基づいて、スライス内の周波数帯域のそれぞれについて量子化パラメータを計算する。

いくつかの実施形態では、周波数帯域の量子化パラメータは、復号器による再構成及びウェーブレット合成がデバイス上で実行された後のフレームの全体的な表示品質を最適化しながら、周波数帯域間のレートを割り当てるために、レート制御１０１８構成要素によって合同して計算されてもよい。周波数帯域間のレート割り当てのための方法は、動作レート歪み曲線上で等しい勾配をもたらす周波数帯域のそれぞれにおける動作点を見つけることである。いくつかの実施形態では、動作レート歪み曲線は、係数のレートが６ステップの量子化パラメータによく近似し得るという事実により、符号化器パイプライン１０２０のエントロピー符号化ステージからの統計値の組み合わせを使用して推定されてもよい。

いくつかの実施形態では、レート制御１０１８構成要素は、１つ以上の以前に処理されたフレームに関する統計値を検査して、フレームの同一場所のブロック又はスライスを符号化するために使用されたビットの実際の数を決定することができる。次に、この情報は、現在のスライスの量子化パラメータを決定する際に、現在のスライスの複雑度統計値と組み合わせて使用され得る。

いくつかの実施形態では、同一画像内において周囲の領域（例えば、周辺領域）よりも高い解像度を有するべき関心領域（例えば、中心窩領域）が画像内に存在してもよい。いくつかの実施形態では、前のフレームからの複雑度統計値は、前のフレームからの中心窩領域と共に記憶され、現在のフレームのスライスにおける周波数帯域の量子化パラメータを計算する際にレート制御１０１８構成要素によって使用され得る。一例として、符号化される各ブロックについて、前のフレームの中心窩領域を使用して、前のフレームについて計算された複雑度統計値を調節することができる。これにより得られた複雑度統計値は、次いで、量子化パラメータを決定する際に、現在のフレームのスライスについて計算された複雑度統計値に加えて使用され得る。

レート制御１０１８構成要素は、現在のスライスの周波数帯域を符号化するために量子化パラメータを使用するブロック処理パイプライン１０２０に、スライス内の周波数帯域の量子化パラメータを提供する。符号化された周波数帯域は、無線インタフェース１０１０に提供され、無線インタフェース１０１０は、符号化された周波数帯域をパケット化し無線接続１０８０を介してデバイスに送信する。

動画符号化システムの目標は、帯域幅使用を最大化し、デバイスへの無線接続１０８０のレイテンシを最小化する一方で、デバイスに対する動画ストリームの品質を最適化することである。いくつかの実施形態では、この目標を達成するのを助けるために、無線インタフェース１０１０は、現在の無線接続情報を、符号化器１００８のレート制御１０１８構成要素にフィードバックとして提供してもよい。レート制御構成要素１０１８は、周波数帯域の量子化パラメータを決定する際にこの情報を使用してもよい。いくつかの実施形態では、無線インタフェース１０１０は、無線接続１０８０の瞬時総ビットレートを追跡することができ、また、接続１０８０上のパケット廃棄率を追跡してもよい。いくつかの実施形態では、無線インタフェース１０１０は、無線接続１０８０の現在のビットレートをレート制御１０１８構成要素にフィードバックする。レート制御１０１８構成要素は、この情報を使用して、利用可能なビットレートを異なる周波数帯域の間で割り当てることができる。例えば、無線接続１０８０のビットレートが現在低い場合、レート制御１０１８構成要素は、より高い周波数帯域の１つ以上に、より少ないビットをこれらの帯域に割り当てるように、量子化パラメータを調整することができる。いくつかの実施形態では、無線インタフェース１０１０はまた、無線接続１０８０の現在のパケット廃棄率をレート制御１０１８構成要素にフィードバックする。レート制御１０１８構成要素は、動画ストリームの品質を最適化するために、現在のビットレートでの帯域幅使用を最大化しながら、パケット廃棄率を低減又は最小化するように周波数帯域の量子化パラメータの調整をバランスさせるため、現在のパケット廃棄率及び現在のビットレートを使用してもよい。

いくつかの実施形態では、レート制御１０１８構成要素は、スライスレベルではなくブロックレベルで周波数帯域の量子化パラメータを調整することができる。

図８は、少なくともいくつかの実施形態に係る、図７に示すような動画符号化システムの動作方法のフローチャートである。１１００で示されるように、プレフィルタ構成要素は、フレーム（単数又は複数）の中心窩領域を判定し、スライス内の画素データをプレフィルタリングする。いくつかの実施形態では、画素データを含むフレームのレンダリングされたスライスは、最初に、プレフィルタ構成要素、例えば、Ｎチャネルのフィルタバンクによって処理される。いくつかの実施形態では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。

１１１０で示されるように、ウェーブレット変換構成要素は、プレフィルタリングされた画素データをＮ個の（例えば、７つの）周波数帯域に分解する。いくつかの実施形態では、ウェーブレット変換構成要素は、フレームのスライスからの画素のブロック（例えば、６４×６４又は１２８×１２８のブロック）を、複数の（例えば、７つの）異なる周波数帯域に分解する、２層ウェーブレット分解を実行する。スライスの周波数帯域は、符号化前に動画符号化システムの複雑度分析構成要素によって、スライスの周波数帯域にわたって複雑度統計値を計算することができるように、ウェーブレット変換後にバッファリングされてもよい。

１１２０で示されるように、複雑度分析構成要素は、周波数帯域にわたる複雑度統計値を計算する。いくつかの実施形態では、複雑度統計値は、ＣＴＵブロックの画素勾配及びサイズの分散のうちの１つ以上を含んでもよいが、これらに限定されない。複雑度分析構成要素は、スライス内の周波数帯域の複雑度統計値を符号化器のレート制御構成要素に提供する。

１１３０で示されるように、符号化器レート制御構成要素は、複雑度統計値に少なくとも部分的に基づいて、スライス内の周波数帯域のそれぞれについて量子化パラメータを決定する。いくつかの実施形態では、周波数帯域の量子化パラメータは、復号器による再構成及びウェーブレット合成がデバイス上で実行された後のフレームの全体的な表示品質を最適化しながら、周波数帯域間のレートを割り当てるために、レート制御構成要素によって合同して計算されてもよい。周波数帯域間のレート割り当てのための方法は、動作レート歪み曲線上で等しい勾配をもたらす周波数帯域のそれぞれにおける動作点を見つけることである。いくつかの実施形態では、動作レート歪み曲線は、係数のレートが６ステップの量子化パラメータによく近似し得るという事実により、符号化器パイプライン１０２０のエントロピー符号化ステージからの統計値の組み合わせを使用して推定されてもよい。

いくつかの実施形態では、レート制御構成要素は、１つ以上の以前に処理されたフレームに関する統計値を検査して、フレームの同一場所のブロック又はスライスを符号化するために使用されたビットの実際の数を決定することができる。次に、この情報は、現在のスライスの量子化パラメータを決定する際に、現在のスライスの複雑度統計値と組み合わせて使用され得る。

いくつかの実施形態では、同一画像内において周囲の領域（例えば、周辺領域）よりも高い解像度を有するべき関心領域（例えば、中心窩領域）が画像内に存在してもよい。いくつかの実施形態では、前のフレームからの複雑度統計値は、前のフレームからの中心窩領域と共に記憶され、現在のフレームのスライスにおける周波数帯域の量子化パラメータを計算する際にレート制御構成要素によって使用され得る。一例として、符号化される各ブロックについて、前のフレームの中心窩領域を使用して、前のフレームについて計算された複雑度統計値を調節することができる。これにより得られた複雑度統計値は、次いで、量子化パラメータを決定する際に、現在のフレームのスライスについて計算された複雑度統計値に加えて使用され得る。

１１４０で示されるように、符号化器（例えば、ＨＥＶＣ符号化器）は、量子化パラメータを使用して符号化技術を周波数帯域に適用して、データを圧縮する。レート制御構成要素は、現在のスライスの周波数帯域を符号化するために量子化パラメータを使用する符号化器のブロック処理パイプラインに、スライス内の周波数帯域の量子化パラメータを提供する。符号化された周波数帯域は、基地局の無線インタフェースに提供される。

１１５０で示されるように、無線インタフェースは圧縮されたデータをパケット化し、無線接続を介してデバイスに送信する。いくつかの実施形態では、無線インタフェースは、現在の無線接続情報を、符号化器のレート制御構成要素にフィードバックとして提供してもよい。レート制御構成要素は、周波数帯域の量子化パラメータを決定する際に、この情報を使用してもよい。いくつかの実施形態では、無線インタフェースは、無線接続の瞬時総ビットレートを追跡することができ、また、接続上のパケット廃棄率を追跡してもよい。いくつかの実施形態では、レート制御構成要素は、異なる周波数帯域の間で利用可能なビットレートを割り当てるために、無線接続の現在のビットレートを使用することができる。いくつかの実施形態では、レート制御構成要素は、現在のビットレートでの動画ストリームの品質を最適化するために、パケット廃棄率を低減又は最小化するように周波数帯域の量子化パラメータの調整をバランスさせるため、現在のパケット廃棄率及び現在のビットレートを使用してもよい。

要素１１６０から要素１１００に戻る矢印によって示されるように、方法は、デバイスに送信されるデータが存在する限り継続してもよい。
例示的なＶＲ／ＭＲシステム

図９は、少なくともいくつかの実施形態に係る、動画符号化システムを実装することができる例示的なＶＲ／ＭＲシステム２０００を示す。ＶＲ／ＭＲシステム２０００は、少なくとも１つのデバイス２１５０（例えば、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、ハンドヘルドコンピューティングデバイス、又はユーザによって装着され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのＨＭＤ）及びコンピューティングデバイス２１００（本明細書では基地局と呼ばれる）を含んでもよい。基地局２１００は、仮想コンテンツを含むＶＲ又はＭＲフレームをレンダリングし、フレームを符号化し、デバイス２１５０によって復号され表示されるように、符号化されたフレームを無線接続２１８０を介してデバイス２１５０に送信する。

基地局２１００及びデバイス２１５０はそれぞれ、基地局２１００及びデバイス２１５０が無線接続２１８０を介してデータを通信し交換することを可能にする無線通信技術を含み得る。いくつかの実施形態では、無線接続２１８０は、デバイス２１５０と基地局２１００との間に高指向性無線リンクを提供する独自の無線通信技術に従って実装されてもよい。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

いくつかの実施形態では、ＨＭＤ２１５０は、ユーザの環境に関する情報（例えば、動画、深度情報、照明情報など）、及び／又はユーザに関する情報（例えば、ユーザの表情、眼の動き、視線の方向、手のジェスチャなど）を収集するセンサを含んでもよい。デバイス２１５０は、センサによって収集された情報の少なくとも一部を、無線接続２１８０を介して基地局２１００に送信してもよい。基地局２１００は、センサから取得された様々な情報に少なくとも部分的に基づいて、仮想コンテンツを含むデバイス２１５０によって表示するためのフレームをレンダリングし、フレームを符号化し、符号化されたフレームを、復号しユーザに対し表示するために、無線接続２１８０を介してデバイス２１５０に送信することができる。フレームを符号化し送信するために、基地局２１００は、図１～図８に示すような動画符号化システムを実装してもよい。

図１０は、いくつかの実施形態に係る、図９に示すような例示的なＶＲ／ＭＲシステムの機能部品及び処理を示すブロック図である。デバイス２１５０は、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、ハンドヘルドコンピューティングデバイス、又はユーザによって着用され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのＨＭＤであってもよいが、これらに限定されない。デバイス２１５０は、様々なタイプの仮想又は拡張現実ディスプレイ技術のいずれかを実装することができるディスプレイ２１５６構成要素又はサブシステムを含み得る。例えば、ＨＭＤデバイス２１５０は、ＤＬＰ（digital light processing、デジタル光処理）、ＬＣＤ（liquid crystal display、液晶表示）、及びＬＣｏＳ（liquid crystal on silicon、反射型液晶素子）技術によるＶＲシステムなどの、ユーザの眼の前のスクリーン上にユーザが見る左右の画像を表示する、ニアアイシステムであってもよい。別の実施例として、ＨＭＤデバイス２１５０は、左右の画像を画素ごとにユーザの眼に走査する直接網膜投射システムであってもよい。画像を走査するために、左右のプロジェクタは、ユーザの眼の前に位置する左右の反射性構成要素（例えば、楕円面鏡）に向けられたビームを生成し、反射性構成要素は、ビームをユーザの眼に反射させる。３次元（３Ｄ）効果を生み出すために、３Ｄ仮想ビュー内で異なる奥行き又は距離にある仮想コンテンツは、三角測量による距離に応じて、より近いオブジェクトは、より遠くのオブジェクト以上にシフトされるように、２つの画像内で左又は右にシフトされる。

デバイス２１５０はまた、本明細書に記載されるようなＶＲ／ＭＲシステム２０００のデバイス側機能を実装するように構成されたコントローラ２１５４を含んでもよい。いくつかの実施形態では、デバイス２１５０はまた、コントローラ２１５４によって実行可能なＶＲ／ＭＲシステム２０００のデバイス構成要素のソフトウェア（コード２１７２）を記憶するように構成されたメモリ２１７０、並びに、コントローラ２１５４上で実行するときにソフトウェアによって使用され得るデータ２１７４を含んでもよい。各種実施形態では、コントローラ２１５４は、１つのプロセッサを含むユニプロセッサシステム、又はいくつかのプロセッサ（例えば、２つ、４つ、８つ、若しくは他の好適な数）を含むマルチプロセッサシステムであってもよい。コントローラ２１５４は、任意の好適な命令セットアーキテクチャを実装するように構成された中央処理装置（ＣＰＵ）を含んでもよく、その命令セットアーキテクチャで定義された命令を実行するように構成されてもよい。例えば、各種実施形態では、コントローラ２１５４は、ｘ８６、ＰｏｗｅｒＰＣ、ＳＰＡＲＣ、ＲＩＳＣ、若しくはＭＩＰＳ命令セットアーキテクチャ（instruction set architecture、ＩＳＡ）、又は任意の他の好適なＩＳＡなどの、様々なＩＳＡのいずれかを実装する汎用プロセッサ又は組み込みプロセッサを含んでもよい。マルチプロセッサシステムでは、プロセッサの各々は、必ずしもではないが、同一のＩＳＡを共通して実装してもよい。コントローラ２１５４は、スカラ方式、スーパースカラ方式、パイプライン方式、スーパーパイプライン方式、アウトオブオーダ方式、インオーダ方式、スペキュレーティブ方式、非スペキュレーティブ方式など、又はそれらの組み合わせを含む、任意のマイクロアーキテクチャを採用してもよい。コントローラ２１５４は、マイクロコーディング技術を実装するための回路を含んでもよい。コントローラ２１５４は、各々が命令を実行するように構成された１つ以上の処理コアを含んでもよい。コントローラ２１５４は、任意のサイズ及び任意の構成（セットアソシエイティブ方式、ダイレクトマップ方式など）を用いることができる、１つ以上のレベルのキャッシュを含んでもよい。いくつかの実施形態では、コントローラ２１５４は、任意の好適なグラフィック処理回路を含むことができる、少なくとも１つのグラフィック処理ユニット（ＧＰＵ）を含むことができる。概して、ＧＰＵは、フレームバッファに表示されることになるオブジェクト（例えば、フレーム全体に対するピクセルデータを含むもの）をレンダリングするように構成されてもよい。ＧＰＵは、グラフィック演算の一部若しくは全て、又は特定のグラフィック演算のハードウェア高速化を実行するグラフィックソフトウェアを実行することができる、１つ以上のグラフィックプロセッサを含んでもよい。いくつかの実施形態では、コントローラ２１５４は、動画及び／又は画像を処理してレンダリングするための１つ以上の他の構成要素、例えば、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などを含んでもよい。いくつかの実施形態では、コントローラ２１５４は、少なくとも１つのシステムオンチップ（ＳＯＣ）を含んでもよい。

メモリ２１７０は、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、ダブルデータレート（ＤＤＲ、ＤＤＲ２、ＤＤＲ３など）ＳＤＲＡＭ（ｍＤＤＲ３などのモバイルバージョンのＳＤＲＡＭ又はＬＰＤＤＲ２などの低電力バージョンのＳＤＲＡＭを含む）、ＲＡＭＢＵＳＤＲＡＭ（ＲＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）などの、任意のタイプのメモリを含んでもよい。いくつかの実施形態では、１つ以上のメモリデバイスは、シングルインラインメモリモジュール（ＳＩＭＭ）、デュアルインラインメモリモジュール（ＤＩＭＭ）などのメモリモジュールを形成するために回路基板に結合されてもよい。代替的に、デバイスは、システムをチップオンチップ構成、パッケージオンパッケージ構成、又はマルチチップモジュール構成で実装する集積回路を搭載してもよい。

いくつかの実施形態では、センサ２１６０は、ユーザの眼の位置及び動きを追跡するために使用され得る１つ以上の視線追跡センサ（例えば、赤外線照明光源を有する赤外線カメラ）を含んでもよいが、これらに限定されない。いくつかの実施形態では、各視線追跡センサがそれぞれの眼を追跡する、２つの視線追跡センサが存在してもよい。いくつかの実施形態では、視線追跡センサによって収集された情報は、基地局２１００による画像のレンダリングを調整するため、かつ／又はユーザの眼が見ている方向及び角度に基づいて、デバイス２１５０の投影システムによる画像の投影を調節するために使用されてもよい。例えば、いくつかの実施形態では、ユーザの眼が現在見ている場所の周囲の領域内の画像のコンテンツは、ユーザが見ていない領域内のコンテンツよりも詳細かつより高い解像度でレンダリングされてもよい。これにより、画像データのための利用可能な処理時間が、眼の周辺領域によって見るコンテンツにではなく、眼の中心窩領域によって見るコンテンツに費やされることを可能にする。同様に、ユーザが見ていない領域内の画像のコンテンツは、ユーザが現在見ている地点の周囲の領域のコンテンツよりも多く圧縮されてもよい。いくつかの実施形態では、センサがユーザの眼のそれぞれの眼の眺めを有するような位置に、デバイス２１５０の内側表面上に位置する２つの視線追跡センサが存在してもよい。しかしながら、各種実施形態では、より多くの又はより少ない視線追跡センサが使用されてもよく、視線追跡センサは他の位置に位置してもよい。例示的な非限定的な実施形態では、各視線追跡センサは、赤外線光源及び赤外線カメラ、例えば、１２０ＦＰＳ以上のフレームレート、７０度の水平視野（ＨＦＯＶ）、及び１０～８０ミリメートル（ｍｍ）の作動距離を有する４００ｘ４００画素数のカメラを含んでもよい。

いくつかの実施形態では、デバイス２１５０は、デバイス２１５０の位置、向き、及び／又は動きを検出し、検出した位置、向き、及び／又は動きデータをデバイス２１５０のコントローラ２１５４及び／又は基地局２１００に提供するように構成された、少なくとも１つの慣性測定ユニット（inertial-measurement unit、ＩＭＵ）２１６２を含み得る。

デバイス２１５０はまた、無線接続２１８０を介して外部基地局２１００と通信して、基地局２１００にセンサ入力を送信し、レンダリングされ圧縮されたフレーム、スライス、又はタイルを基地局２１００から受信するように構成された無線インタフェース２１５２を含んでもよい。いくつかの実施形態では、無線インタフェース２１５２は、デバイス２１５０と基地局２１００との間に高指向性無線リンクを提供する独自の無線通信技術を実装することができる。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

基地局２１００は、無線インタフェース２１８０を介してデバイス２１５０に通信可能に結合された外部デバイス（例えば、コンピューティングシステム、ゲームコンソールなど）であってもよい。基地局２１００は、動画及び／又は画像をレンダリングし、フィルタリングし、符号化し、送信するための様々なタイプのプロセッサ（例えば、ＳＯＣ、ＣＰＵ、ＩＳＰ、ＧＰＵ、コーデック、及び／又は他の構成要素）のうちの１つ以上を含んでもよい。基地局２１００は、無線接続２１８０を介してセンサ２１６０から取得した様々な入力に少なくとも部分的に基づく仮想コンテンツを含むフレーム（各フレームは左右画像を含む）をレンダリングし、レンダリングしたフレーム（又はフレームのスライス）を本明細書に記載されるような動画符号化システムを使用してフィルタリングかつ圧縮し、圧縮されたフレーム又はスライスをデバイス２１５０に送信して表示することができる。

基地局２１００は、デスクトップコンピュータ、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、ハンドヘルドコンピュータデバイス、ゲームコントローラ、ゲームシステムなどの任意のタイプのコンピューティングシステム若しくはコンピューティングデバイスであってもよく、又はそれを含んでもよい。基地局２１００は、本明細書に記載されるような動画符号化システムを含むＶＲ／ＭＲシステム２０００の基地局側機能を実装する１つ以上のプロセッサを備えるコントローラ２１１０を含んでもよい。基地局２１００はまた、基地局コントローラ２１１０によって実行可能なＶＲ／ＭＲシステム２０００の基地局構成要素のソフトウェア（コード２１２２）を記憶するように構成されたメモリ２１２０、並びに、コントローラ２１１０上で実行するときにソフトウェアによって使用され得るデータ２１２４を含んでもよい。

各種実施形態では、基地局コントローラ２１１０は、１つのプロセッサを含むユニプロセッサシステム、又はいくつかのプロセッサ（例えば、２つ、４つ、８つ、若しくは他の好適な数）を含むマルチプロセッサシステムであってもよい。コントローラ２１１０は、任意の好適な命令セットアーキテクチャを実装するように構成された中央処理装置（ＣＰＵ）を含んでもよく、その命令セットアーキテクチャで定義された命令を実行するように構成されてもよい。例えば、各種実施形態では、コントローラ２１１０は、ｘ８６、ＰｏｗｅｒＰＣ、ＳＰＡＲＣ、ＲＩＳＣ、若しくはＭＩＰＳ命令セットアーキテクチャ（ＩＳＡ）、又は任意の他の好適なＩＳＡなどの、様々なＩＳＡのいずれかを実装する汎用プロセッサ又は組み込みプロセッサを含んでもよい。マルチプロセッサシステムでは、プロセッサの各々は、必ずしもではないが、同一のＩＳＡを共通して実装してもよい。コントローラ２１１０は、スカラ方式、スーパースカラ方式、パイプライン方式、スーパーパイプライン方式、アウトオブオーダ方式、インオーダ方式、スペキュレーティブ方式、非スペキュレーティブ方式など、又はそれらの組み合わせを含む、任意のマイクロアーキテクチャを採用してもよい。コントローラ２１１０は、マイクロコーディング技術を実装するための回路を含んでもよい。コントローラ２１１０は、各々が命令を実行するように構成された１つ以上の処理コアを含んでもよい。コントローラ２１１０は、任意のサイズ及び任意の構成（セットアソシエイティブ方式、ダイレクトマップ方式など）を用いることができる、１つ以上のレベルのキャッシュを含んでもよい。いくつかの実施形態では、コントローラ２１１０は、任意の好適なグラフィック処理回路を含むことができる、少なくとも１つのグラフィック処理ユニット（ＧＰＵ）を含むことができる。概して、ＧＰＵは、フレームバッファに表示されることになるオブジェクト（例えば、フレーム全体に対するピクセルデータを含むもの）をレンダリングするように構成されてもよい。ＧＰＵは、グラフィック演算の一部若しくは全て、又は特定のグラフィック演算のハードウェア高速化を実行するグラフィックソフトウェアを実行することができる、１つ以上のグラフィックプロセッサを含んでもよい。いくつかの実施形態では、コントローラ２１１０は、本明細書に記載されるような動画及び／又は画像を処理し、レンダリングし、フィルタリングし、符号化するための１つ以上の他の構成要素、例えば、様々なタイプの集積回路（ＩＣ）、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などのうちの１つ以上を含んでもよい。いくつかの実施形態では、コントローラ２１１０は、少なくとも１つのシステムオンチップ（ＳＯＣ）を含んでもよい。

基地局メモリ２１２０は、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、ダブルデータレート（ＤＤＲ、ＤＤＲ２、ＤＤＲ３など）ＳＤＲＡＭ（ｍＤＤＲ３などのモバイルバージョンのＳＤＲＡＭ又はＬＰＤＤＲ２などの低電力バージョンのＳＤＲＡＭを含む）、ＲＡＭＢＵＳＤＲＡＭ（ＲＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）などの、任意のタイプのメモリを含んでもよい。いくつかの実施形態では、１つ以上のメモリデバイスは、シングルインラインメモリモジュール（ＳＩＭＭ）、デュアルインラインメモリモジュール（ＤＩＭＭ）などのメモリモジュールを形成するために回路基板に結合されてもよい。代替的に、デバイスは、システムをチップオンチップ構成、パッケージオンパッケージ構成、又はマルチチップモジュール構成で実装する集積回路を搭載してもよい。

基地局２１００は、無線接続２１８０を介してデバイス２１５０と通信して、デバイス２１５０からセンサ入力を受信し、基地局２１００からデバイス２１５０に圧縮フレーム、スライス、又はタイルを送信するように構成された１つ以上の無線技術インタフェース２１３０をまた含み得る。いくつかの実施形態では、無線技術インタフェース２１３０は、デバイス２１５０と基地局２１００との間に高指向性無線リンクを提供する独自の無線通信技術を実装することができる。いくつかの実施形態では、無線通信技術の指向性及び帯域幅は、複数のデバイス２１５０が同時に基地局２１００と通信することをサポートすることができ、それにより、複数のユーザが共同設置環境において同時にシステム２０００を使用することを可能にし得る。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

いくつかの実施形態では、基地局２１００は、フレームをレンダリングしてデバイス２１５０に送信し、デバイス２１５０から受信したセンサ２１６０の入力に少なくとも部分的に基づいて、３Ｄ仮想ビューをユーザのために提供するように構成されていてもよい。いくつかの実施形態では、仮想ビューは、ユーザの環境の高画質、高解像度の動画をリアルタイムでキャプチャし表示する、１つ以上のシーンカメラ（例えば、ＲＧＢ（可視光）動画カメラ）によってキャプチャされた動画に基づいて、ユーザの環境内の実際のオブジェクトのレンダリングを含む、ユーザの環境のレンダリングを含むことができる。いくつかの実施形態では、仮想ビューはまた、基地局２１００によってレンダリングされ、ユーザの現実環境の投影された３Ｄビューと合成された仮想コンテンツ（例えば、仮想オブジェクト、現実オブジェクトの仮想タグ、ユーザのアバターなど）を含んでもよい。

図９及び１０には示されていないが、いくつかの実施形態では、ＶＲ／ＭＲシステム２０００は、１つ以上の他の構成要素を含んでいてもよい。例えば、システムは、仮想コンテンツと対話するために３Ｄ仮想ビュー内の仮想カーソルを移動させるためのカーソル制御デバイス（例えば、マウス）を含んでもよい。図９及び図１０は、単一のデバイス２１５０を示すが、いくつかの実施形態では、ＶＲ／ＭＲシステム２０００は、複数のデバイス２１５０が同時に基地局２１００と通信することをサポートすることができ、それにより、複数のユーザが共同設置環境において同時にシステムを使用することを可能にし得る。

本明細書で説明される方法は、異なる実施形態では、ソフトウェア、ハードウェア、又はそれらの組み合わせの形態で実行されてもよい。加えて、方法のブロックの順序は変更されてもよく、様々な要素の追加、再順序付け、組み合わせ、省略、修正などが行われてもよい。本開示の利益を得る当業者にとって明白であるような、様々な修正及び変更が行われてもよい。本明細書に記載される各種実施形態は、例示的なものであり、限定的なものではない。多くの変形、修正、追加、及び改善が可能である。したがって、単一の事例として本明細書に記載される構成要素について、複数の事例を提供することができる。種々の構成要素、動作及びデータストアの間の境界は、ある程度任意のものであり、特定の動作は、特定の例示的な構成の文脈において示される。機能性の他の割り当てが想定され、以下に続く請求項の範囲内に含まれてもよい。最後に、例示的な構成における別個の構成要素として提示された構造及び機能性は、組み合わされた構造又は構成要素として実施されてもよい。それらの及び他の変形、修正、追加、及び改善は、以下に続く請求項で定義されるように、実施形態の範囲内に含まれてもよい。

Claims

動画符号化システムであって、
ブロックベースの符号化器と、
現在の動画フレームのスライスからの複数の画素ブロックにウェーブレット変換を適用して、前記スライスからの前記画素ブロックを複数の周波数帯域に分解し、前記スライスの前記周波数帯域に関する周波数データを含む周波数ブロックをバッファに出力するように構成された１つ以上のプロセッサを含むウェーブレット変換構成要素と、
前記スライスの前記バッファリングされた周波数帯域にわたる複雑度統計値を計算し、前記スライスの前記周波数帯域の前記複雑度統計値を前記符号化器に出力するように構成された１つ以上のプロセッサを含む複雑度分析構成要素であって、
前記符号化器は、
前記スライスの前記周波数帯域の前記複雑度統計値に少なくとも部分的に基づいて、前記スライスの前記周波数帯域のそれぞれについての量子化パラメータを決定し、
符号化技術を前記スライスに対する前記バッファリングされた周波数ブロックに適用するように構成され、前記符号化技術は、前記スライスの前記周波数帯域の前記決定された量子化パラメータを使用して前記周波数ブロック内の前記周波数データを圧縮する、複雑度分析構成要素と、
前記スライスに対する前記圧縮された周波数データを無線接続を介して受信デバイスに送信するように構成された無線インタフェースと、
を備える、動画符号化システム。
前記複雑度統計値は、画素勾配情報又は前記スライスの前記周波数ブロックサイズの分散のうちの１つ以上を含む、請求項１に記載の動画符号化システム。
前記符号化器は、前記スライスの前記周波数帯域それぞれの前記量子化パラメータを、以前に処理された動画フレームの同一場所のスライスを符号化するために使用されたビットの実際の数と組み合わせた、前記スライスの前記周波数帯域の前記複雑度統計値に少なくとも部分的に基づいて決定するように更に構成されている、請求項１に記載の動画符号化システム。
前記無線インタフェースは、前記無線接続のために現在利用可能なビットレートを前記符号化器にフィードバックとして提供するように構成され、
前記スライスの前記周波数帯域の前記量子化パラメータを決定すると、前記符号化器は、前記現在利用可能なビットレートを前記周波数帯域の間で割り当てるように構成されている、請求項１に記載の動画符号化システム。
前記無線インタフェースは、前記無線接続のために現在利用可能なビットレート及び前記無線接続上の現在のパケット廃棄率を前記符号化器へのフィードバックとして提供するように構成され、
前記スライスの前記周波数帯域の前記量子化パラメータを決定するとき、前記符号化器は、前記現在利用可能なビットレートで利用可能な帯域幅使用を最大化しながら、前記パケット廃棄率を最小化するように、前記周波数帯域の前記量子化パラメータを調整するように構成されている、請求項１に記載の動画符号化システム。
前記符号化器が、前のフレームからの複雑度統計値と組み合わせた前記スライスの前記複雑度統計値、及び前記前のフレームの中心窩領域に少なくとも部分的に基づいて、前記スライスの前記量子化パラメータを決定するように更に構成されている、請求項１に記載の動画符号化システム。
前のフレームからの複雑度統計値と組み合わせた前記スライスの前記複雑度統計値、及び前記前のフレームの中心窩領域に少なくとも部分的に基づいて、前記スライスの前記量子化パラメータを決定するために、前記符号化器は、前記前のフレームの前記中心窩領域に従って、前記前のフレームからの前記複雑度統計値を調節し、前記前のフレームからの前記調節された複雑度統計値を、前記スライスの前記複雑度統計値と組み合わせて使用して、前記量子化パラメータを決定する、請求項６に記載の動画符号化システム。
前記ウェーブレット変換が、前記動画フレームからの各画素ブロックに適用される２レベルのウェーブレット分解である、請求項１に記載の動画符号化システム。
前記符号化器が、
前記スライスの前記バッファリングされた周波数ブロックに前記符号化技術を適用するように構成されたブロック処理パイプラインと、
前記スライスの前記周波数帯域のそれぞれについての前記量子化パラメータを決定し、前記量子化パラメータを前記ブロック処理パイプラインに提供するように構成されたレート制御構成要素と、
を備える、請求項１に記載の動画符号化システム。
１つ以上のプロセッサが、
現在の動画フレームのスライスからの複数の画素ブロックにウェーブレット変換を適用して、前記スライスからの前記画素ブロックを複数の周波数帯域に分解し、前記スライスの前記周波数帯域の周波数データを含む周波数ブロックをバッファに出力することと、
前記スライスの前記バッファリングされた周波数帯域にわたる複雑度統計値を計算し、前記スライスの前記周波数帯域の前記複雑度統計値を前記符号化器に出力することと、
前記スライスの前記周波数帯域の前記複雑度統計値に少なくとも部分的に基づいて、前記スライスの前記周波数帯域のそれぞれについての量子化パラメータを決定することと、
符号化技術を前記スライスの前記バッファリングされた周波数ブロックに適用することであって、前記符号化技術が、前記スライスの前記周波数帯域の前記決定された量子化パラメータを使用して前記周波数ブロック内の前記周波数データを圧縮する、ことと、
前記スライスの前記圧縮された周波数データを無線接続を介して受信デバイスに送信することと、
を実装するように構成されること、
を含む、方法。
前記複雑度統計値が、画素勾配情報又は前記スライスの前記周波数ブロックサイズの分散のうちの１つ以上を含む、請求項１０に記載の方法。
前記スライスの前記周波数帯域それぞれの前記量子化パラメータを、以前に処理された動画フレームの同一場所のスライスを符号化するために使用されたビットの実際の数と組み合わせた、前記スライスの前記周波数帯域の前記複雑度統計値に少なくとも部分的に基づいて決定することを更に含む、請求項１０に記載の方法。
前記無線接続のために現在利用可能なビットレートを追跡することを更に含み、前記スライスの前記周波数帯域の前記量子化パラメータを決定することは、前記現在利用可能なビットレートを前記周波数帯域の間で割り当てることを含む、請求項１０に記載の方法。
前記無線接続に関する現在の利用可能なビットレート及び前記無線接続上の現在のパケット廃棄率を追跡することを更に含み、前記スライスの前記周波数帯域の前記量子化パラメータを決定することが、前記現在利用可能なビットレートで利用可能な帯域幅使用を最大化しながら、前記パケット廃棄率を最小化するように、前記周波数帯域の前記量子化パラメータを調整することを含む、請求項１０に記載の方法。
前のフレームからの複雑度統計値と組み合わせた前記スライスの前記複雑度統計値、及び前記前のフレームの中心窩領域に少なくとも部分的に基づいて、前記スライスの前記量子化パラメータを決定することを更に含む、請求項１０に記載の方法。
前のフレームからの複雑度統計値と組み合わせた前記スライスの前記複雑度統計値、及び前記前のフレームの中心窩領域に少なくとも部分的に基づいて、前記スライスの前記量子化パラメータを決定することは、前記前のフレームの前記中心窩領域に従って、前記前のフレームからの前記複雑度統計値を調節することと、前記前のフレームからの前記調節された複雑度統計値を、前記スライスの前記複雑度統計値と組み合わせて使用して、前記量子化パラメータを決定することと、を含む、請求項１５に記載の方法。
１つ以上のプロセッサ及びディスプレイサブシステムを含むデバイスと、
１つ以上のプロセッサを含む基地局であって、前記１つ以上のプロセッサは、
現在の動画フレームのスライスからの複数の画素ブロックにウェーブレット変換を適用して、前記スライスからの前記画素ブロックを複数の周波数帯域に分解し、前記スライスの前記周波数帯域の周波数データを含む周波数ブロックをバッファに出力し、
前記スライスの前記バッファリングされた周波数帯域にわたる複雑度統計値を計算し、前記スライスの前記周波数帯域の前記複雑度統計値を前記符号化器に出力し、
前記スライスの前記周波数帯域の前記複雑度統計値に少なくとも部分的に基づいて、前記スライスの前記周波数帯域のそれぞれについての量子化パラメータを決定し、
符号化技術を前記スライスの前記バッファリングされた周波数ブロックに適用し、前記符号化技術が、前記スライスの前記周波数帯域の前記決定された量子化パラメータを使用して前記周波数ブロック内の前記周波数データを圧縮し、
前記スライスの前記圧縮された周波数データを無線接続を介して前記デバイスに送信する、
ように構成されている、基地局と、を備え、
前記デバイスの前記１つ以上のプロセッサは、
前記基地局から受信した前記圧縮された周波数帯域を展開し、
前記展開された周波数帯域でウェーブレット合成を実行して前記動画フレームの前記画素データを再構成し、
前記再構成された画素データを前記ディスプレイサブシステムに提供して表示する、ように構成されている、
システム。
前記基地局の前記１つ以上のプロセッサが、前記スライスの前記周波数帯域のそれぞれについての前記量子化パラメータを、以前に処理された動画フレームの符号化情報と組み合わせた、前記スライスの前記周波数帯域の前記複雑度統計値に少なくとも部分的に基づいて決定するように構成されている、請求項１７に記載のシステム。
前記基地局の前記１つ以上のプロセッサが、前記無線接続の現在利用可能なビットレートで利用可能な帯域幅使用を最大化しながら、前記無線接続上のパケット廃棄率を最小化するために、前記周波数帯域の前記量子化パラメータを調整するように構成されている、請求項１７に記載のシステム。
前記デバイスが、ヘッドマウントディスプレイ（ＨＭＤ）である、請求項１７に記載のシステム。