JP7171768B2

JP7171768B2 - 動画符号化システム

Info

Publication number: JP7171768B2
Application number: JP2020568504A
Authority: JP
Inventors: ジムシーチョウ; ソリンシーシスマス
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2018-06-28
Filing date: 2019-06-27
Publication date: 2022-11-15
Anticipated expiration: 2039-06-27
Also published as: KR20240033186A; KR20220150412A; JP2021527977A; CN112313954A; US20210250616A1; US12052440B2; KR20210011407A; JP7441924B2; EP3815368A1; US20230254510A1; WO2020006293A1; KR102645652B1; JP2024056936A; JP2023017896A; US11653026B2

Description

本発明は、動画符号化システムに関する。

仮想現実（Virtual reality、ＶＲ）は、ユーザが没入型人工環境を体験及び／又はそれと相互作用して、それにより、ユーザが物理的にその環境内にいるかのように感じることを可能にする。例えば、仮想現実システムは、奥行きの錯覚を作り出すために、立体的シーンをユーザに表示してもよく、コンピュータは、シーンコンテンツをリアルタイムで調整して、ユーザがシーン内で移動する錯覚を提供することができる。ユーザが仮想現実システムを介して画像を見る場合、ユーザは、このように一人称の視点からシーン内で移動しているかのように感じることができる。同様に、複合現実（mixed reality、ＭＲ）は、コンピュータ生成情報（仮想コンテンツと呼ばれる）を実世界画像又は実世界視野と組み合わせてユーザの世界に対する視野を増強又はそのコンテンツを追加する。あるいは、複合現実は実世界のオブジェクトの仮想表現を３次元（３Ｄ）仮想世界のビューに組み合わせる。したがって、仮想現実のシミュレートされた環境及び／又は複合現実の複合環境を利用して、複数のアプリケーションの相互作用型ユーザエクスペリエンスを提供することができる。

高解像度動画ソースを、通信リンク（例えば、無線リンク）を介してデバイスに送信して、復号し、表示するために、低レイテンシで符号化することができる動画符号化システムの各種実施形態が記載される。動画符号化システムの実施形態はまた、デバイスに送信される符号化動画のグレースフルデグラデーションを提供し、通信リンクのチャネル容量の変化などの変動する条件下で、所望のフレームレートを維持することができる。動画符号化システムの例示的な適用は、仮想コンテンツを含む動画フレームがレンダリングされ、符号化され、基地局によってデバイス（例えば、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、又はユーザによって装着され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのヘッドマウントディスプレイ（head-mounted display、ＨＭＤ）に送信されて復号され表示される、仮想又は複合現実システムにおける。

様々な方法及び装置が、無線リンクを介して目標フレームレートを維持し、フレームのレンダリング、伝送、及び表示におけるレイテンシを最小化するために、動画符号化システムによって実施され得る。加えて、方法及び装置は、通信リンクのチャネル容量の変化などの変動する条件下で所望のフレームレートを維持するために、デバイスに送信された符号化動画のグレースフルデグラデーションを提供することができる。

いくつかの実施形態では、動画符号化システムは、符号化する前の画素データに対してウェーブレット変換を実行し、画素データを周波数帯域に分解することができる。次いで、周波数帯域は、ブロックベースの符号化器に提供されるブロックに編成され、符号化／圧縮される。符号化された周波数データは、次いで、無線インタフェースに送られ、符号化された周波数データはパケット化され、パケットは受信デバイスに送信される。受信デバイス上で、符号化されたデータは、パケット復号され、ブロックベースの復号器を通過して、周波数帯域を復元する。次いで、復元された周波数帯域でウェーブレット合成を実行して、表示する画素データを再構成する。

いくつかの実施形態では、動画符号化システムは、スライスベースのレンダリング、符号化、及び伝達を実行することができる。フレーム全体を基地局内でレンダリングして符号化し、レンダリングされたフレームをデバイスに送信するのではなく、基地局は、フレームの一部又は部分（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを用意できた都度デバイスに送信してもよい。スライスベースのレンダリング及び符号化は、レイテンシを低減するのに役立ち得、バッファに必要とされるメモリの量もまた低減することができ、これにより、チップ（単数又は複数）又はプロセッサ（単数又は複数）上のメモリの接地面積、並びに必要電力を低減する。

いくつかの実施形態では、動画符号化システムは、タイルベースのレンダリング、符号化、及び伝達を実行することができる。タイルベースのレンダリング、符号化、及び伝達において、各スライスは、複数のタイル（例えば、４つのタイル）に分割されてもよく、基地局は、タイルをレンダリングして符号化し、符号化されたタイルを準備でき次第デバイスに送信してもよい。

いくつかの実施形態では、動画符号化システムは、単一の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルを処理することができる。しかしながら、いくつかの実施形態では、動画符号化システムは、複数の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。例えば、いくつかの実施形態では、各スライスは４つのタイルに分割されてもよく、２つの符号化器は、各スライスからの２つのタイル上で動作してもよい。各符号化器は、異なる周波数帯域からのブロックの処理をタイルの間で多重化して、同じ周波数帯域からのブロックの処理の間に複数の時間単位を可能としてもよい。ブロックの処理をタイル間で多重化することにより、周波数帯域内のブロック間の依存関係に適切に対処することができる。

いくつかの実施形態では、動画符号化システムは、ウェーブレット変換の前にフレーム内で画素データのプレフィルタリングを実行することができる。いくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープ機能を実行することを含んでもよい。レンズワープは、画像が閲覧されるデバイス（例えばＨＭＤ）のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイスで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、デバイス上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、プレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングを含んでもよい。この方法では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。いくつかの実施形態では、周辺領域（すなわち、中心窩領域の外側のフレームの部分）は、周辺領域における解像度を低減するためにプレフィルタリングされてもよい。

少なくともいくつかの実施形態に係る、符号化前にウェーブレット変換を使用して画素データを周波数帯域に分解する動画符号化システムを示すブロック図である。少なくともいくつかの実施形態に係る、フレームからのタイルを並行して処理する複数の符号化器を含む動画符号化システムを示す。少なくともいくつかの実施形態に係る、スライス及びタイルに分割された例示的なフレームを示す。少なくともいくつかの実施形態に係る、ブロックに分割されたタイルの例を示す。少なくともいくつかの実施形態に係る、符号化前に、画素データを記憶して周波数帯域データを生成する画素ブロックのウェーブレット変換を実行することを示す。少なくともいくつかの実施形態に係る、図１及び図２に示すような動画符号化システムを含むＶＲ／ＭＲシステムの動作方法の高レベルフローチャートである。少なくともいくつかの実施形態に係る、図１に示すような動画符号化システムの動作方法のフローチャートである。少なくともいくつかの実施形態に係る、図２に示すような動画符号化システムの動作方法のフローチャートである。少なくともいくつかの実施形態に係る、動画符号化システムを実装することができる例示的なＶＲ／ＭＲシステムを示す。少なくともいくつかの実施形態に係る、図７に示すようなＶＲ／ＭＲシステムの構成要素を示すブロック図である。

本明細書は、「ｏｎｅｅｍｂｏｄｉｍｅｎｔ（一実施形態）」又は「ａｎｅｍｂｏｄｉｍｅｎｔ（実施形態）」に対する参照を含む。「ｉｎｏｎｅｅｍｂｏｄｉｍｅｎｔ（一実施形態において）」又は「ｉｎａｎｅｍｂｏｄｉｍｅｎｔ（ある実施形態において）」という語句表現は、必ずしも同一の実施形態を指すわけではない。特定の特徴、構造、又は特性は、本開示と一貫性を有するいずれかの好適な方式で組み合わされてもよい。

「ｃｏｍｐｒｉｓｉｎｇ（備える、含む）」。この用語はオープンエンドである。特許請求の範囲で使用されるとき、この用語は、追加の構造又はステップを除外しない。「１つ以上のプロセッサユニット・・・を備えた装置」と記載される請求項を検討する。このような請求項は、装置が追加の構成要素（例えば、ネットワークインタフェースユニット、グラフィック回路など）を含むことを除外しない。

「ｃｏｎｆｉｇｕｒｅｄｔｏ（ように構成されている）」。様々なユニット、回路、又は他の構成要素は、タスク又はタスク（複数）を実行する「ように構成されている」と説明又は請求されてもよい。このような文脈では、「構成されている」は、ユニット／回路／構成要素が、動作の間にそれらのタスク又はタスク（複数）を実行する構造（例えば、回路）を含むことを示すことによって構造を暗示するときに使用される。そのように、ユニット／回路／構成要素は、指定されたユニット／回路／構成要素が現在動作可能でない（例えば、オンの状態でない）ときでさえ、タスクを実行するように構成されていると言うことができる。「構成されている」という言葉と共に使用されるユニット／回路／構成要素は、ハードウェア、例えば、演算を実施するように実行可能なプログラム命令を記憶した回路、メモリなどを含む。ユニット／回路／構成要素が１つ以上のタスクを実行するように「構成されている」と記述することは、そのユニット／回路／構成要素に対して米国特許法第１１２条、段落（ｆ）が適用されないことが明示的に意図されている。加えて、「構成されている」は、ソフトウェア及び／又はファームウェア（例えば、ＦＰＧＡ又はソフトウェアを実行する汎用プロセッサ）によって操作され、対象のタスク（単数又は複数）を実行可能な方式で動作する一般的な構造体（例えば、一般的な回路）を含むことができる。「構成されている」はまた、１つ以上のタスクを実施又は実行するように適合されたデバイス（例えば、集積回路）を組み立てるように製造工程（例えば、半導体組み立て設備）を適合させることを含んでもよい。

「第１」、「第２」など。本明細書で使用されるように、これらの用語は、続く名詞の標識として使用され、いかなるタイプの順序付け（例えば、空間的、時間的、論理的など）も意味しない。例えば、バッファ回路は、「第１」及び「第２」の値に対する書き込み演算を実行するものとして本明細書で説明されてもよい。用語「第１」及び「第２」は、必ずしも第１の値が第２の値の前に書き込まれなければならないことを含意していない。

「基づいて」又は「従って」。本明細書で使用されるように、それらの用語は、判定に影響を及ぼす１つ以上の要因を説明するために使用される。それらの用語は、判定に影響を及ぼすことがある追加の要因を排除しない。すなわち、判定はそれらの要因のみに基づいているか、又は少なくとも部分的にそれらの要因に基づいていることがある。「Ｂに基づいてＡを判定する」というフレーズを検討する。このケースでは、ＢはＡの判定に影響を及ぼす要因であるが、このようなフレーズはＡの判定がＣにも基づいていることを除外しない。他の例では、ＡはＢのみに基づいて判定されてもよい。

「又は」。特許請求の範囲で使用されるとき、用語「又は」は、包括的論理和として使用され、排他的論理和として使用されない。例えば、語句「ｘ、ｙ、又はｚのうちの少なくとも１つ」は、ｘ、ｙ、及びｚのいずれか１つ、並びにこれらの任意の組み合わせを意味する。

動画符号化システムの各種実施形態を説明する。動画符号化システムの実施形態は、高解像度動画ソースを、通信リンク（例えば、無線リンク）を介してデバイスに送信して、復号し、表示するために、低レイテンシで符号化することができる。動画符号化システムの実施形態はまた、デバイスに送信される符号化動画のグレースフルデグラデーションを提供し、通信リンクのチャネル容量の変化などの変動する条件下で、所望のフレームレートを維持することができる。

動画符号化システムの例示的な適用は、仮想コンテンツを含む動画フレームがレンダリングされ、符号化され、デバイスに送信されて復号され表示される、仮想又は複合現実システムにおける。仮想又は複合現実システム（本明細書ではＶＲ／ＭＲシステムと呼ばれる）の実施形態が記載され、動画符号化システムの実施形態が実装され得る。いくつかの実施形態では、ＶＲ／ＭＲシステムは、デバイス（例えば、パッド若しくはタブレットデバイス、スマートフォン、又はユーザにより着用され、本明細書ではヘッドマウントディスプレイ（ＨＭＤ）と称される、ヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡）と、本明細書では基地局と称する別個のコンピューティングデバイスとを含んでもよい。いくつかの実施形態では、デバイス及び基地局は、無線接続を介してデバイス及び基地局がデータを通信し交換することを可能にする無線通信技術をそれぞれ含み得る。いくつかの実施形態では、デバイスは、ユーザの環境に関する情報（例えば、動画、深度情報、照明情報など）、及びユーザに関する情報（例えば、ユーザの表情、眼の動き、手のジェスチャなど）を収集するセンサを含んでもよい。センサによって収集された情報は、無線接続を介して基地局に送信されてもよい。基地局は、無線接続を介してデバイスから受信したセンサ情報に少なくとも部分的に基づいて仮想コンテンツを含むフレームを生成しレンダリングするように構成されたソフトウェア及びハードウェア（例えば、プロセッサ（システムオンチップ（system on a chip、ＳＯＣ）、ＣＰＵ、画像信号プロセッサ（image signal processor、ＩＳＰ）、グラフィック処理ユニット（graphics processing unit、ＧＰＵ）、符号化器／復号器（コーデック）など）、メモリなど）を含み得る。基地局はまた、レンダリングされたフレームを予めフィルタリングし、圧縮し、無線接続を介してデバイスに送信して、表示することができる、本明細書に記載されるような動画符号化システムの実施形態を含んでもよい。

いくつかの実施形態では、ＶＲ／ＭＲシステムは、デバイスと基地局との間に高指向性の無線リンクを提供する独自の無線通信技術を実装することができる。いくつかの実施形態では、無線通信技術の指向性及び帯域幅は、複数のデバイスが同時に基地局と通信することをサポートすることができ、それにより、複数のユーザが共同設置環境において同時にシステムを使用することを可能にし得る。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術がサポートされてもよい。

無線リンクに関して考慮される主要な制約は、帯域幅及びレイテンシを含む。ＶＲ／ＭＲシステムの目標は、高解像度の広視野（field of view、ＦＯＶ）な仮想表示を、高品質のＶＲ／ＭＲ視野をユーザに提供するフレームレートで提供することである。別の目標は、フレームが基地局によってレンダリングされる時間と、フレームがデバイスによって表示される時間との間のレイテンシを最小化することである。しかしながら、無線リンクのチャネル容量は時間と共に変化することがあり、したがって、無線リンクは、任意の所与の時間に送信される情報のうち一定量のみをサポートする場合がある。

無線リンクを介して目標フレームレートを維持し、フレームのレンダリング、伝達、及び表示におけるレイテンシを最小化するために、動画符号化システムによって実施され得る様々な方法及び装置が本明細書に記載される。加えて、方法及び装置は、通信リンクのチャネル容量の変化などの変動する条件下で所望のフレームレートを維持するために、デバイスに送信された符号化動画のグレースフルデグラデーションを提供することができる。

いくつかの実施形態では、動画符号化システムは、符号化する前の符号画素データに対してウェーブレット変換を実行し、画素データを周波数帯域に分解することができる。次いで、周波数帯域は、ブロックベースの符号化器に提供されるブロックに編成され、符号化／圧縮される。一例として、フレームは１２８ｘ１２８のブロックに分割され、２レベルのウェーブレット分解を１２８ｘ１２８のブロックのそれぞれに適用して、３２ｘ３２の周波数データのブロックを１６個生成することができる。１６個の３２ｘ３２の周波数データブロックは、７つの周波数帯域を表しており、次いで、符号化器（例えば、高効率動画符号化（High Efficiency Video Coding、ＨＥＶＣ）符号化器）に送信され、符号化されてもよい。符号化された周波数データは、次いで、無線インタフェースに送られ、符号化された周波数データはパケット化され、パケットは受信デバイス（例えば、ＨＭＤ）に送信される。受信デバイス上で、符号化されたデータは、パケット復号され、ブロックベースの復号器を通過して、周波数帯域を復元する。次いで、復元された周波数帯域でウェーブレット合成を実行して、表示する画素データを再構成する。

ウェーブレット変換は、動画フレームからの画素ブロックそれぞれに適用される２レベルのウェーブレット分解である実施形態が一般に記載されるが、様々な実施形態では、ウェーブレット分解は、任意の数Ｎのレベル（例えば、１つのレベル、２つのレベル、３つのレベル、４つのレベルなど）であってよく、レベルの数Ｎは、符号化された画像の品質と符号化されるブロックの複雑度とをトレードオフするように調整されてもよい。

いくつかの実施形態では、ウェーブレット分解内のウェーブレット係数のそれぞれにコアリング（coring）関数を適用することができる。「Ｃｏｒｉｎｇ」は、係数のソフト閾値処理（soft-thresholding）を指し、ノイズを除去するのに有効である。これは、重要性の高い領域と、利用可能帯域幅との対比において、適応的に行うことができる。

いくつかの実施形態では、動画符号化システムは、スライスベースのレンダリング、符号化、及び伝達を実行することができる。フレーム全体をレンダリング、符号化、及び送信することは、各フレームが完了し、記憶され、次いでＶＲ／ＭＲシステムの次のステージに送信される必要があるため、レイテンシ及びメモリへの影響を有し得る。スライスベースのレンダリングでは、フレーム全体を基地局内でレンダリングして符号化し、レンダリングされたフレームをデバイスに送信するのではなく、基地局は、フレームの一部（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを準備でき次第デバイスに送信してもよい。スライスは、例えば、１２８ｘ１２８ブロック行、又は２つ以上のブロック行であってもよい。スライスベースのレンダリング及び符号化は、レイテンシを低減するのに役立ち得、バッファに必要とされるメモリの量もまた低減することができ、これにより、チップ（単数又は複数）又はプロセッサ（単数又は複数）上のメモリの接地面積、並びに必要電力を低減することができる。

いくつかの実施形態では、動画符号化システムは、単一の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルを処理することができる。しかしながら、いくつかの実施形態では、動画符号化システムは、複数の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。例えば、いくつかの実施形態では、各スライスは４つのタイルに分割されてもよく、各タイルは複数の１２８ｘ１２８ブロックを含み、２つの符号化器（ｅ０及びｅ１）は、各スライスからの２つのタイルで動作してもよい（例えば、ｅ０はｔ０及びｔ１で動作し、ｅ１は、ｔ２及びｔ３で動作する）。各符号化器は、１６の時間単位を同じ周波数帯域からのブロックの処理の間で可能とするように、異なる周波数帯域からのブロックの処理を２つのタイルの間で多重化してもよい。ブロックの処理を２つのタイル間で多重化することにより、周波数帯域のブロック間の依存関係に適切に対処することができる。各スライスが４つのタイルに分割され、２つの符号化器が各スライスからのそれぞれのタイル上で動作する実施形態が記載されているが、いくつかの実施形態では、スライスをより多くのタイル（例えば、６つ又は８つのタイル）に分割することができ、いくつかの実施形態では、より多くの符号化器（例えば、３つ又は４つの符号化器）が使用されてもよい。

いくつかの実施形態では、動画符号化システムは、ウェーブレット変換の前にフレーム内で画素データのプレフィルタリングを実行することができる。プレフィルタリングは、例えば、フレームのウェーブレット変換、符号化、及び無線リンクを介してデバイスへの送信を実行する前に、基地局によってレンダリングされるフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。

デバイスがＨＭＤであるいくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープ（lens warp）を実行することを含んでもよい。レンズワープは、画像が閲覧されるＨＭＤ上のレンズによって導入される画像の歪みを補正するために実施され、それによって画像の品質を改善する。いくつかの実施形態では、ＨＭＤは、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続を介してレンズワープデータを基地局に提供することができる。次いで、基地局は、そのＨＭＤに関するレンズワープデータに基づいて、フレーム上でレンズワープを実行することができる。従来のＶＲ／ＭＲシステムでは、レンズワープは、復号後表示前にＨＭＤで実行される。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にＨＭＤで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、ＨＭＤ上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、プレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングを含んでもよい。この方法では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。人間の眼は、周辺領域よりも中心窩領域においてより高い解像度を知覚することができる。したがって、中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。いくつかの実施形態では、周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。いくつかの実施形態では、周辺領域に適用されるフィルタリングの量は、フレームの周辺に向かって伸びつつ増加してもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

図１は、少なくともいくつかの実施形態に係る、符号化前のウェーブレット変換を使用して画素データを周波数帯域に分解する動画符号化システム１２０を示すブロック図である。ＶＲ／ＭＲシステム１０は、少なくとも１つのデバイス１５０（例えば、パッド若しくはタブレットデバイス、スマートフォン、又は、ユーザによって装着され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのＨＭＤ）及びコンピューティングデバイス１００（本明細書では基地局と呼ばれる）を含んでもよい。基地局１００は、仮想コンテンツを含むＶＲ又はＭＲフレームをレンダリングし、フレームを符号化し、デバイス１５０によって復号され表示されるように、符号化されたフレームを無線接続１８０を介してデバイス１５０に送信する。

いくつかの実施形態では、ＨＭＤ１５０は、ユーザ１９０の環境に関する情報（例えば、動画、深度情報、照明情報など）、及びユーザ１９０に関する情報（例えば、ユーザの表情、眼の動き、視線の方向、手のジェスチャなど）を収集するセンサ１６０を含んでもよい。デバイス１５０は、センサ１６０によって収集された情報の少なくとも一部を、無線接続１８０を介して基地局１００に送信してもよい。基地局１００は、センサ１６０から取得された様々な情報に少なくとも部分的に基づいて、仮想コンテンツを含むデバイス１５０によって表示するためのフレームをレンダリングし、フレームを符号化し、符号化されたフレームを、復号しユーザに対し表示するために、無線接続１８０を介してデバイス１５０に送信することができる。

基地局１００及びデバイス１５０は、基地局１００及びデバイス１５０が無線接続１８０を介してデータを通信し交換することを可能にする無線通信技術を実装してもよい。いくつかの実施形態では、無線接続１８０は、デバイス１５０と基地局１００との間に高指向性無線リンクを提供する独自の無線通信技術に従って実装されてもよい。しかしながら、いくつかの実施形態では、他の商用の（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

ＶＲ／ＭＲシステム１０内のデバイス１５０と基地局１００との間の無線接続１８０に関して考慮される主要な制約は、帯域幅及びレイテンシを含む。例えば、いくつかの実施形態では、目標は、高解像度の広角視野（ＦＯＶ）仮想表示を、高品質のＶＲ／ＭＲ視野をユーザに提供するフレームレートでユーザに提供することである。別の目標は、動画フレームがデバイスによってキャプチャされた時間と、動画フレームに基づいてレンダリングされたＶＲ／ＭＲフレームがデバイスにより表示される時間との間のレイテンシを最小化することである。

基地局１００は、本明細書に記載されるような動画及び／又は画像をレンダリング、フィルタリング、符号化、並びに送信するための様々なハードウェア構成要素、例えば、様々なタイプのプロセッサ、集積回路（ＩＣ）、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などを含んでもよい。基地局１００は、ＧＰＵレンダリング１１０構成要素、無線インタフェース１３０構成要素、並びに無線接続１８０を介して目標フレームレートを維持し、フレームレンダリング、符号化、伝達、及び表示におけるレイテンシを最小化するのに役立ち得る様々な方法を実装する１つ以上のハードウェア構成要素を含み得る、動画符号化システム１２０を含み得るが、これらに限定されない。動画符号化システム１２０は、プレフィルタ１２２構成要素（例えば、Ｎチャネルのフィルタバンク）、ウェーブレット変換１２４構成要素、及び符号化器１２６構成要素を含み得るが、これらに限定されない。

ＧＰＵレンダリング１１０は、センサ１６０から取得された様々な情報に少なくとも部分的に基づいて、仮想コンテンツを含むデバイス１５０によって表示するためのフレームをレンダリングすることができる１つ以上のハードウェア構成要素を含み得る。

いくつかの実施形態では、動画符号化システム１２０は、ウェーブレット変換１２４を実行する前にレンダリングされたフレーム内の画素データをプレフィルタリング１２２する１つ以上のハードウェア構成要素を含んでもよい。プレフィルタ１２２は、例えば、フレームのウェーブレット変換１２４、符号化１２６、無線接続１８０を介してデバイス１５０への送信を実行する前に、基地局１００上でレンダリングされたフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線接続１８０上でのレイテンシ及び帯域幅の使用を低減することができる。

いくつかの実施形態では、プレフィルタ１２２は、ウェーブレット変換１２４の前に、基地局１００上のフレームに対してレンズワープを実行してもよい。レンズワープは、画像が閲覧されるデバイス上のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。いくつかの実施形態では、デバイス１５０は、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続１８０を介してレンズワープデータを基地局１００に提供することができる。次いで、動画符号化システム１２０のプレフィルタ１２２構成要素は、そのデバイス１５０のレンズワープデータに基づいてフレーム上でレンズワープを実行することができる。従来のＶＲ／ＭＲシステムでは、レンズワープは、復号後表示前にデバイス１５０上で実行される。プレフィルタ１２２ステージにおいて基地局１００上でレンズワープを実行することによって、ウェーブレット変換１２４及び符号化１２６を実行する前にフレームの解像度を低減することができる。これにより圧縮の改善に役立ち得、無線接続１８０上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイス１５０で行うのではなく、プレフィルタ１２２ステージにおいて基地局１００で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化１２６の前に解像度を低減するために基地局１００でフィルタリングを実行し、次いで、デバイス１５０上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、プレフィルタ１２２はまた、中心窩領域内ではより高い解像度を維持しつつ、周辺領域内の解像度を低減する、１つ以上のフィルタを適用してもよい。この方法では、デバイス１５０から取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。人間の眼は、周辺領域よりも中心窩領域においてより高い解像度を知覚することができる。したがって、中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。いくつかの実施形態では、周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。いくつかの実施形態では、周辺領域に適用されるフィルタリングの量は、フレームの周辺に向かって伸びつつ増加してもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

いくつかの実施形態では、動画符号化システム１２０のウェーブレット変換１２４構成要素は、符号化する前の画素データに対してウェーブレット変換を実行し、画素データを周波数帯域に分解する、１つ以上のハードウェア構成要素（例えば、Ｎチャネルのフィルタバンク）を含んでもよい。次いで、周波数帯域は、ブロックベースの符号化器１２６に提供されるブロックに編成され、符号化／圧縮される。一例として、図３Ａ～３Ｃに示されるように、フレームは１２８ｘ１２８のブロックに分割され、２レベルのウェーブレット分解を１２８ｘ１２８のブロックのそれぞれに適用して、３２ｘ３２のブロックを１６個生成することができる。１６個の３２ｘ３２の周波数データブロックは、７つの周波数帯域を表しており、次いで、ブロックベースの符号化器（例えば、高効率動画符号化（ＨＥＶＣ）符号化器）１２６に送信され、符号化されてもよい。符号化された周波数データは、次いで、１つ以上のハードウェア構成要素を実装した無線インタフェース１３０に送信される。これにより、データはパケット化され、パケットは無線接続１８０を介してデバイス１５０に送信される。

デバイス１５０は、本明細書に記載されるような動画及び／又は画像を復号し表示するための様々なハードウェア構成要素、例えば、様々なタイプのプロセッサ、集積回路（ＩＣ）、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などを含んでもよい。デバイス１５０は、無線インタフェース１５２、復号器１５４構成要素（例えば、高効率動画符号化（ＨＥＶＣ）復号器）、ウェーブレット合成１５６構成要素、及びディスプレイ１５８構成要素を含み得るが、これらに限定されない。デバイス１５０上で、無線インタフェース１５２は、基地局１００によって無線接続１８０を介して送信されたパケットを受信する。符号化されたデータは、パケット復号され、ブロックベースの復号器１５４（例えば、高効率動画符号化（ＨＥＶＣ）復号器）を通過して、周波数帯域を復元する。次いで、ウェーブレット合成１５６が復元された周波数データ上で実行されて、ディスプレイ１５８のための画素データを再構成する。

いくつかの実施形態では、動画符号化システム１２０は、スライスベースのレンダリング、符号化、及び伝達を実行することができる。フレーム全体をレンダリング、符号化、及び送信することは、各フレームが完了し、記憶され、次いでＶＲ／ＭＲシステム１０の次のステージに送信される必要があるため、レイテンシ及びメモリへの影響を有し得る。スライスベースのレンダリングでは、フレーム全体を基地局１００内でレンダリングして符号化し、レンダリングされたフレームをデバイス１５０に送信するのではなく、基地局１００は、フレームの一部（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを準備でき次第デバイス１５０に送信してもよい。スライスは、例えば、１２８ｘ１２８のブロック行であってもよい。スライスベースのレンダリング及び符号化は、レイテンシを低減するのに役立ち得、バッファに必要とされるメモリの量もまた低減することができ、これにより、チップ（単数又は複数）又はプロセッサ（単数又は複数）上のメモリの接地面積、並びに必要電力を低減する。

いくつかの実施形態では、動画符号化システム１２０は、タイルベースのレンダリング、符号化、及び伝達を実行することができる。タイルベースのレンダリング、符号化、及び伝達において、各スライスは、複数のタイル（例えば、４つのタイル）に分割されてもよく、基地局１００は、タイルをレンダリングして符号化し、符号化されたタイルを準備でき次第デバイス１５０に送信してもよい。

いくつかの実施形態では、動画符号化システム１２０は、単一の符号器１２６を使用して、タイルベースのレンダリング、符号化、及び伝達を実行し、各スライスからのタイルを処理することができる。しかしながら、いくつかの実施形態では、動画符号化システム１２０は、複数の符号化器１２６を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。図２は、少なくともいくつかの実施形態に係る、レンダリングされたフレームからのタイルを並行して処理する複数の符号化器（この例では２つの符号化器２２６Ａ及び２２６Ｂ）を含む動画符号化システム２２０を示す。

基地局２００のＧＰＵレンダリング２１０構成要素は、ディスプレイのためのフレーム（又はフレームのスライス）をレンダリングする１つ以上のＧＰＵ及び／又は他の構成要素を含み得る。フレームは、例えば図３Ａに示すように、スライスに分割されてもよい。図３Ａに示すように、各スライスは、複数のタイル（この例では４つ）に分割されてもよく、各タイルは複数のブロックを含む。図３Ｂは、４個の１２８ｘ１２８のブロックを含む例示的なタイルを示す。しかしながら、いくつかの実施形態では、他のサイズ（例えば、６４ｘ６４、３２ｘ３２など）のブロックが使用されてもよく、タイルは、より多い又は、より少ないブロックを含んでもよい。

動画符号化システム２２０のプレフィルタ２２２及びウェーブレット変換２２４構成要素は、次いで、符号化２２６の前に各タイルを処理することができる。いくつかの実施形態では、動画符号化システム２２０は、各タイルを処理するための別個のプレフィルタ２２２構成要素及びウェーブレット変換２２４構成要素を含むことができる。この例では、プレフィルタ２２２Ａ構成要素及びウェーブレット変換２２４Ａ構成要素がタイル０を処理し、プレフィルタ２２２Ｂ構成要素及びウェーブレット変換２２４Ｂ構成要素がタイル１を処理し、プレフィルタ２２２Ｃ構成要素及びウェーブレット変換２２４Ｃ構成要素がタイル２を処理し、プレフィルタ２２２Ｄ構成要素及びウェーブレット変換２２４Ｄ構成要素がタイル３を処理する。プレフィルタ２２２構成要素は、本明細書に記載されるようなタイルのプレフィルタリングを実行し、ウェーブレット変換２２４構成要素は、本明細書に記載されるように、タイルを周波数帯域に分解する。しかしながら、いくつかの実施形態では、動画符号化システム２２０は、タイルを処理する単一のプレフィルタ２２２構成要素及び単一のウェーブレット変換２２４構成要素を含むことができる。いくつかの実施形態では、動画符号化システム２２０は、複数の（例えば、２つの）プレフィルタ２２２構成要素及び複数の（例えば、２つの）ウェーブレット変換２２４構成要素を含むことができ、それぞれが複数の（例えば、２つの）タイルを処理する。

２つの符号化器２２６Ａ及び２２６Ｂは、各スライスからの２つのタイル上で動作してもよい（例えば、符号化器２２６Ａはタイル０及びタイル１で動作し、符号化器２２６Ｂはタイル２及びタイル３上で動作する）。各符号化器２２６は、１６の時間単位を同じ周波数帯域からのブロックの処理の間で可能とするように、異なる周波数帯域（すなわち、図３Ｃに例示される３２ｘ３２のブロック１６個）からのブロックの処理を２つのタイルの間で多重化してもよい。ブロックの処理を２つのタイル間で多重化することにより、同じ周波数帯域におけるブロック間の依存関係に適切に対処することができる。

各スライスが４つのタイルに分割され、２つの符号化器が各スライスからそれぞれのタイル上で動作する実施形態が記載されているが、いくつかの実施形態では、スライスをより多くのタイル（例えば、６つ又は８つのタイル）に分割することができ、いくつかの実施形態では、より多くの符号化器（例えば、３つ、４つ、又はそれ以上の符号化器）を使用することができる。

図３Ｃは、少なくともいくつかの実施形態に係る、符号化前に、画素データを記憶して周波数帯域データを生成する画素ブロックのウェーブレット変換を実行することを示す。この実施例では、ウェーブレット変換３２４構成要素によって２レベルウェーブレット分解が１２８ｘ１２８の画素ブロック３００に適用されて、７つの周波数帯域を表す周波数データである１６個の３２ｘ３２のブロック３０２を生成する。次いで、周波数ブロック３０２は、符号化のために符号化器３２６に提供される。例えば、周波数ブロック３０２は、ウェーブレット変換３２４構成要素によってバッファに書き込まれ、符号化器３２６構成要素によってバッファから読み出されてもよい。

周波数ブロック３０２のラベルにおいて、文字Ｌはローパスフィルタを表し、文字Ｈはハイパスフィルタを表す。ラベルが２文字のブロック３０２は、１レベル（２Ｄ）のウェーブレット変換又は分解を表す。ラベルが２文字のブロック３０２（７つの周波数帯域のうちの３つであるＬＨ、ＨＬ、及びＨＨを表す）において、第１の文字は、１番目に実行される垂直フィルタ（高又は低のいずれか）を表し、第２の文字は、２番目に実行される水平フィルタ（高又は低のいずれか）を表す。ラベルが４文字のブロック３０２は、２レベルのウェーブレット変換又は分解を表す。ラベルが４文字のブロック３０２において、第１の２文字（ＬＬ）は、最初に垂直ローパスフィルタが存在し、水平ローパスフィルタが続くことを示す。第２の２文字は、その結果生じたＬＬブロックがＬＬ、ＬＨ、ＨＬ、及びＨＨの４通りにフィルタリングされた（したがって、７つの周波数帯域のうちの４つ（ＬＬＬＬ、ＬＬＬＨ、ＬＬＨＬ、及びＬＬＨＨ）が生成されている）ことを示す。

図３Ｃに示すように画素データを周波数帯域に分解することにより、周波数帯域は、符号化器３２６によって別個のストリームとしてバッファリングされ、処理されることが可能となる。周波数帯域を別個のストリームとして処理することにより、符号化器３２６の構成要素は、独立したストリームの処理を多重化することが可能となる。ＨＥＶＣ符号化などのブロックベースの符号化方法では、ブロック（符号化ツリーユニット（ＣＴＵ）と呼ばれる）は、ブロック処理パイプラインにおいて複数のステージで処理される。２つ以上のブロックは、所与のクロックサイクルにおいてパイプラインの異なるステージにあってもよく、ブロックは、クロックのサイクルが進むにつれてパイプラインを通って移動する。所与のブロックの処理は、以前に処理された１つ以上の近隣ブロック、例えば、所与のブロックの上の行の１つ以上のブロック、及び／又は、所与のブロックの左側のブロックへの依存関係を有し得る。周波数帯域データのストリームの処理を多重化することによって、符号化器３２６は、所与のストリーム内のブロックの処理を間をあけて配置し、それにより、所与のブロックが依存関係を有する近隣ブロックを処理するために追加のクロックサイクルを提供する。例えば、所与のブロックが以前に処理された近隣ブロックに依存するステージに到達したときに、所与のブロックの左側のブロックは、パイプライン内で所与のブロックに数ステージ先行するブロックであってもよい。これにより、符号化器３２６は、以前に処理されたブロックに対する依存関係により適切に対処可能となり、隣接ブロックに依存するステージにおける所与のブロックの処理を行前に、パイプライン内の近隣ブロックの処理の完了を待つ必要性を低減又は排除することができる。

加えて、図３Ｃに示すように画素データを周波数帯域に分解することにより、符号化器３２６及び無線インタフェースによって周波数帯域の優先が可能となる。典型的に、画像及び動画送信では、より低い周波数がより重要である一方、より高い周波数の重要性は薄い。より高い周波数は、通常、画像の詳細に対応し、したがって、優先度は、より低いと見なすことができる。より高い周波数帯域には、画像内のエネルギーのより小さい割合が含まれる。エネルギーの大部分は、より低い周波数帯域に含まれる。このように、画素データを周波数帯域に分解することにより、データストリームを符号化及び送信するときに符号化器３２６及び無線インタフェースによって活用され得るデータストリームへの優先順位付けを提供する。例えば、いくつかの実施形態では、異なる圧縮技術を異なる周波数帯域に使用することができ、より低い優先度の帯域により積極的な圧縮を適用し、より高い優先度の帯域にはより控えめな圧縮を適用してもよい。別の例として、周波数帯域の優先順位付けは、ＶＲ／ＭＲシステムのグレースフルデグラデーションを提供するのに役立ち得る。無線接続の性能を監視することができ、デバイスからのフィードバックを考慮して、システム全体のパフォーマンスを追跡することができる。何らかの理由でシステムの性能が低下した場合、例えば、無線接続の質が低下し、無線接続の帯域幅容量が閾値を下回る場合、符号化器３２６及び無線インタフェースは、より低い周波数帯域の１つ以上の符号化及び送信を優先することができ、より低い優先度レベルを割り当てられた１つ以上の周波数レベル、例えば、１つ以上のより高い周波数帯域の符号化及び／若しくは送信を低減又は低下させることができる。

上述のように、ウェーブレット変換は、画像を周波数帯域に分解する。いくつかの実施形態では、これは、異なる解像度のディスプレイに同じ信号を送信するために活用されてもよい。一例として、２レベルウェーブレット分解を適用して、７つの周波数帯域に信号を分解することができる。４つの帯域（ＬＬＬＬ、ＬＬＬＨ、ＬＬＨＬ、及びＬＬＨＨ）が表示パネルに送信される場合、帯域は、より低い視覚品質で元の意図された解像度に再構成されてもよい。代替として、より低い表示解像度を有する表示パネルに好適であり得る１／４の解像度（各寸法において１／２）で再構成されてもよい。

図４は、少なくともいくつかの実施形態に係る、図１及び図２に示すような動画符号化システムを含むＶＲ／ＭＲシステムの動作方法の高レベルフローチャートである。４００で示されるように、デバイスは、無線接続を介して基地局にデータを送信する。４１０で示されるように、基地局は、デバイスから受信したデータに少なくとも部分的に基づいて、仮想コンテンツを含むフレームをレンダリングする。４２０で示されるように、基地局は、レンダリングされたデータを圧縮し、圧縮されたデータを無線接続を介してデバイスに送信する。４３０で示されるように、デバイスは、仮想コンテンツを展開して表示して、ユーザによる閲覧のための３Ｄ仮想ビューを生成する。４３０から４００に戻る矢印によって示されるように、この方法は、ユーザがＶＲ／ＭＲシステムを使用している限り継続する。

いくつかの実施形態では、フレーム全体を基地局内でレンダリングして符号化し、レンダリングされたフレームをデバイスに送信するのではなく、基地局は、フレームの一部（スライスと呼ばれる）をレンダリングして符号化し、符号化されたスライスを準備でき次第デバイスに送信してもよい。スライスは、例えば、１２８ｘ１２８のブロック行であってもよい。いくつかの実施形態では、動画符号化システムは、タイルベースのレンダリング、符号化、及び伝達を実行することができる。タイルベースのレンダリング、符号化、及び伝達において、各スライスはそれぞれ１つ以上のブロックを含む複数のタイル（例えば、それぞれ４個のブロックを含む４つのタイル）に分割されてもよく、基地局は、タイルをレンダリングして符号化し、符号化されたタイルを準備でき次第デバイスに送信してもよい。

図５は、少なくともいくつかの実施形態に係る、図１に示すような動画符号化システムの動作方法のフローチャートである。図５の方法は、例えば、図４の４２０において実行されてもよい。図５の方法は、スライスベースの符号化及び送信が実行されていると仮定する。しかしながら、いくつかの実施形態では、タイルベースの符号化及び送信が実行されてもよい。

５１０で示されるように、プレフィルタ構成要素は、フレームのスライス内の画素ブロックにレンズワープ及び／又は中心窩フィルタを適用する。いくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープを実行することを含んでもよい。レンズワープは、画像が閲覧されるデバイス上のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。いくつかの実施形態では、デバイスは、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続を介してレンズワープデータを基地局に提供することができる。次いで、基地局は、そのデバイスのレンズワープデータに基づいて、フレーム上でレンズワープを実行することができる。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイスで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、デバイス上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、５１０でのプレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングもまた含んでもよい。いくつかの実施形態では、デバイスから取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

５２０で示されるように、ウェーブレット変換構成要素は、画素ブロックにウェーブレット変換技術を適用して、画素データをＮ個の（例えば、７つの）周波数帯域に分解する。次いで、周波数帯域は、ブロックベースの符号化器に提供されるブロックに編成され、符号化／圧縮される。一例として、フレームを１２８ｘ１２８のブロックに分割することができ、２レベルのウェーブレット分解を各１２８ｘ１２８のブロックに適用して、例えば図３Ｃに示すように、７つの周波数帯域を表す周波数データの３２ｘ３２ブロックを１６個生成することができる。

５３０で示されるように、符号化器は、符号化技術をブロック内の周波数帯域に適用して、データを圧縮する。符号化器は、例えば、高効率動画符号化（ＨＥＶＣ）符号化器であってもよい。しかしながら、いくつかの実施形態では、他の符号化技術が使用されてもよい。要素５２０で示されるように画素データを周波数帯域に分解することにより、周波数帯域は、符号化器によって別個のストリームとしてバッファリングされ、処理されることが可能となる。別個のストリームとして周波数帯域を処理することにより、符号化器の構成要素は、独立したストリームの処理を多重化することが可となる。ＨＥＶＣ符号化などのブロックベースの符号化方法では、ブロック（符号化ツリーユニット（ＣＴＵ）と呼ばれる）は、パイプラインにおいて複数のステージで処理される。２つ以上のブロックは、所与のクロックサイクルにおいてパイプラインの異なるステージにあってもよく、ブロックは、クロックのサイクルが進むにつれてパイプラインを通って移動する。所与のブロックの処理は、以前に処理された１つ以上の近隣ブロック、例えば、所与のブロックの上の行の１つ以上のブロック、及び／又は、所与のブロックの左側のブロックへの依存関係を有し得る。ストリームの処理を多重化することによって、符号化器は、所与のストリーム内のブロックの処理を間をあけて配置し、それにより、所与のブロックが依存関係を有する近隣ブロックを処理するために追加のクロックサイクルを提供する。例えば、所与のブロックが以前に処理された近隣ブロックに依存するステージに到達したときに、所与のブロックの左側のブロックは、パイプライン内で所与のブロックに数ステージ先行するブロックであってもよい。これにより、符号化器は、以前に処理されたブロックに対する依存関係により適切に対処可能となり、隣接ブロックに依存するステージにおける所与のブロックの処理を行う前に、パイプライン内の近隣ブロックの処理の完了を待つ必要性を低減又は排除することができる。

５４０で示されるように、無線インタフェースは、圧縮されたデータをパケット化し、無線接続を介してパケットをデバイスに送信する。

要素５２０で示されるように画素データを周波数帯域に分解することにより、要素５３０での符号化器及び要素５４０での無線インタフェースによって周波数帯域の優先が可能となる。典型的に、画像及び動画送信では、より低い周波数がより重要である一方、より高い周波数の重要性は薄い。より高い周波数は、通常、画像の詳細に対応し、したがって、優先度は、より低いと見なすことができる。より高い周波数帯域には、画像内のエネルギーのより小さい割合が含まれる。エネルギーの大部分は、より低い周波数帯域に含まれる。このように、画素データを周波数帯域に分解することにより、データストリームを符号化及び送信するときに符号化器及び無線インタフェースによって活用され得るデータストリームへの優先順位付けを提供する。例えば、いくつかの実施形態では、異なる圧縮技術を異なる周波数帯域に使用することができ、より低い優先度の帯域により積極的な圧縮を適用し、より高い優先度の帯域にはより控えめな圧縮を適用してもよい。別の例として、周波数帯域の優先順位付けは、ＶＲ／ＭＲシステムのグレースフルデグラデーションを提供するのに役立ち得る。無線接続の性能を監視することができ、デバイスからのフィードバックを考慮して、システム全体のパフォーマンスを追跡することができる。何らかの理由でシステムの性能が低下した場合、例えば、無線接続の質が低下し、無線接続の帯域幅容量が閾値を下回る場合、符号化器及び無線インタフェースは、より低い周波数帯域の１つ以上の符号化及び送信を優先することができ、より低い優先度レベルを割り当てられた１つ以上の周波数レベル、例えば、１つ以上のより高い周波数帯域の符号化及び／若しくは送信を低減又は低下させることができる。

５５０において、符号化及び送信されるスライスが更に存在する場合、方法は、要素５１０に戻り、次のスライスを処理する。さもなければ、５６０において、符号化及び送信されるフレームが更に存在する場合、方法は要素５１０に戻り、次のフレームの処理を開始する。

図６は、少なくともいくつかの実施形態に係る、図２に示すような動画符号化システムの動作方法のフローチャートである。図６の方法は、例えば、図４の４２０において実行されてもよい。図６の方法では、動画符号化システムは、複数の符号化器を使用してタイルベースの符号化を実行して、各スライスからのタイルをそれぞれ処理することができる。

６００で示されるように、レンダリングエンジンは、複数のタイル（この例では４つのタイル）を含むスライスをレンダリングし、各タイルは、複数の画素ブロック（この例では、４個の１２８ｘ１２８の画素ブロック）を含む。

６１０で示されるように、プレフィルタ構成要素は、レンズワープ及び／又は中心窩フィルタをスライスに適用する。いくつかの実施形態では、プレフィルタリングは、ウェーブレット変換の前に、基地局上のフレームに対してレンズワープを実行することを含んでもよい。レンズワープは、画像が閲覧されるデバイス上のレンズによって導入される画像の歪みを補正するために実行され、それによって画像の品質が改善される。いくつかの実施形態では、デバイスは、例えば較正プロセスによって生成されたレンズのレンズワープデータを記憶することができ、無線接続を介してレンズワープデータを基地局に提供することができる。次いで、基地局は、そのデバイスのレンズワープデータに基づいて、フレーム上でレンズワープを実行することができる。プレフィルタステージにおいて基地局上でレンズワープを実行することによって、ウェーブレット変換及び符号化を実行する前にフレームの解像度を低減することができる。これにより、圧縮の改善に役立ち得、無線リンク上でのレイテンシ及び帯域幅の使用を低減することができる。加えて、レンズワープを、復号後にデバイスで行うのではなく、プレフィルタステージにおいて基地局で実行することにより、画像データのフィルタリングは一度実行するのみでよい。これは、符号化の前に解像度を低減するために基地局でフィルタリングを実行し、次いで、デバイス上でレンズワープフィルタリングを実行することと対照的である。

いくつかの実施形態では、６１０でのプレフィルタリングは、中心窩領域内ではより高い解像度を維持しつつ、周辺領域での解像度を低減したフィルタリングもまた含んでもよい。いくつかの実施形態では、デバイスによって取得された視線追跡情報を使用して、ユーザが現在見ている方向を識別することができる。中心窩（中心窩領域と呼ばれる）に対応するフレームの領域は、決定された視線方向に少なくとも部分的に基づいて特定されてもよい。周辺領域（すなわち、フレームの中心窩領域の外側の部分）は、人間の視覚システムの知識に基づいて情報を減らすように、例えば、高周波数情報をフィルタリングし、かつ／又は、色圧縮を増加させることによって、プレフィルタリングされていてもよい。周辺領域のプレフィルタリングは、フレームの圧縮の改善を助けることができる。

いくつかの実施形態では、動画符号化システムは、タイルを処理する単一のプレフィルタ構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、各タイルを処理するための別個のプレフィルタ構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、それぞれが複数の（例えば、２つの）タイルを処理する、複数の（例えば、２つの）プレフィルタ構成要素を含み得る。

６２０で示されるように、ウェーブレット変換構成要素は、スライス内の画素ブロックにウェーブレット変換技術を適用して、画素データをＮ個の（例えば、７つの）周波数帯域に分解する。次いで、周波数帯域は、ブロックベースの符号化器に提供され得るブロック（例えば、ＣＴＵ）に編成される、符号化／圧縮される。一例として、フレームを１２８ｘ１２８のブロックに分割することができ、２レベルのウェーブレット分解を各１２８ｘ１２８のブロックに適用して、例えば図３Ｃに示すように、７つの周波数帯域を表す周波数データの３２ｘ３２ブロックを１６個生成することができる。

いくつかの実施形態では、動画符号化システムは、タイルを処理する単一のウェーブレット変換構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、各タイルを処理するための別個のウェーブレット変換構成要素を含み得る。いくつかの実施形態では、動画符号化システムは、それぞれが複数の（例えば、２つの）タイルを処理する、複数の（例えば、２つの）ウェーブレット変換構成要素を含み得る。

図６の方法では、例示的な動画符号化システムは、要素６２０において並行して生成されるスライスのうちの異なるものから周波数データのブロックを符号化するように構成された２つの符号化器を含む。例えば、第１の符号化器は、スライス０及び１からブロックを符号化するように構成されてもよく、第２の符号化器は、スライス２及び３からブロックを符号化するように構成されてもよい。６３０Ａで示されるように、第１の符号化器は、符号化技術をタイル０及び１のブロック内の周波数帯域に適用し、２つの異なるタイル間で異なる周波数帯域からブロックの処理を多重化する。６３０Ｂで示されるように、第２の符号化器は、符号化技術をタイル２及び３のブロック内の周波数帯域に適用し、２つの異なるタイル間で異なる周波数帯域からブロックの処理を多重化する。

符号化器は、例えば、高効率動画符号化（ＨＥＶＣ）符号化器であってもよい。しかしながら、いくつかの実施形態では、他の符号化技術が使用されてもよい。要素６２０で示されるように画素データを周波数帯域に分解することにより、周波数帯域は、要素６３０Ａ及び６３０Ｂでの符号化器によって別個のストリームとしてバッファリングされ、処理されることが可能となる。別個のストリームとして周波数帯域を処理することにより、符号化器は、独立したストリームの処理を多重化することが可能となる。ＨＥＶＣ符号化などのブロックベースの符号化方法では、ブロック（符号化ツリーユニット（ＣＴＵ）と呼ばれる）は、パイプラインにおいて複数のステージで処理される。２つ以上のブロックは、所与のクロックサイクルにおいてパイプラインの異なるステージにあってもよく、ブロックは、クロックのサイクルが進むにつれてパイプラインを通って移動する。所与のブロックの処理は、以前に処理された１つ以上の近隣ブロック、例えば、所与のブロックの上の行の１つ以上のブロック、及び／又は、所与のブロックの左側のブロックへの依存関係を有し得る。ストリームの処理を多重化することによって、符号化器は、所与のストリーム内のブロックの処理を間をあけて配置し、それにより、所与のブロックが依存関係を有する近隣ブロックを処理するために追加のクロックサイクルを提供する。例えば、所与のブロックが以前に処理された近隣ブロックに依存するステージに到達したときに、所与のブロックの左側のブロックは、パイプライン内で所与のブロックに数ステージ先行するブロックであってもよい。これにより、符号化器は、以前に処理されたブロックに対する依存関係により適切に対処可能となり、隣接ブロックに依存するステージにおける所与のブロックの処理を行う前に、パイプライン内の近隣ブロックの処理の完了を待つ必要性を低減又は排除することができる。

６４０で示されるように、無線インタフェースは、要素５３０で符号化器によって生成された圧縮データをパケット化し、無線接続を介してパケットをデバイスに送信する。６５０から６００に戻る矢印によって示されるように、この方法は、ユーザがＶＲ／ＭＲシステムを使用している限り継続する。

要素６２０で示されるように画素データを周波数帯域に分解することにより、要素６３０Ａ及び６３０Ｂでの符号化器並びに要素６４０での無線インタフェースによって周波数帯域の優先が可能となる。典型的に、画像及び動画送信では、より低い周波数がより重要である一方、より高い周波数の重要性は薄い。より高い周波数は、通常、画像の詳細に対応し、したがって、優先度は、より低いと見なすことができる。より高い周波数帯域には、画像内のエネルギーのより小さい割合が含まれる。エネルギーの大部分は、より低い周波数帯域に含まれる。このように、画素データを周波数帯域に分解することにより、データストリームを符号化及び送信するときに符号化器及び無線インタフェースによって活用され得るデータストリームへの優先順位付けを提供する。例えば、いくつかの実施形態では、異なる圧縮技術を異なる周波数帯域に使用することができ、より低い優先度の帯域により積極的な圧縮を適用し、より高い優先度の帯域にはより控えめな圧縮を適用してもよい。別の例として、周波数帯域の優先順位付けは、ＶＲ／ＭＲシステムのグレースフルデグラデーションを提供するのに役立ち得る。無線接続の性能を監視することができ、デバイスからのフィードバックを考慮して、システム全体のパフォーマンスを追跡することができる。何らかの理由でシステムの性能が低下した場合、例えば、無線接続の質が低下し、無線接続の帯域幅容量が閾値を下回る場合、符号化器及び無線インタフェースは、より低い周波数帯域の１つ以上の符号化及び送信を優先することができ、より低い優先度レベルを割り当てられた１つ以上の周波数レベル、例えば、１つ以上のより高い周波数帯域の符号化及び／若しくは送信を低減又は低下させることができる。

各スライスが４つのタイルに分割され、２つの符号化器が各スライスからのそれぞれのタイル上で動作する実施形態が記載されているが、いくつかの実施形態では、スライスをより多くのタイル（例えば、６つ又は８つのタイル）に分割することができ、いくつかの実施形態では、より多くの符号化器（例えば、３つ又は４つの符号化器）が使用されてもよい。

（例示的なＶＲ／ＭＲシステム）
図７は、少なくともいくつかの実施形態に係る、動画符号化システムを実装することができる例示的なＶＲ／ＭＲシステム２０００を示す。ＶＲ／ＭＲシステム２０００は、少なくとも１つのデバイス２１５０（例えば、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、ハンドヘルドコンピューティングデバイス、又はユーザによって装着され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのＨＭＤ）及びコンピューティングデバイス２１００（本明細書では基地局と呼ばれる）を含んでもよい。基地局２１００は、仮想コンテンツを含むＶＲ又はＭＲフレームをレンダリングし、フレームを符号化し、デバイス２１５０によって復号され表示されるように、符号化されたフレームを無線接続２１８０を介してデバイス２１５０に送信する。

基地局２１００及びデバイス２１５０はそれぞれ、基地局２１００及びデバイス２１５０が無線接続２１８０を介してデータを通信し交換することを可能にする無線通信技術を含み得る。いくつかの実施形態では、無線接続２１８０は、デバイス２１５０と基地局２１００との間に高指向性無線リンクを提供する独自の無線通信技術に従って実装されてもよい。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

いくつかの実施形態では、ＨＭＤ２１５０は、ユーザの環境に関する情報（例えば、動画、深度情報、照明情報など）、及び／又はユーザに関する情報（例えば、ユーザの表情、眼の動き、視線の方向、手のジェスチャなど）を収集するセンサを含んでもよい。デバイス２１５０は、センサによって収集された情報の少なくとも一部を、無線接続２１８０を介して基地局２１００に送信してもよい。基地局２１００は、センサから取得された様々な情報に少なくとも部分的に基づいて、仮想コンテンツを含むデバイス２１５０によって表示するためのフレームをレンダリングし、フレームを符号化し、符号化されたフレームを、復号しユーザに対し表示するために、無線接続２１８０を介してデバイス２１５０に送信することができる。フレームを符号化し送信するために、基地局２１００は、図１～図６に示すような動画符号化システムを実装してもよい。

図８は、いくつかの実施形態に係る、図７に示すような例示的なＶＲ／ＭＲシステムの機能部品及び処理を示すブロック図である。デバイス２１５０は、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、ハンドヘルドコンピューティングデバイス、又はユーザによって着用され得るヘッドセット、ヘルメット、ゴーグル、若しくは眼鏡などのＨＭＤであってもよいが、これらに限定されない。デバイス２１５０は、様々なタイプの仮想又は拡張現実表示技術のいずれかを実装し得るディスプレイ２１５６構成要素又はサブシステムを含み得る。例えば、ＨＭＤデバイス２１５０は、ＤＬＰ（digital light processing、デジタル光処理）、ＬＣＤ（liquid crystal display、液晶表示）、及びＬＣｏＳ（liquid crystal on silicon、反射型液晶素子）技術によるＶＲシステムなどの、ユーザの眼の前のスクリーン上にユーザが見る左右の画像を表示する、ニアアイシステムであってもよい。別の実施例として、ＨＭＤデバイス２１５０は、左右の画像を画素ごとにユーザの眼に走査する直接網膜投射システムであってもよい。画像を走査するために、左右のプロジェクタは、ユーザの眼の前に位置する左右の反射性構成要素（例えば、楕円面鏡）に向けられたビームを生成し、反射性構成要素は、ビームをユーザの眼に反射させる。３次元（３Ｄ）効果を生み出すために、３Ｄ仮想ビュー内で異なる奥行き又は距離にある仮想コンテンツは、三角測量による距離に応じて、より近いオブジェクトはより遠くのオブジェクト以上にシフトされるように、２つの画像内で左又は右にシフトされる。

デバイス２１５０はまた、本明細書に記載されるようなＶＲ／ＭＲシステム２０００のデバイス側機能を実装するように構成されたコントローラ２１５４を含んでもよい。いくつかの実施形態では、ＨＭＤ２１５０はメモリ２１７０をまた含んでもよく、メモリ２１７０は、コントローラ２１５４によって実行可能なＶＲ／ＭＲシステム２０００のデバイス構成要素のソフトウェア（コード２１７２）、並びにコントローラ２１５４上での実行時にソフトウェアによって使用され得るデータ２１７４を記憶するように構成されている。各種実施形態では、コントローラ２１５４は、１つのプロセッサを含むユニプロセッサシステム、又はいくつかのプロセッサ（例えば、２つ、４つ、８つ、若しくは他の好適な数）を含むマルチプロセッサシステムであってもよい。コントローラ２１５４は、任意の好適な命令セットアーキテクチャを実装するように構成された中央処理装置（ＣＰＵ）を含んでもよく、その命令セットアーキテクチャで定義された命令を実行するように構成されてもよい。例えば、各種実施形態では、コントローラ２１５４は、ｘ８６、ＰｏｗｅｒＰＣ、ＳＰＡＲＣ、ＲＩＳＣ、若しくはＭＩＰＳ命令セットアーキテクチャ（instruction set architecture、ＩＳＡ）、又は任意の他の好適なＩＳＡなどの、様々なＩＳＡのいずれかを実装する汎用プロセッサ又は組み込みプロセッサを含んでもよい。マルチプロセッサシステムでは、プロセッサの各々は、必ずしもではないが、同一のＩＳＡを共通して実装してもよい。コントローラ２１５４は、スカラ方式、スーパースカラ方式、パイプライン方式、スーパーパイプライン方式、アウトオブオーダ方式、インオーダ方式、スペキュレーティブ方式、非スペキュレーティブ方式など、又はそれらの組み合わせを含む、任意のマイクロアーキテクチャを採用してもよい。コントローラ２１５４は、マイクロコーディング技術を実装するための回路を含んでもよい。コントローラ２１５４は、各々が命令を実行するように構成された１つ以上の処理コアを含んでもよい。コントローラ２１５４は、任意のサイズ及び任意の構成（セットアソシエイティブ方式、ダイレクトマップ方式など）を用いることができる、１つ以上のレベルのキャッシュを含んでもよい。いくつかの実施形態では、コントローラ２１５４は、任意の好適なグラフィック処理回路を含むことができる、少なくとも１つのグラフィック処理ユニット（ＧＰＵ）を含むことができる。概して、ＧＰＵは、フレームバッファに表示されることになるオブジェクト（例えば、フレーム全体に対するピクセルデータを含むもの）をレンダリングするように構成されてもよい。ＧＰＵは、グラフィック演算の一部若しくは全て、又は特定のグラフィック演算のハードウェア高速化を実行するグラフィックソフトウェアを実行することができる、１つ以上のグラフィックプロセッサを含んでもよい。いくつかの実施形態では、コントローラ２１５４は、動画及び／又は画像を処理してレンダリングするための１つ以上の他の構成要素、例えば、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などを含んでもよい。いくつかの実施形態では、コントローラ２１５４は、少なくとも１つのシステムオンチップ（ＳＯＣ）を含んでもよい。

メモリ２１７０は、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、ダブルデータレート（ＤＤＲ、ＤＤＲ２、ＤＤＲ３など）ＳＤＲＡＭ（ｍＤＤＲ３などのモバイルバージョンのＳＤＲＡＭ又はＬＰＤＤＲ２などの低電力バージョンのＳＤＲＡＭを含む）、ＲＡＭＢＵＳＤＲＡＭ（ＲＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）などの、任意のタイプのメモリを含んでもよい。いくつかの実施形態では、１つ以上のメモリデバイスは、シングルインラインメモリモジュール（ＳＩＭＭ）、デュアルインラインメモリモジュール（ＤＩＭＭ）などのメモリモジュールを形成するために回路基板に結合されてもよい。代替的に、デバイスは、システムをチップオンチップ構成、パッケージオンパッケージ構成、又はマルチチップモジュール構成で実装する集積回路を搭載してもよい。

いくつかの実施形態では、センサ２１６０は、ユーザの眼の位置及び動きを追跡するために使用され得る１つ以上の視線追跡センサ（例えば、赤外線照明光源を有する赤外線カメラ）を含んでもよいが、これらに限定されない。いくつかの実施形態では、各視線追跡センサがそれぞれの眼を追跡する、２つの視線追跡センサが存在してもよい。いくつかの実施形態では、視線追跡センサによって収集された情報は、基地局２１００による画像のレンダリングを調整するため、かつ／又はユーザの眼が見ている方向及び角度に基づいて、デバイス２１５０の投影システムによる画像の投影を調節するために使用されてもよい。例えば、いくつかの実施形態では、ユーザの眼が現在見ている場所の周囲の領域内の画像のコンテンツは、ユーザが見ていない領域内のコンテンツよりも詳細かつより高い解像度でレンダリングされてもよい。これにより、画像データのための利用可能な処理時間が、眼の周辺領域によって見るコンテンツにではなく、眼の中心窩領域によって見るコンテンツに費やされることを可能にする。同様に、ユーザが見ていない領域内の画像のコンテンツは、ユーザが現在見ている地点の周囲の領域のコンテンツよりも多く圧縮されてもよい。いくつかの実施形態では、センサがユーザの眼のそれぞれの眼の眺めを有するような位置に、デバイス２１５０の内側表面上に位置する２つの視線追跡センサが存在してもよい。しかしながら、各種実施形態では、より多くの又はより少ない視線追跡センサが使用されてもよく、視線追跡センサは他の位置に位置してもよい。例示的な非限定的な実施形態では、各視線追跡センサは、赤外線光源及び赤外線カメラ、例えば、１２０ＦＰＳ以上のフレームレート、７０度の水平視野（ＨＦＯＶ）、及び１０～８０ミリメートル（ｍｍ）の作動距離を有する４００ｘ４００画素数のカメラを含んでもよい。

いくつかの実施形態では、デバイス２１５０は、デバイス２１５０の位置、向き、及び／又は動きを検出し、検出された位置、向き、及び／又は運動データをＨＭＤ２１５０のコントローラ２１５４及び／又は基地局２１００に提供するように構成された、少なくとも１つの慣性測定ユニット（inertial-measurement unit、ＩＭＵ）２１６２を含んでもよい。

デバイス２１５０はまた、無線接続２１８０を介して外部基地局２１００と通信して、基地局２１００にセンサ入力を送信し、レンダリングされ圧縮されたフレーム、スライス、又はタイルを基地局２１００から受信するように構成された無線インタフェース２１５２を含んでもよい。いくつかの実施形態では、無線インタフェース２１５２は、デバイス２１５０と基地局２１００との間に高指向性無線リンクを提供する独自の無線通信技術を実装することができる。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

基地局２１００は、無線インタフェース２１８０を介してデバイス２１５０に通信可能に結合された外部デバイス（例えば、コンピューティングシステム、ゲームコンソールなど）であってもよい。基地局２１００は、動画及び／又は画像をレンダリングし、フィルタリングし、符号化し、送信するための様々なタイプのプロセッサ（例えば、ＳＯＣ、ＣＰＵ、ＩＳＰ、ＧＰＵ、コーデック、及び／又は他の構成要素）のうちの１つ以上を含んでもよい。基地局２１００は、無線接続２１８０を介してセンサ２１６０から取得した様々な入力に少なくとも部分的に基づく仮想コンテンツを含むフレーム（各フレームは左右画像を含む）をレンダリングし、レンダリングしたフレーム（又はフレームのスライス）を本明細書に記載されるような動画符号化システムを使用してフィルタリングかつ圧縮し、圧縮されたフレーム又はスライスをデバイス２１５０に送信して表示することができる。

基地局２１００は、デスクトップコンピュータ、ノートブック若しくはラップトップコンピュータ、パッド若しくはタブレットデバイス、スマートフォン、ハンドヘルドコンピュータデバイス、ゲームコントローラ、ゲームシステムなどの任意のタイプのコンピューティングシステム若しくはコンピューティングデバイスであってもよく、又はそれを含んでもよい。基地局２１００は、本明細書に記載されるような動画符号化システムを含むＶＲ／ＭＲシステム２０００の基地局側機能を実装する１つ以上のプロセッサを備えるコントローラ２１１０を含んでもよい。基地局２１００はまた、基地局コントローラ２１１０によって実行可能なＶＲ／ＭＲシステム２０００の基地局構成要素のソフトウェア（コード２１２２）を記憶するように構成されたメモリ２１２０、並びに、コントローラ２１１０上で実行するときにソフトウェアによって使用され得るデータ２１２４を含んでもよい。

各種実施形態では、基地局コントローラ２１１０は、１つのプロセッサを含むユニプロセッサシステム、又はいくつかのプロセッサ（例えば、２つ、４つ、８つ、若しくは他の好適な数）を含むマルチプロセッサシステムであってもよい。コントローラ２１１０は、任意の好適な命令セットアーキテクチャを実装するように構成された中央処理装置（ＣＰＵ）を含んでもよく、その命令セットアーキテクチャで定義された命令を実行するように構成されてもよい。例えば、各種実施形態では、コントローラ２１１０は、ｘ８６、ＰｏｗｅｒＰＣ、ＳＰＡＲＣ、ＲＩＳＣ、若しくはＭＩＰＳ命令セットアーキテクチャ（ＩＳＡ）、又は任意の他の好適なＩＳＡなどの、様々なＩＳＡのいずれかを実装する汎用プロセッサ又は組み込みプロセッサを含んでもよい。マルチプロセッサシステムでは、プロセッサの各々は、必ずしもではないが、同一のＩＳＡを共通して実装してもよい。コントローラ２１１０は、スカラ方式、スーパースカラ方式、パイプライン方式、スーパーパイプライン方式、アウトオブオーダ方式、インオーダ方式、スペキュレーティブ方式、非スペキュレーティブ方式など、又はそれらの組み合わせを含む、任意のマイクロアーキテクチャを採用してもよい。コントローラ２１１０は、マイクロコーディング技術を実装するための回路を含んでもよい。コントローラ２１１０は、各々が命令を実行するように構成された１つ以上の処理コアを含んでもよい。コントローラ２１１０は、任意のサイズ及び任意の構成（セットアソシエイティブ方式、ダイレクトマップ方式など）を用いることができる、１つ以上のレベルのキャッシュを含んでもよい。いくつかの実施形態では、コントローラ２１１０は、任意の好適なグラフィック処理回路を含むことができる、少なくとも１つのグラフィック処理ユニット（ＧＰＵ）を含むことができる。概して、ＧＰＵは、フレームバッファに表示されることになるオブジェクト（例えば、フレーム全体に対するピクセルデータを含むもの）をレンダリングするように構成されてもよい。ＧＰＵは、グラフィック演算の一部若しくは全て、又は特定のグラフィック演算のハードウェア高速化を実行するグラフィックソフトウェアを実行することができる、１つ以上のグラフィックプロセッサを含んでもよい。いくつかの実施形態では、コントローラ２１１０は、本明細書に記載されるような動画及び／又は画像を処理し、レンダリングし、フィルタリングし、符号化するための１つ以上の他の構成要素、例えば、様々なタイプの集積回路（ＩＣ）、画像信号プロセッサ（ＩＳＰ）、符号化器／復号器（コーデック）などのうちの１つ以上を含んでもよい。いくつかの実施形態では、コントローラ２１１０は、少なくとも１つのシステムオンチップ（ＳＯＣ）を含んでもよい。

基地局メモリ２１２０は、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、ダブルデータレート（ＤＤＲ、ＤＤＲ２、ＤＤＲ３など）ＳＤＲＡＭ（ｍＤＤＲ３などのモバイルバージョンのＳＤＲＡＭ又はＬＰＤＤＲ２などの低電力バージョンのＳＤＲＡＭを含む）、ＲＡＭＢＵＳＤＲＡＭ（ＲＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）などの、任意のタイプのメモリを含んでもよい。いくつかの実施形態では、１つ以上のメモリデバイスは、シングルインラインメモリモジュール（ＳＩＭＭ）、デュアルインラインメモリモジュール（ＤＩＭＭ）などのメモリモジュールを形成するために回路基板に結合されてもよい。代替的に、デバイスは、システムをチップオンチップ構成、パッケージオンパッケージ構成、又はマルチチップモジュール構成で実装する集積回路を搭載してもよい。

基地局２１００は、無線接続２１８０を介してデバイス２１５０と通信して、デバイス２１５０からセンサ入力を受信し、基地局２１００からデバイス２１５０に圧縮フレーム、スライス、又はタイルを送信するように構成された１つ以上の無線技術インタフェース２１３０をまた含み得る。いくつかの実施形態では、無線技術インタフェース２１３０は、デバイス２１５０と基地局２１００との間に高指向性無線リンクを提供する独自の無線通信技術を実装することができる。いくつかの実施形態では、無線通信技術の指向性及び帯域幅は、複数のデバイス２１５０が同時に基地局２１００と通信することをサポートすることができ、それにより、複数のユーザが共同設置環境において同時にシステム２０００を使用することを可能にし得る。しかしながら、いくつかの実施形態では、他の商用（例えば、Ｗｉ－Ｆｉ、Ｂｌｕｅｔｏｏｔｈなど）又は独自の無線通信技術が使用されてもよい。

いくつかの実施形態では、基地局２１００は、フレームをレンダリングしてデバイス２１５０に送信し、デバイス２１５０から受信したセンサ２１６０の入力に少なくとも部分的に基づいて、３Ｄ仮想ビューをユーザのために提供するように構成されていてもよい。いくつかの実施形態では、仮想ビューは、ユーザの環境の高画質、高解像度の動画をリアルタイムでキャプチャし表示する、１つ以上のシーンカメラ（例えば、ＲＧＢ（可視光）動画カメラ）によってキャプチャされた動画に基づいて、ユーザの環境内の実際のオブジェクトのレンダリングを含む、ユーザの環境のレンダリングを含むことができる。いくつかの実施形態では、仮想ビューはまた、基地局２１００によってレンダリングされ、ユーザの現実環境の投影された３Ｄビューと合成された仮想コンテンツ（例えば、仮想オブジェクト、現実オブジェクトの仮想タグ、ユーザのアバターなど）を含んでもよい。

図７及び８には示されていないが、いくつかの実施形態では、ＶＲ／ＭＲシステム２０００は、１つ以上の他の構成要素を含んでもよい。例えば、システムは、仮想コンテンツと対話するために３Ｄ仮想ビュー内の仮想カーソルを移動させるためのカーソル制御デバイス（例えば、マウス）を含んでもよい。図７及び図８は、単一のデバイス２１５０を示すが、いくつかの実施形態では、ＶＲ／ＭＲシステム２０００は、複数のデバイス２１５０が同時に基地局２１００と通信することをサポートすることができ、それにより、複数のユーザが共同設置環境において同時にシステムを使用することを可能にし得る。

本明細書で説明される方法は、異なる実施形態では、ソフトウェア、ハードウェア、又はそれらの組み合わせの形態で実行されてもよい。加えて、方法のブロックの順序は変更されてもよく、様々な要素の追加、再順序付け、組み合わせ、省略、修正などが行われてもよい。本開示の利益を得る当業者にとって明白であるような、様々な修正及び変更が行われてもよい。本明細書に記載される各種実施形態は、例示的なものであり、限定的なものではない。多くの変形、修正、追加、及び改善が可能である。したがって、単一の事例として本明細書に記載される構成要素について、複数の事例を提供することができる。種々の構成要素、動作及びデータストアの間の境界は、ある程度任意のものであり、特定の動作は、特定の例示的な構成の文脈において示される。機能性の他の割り当てが想定され、以下に続く請求項の範囲内に含まれてもよい。最後に、例示的な構成における別個の構成要素として提示された構造及び機能性は、組み合わされた構造又は構成要素として実施されてもよい。それらの及び他の変形、修正、追加、及び改善は、以下に続く請求項で定義されるように、実施形態の範囲内に含まれてもよい。

Claims

１つ以上のプロセッサを備えるウェーブレット変換構成要素であって、前記１つ以上のプロセッサが、
レンダリングされた動画フレームからの画素ブロックにウェーブレット変換を適用して、前記画素ブロックを複数の周波数帯域に分解し、
前記画素ブロックからの前記周波数帯域を、前記周波数帯域のうちの１つの帯域の周波数データをそれぞれ含む複数の周波数ブロックに編成し、
前記周波数帯域に対する前記周波数ブロックを別個のストリームとしてバッファに提供し、各ストリームは、前記周波数帯域の１つに対応する、
ように構成されているウェーブレット変換構成要素と、
少なくとも１つのブロックベースの符号化器であって、
バッファリングされた周波数ブロックの前記別個のストリームを処理し、あるストリーム内の前記バッファリングされた周波数ブロックを処理し、前記少なくとも１つのブロックベースの符号化器は、符号化技術を前記バッファリングされた周波数ブロックに適用して前記周波数ブロック内の前記周波数データを圧縮し、
前記別個のストリームからの前記圧縮された周波数データを無線インタフェースに提供し無線接続を介して受信デバイスに伝達する、
ように構成されている少なくとも１つのブロックベースの符号化器と、
を備える、動画符号化システム。
前記ウェーブレット変換の前に、前記動画フレームからの前記画素ブロックをプレフィルタリングするように構成された１つ以上のプロセッサを含むプレフィルタ構成要素を更に備える、請求項１に記載の動画符号化システム。
前記画素ブロックをプレフィルタリングするために、前記プレフィルタ構成要素が前記動画フレームにレンズワープフィルタを適用して、前記受信デバイスのレンズによって導入された歪みを補正する、請求項２に記載の動画符号化システム。
前記画素ブロックをプレフィルタリングするために、前記プレフィルタ構成要素が前記動画フレームの周辺領域に少なくとも１つのフィルタを適用して、前記動画フレームの中心窩領域内でより高い解像度を維持しつつ、前記周辺領域の解像度を低減させる、請求項２に記載の動画符号化システム。
前記レンダリングされた映像フレームが複数のスライスに分割されて、各スライスは少なくとも１行の画素ブロックを含み、前記動画符号化システムは、反復的に、
前記レンダリングされた動画フレームのスライスを取得し、
前記ウェーブレット変換を前記スライス内の前記画素ブロックに適用して前記画素ブロックを複数の周波数帯域に分解し、前記周波数帯域のうちの１つの帯域の周波数データをそれぞれ含む複数の周波数ブロックに編成し、
前記周波数帯域に対する前記周波数ブロックを別個のストリームとしてバッファリングし、各ストリームは、前記周波数帯域の１つに対応し、
バッファリングされた周波数ブロックの前記別個のストリームを処理し、あるストリーム内の前記バッファリングされた周波数ブロックを処理し、前記少なくとも１つのブロックベースの符号化器は、前記符号化技術を前記スライスからの前記あるストリームの前記周波数ブロックに適用して前記バッファリングされた周波数ブロック内の前記周波数データを圧縮し、
前記スライスに対する前記別個のストリームからの前記圧縮された周波数データを前記無線接続を介して前記受信デバイスに伝達するために前記無線インタフェースに提供する、
ように実行するように構成されている、請求項１に記載の動画符号化システム。
前記レンダリングされた動画フレームが複数のスライスに分割され、各スライスが２つ以上のタイルを含み、各タイルは２つ以上の画素ブロックを含み、前記動画符号化システムが、少なくとも２つのブロックベースの符号化器を含み、各符号化器は、各スライスからの前記タイルのサブセットからのバッファリングされた周波数ブロックの前記別個のストリームを処理し、各スライスからの前記タイルの前記それぞれのサブセットからの前記バッファリングされた周波数ブロック内の前記周波数データを圧縮するように構成されている、請求項１に記載の動画符号化システム。
各符号化器が、そのそれぞれのサブセット内の前記タイル間に前記周波数帯域の前記周波数ブロックの処理を多重化して、各周波数帯域の周波数ブロックの前記処理間に複数の時間単位を可能にするように構成されている、請求項６に記載の動画符号化システム。
前記ウェーブレット変換が、前記動画フレームからの各画素ブロックに適用される２レベルのウェーブレット分解である、請求項１に記載の動画符号化システム。
前記ウェーブレット変換が、前記動画フレームからの各画素ブロックに適用されるＮレベルのウェーブレット分解であり、Ｎは調整可能である、請求項１に記載の動画符号化システム。
前記ウェーブレット変換を適用することが、ウェーブレット分解の１つ以上のウェーブレット係数にコアリング関数を適用することを含む、請求項１に記載の動画符号化システム。
前記画素ブロックが１２８ｘ１２８の画素ブロックであり、前記ウェーブレット変換が、それぞれの画素ブロックを、７つの異なる周波数帯域を表す１６個の３２ｘ３２の周波数データブロックに分解する、請求項１に記載の動画符号化システム。
１つ以上のプロセッサが、
レンダリングされた動画フレームからの画素ブロックにウェーブレット変換を適用して、前記画素ブロックを複数の周波数帯域に分解することと、
前記画素ブロックからの前記周波数帯域を、前記周波数帯域のうちの１つの帯域の周波数データをそれぞれ含む複数の周波数ブロックに編成することと、
前記周波数帯域に対する前記周波数ブロックを別個のストリームとしてバッファリングし、各ストリームは、前記周波数帯域の１つに対応することと、
バッファリングされた周波数ブロックの前記別個のストリームを処理し、あるストリーム内の前記バッファリングされた周波数ブロックを処理し、符号化技術を前記バッファリングされた周波数ブロックに適用して前記周波数ブロック内の前記周波数データを圧縮することと、
前記別個のストリームからの前記圧縮された周波数データを無線接続を介して受信デバイスに送信することと、
を実装するように構成されること、
を含む、方法。
前記ウェーブレット変換を適用する前に、前記動画フレームからの前記画素ブロックをプレフィルタリングすることを更に含み、
プレフィルタリングすることが、
レンズワープフィルタを前記動画フレームに適用して前記受信デバイスのレンズによって導入される歪みを補正すること、又は、
前記動画フレームの周辺領域に少なくとも１つのフィルタを適用して前記動画フレームの中心窩領域内でより高い解像度を維持しつつ、前記周辺領域内の解像度を低減させること、
のうちの１つ以上を含む、請求項１２に記載の方法。
前記動画フレームが複数のスライスに分割され、各スライスは少なくとも１行の画素ブロックを含み、前記１つ以上のプロセッサが、前記動画フレームの各スライスに対して、ウェーブレット変換を前記適用することと、前記編成することと、前記バッファリングすることと、前記バッファリングされた周波数ブロックの前記別個のストリームを処理することと、前記送信することと、を実行する、請求項１２に記載の方法。
前記動画フレームが複数のスライスに分割され、各スライスは２つ以上のタイルを含み、各タイルは２つ以上の画素ブロックを含み、前記１つ以上のプロセッサが、前記動画フレームの各タイルに対して、ウェーブレット変換を前記適用することと、前記編成することと、前記バッファリングすることと、前記バッファリングされた周波数ブロックの前記別個のストリームを処理することと、前記送信することと、を実行する、請求項１２に記載の方法。
前記バッファリングされた周波数ブロックの前記別個のストリームを処理することは、少なくとも２つのブロックベースの符号化器によって実行され、各符号化器は、各スライスからの前記タイルのサブセットからのバッファリングされた周波数ブロックの前記別個のストリームを処理して、前記タイルの前記それぞれのサブセットからの前記バッファリングされた周波数ブロック内の前記周波数データを圧縮し、前記方法は、各符号化器が前記周波数帯域の前記バッファリングされた周波数ブロックの前記処理を前記タイルのそれぞれのサブセット間で多重化して、各周波数帯域のバッファリングされた周波数ブロックの前記処理間に複数の時間単位を可能にすることを更に含む、請求項１５に記載の方法。
前記ウェーブレット変換が、前記動画フレームからの各画素ブロックに適用される２レベルウェーブレット分解である、請求項１２に記載の方法。
１つ以上のプロセッサ及びディスプレイサブシステムを備えるデバイスと、
レンダリングされた動画フレームからの画素データのブロックにウェーブレット変換を適用して、前記画素データを複数の周波数帯域に分解し、前記周波数帯域を、それぞれが前記周波数帯域の１つに対する周波数データを含む複数の周波数ブロックに編成し、
前記周波数帯域に対する前記周波数ブロックを別個のストリームとしてバッファに提供し、各ストリームは、前記周波数帯域の１つに対応する、するように構成された１つ以上のプロセッサと、
バッファリングされた周波数ブロックの前記別個のストリームを処理し、あるストリーム内の前記バッファリングされた周波数ブロックを処理する少なくとも１つのブロックベースの符号化器であって、前記周波数帯域を圧縮するために、符号化技術を前記バッファリングされた周波数ブロックに適用するように構成された、少なくとも１つのブロックベースの符号化器と、
前記圧縮された周波数帯域を、無線接続を介して前記デバイスに送信するように構成された無線インタフェースと、
を含む基地局と、を備え、
前記デバイスの前記１つ以上のプロセッサは、
前記基地局から受信した前記圧縮された周波数帯域を展開し、
前記展開した周波数帯域上でウェーブレット合成を実行して前記動画フレームの前記画素データを再構成し、
前記再構成された画素データを、前記ディスプレイサブシステムに提供して表示するように構成されている、
システム。
前記基地局の前記１つ以上のプロセッサは、前記ウェーブレット変換の前に前記動画フレームの前記画素データをプレフィルタリングするように更に構成され、前記画素データをプレフィルタリングするために、前記１つ以上のプロセッサは、前記動画フレームにレンズワープフィルタを適用して、前記デバイスのレンズによって導入された歪みを補正する、請求項１８に記載のシステム。
前記デバイスが、ヘッドマウントディスプレイ（ＨＭＤ）である、請求項１８に記載のシステム。