JP2023552116A

JP2023552116A - メッシュ解凍のための方法、処理回路構成を含む装置、並びに関連するプログラム及び記憶媒体

Info

Publication number: JP2023552116A
Application number: JP2023532133A
Authority: JP
Inventors: ホアン，チャオ; ジャン，シァン; ティエン，ジュン; シュー，シャオジョン; リウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2021-08-25
Filing date: 2022-08-24
Publication date: 2023-12-14
Also published as: WO2023028520A1; US20230063575A1; EP4200815A1; KR20230056750A; EP4200815A4; CN116997935A

Abstract

幾つかの例では、メッシュコーディングのための装置が処理回路構成を含む。処理回路構成は、パッチに分割されるメッシュのエンコードされた情報を運ぶビットストリームを受信する。ビットストリームは、第１の部分と、第２の部分とを含み、第１の部分は、パッチ情報を含み、第２の部分は、少なくとも第１のパッチの第１のエッジおよび第２のパッチの第２のエッジがエッジメイトのペアであることを示すパッチ境界情報を含む。処理回路構成は、第１の部分をデコードしてパッチ情報を取得し、第２の部分をデコードしてパッチ境界情報を取得する。処理回路構成は、パッチ情報およびパッチ境界情報に基づいて再構成されたメッシュを生成し、第１のエッジおよび第２のエッジは、第１のパッチを第２のパッチと接続するために、再構成されたメッシュ内の同じエッジにマッピングされる。

Description

（関連出願の参照）
本出願は、２０２１年８月２５日に出願された米国仮出願第６３／２３７，０９７号「Patch Zippering for Mesh Compression」に対する優先権の利益を主張する２０２２年８月２３日に出願された米国特許出願第１７／８９３，８９２号「PATCH ZIPPERING FOR MESH COMPRESSION」に対する優先権の利益を主張する。先行出願の開示は、その全文が参照により本明細書に援用される。

（技術分野）
本開示は、メッシュコーディング(mesh coding)に概ね関する実施形態を記載する。

本明細書において提供される背景記述は、開示の文脈を概ね提示することを目的としている。その成果がこの背景技術セクションに記載される範囲における現在名前が挙げられている発明者の成果、並びに他の点においては出願時に先行技術として適格でないことがある記述の側面は、本開示に対する先行技術として明示的にも黙示的にも認められていない。

様々な技術が、３次元（３Ｄ）空間において世界の中のオブジェクト(物体)、世界の中の環境、および同等のもののような世界をキャプチャして(取り込んで)表現するために開発されている。世界の３Ｄ表現は、より没入的な形態の相互作用(対話)および通信を可能にすることができる。幾つかの例では、ポイントクラウド(点群)およびメッシュを世界の３Ｄ表現として使用することができる。

本開示の態様が、メッシュコーディング（例えば、圧縮および解凍）のための方法および装置を提供する。幾つかの例では、メッシュコーディングのための装置が、処理回路構成を含む。処理回路構成は、パッチに分割されるメッシュのエンコードされた情報を運ぶビットストリームを受信する。ビットストリームは、第１の部分と、第２の部分とを含み、第１の部分は、パッチ情報を含み、第２の部分は、少なくとも第１のパッチの第１のエッジおよび第２のパッチの第２のエッジがエッジメイトのペアであることを示すパッチ境界情報を含む。処理回路構成は、第１の部分をデコードしてパッチ情報を取得し、第２の部分をデコードしてパッチ境界情報を取得する。処理回路構成は、パッチ情報およびパッチ境界情報に基づいて、再構成されたメッシュを生成し、第１のエッジおよび第２のエッジは、第１のパッチおよび第２のパッチを互いに接続する（ジップする(zip)）ために、再構成されたメッシュ内の同じエッジにマッピングされる。

幾つかの例において、第１の部分からデコードされるパッチ情報は、第２の部分からデコードされるパッチ境界情報とは異なるパッチ境界情報を有する。

幾つかの例において、処理回路構成は、第２の部分から境界テーブルをデコードし、境界テーブルは、パッチの境界頂点のリストを含む。処理回路構成は、境界テーブルに従って、第１のパッチについての境界頂点の第１のリストおよび第２のパッチについての境界頂点の第２のリストを決定する。さらに、処理回路構成は、境界頂点の第１のリストに従って第１のパッチについての第１の境界エッジを決定し、境界頂点の第２のリストに従って第２のパッチの第２の境界エッジを決定する。第１のエッジは、第１のパッチの第１の境界エッジの１つであり、第２のエッジは、第２のパッチの第２の境界エッジの１つである。

幾つかの例において、処理回路構成は、第２の部分から第１のアレイをデコードする。第１のアレイは、パッチの境界頂点をＵＶアトラスにマッピングするためのＵＶ座標を持つ(carries)。処理回路構成は、第１のアレイに従って、第１のパッチをＵＶアトラス内の第１のＵＶパッチにマッピングするために、境界頂点の第１のリストの第１の境界ＵＶ座標を決定する。第１のＵＶパッチは、第１のパッチに対応する。処理回路構成は、第１のアレイに従って、第２のパッチをＵＶアトラス内の第２のＵＶパッチにマッピングするために、境界頂点の第２のリストの第２の境界ＵＶ座標を決定する。第２のＵＶパッチは、第２のパッチに対応する。

再構成されたメッシュを生成するために、幾つかの例において、処理回路構成は、第１のＵＶパッチの内側の第１の頂点の第１のＵＶ座標を決定し、第２のＵＶパッチの内側の第２の頂点の第２のＵＶ座標を決定する。一例において、第１の頂点および第２の頂点は、ＵＶアトラスの規則的なグリッド(regular grid)にある。さらに、幾つかの例において、処理回路構成は、第１の頂点の第１のＵＶ座標および境界頂点の第１のリストの第１の境界ＵＶ座標に基づいて、第１のＵＶパッチについての第１の接続性情報を決定し、第２の頂点の第２のＵＶ座標および境界頂点の第２のリストの第２の境界ＵＶ座標に基づいて、第２のＵＶパッチについての第２の接続性情報を決定する。幾つかの例において、処理回路構成は、ビットストリーム中の信号に基づいて、特定の接続性決定技法の使用を決定する。

幾つかの例において、処理回路構成は、第２の部分から第２のアレイをデコードし、第２のアレイは、パッチの境界頂点に対応するメッシュのメッシュ頂点インデックス(mesh vertex indices)を持つ。処理回路構成は、第２のアレイに従って、第１のエッジの第１の頂点についての第１のメッシュ頂点インデックスを決定するように構成され、第２のアレイに従って、第２のエッジの第２の頂点についての第２のメッシュ頂点インデックスを決定する。第１のエッジの第１の頂点についての第１のメッシュ頂点インデックスは、第２のエッジの第２の頂点についての第２のメッシュ頂点インデックスと一致する。

幾つかの例において、処理回路構成は、第２の部分から第３のアレイをデコードし、第３のアレイは、メッシュ内のパッチの境界頂点についてのメッシュ頂点インデックスに対応する三次元座標を持つ。

幾つかの例において、処理回路構成は、第３のアレイに従って、第１のエッジの第１の頂点についての第１の３Ｄ座標を決定し、第３のアレイに従って、第２のエッジの第２の頂点の第２の３Ｄ座標を決定する。第１のエッジの第１の頂点についての第１の３Ｄ座標は、第２のエッジの第２の頂点の第２の３Ｄ座標と一致する。

本開示の態様は、命令を格納する非一時的なコンピュータ読取可能な媒体も提供し、命令は、コンピュータによって実行されるときに、メッシュコーディングのための方法のいずれか１つまたは組み合わせをコンピュータに実行させる。

開示された主題事項のさらなる構成、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになるであろう。

幾つかの例における通信システムのブロック図を示している。

幾つかの例におけるストリーミングシステムのブロック図を示している。

幾つかの例におけるポイントクラウドフレームをエンコードするためのエンコーダのブロック図を示している。

幾つかの例におけるポイントクラウドフレームに対応する圧縮されたビットストリームをデコードするためのデコーダのブロック図を示している。

幾つかの例におけるビデオデコーダのブロック図を示している。

幾つかの例におけるビデオエンコーダのブロック図を示している。

ポイントクラウドフレームに対応する圧縮されたビットストリームをデコードするためのデコーダのブロック図を示している。

幾つかの例における再構成されたメッシュの図を示している。

幾つかの例におけるメッシュコーディング（圧縮および解凍）フレームワークのブロック図を示している。

幾つかの例におけるプロセス例を概説するフローチャートを示している。

幾つかの例におけるコンピュータシステムの概略図を示している。

本開示の態様が、三次元（３Ｄ）メディア処理(media processing)の分野における技術を提供する。

三次元（３Ｄ）キャプチャ、３Ｄモデリング、および３Ｄレンダリング、および同等物における進歩のような、３Ｄメディア処理における技術開発は、幾つかのプラットフォームおよびデバイスに亘って３Ｄメディアコンテンツのユビキタスな存在を促進している。例えば、赤ちゃんの最初の一歩が、１つの大陸でキャプチャされる(取り込まれる)ことができ、媒体技術は、祖父母が別の大陸で赤ちゃんを見て（そして、おそらく対話して）、赤ちゃんとの没入的体験を楽しむことを可能にすることができる。本開示の一態様によれば、没入的体験を向上させるために、３Ｄモデルは、ますます洗練されてきており、３Ｄモデルの作成および消費は、データストレージ、データ送信リソースのような、有意な量のデータリソースを占めている。

本開示の幾つかの態様によれば、ポイントクラウド(点源)(point clouds)およびメッシュ(meshes)を３Ｄモデルとして使用して没入的コンテンツを表現することができる。

ポイントクラウドは、一般に、各ポイント(点)が、色、材料特性、テクスチャ情報、強度属性、反射率属性、モーション関連属性、モダリティ属性、および様々な他の属性のような、属性と関連付けられる、３Ｄ空間内のポイントのセットを指すことがある。ポイントクラウドは、オブジェクトまたはシーンをそのようなポイントの組成として再構成するために使用されることができる。

オブジェクトの（メッシュモデルとも呼ばれる）メッシュは、オブジェクトの表面を記述するポリゴン(polygon)を含むことができる。各ポリゴンは、３Ｄ空間内のポリゴンの頂点と、頂点がどのように接続されてポリゴンになるのかの情報とによって定義されることができる。頂点がどのように接続されてポリゴンになるかの情報は、接続性情報と呼ばれる。幾つかの例において、メッシュは、頂点と関連付けられた色、法線、および同等物のような、属性を含むこともできる。

本開示の幾つかの態様によれば、ポイントクラウド圧縮（ＰＣＣ：point cloud compression）のための幾つかのコーディングツールをメッシュ圧縮のために使用することができる。例えば、メッシュを再メッシュして、新しいメッシュの接続性上方を推測できる新しいメッシュを生成することができる。新しいメッシュの頂点、および新しいメッシュの頂点と関連付けられる属性は、ポイントクラウド内のポイントと見なされることができ、ＰＣＣコーデックを使用して圧縮されることができる。

ポイントクラウドを使用して、オブジェクトまたはシーンをそのようなポイントの組成として再構成することができる。ポイントは、複数のカメラ、奥行きセンサ、またはＬｉｄａｒをさまざまな設定において使用してキャプチャされることができ、再構成されたシーンまたはオブジェクトを現実的に表現するために、数千から数十億のポイントで構成されることがある。パッチ(patch)は、一般に、ポイントクラウドによって記述される表面の連続したサブセットを指すことがある。一例において、パッチは、閾値量よりも少ない量で互いに逸脱する表面法線ベクトル(surface normal vectors)を持つポイントを含む。

ＰＣＣは、Ｇ－ＰＣＣと呼ばれるジオメトリ(geometry)(幾何学的形状)ベースのスキーム、Ｖ－ＰＣＣと呼ばれるビデオコーディング(video coding)ベースのスキーム、および同等のスキームのような、様々なスキームに従って行われることができる。本開示の幾つかの態様によれば、Ｇ－ＰＣＣは、３Ｄジオメトリを直接的にエンコード(符号化)し、ビデオコーディングと共有することがあまりない純粋にジオメトリベースのアプローチであり、Ｖ－ＰＣＣは、ビデオコーディングに大きく基づいている。例えば、Ｖ－ＰＣＣは、３Ｄクラウドのポイントを２Ｄグリッド（画像）のピクセル(画素)にマッピングすることができる。Ｖ－ＰＣＣスキームは、ポイントクラウド圧縮のために汎用ビデオコーデックを利用することができる。本開示におけるＰＣＣコーデック（エンコーダ／デコーダ）は、Ｇ－ＰＣＣコーデック（エンコーダ／デコーダ）またはＶ－ＰＣＣコーデックであることができる。

本開示の一態様によれば、Ｖ－ＰＣＣスキームは、既存のビデオコーデックを使用して、ポイントクラウドのジオメトリ、占有、およびテクスチャを３つの別個のビデオシーケンスとして圧縮することができる。３つのビデオシーケンスを解釈するために必要とされる余分のメタデータは、別個に圧縮される。全体的なビットストリームの小さな部分が、メタデータであり、メタデータは、一例において、ソフトウェア実装を使用して効率的にエンコード(符号化)／デコード(復号化)されることができる。情報の大部分は、ビデオコーデックによって処理される。

図１は、幾つかの例における通信システム（１００）のブロック図を示している。通信システム（１００）は、例えば、ネットワーク（１５０）を介して相互に通信できる複数の端末デバイスを含む。例えば、通信システム（１００）は、ネットワーク（１５０）を介して相互接続される端末デバイス（１１０）および（１２０）のペアを含む。図１の例において、端末デバイス（１１０）および（１２０）の第１のペアは、ポイントクラウドデータの単方向送信を行うことができる。例えば、端末デバイス（１１０）は、端末デバイス（１１０）と接続されるセンサ（１０５）によってキャプチャされるポイントクラウド（例えば、構造を表すポイント）を圧縮することがある。圧縮されたポイントクラウドは、ネットワーク（１５０）を介して、例えば、ビットストリームの形態において、他の端末デバイス（１２０）に送信されることができる。端末デバイス（１２０）は、ネットワーク（１５０）から圧縮されたポイントクラウドを受信し、ポイントクラウドを再構成するためにビットストリームを解凍し、再構成されたポイントクラウドを適切に表示することがある。一方向データ送信は、メディアサービスアプリケーションおよび同等物において一般的であることがある。

図１の例において、端末デバイス（１１０）および（１２０）は、サーバ、およびパーソナルコンピュータとして図示されることがあるが、本開示の原理は、そのように限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、ゲーム端末、メディアプレーヤー、および／または専用の３次元（３Ｄ）機器に用途を見出す。ネットワーク（１５０）は、端末デバイス（１１０）および（１２０）の間で圧縮されたポイントクラウドを送信する任意の数のネットワークを表す。ネットワーク（１５０）は、例えば、ワイヤライン（有線）および／または無線通信ネットワークを含むことができる。ネットワーク（１５０）は、回線交換チャネルおよび／またはパケット交換チャネルでデータを交換することがある。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、インターネット、および同等物を含む。

図２は、幾つかの例におけるストリーミングシステム（２００）のブロック図を示している。ストリーミングシステム（２００）は、ポイントクラウドの利用アプリケーションである。開示される主題事項は、３Ｄテレプレゼンスアプリケーション、仮想現実アプリケーション、および同等物のような、他のポイントクラウド対応アプリケーションに等しく適用可能であり得る。

ストリーミングシステム（２００）は、キャプチャサブシステム（２１３）を含むことがある。キャプチャサブシステム（２１３）は、ポイントクラウドソース（２０１）、例えば、光検出および測距（ＬＩＤＡＲ）システム、３Ｄカメラ、３Ｄスキャナ、ソフトウェアにおいて圧縮されていないポイントクラウドを生成するグラフィックス生成コンポーネント、および、例えば、圧縮されていないポイントクラウド（２０２）を生成する同等物を含むことができる。一例において、ポイントクラウド（２０２）は、３Ｄカメラによってキャプチャされるポイントを含む。ポイントクラウド（２０２）は、圧縮されたポイントクラウド（２０４）（圧縮されたポイントクラウドのビットストリーム）と比較されるときの高いデータ量を強調するために太線で描写されている。圧縮されたポイントクラウド（２０４）は、ポイントクラウドソース（２０１）に結合されたエンコーダ（２０３）を含む電子デバイス（２２０）によって生成されることができる。エンコーダ（２０３）は、以下により詳細に記載されるように、開示される主題事項の態様を有効化するか或いは実装するために、ハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ポイントクラウドのストリーム（２０２）と比較されるときの低いデータ量を強調するために細い線として表現される、圧縮されたポイントクラウド（２０４）（または圧縮されたポイントクラウドのビットストリーム（２０４））は、将来の使用のためにストリーミングサーバ（２０５）に格納されることができる。図２のクライアントサブシステム（２０６）および（２０８）のような１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（２０５）にアクセスして、圧縮されたポイントクラウド（２０４）のコピー（２０７）および（２０９）を取り出す(retrieve)ことができる。クライアントサブシステム（２０６）は、例えば、電子デバイス（２３０）内にデコーダ（２１０）を含むことができる。デコーダ（２１０）は、圧縮されたポイントクラウドの入って来る(incoming)コピー（２０７）をデコードし、レンダリングデバイス（２１２）でレンダリングされることができる再構成されたポイントクラウド（２１１）の出て行く(outgoing)ストリームを作成する。

電子デバイス（２２０）および（２３０）は、他のコンポーネント（図示せず）を含むことができることに留意されたい。例えば、電子デバイス（２２０）は、デコーダ（図示せず）を含むことができ、電子デバイス（２３０）は、エンコーダ（図示せず）を含むこともできる。

幾つかのストリーミングシステムにおいて、圧縮されたポイントクラウド（２０４）、（２０７）、および（２０９）（例えば、圧縮されたポイントクラウドのビットストリーム）は、特定の標準に従って圧縮されることができる。幾つかの例では、ビデオコーディング標準が、ポイントクラウドの圧縮において使用される。それらの標準の例は、ＨＥＶＣ（High Efficiency Video Coding)、ＶＶＣ（Versatile Video Coding）、および同等物を含む。

図３は、幾つかの実施例による、ポイントクラウドフレームをエンコードするためのＶ－ＰＣＣエンコーダ（３００）のブロック図を示している。幾つかの実施形態において、Ｖ－ＰＣＣエンコーダ（３００）は、通信システム（１００）およびストリーミングシステム（２００）において使用されることができる。例えば、エンコーダ（２０３）は、Ｖ－ＰＣＣエンコーダ（３００）と同様の方法で構成おされることができ、且つ作動することができる。

Ｖ－ＰＣＣエンコーダ（３００）は、ポイントクラウドフレームを圧縮されていない入力として受信し、圧縮されたポイントクラウドフレームに対応するビットストリームを生成する。幾つかの実施形態において、Ｖ－ＰＣＣエンコーダ（３００）は、ポイントクラウドソース（２０１）および同等物のようなポイントクラウドソースからポイントクラウドフレームを受信することがある。

図３の例において、Ｖ－ＰＣＣエンコーダ（３００）は、パッチ生成モジュール（３０６）と、パッチパッキング(patch packing)モジュール（３０８）と、ジオメトリ画像生成モジュール（３１０）と、テクスチャ画像生成モジュール（３１２）と、パッチ情報モジュール（３０４）と、占有マップモジュール（３１４）と、平滑化(smoothing)モジュール（３３６）と、画像パディング(image padding)モジュール（３１６）および（３１８）と、グループ拡張(group dilation)モジュール（３２０）と、ビデオ圧縮モジュール（３２２）、（３２３）および（３３２）と、補助パッチ情報圧縮モジュール（３３８）と、エントロピー圧縮モジュール（３３４）と、マルチプレクサ（３２４）とを含む。

本開示の一態様によれば、Ｖ－ＰＣＣエンコーダ（３００）は、圧縮されたポイントクラウドを解凍されたポイントクラウドに変換して戻すために使用される幾つかのメタデータ（例えば、占有マップおよびパッチ情報）とともに、三次元ポイントクラウドフレームを画像ベースの表現に変換する。幾つかの例において、Ｖ－ＰＣＣエンコーダ（３００）は、３Ｄポイントクラウドフレームをジオメトリ画像、テクスチャ画像および占有マップに変換し、次に、ビデオコーディング技術を使用して、ジオメトリ画像、テクスチャ画像および占有マップをビットストリームにエンコードすることができる。一般に、ジオメトリ画像は、ピクセルに投影されるポイントと関連付けられるジオメトリ値で満たされたピクセルを持つ２Ｄ画像であり、ジオメトリ値で満たされたピクセルは、ジオメトリサンプルと呼ばれることができる。テクスチャ画像が、ピクセルに投影されるポイントと関連付けられるテクスチャ値で満たされたピクセルを持つ２Ｄ画像であり、テクスチャ値で満たされたピクセルは、テクスチャサンプルと呼ばれることができる。占有マップは、パッチによって占められていることまたは占められていないことを示す値で満たされたピクセルを持つ２Ｄ画像である。

パッチ生成モジュール（３０６）は、各パッチが２Ｄ空間内の平面に対する深度フィールドによって記述されることがあるように、ポイントクラウドを、オーバーラップしてよい或いはオーバーラップしなくてよいパッチのセットにセグメント化する（例えば、パッチは、ポイントクラウドによって記述される表面の連続したサブセットとして定義される）。幾つかの実施形態において、パッチ生成モジュール（３０６）は、ポイントクラウドを滑らかな境界を持つ最小数のパッチに分解する一方で、再構成エラーも最小限に抑えることを目的としている。

幾つかの例において、パッチ情報モジュール（３０４）は、パッチのサイズおよび形状を示すパッチ情報を収集することができる。幾つかの例において、パッチ情報は、画像フレームにパックされることができ、次に、圧縮された補助パッチ情報を生成するために補助パッチ情報圧縮モジュール（３３８）によってエンコードされる。

幾つかの例において、パッチパッキングモジュール（３０８）は、抽出されるパッチを２次元（２Ｄ）グリッド(格子)にマッピングする一方で、未使用の空間を最小限に抑え且つグリッドのあらゆるＭ×Ｍ（例えば１６×１６）ブロックが一意のパッチと関連付けられることを保証するように構成される。効率的なパッチパッキングは、未使用の空間を最小限に抑えることまたは時間的な一貫性を確保することのいずれかによって、圧縮効率に直接的に影響を与えることができる。

ジオメトリ画像生成モジュール（３１０）は、所与のパッチ場所でポイントクラウドのジオメトリと関連付けられる２Ｄジオメトリ画像を生成することができる。テクスチャ画像生成モジュール（３１２）は、所与のパッチ場所でポイントクラウドのテクスチャと関連付けられた２Ｄテクスチャ画像を生成することができる。ジオメトリ画像生成モジュール（３１０）およびテクスチャ画像生成モジュール（３１２）は、パッキングプロセス中に計算される３Ｄから２Ｄへのマッピングを利用して、ポイントクラウドのジオメトリおよびテクスチャを画像として格納する。複数のポイントが同じサンプルに投影されている場合をより適切に処理するために、各パッチは、レイヤー(層)と呼ばれる２つの画像の上に投影される。一例において、ジオメトリ画像は、ＹＵＶ４２０－８ビットフォーマットにおけるＷ×Ｈの単色フレームによって表される。テクスチャ画像を生成するために、テクスチャ生成手順は、再サンプリングされるポイントと関連付けられる色を計算するために、再構成された／平滑化されたジオメトリを利用する。

占有マップモジュール（３１４）は、各ユニットでパディング情報を記述する占有マップを生成することができる。例えば、占有画像は、グリッドの各セルについてセルが空の空間に属しているか或いはポイントクラウドに属しているかを示すバイナリマップを含む。一例において、占有マップは、各ピクセルについてピクセルがパディングされているかどうかを記述するバイナリ情報を使用する。別の例において、占有マップは、ピクセルのブロックについてピクセルのブロックがパディングされているかどうかを記述するバイナリ情報を使用する。

占有マップモジュール（３１４）によって生成される占有マップは、可逆(無損失)コーディングまたは非可逆(損失性)コーディングを使用して圧縮されることができる。可逆コーディングが使用されるときには、エントロピー圧縮モジュール（３３４）を使用して占有マップを圧縮する。非可逆コーディングを使用するときには、ビデオ圧縮モジュール（３３２）を使用して占有マップを圧縮する。

パッチパッキングモジュール（３０８）は、画像フレームにパックされる２Ｄパッチの間に幾つかの空の空間を残すことがあることに留意されたい。画像パディングモジュール（３１６）および（３１８）は、２Ｄビデオおよび画像コーデックに適することがある画像フレームを生成するために、空の空間を満たすことができる（パディング(padding)と呼ばれる）。画像パディングは、冗長な情報で未使用の空間を満たすことができるバックグラウンド充填(background filling)とも呼ばれる。幾つかの例では、良好なバックグラウンド充填が、ビットレートを最小限に増加させる一方で、パッチ境界の周りに有意なコーディングひずみ(coding distortion)を導入しない。

ビデオ圧縮モジュール（３２２）、（３２３）、および（３３２）は、ＨＥＶＣ、ＶＶＣおよび同等物のような、適切なビデオコーディング標準に基づいて、パディングされたジオメトリ画像、パディングされたテクスチャ画像、および占有マップのような、２Ｄ画像をエンコードすることができる。一例において、ビデオ圧縮モジュール（３２２）、（３２３）、および（３３２）は、別個に作動する個別のコンポーネントである。別の例において、ビデオ圧縮モジュール（３２２）、（３２３）、および（３３２）は、単一のコンポーネントとして実装され得ることに留意されたい。

幾つかの例において、平滑化モジュール（３３６）は、再構成されたジオメトリ画像の平滑化された画像を生成するように構成される。平滑化された画像は、テクスチャ画像生成（３１２）に提供されることができる。次に、テクスチャ画像生成（３１２）は、再構成されたジオメトリ画像に基づいてテクスチャ画像の生成を調整することがある。例えば、エンコードおよびデコード中にパッチ形状（例えば、ジオメトリ）が僅かにひずむとき、ひずみは、パッチ形状におけるひずみを補正するために、テクスチャ画像を生成するときに考慮されることがある。

幾つかの実装において、グループ拡張（３２０）は、再構成されたポイントクラウドの視覚的品質ならびにコーディング利得を向上させるために、冗長な低周波コンテンツでオブジェクト境界の周囲のピクセルをパディングするように構成される。

マルチプレクサ（３２４）は、圧縮されたジオメトリ画像、圧縮されたテクスチャ画像、圧縮された占有マップ、圧縮された補助パッチ情報を圧縮されたビットストリームに多重化する(multiplex)ことができる。

図４は、幾つかの例において、ポイントクラウドフレームに対応する圧縮されたビットストリームをデコードするためのＶ－ＰＣＣデコーダ（４００）のブロック図を示している。幾つかの例において、Ｖ－ＰＣＣデコーダ（４００）は、通信システム（１００）およびストリーミングシステム（２００）において使用されることができる。例えば、デコーダ（２１０）は、Ｖ－ＰＣＣデコーダ（４００）と同様の方法で作動するように構成されることができる。Ｖ－ＰＣＣデコーダ（４００）は、圧縮されたビットストリームを受信し、圧縮されたビットストリームに基づいて再構成されたポイントクラウドを生成する。

図４の例において、Ｖ－ＰＣＣデコーダ（４００）は、デマルチプレクサ（４３２）と、ビデオ解凍モジュール（４３４）および（４３６）と、占有マップ解凍モジュール（４３８）と、補助パッチ情報解凍モジュール（４４２）と、ジオメトリ再構成モジュール（４４４）と、平滑化モジュール（４４６）と、テクスチャ再構成モジュール（４４８）と、色平滑化(color smoothing)モジュール（４５２）とを含む。

デマルチプレクサ（４３２）は、圧縮されたビットストリームを受信し、圧縮されたビットストリームを圧縮されたテクスチャ画像、圧縮されたジオメトリ画像、圧縮された占有マップ、および圧縮された補助パッチ情報に分離することができる。

ビデオ圧縮モジュール（４３４）および（４３６）は、適切な標準（例えば、ＨＥＶＣ、ＶＶＣなど）に従って圧縮された画像をデコードし、解凍された画像を出力することができる。例えば、ビデオ解凍モジュール（４３４）は、圧縮されたテクスチャ画像をデコードし、解凍されたテクスチャ画像を出力し、ビデオ圧縮モジュール（４３６）は、圧縮されたジオメトリ画像をデコードし、解凍されたジオメトリ画像を出力する。

占有マップ解凍モジュール（４３８）は、適切な標準（例えば、ＨＥＶＣ、ＶＶＣなど）に従って圧縮された占有マップをデコードし、解凍された占有マップを出力することができる。

補助パッチ情報解凍モジュール（４４２）は、適切な標準（例えば、ＨＥＶＣ、ＶＶＣなど）に従って圧縮された補助パッチ情報をデコードし、解凍された補助パッチ情報を出力することができる。

ジオメトリ再構成モジュール（４４４）は、解凍されたジオメトリ画像を受信し、解凍された占有マップおよび解凍された補助パッチ情報に基づいて再構成されたポイントクラウドジオメトリを生成することができる。

平滑化モジュール（４４６）は、パッチのエッジにおける不一致(incongruences)を平滑化することができる。平滑化手順は、圧縮アーティファクトに起因してパッチ境界で生じることがある潜在的な不連続性を緩和することを目的としている。幾つかの実施形態では、圧縮／解凍によって引き起こされることがあるひずみを緩和するために、平滑化フィルタが、パッチ境界に位置するピクセルに適用されることがある。

テクスチャ再構成モジュール（４４８）は、解凍されたテクスチャ画像および平滑化ジオメトリに基づいてポイントクラウド内のポイントについてのテクスチャ情報を決定することができる。

色平滑化モジュール（４５２）は、色合い(coloring)の不一致を平滑化することができる。３Ｄ空間内の隣接しないパッチは、しばしば、２Ｄビデオでは互いに隣り合ってパックされる。幾つかの例では、隣接しないパッチからのピクセル値が、ブロックベースのビデオコーデックによって混同されることがある。色平滑化の目的は、パッチ境界に現れる目に見えるアーティファクトを減少させることである。

図５は、幾つかの例におけるビデオデコーダ（５１０）のブロック図を示している。ビデオデコーダ（５１０）は、Ｖ－ＰＣＣデコーダ（４００）において使用されることができる。例えば、ビデオ解凍モジュール（４３４）および（４３６）ならびに占有マップ解凍モジュール（４３８）は、ビデオデコーダ（５１０）と同様に構成されることができる。

ビデオデコーダ（５１０）は、コーディングされたビデオシーケンスのような圧縮された画像(圧縮画像)からシンボル（５２１）を再構成するパーサ（５２０）を含むことがある。それらのシンボルのカテゴリは、ビデオデコーダ（５１０）の動作を管理するために使用される情報を含む。パーサ（５２０）は、受信されるコーディングされたビデオシーケンスを構文解析する／エントロピーデコードすることがある。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術または標準に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト感度を持つ或いは持たない算術コーディングなどを含む、様々な原理に従うことができる。パーサ（５２０）は、コーディングされたビデオシーケンスから、グループに対応する少なくとも１つのパラメータに基づいて、ビデオデコーダ内のピクセルのサブグループのうちの少なくとも１つのサブグループについて、サブグループパラメータのセットを抽出することがあきる。サブグループは、ピクチャのグループ（ＧＯＰ：Group of Pictures）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（ＣＵ：Coding Units）、ブロック、変換ユニット（ＴＵ：Transform Units）、予測ユニット（ＰＵ：Prediction Units）などを含むことができる。パーサ（５２０）は、変換係数、量子化子パラメータ値、動きベクトルなどのようなコーディングされたビデオシーケンス情報から抽出することもある。

パーサ（５２０）は、シンボル（５２１）を作成するために、バッファメモリから受信するビデオシーケンスに対してエントロピーデコーディング／構文解析動作を行うことがある。

シンボルの再構成（５２１）は、コーディングされたビデオピクチャまたは（インターピクチャおよびイントラピクチャ、インターブロックおよびイントラブロックのような）その部分のタイプおよび他の要因に依存して、複数の異なるユニットを含むことができる。どのユニットが関与し、どのように関与するかは、パーサ（５２０）によってコーディングされたビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ（５２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明瞭性のために描写されていない。

既述の機能ブロックを超えて、ビデオデコーダ（５１０）は、以下に記載されるように多数の機能ユニットに概念的に細分化されることができる。商業的制約の下で作動する実用的な実装において、これらのユニットの多くは、互いに密接に相互作用し、少なくとも部分的には、互いに統合させられることができる。しかしながら、開示される主題事項を記述する目的のために、以下の機能ユニットへの概念的な細分化が適切である。

第１のユニットは、スケーラ／逆変換ユニット（５５１）である。スケーラ／逆変換ユニット（５５１）は、パーサ（５２０）から、量子化された変換係数、並びにどの変換を使用するか、ブロックサイズ、量子化係数、量子化スケーリング行列などを含む制御情報を、シンボル（５２１）として受信する。スケーラ／逆変換ユニット（５５１）は、アグリゲータ（５５５）に入力されることができるサンプル値を含むブロックを出力することができる。

幾つかの場合において、スケーラ／逆変換ユニット（５５１）の出力サンプルは、イントラコーディングされた(intro coded)ブロック、すなわち、以前に再構成されたピクチャからの予測情報を使用していないが、現在のピクチャのうちの以前に再構成された部分からの予測情報を使用することができるブロックに関係することができる。そのような予測情報は、イントラピクチャ(intro picture)予測ユニット（５５２）によって提供されることができる。幾つかの場合において、イントラピクチャ予測ユニット（５５２）は、現在のピクチャバッファ（５５８）からフェッチされた周囲の再構成済み情報を使用して、再構成の下にあるブロックと同じサイズおよび形状のブロックを生成する。現在のピクチャバッファ（５５８）は、例えば、部分的に再構成された現在のピクチャおよび／または完全に再構成された現在の画像をバッファする。アグリゲータ（５５５）は、幾つかの場合には、イントラ予測ユニット（５５２）が生成した予測情報を、スケーラ／逆変換ユニット（５５１）によって提供されるような出力サンプル情報に、サンプル毎ベースで追加する。

他の場合には、スケーラ／逆変換ユニット（５５１）の出力サンプルは、インターコーディングされた、潜在的に動き補償されたブロックに関係することができる。そのような場合には、動き補償予測ユニット（５５３）は、予測のために使用されるサンプルをフェッチするために参照ピクチャメモリ（５５７）にアクセスすることができる。ブロックに関係するシンボル（５２１）に従ってフェッチされたサンプルを動き補償した後に、これらのサンプルは、出力サンプル情報を生成するために、アグリゲータ（５５５）によってスケーラ／逆変換ユニット（５５１）の出力（この場合には、残差サンプルまたは残差信号と呼ばれる）に追加することができる。動き補償予測ユニット（５５３）が予測サンプルをフェッチする参照ピクチャメモリ（５５７）内のアドレスは、例えば、Ｘ、Ｙ、および参照ピクチャコンポーネントを持つことができるシンボル（５２１）の形態において動き補償予測ユニット（５５３）に利用可能である、動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトル(sub-sample exact motion vectors)が使用されているときの参照ピクチャメモリ（５５７）、動きベクトル予測メカニズムなどからフェッチされるようなサンプル値の補間を含むこともできる。

アグリゲータ（５５５）の出力サンプルは、ループフィルタユニット（５５６）内で様々なループフィルタリング技術を受けることができる。ビデオ圧縮技術は、インループフィルタ(in-loop filter)技術を含むことができ、インループフィルタ技術は、（コーディングされたビデオビットストリームとも呼ばれる）コーディングされたビデオシーケンスに含まれるパラメータによって制御され、パーサ（５２０）からのシンボル（５２１）としてループフィルタユニット（５５６）に利用可能にされるが、コーディングされたピクチャまたはコーディングされたビデオシーケンスの（デコーディング順において）以前の部分のデコーディング中に得られるメタ情報に応答することもでき、以前に再構成され且つループフィルタリングされたサンプル値に応答することもできる。

ループフィルタユニット（５５６）の出力は、レンダリングデバイス(render device)に出力されることができ、将来のインターピクチャ予測における使用のために参照ピクチャメモリ（５５７）に格納されることができる、サンプルストリームであることができる。

特定のコーディングされたピクチャは、ひとたび完全に再構成されると、将来の予測のための参照ピクチャとして使用されることができる。例えば、ひとたび現在のピクチャに対応するコーディングされたピクチャが完全に再構成され、コーディングされたピクチャが（例えば、パーサ（５２０）によって）参照ピクチャとして識別されると、現在のピクチャバッファ（５５８）は、参照ピクチャメモリ（５５７）の一部分となることができ、後続のコーディングされたピクチャの再構成を開始する前に新たな現在のピクチャバッファが再割り当てされることができる。

ビデオデコーダ（５１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような標準における所定のビデオ圧縮技術に従ってデコーディング動作を行うことがある。コーディングされたビデオシーケンスは、コーディングされたビデオシーケンスがビデオ圧縮技術または標準の構文およびビデオ圧縮技術または標準に文書化されるようなプロファイルの両方に準拠するという意味で、使用されているビデオ圧縮技術または標準によって指定される構文に適合することがある。具体的には、プロファイルは、ビデオ圧縮技術または標準において利用可能な全てのツールから、そのプロファイルのために利用可能な唯一のツールとして、特定のツールを選択することができる。準拠のために同様に必要なものは、コーディングされたビデオシーケンスの複雑さがビデオ圧縮技術または標準のレベルによって定義される境界内にあることであり得る。幾つかの場合において、レベルは、最大ピクチャサイズ、最大フレームレート、（例えば、毎秒メガサンプルで測定される）最大再構成サンプルレート、最大参照ピクチャサイズなどを制約する。レベルによって設定される制約は、幾つかの場合において、ＨＲＤ（Hypothetical Reference Decoder）仕様およびコーディングされたビデオシーケンスにおいて信号伝達されるＨＲＤバッファ管理のためのメタデータを通じてさらに制約されることができる。

図６は、本開示の一実施形態によるビデオエンコーダ（６０３）のブロック図を示している。ビデオエンコーダ（６０３）は、ポイントクラウドを圧縮するＶ－ＰＣＣエンコーダ（３００）において使用されることができる。一例において、ビデオ圧縮モジュール（３２２）および（３２３）並びにビデオ圧縮モジュール（３３２）は、エンコーダ（６０３）と同様に構成される。

ビデオエンコーダ（６０３）は、パディングされたジオメトリ画像、パディングされたテクスチャ画像および同等物のような画像を受信し、圧縮された画像を生成することがある。

一実施形態によれば、ビデオエンコーダ（６０３）は、リアルタイムで或いはアプリケーションによって要求される任意の他の時間制約の下で、ソースビデオシーケンス（画像）のピクチャをコーディングし、コーディングされたビデオシーケンス（圧縮された画像）に圧縮することがある。適切なコーディング速度を強制することは、コントローラ（６５０）の１つの機能である。幾つかの実施形態において、コントローラ（６５０）は、以下に記載されるように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。明瞭性のために、結合は描写されていない。コントローラ（６５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化、レートひずみ最適化技法のラムダ値、．．．）、ピクチャサイズ、ピクチャのグループ（ＧＯＰ）レイアウト、最大動きベクトル検索範囲などを含むことができる。コントローラ（６５０）は、特定のシステム設計のために最適化されたビデオエンコーダ（６０３）に関係する他の適切な機能を持つように構成されることができる。

幾つかの実施形態において、ビデオエンコーダ（６０３）は、コーディングループにおいて作動するように構成される。過度に単純化された記述として、一例において、コーディングループは、（例えば、コーディングされるべき入力ピクチャおよび参照ピクチャに基づいて、シンボルストリームのような、シンボルを作成することに関与する）ソースコーダ（６３０）と、ビデオエンコーダ（６０３）に埋め込まれる（ローカル）デコーダ（６３３）とを含むことができる。デコーダ（６３３）は、（リモート）デコーダも作成するのと同様の方法においてサンプルデータを作成するためにシンボルを再構成する（何故ならば、開示される主題事項において考慮されるビデオ圧縮技術において、シンボルとコーディングされたビデオビットストリームとの間のあらゆる圧縮は可逆(無損失)であるからである）。再構成されたサンプルストリーム（サンプルデータ）は、参照ピクチャメモリ（６３４）に入力される。シンボルストリームのデコーディングは、デコーダの場所（ローカルまたはリモート）とは無関係にビット正確な結果(bit-exact results)をもたらすので、参照ピクチャメモリ（６３４）内のコンテンツも、ローカルエンコーダとリモートエンコーダの間でビット正確である。換言すれば、エンコーダの予測部は、デコーディング中に予測を使用するときにデコーダが「見る」であろうサンプル値と全く同じサンプル値を参照ピクチャサンプルとして「見る」。参照ピクチャ同期性（および例えばチャネルエラーの故に同期性を維持し得ない場合に結果として生じるドリフト）の基本原理は、幾つかの関連技術においても使用される。

「ローカル」デコーダ（６３３）の動作は、図５と併せて既に詳細に記載されたビデオデコーダ（５１０）のような「リモート」デコーダと同じであることができる。しかしながら、図５も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（６４５）およびパーサ（５２０）によるコーディングされたビデオシーケンスへのシンボルのエンコーディング(符号化)／デコーディング(復号化)は、可逆(無損失)であり得るので、パーサ（５２０）を含むビデオデコーダ（５１０）のエントロピーデコーディング部分は、ローカルデコーダ（６３３）において完全に実装されないことがある。

動作中、幾つかの例において、ソースコーダ（６３０）は、「参照ピクチャ」として指定されたビデオシーケンスから１つ以上の以前にコーディングされたピクチャを参照して入力ピクチャを予測的にコーディングする、動き補償された予測コーディングを行うことがある。このようにして、コーディングエンジン（６３２）は、入力ピクチャのピクセルブロックと入力ピクチャへの予測参照として選択されることがある参照ピクチャのピクセルブロックとの間の差をコーディングする。

ローカルビデオデコーダ（６３３）は、ソースコーダ（６３０）によって作成されるシンボルに基づいて、参照ピクチャとして指定されることがあるピクチャのコーディングされたビデオデータをデコードすることがある。コーディングエンジン（６３２）の動作は、有利には、非可逆(損失性)プロセスであってよい。コーディングされたビデオデータがビデオデコーダ（図６には示されていない）でデコードされることがあるとき、再構成されたビデオシーケンスは、典型的には、幾つかのエラーを持つソースビデオシーケンスのレプリカであることがある。ローカルビデオデコーダ（６３３）は、ビデオデコーダによって参照ピクチャに対して行われることがあるデコーディングプロセスを複製し、再構成された参照ピクチャを参照ピクチャキャッシュ（６３４）に格納させることがある。このようにして、ビデオエンコーダ（６０３）は、共通のコンテンツを持つ再構成された参照ピクチャのコピーを、（送信エラーがない）遠端ビデオデコーダによって取得される再構成された参照ピクチャとしてローカルに格納することがある。

予測器（６３５）は、コーディングエンジン（６３２）の予測検索を行うことがある。すなわち、コーディングされるべき新しいピクチャについて、予測器（６３５）は、新しいピクチャのための適切な予測参照として機能することがある、（候補参照ピクセルブロックとしての）サンプルデータ、または参照ピクチャ動きベクトル、ブロック形状などのような特定のメタデータについて、参照ピクチャメモリ（６３４）を検索することがある。予測器（６３５）は、適切な予測参照を見出すために、サンプルブロック対ピクセルブロックベースで作動することがある。幾つかの場合には、予測器（６３５）によって取得される検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（６３４）に格納された複数の参照ピクチャから引き出される予測参照を有することがある。

コントローラ（６５０）は、例えば、ビデオデータをエンコードするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（６３０）のコーディング動作を管理することがある。

全ての前述の機能ユニットの出力は、エントロピーコーダ（６４５）においてエントロピーコーディングを受けることがある。エントロピーコーダ（６４５）は、ハフマンコーディング、可変長コーディング、算術コーディングなどのような技術に従ってシンボルを可逆(無損失)圧縮することによって、様々な機能ユニットによって生成されるシンボルをコーディングされたビデオシーケンスに変換する。

コントローラ（６５０）は、ビデオエンコーダ（６０３）の動作を管理することがある。コーディング中、コントローラ（６５０）は、各コーディングされた画像に特定のコーディングされたピクチャタイプを割り当てることがあり、それはそれぞれのピクチャに適用されることがあるコーディング技術に影響を与えることがある。例えば、ピクチャは、しばしば、後続のピクチャタイプのうちの１つとして割り当てられることがある。

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の任意の他のピクチャを使用することなく、コーディングおよびデコードされることがあるものであることがある。幾つかのビデオコーデックは、例えば、ＩＤＲ（Independent Decoder Refresh）ピクチャを含む、異なるタイプのイントラピクチャを可能にする。当業者は、Ｉピクチャのそれらの変形およびそれらのそれぞれの用途および構成を認識している。

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために、最大で１つの動きベクトル(運動ベクトル)および参照インデックス(参照指数)を使用するイントラ予測またはインター予測を使用してコーディングおよびデコードされることがあるものであることがある。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために、最大で２つの動きベクトルおよび参照インデックスを使用するイントラ予測またはインター予測を使用してコーディングおよびデコードされることがあるものであることがある。同様に、マルチ予測ピクチャは、単一のブロックの再構成のために、２つよりも多くの参照ピクチャおよび関連するメタデータを使用することができる。

ソースピクチャは、一般的に、複数のサンプルブロック（例えば、４ｘ４、８ｘ８、４ｘ８、または１６ｘ１６の各々についてのサンプルブロック）に空間的に細分化され、ブロック毎ベースデコードされることがある。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てによって決定されるような他の（既にコーディングされた）ブロックを参照して予測的にコーディングされることがある。例えば、Ｉピクチャのブロックは、非予測的にコーディングされることがあり、或いは、それらは、同じピクチャの既にコーディングされたブロック（空間予測またはイントラ予測）を参照して予測的にコーディングされることがある。Ｐピクチャのピクセルブロックは、空間予測を介して、或いは１つの以前にコーディングされた参照ピクチャを参照する時間予測を介して、予測的にコーディングされることがある。Ｂピクチャのブロックは、空間予測を介して、或いは１つまたは２つの以前にコーディングされた参照ピクチャを参照する時間予測を介して、予測的にコーディングされることがある。

ビデオエンコーダ（６０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような所定のビデオコーディング技術または標準に従ってコーディング動作を行うことがある。その動作において、ビデオエンコーダ（６０３）は、入力ビデオシーケンスにおいて時間的および空間的な冗長性を利用する予測的コーディング動作を含む、様々な圧縮動作を行うことがある。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術または標準によって指定される構文に適合することがある。

ビデオは、時間的なシーケンスにおいて複数のソースピクチャ（画像）の形態にあることがある。（しばしばイントラ予測と省略される）イントラピクチャ予測は、所与のピクチャにおける空間的な相関関係を利用し、インターピクチャ予測は、ピクチャ間の（時間的なまたは他の）相関関係を利用する。一例では、現在のピクチャと呼ばれるエンコーディング／デコーディングの下にある特定のピクチャが、ブロックに分割される。現在のピクチャにおけるブロックが、ビデオ内の以前にコーディングされ且つ依然としてバッファされている参照ピクチャにおける参照ブロックに類似するとき、現在のピクチャにおけるブロックは、動きベクトルと呼ばれるベクトルによってコーディングされることができる。動きベクトルは、参照ピクチャにおける参照ブロックを指し、複数の参照ピクチャが使用されている場合には、参照ピクチャを識別する３次元を持つことができる。

幾つかの実施形態において、双予測技法が、インターピクチャ予測において使用されることができる。双予測技法によれば、ビデオ内の現在のピクチャに対してデコーディング順において両方とも先行する（しかしながら、表示順においてそれぞれ過去および未来であることがある）第１の参照ピクチャおよび第２の参照ピクチャのような２つの参照ピクチャが使用される。現在のピクチャ内のブロックは、第１の参照ピクチャ内の第１の参照ブロックを指す第１の動きベクトルおよび第２の参照ピクチャ内の第２の参照ブロックを指す第２の動きベクトルによってコーディングされることができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせによって予測されることができる。

さらに、マージモード技法をインターピクチャ予測に使用して、コーディング効率を向上させることができる。

本開示の幾つかの実施形態によれば、インターピクチャ予測およびイントラピクチャ予測のような予測が、ブロックの単位で行われる。例えば、ＨＥＶＣ標準によれば、ビデオピクチャのシーケンス内のピクチャは、圧縮のためにコーディングツリーユニット（ＣＴＵ：coding tree units）に分割され、ピクチャ内のＣＴＵは、６４ｘ６４ピクセル、３２ｘ３２ピクセル、または１６ｘ１６ピクセルのような、同じサイズを有する。一般に、ＣＴＵは、３個のコーディングツリーブロック（ＣＴＢ：coding tree blocks）を含み、それらは１個のルマ(輝度)ＣＴＢおよび２個のクロマ(彩度)ＣＴＢである。各ＣＴＵは、１個または複数のコーディングユニット（ＣＵ：coding units）に再帰的に分割されることができる。例えば、６４ｘ６４ピクセルのＣＴＵは、６４ｘ６４ピクセルの１個のＣＵ、３２ｘ３２ピクセルの４個のＣＵ、または１６ｘ１６ピクセルの１６個のＣＵに分割されることができる。一例では、各ＣＵを分析して、インター予測タイプやイントラ予測タイプのようなＣＵのための予測タイプを決定する。ＣＵは、時間的または空間的な予測可能性に依存して、１つ以上の予測ユニット（ＰＵ：prediction units）に分割される。一般に、各ＰＵは、１個のルマ予測ブロック（ＰＢ：prediction block）と、２個のクロマＰＢとを含む。一実施形態では、コーディング（エンコーディング／デコーディング）における予測動作は、予測ブロックの単位で行われる。予測ブロックの例としてルマ予測ブロックを使用すると、予測ブロックは、８ｘ８ピクセル、１６ｘ１６ピクセル、８ｘ１６ピクセル、１６ｘ８ピクセルなどのような、ピクセルについての値（例えば、ルマ値）の行列(マトリクス)を含む。

図７は、幾つかの例におけるＧ－ＰＣＣエンコーダ（７００）のブロック図を示している。Ｇ－ＰＣＣエンコーダ（７００）は、ポイントクラウドデータを受信し、ポイントクラウドデータを圧縮して、圧縮されたポイントクラウドデータを運ぶビットストリームを生成するように構成されることができる。一実施形態において、Ｇ－ＰＣＣエンコーダ（７００）は、位置量子化モジュール（７１０）、重複ポイント除去モジュール（７１２）、オクツリー(八分木)エンコーディングモジュール（７３０）、属性転送モジュール（７２０）、詳細レベル（ＬＯＤ：level of detail）生成モジュール（７４０）、属性予測モジュール（７５０）、残差量子化モジュール（７６０）、算術コーディングモジュール（７７０）、逆残差量子化モジュール（７８０）、加算モジュール（７８１）、および再構成された属性値を格納するメモリ（７９０）を含むことができる。

図示のように、入力ポイントクラウド（７０１）は、Ｇ－ＰＣＣエンコーダ（７００）で受信されることができる。ポイントクラウド（７０１）の位置（例えば、３Ｄ座標）は、量子化モジュール（７１０）に提供される。量子化モジュール（７１０）は、量子化された位置を生成するために座標を量子化するように構成される。重複ポイント除去モジュール（７１２）は、量子化された位置を受信し、フィルタリングプロセスを行って、重複ポイントを識別して除去するように構成される。オクツリーエンコーディングモジュール（７３０）は、重複ポイント除去モジュール（７１２）からフィルタリングされた位置を受信し、オクツリーベースのコーディングプロセスを行って、ボクセルの３Ｄグリッドを記述する占有コードのシーケンスを生成するように構成される。占有コードは、算術コーディングモジュール（７７０）に提供される。

属性転送モジュール（７２０）は、入力ポイントクラウドの属性を受信し、複数の属性値がそれぞれのボクセルと関連付けれるときに、各ボクセルについての属性値を決定するために、属性転送プロセスを行うように構成される。属性転送プロセスは、オクツリーエンコーディングモジュール（７３０）から出力された順序変更されたポイントに対して行われることができる。転送動作後の属性は、属性予測モジュール（７５０）に提供される。ＬＯＤ生成モジュール（７４０）は、オクツリーエンコーディングモジュール（７３０）から出力される順序変更されたポイントで動作し、ポイントを異なるＬＯＤに再編成するように構成される。ＬＯＤ情報は、属性予測モジュール（７５０）に提供される。

属性予測モジュール（７５０）は、ＬＯＤ生成モジュール（７４０）からのＬＯＤ情報によって示されるＬＯＤベースの順序に従ってポイントを処理する。属性予測モジュール（７５０）は、メモリ（７９０）に格納される現在のポイントの隣接するポイントのセットの再構成された属性に基づいて、現在のポイントについての属性予測を生成する。予測残差は、属性転送モジュール（７２０）から受信される元の属性値とローカルに生成される属性予測とに基づいて引き続き取得されることができる。候補インデックスがそれぞれの属性予測プロセスにおいて使用されるときに、選択される予測候補に対応するインデックスが、算術コーディングモジュール（７７０）に提供されることがある。

残差量子化モジュール（７６０）は、属性予測モジュール（７５０）から予測残差を受信し、量子化を行って量子化された残差を生成するように構成される。量子化された残差は、算術コーディングモジュール（７７０）に提供される。

逆残差量子化モジュール（７８０）は、残差量子化モジュール（７６０）から量子化された残差を受信し、残差量子化モジュール（７６０）で行われる量子化動作の逆を行うことによって再構成された予測残差を生成するように構成される。加算モジュール（７８１）は、逆残差量子化モジュール（７８０）から再構成された予測残差を受信し、属性予測モジュール（７５０）からそれぞれの属性予測を受信するように構成される。再構成された予測残差と属性予測とを組み合わせることによって、再構成された属性値が生成され、メモリ（７９０）に格納される。

算術コーディングモジュール（７７０）は、占有コード、（使用されるならば）候補インデックス、（生成されるならば）量子化された残差、および他の情報を受信し、エントロピーエンコーディングを行って、受信した値または情報をさらに圧縮するように構成される。その結果、圧縮された情報を運ぶ圧縮されたビットストリーム（７０２）を生成することができる。ビットストリーム（７０２）は、圧縮されたビットストリームをデコードするデコーダに送信されるか或いは他の方法で提供されるか、或いはストレージデバイスに格納されることがある。

図８は、一実施形態によるＧ－ＰＣＣデコーダ（８００）のブロック図を示している。Ｇ－ＰＣＣデコーダ（８００）は、圧縮されたビットストリームを受信し、ポイントクラウドデータ解凍を行って、ビットストリームを解凍し、デコードされたポイントクラウドデータを生成するように構成されることができる。一実施形態において、Ｇ－ＰＣＣデコーダ（８００）は、算術デコーディングモジュール（８１０）、逆残差量子化モジュール（８２０）、オクツリーデコーディングモジュール（８３０）、ＬＯＤ生成モジュール（８４０）、属性予測モジュール（８５０）、および再構成された属性値を格納するメモリ（８６０）を含むことができる。

図示のように、圧縮ビットストリーム（８０１）は、算術デコーディングモジュール（８１０）で受信されることができる。算術デコーディングモジュール（８１０）は、圧縮されたビットストリーム（８０１）をデコードして、ポイントクラウドの（生成されるならば）量子化された残差と占有コードとを取得するように構成される。オクツリーデコーディングモジュール（８３０）は、占有コードに従ってポイントクラウド内のポイントの再構成された位置を決定するように構成される。ＬＯＤ生成モジュール（８４０）は、再構成された位置に基づいてポイントを異なるＬＯＤに再編成し、ＬＯＤベースの順序を決定するように構成される。逆残差量子化モジュール（８２０）は、算術デコーディングモジュール（８１０）から受信される量子化された残差に基づいて再構成された残差を生成するように構成される。

属性予測モジュール（８５０）は、属性予測プロセスを実行して、ＬＯＤベースの順序に従ってポイントについての属性予測を決定するように構成される。例えば、現在のポイントの属性予測は、メモリ（８６０）に格納された現在のポイントの隣接するポイントの再構成された属性値に基づいて決定されることができる。幾つかの例では、属性予測をそれぞれの再構成された残差と組み合わせて、現在のポイントについての再構成された属性を生成することができる。

属性予測モジュール（８５０）から生成される再構成された属性のシーケンスは、オクツリーデコーディングモジュール（８３０）から生成される再構成された位置とともに、一例ではＧ－ＰＣＣデコーダ（８００）から出力されるデコードされたポイントクラウド（８０２）に対応する。加えて、再構成された属性は、メモリ（８６０）にも格納され、後続のポイントについての属性予測を導出するために引き続き使用されることができる。

様々な実施形態において、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実装されることができる。例えば、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）は、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、および同等物のような、ソフトウェアを用いて或いは用いないで作動する１つ以上の集積回路（ＩＣ）のような処理回路で実装されることができる。別の例において、エンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）は、不揮発性（または非一時的）コンピュータが読取可能な記憶媒体に格納された命令を含むソフトウェアまたはファームウェアとして実装されることができる。命令は、１つ以上のプロセッサのような処理回路構成によって実行されるときに、処理回路構成にエンコーダ（３００）、デコーダ（４００）、エンコーダ（７００）、および／またはデコーダ（８００）の機能を行わせる。

本明細書において開示される属性予測技法を実装するように構成される属性予測モジュール（７５０）および（８５０）は、図７および図８に示されるものと類似するか或いは異なる構造を持つことがある他のデコーダまたはエンコーダに含められ得ることに注意されたい。加えて、エンコーダ（７００）およびデコーダ（８００）は、様々な例において同じデバイスまたは別々のデバイスに含められることができる。

本開示の幾つかの態様によれば、メッシュ圧縮は、ＰＣＣコーディングツールとは異なるコーディングツールを使用することができ、或いは上記ＰＣＣ（例えば、Ｇ－ＰＣＣ、Ｖ－ＰＣＣ）エンコーダ、上記ＰＣＣ（例えば、Ｇ－ＰＣＣ、Ｖ－ＰＣＣ）デコーダ、および同等物のような、ＰＣＣコーディングツールを使用することができる。

オブジェクトの（メッシュモデルとも呼ばれる）メッシュは、オブジェクトの表面を記述するポリゴンを含むことができる。各ポリゴンは、３Ｄ空間内のポリゴンの頂点と、頂点がどのように接続されてポリゴンになるかの情報とによって定義付けられることができる。頂点がどのように接続されるかの情報は、接続情報と呼ばれる。幾つかの例において、メッシュは、頂点と関連付けられる色、法線、および同等物のような、属性を含むこともできる。属性は、２Ｄ属性マップでメッシュをパラメータ化するマッピング情報を利用することによって、メッシュの表面と関連付けられることができる。マッピング情報は、通常、メッシュの頂点と関連付けられる、ＵＶ座標またはテクスチャ座標と呼ばれる、パラメトリック座標のセットによって記述される。（幾つかの例ではテクスチャマップと呼ばれる）２Ｄ属性マップは、テクスチャ、法線、配置などのような、高解像度の属性情報を格納するために使用される。そのような情報は、テクスチャマッピングおよびシェーディング(shading)のような様々な目的のために使用されることができる。

幾つかの実施形態では、メッシュが、ジオメトリ情報、接続性情報、マッピング情報、頂点属性、および属性マップと呼ばれるコンポーネントを含むことができる。幾つかの例において、ジオメトリ情報は、メッシュの頂点と関連付けられる３Ｄ位置のセットによって記述される。一例では、（ｘ，ｙ，ｚ）座標を使用して、頂点の３Ｄ位置を記述することができる。幾つかの例において、接続性情報は、頂点をどのように接続して３Ｄ表面を作成するかを記述する頂点インデックスのセットを含む。幾つかの例において、マッピング情報は、メッシュ表面をどのように平面の２Ｄ領域にマッピングするかを記述する。一例において、マッピング情報は、接続性情報とともにメッシュ頂点と関連付けられるＵＶパラメトリック／テクスチャ座標（ｕ，ｖ）のセットによって記述される。幾つかの例において、頂点属性は、メッシュ頂点と関連付けられるスカラまたはベクトル属性値を含む。幾つかの例において、属性マップは、メッシュ表面と関連付けられ、２Ｄ画像／ビデオとして格納される、属性を含む。一例において、ビデオ（例えば、２Ｄ画像／動画）とメッシュ表面と間のマッピングは、マッピング情報によって定義付けられる。

本開示の態様によれば、ＵＶマッピングまたはメッシュパラメータ化と呼ばれる幾つかの技法が、３Ｄドメイン内のメッシュの表面を２Ｄドメインにマッピングするために使用される。幾つかの例では、メッシュが、３Ｄドメイン内の（幾つかの例ではセグメントとも呼ばれる）パッチに分割される。次に、パッチは、それぞれ、２Ｄ形状にパラメータ化される。２Ｄ形状は、幾つかの例ではアトラス(atlases)とも呼ばれるマップにパックされる（例えば、方向付けられて配置される）ことができる。幾つかの例において、マップは、２Ｄ画像またはビデオ処理技法を使用してさらに処理されることができる。

一例では、ＵＶマッピング技法が、３Ｄメッシュのパッチに対応する２Ｄにおける（ＵＶマップとも呼ばれる）ＵＶアトラスおよび（テクスチャマップとも呼ばれる）１つ以上のテクスチャアトラスを生成する。ＵＶアトラスは、２Ｄドメイン（例えば、長方形）内の２Ｄポイントへの３Ｄメッシュの３Ｄ頂点の割り当てを含む。ＵＶアトラスは、３Ｄ表面の座標と２Ｄドメインの座標との間のマッピングである。一例では、２Ｄ座標（ｕ，ｖ）にあるＵＶアトラス内のポイントが、３Ｄドメイン内の頂点の座標（ｘ，ｙ，ｚ）によって形成される値を持つ。一例では、テクスチャアトラスは、３Ｄメッシュの色情報を含む。例えば、２Ｄ座標（ｕ，ｖ）にあるテクスチャアトラス内のポイントが、３Ｄドメイン内の（ｘ，ｙ，ｚ）にある頂点の色に等しい色を持つ。

本開示の一態様によれば、動的メッシュが、コンポーネント（ジオメトリ情報、接続性情報、マッピング情報、頂点属性および属性マップ）のうちの少なくとも１つが時間とともに変化するメッシュである。動的メッシュは、（メッシュフレームとも呼ばれる）メッシュのシーケンスによって記述されることができる。動的メッシュは、大量のデータを必要とすることがある。何故ならば、動的メッシュは、時間の経過に亘って変化する有意な量の情報を含むことがあるからである。メッシュの圧縮技術は、メッシュ表現におけるメディアコンテンツの効率的な格納および送信を可能にすることができる。

幾つかの例では、動的メッシュが、一定の接続性情報、時変ジオメトリ、および時変頂点属性を持つことができる。幾つかの例では、動的メッシュが、時変接続性情報を持つことができる。一例では、デジタルコンテンツ作成ツールが、通常、時変属性マップおよび時変接続性情報を持つ動的メッシュを生成する。幾つかの例では、動的メッシュを生成するために、容量取得(volumetric acquisition)技法が使用される。容量取得技法は、特にリアルタイムの制約の下で、時変接続性情報を持つ動的メッシュを生成することができる。

本開示の幾つかの態様によれば、幾つかのメッシュ圧縮技法は、非可逆(損失性)圧縮の性質を持ち、再構成されたメッシュの品質は、ギャップに苦しみ得る。幾つかの例では、ＵＶアトラスサンプリング技法のような再メッシュ技法が、メッシュ圧縮において使用される。ＵＶアトラスサンプリング技法は、ＵＶアトラス上にサンプリングされた規則的なグリッドポイントを介して３Ｄメッシュモデルを再メッシュする。ＵＶアトラスにおける元の頂点は、規則的なグリッドポイントによって置換される。接続性情報は、規則的なグリッドポイントから推測されることができ、個別にエンコードされる必要がない。ＵＶアトラスサンプリング技法におけるサンプリングポイントは、ＵＶパッチの境界上でメッシュの頂点と一致せず、故に、再構成されたメッシュは、ギャップを有することがある。

本開示の一態様によれば、（ＵＶアトラスとも呼ばれる）ＵＶマップは、メッシュの特定のエッジおよび頂点で構成される切断経路に沿ってメッシュをパッチに分割し、パッチをＵＶマップにおけるＵＶパッチにパラメータ化することによって生成される。切断経路におけるエッジおよび頂点は、ＵＶマップにおけるＵＶパッチの境界エッジおよび境界頂点にマッピングされる。例えば、切断経路におけるエッジが、ＵＶマップにおける２つの異なるＵＶパッチの２つの境界エッジに分割され、切断経路における頂点が、ＵＶマップにおける異なるＵＶパッチのｎ（ｎ≧２）の境界頂点に分割される。同じエッジの分割によって生じる境界エッジは、エッジメイト(edge mates)と呼ばれる。同じ頂点の分割によって生じる境界頂点は、頂点メイト(vertex mates)と呼ばれる。よって、ＵＶパッチの境界は、エッジメイトおよび頂点メイトからなる。

幾つかの例では、ＵＶマップでＵＶアトラスサンプリング技法を使用してパラメータ化を推定するとき、サンプリングポイントは、ＵＶマップにおけるＵＶパッチの境界頂点および境界エッジで一致しない。その場合には、デコーダ側で、再構成されたパッチの境界は、エッジメイトおよび頂点メイトについての一致要件(matching requirements)を満たさないことがあり、よって、ギャップがパッチ間に存在することがある。

図９は、ＵＶアトラスサンプリングに基づいて処理される再構成されたメッシュ（９００）の図を示している。再構成されたメッシュ（９００）は、パッチ間のギャップ（９０１）を含む。

本開示の幾つかの態様は、メッシュ圧縮のための（パッチ接続技法とも呼ばれる）パッチジッピング(patch zipping)技法を提供する。パッチジッピング技法は、ＵＶパッチ（例えば、再メッシュ前のオリジナルＵＶパッチ）の境界エッジおよび境界頂点のような、ＵＶパッチの境界情報を保持することができる。ＵＶパッチの境界情報を使用して、一例では、ＵＶアトラスサンプリング技法によって防水メッシュを再構成することができる。

ＵＶアトラスサンプリング技法は、パッチジッピング技法を使用してパッチ間で充填されたギャップを実現することができる非可逆(損失性)圧縮技法の一例として使用されるが、パラメータ化、サンプリング、または投影アプローチにかかわらず、他の再メッシュまたは圧縮技法をパッチジッピング技法と共に使用してギャップ充填効果を実現することができることに留意されたい。

図１０は、本開示の幾つかの実施形態によるメッシュ圧縮のためのフレームワーク（１０００）の図を示している。フレームワーク（１０００）は、メッシュエンコーダ（１０１０）と、メッシュデコーダ（１０５０）とを含む。メッシュエンコーダ（１０１０）は、入力メッシュ（１００５）（動的メッシュの場合にはメッシュフレーム）をビットストリーム（１０４５）にエンコードし、メッシュデコーダ（１０５０）は、ビットストリーム（１０４５）をデコードして再構成されたメッシュ（１０９５）（動的メッシュの場合にはメッシュフレーム）を生成する。

メッシュエンコーダ（１０１０）は、コンピュータ、サーバコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、ゲームデバイス、ＡＲデバイス、ＶＲデバイス、および同等物のような、任意の適切なデバイスであることができる。メッシュデコーダ（１０５０）は、コンピュータ、クライアントコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、ゲームデバイス、ＡＲデバイス、ＶＲデバイス、および同等物のような、任意の適切なデバイスであることができる。ビットストリーム（１０４５）は、任意の適切な通信ネットワーク（図示せず）を介してメッシュエンコーダ（１０１０）からメッシュデコーダ（１０５０）に送信されることができる。

図１０の例において、メッシュエンコーダ（１０１０）は、非可逆(損失性)メッシュエンコーダ（１０２０）と、互いに結合された境界エンコーダ（１０４０）とを含む。非可逆メッシュエンコーダ（１０２０）は、情報損失を引き起こすことがある技法を使用し、情報損失は、再構成されたメッシュにギャップを引き起こし得る。境界エンコーダ（１０４０）は、入力メッシュ（１００５）にパッチの境界情報を保持し、境界情報をビットストリーム（１０４５）にエンコードするように構成される。

幾つかの例において、非可逆メッシュエンコーダ（１０２０）は、情報損失を引き起こすことがあり、再構成されたメッシュにギャップをもたらすことがある、ＵＶアトラスサンプリング技法を使用する。図１０の例において、非可逆メッシュエンコーダ（１０２０）は、図１０に示すように互いに結合された前処理モジュール（１０２１）、ＵＶアトラスサンプリングモジュール（１０２５）およびエンコーダ（１０３０）を含む。

前処理モジュール（１０２１）は、入力メッシュ（１００５）を分割してパッチを生成し、パッチのパラメータ化を行ってＵＶマップおよび１つ以上のテクスチャマップのような２Ｄドメインにおいてマップ（１０２２）を生成する。ＵＶマップは、入力メッシュ（１００５）のパッチに対応するＵＶパッチを含む。

ＵＶアトラスサンプリングモジュール（１０２５）は、規則的なグリッドポイント上でＵＶマップをサンプリングすることによって新しいメッシュ（１０２７）を生成することによって再メッシュ(re-meshing)を行う。一例において、新しいメッシュ（１０２７）は、頂点が規則的なグリッドポイントにマッピングされた新しいＵＶマップおよび新しいテクスチャマップの形態にある。幾つかの例において、新しいメッシュ（１０２７）は、新しいＵＶマップおよび新しいテクスチャマップから再構成される再構成されたメッシュである。新しいメッシュ（１０２７）の接続性情報は、規則的なグリッドポイントに従って推測されることができることに留意されたい。

エンコーダ（１０３０）は、新しいメッシュ（１０２７）をエンコードすることができる。一例において、エンコーダ（１０３０）は、Ｇ－ＰＣＣエンコーダ、Ｖ－ＰＣＣエンコーダおよび同等物のような、ＰＣＣエンコーダを含む。新しいメッシュ（１０２７）の頂点は、ポイントクラウドを形成することができ、エンコーダ（１０３０）は、ＰＣＣエンコーダを使用してポイントクラウドをエンコードすることができる。別の例において、エンコーダ（１０３０）は、適切なビデオコーディング標準に従って新しいＵＶマップおよび新しいテクスチャマップをエンコードすることができるビデオエンコーダを含む。エンコーダ（１０３０）は、非可逆エンコーダまたは可逆エンコーダであることができる。

図１０の例において、境界エンコーダ（１０４０）は、マップ（１０２２）からパッチ境界情報を抽出し、パッチ境界情報をビットストリーム（１０４５）にエンコードすることができる。境界エンコーダ（１０４０）の動作は、本開示においてさらに記載される。

図１０の例において、ビットストリーム（１０４５）は、メッシュデコーダ（１０５０）に提供される。メッシュデコーダ（１０５０）は、デコーダ（１０６０）、メッシュ再構成モジュール（１０８０）、および境界デコーダ（１０９０）を含む。一例において、デコーダ（１０６０）は、エンコーダ（１０３０）に対応し、エンコーダ（１０３０）によってエンコードされるビットストリーム（１０４５）の部分をデコードし、デコードされる情報（１０６５）を生成することができる。

一例において、エンコーダ（１０３０）は、ＰＣＣエンコーダであり、その場合には、デコーダ（１０６０）は、ＰＣＣデコーダである。デコーダ（１０６０）は、エンコーダ（１０３０）によってエンコードされるビットストリーム（１０４５）の部分をデコードして、メッシュの頂点であるポイントを持つポイントクラウドを生成することができる。例えば、デコードされる情報（１０６５）は、メッシュの頂点であるポイントを持つポイントクラウドを含む。

別の例において、エンコーダ（１０３０）は、１つ以上のビデオエンコーダを含み、デコーダ（１０６０）は、１つ以上のビデオデコーダを含む。デコーダ（１０６０）は、エンコーダ（１０３０）によってエンコードされるビットストリーム（１０４５）の部分をデコードして、ＵＶマップ、１つ以上のテクスチャマップおよび同等物のような、マップを生成することができる。例えば、デコードされる情報（１０６５）は、ビットストリーム（１０４５）からデコードされるＵＶマップおよび１つ以上のテクスチャマップを含む。

図１０の例において、境界デコーダ（１０９０）は、境界エンコーダ（１０４０）に対応し、境界エンコーダ（１０４０）によってエンコードされるビットストリーム（１０４５）の部分をデコードし、デコードされるパッチ境界情報（１０９１）を生成することができる。

図１０の例において、デコードされる情報（１０６５）およびデコードされるパッチ境界情報（１０９１）は、メッシュ再構成モジュール（１０８０）に提供される。メッシュ再構成モジュール（１０８０）は、デコードされた情報（１０６５）およびデコードされたパッチ境界情報（１０９１）に基づいて再構成されたメッシュ（１０９５）を生成する。境界デコーダ（１０９０）およびメッシュ再構成（１０８０）の動作は、本開示においてさらに記載される。

前処理モジュール（１０２１）、ＵＶアトラスサンプリングモジュール（１０２５）、エンコーダ（１０３０）、および境界エンコーダ（１０４０）のような、メッシュエンコーダ（１０１０）内のコンポーネントは、様々な技法によってそれぞれ実装され得ることに留意されたい。一例では、コンポーネントが、集積回路構成によって実装される。別の例では、コンポーネントが、１つ以上のプロセッサで実行され得るソフトウェアを使用して実装される。

デコーダ（１０６０）、メッシュ再構成モジュール（１０８０）、および境界デコーダ（１０９０）のような、メッシュデコーダ（１０５０）内のコンポーネントが、様々な技法によってそれぞれ実装され得ることに留意されたい。一例では、コンポーネントが、集積回路構成によって実装される。別の例では、コンポーネントが、１つ以上のプロセッサによって実行されることができるソフトウェアを使用して実装される。

本開示の一態様によれば、境界エンコーダ（１０４０）は、ＵＶマップからＵＶパッチを決定し、ＵＶパッチの境界を決定し、ＵＶパッチの境界を適切なデータ構造においてパッチ境界データとして格納し、パッチ境界データをビットストリーム（１０４５）にエンコードすることができる。

ＵＶマップからＵＶパッチを決定するために、幾つかの例において、境界エンコーダ（１０４０）は、Ｅｄｇｅｂｒｅａｋｅｒまたは結合(valence)ベースのアルゴリズムのような、三角形トラバーサルアルゴリズムを使用して、ＵＶマップ内の接続された三角形のセットを検出する。接続された三角形のセットは、ＵＶパッチに対応する。境界エンコーダ（１０４０）は、前処理モジュール（１０２１）から情報（例えば、パーティション情報、パラメータ化情報および同等物）を受信することもでき、前処理モジュール（１０２１）から受信する情報からＵＶパッチを決定する。

ＵＶパッチの境界を決定するために、幾つかの例において、境界エンコーダ（１０４０）は、境界頂点および境界エッジを決定する。任意の適切な技法を使用して、境界頂点および境界エッジを検出することができる。一例では、ＵＶパッチにおけるエッジがＵＶパッチの２つの隣接する三角形によって共有されないとき、例えば、エッジがＵＶパッチの１つの三角形にのみに属するとき、エッジは、ＵＶパッチの境界エッジであり、境界エッジの頂点は、境界頂点である。

別の例では、ＵＶパッチの境界頂点が、メッシュ頂点から分割される。よって、頂点メイト(vertex mates)が、頂点の（ｘ，ｙ，ｚ）に基づいて、ＵＶパッチから検出されることができる。例えば、異なるＵＶパッチの複数の頂点が同じ（ｘ，ｙ，ｚ）値を持つとき、その複数の頂点は、頂点メイトであり、ＵＶパッチの境界頂点でもある。さらに、２つの境界頂点間のエッジが、境界エッジである。

別の例では、パーティション情報が、前処理モジュール（１０２１）から受信される。例えば、パーティション情報は、入力メッシュ（１００５）をパッチに分割する切断経路の情報を含む。パーティション情報は、境界エッジおよび境界頂点を示す。

パッチ境界情報は、適切なデータ構造に格納されることができる。一例では、ＵＶパッチの境界頂点が、時計回り順序、反時計回り順序、および同等の順序のような、特定の順序において格納される。幾つかの例では、（例えば、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅと呼ばれる）ハッシュテーブルが、ＵＶパッチについての境界頂点を格納するために構築され、ハッシュテーブル（例えば、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅ）は、ＵＶパッチにそれぞれ対応する複数のテーブルエントリを含み、各テーブルエントリは、対応するＵＶパッチの境界頂点のリストである。例えば、ＵＶパッチに対応するエントリが、ＵＶパッチのラベルに従ってアクセスされることができ、エントリは、ＵＶパッチの境界頂点インデックスのリストを、反時計回り順序のような固定順序において格納する。一例では、ｉ番目のＵＶパッチのためのラベルにハッシュ関数を適用して値ｉを取得して、テーブルエントリｂｏｕｎｄａｒｙ＿ｔａｂｌｅ［ｉ］にアクセスする。テーブルエントリｂｏｕｎｄａｒｙ＿ｔａｂｌｅ［ｉ］は、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅ［ｉ］＝［ｉｄｘ＿１，ｉｄｘ＿２，ｉｄｘ＿３，．．．，ｉｄｘ＿ｍ］のような、境界頂点インデックスのリストを格納し、ｍは、ｉ番目のＵＶパッチの境界頂点の数を示し、ｉ番目のＵＶパッチの境界頂点のインデックスは、ｉｄｘ＿１，ｉｄｘ＿２，ｉｄｘ＿３，．．．，ｉｄｘ＿ｍである。よって、境界エッジは、（ｉｄｘ＿１，ｉｄｘ＿２），（ｉｄｘ＿２，ｉｄｘ＿３），．．．，（ｉｄｘ＿ｍ，ｉｄｘ＿１）である。

一例において、境界テーブル内のインデックスは、ＵＶパッチの内側の頂点を除くＵＶアトラス内の境界頂点のみについて定義される境界頂点インデックスであることに留意されたい。

さらに、ＵＶパッチの境界頂点の詳細情報が格納される。例えば、ＵＶパッチの各境界頂点について、ＵＶアトラス内の境界頂点のＵＶ座標、例えば入力メッシュ（１００５）における対応するメッシュ頂点インデックス、および例えば、入力メッシュ（１００５）における３Ｄ座標が格納される。幾つかの例では、各境界頂点について、６つの整数（例えば、ＵＶアトラスにおけるｕ座標、ＵＶアトラスにおけるｖ座標、入力メッシュにおけるメッシュ頂点インデックス（１００５）、入力メッシュ（１００５）におけるｘ座標、入力メッシュ（１００５）におけるｙ座標、入力メッシュ（１００５）におけるｚ座標）が、境界頂点に関連付けられて格納される。一例では、ｂｏｕｎｄａｒｙ＿ｕｖ、ｂｏｕｎｄａｒｙ＿ｉｄｘ、ｂｏｕｎｄａｒｙ＿ｘｙｚとして参照される３つのアレイ(配列)が、境界頂点の詳細情報を格納するために使用される。３つのアレイの各々は、それぞれ境界頂点についてのアレイエントリを含む。境界頂点についてのアレイエントリは、境界頂点インデックスによってアクセスされることができる。境界頂点についてのアレイｂｏｕｎｄａｒｙ＿ｕｖにおけるアレイエントリが、ＵＶアトラスにおける境界頂点のＵＶ座標を格納する。境界頂点についてのアレイｂｏｕｎｄａｒｙ＿ｉｄｘにおけるアレイエントリが、ＵＶアトラスにおける境界頂点の（例えば、入力メッシュ（１００５）の）メッシュ頂点インデックスを格納する。境界頂点についてアレイｂｏｕｎｄａｒｙ＿ｘｙｚにおけるアレイエントリが、入力メッシュ（１００５）における対応するメッシュ頂点の３Ｄ元座標を格納する。

従って、一例では、頂点メイト(vertex mates)が、メッシュ頂点インデックスについて同じ値を持つことができ、３Ｄ座標について同じ値を持つことができる。

別の例では、メッシュシーケンスについて、境界頂点の詳細情報は、２つの３チャネル画像を使用して格納される。例えば、境界頂点のＵＶ座標および対応するメッシュ頂点インデックスは、例えば、第1の３チャネル画像中に３チャネルとして格納され、境界頂点の３Ｄ座標は、第２の３チャネル画像中に３チャネルとして格納される。

ＵＶパッチの境界頂点に対応するメッシュ頂点は、切断経路上にあるので、本掲載所において記載される対応するメッシュ頂点インデックスは、それらの切断経路頂点について定義されることに留意されたい。

本開示の一態様によれば、境界情報により、占有マップは、必ずしもビットストリーム（１０４５）にコーディングされないことがある。例えば、ＵＶパッチの内側のポイントおよびＵＶパッチの外側のポイントは、境界情報に基づいて決定されることができる。より具体的には、ＵＶパッチの境界頂点によって定義されるポリゴンの内側のポイントは、占有ポイントとして推論されることができ、ＵＶパッチに属する。ＵＶアトラス上のポイントが如何なるＵＶパッチにも属さないならば、そのポイントは、占有されていないと推論されることができる。幾つかの例において、エンコーダ（１０３０）は、ジオメトリ画像をエンコードするためのビデオエンコーダを含み、占有マップのためのビデオエンコーダを含まない。

一例において、境界エンコーダ（１０４０）は、可逆(無損失)コーディング技法を使用してｂｏｕｎｄａｒｙ＿ｔａｂｌｅおよびｂｏｕｎｄａｒｙ＿ｉｄｘをビットストリーム（１０４５）にエンコードし、非可逆(損失性)または可逆コーディング技法を使用してｂｏｕｎｄａｒｙ＿ｘｙｚおよびｂｏｕｎｄａｒｙ＿ｕｖをビットストリーム（１０４５）にエンコードする。別の例において、境界エンコーダ（１０４０）は、可逆コーディング技法を使用してｂｏｕｎｄａｒｙ＿ｔａｂｌｅ、ｂｏｕｎｄａｒｙ＿ｕｖおよびｂｏｕｎｄａｒｙ＿ｉｄｘをビットストリーム（１０４５）にエンコードし、非可逆または可逆コーディング技法を使用してｂｏｕｎｄａｒｙ＿ｘｙｚをビットストリーム（１０４５）にエンコードする。

一例では、各メッシュフレームの境界情報が、独立してコーディングされる。幾つかの例において、メッシュフレームの境界情報は、フレーム間の相関関係を探索することによってコーディングされることができる。例えば、エントロピーコーディングにおけるインターフレーム予測(inter-frame prediction)およびイントラフレーム関連コンテキストモデリング(intra-frame related context modeling)は、境界情報をコーディングするときに適用されることができる。

本開示の一態様によれば、境界デコーダ（１０９０）は、ビットストリーム（１０４５）からｂｏｕｎｄａｒｙ＿ｔａｂｌｅ、ｂｏｕｎｄａｒｙ＿ｕｖ、ｂｏｕｎｄａｒｙ＿ｉｄｘ、ｂｏｕｎｄａｒｙ＿ｘｙｚのような境界情報をデコードするように構成される。一例において、メッシュ再構成モジュール（１０８０）は、再構成されたメッシュ（１０９５）をパッチ毎に生成することができる。各ＵＶパッチについて、メッシュ再構成モジュール（１０８０）は、ＵＶパッチのラベルに対してハッシュ関数を適用して、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅ内のテーブルエントリのテーブルエントリインデックスを決定する。次に、メッシュ再構成モジュール（１０８０）は、テーブルエントリにアクセスしてＵＶパッチについての境界頂点の境界頂点インデックスのリストを取得し、境界頂点に基づいてＵＶパッチの境界エッジを決定する。

幾つかの例では、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅからのＵＶパッチの境界頂点の境界頂点インデックスに基づいて、アレイｂｏｕｎｄａｒｙ＿ｕｖにアクセスして、ＵＶパッチの境界頂点のＵＶ座標を取得する。さらに、幾つかの例では、ＵＶアトラスサンプリング技法が使用されるときに、ＵＶパッチの内側の規則的なグリッド上のサンプリングポイントを決定することができ、サンプリングポイントのＵＶ座標を決定することができる。

幾つかの例では、取得したＵＶ座標およびＵＶパッチの境界エッジを用いて、接続性情報を推測することができ、ＵＶパッチの面を生成することができる。一例では、ＵＶパッチの内側のポイントの取得したＵＶ座標およびＵＶパッチの境界エッジに基づいて、制約付きドローネー三角形分割技法(Delaunay triangulation technique)を使用して、ＵＶパッチの再メッシュされた三角形の面を生成する。他の適切な三角測量(triangulation)または再メッシュ(re-meshing)技法を使用してＵＶパッチの面を生成し得ることに留意されたい。幾つかの例において、ビットストリームは、使用する特定の三角測量または再メッシュ技法を示す信号を含む。

本開示の一態様によれば、ＵＶパッチの内側の頂点の３Ｄ座標は、例えば、ＵＶマップに従って、ジオメトリピクチャから取得されることができる。ＵＶパッチ境界上の境界頂点について、一例では、ＵＶパッチの境界頂点のインデックスをｂｏｕｎｄａｒｙ＿ｔａｂｌｅから決定することができ、次に、アレイｂｏｕｎｄａｒｙ＿ｉｄｘに従って対応するメッシュ頂点インデックスを決定することができる。一例において、アレイｂｏｕｎｄａｒｙ＿ｘｙｚは、メッシュ頂点インデックスに対応する３Ｄ座標を格納し、次に、境界頂点の３Ｄ座標は、境界頂点についてのメッシュ頂点インデックスに基づいて決定されることができる。別の例において、アレイｂｏｕｎｄａｒｙ＿ｘｙｚは、ＵＶパッチ内の境界頂点のインデックスに対応する３Ｄ座標を格納し、次に、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅからの境界頂点のインデックスを使用して、アレイｂｏｕｎｄａｒｙ＿ｘｙｚから境界頂点の３Ｄ座標を取得することができる。

図１１は、開示の実施形態によるプロセス（１１００）の概説するフローチャートを示している。プロセス（１１００）は、メッシュのためのエンコーディング処理中に使用されることができる。様々な実施形態において、プロセス（１１００）は、処理回路構成によって実行される。幾つかの実施形態において、プロセス（１１００）は、ソフトウェア命令において実装され、よって、処理回路構成がソフトウェア命令を実行するとき、処理回路構成は、プロセス（１１００）を行う。プロセスは、（Ｓ１１０１）で開始し、（Ｓ１１１０）に進む。

（Ｓ１１１０）で、メッシュから分割される複数のパッチのパッチ境界情報を決定する。

（Ｓ１１２０）で、複数のパッチのパッチ情報をビットストリームの第1の部分にエンコードする。

（Ｓ１１３０）で、複数のパッチのパッチ境界情報をビットストリームの第２の部分にエンコードする。パッチ境界情報は、少なくとも第１のパッチの第１のエッジおよび第２のパッチの第２のエッジがエッジメイト(edge mates)のペアであることを示す。

本開示の一態様によれば、第１の部分におけるパッチ情報は、第２の部分におけるパッチ境界情報とは異なるパッチ境界情報を持つ。例えば、パッチ情報は、例えば、ＵＶアトラスサンプリング技法および同等物を含む、非可逆(損失性)圧縮の性質を持つ技法によってエンコードされる。

幾つかの実施形態において、ＵＶアトラスにおけるＵＶパッチは、ビットストリームの第1の部分にエンコードされ、ＵＶパッチの境界の情報は、ビットストリームの第２の部分にエンコードされる。ＵＶアトラスにおけるＵＶパッチは、メッシュにおける複数のパッチに対応する。

幾つかの実施形態では、パッチ境界情報を決定するために、ＵＶパッチがＵＶアトラスから決定され、ＵＶパッチの境界が決定される。幾つかの例では、ＵＶパッチを決定するために、ＵＶアトラス内の接続された三角形の第１のセットが検出され、接続された三角形の第１のセットは、第１のＵＶパッチを形成する。ＵＶパッチの境界を決定するために、一例では、第１のＵＶパッチのエッジのセットが検出され、エッジのセットの各々は、第１のＵＶパッチの２つの隣接する三角形によって共有されない。別の例では、第１のＵＶパッチの頂点のセットが検出され、頂点のセットの各々は、少なくとも別のＵＶパッチにおける頂点メイトを持つ。

幾つかの例では、ＵＶパッチをエンコードするために、ＵＶアトラスを規則的なグリッド上でサンプリングして新しいメッシュを生成し、新しいメッシュの情報をビットストリームの第１の部分にエンコードする。

幾つかの例では、ＵＶパッチの境界の情報をエンコードするために、境界テーブルを第２の部分にエンコードする。境界テーブル（例えば、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅ）は、複数のＵＶパッチの境界頂点のリストを含む。幾つかの例では、第１のアレイが、第２の部分にエンコードされ、第１のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｕｖ）は、複数のパッチの境界頂点をＵＶアトラスにマッピングするためのＵＶ座標を持つ(carries)。さらに、幾つかの例では、第２のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｉｄｘ）が、第２の部分にエンコードされる。第２のアレイは、複数のＵＶパッチの境界頂点に対応するメッシュのメッシュ頂点インデックスを持つ。幾つかの例では、第３のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｘｙｚ）が、第２の部分にエンコードされ、第３のアレイは、複数のＵＶパッチの境界頂点についてのメッシュ頂点インデックスに対応する３次元座標を運ぶ。幾つかの他の例では、第３のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｘｙｚ）が、第２の部分にエンコードされ、第３のアレイは、複数のＵＶパッチの境界頂点についての境界頂点インデックスに対応する３次元座標を持つ。

本開示の一態様によれば、ビットストリームの第２の部分にエンコードされる境界情報に基づいて占有マップを決定することができ、よって、第１の部分は、一例において、占有マップを含む必要がない。

次に、プロセスは、（Ｓ１１９９）に進み、終了する。

プロセス（１１００）は、適切に適合されることができる。プロセス（１１００）のステップを変更および／または省略することができる。追加的なステップを加えることができる。任意の適切な順序の実装を使用することができる。

図１２は、本開示の一実施形態によるプロセス（１２００）を概説するフローチャートを示している。プロセス（１２００）は、メッシュについてのデコーディングプロセス中に使用されることができる。様々な実施形態において、プロセス（１２００）は、処理回路構成によって実行される。幾つかの実施形態において、プロセス（１２００）は、ソフトウェア命令において実装され、よって、処理回路構成がソフトウェア命令を実行するときに、処理回路構成は、プロセス（１２００）を行う。プロセスは、（Ｓ１２０１）で開始し、（Ｓ１２１０）に進む。

（Ｓ１２１０）で、メッシュのエンコードされた情報を運ぶビットストリームを受信する。メッシュは、パッチに分割され、ビットストリームは、第１の部分と、第２の部分とを含む。第１の部分は、パッチ情報を含み、第２の部分は、少なくとも第１のパッチの第１のエッジおよび第２のパッチの第２のエッジがエッジメイトのペアであることを示すパッチ境界情報を含む。

（Ｓ１２２０）で、第１の部分をデコードしてパッチ情報を取得する。

（Ｓ１２３０）で、第２の部分をデコードしてパッチ境界情報を取得する。

（Ｓ１２４０）で、パッチ情報およびパッチ境界情報に基づいて再構成されたメッシュを生成する。第１のエッジおよび第２のエッジを再構成されたメッシュ内の同じエッジにマッピングして、第１のパッチおよび第２のパッチを一緒にジップする(zip)（接続する(connect)）。

幾つかの例において、第１の部分からデコードされるパッチ情報は、第２の部分からデコードされるパッチ境界情報とは異なるパッチ境界情報を持つ。例えば、パッチ情報は、例えば、ＵＶアトラスサンプリング技法および同等技法を含む、非可逆(損失性)圧縮の性質を有する技法によってエンコードされる。

幾つかの実施形態では、第２の部分をデコードするために、境界テーブル（例えば、ｂｏｕｎｄａｒｙ＿ｔａｂｌｅ）を第２の部分からデコードする。境界テーブルは、ＵＶアトラス内のＵＶパッチの境界頂点のリストを含む。幾つかの例では、第１のパッチについての境界頂点の第１のリストが、境界テーブルに従って決定され、第２のパッチについての境界頂点の第２のリストが、境界テーブルに従って決定される。さらに、第１のパッチについての第１の境界エッジは、境界頂点の第１のリストに従って決定され、第１のエッジは、第１のパッチの第１の境界エッジの１つである。第２のパッチの第２の境界エッジは、境界頂点の第２のリストに従って決定され、第２のエッジは、第２のパッチの第２の境界エッジの１つである。

第２の部分をデコードするために、幾つかの例では、第１のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｕｖ）を第２の部分からデコードする。第１のアレイは、パッチの境界頂点をＵＶアトラスにマッピングするためのＵＶ座標を持つ。第１のアレイによれば、境界頂点の第１のリストの第１の境界ＵＶ座標は、第１のパッチをＵＶアトラス内の第１のＵＶパッチにマッピングするために決定され、第１のＵＶパッチは、第１のパッチに対応する。第１のアレイによれば、境界頂点の第２のリストの第２の境界ＵＶ座標は、第２のパッチをＵＶアトラス内の第２のＵＶパッチにマッピングするために決定され、第２のＵＶパッチは、第２のパッチに対応する。

幾つかの例では、再構成されたメッシュを生成するために、第１のＵＶパッチの内側の第１の頂点の第１のＵＶ座標を決定し、第２のＵＶパッチの内側の第２の頂点の第２のＵＶ座標を決定する。例えば、第１の頂点および第２の頂点は、ＵＶアトラスの規則的なグリッドにある。幾つかの例では、第１のＵＶパッチの内側の第１の頂点の第１のＵＶ座標および境界頂点の第１のリストの第１の境界ＵＶ座標に基づいて第１のＵＶパッチについての第１の接続情報を決定し、第２のＵＶパッチの内側の第２の頂点の第２のＵＶ座標および境界頂点の第２のリストの第２の境界ＵＶ座標に基づいて第２のＵＶパッチについての第２の接続性情報を決定する。第１の接続性情報および第２の接続性情報は、任意の適切な技法によって決定されることができる。一例では、特定の接続性決定技法の使用が、ビットストリーム内の信号に基づいて決定される。

幾つかの例では、第２のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｉｄｘ）が、第２の部分からデコードされ、第２のアレイは、パッチの境界頂点に対応するメッシュのメッシュ頂点インデックスを持つ。一例では、第２のアレイに従って、第１のエッジの第１の頂点についての第１のメッシュ頂点インデックスが決定され、第２のエッジの第２の頂点についての第２のメッシュ頂点インデックスが決定される。第１のエッジの第１の頂点についての第１のメッシュ頂点インデックスは、第２のエッジの第２の頂点についての第２のメッシュ頂点インデックスと一致する。よって、第１のエッジおよび第２のエッジは、エッジメイトである。さらに、一例では、第３のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｘｙｚ）が、第２の部分からデコードされる。第３のアレイは、メッシュ頂点インデックスに対応する３次元座標を持つ。

他の幾つかの例では、第３のアレイ（例えば、ｂｏｕｎｄａｒｙ＿ｘｙｚ）が、第２の部分からデコードされる。第３のアレイは、ＵＶパッチの境界頂点インデックスに対応する３次元（３Ｄ）座標を持つ。一例では、第３のアレイに従って、第１のエッジの第１の頂点についての第１の３Ｄ座標が決定され、第２のエッジの第２の頂点についての第２の３Ｄ座標が決定される。第１のエッジの第１の頂点についての第１の３Ｄ座標は、第２のエッジの第２の頂点についての第２の３Ｄ座標と一致し、よって、第１のエッジおよび第２のエッジは、エッジメイト(edge mates)の一致である。

次に、処理は、（Ｓ１２９９）に進み、終了する。

プロセス（１２００）を適切に適合させることができる。プロセス（１２００）のステップを変更および／または省略することができる。追加的なステップを加えることができる。任意の適切な順序の実装を使用できる。

本開示で開示される技法は、任意の順序で別々に或いは組み合わせて使用することができる。さらに、各技法（例えば、方法、実施形態）、エンコーダ、およびデコーダは、処理回路構成（例えば、１つ以上のプロセッサまたは１つ以上の集積回路）によって実装されることがある。幾つかの例において、１つ以上のプロセッサは、非一時的なコンピュータ可読媒体に格納されるプログラムを実行する。

上述の技法は、コンピュータ可読命令を使用するコンピュータソフトウェアとして実装されることができ、１つ以上のコンピュータ可読媒体に物理的に格納されることができる。例えば、図１３は、開示される主題事項の特定の実施形態を実装するのに適したコンピュータシステム（１３００）を示している。

コンピュータソフトウェアは、１つ以上のコンピュータ中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）、および同等物によって、直接的にまたは解釈、マイクロコード実行、および同等物を通じて実行されることができる命令を含むコードを作成するために、アセンブリ、コンパイル、リンク、または同様のメカニズムの対象となることがある任意の適切なマシンコードまたはコンピュータ言語を使用してコーディングされることができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイス、および同等物を含む、様々なタイプのコンピュータまたはそのコンポーネントで実行されることができる。

コンピュータシステム（１３００）について図１３に示されるコンポーネントは、本質的には例示的であり、本開示の実施形態を実装するコンピュータソフトウェアの使用範囲または機能性に関する如何なる制限を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム（１３００）の例示的な実施形態に例示されるコンポーネントのいずれか１つまたは組み合わせに関する如何なる依存関係または要件を持つものとしても解釈されるべきでない。

コンピュータシステム（１３００）は、特定のヒューマンインターフェース入力デバイスを含むことがある。そのようなヒューマンインターフェース入力デバイスは、例えば、（キーストローク、スワイプ、データグローブの動きのような）触覚入力、（音声、拍手のような）オーディオ入力、（ジェスチャのような）視覚入力、（描写されていない）嗅覚入力を通じて、１人以上の人間のユーザによる入力に応答することがある。ヒューマンインターフェースデバイスは、（スピーチ、音楽、環境音のような）オーディオ、（スキャンされた画像、静止画像カメラから取得された写真画像のような）画像、（二次元ビデオ、立体ビデオを含む三次元ビデオのような）ビデオのような、必ずしも人間による意識的入力に直接的に関連しない特定のメディアをキャプチャするために使用されることもできる。

入力ヒューマンインターフェースデバイスは、キーボード（１３０１）、マウス（１３０２）、トラックパッド（１３０３）、タッチスクリーン（１３１０）、データグローブ（図示せず）、ジョイスティック（１３０５）、マイクロホン（１３０６）、スキャナ（１３０７）、カメラ（１３０８）のうちの１つ以上（それぞれのうちの１つのみが描写されている）を含むことがある。

コンピュータシステム（１３００）は、特定のヒューマンインターフェース出力デバイスを含むこともある。そのようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、および匂い／味を通じて、１つ以上の人間のユーザの感覚を刺激することがある。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１３１０）、データグローブ（図示せず）、ジョイスティック（１３０５）による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る）、（スピーカ（１３０９）、（描写されていない）ヘッドホンのような）オーディオ出力デバイス、（各々がタッチスクリーン入力能力を持つ或いは持たない、各々が触覚フィードバック能力を持つ或いは持たない、それらのうちの一部は、立体映像出力のような手段を通じて二次元の視覚出力または三次元より大きな次元の出力を出力することがある、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含む、スクリーン（１３１０）のような）視覚出力デバイス、仮想現実メガネ（描写されていない）、ホログラフィックディスプレイおよびスモークタンク（描写されていない）、およびプリンタ（描写されていない）を含むことがある。

コンピュータシステム（１３００）は、人間がアクセス可能なストレージデバイス、並びにＣＤ／ＤＶＤまたは同様のメディアを含むＣＤ／ＤＶＤＲＯＭ／ＲＷ（１３２０）を含む光学媒体（１３２１）、サムドライブ（１３２２）、リムーバブルハードドライブまたはソリッドステートドライブ（１３２３）、テープおよびフロッピーディスク（描写されていない）のようなレガシー磁気媒体、セキュリティドングル（描写されていない）のような特殊なＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス、および同等物のようなそれらの関連する媒体も含むことができる。

当業者は、現在開示されている主題事項に関連して使用されるような「コンピュータ可読媒体」という用語は、伝送媒体、搬送波、または他の一時的な信号を含まないことを同様に理解するはずである。

コンピュータシステム（１３００）は、１つ以上の通信ネットワーク（１３５５）へのインターフェース（１３５４）を含むこともできる。ネットワークは、例えば、無線、有線、光であることができる。ネットワークは、さらに、ローカル、ワイドエリア、メトロポリタン、車両および産業用、リアルタイム、遅延耐性などであることができる。ネットワークの例は、イーサネットのようなローカルエリアネットワーク、無線ＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、地上波放送ＴＶを含むテレビ有線または無線ワイドエリアデジタルネットワーク、ＣＡＮＢｕｓを含む車両および産業用などを含む。特定のネットワークは、一般的に、（例えば、コンピュータシステム（１３００）のＵＳＢポートのような）特定の汎用データポートまたは周辺バス（１３４９）に取り付けられた外部ネットワークインターフェースアダプタを必要とする。他のものは、以下に記載されるようなシステムバスへの取り付けによって、コンピュータシステム（１３００）のコアに一般的に統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）。これらのネットワークのいずれかを使用して、コンピュータシステム（１３００）は、他のエンティティと通信することができる。そのような通信は、単方向、受信専用（例えば、テレビ放送）、単方向送信専用（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、または、例えば、ローカルまたはワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの双方向であることができる。特定のプロトコルおよびプロトコルスタックが、上述のように、それらのネットワークおよびネットワークインターフェースの各々で使用されることができる。

前述のヒューマンインターフェースデバイス、人間がアクセス可能なストレージデバイス、およびネットワークインターフェースは、コンピュータシステム（１３００）のコア（１３４０）に取り付けられることができる。

コア（１３４０）は、１つ以上の中央処理装置（ＣＰＵ）（１３４１）、グラフィックス処理装置（ＧＰＵ）（１３４２）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）の形式の特殊なプログラマブル処理装置（１３４３）、特定のタスク用のハードウェアアクセラレータ（１３４４）、グラフィックスアダプタ（１３５０）などを含むことができる。これらのデバイスは、読出し専用メモリ（ＲＯＭ）（１３４５）、ランダムアクセスメモリ（１３４６）、ユーザがアクセスできない内部ハードドライブのような内部大容量ストレージ、ＳＳＤ、および同等物（１３４７）とともに、システムバス（１３４８）を通じて接続されることがある。幾つかのコンピュータシステムにおいて、システムバス（１３４８）は、追加的なＣＰＵ、ＧＰＵ、および同等物による拡張を可能にするために、１つ以上の物理プラグの形態においてアクセス可能であることができる。周辺デバイスは、コアのシステムバス（１３４８）に直接的に取り付けられることができ、或いは周辺バス（１３４９）を通じて取り付けられることができる。一例において、スクリーン（１３１０）は、グラフィックスアダプタ（１３５０）に接続されることができる。周辺バスのためのアーキテクチャは、ＰＣＩ、ＵＳＢ、および同等物を含む。

ＣＰＵ（１３４１）、ＧＰＵ（１３４２）、ＦＰＧＡ（１３４３）、アクセラレータ（１３４４）は、組み合わせにおいて前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１３４５）またはＲＡＭ（１３４６）に格納されることができる。移行データは、ＲＡＭ（１３４６）に格納されることもできるのに対し、恒久データは、例えば、内部大容量記憶装置（１３４７）に格納されることができる。任意のメモリデバイスへの高速格納および取出しは、１つ以上のＣＰＵ（１３４１）、ＧＰＵ（１３４２）、大容量記憶装置（１３４７）、ＲＯＭ（１３４５）、ＲＡＭ（１３４６）、および同等物と密接に関連付けられることができる、キャッシュメモリの使用を通じて可能にされることができる。

コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードをその上に持つことができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計され且つ構築されたものであることができ、或いは、それらは、コンピュータソフトウェア技術において技能を有する者によく知られており且つ利用可能である種類のものであることができる。

制限ではなく、一例として、アーキテクチャ（１３００）、具体的には、コア（１３４０）を有するコンピュータシステムは、１つ以上の有形のコンピュータ可読媒体において具現されるソフトウェアを実行する（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ、および同等物を含む）プロセッサの結果としての機能性を提供することができる。そのようなコンピュータ可読媒体は、上述のようなユーザがアクセス可能な大容量記憶装置と関連付けられる媒体、並びにコア内部大容量記憶装置（１３４７）またはＲＯＭ（１３４５）のような非一時的な性質を持つコア（１３４０）の特定の記憶装置であることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに格納されることができ、コア（１３４０）によって実行されることができる。コンピュータ可読媒体は、特定のニーズに従って、１つ以上のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（１３４０）、特に（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、および同等物を含む）その中のプロセッサに、ＲＡＭ（１３４６）に格納されたデータ構造を定義することおよびソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することを含む、本明細書に記載される特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。追加的にまたは代替的に、コンピュータシステムは、回路（例えば、アクセラレータ（１３４４））に配線されるか或いは他の方法で具現されるロジック(論理)の結果としての機能性を提供することができ、それはソフトウェアの代わりに或いはソフトウェアとともに作動して、本明細書に記載される特定のプロセスまたは特定のプロセスの特定の部分を実行することができる。ソフトウェアへの言及は、適切な場合には、ロジックを含むことができ、その逆もまた同様である。コンピュータ可読媒体への言及は、適切な場合には、実行のための（集積回路（ＩＣ）のような）ソフトウェアを格納する回路、実行のためのロジックを具現する回路、またはそれらの両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。

この開示は、幾つかの例示的な実施形態を記載したが、変更、置換、および様々な代替的な均等物があり、それらは本開示の範囲内にある。よって、当業者は、本開示において明示的に図示されていないか或いは記載されていないが、本開示の原則を具現し、よって、その精神および範囲内にある、多数のシステムおよび方法を考案し得ることが理解されるであろう。

Claims

メッシュ解凍のための方法であって、
パッチに分割されるメッシュのエンコードされた情報を運ぶビットストリームを受信することであって、前記ビットストリームは、第１の部分と、第２の部分とを含み、前記第１の部分は、パッチ情報を含み、前記第２の部分は、少なくとも第１のパッチの第１のエッジおよび第２のパッチの第２のエッジがエッジメイトのペアであることを示すパッチ境界情報を含む、受信することと、
前記第１の部分をデコードして前記パッチ情報を取得することと、
前記第２の部分をデコードして前記パッチ境界情報を取得することと、
前記パッチ情報と前記パッチ境界情報とに基づいて、再構成されたメッシュを生成することと、を含み、
前記第１のエッジおよび前記第２のエッジは、前記第１のパッチを前記第２のパッチと接続するように前記再構成されたメッシュ内の同じエッジにマッピングされる、
方法。
前記第１の部分からデコードされる前記パッチ情報は、前記第２の部分からデコードされる前記パッチ境界情報とは異なるパッチ境界情報を有する、請求項１に記載の方法。
前記第２の部分をデコードすることは、
前記第２の部分から境界テーブルをデコードすることであって、前記境界テーブルは、前記パッチと関連付けられる境界頂点のリストを含む、デコードすることと、
前記境界テーブルに従って、前記第１のパッチと関連付けられる境界頂点の第１のリストおよび前記第２のパッチと関連付けられる境界頂点の第２のリストを決定することと、
前記境界頂点の前記第１のリストに従って、前記第１のパッチについての第１の境界エッジを決定することであって、前記第１のエッジは、前記第１のパッチの境界エッジである、決定することと、
前記境界頂点の前記第２のリストに従って、前記第２のパッチの第２の境界エッジを決定することであって、前記第２のエッジは、前記第２のパッチの境界エッジである、決定することと、をさらに含む、
請求項１に記載の方法。
前記第２の部分をデコードすることは、
前記第２の部分から第１のアレイをデコードすることであって、前記第１のアレイは、前記パッチの前記境界頂点をＵＶアトラスにマッピングするためのＵＶ座標を持つ、デコードすることと、
前記第１のアレイに従って、前記第１のパッチを前記ＵＶアトラス内の第１のＵＶパッチにマッピングするために前記境界頂点の前記第１のリストの第１の境界ＵＶ座標を決定することと、
前記第１のアレイに従って、前記第１のパッチを前記ＵＶアトラス内の第２のＵＶパッチにマッピングするために前記境界頂点の前記第２のリストの第２の境界ＵＶ座標を決定することと、をさらに含む、
請求項３に記載の方法。
前記再構成されたメッシュを生成することは、
前記第１のＵＶパッチの内側の第１の頂点の第１のＵＶ座標を決定することと、
前記第２のＵＶパッチの内側の第２の頂点の第２のＵＶ座標を決定することと、をさらに含む、
請求項４に記載の方法。
前記第１の頂点および前記第２の頂点は、前記ＵＶアトラスの規則的なグリッドにある、請求項５に記載の方法。
前記第１の頂点の前記第１のＵＶ座標および前記境界頂点の前記第１のリストの前記第１の境界ＵＶ座標に基づいて、前記第１のＵＶパッチについての第１の接続性情報を決定することと、
前記第２の頂点の前記第２のＵＶ座標および前記境界頂点の前記第２のリストの前記第２の境界ＵＶ座標に基づいて、前記第２のＵＶパッチについての第２の接続性情報を決定することと、をさらに含む、
請求項５に記載の方法。
前記ビットストリーム中の信号に基づいて、特定の接続性決定技法の使用を決定することをさらに含む、請求項７に記載の方法。
前記第２の部分から第２のアレイをデコードすることであって、前記第２のアレイは、前記パッチの前記境界頂点に対応する前記メッシュのメッシュ頂点インデックスを持つ、デコードすることと、
前記第２のアレイに従って、前記第１のエッジの第１の頂点についての第１のメッシュ頂点インデックスを決定することと、
前記第２のアレイに従って、前記第２のエッジの第２の頂点についての第２のメッシュ頂点インデックスを決定することと、を含み、
前記第１のエッジの第１の頂点についての前記第１のメッシュ頂点インデックスは、前記第２のエッジの第２の頂点についての前記第２のメッシュ頂点インデックスと一致する、
請求項５に記載の方法。
前記第２の部分から第３のアレイをデコードすることをさらに含み、前記第３のアレイは、前記パッチの前記境界頂点についての前記メッシュ頂点インデックスに対応する三次元座標を持つ、請求項９に記載の方法。
前記第２の部分から第３のアレイをデコードすることであって、前記第３のアレイは、前記メッシュ内の前記パッチの前記境界頂点の三次元（３Ｄ）座標を持つ、デコードすることと、
前記第３のアレイに従って、前記第１のエッジの第１の頂点についての第１の３Ｄ座標を決定することと、
前記第３のアレイに従って、前記第２のエッジの第２の頂点の第２の３Ｄ座標を決定することと、を含み、
前記第１のエッジの前記第１の頂点についての前記第１の３Ｄ座標は、前記第２のエッジの前記第２の頂点の前記第２の３Ｄ座標と一致する、
請求項５に記載の方法。
処理回路構成を含む装置であって、
前記処理回路構成は、
パッチに分割されるメッシュのエンコードされた情報を運ぶビットストリームを受信するように構成され、前記ビットストリームは、第１の部分と、第２の部分とを含み、前記第１の部分は、パッチ情報を含み、前記第２の部分は、少なくとも第１のパッチの第１のエッジおよび第２のパッチの第２のエッジがエッジメイトのペアであることを示すパッチ境界情報を含み、
前記第１の部分をデコードして前記パッチ情報を取得するように構成され、
前記第２の部分をデコードして前記パッチ境界情報を取得するように構成され、
前記パッチ情報および前記パッチ境界情報に基づいて、再構成されたメッシュを生成するように構成され、前記第１のエッジおよび前記第２のエッジは、前記第１のパッチを前記第２のパッチと接続するために、前記再構成されたメッシュ内の同じエッジにマッピングされる、
装置。
前記第１の部分からデコードされる前記パッチ情報は、前記第２の部分からデコードされる前記パッチ境界情報とは異なるパッチ境界情報を有する、請求項１２に記載の装置。
前記処理回路構成は、
前記第２の部分から境界テーブルをデコードするように構成され、前記境界テーブルは、前記パッチの境界頂点のリストを含み、
前記境界テーブルに従って、前記第１のパッチについての境界頂点の第１のリストおよび前記第２のパッチについての境界頂点の第２のリストを決定するように構成され、
前記境界頂点の前記第１のリストに従って、前記第１のパッチについての第１の境界エッジを決定するように構成され、前記第１のエッジは、前記第１のパッチの境界エッジであり、
前記境界頂点の前記第２のリストに従って、前記第２のパッチの第２の境界エッジを決定するように構成され、前記第２のエッジは、前記第２のパッチの境界エッジである、
請求項１２に記載の装置。
前記処理回路構成は、
前記第２の部分から第１のアレイをデコードするように構成され、前記第１のアレイは、前記パッチの前記境界頂点をＵＶアトラスにマッピングするためのＵＶ座標を持ち、
前記第１のアレイに従って、前記第１のパッチを前記ＵＶアトラス内の第１のＵＶパッチにマッピングするために、前記境界頂点の前記第１のリストの第１の境界ＵＶ座標を決定するように構成され、前記第１のＵＶパッチは、前記第１のパッチに対応し、
前記第１のアレイに従って、前記第２のパッチを前記ＵＶアトラス内の第２のＵＶパッチにマッピングするために、前記境界頂点の前記第２のリストの第２の境界ＵＶ座標を決定するように構成され、前記第２のＵＶパッチは、前記第２のパッチに対応する、
請求項１４に記載の装置。
前記処理回路構成は、
前記第１のＵＶパッチの内側の第１の頂点の第１のＵＶ座標を決定するように構成され、
前記第２のＵＶパッチの内側の第２の頂点の第２のＵＶ座標を決定するように構成される、
請求項１５に記載の装置。
前記第１の頂点および前記第２の頂点は、前記ＵＶアトラスの規則的なグリッドにある、請求項１６に記載の装置。
前記処理回路構成は、
前記第１の頂点の前記第１のＵＶ座標および前記境界頂点の前記第１のリストの前記第１の境界ＵＶ座標に基づいて、前記第１のＵＶパッチについての第１の接続性情報を決定するように構成され、
前記第２の頂点の前記第２のＵＶ座標および前記境界頂点の前記第２のリストの前記第２の境界ＵＶ座標に基づいて、前記第２のＵＶパッチについての第２の接続性情報を決定するように構成される、
請求項１６に記載の装置。
前記処理回路構成は、
前記第２の部分から第２のアレイをデコードするように構成され、前記第２のアレイは、前記パッチの前記境界頂点に対応する前記メッシュのメッシュ頂点インデックスを持ち、
前記第２のアレイに従って、前記第１のエッジの第１の頂点についての第１のメッシュ頂点インデックスを決定するように構成され、
前記第２のアレイに従って、前記第２のエッジの第２の頂点についての第２のメッシュ頂点インデックスを決定するように構成され、
前記第１のエッジの第１の頂点についての前記第１のメッシュ頂点インデックスは、前記第２のエッジの第２の頂点についての前記第２のメッシュ頂点インデックスと一致する、
請求項１２に記載の装置。
前記処理回路構成は、
前記第２の部分から第３のアレイをデコードするように構成され、前記第３のアレイは、前記メッシュ内の前記パッチの前記境界頂点の三次元（３Ｄ）座標を持ち、
前記第３のアレイに従って、前記第１のエッジの第１の頂点についての第１の３Ｄ座標を決定するように構成され、
前記第３のアレイに従って、前記第２のエッジの第２の頂点についての第２の３Ｄ座標を決定するように構成され、
前記第１のエッジの前記第１の頂点についての前記第１の３Ｄ座標は、前記第２のエッジの前記第２の頂点の前記第２の３Ｄ座標と一致する、
請求項１２に記載の装置。
命令を含むコンピュータプログラムであって、前記命令は、少なくとも１つのプロセッサによって実行されるときに、コンピュータに請求項１－１１に記載の方法を実行する、コンピュータプログラム。
命令を格納する非一時的なコンピュータ読取可能媒体であって、前記命令は、コンピュータによって実行されるときに、前記コンピュータに請求項１－１１に記載の方法を実行させる、非一時的なコンピュータ読取可能媒体。