JP7842231B2

JP7842231B2 - メッシュ処理のための方法、装置

Info

Publication number: JP7842231B2
Application number: JP2024547318A
Authority: JP
Inventors: ティエン，ジュン; ホアン，チャオ; シュ，シャオジョン; ジャン，シアン; リウ，シャン
Original assignee: Tencent America LLC
Current assignee: Tencent America LLC
Priority date: 2022-07-08
Filing date: 2023-05-16
Publication date: 2026-04-07
Anticipated expiration: 2043-05-16
Also published as: JP2025507354A; US20240015324A1; WO2024010994A1; KR20240068717A; US12335522B2; EP4552089A1; CN118575201A

Description

本願は、２０２２年７月８日に出願された米国仮出願第６３／３５９，６６９号「メッシュ圧縮における頂点位置コーディング」に対する優先権を主張する、２０２３年５月８日に提出された、出願番号が１８／１４４，６８６であり、発明の名称が「メッシュ圧縮における頂点位置コーディング」である米国特許出願に対して優先権を主張し、その全体が参照により本明細書に組み込まれるものとする。

本開示は、メッシュ処理に関する実施形態を含む。

本明細書で提供される「背景技術」の説明は、本開示のコンテキストを大まかに示すことを目的とする。ここに名を挙げられている発明者の業績は、この背景技術に記載された範囲において、出願時に従来技術として通常見なされえない記載の態様と共に、明示的にも黙示的にも本開示に対する従来技術として認められない。

３次元（３Ｄ）撮影、モデリング及びレンダリングの進歩は、複数のプラットフォーム及び装置にわたる３Ｄコンテンツの遍在的存在を促進した。現在では、ある大陸で赤ちゃんの最初の一歩を撮影し、赤ちゃんの祖父母が別の大陸でその赤ちゃんを見て（いくつかの場合では、交流し）、完全没入体験を楽しむことができるようにする。そのような現実感を実現するために、モデルはこれまで以上に洗練されており、大量のデータがそれらのモデルの作成及び消費にリンクされる。３Ｄメッシュは、このような没入型コンテンツを表現するために広く使用されている。

本開示の態様は、メッシュ処理のための方法及び装置を提供する。いくつかの例では、メッシュ処理のための装置は、処理回路を含む。

本開示の一態様によれば、ビデオエンコーダが実行するメッシュ処理のための方法が提供される。この方法では、現在頂点の複数の候補予測を決定する。前記現在頂点がメッシュの複数の頂点に含まれる。複数の前記候補予測が複数の三角形に基づいて決定される。複数の前記三角形のそれぞれが各候補予測に対応する。複数の前記候補予測から前記現在頂点の予測を決定する。前記予測が、前記現在頂点の複数の候補予測の数が閾値以上であることに基づいて予め定められた予測インデックスによって識別される。決定された前記予測に基づいて前記現在頂点の予測情報をエンコードする。前記予測情報が前記現在頂点の予測を識別する予測インデックスを含む。

いくつかの実施形態では、前記閾値は、２以上５以下である。

一例では、前記現在頂点の複数の候補予測を決定するために、前記現在頂点に対して複数の前記三角形のうちの第１の三角形を決定し、前記第１の三角形が複数の前記三角形のうちの第２の三角形と共有エッジを有する。前記現在頂点が前記第２の三角形に含まれ、かつ前記共有エッジの反対側にある。前記第１の候補予測と前記第１の三角形が第１の平行四辺形を形成する平行四辺形予測によって、決定された前記第１の三角形に基づいて、複数の前記候補予測のうちの第１の候補予測を決定する。

一例では、前記現在頂点の複数の候補予測を決定するために、複数の前記候補予測の平均予測を決定する。

一例では、前記現在頂点の予測を決定するために、前記現在頂点の予測リストを決定する。前記予測リストにおける候補予測子が前記予測リストにおける平均予測及び前記平均予測に続く複数の前記候補予測を含む。前記予測リストにおける複数の前記候補予測の順序は、複数の前記候補予測に対応する複数の前記三角形の順序に基づくものである。前記予測リストにおける前記候補予測子のそれぞれが各予測インデックスに関連付けられる。

いくつかの実施形態では、複数の前記三角形は、螺旋状の三角形スパニングツリー順序でラベル付けされるエッジブレイカーアルゴリズムに基づいて順序付けされる。

一例では、前記現在頂点の複数の前記候補予測の数が前記閾値に等しいことに応答して、前記予測インデックスが第１の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第１の候補予測子として決定する。一例では、前記現在頂点の複数の前記候補予測の数が前記閾値よりも大きいことに応答して、前記予測インデックスが第２の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第２の候補予測子として決定する。一例では、前記現在頂点の複数の前記候補予測の数が前記閾値以上であることに応答して、前記予測インデックスが第３の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第３の候補予測子として決定する。

一例では、前記現在頂点の予測を決定するために、前記予測リストにおける候補予測子のそれぞれと前記現在頂点との予測差を決定する。前記予測リストにおける候補予測子から前記予測差のうちの最小予測差に対応する前記予測を更に決定する。

一例では、前記現在頂点の予測を決定するために、前記予測リストの候補予測子のサブセット内の最小予測差を有する予測を決定する。

いくつかの実施形態では、固定長コーディング、可変長コーディング、及び差分コーディングのうちの１つに基づいて、前記予測リストにおける候補予測子のそれぞれに対して各予測インデックスを決定する。

いくつかの実施形態では、前記現在頂点の予測情報は、残差情報を含む。前記残差情報は、前記現在頂点と決定された前記予測との差を示す。いくつかの実施形態では、前記残差情報をエンコードしてもよい。例えば、固定長コーディング、指数ゴロムコーディング、及び算術コーディングのうちの１つに基づいて残差情報をエンコードしてもよい。

本開示の別の態様によれば、装置が提供される。前記装置は、処理回路を含む。前記処理回路は、記載されたメッシュ処理のための方法のいずれかを実行するように構成されてもよい。

本開示の態様はコンピュータによって実行されると、記載されたメッシュ処理のための方法のいずれかを前記コンピュータに実行させる命令を記憶する非一時的なコンピュータ可読媒体をさらに提供する。

開示された主題の更なる特徴、性質及び様々な利点は、下記の詳細な説明及び添付の図面からより明らかになる。

ビデオ処理システム（１００）の例示的なブロック図の概略図である。デコーダの例示的なブロック図の概略図である。エンコーダの例示的なブロック図の概略図である。本開示のいくつかの実施形態に係る第１の例示的な平行四辺形予測の概略図である。本開示のいくつかの実施形態に係る第２の例示的な平行四辺形予測の概略図である。エッジブレイカーアルゴリズムの５つのパッチ構成の例を示す。エッジブレイカーアルゴリズムによる例示的なメッシュトラバーサルを示す。平行四辺形予測に基づいて頂点を予測する例を示す概略図である。本開示のいくつかの実施形態に係るプロセスの概要を示すフローチャートである。本開示のいくつかの実施形態に係る別のプロセスの概要を示すフローチャートである。一実施形態に係るコンピュータシステムの概略図である。

図１は、いくつかの例におけるビデオ処理システム（１００）のブロック図を示す。ビデオ処理システム（１００）は、開示された主題の用途の例であり、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダである。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、ストリーミングサービス、及び、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他の画像及びビデオ対応用途に等しく適用可能である。

ビデオ処理システム（１００）は、ビデオソース（１０１）を含み得る撮影サブシステム（１１３）を含む。ビデオソース（１０１）は、カメラによって撮影された画像及び／又はコンピュータによって生成された画像を１つ以上含んでもよい。例えば、デジタルカメラは、非圧縮のビデオピクチャ（１０２）のストリームを作成する。一例では、ビデオピクチャ（１０２）のストリームは、デジタルカメラによって取得されたサンプルを含む。エンコードされたビデオデータ（１０４）（又はコード化されたビデオビットストリーム）と比較して高いデータ量を強調するために太線で示されたビデオピクチャ（１０２）のストリームは、ビデオソース（１０１）に結合されたビデオエンコーダ（１０３）を含む電子デバイス（１２０）によって処理することができる。ビデオエンコーダ（１０３）は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか又は実装するために、ハードウェア、ソフトウェア又はそれらの組み合わせを含むことができる。ビデオピクチャ（１０２）のストリームと比較してより低いデータ量を強調するために細線で示された、エンコードされたビデオデータ（１０４）（又はエンコードされたビデオビットストリーム）は、将来使用するためにストリーミングサーバ（１０５）に記憶することができる。図１のクライアントサブシステム（１０６）及び（１０８）のような１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（１０５）にアクセスして、エンコードされたビデオデータ（１０４）のコピー（１０７）及び（１０９）を検索することができる。クライアントサブシステム（１０６）は、例えば、電子デバイス（１３０）におけるビデオデコーダ（１１０）を含んでもよい。ビデオデコーダ（１１０）は、エンコードされたビデオデータの入り方向コピー（１０７）をデコードし、ディスプレイ（１１２）（例えば、表示画面）又は他のレンダリングデバイス（図示せず）でレンダリングできるビデオピクチャ（１１１）の出方向ストリームを作成する。いくつかのストリーミングシステムにおいて、エンコードされたビデオデータ（１０４）、（１０７）及び（１０９）（例えば、ビデオビットストリーム）は、特定のビデオコーディング／圧縮規格に従ってエンコードすることができる。これらの規格の例は、ＩＴＵ－Ｔ勧告Ｈ．２６５を含む。一例では、発展中のビデオコーディング規格は、非公式的に多用途ビデオコーディング（ＶＶＣ）として知られている。開示された主題は、ＶＶＣのコンテキストに使用されてもよい。

なお、電子デバイス（１２０）及び（１３０）は、他の構成要素（図示せず）を含むことができる。例えば、電子デバイス（１２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（１３０）は、ビデオエンコーダ（図示せず）を含むことができる。

図２は、ビデオデコーダ（２１０）の例示的なブロック図を示す。ビデオデコーダ（２１０）は、電子デバイス（２３０）に含まれてもよい。電子デバイス（２３０）は、受信機（２３１）を含むことができる。受信機（２３１）は、ネットワークインタフェース回路などの受信回路を含んでもよい。ビデオデコーダ（２１０）は、図１の例におけるビデオデコーダ（１１０）の代わりに使用することができる。

受信機（２３１）は、ビデオデコーダ（２１０）によってデコードされる１つ以上のコード化ビデオシーケンスを受信してもよい。一実施形態では、一度に１つのコード化ビデオシーケンスを受信し、各コード化ビデオシーケンスのデコーディングは、他のコード化ビデオシーケンスのデコーディングから独立している。コード化ビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得るチャネル（２０１）から受信されてもよい。受信機（２３１）は、それぞれの使用エンティティ（図示せず）に転送され得る他のデータ、例えば、コード化オーディオデータ及び／又は補助データストリームとともに、エンコードされたビデオデータを受信してもよい。受信機（２３１）は、コード化ビデオシーケンスを他のデータから分離してもよい。ネットワークジッタを防止するために、バッファメモリ（２１５）は、受信機（２３１）とエントロピーデコーダ／パーサ（２２０）（以降、「パーサ（２２０）」）の間に結合されてもよい。特定の用途では、バッファメモリ（２１５）は、ビデオデコーダ（２１０）の一部である。他の場合、バッファメモリ（２１５）は、ビデオデコーダ（２１０）（図示せず）の外部に存在することができる。更に他の場合、例えば、ネットワークジッタを防止するためにビデオデコーダ（２１０）の外部にバッファメモリ（図示せず）が存在し、更に、例えば、再生タイミングを処理するためにビデオデコーダ（２１０）の内部に別のバッファメモリ（２１５）が存在することができる。受信機（２３１）が十分な帯域幅及び可制御性を有する記憶／転送装置から、又は等同期ネットワークからデータを受信する際に、バッファメモリ（２１５）は必要ではないことがあり、小さくされることがある。インターネットなどのベストエフォートパケットネットワークで使用するために、バッファメモリ（２１５）が必要であることがあり、バッファメモリ（２１５）は、比較的大きいことがあり、有利には適応サイズであることができ、ビデオデコーダ（２１０）の外部のオペレーティングシステム又は類似の要素（図示せず）に少なくとも部分的に実装され得る。

ビデオデコーダ（２１０）は、コード化ビデオシーケンスからシンボル（２２１）を再構築するパーサ（２２０）を含んでもよい。これらのシンボルのカテゴリは、ビデオデコーダ（２１０）の動作を管理するために使用される情報を含み、そして、電子デバイス（２３０）の不可欠な部分ではないが、図２に示されるように電子デバイス（２３０）に結合することができるレンダリングデバイス（２１２）（例えば、表示画面）のようなレンダリングデバイスを制御する情報を潜在的に含む。レンダリングデバイスのための制御情報は、補助強化情報（ＳＥＩ）メッセージ又はビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（図示せず）の形態であってもよい。パーサ（２２０）は、受信されたコード化ビデオシーケンスを構文解析／エントロピーデコードしてもよい。コード化ビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に合わせることができ、可変長コーディング、ハフマンコーディング、コンテキスト感受性を有するか又は有さない算術コーディングなどを含む様々な原理に従うことができる。パーサ（２２０）は、グループに対応する少なくとも１つのパラメータに基づいて、コード化ビデオシーケンスからビデオデコーダ内の画素の少なくとも１つのサブグループのためのサブグループパラメータのセットを抽出してもよい。サブグループは、ピクチャグループ（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（ＣＵ）、ブロック、変換ユニット（ＴＵ）、予測ユニット（ＰＵ）などを含むことができる。パーサ（２２０）は、コード化ビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報も抽出してもよい。

パーサ（２２０）は、シンボル（２２１）を作成するために、バッファメモリ（２１５）から受信されたビデオシーケンスに対してエントロピーデコーディング／構文解析動作を実行してもよい。

シンボル（２２１）の再構築は、コード化されたビデオピクチャ又はその一部（例えば、インターピクチャ及びイントラピクチャ、インターブロック及びイントラブロック）のタイプ及び他の要因に応じて、複数の異なるユニットに関与することができる。どのユニットが、どのように関与するかは、パーサ（２２０）によってコード化ビデオシーケンスから構文解析されたサブグループ制御情報によって制御することができる。パーサ（２２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために示されていない。

すでに述べた機能ブロックに加え、ビデオデコーダ（２１０）は、以下で説明されるようにいくつかの機能ユニットに概念的に細分することができる。商業的制約で動作する実際の実装では、これらのユニットの多くは、互いに密接に相互作用し、少なくとも部分的には互いに統合することができる。しかしながら、開示された主題を説明するために、以下の機能ユニットへの概念的な細分は適切である。

第１のユニットは、スケーラ／逆変換ユニット（２５１）である。スケーラ／逆変換ユニット（２５１）は、使用する変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報と、量子化された変換係数とを、シンボル（２２１）としてパーサ（２２０）から受信する。スケーラ／逆変換ユニット（２５１）は、アグリゲータ（２５５）に入力可能なサンプル値を含むブロックを出力することができる。

いくつかの場合では、スケーラ／逆変換ユニット（２５１）の出力サンプルは、イントラコード化ブロックに関係することがある。イントラコード化ブロックは、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックである。このような予測情報は、イントラピクチャ予測ユニット（２５２）によって提供することができる。いくつかの場合では、イントラピクチャ予測ユニット（２５２）は、現在ピクチャバッファ（２５８）から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックと同じサイズ及び形状のブロックを生成する。現在ピクチャバッファ（２５８）は、例えば、部分的に再構築された現在ピクチャ及び／又は完全に再構築された現在ピクチャをバッファリングする。アグリゲータ（２５５）は、いくつかの場合では、サンプルごとに、イントラ予測ユニット（２５２）が生成した予測情報を、スケーラ／逆変換ユニット（２５１）によって提供される出力サンプル情報に追加する。

他の場合では、スケーラ／逆変換ユニット（２５１）の出力サンプルは、インターコード化された、潜在的に動き補償されたブロックに関係することができる。このような場合に、動き補償予測ユニット（２５３）は、参照ピクチャメモリ（２５７）にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル（２２１）に従って動き補償した後、出力サンプル情報を生成するように、これらのサンプルは、アグリゲータ（２５５）によってスケーラ／逆変換ユニット（２５１）の出力に追加することができる（この場合に、残差サンプル又は残差信号と呼ばれる）。動き補償予測ユニット（２５３）が予測サンプルを取り出す参照ピクチャメモリ（２５７）内のアドレスは、例えば、Ｘ、Ｙ及び参照ピクチャ成分を有し得るシンボル（２２１）の形態で動き補償予測ユニット（２５３）に利用可能な動きベクトルによって制御することができる。動き補償は、サブサンプルの正確な動きベクトルが使用中であるときに参照ピクチャメモリ（２５７）から取り出されたサンプル値の補間、動きベクトル予測メカニズムなどを含むこともできる。

アグリゲータ（２５５）の出力サンプルは、ループフィルタユニット（２５６）において様々なループフィルタリング技術によって用いられてもよい。ビデオ圧縮技術は、コード化ビデオシーケンス（コード化されたビデオビットストリームとも呼ばれる）に含まれ、パーサ（２２０）からのシンボル（２２１）としてループフィルタユニット（２５６）に利用可能とされたパラメータによって制御されるループ内フィルタ技術を含むことができる。ビデオ圧縮は、コード化ピクチャ又はコード化ビデオシーケンスの（デコーディング順序で）前の部分のデコーディング中に取得されたメタ情報に応じるとともに、予め再構築されループフィルタリングされたサンプル値に応じることもできる。

ループフィルタユニット（２５６）の出力は、レンダリングデバイス（２１２）へ出力することができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリ（２５７）に記憶することができるサンプルストリームであり得る。

特定のコード化ピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用することができる。例えば、現在ピクチャに対応するコード化ピクチャが完全に再構築され、コード化ピクチャが（例えば、パーサ（２２０）によって）参照ピクチャとして識別されると、現在ピクチャバッファ（２５８）は、参照ピクチャメモリ（２５７）の一部になることができ、次のコード化ピクチャの再構築を開始する前に新しい現在ピクチャバッファを再割当てすることができる。

ビデオデコーダ（２１０）は、所定のビデオ圧縮技術又はＩＴＵ－Ｔ勧告Ｈ．２６５のような規格に従ってデコーディング動作を実行することができる。コード化ビデオシーケンスがビデオ圧縮技術又は規格の構文と、ビデオ圧縮技術又は規格で文書化されたプロファイルとの両方に準拠しているという意味で、コード化ビデオシーケンスは、使用されているビデオ圧縮技術又は規格によって指定される構文に準拠し得る。具体的には、プロファイルは、ビデオ圧縮技術又は規格で利用可能な全てのツールから、特定のツールをそのプロファイルで利用可能な唯一のツールとして選択することができる。コード化ビデオシーケンスの複雑さがビデオ圧縮技術又は規格のレベルで限定される範囲内にあることも、コンプライアンスに対して必要である。いくつかの場合では、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート（例えば、１秒あたりのメガサンプルで測定される）、最大参照ピクチャサイズなどを制限する。いくつかの場合では、レベルによって設定された制限は、仮想参照デコーダ（ＨＲＤ）の仕様及びコード化ビデオシーケンスでシグナリングされたＨＲＤバッファ管理のためのメタデータによって更に制限され得る。

一実施形態では、受信機（２３１）は、エンコードされたビデオとともに追加の（冗長）データを受信することができる。追加のデータは、コード化ビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、及び／又は、元のビデオデータをより正確に再構築するためにビデオデコーダ（２１０）によって使用されてもよい。追加のデータは、例えば、時間的、空間的又は信号対雑音比（ＳＮＲ）エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態であり得る。

図３は、ビデオエンコーダ（３０３）の例示的なブロック図を示す。ビデオエンコーダ（３０３）は、電子デバイス（３２０）に含まれる。電子デバイス（３２０）は、送信機（３４０）（例えば、送信回路）を含む。ビデオエンコーダ（３０３）は、図１の例におけるビデオエンコーダ（１０３）の代わりに使用することができる。

ビデオエンコーダ（３０３）は、ビデオエンコーダ（３０３）によってコード化すべきビデオ画像を撮影し得るビデオソース（３０１）（図３の例では電子デバイス（３２０）の一部ではない）からビデオサンプルを受信することができる。別の例では、ビデオソース（３０１）は、電子デバイス（３２０）の一部である。

ビデオソース（３０１）は、ビデオエンコーダ（３０３）によってコード化すべきソースビデオシーケンスを、任意の適切なビット深度（例えば、８ビット、１０ビット、１２ビット…）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ…）及び任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース（３０１）は、予め準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース（３０１）は、ローカル画像情報をビデオシーケンスとして撮影するカメラであり得る。ビデオデータは、順番に見られるときに動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて１つ以上のサンプルを含むことができる。以下の説明ではサンプルを中心に説明する。

一実施形態によれば、ビデオエンコーダ（３０３）は、リアルタイムで又は要求される任意の他の時間制約の下でソースビデオシーケンスのピクチャをコード化し、コード化ビデオシーケンス（３４３）に圧縮することができる。適切なコーディング速度を実施することは、コントローラ（３５０）の機能の１つである。いくつかの実施形態では、コントローラ（３５０）は、以下で説明されるように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。明瞭にするために、結合は図示されていない。コントローラ（３５０）によって設定されたパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化、レート歪み最適化技術のラムダ値…）、ピクチャサイズ、ピクチャ群（ＧＯＰ）レイアウト、最大動きベクトル検索範囲などを含むことができる。コントローラ（３５０）は、特定のシステム設計に対して最適化されたビデオエンコーダ（３０３）に関係する他の適切な機能を有するように構成することができる。

いくつかの実施形態では、ビデオエンコーダ（３０３）は、コーディングループで動作するように構成される。過度に簡略化した説明として、一例では、コーディングループは、ソースコーダ（３３０）（例えば、コード化すべき入力ピクチャ及び参照ピクチャに基づくシンボルストリームなどのシンボルの作成を担当する）、及びビデオエンコーダ（３０３）に埋め込まれた（ローカル）デコーダ（３３３）を含むことができる。デコーダ（３３３）は、シンボルを再構築して、（リモート）デコーダが作成するのと同様な方法でサンプルデータを作成する。再構築されたサンプルストリーム（サンプルデータ）は、参照ピクチャメモリ（３３４）に入力される。シンボルストリームのデコーディングにより、（ローカル又はリモート）デコーダの位置に関係なくビット正確な結果が得られるため、参照ピクチャメモリ（３３４）のコンテンツもローカルエンコーダとリモートエンコーダの間でビット正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコーディング中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性のこの基本原理（及び例えばチャネルエラーに起因して同期性を維持できない場合に生じるドリフト）は、いくつかの関連技術にも使用されている。

「ローカル」デコーダ（３３３）の動作は、前文で図２に関連して既に詳細に説明された、ビデオデコーダ（２１０）などの「リモート」デコーダの動作と同様であり得る。しかしながら、図２も簡単に参照し、シンボルが利用可能であり、エントロピーコーダ（３４５）及びパーサ（２２０）によるコード化ビデオシーケンスへのシンボルのエンコーディング／デコーディングは可逆であり得るため、バッファメモリ（２１５）及びパーサ（２２０）を含むビデオデコーダ（２１０）のエントロピーデコーディング部分は、ローカルデコーダ（３３３）では完全に実装されない場合がある。

一実施形態では、デコーダに存在する構文解析／エントロピーデコーディング以外のデコーダ技術は、対応するエンコーダに同一又は実質的に同一の機能的形態で存在する。したがって、開示された主題は、デコーダの動作に焦点を合わせている。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため、省略できる。特定の領域で、より詳細な説明が以下に提供される。

動作中、いくつかの例では、ソースコーダ（３３０）は、動き補償予測コーディングを実行してもよく、動き補償予測コーディングは、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の予めコード化されたピクチャを参照して入力ピクチャを予測的にコード化する。このようにして、コーディングエンジン（３３２）は、入力ピクチャの画素ブロックと、入力ピクチャへの予測基準として選択され得る参照ピクチャの画素ブロックとの差をコード化する。

ローカルビデオデコーダ（３３３）は、ソースコーダ（３３０）によって作成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャのコード化されたビデオデータをデコードすることができる。コーディングエンジン（３３２）の動作は、有利には非可逆プロセスであり得る。コード化されたビデオデータがビデオデコーダ（図３に図示されていない）でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかの誤差を伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ（３３３）は、ビデオデコーダによって参照ピクチャに対して実行され得るデコーディングプロセスを再現し、再構築された参照ピクチャを参照ピクチャメモリ（３３４）に記憶させることができる。このようにして、ビデオエンコーダ（３０３）は、遠端ビデオデコーダによって取得される再構築された参照ピクチャと共通するコンテンツ（送信エラー無し）を有する再構築された参照ピクチャのコピーをローカルに記憶し得る。

予測子（３３５）は、コーディングエンジン（３３２）の予測検索を実行することができる。つまり、新しいコード化すべきピクチャについて、予測子（３３５）は、（候補の参照画素ブロックとしての）サンプルデータ、又は、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ（３３４）で検索することができる。予測子（３３５）は、適切な予測基準を見つけるために、サンプルブロック／画素ブロックごとに動作することができる。いくつかの場合では、予測子（３３５）によって取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（３３４）に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。

コントローラ（３５０）は、例えば、ビデオデータをエンコーディングするために使用されるパラメータ及びサブグループパラメータの設定を含む、ソースコーダ（３３０）のコーディング動作を管理してもよい。

前述の全ての機能ユニットの出力は、エントロピーコーダ（３４５）でエントロピーコーディングされてもよい。エントロピーコーダ（３４５）は、例えば、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従ってシンボルに対して可逆圧縮を適用することにより、様々な機能ユニットによって生成されたシンボルをコード化ビデオシーケンスに変換する。

送信機（３４０）は、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得る通信チャネル（３６０）を介した送信の準備のために、エントロピーコーダ（３４５）によって作成されたコード化ビデオシーケンスをバッファリングすることができる。送信機（３４０）は、ビデオエンコーダ（３０３）からのコード化されたビデオデータを、送信されるべき他のデータ、例えば、コード化オーディオデータ及び／又は補助データストリーム（ソースは図示されていない）とマージしてもよい。

コントローラ（３５０）は、ビデオエンコーダ（３０３）の動作を管理してもよい。コーディング中、コントローラ（３５０）は、各コード化ピクチャに特定のコード化ピクチャタイプを割り当てることができ、これは、各々のピクチャに適用され得るコーディング技術に影響を及ぼし得る。例えば、ピクチャは、下記のピクチャタイプのいずれかが割り当てられてもよいことが多い。

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の他のいかなるピクチャを使用せずにコード化及びデコードされ得るものであり得る。いくつかのビデオコーデックは、例えば、インディペンデントデコーダリフレッシュ（ＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈ、「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャの変形及びそれらの各々の用途及び特徴を知っている。

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために最大１つの動きベクトル及び参照インデックスを使用したイントラ予測又はインター予測によりコード化及びデコードされ得るものであり得る。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために最大２つの動きベクトル及び参照インデックスを使用したイントラ予測又はインター予測によりコード化及びデコードされ得るものであり得る。同様に、多重予測ピクチャは、単数のブロックの再構築のために３つ以上の参照ピクチャ及び関連メタデータを使用することができる。

ソースピクチャは、一般的に、複数のサンプルブロック（例えば、それぞれ、４×４、８×８、４×８又は１６×１６サンプルのブロック）に空間的に細分され、ブロックごとにコード化されてもよい。ブロックは、ブロックの各々のピクチャに適用されるコーディング割り当てによって決定された他の（既にコード化された）ブロックを参照して予測的にコード化され得る。例えば、Ｉピクチャのブロックは、非予測的にコード化されてもよく、同一のピクチャの既にコード化されたブロックを参照して予測的にコード化されてもよい（空間的予測又はイントラ予測）。Ｐピクチャの画素ブロックは、１つの予めコード化された参照ピクチャを参照して、空間的予測又は時間的予測を介して予測的にコード化されてもよい。Ｂピクチャのブロックは、１つ又は２つの予めコード化された参照ピクチャを参照して、空間的予測又は時間的予測を介して予測的にコード化されてもよい。

ビデオエンコーダ（３０３）は、ＩＴＵ－Ｔ勧告Ｈ．２６５などの所定のビデオコーディング技術又は規格に従ってコーディング動作を実行することができる。動作中、ビデオエンコーダ（３０３）は、入力ビデオシーケンスの時間的冗長性及び空間的冗長性を利用する予測コーディング動作を含む、様々な圧縮動作を実行することができる。したがって、コード化されたビデオデータは、使用されるビデオコーディング技術又は規格によって指定された構文に従う場合がある。

一実施形態では、送信機（３４０）は、エンコードされたビデオとともに追加のデータを送信してもよい。ソースコーダ（３３０）は、このようなデータをコード化ビデオシーケンスの一部として含み得る。追加のデータは、時間的／空間的／ＳＮＲエンハンスメントレイヤ、冗長ピクチャ及び冗長スライスなどの他の形態の冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含み得る。

ビデオは、時系列で複数のソースピクチャ（ビデオピクチャ）として撮影され得る。イントラピクチャ予測（「イントラ予測」と略されることが多い）は、所定のピクチャにおける空間的相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的又は他の）相関を利用する。一例では、現在ピクチャと呼ばれるエンコーディング／デコーディング中の特定のピクチャは、ブロックに分割される。現在ピクチャにおけるブロックが、ビデオにおける予めコード化され、まだバッファリングされている参照ピクチャにおける参照ブロックに類似している場合、現在ピクチャにおけるブロックは、動きベクトルと呼ばれるベクトルによってコード化することができる。動きベクトルは、参照ピクチャにおける参照ブロックを指し、複数の参照ピクチャが使用されている場合、参照ピクチャを識別する第３次元を有することができる。

いくつかの実施形態では、インターピクチャ予測において双予測技術を使用することができる。双予測技術によれば、ビデオにおける現在ピクチャよりデコーディング順序がそれぞれ前である（ただし、表示順序でそれぞれ過去及び将来にあり得る）第１の参照ピクチャ及び第２の参照ピクチャのような２つの参照ピクチャを使用する。現在ピクチャにおけるブロックは、第１の参照ピクチャにおける第１の参照ブロックを指す第１の動きベクトル、及び第２の参照ピクチャにおける第２の参照ブロックを指す第２の動きベクトルによってコード化することができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせから予測することができる。

更に、マージモード技術をインターピクチャ予測に使用して、コーディング効率を向上させることができる。

本開示のいくつかの実施形態によれば、インターピクチャ予測及びイントラピクチャ予測などの予測は、ポリゴン又は三角形のブロックなどのブロック単位で実行される。例えば、ＨＥＶＣ規格によれば、一連のビデオピクチャのうちのピクチャは、圧縮のためにコーディングツリーユニット（ＣＴＵ）に分割され、ピクチャ内のＣＴＵは、６４×６４画素、３２×３２画素、又は１６×１６画素など、同一のサイズを有する。一般に、ＣＴＵは、１つの輝度ＣＴＢと２つの彩度ＣＴＢである３つのコーディングツリーブロック（ＣＴＢ）を含む。各ＣＴＵは、１つ以上のコーディングユニット（ＣＵ）に再帰的に四分木分割することができる。例えば、６４×６４画素のＣＴＵは、１つの６４×６４画素のＣＵ、又は４つの３２×３２画素のＣＵ、又は１６個の１６×１６画素のＣＵに分割することができる。一例では、各ＣＵを解析して、インター予測タイプ又はイントラ予測タイプなど、ＣＵの予測タイプを決定する。ＣＵは、時間的及び／又は空間的予測可能性に応じて、１つ以上の予測ユニット（ＰＵ）に分割される。一般に、各ＰＵは、１つの輝度予測ブロック（ＰＢ）と２つの彩度ＰＢを含む。一実施形態では、コーディング（エンコーディング／デコーディング）における予測動作は、予測ブロックの単位で実行される。輝度予測ブロックを予測ブロックの例として用いて、予測ブロックは、８×８画素、１６×１６画素、８×１６画素、１６×８画素などの画素の値（例えば、輝度値）の行列を含む。

なお、ビデオエンコーダ（１０３）及び（３０３）とビデオデコーダ（１１０）及び（２１０）とは、任意の適切な技術を用いて実装することができる。一実施形態では、ビデオエンコーダ（１０３）及び（３０３）とビデオデコーダ（１１０）及び（２１０）とは、１つ以上の集積回路を用いて実装することができる。別の実施形態では、ビデオエンコーダ（１０３）及び（３０３）とビデオデコーダ（１１０）及び（２１０）とは、ソフトウェア命令を実行する１つ以上のプロセッサを用いて実装することができる。

本開示は、メッシュ圧縮における頂点位置コーディングの方法及びシステムに関する実施形態を含む。

メッシュは、ボリュームオブジェクトの表面を説明するポリゴンをいくつか含んでもよい。メッシュの各ポリゴンは、３次元（３Ｄ）空間内の対応するポリゴンの頂点と、頂点がどのように接続されるかの情報（接続性情報と呼ぶことができる）によって定義することができる。いくつかの実施形態では、色、法線などの頂点属性をメッシュ頂点に関連付けることができる。２次元（２Ｄ）属性マップ内のメッシュをパラメータ化するマッピング情報を利用することにより、属性（又は頂点属性）をメッシュの表面に関連付けることもできる。このようなマッピングは通常、メッシュ頂点に関連付けられた、ＵＶ座標又はテクスチャ座標と呼ばれるパラメトリック座標のセットによって記述することができる。２Ｄ属性マップは、テクスチャ、法線、変位などの高解像度属性情報を記憶するために使用することができる。このような情報は、テクスチャマッピング及びシェーディングなどの様々な目的に使用することができる。

動的メッシュシーケンスは、動的メッシュが経時的に変化する大量の情報を含む可能性があるため、大量のデータを必要とする可能性がある。したがって、このようなコンテンツを記憶し送信するには、効率的な圧縮技術が必要である。ＩＣ、ＭＥＳＨＧＲＩＤ及びＦＡＭＣなどのメッシュ圧縮規格は、常時接続性、時変ジオメトリ及び頂点属性を有する動的メッシュに対処するようにＭＰＥＧによって以前に開発された。しかしながら、これらの規格では、時変属性マップ及び接続性情報が考慮されていない。通常、ＤＣＣ（デジタルコンテンツ作成）ツールは、このような動的メッシュを生成する。しかしながら、特にリアルタイムの制約の下で常時接続性動的メッシュを生成することは、ボリューム取得技術にとって困難である。このタイプのコンテンツ（例えば、常時接続性動的メッシュ）は、既存の規格にサポートされない可能性がある。ＭＰＥＧは、時変接続性情報及び任意に時変属性マップを有する動的メッシュを直接処理する新しいメッシュ圧縮規格を開発することを計画している。この新しいメッシュ圧縮規格は、リアルタイム通信、ストレージ、自由視点ビデオ、拡張現実（ＡＲ）、仮想現実（ＶＲ）などの様々な用途向けの非可逆圧縮及び可逆圧縮を対象とする。ランダムアクセス及びスケーラブル／プログレッシブコーディングなどの機能性も考慮される。

メッシュジオメトリ情報は、頂点接続性情報、３Ｄ座標、及び２Ｄテクスチャ座標などを含むことができる。頂点位置とも呼ばれる頂点３Ｄ座標の圧縮は、多くの場合、ジオメトリ関連データ全体のかなりの部分を消費することができるため、非常に重要である。

本開示では、簡単かつ明確にするために、一例として三角形メッシュを使用して実施形態を説明する。しかしながら、他のポリゴンメッシュ（例えば、四角形メッシュ又は五角形メッシュ）も本開示の実施形態に適用することができる。一例では、三角形メッシュは、一連の三角形を含むポリゴンメッシュの一種である。一連の三角形は、共通のエッジ又はコーナーによって接続することができる。共通のエッジ又はコーナーは、メッシュ頂点として表すことができる。

頂点位置圧縮は、平行四辺形予測によって実装することができる。平行四辺形予測では、圧縮アルゴリズムにより、予測三角形に含まれる新しい頂点を導入することができる。予測三角形は、隣接する三角形と共有されるエッジに基づいて形成することができる。一例では、隣接する三角形を予めコード化することができる。新しい頂点は、現在頂点の予測位置を示すことができる。新しい頂点は、隣接する三角形に含まれる３つの頂点と共に平行四辺形を形成することができる。例えば、図４Ａに示すように、メッシュ（４００Ａ）は、三角形（４１２）などの複数の三角形を含むことができる。三角形のそれぞれは、３つの頂点を含むことができる。例えば、三角形（４１２）は、頂点（４０６）、（４０８）、及び（４１０）を含むことができる。現在頂点（４０２）をコード化するために、平行四辺形予測に従って、現在頂点（４０２）の予測頂点（又は予測）（４０４）を予測三角形（４１４）に基づいて生成することができる。予測頂点（４０４）は、予測三角形（４１４）に含まれる。予測三角形（４１４）は、三角形（４１２）とエッジ（４１６）を共有することができる。頂点（４０６）、（４０８）、（４１０）及び予測頂点（４０４）は、平行四辺形を形成することができる。更に、現在頂点（４０２）は、メッシュ（４００Ａ）の三角形（４１８）に含まれ、三角形（４１８）と三角形（４１２）はエッジ（４１６）を共有する。

現在頂点を予測するために、複数の平行四辺形予測を適用することができる。複数の平行四辺形予測では、例えば、２つ以上の平行四辺形予測が利用可能な場合いつでも、それらによって得られる平均位置を使用することができる。図４Ｂは、２つの平行四辺形予測の例を示す。図４Ｂに示すように、現在頂点（４２０）は、メッシュ（４００Ｂ）の第１の三角形（４３４）に含まれる。第１の三角形（４３４）は、頂点（（４２０）、（４３８）、（４４２））を含むことがきる。第１の三角形（４３４）は、メッシュ（４００Ｂ）の隣接する三角形（４２８）とエッジ（４４４）を共有することができる。現在頂点（４２０）は、頂点（４２０）、（４３８）、及び（４４０）を含む第２の三角形（４３６）に含まれる。第２の三角形（４３６）は、メッシュ（４００Ｂ）の隣接する三角形（４２６）とエッジ（４４６）を共有することができる。共有エッジ（４４４）に基づいて、第１の予測頂点（又は第１の予測）（４２４）を決定することができる。第１の予測頂点（４２４）は、隣接する三角形（４２８）と第１の平行四辺形を形成することができる。共有エッジ（４４６）に基づいて、第２の予測頂点（又は第２の予測）（４２２）を決定することができる。第２の予測頂点（４２２）は、隣接する三角形（４２６）と第２の平行四辺形を形成することができる。したがって、現在頂点（４２０）は更に、第１の予測頂点（４２４）と第２の予測頂点（４２２）の平均によって予測することができる。

本開示では、メッシュ圧縮のための頂点位置コーディングの方法及び／又はシステムが提供される。一実施形態では、平行四辺形予測に基づいて、現在頂点の予測位置値（又は予測又は予測頂点）を複数の候補位置値（又は候補予測又は候補予測頂点）から選択することができる。選択された予測頂点は、インデックスによってコード化（又は識別）することができる。選択された予測頂点と現在頂点との予測残差を更にコード化することができる。

本開示では、メッシュ圧縮における頂点位置予測のために、多くの方法及び／又はシステムを提案することができる。なお、これらの方法及び／又はシステムは、個別に又は任意の組み合わせで適用することができる。なお、こられの方法は、動的メッシュだけでなく、静的メッシュに適用することができる。静的メッシュは、１つのフレームのみを含んでもよく、静的メッシュのメッシュコンテンツは、経時的に変化しなくてもよい。更に、開示された方法及び／又はシステムは、頂点位置予測に限定されない。開示された方法及び／又はシステムは、例えば、２Ｄテクスチャ座標予測、又はより一般的な多重予測ベースのスキームにも適用することができる。

三角形メッシュ（又はメッシュ）内の三角形を順序付けすることができる。メッシュ内の三角形の順序は、エッジブレイカーアルゴリズム又は他の分割アルゴリズムに従ってトラバースすることができる。更に、一例では、メッシュ内の頂点を三角形の順序に基づいて順序付けすることもできる。一例では、三角形及び頂点の順序又はトラバース順序は、同じスキーム又は異なるスキームに基づいて決定することができる。

図５Ａ及び５Ｂは、エッジブレイカーアルゴリズムに基づく、メッシュ内の三角形と頂点の例示的な順序付けを示す。図５Ａは、エッジブレイカーアルゴリズムの５つの例示的なパッチ構成を示す。図５Ａに示すように、ｖは、パッチの中心頂点、Ｔは現在三角形である。各パッチ内のアクティブゲート（又は現在三角形）は、Ｔとして表すことができる。パッチＣでは、ｖを中心に扇形に広がる（又は回転する）完全な三角形を提供することができる。パッチＬでは、１つ以上の欠落している三角形がアクティブゲートＴの左側に配置することができる。パッチＲでは、１つ以上の欠落している三角形がアクティブゲートＴの右側に配置することができる。パッチＥでは、ｖはＴのみに隣接する。パッチＳでは、１つ以上の欠落している三角形がアクティブゲートＴの左側又は右側以外の位置に配置することができる。図５Ｂは、エッジブレイカーアルゴリズムのトラバーサルに基づいてメッシュ（５００）の三角形を順序付けすることができるメッシュ（５００）の例示的なトラバーサルを示す。図５Ｂに示すように、メッシュ（５００）内の三角形は、螺旋状の三角形スパニングツリーに沿ってトラバースすることができる。例えば、トラバーサルは、Ｃタイプ（又はＣパッチ）の三角形（５０２）から開始することができる。そして、トラバーサルは、三角形（例えば、（５０２））の右エッジに隣接する分岐に沿って進むことができる。トラバーサルは、Ｅタイプの三角形（例えば、（５０４））に到達すると停止することができる。エッジブレイカーアルゴリズムによれば、メッシュ（５００）の三角形は、ＣＲＳＲＬＥＣＲＲＲＬＥのシーケンスでトラバース（又は順序付け）することができ、これは、図５Ｂに示すことができる。メッシュ（５００）の三角形のそれぞれの頂点は、三角形の順序に基づいて順序付けすることもできる。

三角形メッシュでは、各三角形（面とも呼ばれる）は、３つの頂点を有する。エッジを共有する２つの三角形に対して、平行四辺形予測は、２つの三角形の対向する２つの頂点のうちの一方を他方の予測子として使用するために適用することができる。図６に示すように、２つの三角形ＡＢＣと三角形ＤＢＣは、エッジＢＣを共有することができる。すでにコード化された頂点Ａ、Ｂ及びＣの座標は、Ｄの座標を予測するために適用することができる。例えば、予測頂点（又は予測）Ｄ’は、平行四辺形予測に基づいて決定することができる。予測頂点Ｄ’の座標は、式（１）で以下のとおり決定することができる。

このようにして、４つの頂点（Ｄ’、Ｂ、Ａ、Ｃ）は、図６に示すように、平行四辺形を形成することができる。各頂点には３Ｄ座標があるため、式（１）は、予測頂点Ｄ’の各座標成分を計算するために使用することができる。例えば、下付き文字ｘ、ｙ、ｚがｘｙｚ空間内の３Ｄ座標を表すと仮定すると、ｘｙｚ空間内の予測頂点Ｄ’の座標成分は、式（２）～（４）で提供することができる。

頂点Ａ、Ｂ及びＣの位置値がコード化されて予測のために使用することができれば、三角形ＡＢＣは、頂点Ｄの予測候補（又は予測三角形）として表すことができる。既存のコード化された頂点と共有エッジの数に応じて、頂点は、０、１つ、２つ、又はそれ以上の予測候補を有し得る。現在頂点に対して複数の予測候補があれば、メッシュの三角形の順序に基づいて予測候補を順序付けすることができる。例えば、三角形は、エッジブレイカーアルゴリズムなどに基づいて順序付けすることができる。

本開示では、現在頂点の複数の予測（又は平行四辺形予測）を決定することができる。複数の平行四辺形予測の平均（又は平均予測）を更に決定することができる。現在頂点の予測（又は予測頂点）を予測リストから選択することができる。予測リストの予測子（又は候補予測子）は、例えば、利用可能な平行四辺形予測及び複数の平行四辺形予測の平均を含むことができる。関連付けられた予測誤差（予測残差とも呼ばれる）は、コード化することができる。予測誤差（又は予測残差）は、予測と現在頂点との差を示すことができる。一実施形態では、予測は、現在頂点と予測リストにおける予測子（又は候補予測子）のそれぞれとの最小予測誤差に対応することができる。一実施形態では、予測リストにおける予測子（又は候補予測子）の数が閾値以上であることに基づいて、予測を予測リストにおいて事前に定義することができる。したがって、予測リストにおける予測子（又は候補予測子）の数が閾値以上であることに従って、予測リストにおける特定の（又は所定の）予測子を現在頂点の予測として選択することができる。

本開示では、三角形メッシュ内の全ての三角形を順序付けすることができる。例えば、エッジブレイカーアルゴリズムに基づいて三角形を順序付けすることができる。また、三角形メッシュ内の全て又は部分の頂点を順序付けすることもできる。一例では、三角形の順序に基づいて頂点を順序付けすることができる。

三角形メッシュ内の頂点Ｖが与えられ、該頂点ＶはＮ個の予測候補（又は予測三角形）を含む。Ｎ個の予測候補は、Ｎ個の予測値Ｖ_１’、Ｖ_２’…Ｖ_Ｎ’を生成することができる。例えば、図４Ｂに示すように、現在頂点（４２０）は、２つの予測三角形（４３０）及び（４３２）を有することができる。予測三角形（４３０）及び（４３２）のそれぞれは、各々の予測値（又は予測頂点）、例えば（４２２）及び（４２４）をそれぞれ生成することができる。現在頂点の予測値は、メッシュ内の対応する予測三角形の順序に基づいて順序付けすることができる。予測値に重複が決定されれば、そのような重複を予測値のリストから削除することができる。

一例では、Ｎ＝０であれば、頂点Ｖに利用可能な予測候補は存在しない。Ｖがメッシュ内でコード化すべき第１の頂点であれば、第１の頂点の予測値Ｖ’を０に設定し、予測残差ＲをＶに設定することができる。したがって、Ｖ’＝０、Ｒ＝Ｖとなる。Ｖがコード化すべき第１の頂点ではなければ、Ｖの予測値Ｖ’を、頂点順序で予めコード化された頂点のコード化値に設定することができる。したがって、予めコード化された頂点は、頂点Ｖの予測子になり得る。予測残差Ｒは、頂点Ｖと予測値（又は予測頂点）Ｖ’との差、即ちＲ＝Ｖ－Ｖ’として決定することができる。

一例では、Ｎ＝１であれば、頂点Ｖに利用可能な予測候補は、１つだけである。したがって、予測値Ｖ’は、唯一の予測候補に基づいて決定することができ、予測残差Ｒは、ＶとＶ’との差、即ちＲ＝Ｖ－Ｖ’として決定することができる。

一例では、Ｎ≧２であれば、頂点Ｖに利用可能な予測候補が複数ある。したがって、複数の予測値（又は予測頂点）は、複数の予測候補に基づいて決定することができる。一実施形態では、予測値の平均を追加の予測子Ｖ_０’とみなすことができる。Ｖ_０’は、式（５）で決定することができる。

平均予測値Ｖ_０’が予測値Ｖ_１’、Ｖ_２’…Ｖ_Ｎ’のいずれかに等しければ、平均予測値Ｖ_０’又は重複した予測値のいずれかを削除することができる。

一実施形態では、エンコーダ側で、Ｖ_ｉ’をＶと比較することができ、０≦ｉ≦Ｎである。予測インデックスｊを選択することができる。選択された予測インデックスｊは、Ｖと予測値Ｖ_ｉ’のそれぞれとの最小予測残差に対応するＶ_ｉ’の中から選択された予測値を示す。いくつかの実施形態では、最小化誤差（又は最小予測残差）は、Ｌ^０ノルム、Ｌ^１ノルム、Ｌ^２ノルム、又はいくつかの他のノルムによって測定することができる。例えば、Ｌ^０ノルムは、式（６）で以下のとおり決定することができる。

ここで、Ｖ_ｘ、Ｖ_ｙ、Ｖ_ｚは、ｘｙｚ空間内のＶの座標で、Ｖ_０ｘ’、Ｖ_０ｙ’、Ｖ_０ｚ’は、ｘｙｚ空間内のＶ_０’の座標である。

デコーダ側では、選択されたインデックス（例えば、予測インデックス）をデコードすることができ、選択された予測子（又は予測値）を予測子（又は候補予測子）のリストから復元することができる。例えば、デコーダは、平行四辺形予測などの予測モードに基づいて、現在頂点の１つ以上の予測値を決定することができる。また、複数の予測値の平均を予測子として考慮することができる。予測リストを形成するために、平均予測値及び１つ以上の予測値を順序付けすることができる。一例では、デコーダ側で生成された予測リストは、エンコーダ側で生成された予測リストと同じであり得る。デコードされた予測インデックスに基づいて、選択された予測子は、予測リストからの予測インデックスに基づいて復元することができる。

一実施形態では、エンコーダ側で、Ｎがいくつかの特定の値に等しければ（例えば、２≦Ｎ≦５）、固定予測インデックス（例えば、インデックス０、１…Ｎのいずれか）を予測リストで選択することができる。固定予測インデックスは、現在頂点の所定の予測子（又は予測頂点）を示す。したがって、予測インデックスは、コード化されなくてもよい。デコーダ側では、デコーダがまず予測リストを構築することができる。そして、デコーダは、固定予測インデックスに基づいて予測子を復元（又は決定）することができる。一例では、Ｎ＞２であれば、予測インデックス０を選択することができ、これは、複数の予測の平均を示すことができる。一例では、Ｎ＞２であれば、予測インデックスは、コード化されなくてもよい。

一実施形態では、エンコーダ側で、Ｎが特定の値（又は閾値）以上であれば、固定予測インデックスを選択又は決定することができる。一例では、特定の値（又は閾値）は、２であり得る。一例では、閾値（又は特定の値）は、２～１０であリ得る。したがって、予測リストにおける全ての予測インデックスは、コード化されなくてもよい。デコーダ側では、デコーダは、Ｎの数に基づいて予測インデックスを復元（又は決定）することができる。例えば、Ｎ＝２の場合、予測インデックス１を選択することができる。Ｎ＞２の場合、予測インデックス０を選択することができる。別の例では、ｎ≧２の場合、予測インデックス０を選択することができる。

一実施形態では、上限Ｍを設定することができる。上限Ｍは、予測リストにおいて考慮（又は適用）できる予測候補の数を示すことができる。ある場合に、Ｎ＞Ｍであれば、メッシュ内の各頂点に対して、最初のＭ個の予測候補のみが考慮される。したがって、最初のＭ個の予測候補Ｖ_１’、Ｖ_２’…Ｖ_Ｍ’に関連付けられた予測値が適用される。一実施形態では、最初のＭ個の予測値の平均は、式（７）で決定することができる。

Ｍは、４などの整数であり得る。したがって、最大でＭ個（例えば４個）の予測候補を考慮することができる。なお、平均予測Ｖ_０’は、候補リストにおいて異なる位置に置くことができる。一例では、平均予測Ｖ_０’は、予測候補リストにおける最初の予測子であり得る。一例では、平均予測Ｖ_０’は、予測候補リストにおける最後の予測子であり得る。一例では、平均予測Ｖ_０’は、予測値Ｖ_１’、Ｖ_２’…Ｖ_Ｍ’に配置することができる。

頂点ＶがＮ個の予測候補Ｖ_１’、Ｖ_２’…Ｖ_Ｎ’及び平均Ｖ_０’を有する場合、選択された予測インデックスは、コード化されてもよい。

いくつかの実施形態では、予測インデックスは、複数の予測候補が存在する場合にのみコード化される必要がある。例えば、現在頂点に利用可能な予測候補が２つ以上である場合、選択された予測候補を示すインデックスは、エンコーダ側でコード化することができる。デコーダ側では、デコーダは、エンコーダと同じ順序で２つ以上の予測候補を決定することができる。デコーダは、コード化された予測インデックスをデコードし、２つ以上の予測候補からの予測インデックスに基づいて、選択された予測候補を再構築することができる。

一実施形態では、予測候補が決定されなければ、あるいは、１つのみの予測候補が決定されれば、予測インデックスは、コード化される必要がない。したがって、予測値は、現在頂点それ自体であってもよく、唯一の予測候補であってもよい。一実施形態では、予測インデックスは、利用可能な予測子候補の数に関係なく、常にコード化することができる。利用可能な予測子がない場合、シグナリングされたインデックスの値は、デコーダ側でのデコーディングプロセスに影響を及ぼさない場合がある。

いくつかの実施形態では、Ｎのいくつかの特定の値に対して固定予測インデックスが常に選択されるか又は予め定められる場合、予測インデックスは、コード化される必要がない場合がある。したがって、候補リストにおける予測子（又は候補予測子）の予測インデックスは、コード化される必要がない場合があり、候補リストから選択された予測インデックスは、デコーダにシグナリングされなくてもよい。

いくつかの実施形態では、予測インデックスは、固定ではなくてもよく、予測候補から選択することができる。現在頂点に対して複数の予測候補が決定される場合、予測インデックスは、例えば、固定長コーディングを使用してコード化することができる。例えば、現在頂点に対して３つの予測候補が決定されれば、０、１、２及び３（０は、候補１、２及び３の平均値を示す）の４つの可能な予測インデックスが必要であり得る。したがって、４つの予測インデックスのそれぞれを表すために、２桁の２進数を適用することができる。なお、三角形メッシュの異なる頂点は、異なる固定長を使用してもよい。例えば、別の頂点が７つの予測候補を有すれば、他の頂点は、予測インデックスを表すために３桁の２進数を使用することができる。固定長コーディングの出力は、算術コーディングなどのエントロピーコーディングにより更に圧縮することができる。

あるいは、予測インデックスは、可変長コーディングを使用してコード化することができる。例えば、現在頂点に対して４つの予測候補が決定されれば、０、１、２、３及び４の５つの可能な予測インデックスが必要であり得る。０、１、２、３及び４の５つの予測インデックスをそれぞれ表すために、０、１００、１０１、１１０及び１１１の可変長コードを割り当てることができる。あるいは、０、１、２、３及び４の５つの予測インデックスをそれぞれ表すために、１、０１、００１、０００１及び００００１の可変長コードを適用することができる。なお、三角形メッシュの異なる頂点は、異なる可変長を使用してもよい。可変長コーディングの出力は、算術コーディングなどのエントロピーコーディングにより更に圧縮することができる。

あるいは、予測インデックスは、差分コード化することができ、現在頂点の予測インデックスは、予めコード化された予測インデックスから予測することができ、予測インデックスに関連付けられた予測誤差もコード化することができる。例えば、予測子の第１の予測インデックスと予測子の第２の予測インデックスとの差は、最初にコード化することができる。第２の予測インデックスは更に、第１の予測インデックスと第２の予測インデックスとの差に基づいてコード化することができる。

予測候補の最大数を限定するために上限Ｍが設定される場合、頂点Ｖに利用可能な予測候補がＭ個を超えれば、最初のＭ個の予測候補のみが頂点Ｖの予測に使用されてもよい。したがって、（Ｍ＋１）個の可能な予測インデックスは、コード化することができ、Ｍは、最初のＭ個の予測候補を示し、１は、最初のＭ個の予測候補の平均を示す。予測値に重複が決定されれば、重複を削除することができる。したがって、予測インデックスの可能性も低減することができる。固定予測インデックスが常に選択されれば、予測インデックスは、コード化されなくてもよい。予測インデックスが固定ではなく、複数の予測候補の中から選択されれば、予測インデックスは、コード化することができる。予測インデックスは、固定長コーディング、可変長コーディング、差分コーディングなどによりコード化することができる。

一実施形態では、位置値（又は予測値）の予測残差Ｒは、コード化（又は決定）することができる。予測残差Ｒは、現在頂点の予測値と現在頂点との差を示すことができる。予測残差Ｒは、固定長コーディング、指数ゴロムコーディング、算術コーディングなどによりコード化することができる。したがって、デコーダは、予測値及び予測残差に基づいて現在頂点を再構築することができ、予測値は、予測リストからのデコードされた予測インデックスに基づいて決定することができる。

図７は、本開示の一実施形態に係るプロセス（７００）の概要を示すフローチャートである。プロセス（７００）をビデオエンコーダなどのエンコーダで使用することができる。様々な実施形態では、プロセス（７００）は、ビデオエンコーダ（１０３）の機能を実行する処理回路、ビデオエンコーダ（３０３）の機能を実行する処理回路などの処理回路によって実行される。いくつかの実施形態では、プロセス（７００）がソフトウェア命令で実装されるため、処理回路は、ソフトウェア命令を実行するとき、プロセス（７００）を実行する。プロセスは、（Ｓ７０１）から開始し、（Ｓ７１０）に進む。

ステップ（Ｓ７１０）では、現在頂点の複数の候補予測を決定する。現在頂点がメッシュの複数の頂点に含まれる。複数の候補予測が複数の三角形に基づいて決定される。複数の三角形のそれぞれが各候補予測に対応する。

ステップ（Ｓ７２０）では、複数の候補予測から現在頂点の予測を決定する。予測が、現在頂点の複数の候補予測の数が閾値以上であることに基づいて予め定められた予測インデックスによって識別される。

ステップ（Ｓ７３０）では、決定された予測に基づいて、現在頂点の予測情報をエンコードする。予測情報が現在頂点の予測を識別する予測インデックスを含む。

いくつかの実施形態では、閾値は、２以上５以下である。

一例では、現在頂点の複数の候補予測を決定するために、現在頂点に対して複数の三角形のうちの第１の三角形を決定し、第１の三角形が複数の三角形のうちの第２の三角形と共有エッジを有する。現在頂点が第２の三角形に含まれ、かつ共有エッジの反対側にある。第１の候補予測と第１の三角形が第１の平行四辺形を形成する平行四辺形予測によって、決定された第１の三角形に基づいて、複数の候補予測のうちの第１の候補予測を決定する。

一例では、現在頂点の複数の候補予測を決定するために、複数の候補予測の平均予測を決定する。

一例では、現在頂点の予測を決定するために、現在頂点の予測リストを決定する。予測リストにおける候補予測子が予測リストにおける平均予測及び平均予測に続く複数の候補予測を含む。予測リストにおける複数の候補予測の順序は、複数の候補予測に対応する複数の三角形の順序に基づくものである。予測リストにおける候補予測子のそれぞれが各予測インデックスに関連付けられる。

いくつかの実施形態では、複数の三角形は、螺旋状の三角形スパニングツリー順序でラベル付けされるエッジブレイカーアルゴリズムに基づいて順序付けされる。

一例では、現在頂点の複数の候補予測の数が閾値に等しいことに応答して、予測インデックスが第１の予測インデックスとして予め定められることに基づいて、予め定められた予測インデックスに従って、現在頂点の予測を予測リストにおける候補予測子の第１の候補予測子として決定する。一例では、現在頂点の複数の候補予測の数が閾値よりも大きいことに応答して、予測インデックスが第２の予測インデックスとして予め定められることに基づいて、予め定められた予測インデックスに従って、現在頂点の予測を予測リストにおける候補予測子の第２の候補予測子として決定する。一例では、現在頂点の複数の候補予測の数が閾値以上であることに応答して、予測インデックスが第３の予測インデックスとして予め定められることに基づいて、予め定められた予測インデックスに従って、現在頂点の予測を予測リストにおける候補予測子の第３の候補予測子として決定する。

一例では、現在頂点の予測を決定するために、予測リストにおける候補予測子のそれぞれと現在頂点との予測差を決定する。予測リストにおける候補予測子から予測差のうちの最小予測差に対応する予測を更に決定する。

一例では、現在頂点の予測を決定するために、予測リストの候補予測子のサブセット内の最小予測差を有する予測を決定する。

いくつかの実施形態では、固定長コーディング、可変長コーディング、及び差分コーディングのうちの１つに基づいて、予測リストにおける候補予測子のそれぞれに対して各予測インデックスを決定する。

次に、プロセスは、（Ｓ７９９）に進み、終了する。

プロセス（７００）は、適切に適合することができる。プロセス（７００）のステップは、変更及び／又は省略することができる。追加ステップを追加することができる。任意の適切な実装順序を使用することができる。

図８は、本開示の一実施形態に係るプロセス（８００）の概要を示すフローチャートである。プロセス（８００）をビデオデコーダなどのデコーダで使用することができる。様々な実施形態では、プロセス（８００）は、ビデオデコーダ（１１０）の機能を実行する処理回路、ビデオデコーダ（２１０）の機能を実行する処理回路などの処理回路によって実行される。いくつかの実施形態では、プロセス（８００）がソフトウェア命令で実装されるため、処理回路は、ソフトウェア命令を実行するとき、プロセス（８００）を実行する。プロセスは、（Ｓ８０１）から開始し、（Ｓ８１０）に進む。

ステップ（Ｓ８１０）では、複数の三角形及び複数の頂点を含むメッシュのコーディング情報を受信する。

ステップ（Ｓ８２０）では、現在頂点の複数の候補予測を決定する。現在頂点がメッシュの複数の頂点に含まれる。複数の候補予測が複数の三角形に基づいて決定され、複数の三角形のそれぞれが各候補予測に対応する。

ステップ（Ｓ８３０）では、複数の候補予測から現在頂点の予測を決定する。予測が、現在頂点の複数の候補予測の数が閾値以上であることに基づいて決定された所定の予測インデックスによって示される。

ステップ（Ｓ８４０）では、決定された予測に基づいて現在頂点を再構築する。

次に、プロセスは、（Ｓ８９９）に進み、終了する。

プロセス（８００）は、適切に適合することができる。プロセス（８００）のステップは、変更及び／又は省略することができる。追加ステップを追加することができる。任意の適切な実装順序を使用することができる。

以上で説明された技術は、コンピュータ可読命令を使用するコンピュータソフトウェアとして実装され、非一時的なコンピュータ可読記憶媒体などの１つ以上のコンピュータ可読媒体に物理的に記憶することができる。例えば、図９は、開示された主題の特定の実施形態を実装することに適したコンピュータシステム（９００）を示す。

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、又はそのようなメカニズムを施されて、１つ以上のコンピュータ中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）などの処理回路によって直接、又は解釈、マイクロコード実行などによって実行することができる命令を含むコードを作成する任意の適切な機械コード又はコンピュータ言語を用いてコード化することができる。

命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータ又はその構成要素上で実行することができる。

コンピュータシステム（９００）について、図９に示される構成要素は、本質的に例示的なものであり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能範囲に関する限定を示唆することを意図するものではない。構成要素の構成は、コンピュータシステム（９００）の例示的な実施形態で示される構成要素のうちのいずれか１つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。

コンピュータシステム（９００）は、特定のヒューマンインタフェース入力デバイスを含んでもよい。このようなヒューマンインタフェース入力デバイスは、例えば触覚入力（キーストローク、スワイプ、データグローブの動きなど）、オーディオ入力（音声、拍手など）、視覚入力（ジェスチャーなど）、嗅覚入力（図示せず）を通じて、１人以上の人間ユーザによる入力に応答することができる。ヒューマンインタフェースデバイスは、オーディオ（スピーチ、音楽、周囲音など）、画像（スキャンされた画像、静止画像カメラから取得した写真画像など）、ビデオ（２次元ビデオ、立体ビデオを含む３次元ビデオなど）などの、人間による意識的な入力に必ずしも直接的に関連しない特定のメディアを取り込むために使用することもできる。

入力ヒューマンインタフェースデバイスは、キーボード（９０１）、マウス（９０２）、トラックパッド（９０３）、タッチスクリーン（９１０）、データグローブ（図示せず）、ジョイスティック（９０５）、マイクフォン（９０６）、スキャナ（９０７）及びカメラ（９０８）（それぞれが１つのみ示される）のうちの１つ以上を含んでもよい。

コンピュータシステム（９００）は特定のヒューマンインタフェース出力デバイスをさらに含んでもよい。このようなヒューマンインタフェース出力デバイスは、例えば触覚出力、音、光、及び匂い／味を通じて、１人以上の人間ユーザの感覚を刺激することができる。このようなヒューマンインタフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（９１０）、データグローブ（図示せず）、又はジョイスティック（９０５）による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい）、オーディオ出力デバイス（スピーカ（９０９）、ヘッドホン（図示せず）など）、視覚出力デバイス（それぞれがタッチスクリーン入力能力、触覚フィードバック能力の有無にかかわらず、一部が、ステレオグラフィック出力、仮想現実眼鏡（図示せず）、ホログラフィックディスプレ及びスモークタンク（図示せず）などの手段を介して、２次元の視覚出力又は３次元以上の出力を出力できる、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（９１０）など）、及びプリンタ（図示せず）を含んでもよい。

コンピュータシステム（９００）は、ヒューマンアクセス可能な記憶装置と、それらに関連する媒体、例えば、ＣＤ／ＤＶＤを有するＣＤ／ＤＶＤＲＯＭ／ＲＷ（９２０）若しくは同様な媒体（９２１）、サムドライブ（９２２）、及びリムーバブルハードドライブ若しくはソリッドステートドライブ（９２３）を含む光媒体、テープ及びフロッピーディスク（図示せず）などのレガシー磁気媒体、セキュリティドングル（図示せず）などの専用ＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイスなどとをさらに含んでもよい。

当業者は本明細書に開示された主題に関連して使用される「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、又は他の一時的な信号を含まないことをさらに理解すべきである。

コンピュータシステム（９００）は１つ以上の通信ネットワーク（９５５）へのインタフェース（９５４）をさらに含んでもよい。ネットワークは、例えば、無線、有線、光ネットワークであり得る。ネットワークは更に、ローカル、ワイドエリア、メトロポリタン、車両用及び産業用、リアルタイム、遅延耐性ネットワークなどであり得る。ネットワークの例は、イーサネット及び無線ＬＡＮなどのローカルエリアネットワークと、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワークと、ケーブルＴＶ、衛星ＴＶ及び地上波放送ＴＶを含むＴＶ有線又は無線ワイドエリアデジタルネットワークと、ＣＡＮバスなどを含む車両用及び産業用ネットワークと、を含む。特定のネットワークは、一般的に、特定の汎用データポート又は周辺バス（９４９）（例えば、コンピュータシステム（９００）のＵＳＢポートなど）に接続された外部ネットワークインタフェースアダプターを必要とする。他のネットワークは一般的に、以下で説明するようにシステムバスに接続することにより、コンピュータシステム（９００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインタフェース又はスマートフォンコンピュータシステムへのセルラーネットワークインタフェース）。これらのネットワークのいずれかを使用して、コンピュータシステム（９００）は、他のエンティティと通信することができる。このような通信は、例えば、ローカル又はワイドエリアデジタルネットワークを使用して、他のコンピュータシステムに対して、単方向の受信のみ（例えば、放送ＴＶ）、単方向の送信のみ（例えば、ＣＡＮバスから特定のＣＡＮバスデバイスへ）、又は双方向であってもよい。上記のように、特定のプロトコルとプロトコルスタックをこれらのネットワークとネットワークインタフェースのそれぞれに使用することができる。

前述のヒューマンインタフェースデバイス、ヒューマンアクセス可能な記憶装置、及びネットワークインタフェースは、コンピュータシステム（９００）のコア（９４０）に接続することができる。

コア（９４０）は、１つ以上の中央処理装置（ＣＰＵ）（９４１）、グラフィックス処理装置（ＧＰＵ）（９４２）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）（９４３）の形態の専用プログラマブル処理装置、特定のタスクのためのハードウェアアクセラレータ（９４４）、及びグラフィックアダプター（９５０）などを含むことができる。これらのデバイスは、リードオンリメモリ（ＲＯＭ）（９４５）、ランダムアクセスメモリ（９４６）、及びユーザがアクセスできない内部ハードドライブ、ＳＳＤなどの内部大容量記憶装置（９４７）と共に、システムバス（９４８）を介して接続されてもよい。いくつかのコンピュータシステムでは、システムバス（９４８）は、１つ以上の物理プラグの形態でアクセス可能であり、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にする。周辺デバイスは、コアのシステムバス（９４８）に直接的に接続されてもよく、周辺バス（９４９）を介して接続されてもよい。一例では、画面（９１０）は、グラフィックアダプター（９５０）に接続することができる。周辺バスのアーキテクチャには、ＰＣＩ、ＵＳＢなどを含む。

ＣＰＵ（９４１）、ＧＰＵ（９４２）、ＦＰＧＡ（９４３）及びアクセラレータ（９４４）は、組み合わせて、前述のコンピュータコードを構成できる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（９４５）又はＲＡＭ（９４６）に記憶することができる。過渡的なデータは、ＲＡＭ（９４６）に記憶することもできるが、恒久的なデータは、例えば内部大容量記憶装置（９４７）に記憶することができる。ＣＰＵ（９４１）、ＧＰＵ（９４２）、大容量記憶装置（９４７）、ＲＯＭ（９４５）、ＲＡＭ（９４６）などのうちの１つ以上と密接に関連付けることができるキャッシュメモリを使用して、任意のメモリデバイスに対する高速記憶及び検索を可能にすることができる。

コンピュータ可読媒体には、様々なコンピュータ実装動作を実行するためのコンピュータコードを有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構築されたものであってもよく、コンピュータソフトウェア分野の当業者によく知られている利用可能な種類のものであってもよい。

限定ではなく、あくまでも一例として、アーキテクチャ（９００）、具体的にはコア（９４０）を有するコンピュータシステムは、プロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）が１つ以上の有形のコンピュータ可読媒体に具体化されたソフトウェアを実行した結果として機能を提供することができる。このようなコンピュータ可読媒体は、コア内部大容量記憶装置（９４７）又はＲＯＭ（９４５）などの、非一時的な性質のコア（９４０）の特定の記憶装置以外に、以上に紹介したようにユーザがアクセス可能な大容量記憶装置に関連付けられる媒体であり得る。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶でき、コア（９４０）によって実行することができる。コンピュータ可読媒体は、特定の需要に応じて、１つ以上のメモリデバイス又はチップを含むことができる。ソフトウェアは、コア（９４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ（９４６）に記憶されたデータ構造を定義するステップと、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更するステップとを含む、本明細書に記載の特定のプロセス又は特定のプロセスの特定の部分を実行させることができる。加えて又は代替として、コンピュータシステムは、本明細書に記載の特定のプロセス又は特定のプロセスの特定の部分を実行するためにソフトウェアの代わりに又はソフトウェアと共に動作することができる回路（例えば、アクセラレータ（９４４））に配線されるか又は他の方法で具体化されたロジックの結果として機能を提供することができる。ソフトウェアへの参照は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ可読媒体への参照は、必要に応じて、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のためのロジックを具体化する回路、又はその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。

本開示は、一部の例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、及び様々な代替の均等物が存在する。したがって、当業者は、本明細書に明示的に示されていないか又は記載されていないが、本開示の原理を具体化するため、その精神及び範囲内にある多数のシステム及び方法を発明することができることが理解されたい。

Claims

ビデオエンコーダが実行するメッシュ処理のための方法であって、
現在頂点の複数の候補予測を決定するステップであって、前記現在頂点がメッシュの複数の頂点に含まれ、複数の前記候補予測が前記メッシュ内の複数の三角形に基づいて決定され、複数の前記三角形のそれぞれが各候補予測に対応する、ステップと、
複数の前記候補予測から前記現在頂点の予測を決定するステップであって、前記予測が、前記現在頂点の複数の候補予測の数が閾値以上であることに基づいて予め定められた予測インデックスによって識別される、ステップと、
決定された前記予測に基づいて前記現在頂点の予測情報をエンコーディングするステップであって、前記予測情報が前記現在頂点の予測を識別する予測インデックスを含む、ステップと、を含む、方法。
前記閾値は、２以上５以下である、請求項１に記載の方法。
前記現在頂点の複数の候補予測を決定するステップは、
前記現在頂点に対して複数の前記三角形のうちの第１の三角形を決定するステップであって、前記第１の三角形が複数の前記三角形のうちの第２の三角形と共有エッジを有し、前記現在頂点が前記第２の三角形に含まれ、かつ前記共有エッジの反対側にある、ステップと、
複数の前記候補予測のうちの第１の候補予測と前記第１の三角形が第１の平行四辺形を形成する平行四辺形予測によって、決定された前記第１の三角形に基づいて、前記第１の候補予測を決定するステップと、を更に含む、請求項１に記載の方法。
前記現在頂点の複数の候補予測を決定するステップは、
複数の前記候補予測の平均予測を決定するステップを更に含む、請求項３に記載の方法。
前記現在頂点の予測を決定するステップは、
前記現在頂点の予測リストを決定するステップであって、前記予測リストにおける候補予測子が前記予測リストにおける平均予測及び前記平均予測に続く複数の前記候補予測を含み、前記予測リストにおける複数の前記候補予測の順序が、複数の前記候補予測に対応する複数の前記三角形の順序に基づくものであり、前記予測リストにおける前記候補予測子のそれぞれが各予測インデックスに関連付けられる、ステップを更に含む、請求項４に記載の方法。
複数の前記三角形は、螺旋状の三角形スパニングツリー順序でラベル付けされるエッジブレイカーアルゴリズムに基づいて順序付けされる、請求項５に記載の方法。
前記現在頂点の予測を決定するステップは、
前記現在頂点の複数の前記候補予測の数が前記閾値に等しいことに応答して、前記予測インデックスが第１の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第１の候補予測子として決定するステップと、
前記現在頂点の複数の前記候補予測の数が前記閾値よりも大きいことに応答して、前記予測インデックスが第２の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第２の候補予測子として決定するステップと、
含む、請求項５に記載の方法。
前記現在頂点の予測を決定するステップは、
前記予測リストにおける候補予測子のそれぞれと前記現在頂点との予測差を決定するステップと、
前記予測リストにおける候補予測子から前記予測差のうちの最小予測差に対応する前記予測を決定するステップと、を更に含む、請求項５に記載の方法。
前記現在頂点の予測を決定するステップは、
前記予測リストの候補予測子のサブセット内の最小予測差を有する予測を決定するステップを更に含む、請求項５に記載の方法。
各予測インデックスを決定するステップは、
固定長コーディング、可変長コーディング、及び差分コーディングのうちの１つに基づいて、前記予測リストにおける候補予測子のそれぞれに対して各予測インデックスを決定するステップを更に含む、請求項５に記載の方法。
前記現在頂点の予測情報は、前記現在頂点と決定された前記予測との差を示す残差情報を含み、
前記方法は、
前記残差情報をエンコードするステップを更に含む、請求項１に記載の方法。
処理回路を含むメッシュ処理のための装置であって、
前記処理回路は、
現在頂点の複数の候補予測を決定するステップであって、前記現在頂点がメッシュの複数の頂点に含まれ、複数の前記候補予測が前記メッシュ内の複数の三角形に基づいて決定され、複数の前記三角形のそれぞれが各候補予測に対応する、ステップと、
複数の前記候補予測から前記現在頂点の予測を決定するステップであって、前記予測が、前記現在頂点の複数の候補予測の数が閾値以上であることに基づいて予め定められた予測インデックスによって識別される、ステップと、
決定された前記予測に基づいて前記現在頂点の予測情報をエンコーディングするステップであって、前記予測情報が前記現在頂点の予測を識別する予測インデックスを含む、ステップと、を実行するように構成される、装置。
前記閾値は、２以上５以下である、請求項１２に記載の装置。
前記処理回路は、
前記現在頂点に対して複数の前記三角形のうちの第１の三角形を決定するステップであって、前記第１の三角形が複数の前記三角形のうちの第２の三角形と共有エッジを有し、前記現在頂点が前記第２の三角形に含まれ、かつ前記共有エッジの反対側にある、ステップと、
複数の前記候補予測のうちの第１の候補予測と前記第１の三角形が第１の平行四辺形を形成する平行四辺形予測によって、決定された前記第１の三角形に基づいて、前記第１の候補予測を決定するステップと、を実行するように更に構成される、請求項１２に記載の装置。
前記処理回路は、
複数の前記候補予測の平均予測を決定するステップを実行するように更に構成される、請求項１４に記載の装置。
前記処理回路は、
前記現在頂点の予測リストを決定するステップであって、前記予測リストにおける候補予測子が前記予測リストにおける平均予測及び前記平均予測に続く複数の前記候補予測を含み、前記予測リストにおける複数の前記候補予測の順序が、複数の前記候補予測に対応する複数の前記三角形の順序に基づくものであり、前記予測リストにおける前記候補予測子のそれぞれが各予測インデックスに関連付けられる、ステップを実行するように更に構成される、請求項１５に記載の装置。
複数の前記三角形は、螺旋状の三角形スパニングツリー順序でラベル付けされるエッジブレイカーアルゴリズムに基づいて順序付けされる、請求項１６に記載の装置。
前記処理回路は、
前記現在頂点の複数の前記候補予測の数が前記閾値に等しいことに応答して、前記予測インデックスが第１の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第１の候補予測子として決定するステップと、
前記現在頂点の複数の前記候補予測の数が前記閾値よりも大きいことに応答して、前記予測インデックスが第２の予測インデックスとして予め定められることに基づいて、予め定められた前記予測インデックスに従って、前記現在頂点の予測を前記予測リストにおける候補予測子の第２の候補予測子として決定するステップと、
を実行するように更に構成される、請求項１６に記載の装置。
前記処理回路は、
前記予測リストにおける候補予測子のそれぞれと前記現在頂点との予測差を決定するステップと、
前記予測リストにおける候補予測子から前記予測差のうちの最小予測差に対応する前記予測を決定するステップと、を実行するように更に構成される、請求項１６に記載の装置。
前記処理回路は、
前記予測リストの候補予測子のサブセット内の最小予測差を有する予測を決定するステップを実行するように更に構成される、請求項１６に記載の装置。