JP2024008741A - メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム - Google Patents

メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム Download PDF

Info

Publication number
JP2024008741A
JP2024008741A JP2022110862A JP2022110862A JP2024008741A JP 2024008741 A JP2024008741 A JP 2024008741A JP 2022110862 A JP2022110862 A JP 2022110862A JP 2022110862 A JP2022110862 A JP 2022110862A JP 2024008741 A JP2024008741 A JP 2024008741A
Authority
JP
Japan
Prior art keywords
mesh
decoded
motion vector
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022110862A
Other languages
English (en)
Inventor
建鋒 徐
Kenho Jo
佳隆 木谷
Yoshitaka Kitani
圭 河村
Kei Kawamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2022110862A priority Critical patent/JP2024008741A/ja
Priority to PCT/JP2023/008649 priority patent/WO2024014042A1/ja
Publication of JP2024008741A publication Critical patent/JP2024008741A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化効率を向上させるメッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラムを提供する。【解決手段】メッシュ符号化装置及びメッシュ復号装置を備えるメッシュ処理システムにおいて、メッシュ復号装置200のインター復号部202Eは、動きベクトル残差復号部202E1、動きベクトルバッファ部202E2、動きベクトル予測部202E3、動きベクトル算出部202E4及び加算器202E5とを備える。インター復号部202Eは、Iフレームの復号済みの頂点とPフレームの頂点との間の対応関係を取得し、かかる対応関係に基づいて、Pフレームの頂点の接続情報をIフレームの頂点の接続情報と同一とするように、Pフレームの基本メッシュの頂点の座標とIフレームの基本メッシュの頂点の座標との差分ベクトルを復号する。【選択図】図8

Description

本発明は、メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラムに関する。
非特許文献1には、非特許文献2を用いてメッシュを符号化する技術が開示されている。
Cfp for Dynamic Mesh Coding、ISO/IEC JTC1/SC29/WG7 N00231、MPEG136 - Online Google Draco、2022年5月26日アクセス[Online]、https://google.github.io/draco
しかしながら、従来技術では、動的なメッシュデータの各フレームに対してフレーム内予測のみを用いており、フレーム間の時間相関を利用せず、動的なメッシュデータの符号化効率が低いという問題点があった。 そこで、本発明は、上述の課題に鑑みてなされたものであり、メッシュの符号化効率を向上させることができるメッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラムを提供することを目的とする。
本発明の第1の特徴は、メッシュ復号装置であって、インター復号部を備え、前記インター復号部は、参照フレームの復号済みの基本メッシュから、前記参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得し、前記対応関係に基づいて、前記復号対象のフレームの頂点の接続情報を前記参照フレームの頂点の接続情報と同一とするように構成されていることを要旨とする。
本発明の第2の特徴は、メッシュ復号方法であって、参照フレームの復号済みの基本メッシュから、前記参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得する工程と、前記対応関係に基づいて、前記復号対象のフレームの頂点の接続情報を前記参照フレームの頂点の接続情報と同一とする工程と、を有することを要旨とする。
本発明の第3の特徴は、コンピュータを、メッシュ復号装置として機能させるプログラムであって、前記メッシュ復号装置は、インター復号部を備え、前記インター復号部は、参照フレームの復号済みの基本メッシュから、前記参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得し、前記対応関係に基づいて、前記復号対象のフレームの頂点の接続情報を前記参照フレームの頂点の接続情報と同じにするように構成されていることを要旨とする。
本発明によれば、メッシュの符号化効率を向上させることができるメッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラムを提供することができる。
図1は、一実施形態に係るメッシュ処理システム1の構成の一例を示す図である。 図2は、一実施形態に係るメッシュ復号装置200の機能ブロックの一例を示す図である。 図3Aは、基本メッシュ及び細分割メッシュの一例を示す図である。 図3Bは、基本メッシュ及び細分割メッシュの一例を示す図である。 図4は、基本メッシュビットストリームのシンタックス構成の一例を示す図である。 図5は、図5は、BPHのシンタックス構成の一例を示す図である。 図6は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202の機能ブロックの一例を示す図である。 図7は、Pフレームの基本メッシュの頂点とIフレームの基本メッシュの頂点との間の対応関係の一例を示す図である。 図8は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの機能ブロックの一例を示す図である。 図9は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの動きベクトル予測部202E3による復号対象の頂点のMVPの算出方法の一例を説明するための図である。 図10は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの動きベクトル予測部202E3の動作の一例を示すフローチャートを示す。 図11は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの動きベクトル予測部202E3が、復号済みの周りの頂点との距離の和Total_Dを算出する動作の一例を示すフローチャートを示す。 図12は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの動きベクトル予測部202E3が、重み付け平均を用いてMVPを算出する動作の一例を示すフローチャートである。 図13は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの動きベクトル予測部202E3が、MVPとして候補MVの集合からMVを選択する動作の一例を示すフローチャートである。 図14は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの動きベクトル予測部202E3が、候補MVの集合を作成する動作の一例を示すフローチャートである。 図15は、平行四辺形予測の一例について説明するための図である。 図16は、基本メッシュビットストリームを復号して生成した制御情報であるadaptive_mesh_flag、adaptive_bit_flag及び精度制御パラメータから、MVRの精度を元のビット精度に戻す動作の一例を示すフローチャートである。 図17は、MVRの符号化の一例を説明するための意図である。 図18は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの機能ブロックの一例を示す図である。 図19は、Edgebreakerを用いて、接続情報及び頂点の順番を決める動作の一例を示す図である。 図20は、一実施形態に係るメッシュ復号装置200の細分割部203の機能ブロックの一例について示す図である。 図21は、一実施形態に係るメッシュ復号装置200の細分割部203の基本メッシュ細分割部203Aの機能ブロックの一例を示す図である。 図22は、一実施形態に係るメッシュ復号装置200の細分割部203の基本メッシュ細分割部203Aの基本面分割部203A5による基本面の分割方法の一例について説明するための図である。 図23は、一実施形態に係るメッシュ復号装置200の細分割部203の基本メッシュ細分割部203Aの動作の一例を示すフローチャートである。 図24は、一実施形態に係るメッシュ復号装置200の細分割部203の細分割メッシュ調整部203Bの機能ブロックの一例を示す図である。 図25は、一実施形態に係るメッシュ復号装置200の細分割部203の細分割メッシュ調整部203Bの辺分割点移動部701によって基本面ABC上の辺分割点が移動されたケースの一例を示す図である。 図26は、一実施形態に係るメッシュ復号装置200の細分割部203の細分割メッシュ調整部203Bの細分割面分割部702によって基本面内の細分割面Xに対して再度細分割が行われたケースの一例を示す図である。 図27は、一実施形態に係るメッシュ復号装置200の細分割部203の細分割メッシュ調整部203Bの細分割面分割部702によって全ての細分割面に対して再度細分割が行われたケースの一例を示す図である。 図28は、一実施形態に係るメッシュ復号装置200の変位量復号部206の機能ブロックの一例について示す図である(空間領域でインター予測が行われる場合)。 図29は、変位量ビットストリームの構成の一例について示す図である。 図30は、DPSのシンタックス構成の一例について示す図である。 図31は、DPHのシンタックス構成の一例について示す図である。 図32は、空間領域でインター予測が行われる場合の参照フレームと復号対象フレームとの間の細分割頂点の対応関係の一例について説明するための図である。 図33は、一実施形態に係るメッシュ復号装置200の変位量復号部206の機能ブロックの一例について示す図である(周波数領域でインター予測が行われる場合)。 図34は、周波数領域でインター予測が行われる場合の参照フレームと復号対象フレームとの間の周波数の対応関係の一例について説明するための図である。 図35は、一実施形態に係るメッシュ復号装置200の変位量復号部206の動作の一例を示すフローチャートである。 図36は、変形例1に係る変位量復号部206の機能ブロックの一例を示す図である。 図37は、変形例2に係る変位量復号部206の機能ブロックの一例を示す図である。 図38は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のインター復号部202Eの機能ブロックの一例を示す図である。 図39は、一実施形態に係るメッシュ復号装置200の基本メッシュ復号部202のイントラ復号部202Bの機能ブロックの一例を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1実施形態>
以下、図1~図35を参照して、本実施形態に係るメッシュ処理システムについて説明する。
図1は、本実施形態に係るメッシュ処理システム1の構成の一例を示す図である。図1に示すように、メッシュ処理システム1は、メッシュ符号化装置100及びメッシュ復号装置200を備えている。
図2は、本実施形態に係るメッシュ復号装置200の機能ブロックの一例を示す図である。
図2に示すように、メッシュ復号装置200は、多重分離部201と、基本メッシュ復号部202と、細分割部203と、メッシュ復号部204と、パッチ統合部205と、変位量復号部206と、映像復号部207とを有する。
ここで、基本メッシュ復号部202、細分割部203、メッシュ復号部204及び変位量復号部206は、メッシュを分割したパッチ単位で処理を行うように構成されており、その後、これの処理結果についてパッチ統合部205で統合されるように構成されていてもよい。
図3Aの例では、メッシュが、基本面1及び2で構成されるパッチ1と、基本面3及び4で構成されるパッチ2とに分割されている。
多重分離部201は、多重化されたビットストリームを、基本メッシュビットストリームと変位量ビットストリームとテクスチャビットストリームとに分離するように構成されている。
<基本メッシュ復号部202>
基本メッシュ復号部202は、基本メッシュビットストリームを復号し、基本メッシュを生成して出力するように構成されている。
ここで、基本メッシュは、3次元空間における複数の頂点と、かかる複数の頂点を接続する辺とで構成される。
なお、図3Aに示すように、基本メッシュは、3つの頂点で表現される基本面を組み合わせて構成される。
基本メッシュ復号部202は、例えば、非特許文献2に示すDracoを用いて、基本メッシュビットストリームを復号するように構成されていてもよい。
また、基本メッシュ復号部202は、細分割手法の種別を制御する制御情報として、後述の「subdivision_method_id」を生成するように構成されていてもよい。
以下、図4~図5を参照して、基本メッシュ復号部202で復号される制御情報について説明する。
図4は、基本メッシュビットストリームのシンタックス構成の一例を示す図である。
図4に示すように、第1に、基本メッシュビットストリームは、基本メッシュパッチに対応する制御情報の集合であるBPH(Base Patch header:ベースパッチヘッダ)を含んでいてもよい。第2に、基本メッシュビットストリームは、BPHの次に、基本メッシュパッチを符号化した基本メッシュパッチデータを含んでいてもよい。
以上のように、基本メッシュビットストリームは、各パッチデータに、1つずつBPHが対応する構成となる。なお、図4の構成は、あくまで一例であり、各パッチデータに、BPHが対応する構成となっていれば、基本メッシュビットストリームの構成要素として、上述以外の要素が追加されてもよい。
例えば、図4に示すように、基本メッシュビットストリームは、SPS(シーケンスパラメータセット:Sequence Parameter Set)を含んでいてもよいし、フレームに対応する制御情報の集合であるFH(Frame Header:フレームヘッダ)を含んでもよいし、メッシュに対応する制御情報であるMH(Mesh Header:メッシュヘッダ)を含んでもよい。
図5は、BPHのシンタックス構成の一例を示す図である。ここで、シンタックスの機能が同様であれば、図5に示すシンタックスメイト異なるシンタックス名が用いられても差し支えない。
図5に示すBPHのシンタックス構成において、Description欄は、各シンタックスが、どのように符号化されているかを意味している。また、ue(v)は、符号無し0次指数ゴロム符号であることを意味し、u(n)は、nビットのフラグであることを意味する。
BPHは、基本メッシュパッチに含まれる基本面の個数を指定する制御信号(mdu_face_count_minus1)を少なくとも含む。
また、BPHは、基本パッチごとに基本メッシュの細分割手法の種別を指定する制御信号(mdu_subdivision_method_id)を少なくとも含む。
また、BPHは、基本メッシュパッチごとに細分割数生成手法の種別を指定する制御信号(mdu_subdivision_num_method_id)を含んでもよい。例えば、mdu_subdivision_num_method_id=0のとき、予測分割残差により基本面の細分割数を生成することと定義し、mdu_subdivision_num_method_id=1のとき、再帰的に基本面の細分割数を生成することと定義してもよい。
BPHは、予測分割残差により基本面の細分割数を生成するとき、インデックスi(i=0,…,mdu_face_count_minus1)ごとに基本面の予測分割残差を指定する制御信号(mdu_subdivision_resuiduals)を含んでもよい。
BPHは、再帰的に基本面の細分割数を生成するとき、基本メッシュパッチごとに再帰的に行う細分割回数の上限を識別するための制御信号(mdu_max_depth)を含んでもよい。
BPHは、インデックスi(i=0,…,mdu_face_count_minus1)及びj(j=0,…,mdu_subdivision_depth_index)ごとに、基本面を再帰的に細分割するか否かを指定する制御信号(mdu_subdivision_flag)を含んでもよい。
図6に示すように、基本メッシュ復号部202は、分離部202Aと、イントラ復号部202Bと、メッシュバッファ部202Cと、接続情報復号部202Dと、インター復号部202Eとを備える。
分離部202Aは、基本メッシュビットストリームを、Iフレーム(参照フレーム)のビットストリームとPフレームのビットストリームとに分類するように構成されている。
(イントラ復号部202B)
イントラ復号部202Bは、例えば、非特許文献2に示すDracoを用いて、Iフレームのビットストリームから、Iフレームの頂点の座標及び接続情報を復号するように構成されている。
図39は、イントラ復号部202Bの機能ブロックの一例を示す図である。
図39に示すように、イントラ復号部202Bは、分離部202Aと、任意イントラ復号部202B1と、整列部202B2とを有する。
任意イントラ復号部202B1は、非特許文献2に示すDracoを含む任意の方式を用いて、Iフレームのビットストリームから、Iフレームの順序無し頂点の座標及び接続情報を復号するように構成されている。
整列部202B2は、順序無し頂点を所定の順序に並び替えることによって頂点を出力するように構成されている。
所定の順序として、例えば、モートンコード順を用いてもよく、ラスタスキャン順を用いてもよい。
また、座標が一致する複数の頂点、すなわち重複頂点をまとめて、単一頂点としてから、所定の順序に並び替えてもよい。
メッシュバッファ部202Cは、イントラ復号部202Bによって復号されたIフレームの頂点の座標及び接続情報を蓄積するように構成されている。
接続情報復号部202Dは、メッシュバッファ部202Cから取り出したIフレームの接続情報をPフレームの接続情報にするように構成されている。
インター復号部202Eは、メッシュバッファ部202Cから取り出したIフレームの頂点の座標とPフレームのビットストリームから復号した動きベクトルとを加算することによって、Pフレームの頂点の座標を復号するように構成されている。
本実施形態では、図7に示すように、Pフレームの基本メッシュの頂点とIフレーム(参照フレーム)の基本メッシュの頂点との間で対応関係が存在する。ここで、インター復号部202Eによって復号される動きベクトルは、Pフレームの基本メッシュの頂点の座標とIフレームの基本メッシュの頂点の座標との差分ベクトルである。
(インター復号部202E)
図8は、インター復号部202Eの機能ブロックの一例を示す図である。
図8に示すように、インター復号部202Eは、動きベクトル残差復号部202E1と、動きベクトルバッファ部202E2と、動きベクトル予測部202E3と、動きベクトル算出部202E4と、加算器202E5とを有する。
動きベクトル残差復号部202E1は、PフレームのビットストリームからMVR(Motion Vector Residual)を生成するように構成されている。
ここで、MVRは、MV(Motion Vector)とMVP(Motion Vector Prediction)との差分を示す動きベクトル残差である。MVは、対応するIフレームの頂点の座標とPフレームの頂点の座標との間の差分ベクトル(動きベクトル)である。MVPは、MVを用いて対象の頂点のMVの予測した値(動きベクトルの予測値)である。
動きベクトルバッファ部202E2は、動きベクトル算出部202E4によって出力されたMVを順次に保存するように構成されている。
動きベクトル予測部202E3は、復号対象の頂点と接続している頂点について、動きベクトルバッファ部202E2から復号済みのMVを取得し、図9に示すように、取得された復号済みのMVの全部又は一部を用いて、復号対象の頂点のMVPを出力するように構成されている。
動きベクトル算出部202E4は、動きベクトル残差復号部202E1で生成されたMVRと動きベクトル予測部202E3から出力されたMVPとを加算し、復号対象の頂点のMVを出力するように構成されている。
加算器202E5は、対応関係を持つIフレーム(参照フレーム)の復号済みの基本メッシュから得られた復号対象の頂点に対応する頂点の座標と、動きベクトル算出部202E3から出力された動きベクトルMVとを加算し、復号対象の頂点の座標を出力するように構成されている。
以下、インター復号部202Eの各部の詳細について説明する。
図10に、動きベクトル予測部202E3の動作の一例を示すフローチャートを示す。
図10に示すように、ステップS1001において、動きベクトル予測部202E3は、MVP及びNに0を設定する。
ステップS1002において、動きベクトル予測部202E3は、動きベクトルバッファ部202E2から、復号対象の頂点の周りの頂点のMVの集合を取得し、後続の処理が終わっていない頂点を特定し、Noに遷移し、全ての頂点について後続の処理が終わっている場合は、Yesに遷移する。
ステップS1003において、動きベクトル予測部202E3は、処理対象の頂点のMVが、復号済みでなければ、Noに遷移し、処理対象の頂点のMVが、復号済みであれば、Yesに遷移する。
ステップS1004において、動きベクトル予測部202E3は、MVPにMVを加算し、Nに1を加算する。
ステップS1005において、動きベクトル予測部202E3は、Nが0より大きければ、MVPをNで除した結果を出力し、Nが0であれば、0を出力し、処理を終了する。
すなわち、動きベクトル予測部202E3は、復号対象の頂点の周りにある頂点の復号済みの動きベクトルを平均することによって、復号対象のMVPを出力するように構成されている。
なお、動きベクトル予測部202E3は、かかる復号済みの動きベクトルの集合が空集合の場合、MVPを0とするように構成されていてもよい。
動きベクトル算出部202E4は、式(1)によって、動きベクトル予測部202E3によって出力されたMVP及び動きベクトル残差復号部202E1によって生成されたMVRから、復号対象の頂点のMVを算出するように構成されていてもよい。
MV(k)=MVP(k)+MVR(k) … (1)
ここで、kは、頂点のインデックスである。MV、MVR及びMVPは、x成分、y成分及びz成分を有するベクターである。
かかる構成によれば、MVPを用いて、MVの代わりにMVRのみを符号化するため、符号化効率を高める効果が期待できる。
加算器202E5は、動きベクトル算出部202E4によって算出された頂点のMVと、かかる頂点に対応する参照フレームの頂点の座標とを加算することによって、かかる頂点の座標を算出し、接続情報(Connectivity)を参照フレームのままにするように構成されている。
具体的には、加算器202E5は、式(2)を用いて、k番目の頂点の座標v’(k)を算出するように構成されていてもよい。
v’(k)=v’(k)+MV(k) … (2)
ここで、v’(k)は、復号対象のフレームで復号するk番目の頂点の座標であり、v’(k)は、参照フレームの復号したk番目の頂点の座標であり、MV(k)は、復号対象のフレームのk番目のMVであり、k=1,2…,Kである。
また、復号対象のフレームの接続情報は、参照フレームの接続情報と同一にされる。
なお、動きベクトル予測部202E3は、復号済みのMVを用いてMVPを算出するため、復号の順番がMVPに影響を及ぼす。
かかる復号の順番は、参照フレームの基本メッシュの頂点の復号の順番にする。一般的に、一定の繰り返しパターンを用いて、起点となるエッジから基本面を1つずつ増やす復号手法であれば、復号した基本メッシュの頂点の順番が復号の過程で決められる。
例えば、動きベクトル予測部202E3は、参照フレームの基本メッシュにおいて、Edgebreakerを用いて、頂点の復号の順番を決めてもよい。
かかる構成によれば、頂点の座標の代わりに参照フレームからのMVを符号化するため、符号化効率を高める効果が期待できる。
(インター復号部202Eの変更例1)
図10に示すフローチャートで算出したMVPは、復号済みの周りのMVの単純平均によって算出されているがが、重み付け平均によって算出されてもよい。
すなわち、動きベクトル予測部202E3は、復号対象の頂点の周りにある頂点の復号済みの動きベクトルに対して、復号対象の頂点及び復号対象の頂点の周りにある頂点に対応する参照フレームの頂点間の距離に応じた重みで加重平均することで、復号対象の動きベクトルの予測値を出力するように構成されていてもよい。
なお、動きベクトル予測部202E3は、復号対象の頂点の周りにある頂点の復号済みの動きベクトルの一部に対して、復号対象の頂点及び復号対象の頂点の周りにある頂点に対応する参照フレームの頂点間の距離に応じた重みで加重平均することで、復号対象の動きベクトルの予測値を出力するように構成されていてもよい。
本変更例1では、インター復号部202Eの動きベクトル予測部202E3は、以下の手順で、MVPを算出するように構成されている。
第1に、動きベクトル予測部202E3は、重みを算出するように構成されている。
図11に、復号済みの周りの頂点との距離の和Total_Dを算出する動作の一例を示すフローチャートを示す。
図11に示すように、ステップS1101において、動きベクトル予測部202E3は、Total_Dに0を設定する。
ステップS1102は、ステップS1002と同じである。
ステップS1103は、ステップS1003と同じである。
ステップS1104において、動きベクトル予測部202E3は、Total_Dに対してe(k)を加算する。
すなわち、動きベクトル予測部202E3は、復号対象の頂点の周りにある頂点の集合を参照して、復号済みの頂点の距離を加算する。
本変更例1では、動きベクトル予測部202E3は、頂点間の対応関係が既知である参照フレームにおける距離を利用して重みを算出するように構成されている。
つまり、図11のステップS1104におけるe(k)は、参照フレームにおける対応する頂点間の距離である。
そして、動きベクトル予測部202E3は、式(3)及び(4)によって、重みw(k)を算出するように構成されていてもよい。
Figure 2024008741000002
ここで、Θは、復号対象の頂点を含んでいるメッシュの面における復号済みの各頂点の集合であり、e(p/k)は、参照フレームで復号対象の頂点と頂点p/kと対応する頂点との間の距離であり、w(k)は、頂点kにおける重みである。
なお、動きベクトル予測部202E3は、距離に応じて事前に決めたルールで、重みを設定するように構成されていてもよい。
例えば、動きベクトル予測部202E3は、e(k)が閾値TH1よりも小さい場合、重みを1に設定し、e(k)が閾値TH2よりも小さい場合、重みを0.5に設定しし、それ以外の場合、重みを0に設定する(重みを利用しない)ように構成されていてもよい。
かかる構成によれば、復号対象の頂点との距離が近い場合に重みを大きくすることで、より高い精度でMVPを算出することができるという効果が期待できる。
第2に、動きベクトル予測部202E3は、MVPを参照するように構成されている。
図12に、重み付け平均を用いてMVPを算出する動作の一例を示すフローチャートを示す。
図12に示すように、ステップS1201において、動きベクトル予測部202E3は、MVP及びNに0を設定する。
ステップS1202は、ステップS1002と同じである。
ステップS1203は、ステップS1003と同じである。
ステップS1204において、動きベクトル予測部202E3は、MVPにw(k)×MV(k)を加算し、Nに1を加算する。
ステップS1205は、ステップS1005と同じである。
或いは、動きベクトル予測部202E3は、式(5)によって、MVPを算出するように構成されていてもよい。
Figure 2024008741000003
ここで、Θは、復号対象の頂点を含んでいるメッシュの面における復号済みの各頂点の集合である。
かかる構成によれば、重み付け平均で、より高い精度のMVPを算出することができるため、MVRの値を小さくしてゼロ付近に集中させることにより、符号化効率を高めるという効果が期待できる。
(インター復号部202Eの変更例2)
本変更例2では、動きベクトル予測部202E3は、周りの複数のMVを用いてMVPを算出するのではなく、1つのMVを選択するように構成されている。
すなわち、動きベクトル予測部202E3は、復号対象の頂点と接続している頂点のMVとして、動きベクトルバッファ部202E2に蓄積されている復号済みのMVのうち最近傍の頂点のMVを選択するように構成されていてもよい。
ここで、動きベクトル予測部202E3は、動きベクトルバッファ部202E2に蓄積されている復号済みのMVの中から、復号対象の頂点と接続している頂点のMVから成る候補リストを構築し、Pフレーム(復号対象のフレーム)のビットストリームから復号したインデックスに基づいて、候補リストから動きベクトルを選択するように構成されていてもよい。
図13に、MVPとして候補MVの集合からMVを選択する動作の一例を示すフローチャートを示す。
図13に示すように、ステップS1301において、動きベクトル予測部202E3は、PフレームのビットストリームからリストIDを復号する。
ステップS1302において、動きベクトル予測部202E3は、候補MVの中から、リストIDを付けるMVをMVPとして選択する。
なお、図13における候補MVの集合では、復号済みの周りのMV及びその組み合わせで算出されたMVが一定の順番で並んでいる。
図14に、かかる候補MVの集合を作成する動作の一例を示すフローチャートを示す。
図14に示すように、ステップS1401において、動きベクトル予測部202E3は、復号対象の頂点の周りの頂点のMVの集合を参照して、復号対象の頂点の周りの全ての頂点に対する処理が完了しているか否かについて判定する。
かかる処理が完了している場合、本動作は、終了し、かかる処理が完了していない場合、本動作は、ステップS1402に進む。
ステップS1402において、動きベクトル予測部202E3は、対象の頂点のMVが復号されているか否かについて判定する。
かかるMVが復号されている場合、本動作は、ステップS1403に進み、かかるMVが復号されていない場合、本動作は、ステップS1401に戻る。
ステップS1403において、動きベクトル予測部202E3は、かかるMVが他の復号済みのMVと重複するか否かについて判定する。
重複する場合、本動作は、ステップS1401に戻り、重複していない場合、本動作は、ステップS1404に進む。
動きベクトル予測部202E3は、ステップS1404において、かかるMVに対して付与するリストIDを決定し、ステップS1405において、候補MVの集合に含める。
なお、図14において、動きベクトル予測部202E3は、リストIDを決定する際に、リストIDを順番に1つずつ増やしてもよいし、参照フレームで復号対象の頂点と頂点kに対応する頂点との間の距離(式(3)のe(k))の順でリストIDを決定してもよい。
かかる構成によれば、候補MVの1つをMVPとして選択することが、場合によって平均よりMVと近いことがあるため、その場合には、符号化効率を高めるという効果が期待できる。
更に、動きベクトル予測部202E3は、上述の候補MVの中から、連続するMV0及びMV1を平均したMVを、新たな候補MVとしてリストの中に追加するように構成されていてもよい。動きベクトル予測部202E3は、かかるMVの追加先としては、表1に示すように、MV0及びMV1の後にする。
Figure 2024008741000004
かかる構成によれば、選択した候補MVが、復号対象の頂点のMVとより近い可能性を高めるという効果が期待できる。
更に、動きベクトル予測部202E3は、リストIDを符号化せず、候補MVの集合から最も近傍の頂点のMVを選択するように構成されていてもよい。かかる構成によれば、符号化効率を更に高めるという効果が期待できる。
(インター復号部202Eの変更例3)
上述の実施例及び変更例1~2では、周りの頂点は、復号対象の頂点と接続している頂点であった。
これに対して、本変更例3では、動きベクトル予測部202E3は、平行四辺形予測によって、すなわち、復号対象の頂点と直接に接続していない頂点も利用して、MVPを算出するように構成されている。
図15に示すように、平行四辺形予測では、復号対象の頂点Aと共有エッジBCを持つ復号済みの面の反対側の頂点Dも利用する。
また、復号対象の頂点Aの共有エッジは、AB以外に、CE及びBGがある。したがって、平行四辺形予測では、同様に、頂点F及びHも利用できる。
例えば、動きベクトル予測部202E3は、図15に示す面BCDを用いて、式(6)で、MVPを算出するように構成されていてもよい。
MVP=MV(B)+MV(C)-MV(D) … (6)
ここで、MV(X)は、頂点Xの動きベクトルであり、MVPは、復号対象の頂点Aの動きベクトル予測値である。
また、上述の共有エッジが複数ある時に、動きベクトル予測部202E3は、それぞれのMVPを平均してもよいし、面の重心が最も近い面を選択してもよい。
(インター復号部202Eの変更例4)
本変更例では、動きベクトル残差復号部202E1によって生成されたMVRは、そのままではなく、MVRを整数表現する際の量子化幅が制御されるように構成されている。
本変更例では、動きベクトル残差復号部202E1は、MVRの量子化幅を制御する制御情報として、adaptive_mesh_flag、adaptive_bit_flag及び精度制御パラメータを復号するように構成されている。
すなわち、動きベクトル残差復号部202E1は、基本メッシュ全体のadaptive_mesh_flag及び基本パッチ毎のadaptive_bit_flagを復号するように構成されている。
ここで、adaptive_mesh_flag及びadaptive_bit_flagは、上述のMVRの量子化幅の調整を行うか否かについて示すフラグであり、0又は1のいずれかの値を採る。
ここで、動きベクトル残差復号部202E1は、adaptive_mesh_flagが有効(すなわち、1)である場合のみ、adaptive_bit_flagを復号する。
また、動きベクトル残差復号部202E1は、adaptive_mesh_flagが無効(すなわち、0)である場合、adaptive_bit_flagは無効(すなわち、0)とみなす。
図16に、に基本メッシュビットストリームを復号して生成した制御情報であるadaptive_mesh_flag、adaptive_bit_flag及び精度制御パラメータから、復号されたMVRの量子化幅を制御する動作の一例を示すフローチャートを示す。
図16に示すように、ステップS1601において、動きベクトル予測部202E3は、adaptive_mesh_flagが0であるか否かについて判定する。
メッシュ全体のadaptive_mesh_flagが0であると判定された場合、本動作は、終了する。
一方、メッシュ全体のadaptive_mesh_flagが1であると判定された場合、本動作は、ステップS1602に進む。
ステップS1602において、動きベクトル予測部202E3は、フレーム内に未処理のパッチが存在するか否かについて判定する。
ステップS1603において、動きベクトル予測部202E3は、パッチごとに復号されるadaptive_mesh_flagが0であるか否かについて判定する。
adaptive_mesh_flagが0であると判定された場合、本動作は、ステップS1601に戻る。
一方、adaptive_mesh_flagが1であると判定された場合、本動作は、ステップS1604に進む。
ステップS1604において、動きベクトル予測部202E3は、後述の精度制御パラメータに基づいて、MVRの量子化幅を制御する。
なお、このように量子化幅を制御されたMVRの値を「MVRQ(Motion Vector Residual Quantization)」と呼ぶ。
ここで、動きベクトル予測部202E3は、例えば、表2のような表を参照して、基本メッシュビットストリーム復号して生成した量子化幅制御パラメータに対応するMVRの量子化幅を用いるように構成されていてもよい。
Figure 2024008741000005
かかる構成によれば、MVRの量子化幅の制御により、符号化効率を高めることができるという効果が期待できる。更に、メッシュレベルのadaptive_mesh_flag及びパッチレベルのadaptive_mesh_flagの階層的な仕組みにより、MVRの量子化幅の制御をしない時に無駄なビットを最小化することができるという効果が期待できる。
(インター復号部202Eの変更例5)
動きベクトル残差復号部202E1によって生成されたMVRを符号化しない場合、誤差が生じる。本変更例5では、かかる誤差を補正するため、離散的な動きベクトル差分を符号化する。
具体的には、図17に示すように、MVRは、x軸、y軸及びz軸の6方向において、1、2、4及び8の大きさを採り得る。かかる符号化の一例について、表3及び表4に示す。
また、複数の方向の組み合わせで、MVRの符号化を行ってもよい。例えば、x軸の+方向の2、y軸の+方向の1の順番で補正してもよい。
Figure 2024008741000006
Figure 2024008741000007
かかる構成によれば、MVRの符号化よりも離散的な動きベクトル差分の符号化効率が高いという効果が期待できる。
以降で、インター復号部202Eの更なる変更例について説明する。
上述のインター復号部202Eの更なる変更例では、上述のインター復号部202Eを実施する前に、以下の機能ブロックを追加するように構成されている。
具体的には、図18に示すように、インター復号部202Eは、図8に示す構成に加えて、重複頂点探索部202E6と、重複頂点判別部202E7と、動きベクトル取得部202E8とAll skip modeシングル、skip modeシングルを備えている。
ここで、All skip modeシグナルが、Pフレームのビットストリームの最初にあり、少なくとも2値を持ち、1ビット又は1ビット以上である。
その1つ(All skip modeシグナルが、Yesを示す場合、例えば、1である場合)は、Pフレームの全ての重複頂点の動きベクトルをビットストリームから復号せず、重複された頂点の動きベクトルをコピーするシグナルである。
もう1つ(All skip modeシグナルが、Noを示す場合、例えば、0である場合)は、Pフレームの各頂点で異なる処理を行うシグナルである。更に、もう1つは、他の値を持ってもよい。例えば、もう1つは、全ての重複頂点の動きベクトルについて、動きベクトル取得部202E8における処理を実施せず、図8に示すインター復号部202Eと同様の処理を行うシングルである。
ここで、Skip modeシグナルは、All skip modeシグナルがNoを示す場合、重複頂点毎に2値を持ち、1ビットである。
Skip modeシグナルは、All skip modeシグナルがYesを示す場合(例えば、1である場合)、当該頂点の動きベクトルをビットストリームから復号せず、重複された頂点の動きベクトルをコピーするシグナルルである。
Skip modeシグナルは、All skip modeシグナルがNoを示す場合(例えば、0である場合)、当該頂点の動きベクトルについて動きベクトル取得部202E8における処理を実施せず、図8に示すインター復号部202Eと同様の処理を行うシングルである。
なお、上述のSkip modeシグナルは、ビットストリームから直接に復号されてもよいし、ビットストリームから図8に示すインター復号部202Eと同様の処理を行う重複頂点を特定するデータ(例えば、当該重複頂点のインデックス)を復号し、かかるデータからSkip modeシグナルを算出してもよい。
更に、図38に示すように、Skip modeシグナルを算出せず、上述の図8に示すインター復号部202Eと同様の処理を行う重複頂点を特定するデータ(例えば、重複頂点のインデックス)を用いて、上述の場合と同様に、当該頂点の動きベクトル復号方法を決めてもよい。
重複頂点探索部202E6は、復号した参照フレームの基本メッシュの幾何情報から、座標が一致する頂点(以下、重複頂点と呼ぶ)のインデックスを探索してバッファ(図示せず)に保存するように構成されている。
具体的には、重複頂点探索部202E6の入力は、復号した参照フレームの基本メッシュの各頂点のインデックス(復号順)及び位置座標である。
また、重複頂点探索部202E6の出力は、重複頂点が存在する頂点のインデックス(vindex0)及びかかる重複頂点のインデックス(vindex1)のペアのリストである。ここで、かかるペアのリストは、index0の順で、バッファrepVertに保存される。
また、vindex1の頂点が、vindex0の前に復号されたため、vindex0>vindex1の関係となる。
なお、参照フレームの基本メッシュで重複頂点が分かる方法として、重複頂点が存在する頂点に対して、特別なシグナルにより、位置座標ではなく、重複頂点のインデックスを復号する。かかる特別なシグナルにより、該当頂点のインデックス及び重複頂点のインデックスのペアを復号順で保存できる。
重複頂点判別部202E7は、該当頂点が復号した頂点の中に重複頂点があるかどうかを判別するように構成されている。
ここで、重複頂点判別部202E7は、該当頂点のインデックスが、重複頂点が存在する頂点のインデックスの中のものであれば、復号した頂点の中に重複頂点があると判別する。なお、復号順で該当頂点が来るので、上述の探索が不要である。
ここで、重複頂点判別部202E7が、該当頂点の重複頂点が存在しないと判断する場合は、図8に示すインター復号部202Eと同様の処理が行われる。
動きベクトル取得部202E8は、該当頂点の重複頂点が存在する場合に、All skip modeシグナルがYesを示す場合、或いは、All skip modeシグナルがNoを示す場合、該当頂点のSkip modeシグナルがYesを示す場合、復号した動きベクトルを保存する動きベクトルバッファ部202E2から重複頂点と同じインデックスを持つ頂点の動きベクトルを取得し、該当頂点の動きベクトルにするように構成されている。
ここで、All skip modeシグナルがNoを示し、該当頂点のSkip modeシグナルがNoを示す場合は、動きベクトル取得部202E8の代わりに、図8に示すインター復号部202Eと同様の処理が行われる。
かかる構成によれば、重複頂点が存在する頂点に対して動きベクトルの復号計算及び符号量の削減効果が期待できる。
上述のインター復号部202Eの更なる変更例では、インター復号部202Eは、参照フレームの復号済みの基本メッシュから、参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得する。
そして、インター復号部202Eは、かかる対応関係に基づいて、復号対象のフレームの頂点の接続情報について符号化せずに参照フレームの復号済みの頂点の接続情報と同一とするように構成されている。
また、インター復号部202Eは、参照フレームの頂点の復号順で、復号対象のフレームの基本メッシュをシグナルに基づいて2種類の領域に分割する。第1領域では、インター処理を用いて復号し、第2領域では、イントラ処理を用いて復号する。
なお、上述の領域は、参考フレームの基本メッシュを復号する際に、復号順上に連続する複数の頂点によって形成される領域であると定義する。
また、シグナルを用いて、復号対象のフレームの基本メッシュの頂点の座標を復号する手段は、以下の2つの実装が想定される。
(手段1)
手段1では、シグナルは、vertex_idx1、vertex_idx2及びintra_flagになる。
ここで、vertex_idx1及びvertex_idx2は、頂点の復号順のインデックス(頂点インデックス)であり、intra_flagは、上述のインター復号手法であるかイントラ復号手法であるかについて示すフラグである。かかるシグナルは、複数あってもよい。
すなわち、vertex_idx1及びvertex_idx2は、上述の一部の領域(第1領域及び第2領域)の開始位置及び終了位置を規定する頂点インデックスである。
(手段2)
手段2では、Edgebreakerで参照フレームの基本メッシュの接続情報を復号し、頂点の座標の復号順をEdgebreakerで決めた順番にするという前提がある。
図19は、Edgebreakerを用いて、接続情報及び頂点の順番を決める動作の一例を示す図である。
図19において、矢印は、接続情報の復号順を示し、数字は、頂点の復号順を示し、同じ線種の矢印によって同じ領域を規定している。
手段2では、シグナルは、インター復号手法であるかイントラ復号手法であるかについて示すフラグであるintra_flagのみになる。
すなわち、手段2では、インター復号部202Eは、Edgebreakerを用いて、第1領域及び第2領域に分割するように構成されている。
<細分割部203>
細分割部203は、制御情報によって示された細分割手法により、基本メッシュ復号部202によって復号された基本メッシュから、追加された細分割頂点及びそれらの接続情報を生成して出力するように構成されている。
ここで、基本メッシュ、追加された細分割頂点、及び、それらの接続情報を、併せて「細分割メッシュ」と呼ぶ。
細分割部202は、基本メッシュビットストリームを復号して生成した制御情報であるsubdivision_method_idから、細分割手法の種別を特定するように構成されている。
以下、図3A及び図3Bを参照して、細分割部202について説明する。
図3A及び図3Bは、基本メッシュから細分割頂点を生成する動作の一例について説明するための図である。
図3Aは、5つの頂点で構成された基本メッシュの一例について示す図である。
ここで、細分割には、例えば、各基本面において各辺の中点同士を接続するMid-edge分割法を用いてもよい。これによって、ある基本面は、4つの面に分割されることになる。
図3Bは、5つの頂点で構成された基本メッシュを分割した細分割メッシュの一例を示す。図3Bに示す細分割メッシュでは、元の5つの頂点(黒丸)に加えて8つの細分割頂点(白丸)が生成されている。
このように生成した細分割頂点ごとに、変位量復号部206で変位量を復号することによって、符号化性能の向上が期待できる。
また、各パッチで異なる細分割方法を適用してもよい。これによって、変位量復号部206で復号される変位量をパッチごとに適応的に変化させ、符号化性能の向上が期待できる。分割したパッチの情報は、制御情報であるpatch_idとして受け取られる。
以下、図20を参照して、細分割部203について説明する。図21は、細分割部203の機能ブロックの一例について示す図である。
図21に示すように、細分割部203は、基本メッシュ細分割部203Aと細分割メッシュ調整部203Bとを有する。
(基本メッシュ細分割部203A)
基本メッシュ細分割部203Aは、入力された基本メッシュ及び基本メッシュの分割情報に基づき、基本面及び基本パッチごとの分割数(細分割数)を算出し、かかる分割数に基づいて基本メッシュを細分割し、細分割面を出力するように構成されている。
すなわち、基本メッシュ細分割部203Aは、基本面及び基本パッチ単位で、上述の分割数を変えることができるように構成されていてもよい。
ここで、基本面は、基本メッシュを構成する面であり、基本パッチは、いくつかの基本面の集合である。
また、基本メッシュ細分割部203Aは、基本面の細再分割数を予測し、予測した基本面の細分割数に対して予測分割数残差を加算することで、基本面の細分割数を算出するように構成されていてもよい。
また、基本メッシュ細分割部203Aは、基本面の隣接基本面の細分割数に基づいて、基本面の細分割数を算出するように構成されていてもよい。
また、基本メッシュ細分割部203Aは、直前に蓄積された基本面の細分割数に基づき、基本面の細分割数を算出するように構成されていてもよい。
また、基本メッシュ細分割部203Aは、基本面を構成する3辺を分割する頂点を生成し、生成した頂点を接続することで、基本面を細分割するように構成されていてもよい。
図21に示すように、基本メッシュ細分割部203Aの後段に、後述の細分割メッシュ調整部を備える203Bを備えている。
以下、図21~図23を用いて、基本メッシュ細分割部203Aの処理の一例について説明する。
図21は、基本メッシュ細分割部203Aの機能ブロックの一例を示す図であり、図23は、基本メッシュ細分割部203Aの動作の一例を示すフローチャートである。
図21に示すように、基本メッシュ細分割部203Aは、基本面分割数バッファ部203A1と、基本面分割数参照部203A2と、基本面分割数予測部203A3と、加算部203A4と、基本面分割部203A5とを有する。
基本面分割数バッファ部203A1は、基本面の分割数を含む基本面の分割情報を格納しており、基本面分割数参照部203A2に対して基本面の分割情報を出力するように構成されている。
ここで、基本面分割数バッファ部203A1のサイズは、1とし、基本面分割数参照部203A2に対して、直前に蓄積された基本面の分割数を出力するように構成されていてもよい。
すなわち、基本面分割数バッファ部203A1のサイズを1にすることで、最後に復号した細かい分割数(直前に復号した細分割数)のみを参照するように構成されていてもよい。
基本面分割数参照部203A2は、復号対象の基本面に対して隣接する基本面が存在していない場合、或いは、復号対象の基本面に対して隣接する基本面が存在しているが分割数が確定していない場合は、基本面分割数予測部203A3に対して、参照不可を出力するように構成されている。
一方、基本面分割数参照部203A2は、復号対象の基本面に対して隣接する基本面が存在し且つ分割数が確定している場合は、基本面分割数予測部203A3に対して、かかる分割数を出力するように構成されている。
基本面分割数予測部203A3は、入力された1つ以上の分割数に基づいて基本面の分割数(細分割数)を予測し、加算部203A4に対して、予測した分割数(予測分割数)を出力するように構成されている。
ここで、基本面分割数予測部203A3は、基本面分割数参照部203A2から参照不可のみが入力された場合は、加算部203A4に対して、0を出力するように構成されている。
なお、基本面分割数予測部203A3は、1つ以上の分割数が入力された場合、入力された分割数の平均値や最大値や最小値や最頻値等の統計値のいずれかを用いて、予測分割数を生成するように構成されていてもよい。
なお、基本面分割数予測部203A3は、1つ以上の分割数が入力された場合、最も隣接する面の分割数を予測分割数として生成するように構成されていてもよい。
加算部203A4は、予測残差ビットストリームから復号した予測分割数残差と基本面分割数予測部203A3から取得した予測分割数とを加算することによって得られた分割数を、基本面分割部203A5に対して出力するように構成されている。
基本面分割部203A5は、加算部203A4から入力された分割数に基づき、基本面を細分割するように構成されている。
図22は、基本面を9分割したケースの一例である。図22を参照して、基本面分割部203A5による基本面の分割方法について説明する。
基本面分割部203A5は、基本面を構成する辺ABに対してN等分(N=3)する点A_1,…,A_(N-1)を生成する。
同様に、基本面分割部203A5は、辺BCや辺CAについてもN等分し、それぞれ点B_1,…,B_(N-1)、C_1,…,C_(N-1)を生成する。
以降、辺AB、辺BC及び辺CA上の点を「辺分割点」と呼ぶ。
基本面分割部203A5は、全てのi(i=1,2,…,N-1)に対して、辺A_i B_(N-i),B_i C_(N-i),C_i A_(N-i)を生成し、N個の細分割面を生成する。
次に、図23を参照して、基本メッシュ細分割部203Aの処理手順について説明する。
ステップS2201において、最後の基本面に対して再分割処理が完了したか否かを判定する。処理が完了した場合終了し、そうでない場合はステップS2202に進む。
ステップS2202において、基本メッシュ細分割部203Aは、Depth<mdu_max_depthの判定を行う。
ここで、Depthは、現在の深度を表す変数で、初期値は0であり、mdu_max_depthは、基本面ごとに決められた最大深度を表す。
ステップS2202における条件を満たす場合は、本処理手順は、ステップS2203に進み、かかる条件を満たさない場合は、本処理手順は、ステップS2201に戻る。
ステップS2203において、基本メッシュ細分割部203Aは、現在の深度におけるmdu_subdivision_flagが1であるか否かについて判定する。
Yesの場合、本処理手順は、ステップS2201に戻り、Noの場合、本処理手順は、ステップS2204に進む。
ステップS2204において、基本メッシュ細分割部203Aは、基本面内の全ての細分割面をさらに細分割する。
ここで、基本メッシュ細分割部203Aは、基本面に対して一度も細分割処理が行われていない場合は、基本面を細分割する。
なお、細分割の方法については、ステップS2204で説明した方法と同様である。
具体的には、基本面が一度も細分割されていない場合は、基本面に対して図22のように細分割を行う。少なくとも1回は細分割されている場合は、細分割面をN個に細分割する。図22を例にすると、頂点A_2と頂点Bと頂点B_1とからなる面を、基本面の分割のときと同様の方法で、更に分割してN個の面を生成する。
細分割処理が終了したとき、本処理手順は、ステップS2205に進む。
ステップS2205において、基本メッシュ細分割部203Aは、Depthに1を加算し、本処理手順は、ステップS2202に戻る。
(細分割メッシュ調整部203B)
次に、細分割メッシュ調整部203Bによって行われる処理の具体例について説明する。以下、図24~28を用いて細分割メッシュ調整部203Bによって行われる処理の一例について説明する。
図24は、細分割メッシュ調整部203Bの機能ブロックの一例を示す図である。
図24に示すように、細分割メッシュ調整部203Bは、辺分割点移動部701と、細分割面分割部702とを有する。
(辺分割点移動部701)
辺分割点移動部701は、入力された初期細分割面に対して、基本面の辺分割点を隣接基本面の辺分割点のいずれかに移動し、細分割面を出力するように構成されている。
図25は、基本面ABC上の辺分割点を移動した例である。例えば、図25に示すように、辺分割点移動部701は、基本面ABCの辺分割点を最も近い隣接基本面の辺分割点に移動するように構成されていてもよい。
(細分割面分割部702)
細分割面分割部702は、入力された細分割面を再度細分割し、復号細分割面を出力するように構成されている。
図26は、基本面内の細分割面Xに対して再度細分割が行われたケースの一例を示す図である。
図26に示すように、細分割面分割部702は、細分割面を構成する頂点と隣接基本面の辺分割点とを接続することで、基本面内に新たな細分割面を生成するように構成されていてもよい。
図27は、全ての細分割面に対して、上述の細分割処理を行ったケースの一例を示す図である。
メッシュ復号部204は、細分割部203で生成された細分割メッシュ及び変位量復号部206で復号された変位量を用いて、復号メッシュを生成して出力するように構成されている。
具体的には、メッシュ復号部204は、各細分割頂点に対して、対応する変位量を加算することによって、復号メッシュを生成するように構成されている。ここで、各変位量がどの細分割頂点に対応するかについての情報は、制御情報によって示される。
パッチ統合部205は、メッシュ復号部206で生成された復号メッシュを、複数のパッチ分だけ統合して出力するように構成されている。
ここで、パッチの分割方法は、メッシュ符号化装置100によって定義される。例えば、パッチの分割方法は、各基本面に対して法線ベクトルを算出しておき、隣接する基本面の中で最も法線ベクトルが類似した基本面を選択し、両基本面を同じパッチとしてまとめ、かかる手順を、次の基本面に対して順次繰り返すように構成されていてもよい。
映像復号部207は、映像符号化によってテクスチャを復号して出力するように構成されている。例えば、映像復号部207は、非特許文献1のHEVCを用いてもよい。
<変位量復号部206>
変位量復号部206は、変位量ビットストリームを復号して変位量を生成して出力するように構成されている。
図28は、ある細分割頂点に対する変位量の一例について示す図である。
図3Bの例では、8個の細分割頂点が存在するため、変位量復号部206は、各細分割頂点に対してスカラー或いはベクトルで表現される変位量を8個定義するように構成されている。
以下、図28を参照して、変位量復号部206について説明する。図28は、変位量復号部206の機能ブロックの一例について示す図である。
図28に示すように、変位量復号部206は、復号部206Aと、逆量子化部206Bと、逆ウェーブレット変換部206Cと、加算器206Dと、インター予測部206Eと、フレームバッファ206Fとを有する。
復号部206Aは、受信した変位量ビットストリームに対して可変長復号を行うことでレベル値及び制御情報を復号して出力するように構成されている。ここで、可変長復号によって得られたレベル値は、逆量子化部206Bに出力され、制御情報は、インター予測部206Eに出力される。
以下、図29を参照して、変位量ビットストリームの構成の一例について説明する。図29は、変位量ビットストリームの構成の一例について示す図である。
図29に示すように、第1に、変位量ビットストリームは、変位量の復号に関する制御情報の集合であるDPS(Displacement Parameter Set:ディスプレイスメントパラメータセット)を含んでいてもよい。
第2に、変位量ビットストリームは、パッチに対応する制御情報の集合であるDPH(Displacement Patch Header:ディスプレイスメントパッチヘッダ)を含んでいてもよい。
第3に、変位量ビットストリームは、DPHの次に、パッチを構成する符号化された変位量を含んでいてもよい。
以上のように、変位量ビットストリームは、各符号化された変位量に、1つずつDPH及びDPSが対応する構成となる。
なお、図29の構成は、あくまで一例である。各符号化された変位量に、DPH及びDPSが対応する構成となっていれば、変位量ビットストリームの構成要素として、上述以外の要素が追加されてもよい。
例えば、図29に示すように、変位量ビットストリームは、SPS(Sequence Parameter Set:シーケンスパラメータセット)を含んでいてもよい。
図30は、DPSのシンタックス構成の一例について示す図である。
図30において、Descriptor欄は、各シンタックスが、どのように符号化されているかを意味している。
また、図30において、ue(v)は、符号無し0次指数ゴロム符号であることを意味し、u(n)は、nビットのフラグであることを意味する。
DPSは、複数のDPSが存在する場合に、各DPSを識別するためのDPS id情報(dps_displacement_parameter_set_id)を少なくとも含む。
また、DPSは、インター予測を行うか否かを制御するフラグ(interprediction_enabled_flag)を含んでもよい。
例えば、interprediction_enabled_flagが0のときは、インター予測を行わないと定義し、interprediction_enabled_flagが1のときは、インター予測を行うと定義してもよい。interprediction_enabled_flagが含まれないときは、インター予測を行わないと定義してもよい。
DPSは、逆DCTを行うか否かを制御するフラグ(dct_enabled_flag)を含んでもよい。
例えば、dct_enabled_flagが0のときは、逆DCTを行わないと定義し、dct_enabled_flagが1のときは、逆DCTを行うと定義してもよい。dct_enabled_flagが含まれないときは、逆DCTを行わないと定義してもよい。
図31は、DPHのシンタックス構成の一例について示す図である。
図31に示すように、DPHは、各DPHに対応するDPSを指定するためのDPS id情報を少なくとも含む。
逆量子化部206Bは、復号部206Aによって復号されたレベル値を逆量子化することによって変換係数を生成して出力するように構成されている。
逆ウェーブレット変換部206Cは、逆量子化部206Bによって生成された変換係数に対して逆ウェーブレット変換を施すことによって予測残差を生成して出力するように構成されている。
(インター予測部206E)
インター予測部206Eは、フレームバッファ206Fから読み出された参照フレームの復号変位量を用いてインター予測を行うことによって、予測変位量を生成して出力するように構成されている。
インター予測部206Eは、interprediction_enabled_flagが1の場合のみ、かかるインター予測を行うように構成されている。
インター予測部206Eは、空間領域でインター予測を行ってもよいし、周波数領域でインター予測を行ってもよい。インター予測は、時間的に過去の参照フレームと未来の参照フレームとを用いて、双方向予測を行ってもよい。
図28は、空間領域でインター予測を行う場合のインター予測部206Eの機能ブロックの一例である。
インター予測部206Eは、空間領域でインター予測を行う場合は、対象フレームにおける細分割頂点の予測変位量について、参照フレームにおける対応する細分割頂点の復号変位量をそのまま参照して決定してもよい。
或いは、対象フレームにおけるある細分割頂点の予測変位量は、複数の参照フレームにおける対応する細分割頂点の復号変位量を用いて、平均と分散を推定した正規分布に従って確率的に決定してもよい。その際は、分散はゼロとして一意的に平均のみで決定してもよい。
或いは、対象フレームにおけるある細分割頂点の予測変位量は、複数の参照フレームにおける対応する細分割頂点の復号変位量を用いて、時間を説明変数、変位量を目的変数として推定した回帰曲線に基づいて決定してもよい。
メッシュ符号化装置100において、フレームごとに符号化効率向上のために、かかる復号変位量の順番が並び替えられていてもよい。
かかる場合、インター予測部206Eは、並び替えられた復号変位量に対してインター予測を行うように構成されていてもよい。
参照フレームと復号対象フレームとの間の細分割頂点の対応関係は、制御情報によって示される。
図32は、空間領域でインター予測が行われる場合の参照フレームと復号対象フレームとの間の細分割頂点の対応関係の一例について説明するための図である。
図33は、周波数領域でインター予測を行う場合のインター予測部206Eの機能ブロックの一例である。
インター予測部206Eは、周波数領域でインター予測を行う場合は、復号対象フレームにおける周波数の予測ウェーブレット変換係数について、参照フレームにおける対応する周波数の復号ウェーブレット変換係数をそのまま参照して決定してもよい。
インター予測部206Eは、複数の参照フレームにおける細分割頂点の復号変位量或いは復号ウェーブレット変換係数を用いて、平均と分散を推定した正規分布に従って確率的にインター予測してもよい。
インター予測部206Eは、複数の参照フレームにおける細分割頂点の復号変位量あるいは復号ウェーブレット変換係数を用いて、時間を説明変数、変位量を目的変数として推定した回帰曲線をもとにインター予測してもよい。
インター予測部206Eは、時間的に過去の参照フレームと未来の参照フレームとを用いて双方向でインター予測するように構成されていてもよい。
メッシュ符号化装置100において、フレームごとに符号化効率向上のために、かかる復号ウェーブレット変換係数の順番が並び替えられていてもよい。
参照フレームと復号対象フレームとの間の周波数の対応関係は、制御情報によって示される。
図34は、周波数領域でインター予測が行われる場合の参照フレームと復号対象フレームとの間の周波数の対応関係の一例について説明するための図である。
また、細分割部203が、基本メッシュを複数のパッチに分割した場合は、インター予測部206Eも、分割したパッチごとにインター予測を行うように構成されている。これによって、フレーム間の時間相関が高くなり、符号化性能の向上が期待できる。
加算器206Dには、逆ウェーブレット変換部206Cから予測残差が入力され、インター予測部206Eから予測変位量が入力される。
加算器206Dは、かかる予測残差と予測変位量とを加算することによって、復号変位量を算出して出力するように構成されている。
加算器206Dによって算出された復号変位量は、フレームバッファ206Fにも出力される。
フレームバッファ206Fは、加算器206Dから復号変位量を取得して蓄積するように構成されている。
ここで、フレームバッファ206Fは、図示しない制御情報に応じて、参照フレームにおいて対応する頂点における復号変位量を出力する。
図35は、変位量復号部206の動作の一例を示すフローチャートである。
図35に示すように、ステップS3501において、変位量復号部206は、全てのパッチに対して、本処理が完了しているか否かについて判定する。
Yesの場合、本動作は、終了し、Noの場合、本動作は、ステップS3502に進む。
ステップS3502において、変位量復号部206は、復号対象のパッチに対して、逆DCTを行ってから逆量子化及び逆ウェーブレット変換を行う。
ステップS3503において、変位量復号部206は、interprediction_enabled_flagが1であるか否かについて判定する。
Yesの場合、本動作は、ステップS3504に進み、Noの場合、本動作は、ステップS3501に戻る。
ステップS3504において、変位量復号部206は、上述のインター予測及び加算を行う。
<変形例1>
以下、図36を参照して、上述の第1実施形態の変形例1について、上述の第1実施形態との相違点に着目して説明する。
図36は、本変形例1に係る変位量復号部206の機能ブロックの一例を示す図である。
図36に示すように、本変形例1に係る変位量復号部206は、復号部206Aの後段に、すなわち、復号部206Aと逆量子化部206Bとの間に、逆DCT部206Gを備えている。
すなわち、本変形例1では、逆量子化部206Bは、逆DCT部202Gから出力されたレベル値に対して逆ウェーブレット変換を施すことによって予測残差を生成するように構成されている。
<変形例2>
以下、図37を参照して、上述の第1実施形態の変形例2について、上述の第1実施形態との相違点に着目して説明する。
図37に示すように、本変形例2に係る変位量復号部206は、映像復号部2061と、画像展開部2062と、逆量子化部2063と、逆ウェーブレット変換部2064と有する。
映像復号部2061は、受信した変位量ビットストリームを、映像符号化によって復号することで映像を出力するように構成されている。
例えば、映像復号部2061は、非特許文献1のHEVCを用いてもよい。
また、映像復号部2061は、動きベクトルを常にゼロとした映像符号化方式を用いてもよい。例えば、映像復号部2061は、HEVCの動きベクトルを常にゼロとし、常に同一位置でのインター予測を用いてもよい。
また、映像復号部2061は、変換を常にスキップするとした映像符号化方式を用いてもよい。例えば、映像復号部2061は、HEVCの変換を常に変換スキップモードとし、変換せずに映像符号化方式を用いてもよい。
画像展開部2062は、映像復号部2061で復号された映像を、画像(フレーム)ごとにレベル値として展開して出力するように構成されている。
かかる展開方法において、画像展開部2062は、制御情報によって示された画像へのレベル値の並べ方から、逆算して特定できる。
画像展開部2062は、レベル値の並べ方として、例えば、高周波成分から低周波成分のレベル値が画像中にラスタ操作順に並べてもよい。
逆量子化部2063は、画像展開部2062で生成されたレベル値を逆量子化することによって変換係数を生成して出力するように構成されている。
逆ウェーブレット変換部2064は、逆量子化部2063で生成された変換係数に対して逆ウェーブレット変換を施すことによって復号変位量を生成して出力するように構成されている。
上述のメッシュ符号化装置100及びメッシュ復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
1…メッシュ処理システム
100…メッシュ符号化装置
200…メッシュ復号部
201…多重分離部
202…基本メッシュ復号部
202A…分離部
202B…イントラ復号部
202B1…任意イントラ復号部
202B2…整列部
202C…メッシュバッファ部
202D…接続情報復号部
202E…インター復号部
202E1…動きベクトル復号部
202E2…動きベクトルバッファ部
202E3…動きベクトル予測部
202E4…動きベクトル算出部
202E5…加算器
202E6…重複頂点探索部
202E7…重複頂点判別部
202E8…動きベクトル取得部
203…細分割部
203A…基本メッシュ細分割部
203A1…基本面分割数バッファ部
203A2…基本面分割数参照部
203A3…基本面分割数予測部
203A4…加算部
203A5…基本面分割部
203B…細分割メッシュ調整部
204…メッシュ復号部
205…パッチ統合部
206…変位量復号部
206A…復号部
206B、2063…逆量子化部
206C、2064…逆ウェーブレット変換部
206D…加算器
206E…インター予測部
206F…フレームバッファ
206G…逆DCT部
2062…画像展開部
207、2061…映像復号部


Claims (6)

  1. メッシュ復号装置であって、
    インター復号部を備え、
    前記インター復号部は、
    参照フレームの復号済みの基本メッシュから、前記参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得し、
    前記対応関係に基づいて、前記復号対象のフレームの頂点の接続情報を前記参照フレームの頂点の接続情報と同一とするように構成されていることを特徴とするメッシュ復号装置。
  2. 前記インター復号部は、
    前記復号対象のフレームのビットストリームから、動きベクトル残差を生成するように構成されている動きベクトル残差復号部と、
    動きベクトルバッファ部から、復号対象の頂点と接続している頂点の復号済みの動きベクトルを取得し、取得された前記復号済みの動きベクトルの全部又は一部を用いて、前記復号対象の頂点の動きベクトルの予測値を出力するように構成されている動きベクトル予測部と、
    前記動きベクトル残差復号部で生成された前記動きベクトル残差と前記動きベクトル予測部から出力された前記動きベクトルの予測値とを加算することで、前記復号対象の頂点の動きベクトルを出力するように構成されている動きベクトル算出部と、を備えることを特徴とする請求項1に記載のメッシュ復号装置。
  3. 前記動きベクトル予測部は、前記復号対象の頂点の周りにある頂点の復号済みの動きベクトルを平均することによって、前記復号対象の動きベクトルの予測値を出力するように構成されていることを特徴とする請求項2に記載のメッシュ復号装置。
  4. 前記動きベクトル予測部は、前記復号対象の頂点の周りにある頂点の復号済みの動きベクトルに対して、前記復号対象の頂点及び前記復号対象の頂点の周りにある頂点に対応する前記参照フレームの頂点間の距離に応じた重みで加重平均することで、前記復号対象の動きベクトルの予測値を出力するように構成されていることを特徴とする請求項2に記載のメッシュ復号装置。
  5. メッシュ復号方法であって、
    参照フレームの復号済みの基本メッシュから、前記参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得する工程と、
    前記対応関係に基づいて、前記復号対象のフレームの頂点の接続情報を前記参照フレームの頂点の接続情報と同一とする工程と、を有することを特徴とするメッシュ復号方法。
  6. コンピュータを、メッシュ復号装置として機能させるプログラムであって、
    前記メッシュ復号装置は、
    インター復号部を備え、
    前記インター復号部は、
    参照フレームの復号済みの基本メッシュから、前記参照フレームの頂点と復号対象のフレームの頂点との間の対応関係を取得し、
    前記対応関係に基づいて、前記復号対象のフレームの頂点の接続情報を前記参照フレームの頂点の接続情報と同一とするように構成されていることを特徴とするプログラム。
JP2022110862A 2022-07-09 2022-07-09 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム Pending JP2024008741A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022110862A JP2024008741A (ja) 2022-07-09 2022-07-09 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
PCT/JP2023/008649 WO2024014042A1 (ja) 2022-07-09 2023-03-07 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022110862A JP2024008741A (ja) 2022-07-09 2022-07-09 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2024008741A true JP2024008741A (ja) 2024-01-19

Family

ID=89536391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022110862A Pending JP2024008741A (ja) 2022-07-09 2022-07-09 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム

Country Status (2)

Country Link
JP (1) JP2024008741A (ja)
WO (1) WO2024014042A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8830235B1 (en) * 1999-09-13 2014-09-09 Alcatel Lucent Non-uniform relaxation procedure for multiresolution mesh processing
EP2216750A1 (en) * 2009-02-06 2010-08-11 Thomson Licensing Method and apparatus for encoding 3D mesh models, and method and apparatus for decoding encoded 3D mesh models
US10389994B2 (en) * 2016-11-28 2019-08-20 Sony Corporation Decoder-centric UV codec for free-viewpoint video streaming
WO2019107181A1 (ja) * 2017-12-01 2019-06-06 ソニー株式会社 送信装置、送信方法、および受信装置

Also Published As

Publication number Publication date
WO2024014042A1 (ja) 2024-01-18

Similar Documents

Publication Publication Date Title
KR102387363B1 (ko) 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
JP6523406B2 (ja) 動き情報の復号化方法
JP5616984B2 (ja) 画像復号化装置
WO2012035640A1 (ja) 動画像符号化方法及び動画像復号化方法
JP7269456B2 (ja) 画像データ符号化/復号化方法及び装置
JP2020529781A (ja) インター予測モードベースの画像処理方法及びそのための装置
WO2024014044A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024014196A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024014042A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024014195A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024014045A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024014043A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
CN114375578A (zh) 用于残差编码的图像解码方法及其设备
JP2020120322A (ja) 距離画像符号化装置およびそのプログラム、ならびに、距離画像復号装置およびそのプログラム
WO2024079983A1 (ja) メッシュ復号装置、メッシュ復号方法及びプログラム
WO2024079981A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2024079982A1 (ja) メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム
WO2022219867A1 (ja) 点群復号装置、点群符号化装置、点群処理システム、点群復号方法及びプログラム
JP6510084B2 (ja) 動画像復号化方法及び電子装置
JP5957513B2 (ja) 動画像復号化方法
JP2023025237A (ja) 動画像符号化装置及び動画像復号化装置
JP2024006359A (ja) 画像復号装置、画像復号方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220729