JP7330306B2 - 変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体 - Google Patents

変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体 Download PDF

Info

Publication number
JP7330306B2
JP7330306B2 JP2021578138A JP2021578138A JP7330306B2 JP 7330306 B2 JP7330306 B2 JP 7330306B2 JP 2021578138 A JP2021578138 A JP 2021578138A JP 2021578138 A JP2021578138 A JP 2021578138A JP 7330306 B2 JP7330306 B2 JP 7330306B2
Authority
JP
Japan
Prior art keywords
order
transform
sub
point
num
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021578138A
Other languages
English (en)
Other versions
JP2022540569A (ja
Inventor
チャン、ウェイ
ヤン、フーチョン
ワン、シューアイ
マー、イェンチュオ
フオ、チュンイェン
チャン、スーチュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Publication of JP2022540569A publication Critical patent/JP2022540569A/ja
Application granted granted Critical
Publication of JP7330306B2 publication Critical patent/JP7330306B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

本願の実施例はビデオコーデックの技術分野に関し、特に変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体に関する。
幾何ベースの点群圧縮(G-PCC、Geometry-based Point Cloud Compression)エンコーダフレームにおいて、点群の幾何情報及び各点群に対応する属性情報は別々に符号化されるのである。幾何符号化が完了した後、幾何情報を再構築するが、属性情報の符号化は再構築された幾何情報に依存する。
現在、属性情報の符号化は主にカラー情報の符号化である。まず、カラー情報をRGBカラー空間からYUVカラー空間に変換する。次に、再構築された幾何情報を利用して点群を改めて着色し、符号化されていない属性情報を再構築された幾何情報に対応させる。カラー情報の符号化において、主に2つの変換方法があり、一方としては詳細レベル(LOD、Level of Detail)分割に依存する距離に基づくアップ変換であり、他方としては直接に行われる領域適応階層変換(RAHT、Region Adaptive Hierarchal Transform)であり、この2つの方法はいずれもカラー情報を空間領域から周波数領域に変換し、変換により高周波係数及び低周波係数を取得し、最後に係数を量子化して符号化し、バイナリビットストリームを生成する。RAHT変換は点群データに対して8分木分割を行って取得した階層構造を基に行われるのであり、8分木の最下層から最上層まで変換し、各層における各ノードを繰り返しトラバーザルする。各ノードのRAHT変換はいずれも変換順序に従って三次元座標のx、y及びz方向において順次行われる。
ところが、異なる点群は異なる空間分布を有するため、RAHT変換を行うとき、一定の変換順序に従って取得した変換係数は依然として情報冗長性が比較的に高く、それによって符号化効率が比較的に低い。
本願の実施例は変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体を提供し、変換により取得される変換係数の冗長度を減少させ、符号化効率を向上させることができる。
本願の実施例の技術案は以下のように実現され得る。
第1態様では、本願の実施例は変換方法を提供し、エンコーダに適用され、
符号化対象点群における符号化対象点の法線ベクトルを決定することと、
前記符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計することと、
前記法線ベクトルの各座標成分の総和に基づいて変換順序を決定することと、を含む。
第2態様では、本願の実施例は更に変換方法を提供し、エンコーダに適用され、
符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定することと、
前記3つの二次元投影面に基づいて各座標面の投影面積を統計することと、
前記投影面積に基づいて変換順序を決定することと、を含む。
第3態様では、本願の実施例は更に逆変換方法を提供し、
属性ビットストリームから変換順序を解析することと、
復号化の時、前記変換順序に基づいて領域適応階層変換(RAHT)逆変換を行うことと、を含む。
第4態様では、本願の実施例はエンコーダを提供し、
符号化対象点群における符号化対象点の法線ベクトルを決定するように構成される決定部と、
前記符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計するように構成される取得部と、を備え、
前記決定部は更に、前記法線ベクトルの各座標成分の総和に基づいて変換順序を決定するように構成される。
第5態様では、本願の実施例は更にエンコーダを提供し、
符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定するように構成される決定部と、
前記3つの二次元投影面に基づいて各座標面の投影面積を統計するように構成される取得部と、を備え、
前記決定部は更に、前記投影面積に基づいて変換順序を決定するように構成される。
第6態様では、本願の実施例はデコーダを提供し、
属性ビットストリームから変換順序を解析するように構成される解析部と、
復号化の時、前記変換順序に基づいて領域適応階層変換(RAHT)逆変換を行うように構成される復号化部と、を備える。
第7態様では、本願の実施例は更にエンコーダを提供し、
実行可能命令を記憶するための第1メモリと、
前記第1メモリに記憶される実行可能命令を実行するとき、第1態様に記載の方法又は第2態様に記載の方法を実現するための第1プロセッサと、を備える。
第8態様では、本願の実施例は更にデコーダを提供し、
実行可能命令を記憶するための第2メモリと、
前記第2メモリに記憶される実行可能命令を実行するとき、第3態様に記載の方法を実現するための第2プロセッサと、を備える。
第9態様では、本願の実施例はコンピュータ可読記憶媒体を提供し、符号化に適用され、実行可能命令が記憶され、実行可能命令は、第1プロセッサにより実行されるとき、第1態様に記載の方法又は第2態様に記載の方法を実現することに用いられる。
第10態様では、本願の実施例はコンピュータ可読記憶媒体を提供し、デコーダに適用され、実行可能命令が記憶され、実行可能命令は、第2プロセッサにより実行されるとき、第3態様に記載の方法を実現することに用いられる。
本願の実施例に係る変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体では、符号化対象点群における符号化対象点の法線ベクトルを決定することと、符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計することと、法線ベクトルの各座標成分の総和に基づいて変換順序を決定することと、を含む。上記技術案を用いることにより、エンコーダが属性符号化を行う過程において、RAHT変換の実現に対して、符号化対象点の法線ベクトルにより各座標成分の法線ベクトルの各座標成分の総和を統計し、最終的に法線ベクトルの各座標成分の総和に基づいてRAHT変換を行う変換順序を決定するのである。そうすると、法線ベクトル蓄積を考慮した上で、特徴が顕著である方向における変換を優先的に行い、変換により取得された変換係数の冗長度を減少させ、コーデック効率を向上させる目的を実現する。
図1は本願の実施例に係る例示的な符号化プロセスのブロック図である。 図2は本願の実施例に係る例示的な復号化プロセスのブロック図である。 図3Aは本願の実施例に係る例示的な二次元モートン符号化の模式図1である。 図3Bは本願の実施例に係る例示的な二次元モートン符号化の模式図2である。 図4Aは本願の実施例に係る例示的な三次元モートン符号化の模式図1である。 図4Bは本願の実施例に係る例示的な三次元モートン符号化の模式図2である。 図5は本願の実施例に係る例示的な階層型RAHT変換の模式図である。 図6は本願の実施例に係る例示的な階層型RAHT変換の変換係数を記憶する模式図である。 図7は本願の実施例に係る例示的な階層型RAHT逆変換の変換係数を記憶する模式図である。 図8Aは本願の実施例に係る変換方法のフローチャート1である。 図8Bは本願の実施例に係る変換方法のフローチャート2である。 図9は本願の実施例に係る変換方法のフローチャート3である。 図10は本願の実施例に係る例示的な変換順序の模式的なフローチャートである。 図11は本願の実施例に係る変換方法のフローチャート4である。 図12は本願の実施例に係る変換方法のフローチャート5である。 図13は本願の実施例に係る変換方法のフローチャート6である。 図14は本願の実施例に係る変換方法のフローチャート7である。 図15は本願の実施例に係る変換方法のフローチャート8である。 図16Aは本願の実施例に係る変換方法のフローチャート9である。 図16Bは本願の実施例に係る変換方法のフローチャート10である。 図17は本願の実施例に係る変換方法のフローチャート11である。 図18は本願の実施例に係る例示的な空間分割の模式図である。 図19は本願の実施例に係る変換方法のフローチャート12である。 図20は本願の実施例に係る変換方法のフローチャート13である。 図21は本願の実施例に係る変換方法のフローチャート14である。 図22は本願の実施例に係る逆変換方法のフローチャートである。 図23は本願の実施例に係るエンコーダの構造模式図1である。 図24は本願の実施例に係るエンコーダの構造模式図2である。 図25は本願の実施例に係るデコーダの構造模式図1である。 図26は本願の実施例に係るデコーダの構造模式図2である。
本願の実施例の特徴及び技術的内容をより詳しく理解するために、以下に図面を参照しながら本願の実施例の実現を詳しく説明し、添付の図面は参照・説明のためのものに過ぎず、本願の実施例を制限するためのものではない。
本願の実施例では、点群G-PCCエンコーダフレームにおいて、三次元画像モデルに入力される点群に対してslice分割を行った後、各sliceを独立して符号化する。
図1に示されるG-PCC符号化プロセスのブロック図において、点群エンコーダに適用され、符号化対象の点群データについては、まずslice分割により点群データを複数のsliceに分割する。各sliceにおいて、点群の幾何情報及び各点群に対応する属性情報は別々に符号化されるのである。幾何符号化過程において、幾何情報に対して座標変換を行い、点群をすべて1つのbounding box(バウンディングボックス)に含ませ、次に量子化し、この量子化は主に拡大縮小の役割を果たし、量子化して整数を取ることにより、一部の点群の幾何情報を同じにし、そうすると、パラメータに基づいて重複点を削除するかどうかを決定し、量子化及び重複点の削除過程は更にボクセル化過程と称される。次に、bounding boxに対して8分木分割を行う。8分木に基づく幾何情報符号化プロセスにおいて、バウンディングボックスを8つのサブ立方体に8等分し、空ではない(点群における点を含む)サブ立方体を8等分し続け、分割により取得された葉ノードが1x1x1の単位立方体になると分割を停止し、葉ノードにおける点を算術符号化して、バイナリの幾何ビットストリームを生成する。trisoup(triangle soup、三角形スープ)に基づく幾何情報符号化過程において、同様にまず8分木分割を行う必要があるが、8分木に基づく幾何情報符号化と違って、該trisoupは点群を辺長1x1x1の単位立方体に段階的に分割する必要がなく、block(サブブロック)の辺長がWになると分割を停止し、各blockにおける点群の分布により形成された表面に基づいて、該表面とblockの12個の辺とにより形成された多くとも12個のvertex(交点)を取得し、vertexを算術符号化して(交点に基づいて表面フィッティングを行って)、バイナリの幾何ビットストリームを生成する。Vertexは更に幾何再構築過程の実現に使用され、再構築された幾何情報は点群の属性を符号化する際に使用される。
属性符号化過程において、幾何符号化が完了し、幾何情報を再構築した後、カラー変換し、カラー情報(即ち属性情報)をRGBカラー空間からYUVカラー空間に変換する。次に、再構築された幾何情報を利用して点群を改めて着色し、符号化されていない属性情報を再構築された幾何情報に対応させる。カラー情報符号化過程において、主に2つの変換方法があり、一方としては詳細レベル(LOD、Level of Detail)分割に依存する距離に基づくアップ変換であり、他方としては直接に領域適応階層変換(RAHT、Region Adaptive Hierarchal Transform)を行う変換であり、この2つの方法はいずれもカラー情報を空間領域から周波数領域に変換し、変換により高周波係数及び低周波係数を取得し、最後に係数を量子化し(即ち量子化係数)、最後に、8分木分割及び表面フィッティング後の幾何符号化データと量子化係数処理後の属性符号化データとをslice合成した後、各blockのvertex座標を順次符号化(即ち算術符号化)して、バイナリの属性ビットストリームを生成する。
図2に示されるG-PCC復号化プロセスのブロック図において、点群デコーダに適用される。デコーダはバイナリビットストリームを取得し、バイナリビットストリームにおける幾何ビットストリーム及び属性ビットストリームをそれぞれ独立して復号化する。幾何ビットストリームを復号化するとき、算術復号化-8分木複合-表面フィッティング-幾何再構築-逆座標変換により点群の幾何情報を取得し、属性ビットストリームを復号化するとき、算術復号化-逆量子化-LODに基づく逆アップ又はRAHTに基づく逆変換-逆カラー変換により点群の属性情報を取得し、幾何情報及び属性情報に基づいて符号化対象の点群データの三次元画像モデルを復元する。
図3A及び図3Bを参照して説明し、高位低位の配列順序がここでz、y、x(x|(y<<1)|(z<<2))である場合を例として説明する。
図3Aには8*8の画像の各画素の空間コードを示し、000000から111111まで、一次元バイナリ数で、x、y値の0~7での位置座標を符号化する。バイナリ座標値を交差して、バイナリz値図を取得する。数値方向に沿ってz字型を接続して、再帰するz字型の曲線を生成する。図面では、各位置に接続順序に従ってz値が置かれる。実際に、上記図面はz方向に反復してなるものであり、00~11(図面全体に1つのzがある)から、更に0000~1111(前のzの各点に1つのzを置く)から、更に000000~111111(前のzの各点に1つのzを置く)から1回あたりに2ビット追加して、再帰していく。
例示的に、図3Bには2x2、4x4、8x8及び16x16空間符号化順序を示し、そこから分かるように、モートンコードの符号化順序は空間z順序に従って実現されるのである。
3次元の場合は、その再帰過程は図4A及び図4Bに示され、座標の交差が実現され、全体的に行われているのは座標値を絶えず分散させることである。x|(y<<1)|(z<<2)であり、即ち各座標値が分散し、各ビットが順次交差し、まずはzで次にはyで最後にはxである。復号化過程は即ちアグリゲーション過程である。
RAHT変換は点群データに対して8分木分割を行って取得した階層構造を基に行われるのであり、8分木の最下層からスタートして、階層に分けて変換される。図5に示すように、8分木分割が終了した後にボクセルブロック1(即ち、図5におけるカラー深さが交錯する3種類の幾何体であり、各ブロックがいずれも点群における点を表す)を取得する。最下層からRAHT変換を行い、変換順序xyzを例とし、下記図5に示すように、まずx方向に沿ってRAHT変換を行う。x方向に隣接するボクセルブロックが存在する場合、両方をRAHTして、隣接する2点の属性値の平均(DC係数)及び詳細(AC係数)を取得する。取得されたDC係数は親ノードのボクセルブロック2の属性情報として存在し、そして次の層のRAHT変換を行うが、AC係数は保留され、最後の符号化に使用される。隣接点が存在しない場合、該ボクセルブロックの属性値を直接に第2層の親ノードに伝達する。第2層のRAHT変換のとき、y方向に沿って行われ、y方向に隣接するボクセルブロックが存在する場合、両方をRAHTして、隣接する2点の属性値の平均(DC係数)及び詳細(AC係数)を取得する。その後、第3層のRAHT変換はz方向に沿って行われ、そしてカラー深さが交錯する3種類の親ノードボクセルブロック3を8分木における次の層のサブノードとして取得し、更に、点群全体に1つの親ノードのみが存在するまでx、y、z方向に沿ってRAHT変換を繰り返し行う。
実際に点群における点のトラバーザルを行うとき、ソートされた点群のモートンコードを利用して行われ、そうすると、図示の8分木における隣接点の結合を容易にする。
本願の実施例では、RAHT変換の具体的なステップについては、
(1)、点群における点の属性値を第1層DC係数とし、且つそれらの重みをすべて1に設定し、RAHT変換をスタートする。
(2)、この層のDC係数及びAC係数を対応のインデックスに基づいて次の層の両親層、親ノードに書き込み、AC係数がなければ書き込まない。
(3)、モートンコードでソートした後のインデックスに従って、インデックスに対応するDC係数をトラバーザルする。
(4)、すべてのDC係数に対応するモートンコードを右へ1ビット移動し、このとき、各DC係数のモートンコードはその親ノードのモートンコードを示す。
(5)、図6に示すように、2つのDC係数のモートンコードが同じであるかどうかを判断し、同じである場合、同じ親ノードにおいて、両方がRAHTを行い、取得されたDC係数を次の層の親ノードのDC係数に書き込み、AC係数を次の層の最後のDC係数に書き込んで2つのDC係数の総和の重みを親ノードのDC係数に与えることを示し、異なる場合、このDC係数及びその重みを直接に次の層に書き込む。
(6)、ある層に1つのみのDC係数が存在するまで、2)~5)を繰り返す。
(7)、最後に、DC係数を量子化して、この層のDC係数及びAC係数の属性値を符号化する。
それに対応して、デコーダブロック図において、RAHTの変換順序はRAHT逆変換にも使用される必要がある。
以下、RAHTの復号化過程について説明する。
RAHT復号化過程はRAHT符号化過程の逆変換であり、符号化過程と同じように、逆変換の前に、まず点群において各点のモートンコードを計算して、各点のモートンコードMを取得した後、点群における点を昇順でソートして、各点の重み値を1に設定し、RAHT逆過程はモートンコードでソートした後の順序に従って点群におけるすべての点をトラバーザルする。
RAHT変換は階層的に行われるのであり、最下層から点群における隣接点を1層ずつ判断し、重みに基づいて属性値に対してRAHT変換を行う。ところが、RAHT逆変換過程は最上層からスタートし、上から下までRAHTの逆変換を行うのであり、従って、RAHT逆変換の前に各層の重み情報を取得する必要がある。
逆RAHT変換を行う前に、取得されたモートンコード情報を利用して最下層から符号化側における、各層のRAHT隣接ノードに対する判断を1回行うことにより、各層の重み情報及びAC係数の対応位置を取得することができ、1つの層のRAHTを行うたびに、対応のモートンコードを左へ1ビット移動する。重み情報及び各層のノードに対応するモートンコード情報をbufferに記録し、その後の使用に備える。
RAHT逆変換を行うとき、最上層からスタートし、各層のモートンコード情報に基づいて隣接ノードの判断を行い、取得された重み情報及び復号化により取得された属性情報を利用してRAHTの逆変換を行う。図7に示すように、RAHT逆変換は第k+1層から第k層までの過程に相当する。隣接ノードを判断して分かった場合、トラバーザルされたDC係数及び対応のAC係数を取ってRAHTの逆変換を行う。
上記説明される背景に基づいて、以下に本願の実施例に係る各変換方法を説明し、主にエンコーダフレームにおいてRAHT変換の時の変換順序を決定する方式の相違についてであり、エンコーダ(点群エンコーダ)に適用される。
図8Aに示すように、本願の実施例は変換方法を提供し、該方法は、
符号化対象点群における符号化対象点の法線ベクトルを決定するS101と、
符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計するS102と、
法線ベクトルの各座標成分の総和に基づいて変換順序を決定するS103と、を含んでもよい。
本願のいくつかの実施例では、図8Bに示すように、S103の後で、
変換順序に従ってRAHT変換を行うS104と、
変換順序を符号化して、属性ビットストリームに書き込むS105と、を更に含む。
本願の実施例に係る変換方法は点群空間の分布及び表面方向のRAHT変換方法を考慮し、固定した変換順序を用いることなく、RAHT変換を行う前に変換対象ブロック及び所定隣接領域範囲内に含まれる点群の空間分布状況を分析し、該分析により取得された結果に基づいてRAHT変換順序を決定し、これにより、より優れた符号化性能を得る。
本願の実施例では、符号化対象点群は本願の符号化対象点群の符号化対象オブジェクトに対する点群データであり、1つの符号化対象点群について、それがN個の点即ちN個の符号化対象点を含んでもよい。Nは1以上である。エンコーダは符号化対象点群における符号化対象点の法線ベクトルを決定することにより、符号化対象点の法線ベクトルに基づいて三次元空間における法線ベクトルの各座標成分の総和を統計することができ、ここの法線ベクトルの各座標成分の総和は符号化対象点群の三次元空間における主な分布が集中しているという特徴を示す。異なる点群が異なる空間分布を有するため、RAHT変換を行う前に、エンコーダは各符号化対象点群自体の空間分布特性に対して、それ自体の分布特徴に適合する変換順序を決定することができ、そうすると、エンコーダは変換順序に従ってRAHT変換を行い、その取得される変換係数は冗長性が低く、それによって符号化効率を向上させることができる。
なお、本願の実施例では、各符号化対象点群の変換順序の決定は異なる可能性があるため、変換順序が決定されたとき、エンコーダは符号化過程において変換順序を属性ビットストリームに書き込む必要がある。例えば、この順序を3ビットのビットストリームによりデコーダに伝送することができ、それによってデコーダは復号化の時に直接にRAHTの変換順序を解析することができる。
本願の実施例では、符号化対象点は符号化対象点群における複数のオブジェクトであり、エンコーダは各符号化対象点の法線ベクトルに基づいて、複数の符号化対象点のx座標成分でのx軸法線ベクトルの各座標成分の総和、複数の符号化対象点のy座標成分でのy軸法線ベクトルの各座標成分の総和、及び複数の符号化対象点のz座標成分でのz軸法線ベクトルの各座標成分の総和を統計し、次に、x軸法線ベクトルの各座標成分の総和、y軸法線ベクトルの各座標成分の総和及びz軸法線ベクトルの各座標成分の総和の分布の密集又は分布の大小に基づいて、密集度又は法線ベクトル蓄積が比較的に多い順序を決定することができ、これにより、変換順序を取得し、変換順序は多いから少ない量の順の法線ベクトル分布順序に対応する。
本願の実施例では、変換順序の決定方式は、エンコーダが符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の絶対値の和を統計し、絶対値の和が法線ベクトルの各座標成分の総和を示し、そして絶対値の和を降順でソートし、変換順序を決定する、ということである。
なお、本願の実施例では、エンコーダが法線ベクトルの各座標成分の絶対値の和を統計することについての実現は、まず各座標成分のすべての法線ベクトルを統計し、次に正規化後に絶対値の和を求める、ということであり、本願の実施例の法線ベクトルはいずれも正規化後の法線ベクトルを用いて使用されるのである。
理解されるように、エンコーダは法線ベクトル推定方法を用いて各点の法線ベクトル情報を取得する。取得された異なる方向の法線ベクトルの総和に基づいて、RAHT変換方向の順序を判断し、即ち、符号化対象点群の空間分布状況を分析することにより、符号化対象点群に対して法線ベクトルの予測及び各方向に沿って和を求める計算を行ってRAHT変換順序を取得し、G-PCC属性符号化部の符号化効率及び符号化性能を改善する。
本願のいくつかの実施例では、図8B、図9に示すように、S101の具体的な実現は、
符号化対象点群の属性情報を取得するS1011と、
符号化対象点群の属性情報に符号化対象点の法線ベクトルが存在するかどうかを判断するS1012と、
存在する場合、直接に符号化対象点の法線ベクトルを取得するS1013と、
存在しない場合、符号化対象点の所定隣接領域範囲内の隣接領域点の幾何情報に基づいて符号化対象点の法線ベクトルを決定するS1014と、を含む。
本願の実施例では、エンコーダは属性符号化を行うとき、符号化対象点群のヘッダ情報により属性情報を取得することができ、且つここの属性情報は点のカラー情報及び追加の法線ベクトル情報を含んでもよい。即ち、本願の実施例では、符号化対象点群における符号化対象点に対して、エンコーダが解析してできた属性情報には、いくつかの符号化対象点群における符号化対象点の法線ベクトルが含まれる可能性があり、全て含まれる可能性もあるし、一部含まれる可能性もあるし、全て含まれない可能性もある。これらの状況に対して、エンコーダは取得された符号化対象点群の属性情報を検出し、各符号化対象点に対して、符号化対象点群の属性情報にこの符号化対象点の法線ベクトルが存在するかどうかを判断することができる。存在する場合、直接に属性情報から符号化対象点の法線ベクトルを取得し、それと同時に、エンコーダは符号化対象点群の幾何情報を取得することができ、即ち符号化対象点の空間座標情報を取得する。存在しない場合、符号化対象点の所定隣接領域範囲内の隣接領域点の幾何情報に基づいて符号化対象点の法線ベクトルを決定する。
即ち、属性情報から自体に対応する法線ベクトルを見つけない符号化対象点は、法線ベクトル推定を行うことにより取得する必要がある。
なお、符号化対象点群自体が各点の法線ベクトルを含まない場合、法線ベクトル推定の方法を用いて各点の法線ベクトル情報を計算する。取得された異なる方向の法線ベクトルの総和に基づいてRAHT変換順序を判断する。
本願のいくつかの実施例では、幾何情報は空間座標情報を含み、それ自体に各点の法線ベクトルが含まれない点群に対して、エンコーダは所定隣接領域範囲内の符号化対象点に最も近い少なくとも1つの隣接領域点を取得し、少なくとも1つの隣接領域点の幾何情報を取得し、少なくとも1つの隣接領域点の幾何情報及び所定のフィッティング曲面方程式に基づいて、少なくとも1つの隣接領域点からフィッティング平面までの少なくとも1つの距離を決定し、少なくとも1つの距離の二乗和の最小化に基づいて所定のフィッティング曲面方程式に対応するシステム特徴ベクトルを取得し、システム特徴ベクトルを符号化対象点の法線ベクトルとする。
本願のいくつかの実施例では、エンコーダは更に、符号化対象点の所定隣接領域範囲内の隣接領域点の属性情報に基づいて符号化対象点の法線ベクトルを決定する。例えば、属性情報に少なくとも1つの隣接領域点の法線ベクトルが含まれる場合、エンコーダは属性情報から少なくとも1つの隣接領域点の法線ベクトルを取得し、更に少なくとも1つの隣接領域点の法線ベクトルに基づいて符号化対象点の法線ベクトルを決定することができる。
なお、エンコーダは属性情報から1つの隣接領域点の法線ベクトルのみを見つけた場合、この隣接領域点の法線ベクトルを符号化対象点の法線ベクトルとして決定し、エンコーダは属性情報から複数の隣接領域点の法線ベクトルのみを見つけた場合、この複数の隣接領域点の法線ベクトルの平均値を符号化対象点の法線ベクトルとして決定する。
理解されるように、エンコーダは各点の法線方向を利用して点群空間分布を求めることができ、その目的はいずれも、RAHTのX、Y、Zの3つの方向に沿う最適なRAHT変換順序を決定し、AC変換係数の分布を最適化し、AC係数の冗長性をなくし、それにより符号化効率を向上させることである。
図11に示すように、本願の実施例は変換方法を提供し、該方法は以下を含んでもよい。
S201、符号化対象点群の属性情報を取得する。
S202、符号化対象点群の属性情報に符号化対象点の法線ベクトルが存在するかどうかを判断する。
S203、存在する場合、直接に符号化対象点の法線ベクトルを取得する。
なお、ここのS201~S203の実現は上記実施例におけるS1011~S1013の実現の説明と同様であり、ここで詳細な説明は省略する。
S204、存在しない場合、モートンコードの順序に従って符号化対象点群をトラバーザルし、所定隣接領域範囲内の符号化対象点に最も近い少なくとも1つの隣接領域点を選択する。
S205、少なくとも1つの隣接領域点の幾何情報を取得する。
S206、少なくとも1つの隣接領域点の幾何情報及び所定のフィッティング曲面方程式に基づいて、少なくとも1つの隣接領域点からフィッティング平面までの少なくとも1つの距離を決定する。
S207、少なくとも1つの距離の二乗和の最小化に基づいて所定のフィッティング曲面方程式に対応するシステム特徴ベクトルを取得し、システム特徴ベクトルを符号化対象点の法線ベクトルとする。
本願の実施例では、それ自体に各点の法線ベクトルが含まれない点群に対して採用し得る法線ベクトル推定方法は、局所的に表面フィッティングされるPCA主成分分析法に基づいて法線ベクトルを取得する方法であり、更にSVD法線ベクトル推定方法を用いてもよい。
所定のフィッティング曲面方程式は原点を通らない平面方程式と、原点を通る平面方程式とを含む。エンコーダが採用する所定のフィッティング曲面方程式が原点を通らない平面方程式である場合、PCA主成分分析法による法線ベクトルの推定を実現する。エンコーダが採用する所定のフィッティング曲面方程式が原点を通る平面方程式である場合、SVD法による線ベクトル推定を実現する。
PCA主成分分析法においては、符号化対象点群における各符号化対象点の法線ベクトル推定を行うとき、該点の所定隣接領域範囲内の他の点の空間座標情報、即ち隣接領域点の空間座標情報を利用する必要があるが、隣接領域点の空間座標情報は幾何情報から取得され得る。高速のK近隣サーチ方法を用いて符号化対象点群に対して各点のモートンコードを計算し、符号化対象点群における符号化対象点のモートンコードを昇順でソートして、モートンコードの順序を取得し、モートンコードの順序に従って各点に対してソートされる周りの一定範囲点内(所定隣接領域範囲内)で最も近いK個の点を選択してそのK最近隣点とする。
なお、所定隣接領域範囲については本願の実施例は制限せず、実際の設定範囲を基準とする。少なくとも1つの隣接領域点Kの選択は異なってもよく、Kが小さければ小さいほど、計算の複雑度が小さくなるとともに、取得された法線ベクトルの誤差が大きくなる。Kが大きければ大きいほど、法線方向を求める計算の複雑度が大きくなるが、求めた法線方向の誤差が比較的に小さい。
このような主成分分析法PCAによって、符号化対象点群におけるすべての符号化対象点の法線ベクトルを取得した後、X、Y、Zの各方向のすべての法線ベクトル投影の絶対値の和を求め、次にその和を求めて得た値を降順でソートして、変換順序を取得する。
理解されるように、エンコーダはフィッティング曲線をできる限り平面に接近させることにより、原点を通る平面及び原点を通らない平面等の方式で法線ベクトルの推定を行うことを提案し、法線ベクトル推定を各状況においていずれも正確に実行させ、法線ベクトルの推定精度を向上させ、更に変換順序の最適性を向上させ、最終的に符号化性能を向上させる。
S208、符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計する。
S209、法線ベクトルの各座標成分の総和に基づいて変換順序を決定する。
S210、変換順序に従って変換を行う。
S211、変換順序を符号化して、属性ビットストリームに書き込む。
なお、ここのS208~S211の実現過程は前述のS102~105の実現過程と同様であり、ここで詳細な説明は省略する。
本願のいくつかの実施例では、図12に示すように、S204の実現との置換可能な実現はS214である。
S214、存在しない場合、空間距離に基づいて符号化対象点群をトラバーザルし、所定隣接領域範囲内の符号化対象点に最も近い少なくとも1つの隣接領域点を選択する。
本願の実施例では、それ自体に各点の法線ベクトルが含まれない点群に対して、エンコーダはK近隣サーチを行うとき、空間距離に基づくサーチ方法を用いて空間距離的に最も近いK近隣接領域点(少なくとも1つの隣接領域点)を見つけてもよい。各点の隣接領域点を正確に見つけるために、符号化対象点群におけるすべての点をトラバーザルしてK近隣のサーチを行ってもよい。
詳しくは、符号化対象点群におけるすべての点をトラバーザルし、すべての点と現在符号化対象点との空間距離を決定し、その中から空間距離が最も小さい1つ又は複数の点を見つければ、K近隣接領域点を決定することができる。
本願のいくつかの実施例では、図13に示すように、S204の実現との置換可能な実現はS215~S216である。
S215、存在しない場合、符号化対象点群に対してK-D木分割を行って、階層構造を取得する。
S216、階層構造をトラバーザルして、符号化対象点と同じ階層に属する点を少なくとも1つの隣接領域点として取得する。
本願の実施例では、それ自体に各点の法線ベクトルが含まれない点群に対して、多次元2分木(K-D、K-dimension binary tree)に基づいてトラバーザルし、それによって隣接領域点をサーチする。
本願の実施例では、エンコーダは符号化対象点群に対してK-D木分割を行って、階層構造を取得する。即ち、エンコーダは点群における点に対してまずK-D木の分割を行い、即ちまずx方向に沿って点群における点を座標の大小順序でソートし、そして中間点の1番目の根ノードの座標を見つけて、点群を同じ点数の2つの部分の中央値に分割して、その後、順に異なる座標軸(x、y、zの順序)の2つの葉ノードに沿って点群を分割し、点数がP(Pは整数である)を越えない最後の層まで分割して、階層構造を取得する。階層構造をトラバーザルして、符号化対象点と同じ階層に属する点を少なくとも1つの隣接領域点として取得し、即ちサブ木の単位で法線ベクトルの計算を行う。
理解されるように、K-D分割を用いる場合、各ノードはいずれも符号化対象点であり、8分木の親ノードが結合後の点であるのに比べて、直接に符号化対象点を判断し、そうすると、変換順序を取得する方式はより正確であり、符号化精度を向上させる。
図14に示すように、本願の実施例は変換方法を提供し、該方法は以下を含んでもよい。
S301、符号化対象点群から特徴点を選択する。
S302、特徴点に対して法線ベクトル推定を行って、特徴点の法線ベクトルを取得する。
S303、符号化対象点と空間距離的に符号化対象点に最も近い隣接領域点とが連続するかどうかを判断する。
S304、連続し且つ隣接領域点が特徴点に属する場合、隣接領域点の法線ベクトルを符号化対象点の法線ベクトルとする。
S305、連続しない場合、符号化対象点の所定隣接領域範囲内の隣接領域点の幾何情報に基づいて符号化対象点の法線ベクトルを決定する。
本願の実施例では、エンコーダは更に、まず符号化対象点群からいくつかの点を特徴点として選択し、まず前述した実施例における法線ベクトル推定方法により各特徴点の法線ベクトルを計算してもよく、そうすると、他の符号化対象点の法線ベクトルの決定を行うとき、エンコーダは空間距離的に最も近い隣接領域点が連続するかどうかを判断した後、連続する場合には、隣接領域点法線ベクトルを用いて現在符号化対象点を示すことができることを示し、連続しない場合、現在符号化対象点と連続する隣接領域点が存在しないことを示し、そこで直接に前述した実施例の法線ベクトル推定方法に基づいて取得する。しかしながら、隣接領域点を見つけることができ、且つ隣接領域点が特徴点に属する場合、隣接領域点の法線ベクトルは既に分かったものであり、エンコーダは隣接領域点の法線ベクトルを符号化対象点の法線ベクトルとすることができる。
なお、エンコーダはモートンコードの順序に従って所定隣接領域範囲内でバックトレースし、符号化対象点と空間距離的に符号化対象点に最も近い隣接領域点とが連続するかどうかを判断するのである。
なお、ここのS304~305の実現は前述の実施例におけるS1013~S1014の実現の説明と同様であり、ここで詳細な説明は省略する。
理解されるように、エンコーダは符号化対象点に空間的に最も近い隣接領域及びモートンコードも連続する隣接領域をサーチすることができ、符号化順序の近接を確保するだけではなく、空間実際位置の近接も確保し、そうすると、隣接領域点の法線ベクトルで符号化対象点を正確に示すことができ、法線ベクトルの推定精度を向上させ、更に変換順序の最適性を向上させ、最終的に符号化性能を向上させる。
S306、符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計する。
S307、法線ベクトルの各座標成分の総和に基づいて変換順序を決定する。
S308、変換順序に従ってRAHT変換を行う。
S309、変換順序を符号化して、属性ビットストリームに書き込む。
なお、ここのS306~309の実現は前述の実施例におけるS102~S105の実現の説明と同様であり、ここで詳細な説明は省略する。
図15に示すように、本願の実施例は変換方法を提供し、該方法は、
符号化対象点群に対して所定ブロック分割を行って、n個の所定ブロックを取得するS401と、
n個の所定ブロックのうちの各所定ブロックにおける符号化対象点の法線ベクトルを決定するS402と、
符号化対象点の法線ベクトルに基づいて各所定ブロックにおける法線ベクトルの各座標成分の総和を統計するS403と、
各所定ブロックに対応する法線ベクトルの各座標成分の総和に基づいて、各所定ブロックに対応する変換順序を決定するS404と、
変換順序に従って各所定ブロックに対してRAHT変換を行うS405と、
各所定ブロックに対応する変換順序を符号化して、属性ビットストリームに書き込むS406と、を含んでもよい。
本願の実施例では、エンコーダは所定ブロック分割を行って、n個の所定ブロックを取得し、n個の所定ブロックのうちの各所定ブロックにおける符号化対象点の法線ベクトルを決定し、1つの所定ブロックを単位として、符号化対象点の法線ベクトルに基づいて、各所定ブロックにおける法線ベクトルの各座標成分の総和を統計し、更に各所定ブロックに対応する法線ベクトルの各座標成分の総和に基づいて各所定ブロックに対応する変換順序を決定し、直接に各所定ブロック及びその各所定ブロックに対応する変換順序に対して、それぞれ各所定ブロックに対してRAHT変換を行い、各所定ブロックに対応する変換順序を符号化して、属性ビットストリームに書き込むことができる。
なお、点群属性のRAHT変換を行うとき、符号化対象点群を分割し、分割により取得された異なる領域に対応する異なる点群に対して、それぞれRAHTの3つの方向における順序の判断を行うことができる。具体的な領域分割方式は異なってもよく、本例では、slice分割スキームを用い、即ちMPEG G-PCCにおける点群slice分割方法に基づいて、点群を異なるslice(即ち所定ブロック)に分割し、各sliceに含まれる点群を更に法線ベクトル推定方法でRAHT変換方向順序の判断を1回行い、即ち異なるsliceが異なるRAHT変換順序を用いる可能性がある。
例えば、所定ブロックはsliceより小さく且つ8分木の葉ノードより大きなblock等であってもよく、本願の実施例は制限しない。
理解されるように、slice分割を用いる場合、各sliceに基づいて符号化を並行して行うことができ、耐障害機能及び符号化速度も向上する。
図16Aに示すように、本願の実施例は変換方法を提供し、該方法は、
符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定するS601と、
3つの二次元投影面に基づいて各座標面の投影面積を統計するS602と、
投影面積に基づいて変換順序を決定するS603と、を含んでもよい。
図16Bに示すように、本願の実施例は変換方法を提供し、S603の後で、
変換順序に従ってRAHT変換を行うS604と、
変換順序を符号化して、属性ビットストリームに書き込むS605と、を更に含む。
本願の実施例では、エンコーダは三次元点群(即ち符号化対象点群)における各点(符号化対象点)をそれぞれ三次元空間からなる3つの座標面(X、Y、Z座標軸からなる3つの面)、即ちXoY平面、YoZ平面及びXoZ平面に投影して、最終的に符号化対象点の3つの二次元投影、即ち3つの二次元投影面を取得する。エンコーダは各二次元投影面の面積を計算し、各座標面の投影面積を統計し、ここの投影面積は符号化対象点群の三次元空間における主な分布が集中しているという特徴を表す。投影面積に基づいて変換順序を決定する。異なる点群が異なる空間分布を有するため、RAHT変換を行う前に、エンコーダは各符号化対象点群自体の空間分布特性に対して、その自体の分布特徴に適する変換順序を決定することができ、そうすると、エンコーダが変換順序に従って行ったRAHT変換では、取得した変換係数は冗長性が低く、更に符号化効率を向上させることができる。
なお、本願の実施例では、投影面積に基づいて変換順序を決定することは、各投影面上の投影点の数を統計し、投影面の数が多ければ多いほど、変換順序が優先されるという原則に従って、RAHTの変換順序を決定することであってもよい。
理解されるように、異なる点群が異なる空間分布を有するため、RAHT変換を行う前に、エンコーダは各符号化対象点群自体の空間分布特性に対して、その自体の分布特徴に適する変換順序を決定することができ、そうすると、エンコーダが変換順序に従って行ったRAHT変換では、取得した変換係数は冗長性が低く、更に符号化効率を向上させることができる。
なお、本願の実施例では、決定された各符号化対象点群の変換順序は異なる可能性があるため、変換順序が決定されたとき、エンコーダは符号化過程において変換順序を属性ビットストリームに書き込む必要がある。例えば、この順序を3ビットのビットストリームによりデコーダに伝送することができ、そうすると、デコーダは復号化の時に直接にRAHTの変換順序を解析することができる。
本願の実施例では、投影面の面積は各投影平面上の投影点の個数で示されてもよい。
例示的に、平面XoY上の投影点数をNum(xoy)と記し、平面YoZ上の投影点数をNum(yoz)と記し、平面ZoX上の投影点数をNum(zox)と記す。投影面積がNum(xoy)>Num(yoz)>Num(zox)である場合、変換順序がyxzであることを決定し、投影面積がNum(xoy)>Num(zox)>Num(yoz)である場合、変換順序がxyzであることを決定し、投影面積がNum(yoz)>Num(xoy)>Num(zox)である場合、変換順序がyzxであることを決定し、投影面積がNum(yoz)>Num(zox)>Num(xoy)である場合、変換順序がzyxであることを決定し、投影面積がNum(zox)>Num(yoz)>Num(xoy)である場合、変換順序がzxyであることを決定し、投影面積がNum(zox)>Num(xoy)>Num(yoz)である場合、変換順序がxzyであることを決定する。
図17に示すように、本願の実施例は変換方法を提供し、該方法は以下を含んでもよい。
S701、所定の立方体辺長に基づいて符号化対象点群を少なくとも1つの立方体サブブロックに分割する。
S702、少なくとも1つの立方体サブブロックのうちの各立方体サブブロックにおける符号化対象ボクセル点の三次元空間からなる3つの座標面での3つの二次元投影面を決定、符号化対象ボクセル点は符号化対象点を示す。
S703、3つの二次元投影面に基づいて各立方体サブブロックに対応する各座標面の投影面積を統計する。
S704、各立方体サブブロックに対応する各座標面の投影面積を降順でソートし、各座標軸面に垂直する座標軸の順序を各立方体サブブロックの変換順序として決定する。
S705、各立方体サブブロックの変換順序に従ってRAHT変換を行う。
S706、各立方体サブブロックの変換順序を符号化して、属性ビットストリームに書き込む。
本願の実施例では、エンコーダは符号化対象点群の位置する空間に対してblock分割を行って、n個のblockを取得することができる。各blockのx、y、zの3つの座標軸のうちの2つごとからなる平面上の投影サイズ又は投影面積を用いてRAHTの変換順序を判断する。
なお、RAHT変換は点群データ(符号化対象点群)に対して8分木分割を行って取得した階層構造を基に行われるのであり、8分木の最下層からスタートして、階層に分けて変換される。エンコーダが符号化対象点群の位置する空間でblock分割を行ってn個のblockを取得する実現過程は図18に示され、エンコーダは点群を8分木の方式で若干の同じサイズのNxNxNのblockに分割し、ここで、Nは固定値に設定され又は異なる点群に基づいてそれぞれ設定されてもよく、本願の実施例は制限しない。即ち、各blockはボクセル点(voxel)とも称されるボクセルをNxNxN個含む。ボクセルの単位は1であり、符号化対象点群における1つの符号化対象点を示す。
本願の実施例では、エンコーダは少なくとも1つの立方体サブブロックのうちの各立方体サブブロックにおける符号化対象ボクセル点の三次元空間からなる3つの座標面での3つの二次元投影面を決定し、符号化対象ボクセル点は符号化対象点を示し、3つの二次元投影面に基づいて各立方体サブブロックに対応する各座標面の投影面積を統計し、更に各立方体サブブロックに対応する各座標面の投影面積を降順でソートし、各座標軸面に垂直する座標軸の順序を各立方体サブブロックの変換順序として決定し、各立方体サブブロックの変換順序に従ってRAHT変換を行い、各立方体サブブロックに対応する変換順序を符号化して、属性ビットストリームに書き込む。
例示的に、各blockにおいて、エンコーダはそのXoY、XoZ及びYoZ平面での投影面積を計算し、エンコーダは3つの投影面における投影総数を統計し、投影総数を投影面積として見なし、投影面積を降順でソートした後、該投影面に垂直する座標軸方向の順序をblockにおけるRAHT変換の順序とし、XoY投影面積がXoZ投影面積より大きく、XoZ投影面積がYoZ投影面積より大きい場合、投影面積の順序はXoY、XoZ及びYoZであり、そうすると、該投影面に垂直する座標軸方向における投XoYにおける投影面の座標軸方向はzであり、該投影面に垂直する座標軸方向XoZにおける投影面の座標軸方向 はyであり、該投影面に垂直する座標軸方向YoZにおける投影面の座標軸方向はxであり、そうすると、XoY、XoZ及びYoZの順序に従って決定した変換順序はzyxである。
なお、点群属性のRAHT変換を行うとき、符号化対象点群を分割し、分割により取得された異なる領域に対応する異なる点群に対して、それぞれRAHTの3つの方向における順序の判断を行うことができる。具体的な領域分割方式は異なってもよく、本例では、block分割スキームを用い、即ちMPEG G-PCCにおける点群block分割方法に基づいて点群をblockに分割し、各blockに含まれる点群を更に投影面積統計の方法でRAHT変換順序の判断を1回行い、即ち異なるblockは異なるRAHT変換順序を使用する可能性がある。
例えば、分割のサイズはslice等であってもよく、本願の実施例は制限しない。
S707、各立方体サブブロックの変換順序に従って各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得する。
S708、各立方体サブブロックに対応する各座標面の投影面積に基づいて、各座標面に対応する投影面積絶対値の和を統計する。
S709、投影面積絶対値の和を降順でソートして、変換順序を取得する。
S710、変換順序に従って各立方体サブブロックのサブボクセル点に対してRAHT変換を行う。
S711、各立方体サブブロックの変換順序を符号化して、属性ビットストリームに書き込む。
本願の実施例では、エンコーダは各立方体サブブロックの変換順序を決定した後、エンコーダは各立方体サブブロックの変換順序に従って各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得し、各立方体サブブロックに対応する各座標面の投影面積に基づいて、各座標面に対応する投影面積絶対値の和を統計し、投影面積絶対値の和を降順でソートして、変換順序を取得し、最後に、変換順序に従って各立方体サブブロックのサブボクセル点に対してRAHT変換を行うことができる。
即ち、エンコーダは各blockの変換順序を取得した後、この変換順序に従って1つのblock内部のRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得し、blockにおけるRAHT変換が終了した後、すべてのblockにおける各方向の投影面積の和を求めて降順でソートして、総RAHT変換順序を取得し、次に、この総RAHT変換順序に従って、取得された各立方体サブブロックのサブボクセル点に対してRAHT変換を行い、最終的に各立方体サブブロックの変換順序を符号化して属性ビットストリームに書き込む必要があり、それによってデコーダが復号化の時に使用することに備える。
理解されるように、符号化対象点の投影面積により各座標成分の投影面積を統計し、最終的には各座標成分の投影面積のサイズに基づいてソートし、RAHT変換を行う変換順序を決定する。そうすると、投影面積の蓄積即ち空間分布特性を考慮した上で、特徴が顕著である方向における変換を優先的に行い、変換により取得された変換係数の冗長度を減少させ、コーデック効率を向上させる目的を実現する。
本願のいくつかの実施例では、図19に示すように、S707の後で、S710の前に、該方法は更に、
各立方体サブブロックに対応する変換順序に基づいて、各立方体サブブロックに対応する主投影方向を取得するS712と、
各立方体サブブロックに対応する主投影方向に基づいて各座標成分の主投影方向の数を統計するS713と、
各座標成分の主投影方向の数を降順でソートして、変換順序を取得するS714と、を含む。
本願の実施例では、エンコーダが各blockの変換順序を判断する方式は更に、各立方体サブブロックの変換順序に従って各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得した後、各立方体サブブロックの変換順序における主投影方向を取得し、各立方体サブブロックの主投影方向に基づいて各座標成分の主投影方向の数を統計し、各座標成分の主投影方向の数を降順でソートして、変換順序を取得する、ということであってもよく、該変換順序に従って符号化対象点群全体に対してRAHT変換を行うことができる。
なお、本願の実施例では、各立方体サブブロックに対応する主投影方向は、各立方体サブブロックに対応する変換順序における1番目の座標方向である。
例示的に、エンコーダが符号化対象点群を3つのblockに分割すると仮定する。block1の変換順序はxyzであり、block2の変換順序はzyxであり、block3の変換順序はzxyであり、そうすると、エンコーダはblock1の主投影方向がxであり、block2の主投影方向がzであり、block3の主投影方向がzであることを取得し、3つの主投影方向を取得した後、各立方体サブブロックに対応する主投影方向に基づいて統計したx分の主投影方向の数は1であり、統計したy分の主投影方向の数は0であり、統計したz分の主投影方向の数は2であり、2>1>0であるため、各座標成分の主投影方向の数を降順でソートして取得した変換順序はzxyである。
図20に示すように、S713の実現過程は、
各立方体サブブロックに対応する主投影方向から所定比率のサブ立方体サブブロックに対応する主投影方向を選択するS7131と、
サブ立方体サブブロックに対応する主投影方向に基づいて各座標成分の主投影方向の数を統計するS7132と、を含んでもよい。
本願の実施例では、エンコーダは符号化対象点群の位置する空間をN個のblockに分割し、N個のblockから所定比率のサブ立方体ブロックを選択し、サブ立方体サブブロックに対応する主投影方向を用いて各座標成分の主投影方向の数を統計し、更に変換順序を取得することができる。
所定比率は10%であってもよく、これは実際のニーズ及び設計に応じて決定されるものであり、本願の実施例は制限しない。
例示的に、エンコーダは符号化対象点群の位置する空間を100個のblockに分割し、主投影方向が100個あり、所定比率が10%である場合、エンコーダは100個のblockから10個のblockを選択して、その三次元主投影方向に基づいて、各座標成分の主投影方向の数を統計することができる。
理解されるように、一部のblockを用いて統計することにより、処理速度を向上させ、演算量を低減させる。
図21に示すように、本願のいくつかの実施例では、S702の前に、方法は更に、
符号化対象点群における符号化対象点を中心として少なくとも1つの立方体サブブロックを構築するS715を含む。
本願の実施例では、エンコーダが符号化対象点群の位置する空間に対してブロック分割を行う方式は更に、各符号化対象点を中心又は中心軸として用いて、各符号化対象点をボクセル中心とする長さNxNxNボクセルの立方体サブブロックを構築することであってもよい。
これの、直接にblock分割を行う方式との相違点は、各blockにおけるボクセルブロックはblockを中心として分割されるものであり、各ボクセルにおける点の分布は点がどのボクセルに位置するかによって決定される、ということである。そして、ここの立方体サブブロックにおける各ボクセルの分割は各符号化対象点を中心として単位1で分割するものであり、ボクセルとボクセルとの間に重複が存在する可能性がある。
本願の実施例では、よりよいRAHT変換順序の決定方法を用いることにより再構築された点群に性能ゲインを与えることができる。下記表1に示すように、再構築された点群のPSNRが低下し、且つBD-rateも著しく向上する。(PSNRは画像を評価する客観的基準であり、PSNRが大きければ大きいほど、画像の品質が高くなる。BD-rateは性能の高低を評価するパラメータであり、BD-rateが負数である場合は性能が高くなることを示し、これを基に、BD-rateの絶対値が大きければ大きいほど、性能ゲインが大きくなる。)
Figure 0007330306000019
表1から分かるように、4つの点群に対して、それぞれ異なる変換順序を用いてRAHT変換を行って取得したAverage平均ゲインはいずれも顕著であり、エンコーダの性能が大幅に向上する。
理解されるように、このような実現手段では、各ボクセルが符号化対象点を中心とするため、取得したボクセルの投影面積を符号化対象点の投影面積とすると、より正確である。
前述した背景に基づいて、以下に本願の実施例に係る変換方法を説明し、主にデコーダフレームにおいてRAHT逆変換を行う際に変換順序を取得する過程に対するものであり、デコーダ(点群デコーダ)に適用される。
図22に示すように、本願の実施例は逆変換方法を提供し、デコーダに適用され、
属性ビットストリームから変換順序を解析するS801と、
復号化の時、変換順序に従ってRAHT逆変換を行うS802と、を含む。
本願の実施例では、符号化ビットストリームがデコーダに伝送されると、該デコーダは符号化ビットストリームにおける属性ビットストリームから変換順序を解析することができ、そうすると、デコーダがRAHT逆変換を行うとき、変換順序を使用して実現することができる。
理解されるように、エンコーダは符号化対象点群の空間分布特徴に基づいて、各符号化対象点群に対応する最適なRAHT変換の変換順序を決定する。そうすると、法線ベクトル蓄積を考慮した上で、特徴が顕著である方向における変換を優先的に行い、変換により取得された変換係数の冗長度を減少させ、コーデック効率を向上させる目的を実現し、各符号化対象点群に対応する変換順序が異なる可能性があるため、符号化の時に変換順序も符号化して属性ビットストリームに書き込む必要があり、デコーダが復号化してRAHT逆変換を行う際に使用することに備える。
前述した実施例の実現に基づいて、図23に示すように、本願の実施例はエンコーダ1を提供し、
符号化対象点群における符号化対象点の法線ベクトルを決定するように構成される決定部10と、
前記符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計するように構成される取得部11と、を備え、
前記決定部10は更に、前記法線ベクトルの各座標成分の総和に基づいて変換順序を決定するように構成される。
本願のいくつかの実施例では、前記エンコーダは更に変換部及び符号化部を備える。
前記変換部12は、変換順序に従ってRAHT変換を行うように構成され、
前記符号化部13は、前記変換順序を符号化して属性ビットストリームに書き込むように構成される。
本願のいくつかの実施例では、前記エンコーダは更に判断部14を備え、
前記取得部11は更に、符号化対象点群の属性情報を取得するように構成され、
前記判断部14は更に、前記符号化対象点群の属性情報に前記符号化対象点の法線ベクトルが存在するかどうかを判断するように構成され、
前記取得部11は更に、存在する場合、直接に前記符号化対象点の法線ベクトルを取得するように構成され、
前記決定部10は更に、存在しない場合、前記符号化対象点の所定隣接領域範囲内の隣接領域点の属性情報に基づいて前記符号化対象点の法線ベクトルを決定するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記所定隣接領域範囲内の前記符号化対象点に最も近い少なくとも1つの隣接領域点を取得し、前記少なくとも1つの隣接領域点の幾何情報を取得するように構成され、
前記決定部10は更に、前記少なくとも1つの隣接領域点の幾何情報及び所定のフィッティング曲面方程式に基づいて、前記少なくとも1つの隣接領域点からフィッティング平面までの少なくとも1つの距離を決定するように構成され、
前記取得部11は更に、前記少なくとも1つの距離の二乗和の最小化に基づいて前記所定のフィッティング曲面方程式に対応するシステム特徴ベクトルを取得し、前記システム特徴ベクトルを前記符号化対象点の法線ベクトルとするように構成される。
本願のいくつかの実施例では、前記所定のフィッティング曲面方程式は、原点を通らない平面方程式と、原点を通る平面方程式とを含む。
本願のいくつかの実施例では、前記取得部11は更に、モートンコードの順序に従って前記符号化対象点群をトラバーザルし、所定隣接領域範囲内の前記符号化対象点に最も近い前記少なくとも1つの隣接領域点を選択するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、空間距離に基づいて前記符号化対象点群をトラバーザルし、所定隣接領域範囲内の前記符号化対象点に最も近い前記少なくとも1つの隣接領域点を選択するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記所定隣接領域範囲内の前記符号化対象点に最も近い少なくとも1つの隣接領域点を取得した後、前記少なくとも1つの隣接領域点の法線ベクトルを取得し、前記特徴点に対して法線ベクトル推定を行って、前記特徴点の法線ベクトルを取得するように構成される。
本願のいくつかの実施例では、前記エンコーダは更に判断部14を備え、
前記決定部10は更に、前記符号化対象点群から特徴点を選択し、前記特徴点に対して法線ベクトル推定を行って、前記特徴点の法線ベクトルを取得するように構成され、
前記判断部14は、前記符号化対象点と空間距離的に前記符号化対象点に最も近い隣接領域点とが連続するかどうかを判断するように構成され、
前記決定部10は更に、連続し且つ前記隣接領域点が前記特徴点に属する場合、隣接領域点の法線ベクトルを前記符号化対象点の法線ベクトルとし、連続しない場合、前記符号化対象点の所定隣接領域範囲内の隣接領域点の幾何情報に基づいて前記符号化対象点の法線ベクトルを決定するように構成される。
本願のいくつかの実施例では、前記判断部14は更に、モートンコードの順序に従って所定隣接領域範囲内でバックトレースし、前記符号化対象点と空間距離的に前記符号化対象点に最も近い隣接領域点とが連続するかどうかを判断するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記符号化対象点群に対して所定ブロック分割を行って、n個の所定ブロックを取得するように構成され、
前記決定部10は更に、前記n個の所定ブロックのうちの各所定ブロックにおける符号化対象点の法線ベクトルを決定するように構成され、
前記取得部11は更に、前記符号化対象点の法線ベクトルに基づいて各所定ブロックにおける法線ベクトルの各座標成分の総和を統計するように構成される。
本願のいくつかの実施例では、前記決定部10は更に、前記各所定ブロックに対応する前記法線ベクトルの各座標成分の総和に基づいて、前記各所定ブロックに対応する変換順序を決定するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の絶対値の和を統計するように構成され、前記絶対値の和は前記法線ベクトルの各座標成分の総和を示す。
本願のいくつかの実施例では、前記決定部10は更に、前記絶対値の和を降順でソートして、前記変換順序を決定するように構成される。
本願の実施例は更にエンコーダ1を提供し、
符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定するように構成される決定部10と、
前記3つの二次元投影面に基づいて各座標面の投影面積を統計するように構成される取得部11と、を備え、
前記決定部10は更に、前記投影面積に基づいて変換順序を決定するように構成される。
本願のいくつかの実施例では、前記エンコーダは更に変換部及び符号化部を備える。
前記変換部12は、変換順序に従ってRAHT変換を行うように構成され、
前記符号化部13は、前記変換順序を符号化して、属性ビットストリームに書き込むように構成される。
本願のいくつかの実施例では、前記取得部11は更に、所定の立方体辺長に基づいて前記符号化対象点群を少なくとも1つの立方体サブブロックに分割し、前記少なくとも1つの立方体サブブロックのうちの各立方体サブブロックにおける符号化対象ボクセル点の三次元空間からなる3つの座標面での3つの二次元投影面を決定し、前記符号化対象ボクセル点は前記符号化対象点を示し、前記3つの二次元投影面に基づいて前記各立方体サブブロックに対応する各座標面の投影面積を統計するように構成される。
本願のいくつかの実施例では、前記決定部10は更に、前記各立方体サブブロックに対応する各座標面の投影面積を降順でソートし、各座標軸面に垂直する座標軸の順序を各立方体サブブロックの変換順序として決定するように構成される。
本願のいくつかの実施例では、前記変換部12は更に、前記各立方体サブブロックに対応する各座標面の投影面積を降順でソートし、各座標軸面に垂直する座標軸の順序を各立方体サブブロックの変換順序として決定した後、前記各立方体サブブロックの変換順序に従って前記各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得するように構成され、
前記取得部11は更に、前記各立方体サブブロックに対応する各座標面の投影面積に基づいて、各座標面に対応する投影面積絶対値の和を統計し、前記投影面積絶対値の和を降順でソートして、前記変換順序を取得するように構成され、
前記変換部12は更に、前記変換順序に従って各立方体サブブロックのサブボクセル点に対してRAHT変換を行うように構成され、
前記符号化部13は更に、前記各立方体サブブロックの変換順序を符号化して属性ビットストリームに書き込むように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記各立方体サブブロックの変換順序に従って前記各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得した後、且つ前記変換順序に従って各立方体サブブロックのサブボクセル点に対してRAHT変換を行う前に、前記各立方体サブブロックに対応する変換順序に基づいて、各立方体サブブロックに対応する主投影方向を取得し、各立方体サブブロックに対応する主投影方向に基づいて各座標成分の主投影方向の数を統計し、前記各座標成分の主投影方向の数を降順でソートして、前記変換順序を取得するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記各立方体サブブロックに対応する主投影方向から所定比率のサブ立方体サブブロックに対応する主投影方向を選択し、前記サブ立方体サブブロックに対応する主投影方向に基づいて前記各座標成分の主投影方向の数を統計するように構成される。
本願のいくつかの実施例では、前記取得部11は更に、前記少なくとも1つの立方体サブブロックのうちの各立方体サブブロックにおける符号化対象ボクセル点の三次元空間からなる3つの座標面での3つの二次元投影面を決定する前に、前記符号化対象点群における符号化対象点を中心として前記少なくとも1つの立方体サブブロックを構築するように構成される。
本願のいくつかの実施例では、前記決定部10は更に、前記投影面積がNum(xoy)>Num(yoz)>Num(zox)である場合、変換順序がyxzであることを決定し、前記投影面積がNum(xoy)>Num(zox)>Num(yoz)である場合、変換順序がxyzであることを決定し、前記投影面積がNum(yoz)>Num(xoy)>Num(zox)である場合、変換順序がyzxであることを決定し、前記投影面積がNum(yoz)>Num(zox)>Num(xoy)である場合、変換順序がzyxであることを決定し、前記投影面積がNum(zox)>Num(yoz)>Num(xoy)である場合、変換順序がzxyであることを決定し、前記投影面積がNum(zox)>Num(xoy)>Num(yoz)である場合、変換順序がxzyであることを決定するように構成される。
実際の応用では、図24に示すように、本願の実施例は更にエンコーダを提供し、
実行可能命令を記憶するための第1メモリ15と、
前記第1メモリ15に記憶される実行可能命令を実行するとき、エンコーダ側の変換方法を実現するための第1プロセッサ16と、を備える。
プロセッサはソフトウェア、ハードウェア、ファームウェア又はそれらの組み合わせにより実現されてもよく、回路、単一又は複数の特定用途向け集積回路(ASIC、application specific integrated circuits)、単一又は複数の汎用集積回路、単一又は複数のマイクロプロセッサ、単一又は複数のプログラマブルロジックデバイス、又は上記回路又はデバイスの組み合わせ、又は他の適切な回路又はデバイスを使用することができ、これにより、該プロセッサは上記実施例における変換方法の対応ステップを実行することができる。
本願の実施例はコンピュータ可読記憶媒体を提供し、実行可能命令が記憶され、実行可能命令は、第1プロセッサにより実行されるとき、エンコーダ側の変換方法を実現することに用いられる。
本願の実施例の各構成部分は1つの処理ユニットに統合されてもよく、各ユニットは独立して物理的に存在してもよく、2つ以上のユニットが1つのユニットに統合されてもよい。上記統合されたユニットはハードウェアの形式で実現されてもよく、ソフトウェア機能モジュールの形式で実現されてもよい。
前記統合されたユニットはソフトウェア機能モジュールの形式で実現され、独立した製品として販売又は使用されるときは、1つのコンピュータ可読記憶媒体に記憶されてもよい。このような理解に基づいて、本実施例の技術案の本質的又は従来技術に貢献する部分、又は該技術案の全部又は一部はソフトウェア製品の形式で具現されてもよい。該コンピュータソフトウェア製品は、1台のコンピュータ装置(パーソナルコンピュータ、サーバ又はネットワーク装置等であってもよい)又はprocessor(プロセッサ)に本実施例に記載の方法の全部又は一部のステップを実行させるための若干の命令を含む1つの記憶媒体に記憶される。そして、上記記憶媒体は磁気ランダムアクセスメモリ(FRAM、ferromagnetic random access memory)、読み出し専用メモリ(ROM、Read Only Memory)、プログラム可能読み出し専用メモリ(PROM、Programmable Read-Only Memory)、消去可能プログラム可能読み出し専用メモリ(EPROM、Erasable Programmable Read-Only Memory)、電気的消去可能プログラム可能読み出し専用メモリ(EEPROM、Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリ(Flash Memory)、磁気表面メモリ、光ディスク、又は読み出し専用光ディスク(CD-ROM、Compact Disc Read-Only Memory)等のプログラムコードを記憶できる様々な媒体を含み、本開示の実施例は制限しない。
図25に示すように、本願の実施例はデコーダ2を提供し、
属性ビットストリームから変換順序を解析するように構成される解析部20と、
復号化の時、前記変換順序に基づいてRAHT逆変換を行うように構成される復号化部21と、を備える。
実際の応用では、図26に示すように、本願の実施例は更にデコーダを提供し、
実行可能命令を記憶するための第2メモリ22と、
前記第2メモリ22に記憶される実行可能命令を実行するとき、デコーダ側の変換方法を実現するための第2プロセッサ23と、を備える。
本願の実施例はコンピュータ可読記憶媒体を提供し、実行可能命令が記憶され、実行可能命令は、第2プロセッサにより実行されるとき、デコーダ側の変換方法を実現することに用いられる。
理解されるように、エンコーダは属性符号化を行う過程において、RAHT変換の実現に対して、符号化対象点の法線ベクトルにより法線ベクトルの各座標成分の総和を統計し、最終的に法線ベクトルの各座標成分の総和に基づいてRAHT変換を行う変換順序を決定する。そうすると、法線ベクトル蓄積を考慮した上で、特徴が顕著である方向における変換を優先的に行い、変換により取得された変換係数の冗長度を減少させ、コーデック効率を向上させる目的を実現する。
本願の実施例は変換方法、エンコーダ、デコーダ及びコンピュータ可読記憶媒体を提供し、符号化対象点群における符号化対象点の法線ベクトルを決定することと、符号化対象点の法線ベクトルに基づいて法線ベクトルの各座標成分の総和を統計することと、法線ベクトルの各座標成分の総和に基づいて変換順序を決定することと、変換順序に従ってRAHT変換を行うことと、変換順序を符号化して属性ビットストリームに書き込むことと、を含む。エンコーダは属性符号化を行う過程において、RAHT変換の実現に対して、符号化対象点の法線ベクトルにより法線ベクトルの各座標成分の総和を統計し、最終的に法線ベクトルの各座標成分の総和に基づいてRAHT変換を行う変換順序を決定する。そうすると、法線ベクトル蓄積を考慮した上で、特徴が顕著である方向における変換を優先的に行い、変換により取得された変換係数の冗長度を減少させ、コーデック効率を向上させる目的を実現する。

Claims (15)

  1. エンコーダに適用される変換方法であって、
    符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定することと、
    前記3つの二次元投影面に基づいて各座標面の投影面積を統計することと、
    前記投影面積に基づいて変換順序を決定することと、を含む変換方法。
  2. 前記投影面積に基づいて変換順序を決定した後、前記方法は更に、
    前記変換順序に基づいて領域適応階層変換(RAHT)変換を行うことと、
    前記変換順序を符号化して、ビットストリームに書き込むことと、を含む請求項に記載の方法。
  3. 符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定することは、
    所定の立方体辺長に基づいて前記符号化対象点群を少なくとも1つの立方体サブブロックに分割することと、
    前記少なくとも1つの立方体サブブロックのうちの各立方体サブブロックにおける符号化対象ボクセル点の三次元空間からなる3つの座標面での3つの二次元投影面を決定し、前記符号化対象ボクセル点は前記符号化対象点を示すことと、を含み、
    前記3つの二次元投影面に基づいて各座標面の投影面積を統計することは、
    前記3つの二次元投影面に基づいて前記各立方体サブブロックに対応する各座標面の投影面積を統計することを含み、
    前記方法は更に、
    前記符号化対象点群における符号化対象点を中心として前記少なくとも1つの立方体サブブロックを構築することを含む請求項1又は2に記載の方法。
  4. 前記投影面積に基づいて変換順序を決定することは、
    前記各立方体サブブロックに対応する各座標面の投影面積を降順でソートし、各座標軸面に垂直する座標軸の順序を各立方体サブブロックの変換順序として決定することを含み、
    前記方法は更に、
    前記各立方体サブブロックの変換順序に従って前記各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得することと、
    前記各立方体サブブロックに対応する各座標面の投影面積に基づいて、各座標面に対応する投影面積絶対値の和を統計することと、
    前記投影面積絶対値の和を降順でソートして、前記変換順序を取得することと、
    前記変換順序に従って各立方体サブブロックのサブボクセル点に対してRAHT変換を行うことと、
    前記各立方体サブブロックの変換順序を符号化して、ビットストリームに書き込むことと、を含む請求項に記載の方法。
  5. 前記各立方体サブブロックの変換順序に従って前記各立方体サブブロックの符号化対象ボクセル点に対してRAHT変換を行って、各立方体サブブロックのサブボクセル点を取得した後、且つ前記変換順序に従って各立方体サブブロックのサブボクセル点に対してRAHT変換を行う前に、前記方法は更に、
    前記各立方体サブブロックに対応する変換順序に基づいて、各立方体サブブロックに対応する主投影方向を取得することと、
    各立方体サブブロックに対応する主投影方向に基づいて各座標成分の主投影方向の数を統計することと、
    前記各座標成分の主投影方向の数を降順でソートして、前記変換順序を取得することと、を含む請求項に記載の方法。
  6. 各立方体サブブロックに対応する主投影方向に基づいて各座標成分の主投影方向の数を統計することは、
    前記各立方体サブブロックに対応する主投影方向から所定比率のサブ立方体サブブロックに対応する主投影方向を選択することと、
    前記サブ立方体サブブロックに対応する主投影方向に基づいて前記各座標成分の主投影方向の数を統計することと、を含む請求項に記載の方法。
  7. 前記投影面積に基づいて変換順序を決定することは、
    前記投影面積がNum(xoy)>Num(yoz)>Num(zox)である場合、変換順序がyxzであることを決定し、
    前記投影面積がNum(xoy)>Num(zox)>Num(yoz)である場合、変換順序がxyzであることを決定し、
    前記投影面積がNum(yoz)>Num(xoy)>Num(zox)である場合、変換順序がyzxであることを決定し、
    前記投影面積がNum(yoz)>Num(zox)>Num(xoy)である場合、変換順序がzyxであることを決定し、
    前記投影面積がNum(zox)>Num(yoz)>Num(xoy)である場合、変換順序がzxyであることを決定し、
    前記投影面積がNum(zox)>Num(xoy)>Num(yoz)である場合、変換順序がxzyであることを決定することを含む請求項に記載の方法。
  8. 復号化に適用される逆変換方法であって、
    ビットストリームから変換順序を解析することと、
    復号化の時、前記変換順序に基づいて領域適応階層変換(RAHT)逆変換を行うことと、を含む逆変換方法。
  9. 前記ビットストリームは属性情報を含む請求項8に記載の方法。
  10. 前記変換順序は座標軸の順序である請求項8に記載の方法。
  11. 復号化の時、点群における各点をモートンコードでソートし、点群におけるすべての点をモートンコードでソートした後の順序に基づいて、RAHT逆変換を行うことを更に含む請求項8に記載の方法。
  12. 各点の重み値を1とする請求項11に記載の方法。
  13. 重みに基づいて、属性値に対してRAHT逆変換を行う請求項12に記載の方法。
  14. エンコーダであって、
    符号化対象点群における符号化対象点の三次元空間からなる3つの座標面での3つの二次元投影面を決定するように構成される決定部と、
    前記3つの二次元投影面に基づいて各座標面の投影面積を統計するように構成される取得部と、を備え、
    前記決定部は更に、前記投影面積に基づいて変換順序を決定するように構成されるエンコーダ。
  15. デコーダであって、
    ビットストリームから変換順序を解析するように構成される解析部と、
    復号化の時、前記変換順序に基づいて領域適応階層変換(RAHT)逆変換を行うように構成される復号化部と、を備えるデコーダ。
JP2021578138A 2019-06-30 2019-06-30 変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体 Active JP7330306B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/094105 WO2021000205A1 (zh) 2019-06-30 2019-06-30 变换方法、逆变换方法、编码器、解码器及存储介质

Publications (2)

Publication Number Publication Date
JP2022540569A JP2022540569A (ja) 2022-09-16
JP7330306B2 true JP7330306B2 (ja) 2023-08-21

Family

ID=74100843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021578138A Active JP7330306B2 (ja) 2019-06-30 2019-06-30 変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体

Country Status (6)

Country Link
US (2) US11412259B2 (ja)
EP (1) EP3993424A4 (ja)
JP (1) JP7330306B2 (ja)
KR (1) KR20220027882A (ja)
CN (2) CN113875254A (ja)
WO (1) WO2021000205A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220029595A (ko) * 2019-07-03 2022-03-08 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 포인트 클라우드 인코딩과 디코딩 방법, 인코더, 디코더 및 컴퓨터 저장 매체
JP7307260B2 (ja) * 2019-07-03 2023-07-11 エルジー エレクトロニクス インコーポレイティド ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置及びポイントクラウドデータ受信方法。
WO2021002594A1 (ko) * 2019-07-04 2021-01-07 엘지전자 주식회사 포인트 클라우드 데이터 처리 장치 및 방법
CN114402621A (zh) * 2019-09-30 2022-04-26 Oppo广东移动通信有限公司 变换方法、逆变换方法、编码器、解码器及存储介质
KR102381163B1 (ko) * 2020-01-07 2022-04-01 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US11741637B2 (en) * 2020-02-10 2023-08-29 Tencent America LLC Node-based geometry and attribute coding for a point cloud
US20230206509A1 (en) * 2021-12-27 2023-06-29 Advanced Micro Devices, Inc. Systems and method for generating morton code
EP4250234A1 (en) * 2022-03-25 2023-09-27 Beijing Xiaomi Mobile Software Co., Ltd. Encoding/decoding positions of points of a point cloud emcompassed in a cuboid volume
WO2023191605A1 (ko) * 2022-04-01 2023-10-05 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
WO2024043659A1 (ko) * 2022-08-22 2024-02-29 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN116503409B (zh) * 2023-06-28 2023-09-12 矽瞻科技(成都)有限公司 一种焊缝缺陷3d点云检测方法、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015513719A (ja) 2012-02-09 2015-05-14 トムソン ライセンシングThomson Licensing 3dモデルを表現するビットストリームを処理するための方法及び装置
US20170347100A1 (en) 2016-05-28 2017-11-30 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
WO2019103009A1 (ja) 2017-11-22 2019-05-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106464743B (zh) * 2014-04-11 2019-10-01 诺基亚通信有限责任两合公司 软件定义联网中的多租赁
US20170214943A1 (en) * 2016-01-22 2017-07-27 Mitsubishi Electric Research Laboratories, Inc. Point Cloud Compression using Prediction and Shape-Adaptive Transforms
US11297346B2 (en) * 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds
US10694210B2 (en) * 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression
CN108632607B (zh) * 2018-05-09 2019-06-21 北京大学深圳研究生院 一种基于多角度自适应帧内预测的点云属性压缩方法
US11803989B2 (en) * 2020-01-08 2023-10-31 Qualcomm Incorporated Quantization for geometry-based point cloud compression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015513719A (ja) 2012-02-09 2015-05-14 トムソン ライセンシングThomson Licensing 3dモデルを表現するビットストリームを処理するための方法及び装置
US20170347100A1 (en) 2016-05-28 2017-11-30 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
WO2019103009A1 (ja) 2017-11-22 2019-05-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
G-PCC codec description v2,MPEG 125-Marrakesh,N18189,ISO/IEC JCT1/SC29/WG11,2019年01月18日,https://mpeg.chiariglione.org/standards/mpeg-i/geometry-based-point-cloud-compression/g-pcc-codec-description-v2

Also Published As

Publication number Publication date
EP3993424A4 (en) 2023-03-01
CN114363634A (zh) 2022-04-15
US11412259B2 (en) 2022-08-09
US11843803B2 (en) 2023-12-12
US20220124371A1 (en) 2022-04-21
KR20220027882A (ko) 2022-03-08
WO2021000205A1 (zh) 2021-01-07
JP2022540569A (ja) 2022-09-16
CN113875254A (zh) 2021-12-31
EP3993424A1 (en) 2022-05-04
US20220329858A1 (en) 2022-10-13

Similar Documents

Publication Publication Date Title
JP7330306B2 (ja) 変換方法、逆変換方法、エンコーダ、デコーダ及び記憶媒体
WO2021000658A1 (zh) 点云编解码方法、编码器、解码器及计算机存储介质
EP2697985B1 (en) Method for encoding a mesh model, encoded mesh model and method for decoding a mesh model
CN110708560A (zh) 点云数据处理方法和装置
JP7386337B2 (ja) 分割方法、符号器、復号器及びコンピュータ記憶媒体
JP7425899B2 (ja) 点群の符号化及び復号方法
WO2021062743A1 (zh) 占位信息的预测方法、编码器、解码器、及存储介质
US11936909B2 (en) Prediction method, encoder, decoder, and computer storage medium
US20220207781A1 (en) Transform method, inverse transform method, encoder, decoder and storage medium
JP2024050705A (ja) 属性情報の予測方法、エンコーダ、デコーダ及び記憶媒体
Xu et al. Dynamic point cloud geometry compression via patch-wise polynomial fitting
WO2021062771A1 (zh) 颜色分量预测方法、编码器、解码器及计算机存储介质
JP2023549447A (ja) 点群階層化方法、デコーダ、エンコーダ及び記憶媒体
JP2023514034A (ja) イントラ予測方法、装置、エンコーダ、デコーダ及び記憶媒体
Wang et al. Point-voting based point cloud geometry compression
WO2022120594A1 (zh) 点云编解码方法、编码器、解码器及计算机存储介质
WO2021108970A1 (zh) 点云处理方法、编码器、解码器及存储介质
KR20220157490A (ko) 인트라 예측 방법, 장치, 인코더, 디코더 및 저장 매체
WO2023155045A1 (zh) 预测的方法和装置、编码器、解码器和编解码系统
JP2023516246A (ja) 区分方法、エンコーダー、デコーダー、及びコンピュータ記憶媒体
CN116458158A (zh) 帧内预测方法及装置、编解码器、设备、存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220523

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230808

R150 Certificate of patent or registration of utility model

Ref document number: 7330306

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150