JP7431742B2 - 三次元物体を表すポイントクラウドを符号化/復号する方法及び装置 - Google Patents

三次元物体を表すポイントクラウドを符号化/復号する方法及び装置 Download PDF

Info

Publication number
JP7431742B2
JP7431742B2 JP2020549779A JP2020549779A JP7431742B2 JP 7431742 B2 JP7431742 B2 JP 7431742B2 JP 2020549779 A JP2020549779 A JP 2020549779A JP 2020549779 A JP2020549779 A JP 2020549779A JP 7431742 B2 JP7431742 B2 JP 7431742B2
Authority
JP
Japan
Prior art keywords
point
projection
point cloud
depth
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020549779A
Other languages
English (en)
Other versions
JPWO2019199531A5 (ja
JP2021518694A (ja
Inventor
ツァイ,カンイン
シュヴェ,ジャン-クロード
オリビエ,ヤニック
Original Assignee
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18306132.4A external-priority patent/EP3614672A1/en
Application filed by インターデジタル ヴイシー ホールディングス, インコーポレイテッド filed Critical インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Publication of JP2021518694A publication Critical patent/JP2021518694A/ja
Publication of JPWO2019199531A5 publication Critical patent/JPWO2019199531A5/ja
Application granted granted Critical
Publication of JP7431742B2 publication Critical patent/JP7431742B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Generation (AREA)

Description

2.分野。
本原理は一般的に、三次元物体を表すポイントクラウドのコーディング及び復号に関する。特に、本原理の技術分野は、ポイントクラウドの投影ベースの符号化/復号に関する。
3.背景。
本節は、様々な技術態様に読者を紹介することを目的としており、以下に説明及び/又は請求されている本原理の様々な態様に関する。この説明は、本原理の様々な態様のより良い理解を容易にするために、背景情報を読者に提供するのに役立つと考えられる。従って、これらの説明は、この観点から読まれるべきであり、先行技術の承認としてではないものとする。
ポイントクラウドは、三次元物体(但し、メッシュのような他のデータフォーマットによって効率的に表されることができない髪又は毛皮のようなより複雑な形状)の外面を表すように通常意図されている点の集合である。ポイントクラウドの各点を、三次元空間位置(三次元空間におけるX、Y、及びZ座標)、及び場合によっては、RGB又はYUV色空間(例えば、透明度、反射率、法線ベクトルなど)で表される色などの他の関連属性によって規定することが多い。
着色ポイントクラウドは、6成分点(X、Y、Z、R、G、B)又は同等に(X、Y、Z、Y、U、V)(但し、(X、Y、Z)は、三次元空間における点の空間位置を規定し、(R、G、B)又は(Y、U、V)は、この点の色を規定する)の集合であってもよい。
下記で、用語「ポイントクラウド」は、着色ポイントクラウドを含む任意のポイントクラウドを意味する。
着色ポイントクラウドは、ポイントクラウドが時間に対して進化するか否かによって静的又は動的であってもよい。動的ポイントクラウドの場合、点の数は、必ずしも一定である必要はないが、一般的に時間と共に進化することに留意すべきである。従って、動的ポイントクラウドは、点の集合の時間順序付きリストである。
実際に、物体を送信又は視察することなく物体の空間構成を共用するために、着色ポイントクラウドを、状態又は建造物のような物体を三次元で走査する文化遺産/建造物などの様々な目的のために使用してもよい。更に、物体が破壊され得る場合の物体(例えば、地震による寺)の知識の保存を保証する方法である。このような着色ポイントクラウドは典型的に、静的で非常に大きい。
別の使用の場合は、三次元表現を使用することによって、地図が、平面に限定されず、起伏を含んでもよい地形及び地図製作にある。
更に、自動車産業及び自律走行車は、ポイントクラウドを使用することができる分野である。自律走行車は、自律走行車のすぐ近くの現実に基づいて安全運転決定を行う環境を「証明する」ことができるはずである。典型的なセンサーは、決定エンジンによって使用される動的ポイントクラウドを生成する。これらのポイントクラウドは、人によって見られるように意図されていない。典型的に、ポイントクラウドは、小さく、必ずしも着色されているわけではなく、高い収集頻度で動的である。ポイントクラウドは、検出物体の物理面の材料と相関がある貴重な情報であり、決定に役立つことができる反射率のような他の属性を有してもよい。
仮想現実(VR)及び没入型世界は、最近ホットな話題になっており、二次元平面ビデオの未来として多くの人によって予測されている。基本的な考えは、視聴者の前で仮想世界を視聴者が単に見ることができる標準的なテレビに対向して視聴者の周囲全体の環境に視聴者を没入させることである。環境内の視聴者の自由によって没入性に幾つかの階調がある。着色ポイントクラウドは、仮想現実世界を配信する優れたフォーマット候補である。着色ポイントクラウドは、静的又は動的であってもよく、典型的に、着色ポイントクラウドの平均サイズは、例えば、一度に数百万点以下である。
エンドユーザに対して実際の記憶/伝送を可能にするのにビットストリームのサイズが十分小さい場合に限り、ポイントクラウド圧縮は、没入型世界に対する三次元物体の記憶/伝送に成功する。
更に、経験の許容できる(又は好ましくは、非常に優れた)品質を維持しながら、帯域幅の妥当な消費で、エンドユーザに動的ポイントクラウドを配信することは重要である。ビデオ圧縮と同様に、時間的相関関係の良い使用法は、動的ポイントクラウドの効率的な圧縮をもたらす重要な要素であると考えられる。
周知の手法は、ポイントクラウドの色情報を表すテクスチャ、及びポイントクラウドの形状情報を表す深度情報を含むビデオを取得し、三次元HEVC(ITUウェブサイト、T推奨、Hシリーズ、h265、https://www.itu.int/rec/T-REC-H.265-201802-I付録Iで仕様が見付けられるHEVCの拡張)などのレガシー符号器を用いてテクスチャ及び深度ビデオをコーディングするために、三次元物体を含む立方体の面に、三次元物体の形状及び色を表す着色ポイントクラウドを投影する。
圧縮の性能は、各投影点に対してビデオ圧縮に近い。しかし、幾つかの内容は、動的ポイントクラウドを考える場合、閉塞、冗長性及び時間的安定性のために、より複雑であることがある。その結果、ポイントクラウド圧縮は、ビット速度に関してビデオ圧縮よりも要求が厳しい。
閉塞に関して、多くの投影を使用することなく複雑なトポロジーの完全な形状を得ることは殆ど不可能である。従って、これらの全投影を符号化/復号するのに必要な資源(計算能力、記憶メモリ)は通常、非常に大きい。
テクスチャ及び深度投影方式を用いたポイントクラウド符号器/復号器(コーデック)が、120回目のMPEG会議中に、最近提案されている。この方式は、ISO/IEC JTC1/SC29 WG11 Doc. N17248,Macau,CN、2017年10月の文献に記載されており、提案方式は、「ポイントクラウド圧縮試験モデルカテゴリ2バージョン0.0(Point cloud compression Test Model Category 2 version 0.0) (TMC2v0)」と呼ばれる。
この符号器/復号器は、動的ポイントクラウドデータを異なるビデオ列の集合に基本的に変換することによって、動的ポイントクラウドの形状及びテクスチャ情報を圧縮する既存のビデオ符号器/復号器を活用する。
特に、既存のビデオ符号器/復号器、例えば、HEVC主プロファイル符号器を用いて、2つのビデオ列(ポイントクラウドデータの形状情報を収集する1つのビデオ列、及びテクスチャ情報、即ち点の色を収集するもう1つのビデオ列)を、生成して圧縮する。
更に、2つのビデオ列を解釈するのに必要な追加メタデータ、即ち、占有マップ及び補助パッチ/ブロック情報を、別々に生成して圧縮する。次に、最終ポイントクラウドビットストリームを生成するように、生成ビデオビットストリーム及びメタデータを一緒に多重化する。更に、メタデータを、算術符号器/復号器などのエントロピー符号器/復号器によって符号化する。
このポイントクラウド符号器/復号器の例示的な符号器2の構造を、図1に表す。
符号器2は、3つの主なブロック、形状圧縮ブロック4、メタデータ圧縮ブロック6及びテクスチャ圧縮ブロック8を含む。
形状圧縮ブロック4は、入力ポイントクラウドを深度パッチに分解する深度パッチ生成ブロック10を含む。
深度パッチ生成処理10は、再構成誤差も最小限にしながら、滑らかな境界を有する最小数の深度パッチにポイントクラウドを分解することを目的とする。深度パッチは、深度値に対応付けられる画素のグループによってポイントクラウドの一部を表す。
一例として、図2に詳述する下記の手法を実施する。
まず、Hugues Hoppe,Tony DeRose,Tom Duchamp,John McDonald,Werner Stuetzle,“Surface reconstruction from unorganized points”,ACM SIGGRAPH 1992 Proceedings,71-78に記載のように、あらゆる点における法線を、102で推定する。
次に、それらの法線によって規定される下記の6つの有向面のうち1つに各点を対応付けることによって、ポイントクラウドの初期クラスタリングを、104で取得する。
-(1.0、0.0、0.0)
-(0.0、1.0、0.0)
-(0.0、0.0、1.0)
-(-1.0、0.0、0.0)
-(0.0、-1.0、0.0)、及び
-(0.0、0.0、-1.0)
より正確には、各点を、最も近い法線を有する平面に対応付ける(即ち、点法線及び平面法線のドット積を最大化する)。
一実施形態によれば、上述の6つの有向面を、下記のように索引付けする。
-(1.0、0.0、0.0)を、クラスター索引0によって索引付けする。
-(0.0、1.0、0.0)を、クラスター索引1によって索引付けする。
-(0.0、0.0、1.0)を、クラスター索引2によって索引付けする。
-(-1.0、0.0、0.0)を、クラスター索引0によって索引付けする。
-(0.0、-1.0、0.0)を、クラスター索引1によって索引付けする。
-(0.0、0.0、-1.0)を、クラスター索引2によって索引付けする。
次に、各点を、対応するクラスターの索引に対応付ける。
次に、点の法線及び最も近い隣接のクラスター索引に基づいて各点に対応付けられたクラスター索引を繰り返し更新することによって、初期クラスタリングを改善する。一実施形態によれば、考えられる点に対して、全隣接点(例えば、三次元空間における現在点までの距離が2未満である全点)を、クラスターAとして知られている1つのクラスターに割り当て、考えられる点を別のクラスターに割り当てる、考えられる点のクラスター索引を、クラスターAに更新する。
次に、接続成分抽出手順を適用する、即ち、同じクラスター索引を有する隣接点を抽出して接続成分を形成することによって、深度パッチを、106で抽出する。一実施形態によれば、下記の2つの条件を同時に満たす全点をグループ化することによって、1つの接続成分を構成する。
-同じクラスター索引を有する全点
-関連接続成分における各点に対して、現在点までの距離が事前定義閾値(例えば、1に等しい)未満である同じ接続成分における少なくとも1つの点が存在する。
各接続成分を、接続成分のクラスター索引(即ち、接続成分に属する点のクラスター索引)に従って投影面に対応付ける。一実施形態は、下記の通りである。
-クラスター索引0を有する接続成分に対するYOZ平面
-クラスター索引1を有する接続成分に対するXOZ平面
-クラスター索引2を有する接続成分に対するXOY平面
同じ投影線に沿った多くの点の場合(投影線は、3つの座標(X、Y、Z)のうち2つの同じ座標を有する点を含む。例えば、投影線は、同じ(X、Y)座標を有する全点から構成されることがある。)をより良く処理するために、2つの深度パッチを、各接続成分に対して生成し、対応する画素の最小及び最大深度値に対応し、D1-D0<=表面厚さ(但し、表面厚さは、最大表面厚さであり、例えば、4に等しい)を満たす深度値D0及びD1を記録する。
より正確には、{H(u、v)}を、同じ画素(u、v)に投影された現在接続成分の点の集合とする。近い層とも呼ばれる第1の深度パッチは、最低深度D0を有する{H(u、v)}内の点の深度を記憶する。遠い層と呼ばれる第2の深度パッチは、区間[D0、D0+表面厚さ]内で最高深度を有する{H(u、v)}内の点を収集する。
深度パッチ生成ブロック10の後に、パッキングブロック12が続く。このパッキングブロック12は、全投影接続成分を二次元グリッドにマップしながら、未使用空間を最小化しようとし、このグリッドのあらゆるT×T(例えば、16×16)ブロック(但し、Tは、ビットストリームに符号化され復号器に送信されるユーザ定義パラメータである)を固有投影接続成分に対応付けることを保証する。二次元グリッド上の各点は、画像上の画素に対応する。
パッキングは、W×Hグリッド(但し、W及びHは、符号化される形状/テクスチャ画像の解像度に対応するユーザ定義パラメータ(例えば、1028×1028)である)にパッチを繰り返し挿入しようとする単純なパッキング戦略を使用する。ラスター走査順序で実行される徹底探索によって、パッチ位置を判定する。パッチの重複無し挿入を保証することができる第1の位置を選択し、パッチによって覆われるグリッドセルを、使用されるようにマーク付けする。現在画像解像度における空空間がパッチに適合することができない場合、グリッドの高さHを、一時的に2倍にし、探索を再度適用する。処理の終わりに、使用グリッドセルに適用するように、Hを切り抜く。二次元グリッドにおけるパッキング位置(各パッチの投影領域のバウンディングボックスの左上隅の位置)、及び各パッチの投影領域のサイズを、圧縮ビットストリームに信号伝送する。
占有マップを、パッキングブロック12からメタデータ圧縮ブロック6に出力する。占有マップは、グリッドの各セルに対して、グリッドの各セルが、空空間に属する、即ち占有されないか、グリッドの各セルが、ポイントクラウドに属する、即ち占有されるかどうかを示す2進マップから構成される(但し、二次元グリッドの1つのセルは、画像生成処理中に深度を伝える画素又は色情報を生成する)。
更に、形状圧縮ブロック4は、画像生成ブロック14を含み、この画像生成ブロック14は、パッキング処理12中に計算される三次元から二次元のマッピング、より詳細には、各接続成分の投影領域のパッキング位置及びサイズを利用して、ポイントクラウドの形状を画像として記憶する。
各接続成分に対して2つの深度パッチを生成するという事実に対応して、2つの画像を生成して、DepthImg0及びDepthImg1と呼ばれるポイントクラウドの形状を記憶する。
符号器2の画像生成ブロック14について、図3を参照して更に詳述する。
画像生成は、各パッチの投影領域のパッキング位置に従って、各パッチのD0値を第2のグリッドの対応する部分に複写するパッキング処理(深度D0パッキング)を含む。
更に、画像生成は、depthImage0の各占有画素に対して、デルタ_深度=D1-D0(D1及びD0は、同じ投影線上にある)であり、対応するD0値を記憶する同じ位置にデルタ_深度を記憶するデルタ深度判定を含む。
更に、画像生成は、下記のような時間インターリービング(depthImage0_0、depthImage1_0、…、depthImage0_i、depthImage1_i、…、depthImage0_n、depthImage1_n)(但し、depthImage0_i及びdepthImage1_iをポイントクラウドフレームiから生成する)を含む。
更に、画像生成は、ビデオ圧縮に適している区分的に滑らかな画像を生成するためにパッチ間の空空間に充填することを目的とするパディング処理20を含む。このパディング処理は、下記のように進む単純なパディング戦略を使用する。
・T×T(例えば、16×16)画素の各ブロックを独立して処理する。
・ブロックが空である(即ち、全画素が空空間に属する)場合、ラスター順序で前のT×Tブロックの最後の行又は列を複写することによって、ブロックの画素に充填する。
・ブロックが一杯である(即ち、空画素がない)場合、何もしない。
・ブロックが空画素及び充填画素の両方を有する場合、非空隣接の平均値を空画素に繰り返し充填する。
画像生成ブロック14の後に、深度ビデオ符号化ブロック21が続く。この深度ビデオ符号化ブロック21では、HM16などの任意のレガシービデオ符号器/復号器を用いて、生成深度画像を、ビデオフレームとして記憶して圧縮する。HM構成に従う16個のビデオ符号器/復号器を、パラメータとして与える。
符号器2のメタデータ圧縮ブロック6において、パッチ毎/接続成分メタデータと呼ばれる下記のメタデータを、下記のように、あらゆる接続成分に対して、収集して符号化する。
・投影面の索引
○平面(1.0、0.0、0.0)及び(-1.0、0.0、0.0)に対する索引0
○平面(0.0、1.0、0.0)及び(0.0、-1.0、0.0)に対する索引1
○平面(0.0、0.0、1.0)及び(0.0、0.0、-1.0)に対する索引2
・パック形状/テクスチャ画像上の二次元バウンディングボックス(u0、v0、u1、v1)
・深度シフトδ0、接線シフトs0及び2接線シフトr0の観点から表される接続成分の三次元位置(x0、y0、z0)
選択投影面に従って、(δ0、s0、r0)を、下記のように計算する。
○索引0、δ0=x0、s0=z0、及びr0=y0
○索引1、δ0=y0、s0=z0、及びr0=x0
○索引2、δ0=z0、s0=x0、及びr0=y0
更に、各T×TブロックにT×Tブロックの関連パッチ/接続成分索引を提供するマッピング情報(ブロック対パッチマップと呼ばれる)を、下記のように、生成して符号化する。
・各T×Tブロックに対して、Lを、二次元バウンディングボックスがそのブロックを含むようにパッチの索引の順序付きリストとする。リストにおける順序は、二次元バウンディングボックスを符号化するために使用される順序と同じである。Lは、候補パッチのリストと呼ばれる。
・形状/テクスチャ画像上のパッチ間の空空間を、パッチと考え、全ブロックの候補パッチリストに追加される特殊索引0を、この空空間に割り当てる。
・Iを、現在T×Tブロックを占有するパッチの索引とし、Jを、LにおけるIの位置とする。索引Iを明示的に符号化する代わりに、Iの位置Jを算術的に符号化し、その結果、より良い圧縮効率をもたらす。
更に、メタデータ圧縮ブロック6は、パッキングブロック12から生成される占有マップの符号化22を実施する。
占有マップ圧縮は、空のT×Tブロック(即ち、パッチ索引0を有するブロック)を検出するために、上述のブロック対パッチマッピング情報を活用する。残りのブロックを、下記のように、23で符号化する。
占有マップを、B0×B0ブロック(但し、B0は、ユーザ定義パラメータである)の精度で、22で符号化することができる。無損失符号化を達成するために、B0を、1に設定すべきである。実際に、B0=2又はB0=4は、視覚的に許容できる結果になるが、占有マップを符号化するのに必要なビットの数が大幅に減少する。
ブロック対パッチマップ符号化23は、下記のように進む。
・2進値を、同じT×Tブロックに属するB0×B0サブブロックに対応付ける。サブブロックが少なくとも非パッド画素を含む場合、値1をサブブロックに対応付け、それ以外ならば、0である。サブブロックが1の値を有する場合、サブブロックは、一杯であると考えられ、それ以外ならば、サブブロックは、空のサブブロックである。
・T×Tブロックの全サブブロックが一杯である(即ち、値1を有する)場合、ブロックは、一杯であると考えられる。それ以外ならば、ブロックは、一杯でないと考えられる。
・各T×Tブロックが一杯であるか否かを示す各T×Tブロックに対して、2進情報を符号化する。
・ブロックが一杯でない場合、一杯/空のサブブロックの位置を示す追加情報を、下記のように符号化する。
○異なる横行順序を、サブブロックに対して規定する。図4は、4つの考えられる横行順序を示す。
○符号器は、これらの横行順序のうち1つを選択し、この横行順序の索引をビットストリームに明示的に信号伝送する。
○ランレングス符号化戦略を使用することによって、サブブロックに対応付けられた2進値を符号化する。
■最初のサブブロックの2進値を符号化する。
■符号器によって選択された横行順序に従いながら、0及び1の連続実行を検出する。
■検出実行の数を符号化する。
■最後の実行を除いて、各実行の長さをも更に符号化する。
占有マップストリームを、占有マップ符号化22から出力し、ブロック対パッチマップストリームを、占有マップ23から出力する。ブロック対パッチ索引及び占有マップは、ブロック毎メタデータと呼ばれる。
テクスチャ圧縮ブロック8は、三次元HEVC(ITUウェブサイト、T推奨、Hシリーズ、h265、https://www.itu.int/rec/T-REC-H.265-201802-I付録Iで仕様が見付けられるHEVCの拡張)などのレガシー復号器による深度ビデオ復号を含み、この後に、形状再構成処理24が続く。この形状再構成処理24は、再構成形状画像における占有画素を検出するために、占有マップ情報を利用する。それらの占有画素に対応付けられた点の三次元位置を、メタデータ及び形状画像を活用することによって計算する。より正確には、Pを、占有画素(u、v)から再構成される点とし、(δ0、s0、r0)を、属する接続成分の三次元位置とし、(u0、v0、u1、v1)を、対応する深度パッチの二次元バウンディングボックスとする。Pを、下記のように、深度δ(u、v)、接線シフトs(u、v)及び2接線シフトr(u、v)の観点から表すことができる。
δ(u、v)=δ0+g(u、v)
s(u、v)=s0-u0+u
r(u、v)=r0-v0+v
但し、g(u、v)は、再構成形状画像の輝度成分である。
更に、ポイントクラウド形状再構成処理24は、現在点を再構成する深度値を記憶する画素の位置、即ち(i、u、v)(但し、iは、深度画像、即ちDepthImg0又はDepthImg1を示し、(u、v)は、i番目の深度画像における画素の座標である)を、各再構成点に対して出力する。
更に、テクスチャ圧縮ブロック8は、三次元色転送ブロック26を含む。この三次元色転送ブロック26では、各再構成点に対してコーディングされるべき色及び/又は他の属性値を、色及び/又は他の属性情報コーディング誤差を最小限にする方法で判定する。一実施形態によれば、各再構成点に対して、入力/原ポイントクラウドにおける最も近い点の色を、コーディングされるべき色として割り当てる。
三次元色転送ブロック26の後に、テクスチャ画像生成ブロック28が続く。このテクスチャ画像生成ブロック28は、形状画像と同じ位置、即ち(i、u、v)における各再構成点のコーディングされるべき色情報を記憶することによって、コーディングされるべきテクスチャ画像を生成する。
テクスチャ画像生成ブロック28の後に、三次元HEVC(ITUウェブサイト、T推奨、Hシリーズ、h265、https://www.itu.int/rec/T-REC-H.265-201802-I付録Iで仕様が見付けられるHEVCの拡張)などのレガシー符号器を用いたテクスチャビデオ符号化が続く。
形状圧縮ブロック4から生成される深度ビデオストリーム、メタデータ圧縮ブロック6から生成されるブロック毎及びパッチ毎メタデータストリーム、及びテクスチャ圧縮ブロック8から生成される色ビデオストリームを、符号器2から出力される圧縮ストリームに多重化する。
図5は、ポイントクラウドの再構成用の符号器2に対応する復号器30を表す。
復号器30で、符号器2から出力された圧縮ストリームを、深度ビデオストリーム、ブロック毎メタデータストリーム、パッチ毎メタデータストリーム及び色ビデオストリームに逆多重化する。
復号器30は、三次元HEVC(ITUウェブサイト、T推奨、Hシリーズ、h265、https://www.itu.int/rec/T-REC-H.265-201802-I付録Iで仕様が見付けられるHEVCの拡張)などのレガシー復号器による深度ビデオ復号を含む形状再構成ブロック31を含む。
更に、画像再構成ブロック31は、図6で詳述される画像再構成ブロック32を含む。このブロック32は、
再構成深度ビデオストリームから再構成depthImage0及び再構成depthImage1を時間デインターリーブすることと、
再構成depthImage0に記憶された再構成D0値を検索することと、
再構成_D0+再構成_デルタ_深度(但し、再構成_デルタ_深度値をdepthImage1に記憶する)を用いてD1値を再構成することと
を含む。
更に、画像再構成ブロック31は、符号器2のポイントクラウド形状再構成ブロック24と同じ方法で動作するポイントクラウド形状再構成ブロック33を含む。
更に、復号器30は、下記を含むメタデータ再構成ブロック34を含む。
-占有マップストリームを復号する占有マップ復号ブロック35。このブロック35から出力された占有マップを、深度画像再構成ブロック32に送信する。
-ブロック対パッチマップストリームを復号するブロック対パッチマップ復号ブロック36。このブロック36から出力されたブロック対パッチマップを、ポイントクラウド形状再構成ブロック33に送信する。
-パッチ毎メタデータストリームを復号するパッチ毎メタデータ復号ブロック37。このブロック37から出力されたパッチ毎メタデータを、ポイントクラウド形状再構成ブロック33に送信する。
更に、復号器30は、三次元HEVC(ITUウェブサイト、T推奨、Hシリーズ、h265、https://www.itu.int/rec/T-REC-H.265-201802-I付録Iで仕様が見付けられるHEVCの拡張)などのレガシー復号器によるテクスチャビデオ復号段階を含むテクスチャ再構成処理を含む。
更に、テクスチャ再構成処理は、再構成パッチ毎及びブロック毎メタデータを用いてテクスチャパッチを再構成するテクスチャパッチ再構成段階を含む。
更に、テクスチャ再構成処理は、各点を再構成する画素の位置を用いて各再構成点の色を再構成テクスチャ画像から取り出すポイントクラウドテクスチャ再構成段階35を含む。
図1の符号器2の無損失の変型は、ISO/IEC JTC1/SC29/WG11 MPEG2018/m42170、2018年1月、Gwangju、Koreaの文献に提案されている。
図7に表すこの無損失符号器50の基本的な考えは、符号器2によって構築される接続成分によって紛失された全点から構成される特殊接続成分を構成することである。次に、対応する追加深度パッチ、及び紛失点パッチに対応する追加テクスチャパッチを、深度及びテクスチャ画像にパックする。
二次元ビデオフレームに投影されない入力ポイントクラウドにおける点は、紛失点と呼ばれる。それらの紛失点は、投影線に沿った最小及び最大深度値を有する2つの点の間に位置決めされる点、ノイズの多い点と考えられる点、投影に対して小さすぎると考えられる成分に属する点を妥協して解決する。全紛失点は、missedPonitsPatchと呼ばれる特殊接続成分を構成する。全紛失点の(x、y、z)座標を、1つの三次元ビデオフレームに別々に又は他の深度値と一緒に記憶される1つの二次元パッチに記憶する。
図1及び図7の損失及び無損失コーディングモードの両方の場合、パック深度画像及びテクスチャ画像に加えて、圧縮ビットストリームのかなりの部分は、パック画像からポイントクラウドを再構成するのに役立ち、下記を含む補助情報を含む。
・法線軸、法線方向における変位、パック画像上の位置などを含むパッチ毎メタデータ
・パック画像における各ブロックをどのパッチによって占有するかを示すブロック対パッチマップ
・画素を占有するか否かを示す占有マップ
図7の無損失ポイントクラウドコーディングにおいて、占有マップは、下記の理由でポイントクラウドを再構成する必要がまだある。
・コーディングされるべき0に等しい値を有する占有画素を、0に等しい値を有することもできる非占有画素と区別する必要がある。
・圧縮性能を向上させるために、パック画像の非占有部分に充填する。この操作は、画像パディングと呼ばれる。
しかし、占有マップ自体は通常、特に無損失モードで、圧縮されるのに非常に高価である。図7の無損失符号器50において、占有マップをコーディングするコストは、画像パディングによってもたらされる利益よりも非常に大きい。
2016年12月21日に出願され、欧州特許3340629号として公開された欧州特許出願公開第16306764.8号は、コーディングされるべき深度値における最下位場所、即ちコード語の下位2ビットを確保して占有マップを記憶することを提案している。これは、特定の数のビット、例えば2ビットを左シフトすることによって、コーディングされるべき元の深度データを上方基準化することによって、達成される。しかし、上方基準化操作は、データ範囲を大幅に増加するので、深度画像は、コーディングされるのに更に一層高価になる。
無損失コーディングモードの場合、この上方基準化操作は、占有マップコーディングを除去する過剰な解決策である。更に、上方基準化は、値「0」を有する占有画素を非占有画素と区別する問題を解決しない。
4.概要。
下記は、本原理の幾つかの態様の基本的な理解を与えるために、本原理の簡略化した概要を提示する。この概要は、本原理の幅広い概説でない。概要は、本原理の主要な又は重要な要素を確認するように意図されていない。下記の概要は、後述のより詳細な説明への前置きとして簡略化した形で本原理の幾つかの態様を単に提示する。
一般的に言えば、本開示は、状況を改善するための解決策を提案する。
この開示は、復号の複雑さを減らすこと、及びコーディングされるべきデータ範囲を不変にしておきながら、占有マップコーディングを除去することによって、無損失ポイントクラウドコーディングのビット速度を節約することを提案する。
有利なことに、占有マップコーディングを、符号器側及び復号器側の両方で除去する。
有利なことに、占有情報を、例えば下記の方法で、コーディングされるべき深度画像のうち1つに埋め込む。
-占有情報を、投影線に沿って最小深度値を記憶するDepthImg0に埋め込む場合、コーディングされるべき全深度値、及びより詳細には深度D0が0を超えることを確実にするように、深度パッチ生成ステップを修正する。
-DepthImg1が、投影線に沿って最小及び最大深度値の間の差デルタ_深度を記憶する場合に、占有情報をDepthImg1に埋め込む場合、コーディングされるべき全デルタ_深度値に、1を加算する。
-DepthImg1が、投影線に沿って最大深度値を記憶する場合に、占有情報をDepthImg1に埋め込む場合、コーディングされるべき全深度値、より詳細には深度D1が0を超えることを確実にするように、深度パッチ生成ステップを修正する。
従って、本開示は、
-投影面の上に規定される二次元正規グリッドのブロックを投影面の上のポイントクラウドの少なくとも1つの点の正射影の深度情報に対応付けるかどうかを示す占有情報を取得することと、
-深度情報を記憶する画像に占有情報を埋め込むことと、
-画像を符号化することと
を含む方法を提供する。
更に、本開示は、
-投影面の上に規定される二次元正規グリッドのブロックを投影面の上のポイントクラウドの少なくとも1つの点の正射影の深度情報に対応付けるかどうかを示す占有情報を取得する手段と、
-深度情報を記憶する画像に占有情報を埋め込む手段と、
-画像を符号化する手段と
を含むデバイスを提供する。
有利なことに、深度情報を記憶する画像に占有情報を埋め込むことは、記憶されるべき深度情報をシフトさせることを含む。
実施形態によれば、方法は、深度情報がシフトされていることを示す情報を伝送することを更に含む。
実施形態によれば、ポイントクラウドの点の深度情報を記憶する画像は、投影面からの最短距離を有する。
実施形態によれば、ポイントクラウドの点の深度情報を記憶する画像は、投影面からの最長距離を有する。
実施形態によれば、深度情報を記憶する画像は、投影面からの最長距離を有するポイントクラウドの点の深度情報と投影面からの最短距離を有するポイントクラウドの点の深度情報との間の差を表す。
更に、本開示は、
-投影面の上のポイントクラウドの少なくとも1つの点の正射影の深度情報を記憶する画像を復号することと、
-復号深度画像から占有情報を導出することであって、占有情報は、投影面の上に規定される二次元正規グリッドのブロックを復号深度情報に対応付けるかどうかを示すことと
を含む方法を提供する。
更に、本開示は、
-投影面の上のポイントクラウドの少なくとも1つの点の正射影の深度情報を記憶する画像を復号する手段と、
-復号深度画像から占有情報を導出する手段であって、占有情報は、投影面の上に規定される二次元正規グリッドのブロックを復号深度情報に対応付けるかどうかを示す手段と
を含むデバイスをも提供する。
有利なことに、符号器/復号器モジュールを、符号器/復号器内の1つ又は複数のプロセッサによって実施する。
開示による方法を、プログラマブル装置上のソフトウェアで実施してもよい。方法を、ハードウェア又はソフトウェアで、又はこれらの組み合わせで単に実施してもよい。
本発明をソフトウェアで実施することができるので、任意の適切な搬送媒体上のプログラマブル装置に提供されるコンピュータ可読コードとして、本発明を具体化することができる。搬送媒体は、フロッピーディスク、CD-ROM、ハードディスクドライブ、磁気テープデバイス又は固体メモリデバイスなどの記憶媒体を含んでもよい。
従って、開示は、コンピュータが本発明の符号化/復号方法を実行することができるコンピュータ実行可能命令を含むコンピュータ可読プログラムを提供する。
5.図面の簡単な説明。
図面において、本原理の例を示す。
既述の符号器を示す。 既述の図1の符号器の深度パッチ生成処理を例示する。 既述の図1の符号器の画像生成処理を例示する。 既述の図1の符号器で使用されるサブブロックの横行の例を示す。 既述の復号器を示す。 既述の図5の復号器の画像再構成処理を例示する 有利なことに本原理を実施することができる無損失符号器を示す。 本開示の実施形態による図7の無損失符号器の修正を示す。 本開示の実施形態による図5の復号器の修正を示す。 本開示の第1の実施形態によって修正された形状圧縮ブロックを例示する。 本開示の第2の実施形態によって修正された形状圧縮ブロックを例示する。 本開示の第3の実施形態によって修正された形状圧縮ブロックを例示する。 本開示の実施形態による拡張デルタ深度(EDD)コードの例を示す。 本開示の第4の実施形態によって修正された形状圧縮ブロックを例示する。 本開示の第5の実施形態によって修正された形状圧縮ブロックを例示する。 本原理の例によるデバイスのアーキテクチャの例を示す。 本原理の例による通信ネットワーク上で通信する2つの遠隔デバイスを示す。 本原理の例による信号の構文を示す。
同様な又は同じ要素を、同じ参照符号で参照する。
6.本原理の例の説明。
以下、本原理について、本原理の例を示す添付図面を参照してより完全に説明する。しかし、本原理は、多くの代替の形態で具体化されてもよく、ここに記載の例に限定されると受け取られるべきではない。従って、本原理は、様々な修正及び代替の形態の余地があるが、本原理の特定の例を、一例として図面に示し、本明細書にて詳細に説明する。しかし、本原理を開示の特定の形態に限定する意図がないものと理解されたい。その一方で、開示は、特許請求の範囲によって規定されるような本原理の精神及び範囲内にある全ての修正、均等物、及び代替物を含むものとする。
本明細書にて使用される用語は、特定の例だけを説明するためであり、本原理を限定するように意図されていない。ここで使用されるように、単数形「1つ(a)」、「1つ(an)」及び「その(the)」は、特に明示的に指示がない限り、複数形も含むように意図されている。更に、本明細書で使用される場合、用語「含む(comprises)」、「含む(comprising)」、「含む(includes)」及び/又は「含む(including)」は、記載の特徴、整数、ステップ、動作、要素、及び/又は構成要素の存在を指定し、1つ又は複数の他の特徴、整数、ステップ、動作、要素、構成要素、及び/又はこれらのグループの存在又は追加を排除しないということが更に理解されるであろう。その上、要素が別の要素に「応答する」又は「接続される」と言及される場合、要素は、他の要素に直接応答する又は接続されることができ、又は介在要素が存在してもよい。一方、要素が他の要素に「直接応答する」又は「直接接続される」と見なされる場合、介在要素が存在しない。ここで使用されるように、用語「及び/又は(and/or)」は、関連列挙項目のうち1つ又は複数の項目のありとあらゆる組み合わせを含み、「/」と短縮されてもよい。
第1(first)、第2(second)などという用語は、様々な要素を説明するために本明細書にて使用され得るが、これらの要素をこれらの用語によって限定すべきではないということが理解されるであろう。これらの用語は、1つの要素を別の要素と区別するために使用されるだけである。例えば、第1の要素を第2の要素と呼ぶことができ、同様に、本原理の教示から逸脱することなく、第2の要素を第1の要素と呼ぶことができる。
線図の幾つかは、通信の主な方向を示すために通信路上に矢印を含むが、図示の矢印と逆方向に通信が行われてもよいものとする。
幾つかの例を、ブロック図及び動作フローチャートに関して説明し、各ブロックは、回路要素、モジュール、又は指定の論理機能を実施する1つ又は複数の実行可能命令を含むコードの一部を表す。更に、他の実装において、ブロックに記載の機能は、記載の順序が狂って行われてもよいことに留意すべきである。例えば、実際に、連続して示される2つのブロックを実質的に同時に実行してもよく、又は場合によっては、ブロックを、関連機能によって逆の順序で実行してもよい。
ここで、「例によって(in accordance with an example)」又は「例において(in an example)」の参照は、例に関連して説明される特定の特徴、構造、又は特性を、本原理の少なくとも1つの実装に含むことができることを意味する出願の様々な箇所における語句「例によって(in accordance with an example)」又は「例において(in an example)」の状況は、必ずしも同じ例を全て参照するとは限らず、他の例を必ず互いに除く別の又は代替の例でもない。
特許請求の範囲で見られる参照符号は、例示に過ぎず、特許請求の範囲に対する効果を限定しないものとする。
明示的に説明されていないが、本例及び変型例を、任意の組み合わせ又は部分組み合わせで使用してもよい。
本原理は、着色ポイントクラウドを符号化/復号するために説明されるが、一連の着色ポイントクラウドの符号化/復号にまで及ぶ。なぜなら、一連の各着色ポイントクラウドを、後述のように連続的に符号化/復号するからである。
実施形態によれば、既述の無損失符号器50及び復号器30を、本原理の実装のために使用する。
本開示の実施形態によって修正された無損失符号器51を表す図8で明らかに分かるように、占有マップコーディングが除去されている。代わりに、占有情報を、コーディングされるべき深度画像に埋め込み、有利なことに、リンク52を、画像生成ブロック14とメタデータ圧縮ブロック6との間に生成する。
それに対応して、復号器30を表す図9で分かるように、復号器30によって受信される圧縮ストリームに占有マップストリームがなく、占有マップ35の復号のブロックを抑制する。
画像生成ブロック14を例示する図3を参照して説明されるように、各投影線に沿って最小及び最大深度値を生成する2つの点を、圧縮ビットストリームに記録する。それに対応して、符号器51は、各ポイントクラウドフレームに対して2つの深度画像DepthImg0及びDepthImg1を符号化する。各投影線に沿った絶対最小深度値と投影線が属する接続成分の最小深度値との間の差である相対最小深度値D0を、DepthImg0に信号伝送しながら、DeltaD=(D1-D0)(但し、D1は、相対最大深度値、即ち、各投影線に沿った絶対最大深度値と投影線が属する接続成分の最小深度値との間の差である)を、DepthImg1に信号伝送する。
各パッチの最小深度値をパッチ毎メタデータに信号伝送することに留意する価値がある。
図10に表す第1の実施形態によれば、占有情報をDepthImg0に埋め込む。
0を超える全D0値を形成し、図3に表すようなDepthImg0のパディングステップ20を除去することによって、無損失復号D0値は、占有情報を示すこともできる。
0を超える全D0値を形成するために、深度パッチ検証ブロック54を追加する。この新しいブロックは、2つの段階を含む。
第1の段階中に、必要ならば、接続成分を分割する。D0深度パッチが、最大可能範囲[0、N-1]を超えるデータ範囲を有する場合、対応する接続成分を2つに分割する。Nの値は、コーディングビットに左右される。8ビットHEVCを使用する場合、N=255である。10ビットHEVCを使用する場合、N=1023である。
次に、第2の段階中に、各D0パッチに対して、コーディングされるべきD0値、又はD0パッチの最小深度値を、下記の処理に従って変換する。
・D0パッチの最小深度、又は対応する接続成分が、0を超える場合、現在の最小パッチ深度を1だけ減少させる。その結果、コーディングされるべき全接続D0値に1を加算する。この場合、ポイントクラウド形状を再構成するためにD0値を使用する前に、再構成D0値を変更する必要はない。
・D0パッチの最小深度、又は対応する接続成分が、既に0である場合、現在の最小パッチ深度を、変わらない状態にしておく。次に、コーディングされるべき全D0値に1を加算する。この場合、ポイントクラウド形状を再構成する前に、再構成D0値を1だけ減少させる必要がある。
必要ならば、使用される前に再構成D0値を補正する必要があるかどうかを示すために、1パッチ当たり、即ち1接続成分当たり1ビットを加算する。
図11に表す第2の実施形態によれば、DepthImg1がDeltaD値を記憶する場合、占有情報をDepthImg1に埋め込む。
この実施形態によれば、DepthImg1を56でパックする前に、コーディングされるべき全DeltaD値を1だけ増加させる。占有画素のDeltaD値の大部分が0であるので、コーディング前のDeltaDの変換段階58を追加する。それに対応して、復号器側でポイントクラウドを再構成するためにDeltaD値を使用する前に、再構成DeltaD値を1だけ減少させる。
図12に表す第3の実施形態によれば、DepthImg1が最大深度値D1を記憶する場合、占有情報をDepthImg1に埋め込む。
0を超える全D1値を形成し、DepthImg1のパディングステップを除去することによって、無損失復号D1値は、占有情報を示すこともできる。
0を超える全D1値を形成するために、深度パッチ検証ブロック60を追加する。この新しいブロックは、2つの段階を含む。
第1の段階中に、必要ならば、接続成分を分割する。D1深度パッチが、最大可能範囲[0、N-1]を超えるデータ範囲を有する場合、対応する接続成分を2つに分割する。Nの値は、コーディングビットに左右される。8ビットHEVCを使用する場合、N=255である。10ビットHEVCを使用する場合、N=1023である。
次に、第2の段階中に、各D1パッチに対して、コーディングされるべきD1値を、下記の処理に従って変換する。
・D1パッチでコーディングされるべき最小値D1が、0を超える場合、ポイントクラウド形状を再構成するためにD1値を使用する前に、再構成D1値を変更する必要はない。
・D1パッチでコーディングされるべき最小値D1が、0である場合、現在のD1パッチのコーディングされるべき全D1値に1を加算する。この場合、ポイントクラウド形状を再構成する前に、再構成D1値を1だけ減少させる必要がある。
使用される前に再構成D1値を補正する必要があるかどうかを示すために、1パッチ当たり、即ち1接続成分当たり1ビットを加算する。
別の可能性は、図13に例示のように、深度D0と深度D1との間で、投影線に沿った各位置に対して、この位置を占有するか否かを示すビットを連結するコード語である拡張デルタ深度(EDD)コードを、DeltaD又はD1の代わりに、DepthImg1に記憶することである。
図14に表す第4の実施形態によれば、DepthImg1が最大深度値D1を記憶する場合、第1の実施形態に記載の方法と同じ方法で、占有情報をDepthImg0に埋め込み、DepthImg1は、これらのEDDコードを記憶する。
図15に表す第5の実施形態によれば、DepthImg1がEDDコードを記憶する場合、占有情報をDepthImg1に埋め込む。この実施形態によれば、DepthImg1を62でパックする前に、コーディングされるべき全EDDコードを1だけ増加させる。占有画素のEDDコードの大部分が0であるので、コーディング前のEDDコードの変換段階64を追加する。それに対応して、復号器側でポイントクラウドを再構成するためにEDDコードを使用する前に、再構成EDDコードを1だけ減少させる。
有利なことに、下記のメタデータを、図7の符号器50と比較して、符号器51によってビットストリーム出力に加算する。
・占有マップをビットストリームに信号伝送するか否かを示す1ビット。例えば、1は肯定を意味し、0は否定を意味する。
・第1のビットが0に等しい場合、どの深度画像が占有情報を含むかを示す1ビット。例えば、0はDepthImg0を意味し、1はDepthImg1を意味する。
・どのデータをDepthImg1に記憶するかを示す数ビット。例えば、0は、DepthImg1がD1を記憶することを意味し、1は、DepthImg1がDeltaD=D1-D0を記憶することを意味し、2は、DepthImg1がEDDコードを記憶することを意味する2ビット。
・DepthImg0が占有情報を伝える場合、ポイントクラウド形状を再構成するためにD0値を使用する前に現在のパッチの再構成D0値を補正する必要があるか否かを示すパッチ毎メタデータと一緒に、パッチ毎1ビットメタデータを信号伝送するかどうかを示す1ビット。
・DepthImg1が占有情報を伝え、DepthImg1がD1値を記憶する場合、ポイントクラウド形状を再構成するためにD1値を使用する前に現在のパッチの再構成D1値を補正する必要があるか否かを示す1ビットパッチ毎メタデータ。
上述の新しいメタデータを、全ビットストリームに対して1回、又は一緒に圧縮される各フレーム又はフレームの各グループに対して複数回、信号伝送することができ、その結果、各フレーム又はフレームの各グループに対して異なるコード体系を選択することができる。上述のメタデータの値を記録するデータフィールドを、圧縮ビットストリームに直接出力することができ、又はこのデータフィールドを圧縮ビットストリームに出力する前に更にエントロピーコーディングすることができる。
図9の復号器30を、図10~図15を参照して説明される符号器51の実施形態によって修正する。
占有情報をDepthImg0に埋め込む第1の実施形態の場合、占有マップを、次式に従って生成する。
更に、必要な場合いつでもD0値を1だけ減少させることによって、深度パッチを再構成する。
占有情報をDepthImg1に埋め込む第2の実施形態の場合、占有マップを、次式に従って生成する。
更に、全DeltaD値を1だけ減少させることによって、深度パッチを再構成する。
占有情報をDepthImg1に埋め込み、DepthImg1がD1値を記憶する第3の実施形態の場合、占有マップを、次式に従って生成する。
必要ならば、関連D1値を1だけ減少させることによって、D1深度パッチを再構成する。
占有情報をDepthImg0に埋め込む第4の実施形態の場合、占有マップを、次式に従って生成する。
更に、必要な場合いつでもD0値を1だけ減少させ、EDDコードから深度値を再構成することによって、深度パッチを再構成する。
占有情報をDepthImg1に埋め込む第5の実施形態の場合、占有マップを、次式に従って生成する。
更に、全EDDコードを1だけ減少させることによって、深度パッチを再構成する。
図1~図15に関して、モジュールは、区別できる物理ユニットと関連していても関連していなくてもよい機能ユニットである。例えば、これらのモジュール又はモジュールの一部は、固有の構成要素又は回路と一緒にされてもよく、又はソフトウェアの機能に寄与してもよい。一方、幾つかのモジュールは、個別の物理的実体から構成される可能性があってもよい。純粋なハードウェア、例えば、ASIC<<特定用途向け集積回路>>又はFPGA<<フィールドプログラマブルゲートアレイ>>又はVLSI<<超大規模集積回路>>のような専用ハードウェアを用いて、又はデバイスに組み込まれた幾つかの集積電子構成要素から、又はハードウェア及びソフトウェア構成要素の混合から、本原理に適合する装置を実施する。
図16は、図1~図15に関して記載の方法を実施するように構成可能なデバイス1100の例示的なアーキテクチャを表す。
デバイス1100は、データ及びアドレスバス1101によって一緒にリンクされる下記の要素を含む。
-例えば、DSP(又はデジタル信号プロセッサ)であるマイクロプロセッサ1102(又はCPU)
-ROM(又は読み出し専用メモリ)1103
-RAM(又はランダムアクセスメモリ)1104
-送信すべきデータをアプリケーションから受信する入出力インターフェース1105
-バッテリー1106
例によれば、バッテリー1106は、デバイスの外部にある。記載のメモリの各々において、明細書で使用される用語<<レジスタ>>は、小容量(数ビット)の領域、又は非常に大きい領域(例えば、全プログラム、又は大量の受信又は復号データ)に対応することができる。ROM1103は、少なくともプログラム及びパラメータを含む。ROM1103は、本原理による技法を実行するアルゴリズム及び命令を記憶してもよい。電源を入れると、CPU1102は、RAMにプログラムをアップロードし、対応する命令を実行する。
RAM1104は、CPU1102によって実行され、デバイス1100の電源を入れた後にアップロードされるプログラム、レジスタ内の入力データ、レジスタ内の方法の異なる状態における中間データ、及びレジスタで方法を実行するために使用される他の変数を、レジスタに含む。
ここに記載の実装を、例えば、方法又は処理、装置、ソフトウェアプログラム、データストリーム、又は信号で実施してもよい。実装の単一の形(例えば、方法又はデバイスとしてだけ記載)の文脈でだけ記載されている場合でも、記載の特徴の実装を、他の形(例えば、プログラム)で実施してもよい。装置を、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実施してもよい。方法を、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスなどを含む処理デバイスを一般的に意味するプロセッサなどの装置で実施してもよい。更に、プロセッサは、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタント(「PDA」)、及びエンドユーザ間の情報通信を容易にする他のデバイスなどの通信デバイスを含む。
符号化又は符号器の例によれば、入力ポイントクラウドを、ソースから取得する。例えば、このソースは、下記を含むセットに属する。
-ローカルメモリ(1103又は1104)、例えば、ビデオメモリ又はRAM(又はランダムアクセスメモリ)、フラッシュメモリ、ROM(又は読み出し専用メモリ)、ハードディスク
-記憶インターフェース(1105)、例えば、大容量記憶装置、RAM、フラッシュメモリ、ROM、光ディスク又は磁気支持体を有するインターフェース
-通信インターフェース(1105)、例えば、有線インターフェース(例えば、バスインターフェース、広域ネットワークインターフェース、ローカルエリアネットワークインターフェース)、又は無線インターフェース(例えば、IEEE 802.11インターフェース又はブルートゥース(登録商標)インターフェース)
-画像収集回路(例えば、CCD(又は電荷結合素子)又はCMOS(又は相補型金属酸化膜半導体)などのセンサー)
復号又は復号器の例によれば、復号ポイントクラウドを、宛先に送信し、具体的には、この宛先は、下記を含むセットに属する。
-ローカルメモリ(1103又は1104)、例えば、ビデオメモリ又はRAM、フラッシュメモリ、ハードディスク
-記憶インターフェース(1105)、例えば、大容量記憶装置、RAM、フラッシュメモリ、ROM、光ディスク又は磁気支持体を有するインターフェース
-通信インターフェース(1105)、例えば、有線インターフェース(例えば、バスインターフェース(例えば、USB(又はユニバーサルシリアルバス))、広域ネットワークインターフェース、ローカルエリアネットワークインターフェース、HDMI(登録商標)(高解像度マルチメディアインターフェース)インターフェース)、又は無線インターフェース(例えば、IEEE 802.11インターフェース、ワイファイ(WiFi)(登録商標)又はブルートゥース(登録商標)インターフェース)
-レンダリングデバイス
-ディスプレイ
符号化又は符号器の例によれば、ビットストリーム(圧縮ストリーム)を宛先に送信する。一例として、ビットストリームを、ローカル又はリモートメモリ、例えば、ビデオメモリ(1104)又はRAM(1104)、ハードディスク(1103)に記憶する。変型例において、ビットストリームを、記憶インターフェース(1105)、例えば、大容量記憶装置、フラッシュメモリ、ROM、光ディスク又は磁気支持体を有するインターフェースに送信する、及び/又は、通信インターフェース(1105)、例えば、ポイントツーポイントリンク、通信バス、ポイントツーマルチポイントリンク又は同報通信ネットワークへのインターフェース上で伝送する。
復号又は復号器の例によれば、ビットストリーム(圧縮ストリーム)をソースから取得する。典型的に、ビットストリームを、ローカルメモリ、例えば、ビデオメモリ(1104)、RAM(1104)、ROM(1103)、フラッシュメモリ(1103)又はハードディスク(1103)から読み取る。変型例において、ビットストリームを、記憶インターフェース(1105)、例えば、大容量記憶装置、RAM、ROM、フラッシュメモリ、光ディスク又は磁気支持体を有するインターフェースから受信する、及び/又は、通信インターフェース(1105)、例えば、ポイントツーポイントリンク、バス、ポイントツーマルチポイントリンク又は同報通信ネットワークへのインターフェースから受信する。
例によれば、図1及び図9に関して記載の符号化方法を実施するように構成されているデバイス1100は、下記を含むセットに属する。
-携帯機器
-スマートフォン、又は三次元収集機能を有するテレビ受像機
-通信デバイス
-ゲーム機
-タブレット(又はタブレットコンピュータ)
-ラップトップ
-静止画像カメラ
-ビデオカメラ
-符号化チップ
-静止画像サーバー
-ビデオサーバー(例えば、同報通信サーバー、ビデオオンデマンドサーバー、又はウェブサーバー)
例によれば、図3及び図10に関して記載の復号方法を実施するように構成されているデバイス1100は、下記を含むセットに属する。
-携帯機器
-頭部装着型ディスプレイ(HMD)
-(複合現実感)スマートメガネ
-ホログラフィックデバイス
-通信デバイス
-ゲーム機
-セットトップボックス
-テレビ受像機
-タブレット(又はタブレットコンピュータ)
-ラップトップ
-ディスプレイ
-立体ディスプレイ
-復号チップ
通信ネットワークNET上の2つの遠隔デバイスA及びBの間の伝送状況で図17に例示の本原理の例によれば、デバイスAは、図8に関して記載のように着色ポイントクラウドを符号化する方法を実施するように構成されているメモリRAM及びROMに関するプロセッサを含み、デバイスBは、図9に関して記載のように復号する方法を実施するように構成されているメモリRAM及びROMに関するプロセッサを含む。
例によれば、ネットワークは、デバイスAからデバイスBを含む復号デバイスに符号化着色ポイントクラウドを同報通信するのに適している同報通信ネットワークである。
デバイスAによって伝送されるように意図されている信号は、ビットストリームを伝える。
図18は、データをパケットベースの伝送プロトコル上で伝送する場合、このような信号の構文の例を示す。各伝送パケットPは、ヘッダーH及びペイロードPAYLOADを含む。
ここに記載の様々な処理及び特徴の実装を、様々な異なる機器又はアプリケーションで具体化してもよい。このような機器の例は、符号器、復号器、復号器からの出力を処理するポストプロセッサ、符号器に入力を与えるプリプロセッサ、ビデオ符号器、ビデオ復号器、ビデオ符号器/復号器、ウェブサーバー、セットトップボックス、ラップトップ、パソコン、携帯電話、パーソナルデジタルアシスタント、頭部装着型ディスプレイ、スマートメガネ、及び画像又はビデオ又は他の通信デバイスを処理する任意の他のデバイスを含む。明らかであるように、機器は移動できてもよく、更に、機器を移動車両に設置してもよい。
更に、方法を、プロセッサによって実行される命令によって実施してもよく、このような命令(及び/又は実装によって生成されるデータ値)を、コンピュータ可読記憶媒体に記憶してもよい。コンピュータ可読記憶媒体は、1つ又は複数のコンピュータ可読媒体で具体化され、コンピュータ可読プログラムコードで具体化されてコンピュータによって実行可能なコンピュータ可読プログラムコードを有するコンピュータ可読プログラム製品の形をとることができる。ここで使用されるようなコンピュータ可読記憶媒体は、コンピュータ可読記憶媒体に情報を記憶する固有能力及びコンピュータ可読記憶媒体から情報を検索する固有能力を考慮すると、持続性記憶媒体と考えられる。コンピュータ可読記憶媒体は、例えば、電子、磁気、光、電磁気、赤外線、又は半導体システム、装置、又はデバイス、又はこれらの任意の適切な組み合わせ(但し、これらに限定されない)であることができる。本原理を適用することができるコンピュータ可読記憶媒体のより具体的な例を与えるが、下記(ポータブルコンピュータディスケット、ハードディスク、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、又はこれらの任意の適切な組み合わせ)は、例示に過ぎず、当業者が容易に分かるように完全な列挙でないことを理解されたい。
命令は、プロセッサ可読媒体で明白に具体化されるアプリケーションプログラムを形成してもよい。
命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、又は組み合わせの中にあってもよい。命令を、例えば、オペレーティングシステム、個別アプリケーション、又はこれらの2つの組み合わせの中で見つけてもよい。従って、プロセッサを、例えば、処理を実行するように構成されているデバイス、及び処理を実行する命令を有するプロセッサ可読媒体(例えば、記憶デバイス)を含むデバイスの両方と見なしてもよい。更に、プロセッサ可読媒体は、命令に加えて又は命令の代わりに、実装によって生成されるデータ値を記憶してもよい。
当業者に明白になり得るように、実装は、例えば、記憶又は伝送可能な情報を伝えるようにフォーマットされた様々な信号を生成してもよい。この情報は、例えば、方法を実行する命令、又は記載の実装のうち1つによって生成されるデータを含んでもよい。例えば、本原理の記載の例の構文を読み書きする規則をデータとして伝える、又は本原理の記載の例によって書き込まれた実際の構文値をデータとして伝えるように、信号をフォーマットしてもよい。このような信号を、例えば、電磁波(例えば、スペクトルの無線周波数部分を用いて)又はベースバンド信号として、フォーマットしてもよい。フォーマッティングは、例えば、データストリームを符号化して、この符号化データストリームで搬送波を変調することを含んでもよい。信号が伝える情報は、例えば、アナログ又はデジタル情報であってもよい。知られているように、信号を、様々な異なる有線又は無線リンク上で伝送してもよい。信号を、プロセッサ可読媒体に記憶してもよい。
多くの実装について説明されている。それにもかかわらず、様々な修正を行うことができるものとする。例えば、異なる実装の要素を、結合、補足、修正、又は除去して、他の実装を生成してもよい。更に、他の構造及び処理を開示の構造及び処理と置換することができることを当業者は理解することができ、得られた実装は、少なくとも実質的に同じ方法で、少なくとも実質的に同じ機能を果たし、開示の実装と少なくとも実質的に同じ結果を得る。従って、このアプリケーションによって、これらの実装及び他の実装が考えられる。

Claims (11)

  1. -投影線に沿う投影面の上のポイントクラウドの第1の点の投影から得られる画素を占有するかどうかを示す占有情報を取得することと、
    -前記第1の点の第1の深度値と前記投影線に沿って前記投影面の上に投影される前記ポイントクラウドの第2の点の第2の深度値との間の位置に対して、前記位置を占有するか否かを示すビットを連結するコード語とともに、前記占有情報を画像に記憶することと、
    -前記画像を符号化することと
    を含む方法。
  2. -投影線に沿う投影面の上のポイントクラウドの第1の点の投影から得られる画素を占有するかどうかを示す占有情報を取得する手段と、
    -前記第1の点の第1の深度値と前記投影線に沿って前記投影面の上に投影される前記ポイントクラウドの第2の点の第2の深度値との間の位置に対して、前記位置を占有するか否かを示すビットを連結するコード語とともに、前記占有情報を画像に記憶する手段と、
    -前記画像を符号化する手段と
    を含むデバイス。
  3. 前記コード語とともに前記占有情報を記憶することは、記憶されるべき前記コード語を
    シフトさせることを含む、請求項1に記載の方法。
  4. 前記コード語がシフトされていることを示す情報を伝送することを更に含む、請求項3
    に記載の方法。
  5. 前記コード語とともに前記占有情報を記憶する手段は、記憶されるべき前記コード語をシフトさせることを含む、請求項2に記載のデバイス。
  6. 前記コード語がシフトされていることを示す情報を伝送する手段を更に含む、請求項に記載のデバイス。
  7. -占有情報と、投影線に沿って投影面の上に投影されるポイントクラウドの第1の点の第1の深度値と前記投影線に沿って前記投影面の上に投影される前記ポイントクラウドの第2の点の第2の深度値との間の位置に対して、前記位置を占有するか否かを示すビットを連結するコード語とを記憶する画像を復号することと、
    -前記復号された画像から前記占有情報を導出することであって、前記占有情報は、前記第1の点の前記投影面の上への前記投影から得られる画素を占有するかどうかを示す、導出することと
    を含む方法。
  8. -占有情報と、投影線に沿って投影面の上に投影されるポイントクラウドの第1の点の第1の深度値と前記投影線に沿って前記投影面の上に投影される前記ポイントクラウドの第2の点の第2の深度値との間の位置に対して、前記位置を占有するか否かを示すビットを連結するコード語とを記憶する画像を復号する手段と、
    -前記復号された画像から前記占有情報を導出する手段であって、前記占有情報は、前記第1の点の前記投影面の上への前記投影から得られる画素を占有するかどうかを示す、導出する手段と
    を含むデバイス。
  9. 前記コード語をシフトさせる必要があるかどうかを示す情報を受信することと、前記受信された情報に従って前記復号されたコード語をシフトさせることとを更に含む、請求項に記載の方法。
  10. 前記コード語をシフトさせる必要があるかどうかを示す情報を受信する手段と、前記受信された情報に従って前記復号されたコード語をシフトさせる手段とを更に含む、請求項8に記載のデバイス。
  11. 請求項1、3~4、7、又は9のいずれか一項に記載の方法を1つ又は複数のプロセッサに実行させる命令を含む持続性プロセッサ可読媒体。
JP2020549779A 2018-04-11 2019-04-03 三次元物体を表すポイントクラウドを符号化/復号する方法及び装置 Active JP7431742B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18305431.1 2018-04-11
EP18305431 2018-04-11
EP18306132.4 2018-08-23
EP18306132.4A EP3614672A1 (en) 2018-08-23 2018-08-23 A method and apparatus for encoding/decoding a point cloud representing a 3d object
PCT/US2019/025485 WO2019199531A1 (en) 2018-04-11 2019-04-03 A method and apparatus for encoding/decoding a point cloud representing a 3d object

Publications (3)

Publication Number Publication Date
JP2021518694A JP2021518694A (ja) 2021-08-02
JPWO2019199531A5 JPWO2019199531A5 (ja) 2022-04-05
JP7431742B2 true JP7431742B2 (ja) 2024-02-15

Family

ID=66102830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020549779A Active JP7431742B2 (ja) 2018-04-11 2019-04-03 三次元物体を表すポイントクラウドを符号化/復号する方法及び装置

Country Status (8)

Country Link
US (1) US20210183109A1 (ja)
EP (1) EP3777182A1 (ja)
JP (1) JP7431742B2 (ja)
KR (1) KR20200140824A (ja)
CN (1) CN111971967A (ja)
CA (1) CA3096819A1 (ja)
SG (1) SG11202008973TA (ja)
WO (1) WO2019199531A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020016136A1 (en) * 2018-07-18 2020-01-23 Telefonaktiebolaget Lm Ericsson (Publ) Video-based coding of point cloud occcupancy map
US11823421B2 (en) * 2019-03-14 2023-11-21 Nokia Technologies Oy Signalling of metadata for volumetric video
CN113785590A (zh) * 2019-05-10 2021-12-10 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
US11979607B2 (en) * 2019-05-30 2024-05-07 Lg Electronics Inc. Apparatus and method for processing point cloud data
US11315289B2 (en) * 2019-09-30 2022-04-26 Nokia Technologies Oy Adaptive depth guard band
US20210211703A1 (en) * 2020-01-07 2021-07-08 Apple Inc. Geometry information signaling for occluded points in an occupancy map video
US11430179B2 (en) * 2020-02-24 2022-08-30 Microsoft Technology Licensing, Llc Depth buffer dilation for remote rendering
US11417063B2 (en) * 2020-09-01 2022-08-16 Nvidia Corporation Determining a three-dimensional representation of a scene
US11606556B2 (en) * 2021-07-20 2023-03-14 Tencent America LLC Fast patch generation for video based point cloud coding
WO2023050432A1 (zh) * 2021-09-30 2023-04-06 浙江大学 编解码方法、编码器、解码器以及存储介质
CN115904294B (zh) * 2023-01-09 2023-06-09 山东矩阵软件工程股份有限公司 一种环境可视化方法、系统、存储介质和电子设备
US11710258B1 (en) 2023-01-25 2023-07-25 Illuscio, Inc. Systems and methods for compressing three-dimensional image data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019142666A1 (ja) 2018-01-16 2019-07-25 ソニー株式会社 画像処理装置および方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100446635B1 (ko) * 2001-11-27 2004-09-04 삼성전자주식회사 깊이 이미지 기반 3차원 객체 표현 장치 및 방법
GB2516424A (en) * 2013-07-15 2015-01-28 Nokia Corp A method, an apparatus and a computer program product for video coding and decoding
US20160021355A1 (en) * 2014-07-15 2016-01-21 Ostendo Technologies, Inc. Preprocessor for Full Parallax Light Field Compression
US9734595B2 (en) * 2014-09-24 2017-08-15 University of Maribor Method and apparatus for near-lossless compression and decompression of 3D meshes and point clouds
US9530215B2 (en) * 2015-03-20 2016-12-27 Qualcomm Incorporated Systems and methods for enhanced depth map retrieval for moving objects using active sensing technology
US11297346B2 (en) * 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds
EP3301926A1 (en) * 2016-09-30 2018-04-04 Thomson Licensing A method and a device for reconstructing a point cloud representative of a scene using light-field data
EP3340629A1 (en) 2016-12-21 2018-06-27 Thomson Licensing Method and apparatus for embedding key information in an image
CN107025673B (zh) * 2017-04-11 2020-02-21 太原科技大学 虚拟结构光3d数据压缩算法的局部误差抑制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019142666A1 (ja) 2018-01-16 2019-07-25 ソニー株式会社 画像処理装置および方法

Also Published As

Publication number Publication date
WO2019199531A1 (en) 2019-10-17
US20210183109A1 (en) 2021-06-17
JP2021518694A (ja) 2021-08-02
CN111971967A (zh) 2020-11-20
SG11202008973TA (en) 2020-10-29
CA3096819A1 (en) 2019-10-17
EP3777182A1 (en) 2021-02-17
KR20200140824A (ko) 2020-12-16

Similar Documents

Publication Publication Date Title
JP7431742B2 (ja) 三次元物体を表すポイントクラウドを符号化/復号する方法及び装置
JP7389751B2 (ja) 三次元物体を表すポイントクラウドを符号化/復号する方法及び装置
CN1681330B (zh) 自适应2n叉树生成方法及3D体数据编码和解码方法和设备
EP2805307B1 (en) Method and apparatus for compressing texture information of three-dimensional (3d) models
JP7488189B2 (ja) 点群の幾何学的形状をコーディングする方法およびデバイス
JP2015504545A (ja) 予測位置符号化
KR20140089426A (ko) 예측성 위치 디코딩
CN111417985A (zh) 用于编码/解码表示3d对象的点云的几何形状的方法和设备
CN110915216A (zh) 用于编码/解码表示3d对象的几何形状和颜色的有色点云的方法和装置
US20240078715A1 (en) Apparatus and method for point cloud processing
WO2022023002A1 (en) Methods and apparatus for encoding and decoding a 3d mesh as a volumetric content
WO2019070830A1 (en) METHOD AND APPARATUS FOR ENCODING / DECODING THE COLORS OF A POINT CLOUD REPRESENTING A 3D OBJECT
EP3614672A1 (en) A method and apparatus for encoding/decoding a point cloud representing a 3d object
WO2023144445A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
EP3614673A1 (en) A method and apparatus for encoding/decoding a point cloud representing a 3d object
JP2022537975A (ja) 点群の処理
CN114554175B (zh) 一种基于分类重排的二维点云距离图像的无损压缩方法
CN116033186A (zh) 一种点云数据处理方法、装置、设备以及介质
WO2024012765A1 (en) A method, an apparatus and a computer program product for video encoding and video decoding
CN116235497A (zh) 一种用于用信号通知基于多平面图像的体积视频的深度的方法和装置
CN102547315B (zh) 立体图像数据压缩方法及系统
CN117615136A (zh) 点云解码方法、点云编码方法、解码器、电子设备以及介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240202

R150 Certificate of patent or registration of utility model

Ref document number: 7431742

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150