JPWO2019142666A1 - 画像処理装置および方法 - Google Patents
画像処理装置および方法 Download PDFInfo
- Publication number
- JPWO2019142666A1 JPWO2019142666A1 JP2019566411A JP2019566411A JPWO2019142666A1 JP WO2019142666 A1 JPWO2019142666 A1 JP WO2019142666A1 JP 2019566411 A JP2019566411 A JP 2019566411A JP 2019566411 A JP2019566411 A JP 2019566411A JP WO2019142666 A1 JPWO2019142666 A1 JP WO2019142666A1
- Authority
- JP
- Japan
- Prior art keywords
- data
- dimensional
- unit
- image processing
- projected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 157
- 238000000034 method Methods 0.000 title abstract description 161
- 238000003672 processing method Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims description 14
- 230000010365 information processing Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 45
- 230000011218 segmentation Effects 0.000 description 42
- 238000012856 packing Methods 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 21
- 238000013459 approach Methods 0.000 description 13
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 238000000354 decomposition reaction Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 244000225942 Viola tricolor Species 0.000 description 1
- 235000004031 Viola x wittrockiana Nutrition 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/003—Reconstruction from projections, e.g. tomography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Computer Graphics (AREA)
- Image Generation (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
Description
1.ビデオベースドアプローチ
2.第1の実施の形態(可変レイヤ数)
3.第2の実施の形態(無いポイントの定義)
4.第3の実施の形態(可変奥行パラメータ)
5.付記
<技術内容・技術用語をサポートする文献等>
本技術で開示される範囲は、実施例に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。
非特許文献2:(上述)
非特許文献3:(上述)
非特許文献4:TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU(International Telecommunication Union), "Advanced video coding for generic audiovisual services", H.264, 04/2017
非特許文献5:TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU(International Telecommunication Union), "High efficiency video coding", H.265, 12/2016
非特許文献6:Jianle Chen, Elena Alshina, Gary J. Sullivan, Jens-Rainer, Jill Boyce, "Algorithm Description of Joint Exploration Test Model 4", JVET-G1001_v1, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 7th Meeting: Torino, IT, 13-21 July 2017
従来、点群の位置情報や属性情報等により3次元構造を表すポイントクラウドや、頂点、エッジ、面で構成され、多角形表現を使用して3次元形状を定義するメッシュ等のデータが存在した。
このようなポイントクラウドの位置と色情報それぞれを、小領域毎に2次元平面に投影し、2次元画像用の符号化方法で符号化するビデオベースドアプローチ(Video-based approach)が提案されている。
以上に説明したようなビデオベースドアプローチに関する本技術について説明する。図3は、各実施の形態において説明する本技術の一覧である。
次に、以上のような各手法を実現する構成について説明する。図4は、本技術を適用した画像処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図4に示される符号化装置100は、ポイントクラウドのような3Dデータを2次元平面に投影して2次元画像用の符号化方法により符号化を行う装置である。
図5は、パッチ分解部111の主な構成例を示すブロック図である。図5に示されるように、この場合のパッチ分解部111は、法線方向推定部151、セグメンテーション初期設定部152、セグメンテーション更新部153、2次元投影部154、および画素分布解析部155を有する。
図6は、本技術を適用した画像処理装置の一態様である復号装置の構成の一例を示すブロック図である。図6に示される復号装置200は、ポイントクラウドのような3Dデータが2次元平面に投影されて符号化された符号化データを、2次元画像用の復号方法により復号し、3次元空間に投影する装置である。
図7は、図6の3D再構築部217の主な構成例を示すブロック図である。図7に示されるように、3D再構築部217は、3次元投影部251、画素分布解析部252、逆セグメンテーション更新部253、逆セグメンテーション初期設定部254、および逆法線方向推定部255を有する。
<3Dデータを投影する2次元平面のレイヤ数可変>
従来の方法では、3Dデータは、図8に示される例のように、2つのレイヤ(レイヤ0およびレイヤ1)の2次元平面に投影されていた。
符号化装置100により実行される符号化処理の流れの例を、図10のフローチャートを参照して説明する。
次に、図11のフローチャートを参照して、図10のステップS101において実行されるパッチ分解処理の流れの例を説明する。
次に、図12のフローチャートを参照して、図11のステップS124において実行される2次元投影処理の流れの例を説明する。
復号側においては、符号化側より提供される2次元平面のレイヤ数を示す情報を用いることにより、上述のようにレイヤ数が可変の2次元平面に投影された3Dデータの再構築を実現することができる。
復号装置200により実行される復号処理の流れの例を、図13のフローチャートを参照して説明する。
次に、図14のフローチャートを参照して、図13のステップS207において実行されるポイントクラウド再構築処理の流れの例を説明する。
次に、図15のフローチャートを参照して、図14のステップS221において実行される3次元投影処理の流れの例を説明する。
<「無い画素」を示す値のシグナル>
疎(Sparse)な3Dデータを2次元平面に投影すると、その2次元平面上において3Dデータが投影されない画素、すなわち、画素値が設定されない画素(無い画素とも称する)が生じる場合がある。
この場合も、符号化処理およびパッチ分解処理は、第1の実施の形態において説明した場合と同様に行われる。したがってそれらの説明は省略する。
復号側においては、2次元平面に投影された3Dデータを3次元空間に投影する際に、以上のようにしてシグナルされた2次元平面上の「無い画素」を示す画素値(上述のX)を検出し、削除する(投影しないようにする)。
この場合も、復号処理およびポイントクラウド再構築処理は、第1の実施の形態において説明した場合と同様に行われる。したがってそれらの説明は省略する。
<奥行パラメータの制御>
3Dデータを2次元平面に投影する際に、その2次元平面に投影する3Dデータの奥行方向の範囲を制御する奥行パラメータthが利用される。この奥行パラメータthにより指定される範囲内のポイントが2次元平面への投影対象となるため、この奥行パラメータthの値は、領域(Local bounding box)の奥行方向の長さに関係する。例えば、領域の奥行方向の長さよりも奥行パラメータthの値が大きいと、他の領域のポイントも投影対象になり得る。つまり、領域の奥行方向の長さは、奥行パラメータthよりも長くする必要がある。
この場合も、符号化処理およびパッチ分解処理は、第1の実施の形態において説明した場合と同様に行われる。したがってそれらの説明は省略する。
復号側においては、2次元平面に投影された3Dデータを3次元空間に投影する際に、以上のように制御された奥行パラメータthに示される範囲に3Dデータを投影するようにする。
この場合も、復号処理およびポイントクラウド再構築処理は、第1の実施の形態において説明した場合と同様に行われる。したがってそれらの説明は省略する。
<制御情報>
以上の各実施の形態において説明した本技術に関する制御情報を符号化側から復号側に伝送するようにしてもよい。例えば、上述した本技術を適用することを許可(または禁止)するか否かを制御する制御情報(例えばenabled_flag)を伝送するようにしてもよい。また、例えば、上述した本技術を適用することを許可(または禁止)する範囲(例えばブロックサイズの上限若しくは下限、またはその両方、スライス、ピクチャ、シーケンス、コンポーネント、ビュー、レイヤ等)を指定する制御情報を伝送するようにしてもよい。
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
以上においては、ポイントクラウドデータのVoxel化に本技術を適用する場合について説明したが、本技術は、これらの例に限らず、任意の規格の3DデータのVoxel化に対して適用することができる。つまり、上述した本技術と矛盾しない限り、符号化・復号方式等の各種処理、並びに、3Dデータやメタデータ等の各種データの仕様は任意である。また、本技術と矛盾しない限り、上述した一部の処理や仕様を省略してもよい。
本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の2状態を識別する際に用いる情報だけでなく、3以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の2値であってもよいし、3値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報(フラグも含む)は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。
(1) 3次元構造を表す3Dデータに含まれる全ての位置毎のデータを、複数レイヤの2次元平面に投影する2次元投影部
を備える画像処理装置。
(2) 前記2次元投影部は、前記3Dデータの、投影面から見て位置が奥行方向に重なる前記位置毎のデータを、前記複数のレイヤの前記2次元平面の、互いに異なるレイヤに投影する
(1)に記載の画像処理装置。
(3) 前記2次元投影部は、前記2次元平面について、前記3Dデータの投影面から見て位置が奥行方向に重なる前記位置毎のデータの最大数と同数のレイヤを生成する
(2)に記載の画像処理装置。
(4) 前記2次元投影部により前記2次元平面に投影された前記3Dデータを、符号化する符号化部をさらに備える
(1)乃至(3)のいずれかに記載の画像処理装置。
(5) 前記符号化部は、前記2次元平面の各レイヤに投影された前記3Dデータの、位置情報、属性情報、およびオキュパンシーマップをそれぞれ符号化する
(4)に記載の画像処理装置。
(6) 前記2次元投影部により前記3Dデータが投影された前記2次元平面のレイヤ数を示す情報と、前記符号化部により前記2次元平面が符号化されて得られた符号化データとを含むビットストリームを生成するビットストリーム生成部をさらに備える
(4)または(5)に記載の画像処理装置。
(7) 前記2次元投影部により前記3Dデータが投影された前記2次元平面を、ビデオフレームとしてパッキングするパッキング部をさらに備え、
前記符号化部は、前記パッキング部により前記2次元平面がパッキングされた前記ビデオフレームを符号化するように構成される
(4)乃至(6)のいずれかに記載の画像処理装置。
(8) 前記2次元投影部は、前記3Dデータを、所定の領域毎に前記2次元平面に投影する
(1)乃至(7)のいずれかに記載の画像処理装置。
(9) 前記3Dデータは、ポイントクラウドである
(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 3次元構造を表す3Dデータに含まれる全ての位置毎のデータを、複数レイヤの2次元平面に投影する
画像処理方法。
を備える画像処理装置。
(12) ビットストリームに含まれる前記レイヤ数情報を抽出する抽出部をさらに備え、
前記3次元投影部は、前記抽出部により抽出された前記レイヤ数情報が示すレイヤ数の前記2次元平面に投影された前記3Dデータの全ての前記位置毎のデータを、前記3次元空間に投影するように構成される
(11)に記載の画像処理装置。
(13) 前記ビットストリームに含まれる前記2次元平面に投影された前記3Dデータの符号化データを復号する復号部をさらに備え、
前記3次元投影部は、前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータの全ての前記位置毎のデータを、前記3次元空間に投影するように構成される
(12)に記載の画像処理装置。
(14) 前記復号部は、前記2次元平面の各レイヤに投影された前記3Dデータの、位置情報、属性情報、およびオキュパンシーマップのそれぞれの符号化データを復号する
(13)に記載の画像処理装置。
(15) 前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータがパッキングされたビデオフレームをアンパッキングするアンパッキング部をさらに備え、
前記3次元投影部は、前記アンパッキング部によりビデオフレームがアンパッキングされて得られた、前記2次元平面に投影された前記3Dデータの全ての前記位置毎のデータを、前記3次元空間に投影するように構成される
(13)または(14)に記載の画像処理装置。
(16) 前記3次元投影部は、所定の領域毎に前記2次元平面に投影された前記3Dデータを、前記3次元空間に投影する
(11)乃至(15)のいずれかに記載の画像処理装置。
(17) 前記3Dデータは、ポイントクラウドである
(11)乃至(16)のいずれかに記載の画像処理装置。
(18) レイヤ数情報が示すレイヤ数の2次元平面に投影された3Dデータの全ての位置毎のデータを、3次元空間に投影する
画像処理方法。
を備える画像処理装置。
(22) 前記所定の値は、予め定められた固定値である
(21)に記載の画像処理装置。
(23) 前記所定の値は、前記3Dデータの奥行の最大値より大きな値である
(21)に記載の画像処理装置。
(24) 前記2次元投影部により前記2次元平面に投影された前記3Dデータを、符号化する符号化部をさらに備える
(21)乃至(23)のいずれかに記載の画像処理装置。
(25) 前記符号化部は、前記2次元平面に投影された前記3Dデータの、位置情報、属性情報、およびオキュパンシーマップをそれぞれ符号化する
(24)に記載の画像処理装置。
(26) 前記所定の値を示す情報と、前記符号化部により前記2次元平面が符号化されて得られた符号化データとを含むビットストリームを生成するビットストリーム生成部をさらに備える
(24)または(25)に記載の画像処理装置。
(27) 前記2次元投影部により前記3Dデータが投影された前記2次元平面を、ビデオフレームとしてパッキングするパッキング部をさらに備え、
前記符号化部は、前記パッキング部により前記2次元平面がパッキングされた前記ビデオフレームを符号化するように構成される
(24)乃至(26)のいずれかに記載の画像処理装置。
(28) 前記2次元投影部は、前記3Dデータを、所定の領域毎に前記2次元平面に投影する
(21)乃至(27)のいずれかに記載の画像処理装置。
(29) 前記3Dデータは、ポイントクラウドである
(21)乃至(28)のいずれかに記載の画像処理装置。
(30) 3次元構造を表す3Dデータに含まれる位置毎のデータを2次元平面に投影し、前記2次元平面の前記位置毎のデータが存在しない位置に、前記位置毎のデータが存在しないことを示す所定の値をセットする
画像処理方法。
を備える画像処理装置。
(32) 前記所定の値は、予め定められた固定値である
(31)に記載の画像処理装置。
(33) 前記所定の値は、前記3Dデータの奥行の最大値より大きな値である
(31)に記載の画像処理装置。
(34) ビットストリームに含まれる前記所定の値を示す情報を抽出する抽出部をさらに備え、
前記3次元投影部は、前記3Dデータに含まれる前記位置毎のデータの内、前記抽出部により抽出された前記情報に示される前記所定の値のデータ以外のデータを、3次元空間に投影するように構成される
(31)乃至(33)のいずれかに記載の画像処理装置。
(35) 前記ビットストリームに含まれる前記2次元平面に投影された前記3Dデータの符号化データを復号する復号部をさらに備え、
前記3次元投影部は、前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータに含まれる前記位置毎のデータの内、前記抽出部により抽出された前記情報に示される前記所定の値のデータ以外のデータを、3次元空間に投影するように構成される
(34)に記載の画像処理装置。
(36) 前記復号部は、前記2次元平面の各レイヤに投影された前記3Dデータの、位置情報、属性情報、およびオキュパンシーマップのそれぞれの符号化データを復号する
(35)に記載の画像処理装置。
(37) 前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータがパッキングされたビデオフレームをアンパッキングするアンパッキング部をさらに備え、
前記3次元投影部は、前記アンパッキング部によりビデオフレームがアンパッキングされて得られた、前記2次元平面に投影された前記3Dデータに含まれる前記位置毎のデータの内、前記抽出部により抽出された前記情報に示される前記所定の値のデータ以外のデータを、3次元空間に投影するように構成される
(35)または(36)に記載の画像処理装置。
(38) 前記3次元投影部は、所定の領域毎に前記2次元平面に投影された前記3Dデータを、前記3次元空間に投影する
(31)乃至(37)のいずれかに記載の画像処理装置。
(39) 前記3Dデータは、ポイントクラウドである
(31)乃至(38)のいずれかに記載の画像処理装置。
(40) 2次元平面に投影された3次元構造を表す3Dデータに含まれる位置毎のデータの内、前記位置毎のデータが存在しないことを示す所定の値のデータ以外のデータを、3次元空間に投影する
画像処理方法。
を備える画像処理装置。
(42) 前記2次元投影部により前記2次元平面に投影された前記3Dデータを、符号化する符号化部をさらに備える
(41)に記載の画像処理装置。
(43) 前記符号化部は、前記2次元平面に投影された前記3Dデータの、位置情報、属性情報、およびオキュパンシーマップをそれぞれ符号化する
(42)に記載の画像処理装置。
(44) 前記領域毎に設定された前記奥行パラメータと、前記符号化部により前記2次元平面が符号化されて得られた符号化データとを含むビットストリームを生成するビットストリーム生成部をさらに備える
(42)または(43)に記載の画像処理装置。
(45) 前記2次元投影部により前記3Dデータが投影された前記2次元平面を、ビデオフレームとしてパッキングするパッキング部をさらに備え、
前記符号化部は、前記パッキング部により前記2次元平面がパッキングされた前記ビデオフレームを符号化するように構成される
(42)乃至(44)のいずれかに記載の画像処理装置。
(46) 前記3Dデータは、ポイントクラウドである
(41)乃至(45)のいずれかに記載の画像処理装置。
(47) 3次元構造を表す3Dデータの位置毎のデータを3次元空間の所定の領域毎に2次元平面に投影する際に、前記領域毎に設定された1レイヤに投影可能な3次元構造を表す3Dデータの位置毎のデータの奥行方向の範囲を制限する奥行パラメータが示す前記奥行方向の範囲内の前記位置毎のデータを、前記2次元平面に投影する
画像処理方法。
を備える画像処理装置。
(52) ビットストリームに含まれる前記奥行パラメータを抽出する抽出部をさらに備え、
前記3次元投影部は、前記3Dデータに含まれる前記位置毎のデータを、前記抽出部により抽出された前記奥行パラメータが示す前記奥行方向の範囲内に投影するように構成される
(51)に記載の画像処理装置。
(53) 前記ビットストリームに含まれる前記2次元平面に投影された前記3Dデータの符号化データを復号する復号部をさらに備え、
前記3次元投影部は、前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータの前記位置毎のデータを、前記抽出部により抽出された前記奥行パラメータが示す前記奥行方向の範囲内に投影するように構成される
(52)に記載の画像処理装置。
(54) 前記復号部は、前記2次元平面の各レイヤに投影された前記3Dデータの、位置情報、属性情報、およびオキュパンシーマップのそれぞれの符号化データを復号する
(53)に記載の画像処理装置。
(55) 前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータがパッキングされたビデオフレームをアンパッキングするアンパッキング部をさらに備え、
前記3次元投影部は、前記アンパッキング部によりビデオフレームがアンパッキングされて得られた、前記2次元平面に投影された前記3Dデータの前記位置毎のデータを、前記抽出部により抽出された前記奥行パラメータが示す前記奥行方向の範囲内に投影するように構成される
(53)または(54)に記載の画像処理装置。
(56) 前記3Dデータは、ポイントクラウドである
(51)乃至(55)のいずれかに記載の画像処理装置。
(57) 3次元空間の所定の領域毎に、2次元平面に投影された3次元構造を表す3Dデータに含まれる位置毎のデータを前記3次元空間に投影する際に、前記位置毎のデータを、前記3次元空間の、前記領域毎に設定された1レイヤに投影可能な前記3Dデータの前記位置毎のデータの奥行方向の範囲を制限する奥行パラメータが示す前記奥行方向の範囲内に投影する
画像処理方法。
Claims (20)
- 3次元構造を表す3Dデータに含まれる全ての位置毎のデータを、複数レイヤの2次元平面に投影する2次元投影部
を備える画像処理装置。 - 前記2次元投影部は、前記3Dデータの、投影面から見て位置が奥行方向に重なる前記位置毎のデータを、前記複数のレイヤの前記2次元平面の、互いに異なるレイヤに投影する
請求項1に記載の画像処理装置。 - 前記2次元投影部は、前記2次元平面について、前記3Dデータの投影面から見て位置が奥行方向に重なる前記位置毎のデータの最大数と同数のレイヤを生成する
請求項2に記載の画像処理装置。 - 前記2次元投影部は、前記2次元平面の前記位置毎のデータが存在しない位置に、前記位置毎のデータが存在しないことを示す所定の値をセットする
請求項1に記載の画像処理装置。 - 前記所定の値は、予め定められた固定値である
請求項4に記載の画像処理装置。 - 前記所定の値は、前記3Dデータの奥行の最大値より大きな値である
請求項4に記載の画像処理装置。 - 前記2次元投影部は、前記3Dデータの前記位置毎のデータを、3次元空間の所定の領域毎に2次元平面に投影する際に、前記領域毎に設定された1レイヤに投影可能な前記3Dデータの前記位置毎のデータの奥行方向の範囲を制限する奥行パラメータが示す前記奥行方向の範囲内の前記位置毎のデータを、前記2次元平面に投影する
請求項1に記載の画像処理装置。 - 前記2次元投影部により前記2次元平面に投影された前記3Dデータを、符号化する符号化部をさらに備える
請求項1に記載の画像処理装置。 - 前記2次元投影部により前記3Dデータが投影された前記2次元平面のレイヤ数を示す情報と、前記符号化部により前記2次元平面が符号化されて得られた符号化データとを含むビットストリームを生成するビットストリーム生成部をさらに備える
請求項8に記載の画像処理装置。 - 前記3Dデータは、ポイントクラウドである
請求項1に記載の画像処理装置。 - 3次元構造を表す3Dデータに含まれる全ての位置毎のデータを、複数レイヤの2次元平面に投影する
画像処理方法。 - レイヤ数情報が示すレイヤ数の2次元平面に投影された3Dデータの全ての位置毎のデータを、3次元空間に投影する3次元投影部
を備える画像処理装置。 - 前記3次元投影部は、前記3Dデータに含まれる前記位置毎のデータの内、前記位置毎のデータが存在しないことを示す所定の値のデータ以外のデータを、前記3次元空間に投影する
請求項12に記載の画像処理装置。 - 前記所定の値は、予め定められた固定値である
請求項13に記載の画像処理装置。 - 前記所定の値は、前記3Dデータの奥行の最大値より大きな値である
請求項13に記載の画像処理装置。 - 前記3次元投影部は、前記3次元空間の所定の領域毎に、前記3Dデータに含まれる前記位置毎のデータを前記3次元空間に投影する際に、前記位置毎のデータを、前記3次元空間の、前記領域毎に設定された1レイヤに投影可能な3次元構造を表す3Dデータの位置毎のデータの奥行方向の範囲を制限する奥行パラメータが示す前記奥行方向の範囲内に投影する
請求項12に記載の画像処理装置。 - ビットストリームに含まれる前記レイヤ数情報を抽出する抽出部をさらに備え、
前記3次元投影部は、前記抽出部により抽出された前記レイヤ数情報が示すレイヤ数の前記2次元平面に投影された前記3Dデータの全ての前記位置毎のデータを、前記3次元空間に投影するように構成される
請求項12に記載の画像処理装置。 - 前記ビットストリームに含まれる前記2次元平面に投影された前記3Dデータの符号化データを復号する復号部をさらに備え、
前記3次元投影部は、前記復号部により前記符号化データが復号されて得られた、前記2次元平面に投影された前記3Dデータの全ての前記位置毎のデータを、前記3次元空間に投影するように構成される
請求項17に記載の画像処理装置。 - 前記3Dデータは、ポイントクラウドである
請求項12に記載の画像処理装置。 - レイヤ数情報が示すレイヤ数の2次元平面に投影された3Dデータの全ての位置毎のデータを、3次元空間に投影する
画像処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018004983 | 2018-01-16 | ||
JP2018004983 | 2018-01-16 | ||
PCT/JP2019/000051 WO2019142666A1 (ja) | 2018-01-16 | 2019-01-07 | 画像処理装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019142666A1 true JPWO2019142666A1 (ja) | 2021-01-28 |
JP7327166B2 JP7327166B2 (ja) | 2023-08-16 |
Family
ID=67301752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019566411A Active JP7327166B2 (ja) | 2018-01-16 | 2019-01-07 | 画像処理装置および方法 |
Country Status (15)
Country | Link |
---|---|
US (1) | US11721048B2 (ja) |
EP (1) | EP3742401A4 (ja) |
JP (1) | JP7327166B2 (ja) |
KR (2) | KR102596507B1 (ja) |
CN (1) | CN111566702B (ja) |
AU (1) | AU2019210233B2 (ja) |
BR (1) | BR112020013599A2 (ja) |
CA (1) | CA3087980A1 (ja) |
MX (1) | MX2020007416A (ja) |
PH (1) | PH12020500587A1 (ja) |
RU (1) | RU2020122782A (ja) |
SG (1) | SG11202005374UA (ja) |
TW (1) | TWI815842B (ja) |
WO (1) | WO2019142666A1 (ja) |
ZA (1) | ZA202005038B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2020007663A (es) * | 2018-01-19 | 2020-09-14 | Interdigital Vc Holdings Inc | Procesamiento de una nube de puntos. |
US11463681B2 (en) * | 2018-02-23 | 2022-10-04 | Nokia Technologies Oy | Encoding and decoding of volumetric video |
EP3554082A1 (en) * | 2018-04-11 | 2019-10-16 | InterDigital VC Holdings, Inc. | A method and device for coding the geometry of a point cloud |
CN111971968B (zh) * | 2018-04-11 | 2024-03-12 | 交互数字Vc控股公司 | 一种用于当3d点集正交投影到投影平面的至少一个图像区域时编码该3d点集的深度值的方法 |
EP3777182A1 (en) * | 2018-04-11 | 2021-02-17 | InterDigital VC Holdings, Inc. | A method and apparatus for encoding/decoding a point cloud representing a 3d object |
EP3780613A4 (en) * | 2018-04-11 | 2021-05-19 | Sony Corporation | IMAGE PROCESSING DEVICE AND METHOD |
KR20200140825A (ko) * | 2018-04-11 | 2020-12-16 | 인터디지털 브이씨 홀딩스 인코포레이티드 | 3d 객체를 나타내는 포인트 클라우드를 인코딩/디코딩하기 위한 방법 및 장치 |
CN112470480B (zh) | 2018-07-11 | 2024-06-18 | 索尼公司 | 图像处理装置和方法 |
EP3821400A1 (en) * | 2018-07-11 | 2021-05-19 | InterDigital VC Holdings, Inc. | Method for encoding/decoding texture of points of a point cloud |
JP2021182650A (ja) * | 2018-07-20 | 2021-11-25 | ソニーグループ株式会社 | 画像処理装置および方法 |
JP7100523B2 (ja) * | 2018-07-27 | 2022-07-13 | 京セラ株式会社 | 表示装置、表示システムおよび移動体 |
US11956478B2 (en) * | 2019-01-09 | 2024-04-09 | Tencent America LLC | Method and apparatus for point cloud chunking for improved patch packing and coding efficiency |
KR20210134391A (ko) * | 2019-03-12 | 2021-11-09 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 포인트 클라우드 코딩을 위한 패치 데이터 유닛 코딩 및 디코딩 |
EP3713238A1 (en) | 2019-03-20 | 2020-09-23 | InterDigital VC Holdings, Inc. | Processing a point cloud |
KR102596003B1 (ko) * | 2019-03-21 | 2023-10-31 | 엘지전자 주식회사 | 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신장치 및 포인트 클라우드 데이터 수신 방법 |
KR102624994B1 (ko) * | 2019-09-30 | 2024-01-12 | 지티이 코포레이션 | 포인트 클라우드 데이터를 위한 파일 형식 |
US11315289B2 (en) * | 2019-09-30 | 2022-04-26 | Nokia Technologies Oy | Adaptive depth guard band |
US20220303578A1 (en) * | 2019-11-13 | 2022-09-22 | Sony Group Corporation | Image processing apparatus and method |
CN115066902A (zh) * | 2020-03-25 | 2022-09-16 | 索尼集团公司 | 图像处理装置和方法 |
KR102533985B1 (ko) * | 2021-05-21 | 2023-05-17 | 한국항공대학교산학협력단 | 포인트 클라우드 복원 시스템 및 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012506573A (ja) * | 2008-10-21 | 2012-03-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | シーンの階層化深さモデルを提供するための方法及び装置並びにシーンの階層化深さモデルを有する信号 |
JP2016511457A (ja) * | 2013-01-18 | 2016-04-14 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 深度マップ上への再投影を使用するサーフェスコーデック |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100450823B1 (ko) * | 2001-11-27 | 2004-10-01 | 삼성전자주식회사 | 깊이 이미지 기반 3차원 물체의 표현을 위한 노드 구조 |
CN1261912C (zh) * | 2001-11-27 | 2006-06-28 | 三星电子株式会社 | 基于深度图像表示三维物体的装置和方法 |
JP5480914B2 (ja) * | 2009-12-11 | 2014-04-23 | 株式会社トプコン | 点群データ処理装置、点群データ処理方法、および点群データ処理プログラム |
JP5522367B2 (ja) | 2009-12-13 | 2014-06-18 | 国立大学法人 千葉大学 | 表面再現方法及び表面再現プログラム |
JP5161991B2 (ja) * | 2011-03-25 | 2013-03-13 | 株式会社東芝 | 画像処理装置 |
WO2012141235A1 (ja) * | 2011-04-13 | 2012-10-18 | 株式会社トプコン | 三次元点群位置データ処理装置、三次元点群位置データ処理システム、三次元点群位置データ処理方法およびプログラム |
WO2013075334A1 (en) * | 2011-11-25 | 2013-05-30 | Thomson Licensing | Position coding based on spatial tree with duplicate points |
US9075933B2 (en) * | 2012-10-11 | 2015-07-07 | Adobe Systems Incorporated | 3D transformation of objects using 2D controls projected in 3D space and contextual face selections of a three dimensional bounding box |
US9715761B2 (en) * | 2013-07-08 | 2017-07-25 | Vangogh Imaging, Inc. | Real-time 3D computer vision processing engine for object recognition, reconstruction, and analysis |
EP3058724A2 (en) * | 2013-10-14 | 2016-08-24 | Koninklijke Philips N.V. | Remapping a depth map for 3d viewing |
US9465361B2 (en) | 2014-03-31 | 2016-10-11 | Disney Enterprises, Inc. | Image based multiview multilayer holographic rendering algorithm |
WO2015172227A1 (en) * | 2014-05-13 | 2015-11-19 | Pcp Vr Inc. | Method, system and apparatus for generation and playback of virtual reality multimedia |
KR20170031656A (ko) * | 2014-07-08 | 2017-03-21 | 삼성전자주식회사 | 화상을 이용해 3차원 정보를 처리하는 전자 장치 및 방 |
US20170214943A1 (en) * | 2016-01-22 | 2017-07-27 | Mitsubishi Electric Research Laboratories, Inc. | Point Cloud Compression using Prediction and Shape-Adaptive Transforms |
CN106934861B (zh) * | 2017-02-09 | 2020-06-26 | 深圳先进技术研究院 | 物体三维重建方法及装置 |
CN107481313A (zh) * | 2017-08-18 | 2017-12-15 | 深圳市唯特视科技有限公司 | 一种基于学习有效点云生成的密集三维物体重建方法 |
-
2018
- 2018-12-27 TW TW107147408A patent/TWI815842B/zh active
-
2019
- 2019-01-07 WO PCT/JP2019/000051 patent/WO2019142666A1/ja unknown
- 2019-01-07 KR KR1020207019305A patent/KR102596507B1/ko active IP Right Grant
- 2019-01-07 JP JP2019566411A patent/JP7327166B2/ja active Active
- 2019-01-07 AU AU2019210233A patent/AU2019210233B2/en active Active
- 2019-01-07 KR KR1020237037047A patent/KR20230155019A/ko not_active Application Discontinuation
- 2019-01-07 EP EP19741709.0A patent/EP3742401A4/en active Pending
- 2019-01-07 CN CN201980007870.2A patent/CN111566702B/zh active Active
- 2019-01-07 RU RU2020122782A patent/RU2020122782A/ru unknown
- 2019-01-07 SG SG11202005374UA patent/SG11202005374UA/en unknown
- 2019-01-07 MX MX2020007416A patent/MX2020007416A/es unknown
- 2019-01-07 CA CA3087980A patent/CA3087980A1/en active Pending
- 2019-01-07 US US16/960,910 patent/US11721048B2/en active Active
- 2019-01-07 BR BR112020013599-2A patent/BR112020013599A2/pt unknown
-
2020
- 2020-07-09 PH PH12020500587A patent/PH12020500587A1/en unknown
- 2020-08-14 ZA ZA2020/05038A patent/ZA202005038B/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012506573A (ja) * | 2008-10-21 | 2012-03-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | シーンの階層化深さモデルを提供するための方法及び装置並びにシーンの階層化深さモデルを有する信号 |
JP2016511457A (ja) * | 2013-01-18 | 2016-04-14 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 深度マップ上への再投影を使用するサーフェスコーデック |
Non-Patent Citations (1)
Title |
---|
TIM GOLLA, REINHARD KLEIN: ""Real-time Point Cloud Compression"", 2015 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS), JPN6022043978, 2015, pages 5087 - 5092, XP032832361, ISSN: 0004965174, DOI: 10.1109/IROS.2015.7354093 * |
Also Published As
Publication number | Publication date |
---|---|
CN111566702A (zh) | 2020-08-21 |
CN111566702B (zh) | 2024-03-26 |
US11721048B2 (en) | 2023-08-08 |
SG11202005374UA (en) | 2020-07-29 |
KR20230155019A (ko) | 2023-11-09 |
JP7327166B2 (ja) | 2023-08-16 |
AU2019210233A1 (en) | 2020-07-23 |
US20210174559A1 (en) | 2021-06-10 |
CA3087980A1 (en) | 2019-07-25 |
BR112020013599A2 (pt) | 2020-12-01 |
MX2020007416A (es) | 2020-09-14 |
AU2019210233B2 (en) | 2023-10-19 |
EP3742401A4 (en) | 2020-12-09 |
KR20200108833A (ko) | 2020-09-21 |
ZA202005038B (en) | 2021-05-26 |
TW201933284A (zh) | 2019-08-16 |
RU2020122782A (ru) | 2022-01-10 |
WO2019142666A1 (ja) | 2019-07-25 |
EP3742401A1 (en) | 2020-11-25 |
TWI815842B (zh) | 2023-09-21 |
PH12020500587A1 (en) | 2021-06-14 |
KR102596507B1 (ko) | 2023-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7327166B2 (ja) | 画像処理装置および方法 | |
JP7552828B2 (ja) | 画像処理装置および方法 | |
US11699248B2 (en) | Image processing apparatus and method | |
WO2019198523A1 (ja) | 画像処理装置および方法 | |
WO2019142667A1 (ja) | 画像処理装置および方法 | |
JP7331852B2 (ja) | 画像処理装置および方法 | |
US11399189B2 (en) | Image processing apparatus and method | |
KR20200140256A (ko) | 화상 처리 장치 및 방법 | |
JP7396302B2 (ja) | 画像処理装置および方法 | |
WO2020188932A1 (ja) | 情報処理装置および情報生成方法 | |
WO2022145214A1 (ja) | 情報処理装置および方法 | |
US20210358176A1 (en) | Image processing apparatus and method | |
WO2020262020A1 (ja) | 情報処理装置および方法 | |
WO2020137603A1 (ja) | 画像処理装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7327166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |