WO2021261237A1 - 情報処理装置および方法 - Google Patents

情報処理装置および方法 Download PDF

Info

Publication number
WO2021261237A1
WO2021261237A1 PCT/JP2021/021665 JP2021021665W WO2021261237A1 WO 2021261237 A1 WO2021261237 A1 WO 2021261237A1 JP 2021021665 W JP2021021665 W JP 2021021665W WO 2021261237 A1 WO2021261237 A1 WO 2021261237A1
Authority
WO
WIPO (PCT)
Prior art keywords
coding
data
unit
scaling
scalable
Prior art date
Application number
PCT/JP2021/021665
Other languages
English (en)
French (fr)
Inventor
智 隈
央二 中神
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to EP21829007.0A priority Critical patent/EP4170597A4/en
Priority to CN202180043038.5A priority patent/CN115917601A/zh
Priority to JP2022531697A priority patent/JPWO2021261237A1/ja
Priority to US17/928,836 priority patent/US20230177735A1/en
Publication of WO2021261237A1 publication Critical patent/WO2021261237A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Definitions

  • This disclosure was made in view of such a situation, and makes it possible to more easily realize scalable decoding of point cloud data.
  • the information processing device and method of one aspect of the present technology in the coding of the point cloud that expresses a three-dimensional object as a set of points, it is a scalable coding method that generates coded data that can be decoded in a scalable manner. It is controlled to prohibit the combined use of coding and scaling coding, which is a coding method that involves changing the tree structure of geometry data.
  • Coding control> ⁇ References that support technical content and terminology>
  • the scope disclosed in the present technology includes not only the contents described in the embodiments but also the contents described in the following non-patent documents known at the time of filing.
  • Point cloud data (also referred to as point cloud data) is composed of geometry data (also referred to as position information) and attribute data (also referred to as attribute information) at each point.
  • Attribute data can contain any information. For example, the color information, reflectance information, normal information, etc. of each point may be included in the attribute data.
  • the point cloud data has a relatively simple data structure, and by using a sufficiently large number of points, an arbitrary three-dimensional structure can be expressed with sufficient accuracy.
  • a voxel is a three-dimensional area for quantizing geometry data (position information).
  • the bounding box 10 is divided into a plurality of voxels 11-1 represented by small squares.
  • the three-dimensional space is described as a two-dimensional plane. That is, in reality, the bounding box 10 is a three-dimensional space region, and the voxel 11-1 is a small region of a rectangular parallelepiped (including a cube).
  • the geometry data (position information) of each point 12-1 of the point cloud data indicated by the black circle in A in FIG. 1 is corrected so as to be arranged for each voxel 11-1. That is, the geometry data is quantized in units of this voxel.
  • all the squares in the bounding box 10 of FIG. 1A are voxels 11-1, and all the black circles shown in FIG. 1A are points 12-1.
  • ⁇ Tree structure (Octree)> Furthermore, a method has been considered in which the geometry data can be decoded in a scalable manner by structuring the geometry data into a tree structure. In other words, by making it possible to decode nodes from the top layer of the tree structure to any layer, not only the restoration of geometry data at the highest resolution (lowest layer) but also the lower resolution (on the way). It is also possible to restore geometry data in the hierarchy). That is, it is possible to decode at an arbitrary resolution without decoding unnecessary layer (resolution) information.
  • one voxel is divided into two in each of x, y, and z (that is, divided into eight) to form a voxel in the next lower hierarchy (also referred to as LoD).
  • a voxel in the next lower hierarchy also referred to as LoD
  • two voxels arranged in each of x, y, and z that is, eight voxels
  • LoD next higher hierarchy
  • points P1, P3, and P6 indicated by gray circles are selected as prediction points, and points P0, P2, P4, and P5 indicated by black circles are selected as reference points. That is, in this hierarchy, the difference value between the attribute data and the predicted value is derived for each of the predicted points P1, P3, and P6.
  • each point selected as a reference point in the next lower hierarchy is arranged in Morton code order, and is classified into a reference point and a prediction point as described above.
  • the reference structure of the attribute data is hierarchized.
  • mergeDuplicatePoint 1
  • mergeDuplicatePoint is flag information indicating whether or not to merge such overlapping points.
  • merges thin out points (reduces the number of points).
  • baseQP 4
  • the number of points is reduced to half for the 4 points (point2 to point5) indicated by the thick line.
  • the same rules as in the case of the example of FIG. 9 are applied. That is, in the layer one level higher than the third layer (second layer), the X coordinate of the third layer is 100 nodes and 101 nodes, the X coordinate is 102 nodes and 103 nodes, and the X coordinate is 104. Nodes and 105 nodes are grouped together. Further, in the uppermost layer (first layer), all the nodes of the second layer are put together.
  • the scalable coding may be any coding method that generates coded data that can be decoded in a scalable manner.
  • attribute data may be lifted and encoded with a reference structure similar to the tree structure of geometry data. That is, the coding may be controlled so as to prohibit the combined use of lifting scalability and scaling coding.
  • the coding device 200 includes a coding control unit 201, a geometry data coding unit 211, a geometry data decoding unit 212, a point cloud generation unit 213, an attribute data coding unit 214, and a bitstream generation unit.
  • the attribute data coding unit 214 acquires the geometry data (decoding result) and the attribute data supplied from the point cloud generation unit 213.
  • the attribute data coding unit 214 encodes the attribute data using the geometry data (decoding result) and generates the coded data of the attribute data.
  • the attribute data coding unit 214 performs this coding according to the control of the coding control unit 201. That is, the attribute data coding unit 214 applies lifting scalability in this coding according to the control of the coding control unit 201.
  • the attribute data coding unit 214 supplies the coded data of the generated attribute data to the bitstream generation unit 215.
  • the bitstream generation unit 215 acquires the coded data of the geometry data supplied from the geometry data coding unit 211. Further, the bitstream generation unit 215 acquires the coded data of the attribute data supplied from the attribute data coding unit 214. The bitstream generation unit 215 generates a bitstream including these coded data. Further, the bit stream generation unit 215 is, according to the control of the coding control unit 201, the scalable coding enable flag (for example, Lifting_scalability_enabled_flag) which is the flag information regarding the application of the scalable coding, and the flag information regarding the application of the scaling coding.
  • the scalable coding enable flag for example, Lifting_scalability_enabled_flag
  • the scalable layering processing unit 252 performs processing related to lifting of attribute data (formation of a reference structure). For example, the scalable layering processing unit 252 acquires attribute data and geometry data (decoding result) supplied from the selection unit 251. The scalable layering processing unit 252 layered the attribute data using the geometry data (that is, forms a reference structure). At that time, the scalable layering processing unit 252 applies the method described in Non-Patent Document 2 to perform layering. That is, the scalable layering processing unit 252 estimates the tree structure (octtree) based on the geometry data, forms a reference structure of the attribute data so as to correspond to the estimated tree structure, and follows the reference structure. The predicted value is derived, and the difference value between the predicted value and the attribute data is derived. The scalable layering processing unit 252 supplies the attribute data (difference value) generated in this way to the quantization unit 254.
  • attribute data difference value
  • the coding apparatus 200 is a coding method for generating coded data that can be scalablely decoded in the coding of a point cloud that expresses a three-dimensional object as a set of points. It is possible to prohibit the combined use of certain scalable coding with scaling coding, which is a coding method that involves changing the tree structure of geometry data. Therefore, for example, in encoding attribute data, it is possible to prepare multiple methods for estimating the tree structure of geometry data and realize scalable decoding of point cloud data without the need for complicated processing such as selecting from among them. Can be done. Moreover, since it is not necessary to newly design the method for estimating the tree structure, it is possible to suppress an increase in cost. That is, scalable decoding of point cloud data can be realized more easily.
  • step S103 When the process of step S103 is completed, the coding control process is completed.
  • step S104 the coding control unit 201 determines whether or not to apply geometry scaling. If it is determined that geometry scaling is applied, the process proceeds to step S105.
  • step S205 the bitstream generation unit 215 generates and outputs a bitstream including the coded data of the geometry data generated in step S201 and the coded data of the attribute data generated in step S204.
  • step S225 the coding unit 235 encodes the tree structure geometry data (that is, octree data) generated in step S222 or the geometry data that has been geometry-scaled in step S224 (that is, octtree data). , Generates coded data for geometry data.
  • step S244 the quantization unit 254 quantizes each difference value derived in step S242 or step S243 by executing the quantization process.
  • the coded data extraction unit 311 supplies the coded data of the extracted geometry data to the geometry data decoding unit 312.
  • the coded data extraction unit 311 supplies the coded data of the extracted attribute data to the attribute data decoding unit 313.
  • the decoding device 300 can correctly decode the coded data of the point cloud data generated by the coding device 200. In other words, scalable decoding of point cloud data can be realized more easily.
  • This program can also be provided via wired or wireless transmission media such as local area networks, the Internet, and digital satellite broadcasting. In that case, the program can be received by the communication unit 914 and installed in the storage unit 913.
  • the configuration described as one device (or processing unit) may be divided and configured as a plurality of devices (or processing units).
  • the configurations described above as a plurality of devices (or processing units) may be collectively configured as one device (or processing unit).
  • a configuration other than the above may be added to the configuration of each device (or each processing unit).
  • a part of the configuration of one device (or processing unit) may be included in the configuration of another device (or other processing unit). ..
  • the information processing apparatus controls so as to prohibit the application of the scaling coding when the scalable coding is applied.
  • the coding control unit controls signaling between the scalable coding enable flag, which is flag information related to the application of the scalable coding, and the scaling coding enable flag, which is flag information related to the application of the scaling coding.
  • the information processing apparatus according to (4).
  • (6) When the coding control unit signals the scalable coding enable flag having a value indicating the application of the scalable coding, the coding control unit signals the scaling coding enable flag having a value indicating that the scaling coding is not applied.
  • the information processing apparatus according to (5).
  • the information processing apparatus which controls to signal the scalable coding enable flag of the above.
  • the coding control unit controls to omit the signaling of the scalable coding enable flag when signaling the scaling coding enable flag of a value indicating the application of the scaling coding (10) to.
  • the information processing apparatus according to any one of (12).
  • a geometry data coding unit that encodes the geometry data of the point cloud according to the control of the coding control unit and generates the coding data of the geometry data.
  • the coding unit that encodes the attribute data to which the scalable layering has not been performed and the information processing apparatus according to any one of (14) to (16).
  • a geometry data decoding unit that decodes the coded data of the geometry data generated by the geometry data coding unit and generates the geometry data. Further, a recolor processing unit for performing recolor processing of the attribute data using the geometry data generated by the geometry data decoding unit is provided.
  • the information processing apparatus according to any one of (14) to (17), wherein the attribute data coding unit encodes the attribute data subjected to the recolor processing by the recolor processing unit.
  • Bit stream generation for generating a bit stream including the coded data of the geometry data generated by the geometry data coding unit and the coded data of the attribute data generated by the attribute data coding unit.
  • the information processing apparatus according to any one of (14) to (18), further comprising a unit.
  • scalable coding which is a coding method for generating coded data that can be decoded in a scalable manner, and changes in the tree structure of geometry data.
  • An information processing method that controls so as not to be used in combination with scaling coding which is a coding method that involves.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Generation (AREA)

Abstract

本開示は、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができるようにする情報処理装置および方法に関する。 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する。本開示は、例えば、情報処理装置、画像処理装置、符号化装置、復号装置、電子機器、情報処理方法、またはプログラム等に適用することができる。

Description

情報処理装置および方法
 本開示は、情報処理装置および方法に関し、特に、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができるようにした情報処理装置および方法に関する。
 従来、例えばポイントクラウド(Point cloud)のような3次元構造を表す3Dデータの符号化方法が考えられた(例えば非特許文献1参照)。また、このポイントクラウドの符号化データをスケーラブルに復号することができるようにする符号化方法が提案された(例えば非特許文献2参照)。非特許文献2に記載の方法の場合、アトリビュートデータの参照構造をジオメトリデータの木構造と同様にすることにより、スケーラブルな復号を実現する。
 ところで、このようなポイントクラウドの符号化の際に、ジオメトリデータをスケーリングし、ポイントを間引く方法が提案された(例えば非特許文献3参照)。
R. Mekuria, Student Member IEEE, K. Blom, P. Cesar., Member, IEEE, "Design, Implementation and Evaluation of a Point Cloud Codec for Tele-Immersive Video",tcsvt_paper_submitted_february.pdf Ohji Nakagami, Satoru Kuma, "[G-PCC] Spatial scalability support for G-PCC", ISO/IEC JTC1/SC29/WG11 MPEG2019/m47352, March 2019, Geneva, CH Xiang Zhang, Wen Gao, Sehoon Yea, Shan Liu, "[G-PCC][New proposal] Signaling delta QPs for adaptive geometry quantization in point cloud coding", ISO/IEC JTC1/SC29/WG11 MPEG2019/m49232, July 2019 Gothenburg, Sweden
 しかしながら、非特許文献3に記載のようにジオメトリデータをスケーリングし、ポイントを間引くとジオメトリデータの木構造が変化する。そのため、アトリビュートデータの参照構造とジオメトリデータの木構造との間で不一致が生じ、スケーラブルな復号ができなくなるおそれがあった。換言するに、非特許文献3に記載のようにジオメトリデータをスケーリングする場合にスケーラブルな復号を実現するためには、ジオメトリデータのスケーリングに対応させてアトリビュートデータの参照構造を形成する必要があった。つまり、スケーラブルな復号が可能となるようにポイントクラウドデータを符号化するためには、ジオメトリデータのスケーリングを行うか否かによってアトリビュートデータ参照構造を変えなければならず、煩雑な処理が必要になるおそれがあった。
 本開示は、このような状況に鑑みてなされたものであり、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができるようにするものである。
 本技術の一側面の情報処理装置は、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する符号化制御部を備える情報処理装置である。
 本技術の一側面の情報処理方法は、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する情報処理方法である。
 本技術の一側面の情報処理装置および方法においては、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御される。
ジオメトリデータの階層化の例を説明する図である。 Liftingの例を説明する図である。 Liftingの例を説明する図である。 Liftingの例を説明する図である。 量子化の例を説明する図である。 アトリビュートデータの階層化の例を説明する図である。 アトリビュートデータの逆階層化の例を説明する図である。 ジオメトリスケーリングの例を説明する図である。 ジオメトリスケーリングの例を説明する図である。 アトリビュートデータの階層化の例を説明する図である。 符号化制御の例を説明する図である。 セマンティクスの例を説明する図である。 プロファイルの例を説明する図である。 シンタックスの例を説明する図である。 符号化装置の主な構成例を示すブロック図である。 ジオメトリデータ符号化部の主な構成例を示すブロック図である。 アトリビュートデータ符号化部の主な構成例を示すブロック図である。 符号化制御処理の流れの例を説明するフローチャートである。 符号化処理の流れの例を説明するフローチャートである。 ジオメトリデータ符号化処理の流れの例を説明するフローチャートである。 アトリビュートデータ符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 コンピュータの主な構成例を示すブロック図である。
 以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
 1.符号化制御
 2.第1の実施の形態(符号化装置)
 3.第2の実施の形態(復号装置)
 4.付記
 <1.符号化制御>
  <技術内容・技術用語をサポートする文献等>
 本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。
 非特許文献1:(上述)
 非特許文献2:(上述)
 非特許文献3:(上述)
 非特許文献4:Khaled Mammou, Alexis Tourapis, Jungsun Kim, Fabrice Robinet, Valery Valentin, Yeping Su, "Lifting Scheme for Lossy Attribute Encoding in TMC1", ISO/IEC JTC1/SC29/WG11 MPEG2018/m42640, April 2018, San Diego, US
 つまり、上述の非特許文献に記載されている内容や、上述の非特許文献において参照されている他の文献の内容等も、サポート要件を判断する際の根拠となる。
  <ポイントクラウド>
 従来、ポイントの位置情報や属性情報等により3次元構造を表すポイントクラウド(Point cloud)や、頂点、エッジ、面で構成され、多角形表現を使用して3次元形状を定義するメッシュ(Mesh)等の3Dデータが存在した。
 例えばポイントクラウドの場合、立体構造物(3次元形状のオブジェクト)を多数のポイントにより表現する。ポイントクラウドのデータ(ポイントクラウドデータとも称する)は、各ポイントのジオメトリデータ(位置情報とも称する)とアトリビュートデータ(属性情報とも称する)とにより構成される。アトリビュートデータは任意の情報を含むことができる。例えば、各ポイントの色情報、反射率情報、法線情報等がアトリビュートデータに含まれるようにしてもよい。このようにポイントクラウドデータは、データ構造が比較的単純であるとともに、十分に多くのポイントを用いることにより任意の立体構造物を十分な精度で表現することができる。
  <ボクセルを用いた位置情報の量子化>
 このようなポイントクラウドデータはそのデータ量が比較的大きいので、符号化等によるデータ量を圧縮するために、ボクセル(Voxel)を用いた符号化方法が考えられた。ボクセルは、ジオメトリデータ(位置情報)を量子化するための3次元領域である。
 つまり、ポイントクラウドを内包する3次元領域(バウンディングボックス(Bounding box)とも称する)をボクセルと称する小さな3次元領域に分割し、そのボクセル毎に、ポイントを内包するか否かを示すようにする。このようにすることにより、各ポイントの位置はボクセル単位に量子化される。したがって、ポイントクラウド(Point cloud)データをこのようなボクセルのデータ(ボクセル(Voxel)データとも称する)に変換することにより、情報量の増大を抑制する(典型的には情報量を削減する)ことができる。
 例えば、図1のAに示されるように、バウンディングボックス10が、小さな四角形で示される複数のボクセル11-1に分割されるとする。なお、ここでは説明の簡略化のため3次元空間を2次元平面として説明している。つまり、実際には、バウンディングボックス10は3次元空間領域であり、ボクセル11-1は、直方体(立方体を含む)の小領域である。図1のAにおいて黒丸で示されるポイントクラウドデータの各ポイント12-1は、このボクセル11-1毎に配置されるように、そのジオメトリデータ(位置情報)が補正される。つまり、このボクセルを単位としてジオメトリデータが量子化される。なお、図1のAのバウンディングボックス10内の全ての四角がボクセル11-1であり、図1のAに示される全ての黒丸がポイント12-1である。
  <木構造(Octree)>
 さらに、ジオメトリデータを木構造化することにより、ジオメトリデータをスケーラブルに復号することができるようにする方法が考えられた。つまり、その木構造の最上位層から任意の階層までのノードを復号することができるようにすることにより、最高解像度(最下位層)でのジオメトリデータの復元だけでなく、より低解像度(途中階層)でのジオメトリデータの復元も可能になる。つまり、不要な階層(解像度)の情報を復号せずに、任意の解像度で復号することができる。
 この木構造はどのようなものであってもよい。例えば、KD木(KD Tree)やオクツリー(Octree)等がある。オクツリーは8分木であり、3次元空間領域の分割(x,y,zの各方向に2分割)に適している。つまり、上述のように、バウンディングボックス10を複数のボクセルに分割する構造に適している。
 例えば、1つのボクセルがx,y,zの各方向に2分割されて(すなわち8分割されて)1つ下位の階層(LoDとも称する)のボクセルが形成される。換言するに、x,y,zの各方向に並ぶ2つのボクセル(すなわち8個のボクセル)が統合されて、1つ上位の階層(LoD)のボクセルが形成される。このような構造を再帰的に繰り返すことにより、ボクセルを用いてオクツリーを構築することができる。
 そして、ボクセルデータでは、各ボクセルがポイントを内包するか否かが示される。換言するに、ボクセルデータでは、ボクセルサイズの解像度でポイントの位置が表現される。したがって、ボクセルデータを用いてオクツリーを構築することにより、ジオメトリデータの解像度のスケーラビリティを実現することができる。つまり、任意の位置に点在するポイントを木構造化するよりも、ボクセルデータを木構造化する方が、より容易にジオメトリデータのオクツリーを構築することができる。
 例えば図1のAの場合、2次元なので、図1のBのように上下左右に並ぶ4つのボクセル11-1が統合されて、太線で示される1階層上のボクセル11-2が形成される。そしてこのボクセル11-2を用いてジオメトリデータが量子化される。つまり、ボクセル11-2内に、ポイント12-1(図1のA)が存在する場合、その位置を補正することにより、そのポイント12-1が、ボクセル11-2に対応するポイント12-2に変換される。なお、図1のBにおいては1つのボクセル11-1にのみ符号を付しているが、図1のBのバウンディングボックス10内の点線で示される全ての四角がボクセル11-1である。同様に、図1のBにおいては1つのボクセル11-2にのみ符号を付しているが、図1のBのバウンディングボックス10内の太線で示される全ての四角がボクセル11-2である。同様に、図1のBにおいては1つのポイント12-2にのみ符号を付しているが、図1のBに示される全ての黒丸がポイント12-2である。
 同様に、図1のCのように、上下左右に並ぶ4つのボクセル11-2が統合されて、太線で示される1つ上位のボクセル11-3が形成される。そしてこのボクセル11-3を用いてジオメトリデータが量子化される。つまり、ボクセル11-3内に、ポイント12-2(図1のB)が存在する場合、その位置を補正することにより、そのポイント12-2が、ボクセル11-3に対応するポイント12-3に変換される。なお、図1のCにおいては1つのボクセル11-2にのみ符号を付しているが、図1のCのバウンディングボックス10内の点線で示される全ての四角がボクセル11-2である。同様に、図1のCにおいては1つのボクセル11-3にのみ符号を付しているが、図1のCのバウンディングボックス10内の太線で示される全ての四角がボクセル11-3である。同様に、図1のCにおいては1つのポイント12-3にのみ符号を付しているが、図1のCに示される全ての黒丸がポイント12-3である。
 同様に、図1のDのように、上下左右に並ぶ4つのボクセル11-3が統合されて、太線で示される1つ上位のボクセル11-4が形成される。そしてこのボクセル11-4を用いてジオメトリデータが量子化される。つまり、ボクセル11-4内に、ポイント12-3(図1のC)が存在する場合、その位置を補正することにより、そのポイント12-3が、ボクセル11-4に対応するポイント12-4に変換される。なお、図1のDにおいては、1つのボクセル11-3にのみ符号を付しているが、図1のDのバウンディングボックス10内の点線で示される全ての四角がボクセル11-3である。
 このようにすることにより、ジオメトリデータが木構造化(オクツリー化)される。
  <リフティング>
 これに対してアトリビュートデータを符号化する際は、符号化による劣化を含めジオメトリデータを既知であるものとして、点間の位置関係を利用して符号化を行う。このようなアトリビュートデータの符号化方法として、RAHT(Region Adaptive Hierarchical Transform)や、非特許文献4に記載のようなリフティング(Lifting)と称する変換を用いる方法が考えられた。これらの技術を適用することにより、ジオメトリデータのオクツリーのように、アトリビュートデータの参照構造(参照関係)を階層化(木構造化)することもできる。
 例えばリフティングの場合、各ポイントのアトリビュートデータは、他のポイントのアトリビュートデータを用いて導出される予測値との差分値として符号化される。そして、その差分値の導出(つまり予測値の導出)を行うポイントが階層的に選択される。
 例えば、図2のAに示される階層において、丸で示される各ポイント(P0乃至P9)の内、白丸で示されるポイントP7、P8、P9が、予測値が導出されるポイントである予測ポイントとして選択され、それ以外のポイントP0乃至P6は、その予測値導出の際にアトリビュートデータを参照されるポイントである参照ポイントとして選択されるように設定される。つまり、この階層においては、予測ポイントP7乃至P9のそれぞれについて、アトリビュートデータとその予測値との差分値が導出される。
 なお、図2においては説明の簡略化のため3次元空間を2次元平面として説明している。つまり、実際には、各ポイントP0乃至P6は、3次元空間に配置されている。
 図2のAの各矢印は、予測値を導出する際の参照関係を示す。例えば、予測ポイントP7の予測値は、参照ポイントP0およびP1のアトリビュートデータを参照して導出される。また、予測ポイントP8の予測値は、参照ポイントP2およびP3のアトリビュートデータを参照して導出される。さらに、予測ポイントP9の予測値は、参照ポイントP4乃至P6のアトリビュートデータを参照して導出される。そして、予測ポイントP7乃至P9のそれぞれについて、上述のように算出された予測値とアトリビュートデータとの差分値が導出される。
 その1つ上位の階層においては、図2のBに示されるように、図2のAの階層(1つ下位の階層)において参照ポイントに選択されたポイント(P0乃至P6)に対して、図2のAの階層の場合と同様の予測ポイントと参照ポイントとの分類(仕分け)が行われる。
 例えば、図2のBにおいてグレーの丸で示されるポイントP1、P3、P6が予測ポイントとして選択され、黒丸で示されるポイントP0、P2、P4、P5が参照ポイントとして選択される。つまり、この階層においては、予測ポイントP1、P3、P6のそれぞれについて、アトリビュートデータとその予測値との差分値が導出される。
 図2のBの各矢印は、予測値を導出する際の参照関係を示す。例えば、予測ポイントP1の予測値は、参照ポイントP0およびP2のアトリビュートデータを参照して導出される。また、予測ポイントP3の予測値は、参照ポイントP2およびP4のアトリビュートデータを参照して導出される。さらに、予測ポイントP6の予測値は、参照ポイントP4およびP5のアトリビュートデータを参照して導出される。そして、予測ポイントP1,P3,P6のそれぞれについて、上述のように算出された予測値とアトリビュートデータとの差分値が導出される。
 その1つ上位の階層においては、図2のCに示されるように、図2のBの階層(1つ下位の階層)において参照ポイントに選択されたポイント(P0、P2、P4、P5)の分類(仕分け)と、各予測ポイントの予測値の導出と、予測値とアトリビュートデータとの差分値の導出とが行われる。
 このような分類を、1つ下位の階層の参照ポイントに対して再帰的に繰り返すことにより、アトリビュートデータの参照構造が階層化される。
  <ポイントの分類>
 このようなリフティングにおけるポイントの分類(仕分け)の手順をより具体的に説明する。リフティングにおいてポイントの分類は、上述のように下位層から上位層に向かう順に行われる。各階層においては、まず、各ポイントをモートンコード順に整列させる。次に、そのモートンコード順に並ぶポイントの列の先頭のポイントを参照ポイントに選択する。次に、その参照ポイントの近傍に位置するポイント(近傍点)を探索し、探索されたポイント(近傍点)を予測ポイント(インデックスポイントとも称する)に設定する。
 例えば、図3に示されるように、処理対象の参照ポイント21を中心に半径Rの円22内においてポイントを探索する。この半径Rは階層毎に予め設定されている。図3の例の場合、ポイント23-1乃至ポイント23-4が検出され、予測ポイントに設定される。
 なお、図3においては説明の簡略化のため3次元空間を2次元平面として説明している。つまり、実際には、各ポイントは、3次元空間に配置されており、ポイントの探索は、半径Rの球状の領域内において行われる。
 次に、残りのポイントについて同様の分類を行う。つまり、現時点において参照ポイントにも予測ポイントにも選択されていないポイントの内、モートンコード順に先頭のポイントを参照ポイントに選択し、その参照ポイント近傍のポイントを探索し、予測ポイントに設定する。
 全てのポイントを分類するまで上述の処理を繰り返したら、その階層の処理が終了し、処理対象が1つ上位の階層に移る。そして、その階層について、上述の手順が繰り返される。つまり、1つ下位の階層において参照ポイントに選択された各ポイントがモートンコード順に整列され、上述のように参照ポイントと予測ポイントに分類される。以上のような処理を繰り返すことにより、アトリビュートデータの参照構造が階層化される。
  <予測値の導出>
 また上述したようにリフティングの場合、予測ポイントのアトリビュートデータの予測値は、その予測ポイント周辺の参照ポイントのアトリビュートデータを用いて導出される。例えば、図4に示されるように、予測ポイントQ(i,j)の予測値を、参照ポイントP1乃至P3のアトリビュートデータを参照して導出するとする。
 なお、図4においては説明の簡略化のため3次元空間を2次元平面として説明している。つまり、実際には、各ポイントは、3次元空間に配置されている。
 この場合、以下の式(1)のように、各参照ポイントのアトリビュートデータが、予測ポイントとその参照ポイントとの距離(実際には3次元空間上の距離)の逆数に応じた重み値(α(P,Q(i,j)))により重み付けされて統合されて導出される。ここでA(P)は、ポイントPのアトリビュートデータを示す。
Figure JPOXMLDOC01-appb-M000001
 非特許文献4に記載の方法では、この予測ポイントとその参照ポイントとの距離の導出に、最高解像度(つまり最下位層)の位置情報が用いられていた。
  <量子化>
 また、アトリビュートデータは、上述のように階層化された後、量子化されて符号化される。その量子化の際に、各ポイントのアトリビュートデータ(差分値)は、階層構造に応じて図5の例のように重み付けされる。この重み値(Quantization Weight)Wは、図5に示されるように、下位層の重み値を用いてポイント毎に導出される。なお、この重み値は、圧縮効率を向上させるために、リフティング(アトリビュートデータの階層化)においても利用され得る。
  <木構造の不一致>
 非特許文献4に記載のリフティングの場合、上述したようにアトリビュートデータの参照構造の階層化の方法は、ジオメトリデータの木構造化(例えばオクツリー化)の場合と異なる。したがって、アトリビュートデータの参照構造がジオメトリデータの木構造と一致することが保証されない。そのため、アトリビュートデータを復号するために、その階層に関わらず、ジオメトリデータを最下位層まで復号する必要があった。つまり、不要な情報を復号せずにポイントクラウドデータのスケーラブルな復号を実現することが困難であった。
  <ポイントクラウドデータのスケーラブルな復号の実現>
 そこで、非特許文献2に記載のように、アトリビュートデータの参照構造をジオメトリデータの木構造と同様にする方法が提案された。より具体的には、アトリビュートデータの参照構造を構築する際に、カレント階層のポイントが存在するボクセルが属する1つ上位階層のボクセルにもポイントが存在するように予測ポイントを選択するようにする。このようにすることにより、不要な情報を復号せずに所望の解像度でポイントクラウドデータを復号することができる。すなわち、ポイントクラウドデータのスケーラブルな復号を実現することができる。
 例えば、図6のAに示されるように、所定の3次元空間領域であるバウンディングボックス100において、ポイント102-1乃至ポイント102-9が所定の階層のボクセル101-1毎に配置されているとする。なお、図6においては、説明の簡略化のため3次元空間を2次元平面として説明している。つまり、実際には、バウンディングボックスは3次元空間領域であり、ボクセルは、直方体(立方体を含む)の小領域である。ポイントは、3次元空間に配置される。
 なお、ボクセル101-1乃至ボクセル101-3を互いに区別して説明する必要が無い場合、ボクセル101と称する。また、ポイント102-1乃至ポイント102-9を互いに区別して説明する必要が無い場合、ポイント102と称する。
 この階層において、図6のBに示されるように、ポイント102-1乃至ポイント102-9が存在するボクセル101-1の1つ上位階層のボクセル101-2にもポイントが存在するように、ポイント102-1乃至ポイント102-9を予測ポイントと参照ポイントに分類する。図6のBの例では、白丸で示されるポイント102-3、ポイント102-5、およびポイント102-8が予測ポイントに設定され、その他のポイントが参照ポイントに設定されている。
 1つ上位の階層においても同様に、ポイント102-1、ポイント102-2、ポイント102-4、ポイント102-6、ポイント102-7、ポイント102-9が存在するボクセル101-2の1つ上位階層のボクセル101-3にもポイントが存在するように、これらのポイント102を予測ポイントと参照ポイントに分類する(図6のC)。図6のCの例では、グレーの丸で示されるポイント102-1、ポイント102-4、およびポイント102-7が予測ポイントに設定され、その他のポイントが参照ポイントに設定されている。
 このようにすることにより、図6のDに示されるように、下位層においてポイント102が存在するボクセル101-3には、ポイント102が1つ存在するように階層化される。このような処理を各階層について行う。つまり、アトリビュートデータの参照構造を構築する際(各階層における予測ポイントと参照ポイントとの分類の際)にこのような処理を行うことにより、アトリビュートデータの参照構造をジオメトリデータの木構造(オクツリー)と同様にすることができる。
 復号は、例えば図7のように、図6の逆順で行われる。例えば、図7のAに示されるように、所定のバウンディングボックス100において、ポイント102-2、ポイント102-6、ポイント102-9が所定の階層のボクセル101-3毎に配置されているとする(図6のDと同様の状態)。なお、図7においても、説明の簡略化のため3次元空間を2次元平面として説明している。つまり、実際には、バウンディングボックスは3次元空間領域であり、ボクセルは、直方体(立方体を含む)の小領域である。ポイントは、3次元空間に配置される。
 この1つ下位の階層においては、図6のBに示されるように、ボクセル101-3毎のポイント102-2、ポイント102-6、ポイント102-9のアトリビュートデータを用いて、ポイント102-1、ポイント102-4、ポイント102-7の予測値を導出して差分値に加算し、ボクセル101-2毎のポイント102のアトリビュートデータを復元する(図6のCと同様の状態)。
 さらに、1つ下位の階層においても同様に、図7のCに示されるように、ボクセル101-2毎のポイント102-1、ポイント102-2、ポイント102-4、ポイント102-6、ポイント102-7、ポイント102-9のアトリビュートデータを用いて、ポイント102-3、ポイント102-5、ポイント102-8の予測値を導出して差分値に加算し、アトリビュートデータを復元する(図6のBと同様の状態)。
 このようにすることにより、図7のDに示されるように、ボクセル101-1毎のポイント102のアトリビュートデータが復元される(図6のAと同様の状態)。つまり、オクツリーの場合と同様に、上位階層のアトリビュートデータを用いて各階層のアトリビュートデータを復元することができる。
 このようにすることにより、アトリビュートデータの参照構造(階層構造)をジオメトリデータの木構造(階層構造)に対応付けることができる。したがって、中間解像度においても各アトリビュートデータに対応するジオメトリデータが得られるので、その中間解像度でジオメトリデータおよびアトリビュートデータを正しく復号することができる。つまり、ポイントクラウドデータのスケーラブルな復号を実現することができる。
  <ジオメトリスケーリング>
 ところで、非特許文献3に記載のように、ポイントクラウドの符号化の際に、ジオメトリデータをスケーリングし、ポイントを間引くジオメトリスケーリング(Geometry Scaling)という方法が提案された。ジオメトリスケーリングでは、符号化の際にノードのジオメトリデータを量子化する。この処理により、符号化対象の領域の特性に応じて、点を間引くことができる。
 例えば、図8のAに示されるように、X座標がそれぞれ、100、101、102、103、104、105の6つのポイント(point1乃至point6)を処理対象とする。なお、ここでは、説明を簡略するため、X座標についてのみ説明する。つまり、実際には、ポイントは3次元空間上に配置されるため、Y座標やZ座標についても、以下に説明するX座標の場合と同様の処理が行われる。
 このような6ポイントに対してジオメトリスケーリングが適用される場合、量子化のパラメータbaseQPの値に応じて、図8のBに示される表のように、各ポイントのX座標のスケーリングが行われる。baseQP = 0の場合、スケーリングが行われないので、各ポイントのX座標は、図8のAに示される座標のままとなる。例えば、baseQP = 4の場合、point2のX座標が101から102にスケーリングされ、point4のX座標が103から104にスケーリングされ、point6のX座標が105から106にスケーリングされる。
 このスケーリングにより複数のポイントのX座標が重畳した場合、マージすることができる。例えば、mergeDuplicatePoint=1の場合、このような重複点がマージされ、1つのポイントとされる。mergeDuplicatePointは、このような重複点のマージを行うか否かを示すフラグ情報である。つまり、このようなマージにより、ポイントが間引かれる(ポイント数が低減する)。例えば、図8のBの表の各行において、このようなマージにより、グレーで示されるポイントを間引くことができる。例えば、baseQP = 4の場合、太線で示される4ポイント(point2乃至point5)については、ポイント数が2分の1に低減される。
 ポイントクラウドデータのスケーラブルな復号を実現するために、非特許文献2に記載のようにアトリビュートデータの階層化を行う場合、ジオメトリデータの符号化データの復号結果に基づいてジオメトリデータの木構造の推定が行われる。つまり、推定したジオメトリデータの木構造と同様になるように、アトリビュートデータの参照構造が形成される。
  <ジオメトリスケーリングによる木構造の不一致>
 ところが上述のようにジオメトリスケーリングが適用されると、ジオメトリデータの符号化データの復号結果においては、ポイントが間引かれている可能性がある。ポイントが間引かれている場合、実際のジオメトリデータの木構造を推定することができない可能性がある。つまり、木構造の推定結果と、実際の木構造(間引かれる前のポイントに対応する木構造)とで不一致が生じるおそれがある。そのような場合、ポイントクラウドデータのスケーラブルな復号を実現することができないおそれがあった。
 図8のBのbaseQP = 4の場合を例に説明する。図8のAに示される表の各ポイント(point1乃至point6)に対応する木構造が図9に示されるような木構造であるとする。この木構造のノード121-1乃至ノード121-6が図8のAに示される表の各ポイント(point1乃至point6)に対応する。つまり、この木構造の最下位層(第3層)のノード121-1乃至ノード121-6のX座標がそれぞれ、100、101、102、103、104、105であるとする。
 図9の木構造は、以下の2つのルールが適用されている。1つ目は、第3層の1つ上位の階層(第2層)においては、第3層のX座標が100のノードと101のノード、X座標が102のノードと103のノード、X座標が104のノードと105のノードが、それぞれまとめられる、というルールである。2つ目は、最上位層(第1層)においては、第2層の全ノードがまとめられる、というルールである。
 つまり、第3層のノード121-1およびノード121-2は第2層のノード122-1に属する。第3層のノード121-3およびノード121-4は第2層のノード122-2に属する。第3層のノード121-5およびノード121-6は第2層のノード122-3に属する。また、第2層のノード122-1乃至ノード122-3は、第1層のノード123に属する。
 ジオメトリスケーリングが行われると、ノード121-2のX座標が101から102にスケーリングされ、ノード121-4のX座標が103から104にスケーリングされ、ノード121-6のX座標が105から106にスケーリングされる。これにより、ノード121-2とノード121-3のX座標が重複するのでマージされ、ノード121-3が間引かれる。同様に、ノード121-4とノード121-5がマージされてノード121-5が間引かれる。これにより、第3層においては、ノード121-1、ノード121-2、ノード121-4、およびノード121-6が符号化される。
 アトリビュートデータの符号化においては、ジオメトリデータの符号化データの復号結果として、最高解像度のジオメトリデータが得られる。つまり、図9の例の場合、ノード121-1、ノード121-2、ノード121-4、およびノード121-6が得られる。そして、これらの4つのポイント(4ノード)からジオメトリデータの木構造が推定される。
 その場合、同様の木構造を形成するために、図9の例の場合と同様のルールが適用される。つまり、第3層の1つ上位の階層(第2層)においては、第3層のX座標が100のノードと101のノード、X座標が102のノードと103のノード、X座標が104のノードと105のノードが、それぞれまとめられる。また、最上位層(第1層)においては、第2層の全ノードがまとめられる。
 これにより、図10に示されるような木構造が推定される。つまり、第3層のノード121-1は第2層のノード124-1に属する。第3層のノード121-2は第2層のノード124-2に属する。第3層のノード121-4は第2層のノード124-3に属する。第3層のノード121-6は第2層のノード124-4に属する。また、第2層のノード124-1乃至ノード124-4は、第1層のノード125に属する。
 図9と図10を比較して明らかなように、これらの木構造は不一致となる。例えば、復号する階層を示すパラメータskipOctreeLayerの値が「1」である(skipOctreeLayer = 1)とする。つまり、第2層を復号する場合、図9に示されるように、ジオメトリデータは3つのノードが得られる。これに対して図10に示されるように、アトリビュートデータは4つのノードが得られる。このように、木構造が不一致となることにより、不要な情報を復号せずに所望の階層の復号結果を得ることが困難であった。つまり、ポイントクラウドデータのスケーラブルな復号を実現することが困難であった。
 換言するに、ポイントクラウドデータのスケーラブルな復号を実現するためには、このようなジオメトリスケーリングを考慮して木構造の推定を行わなければならない。つまり、ジオメトリスケーリングが行われる場合と行われない場合とで木構造の推定方法を変える等の煩雑な処理が必要であった。また、複数の推定方法を用意することにより、コストが増大するおそれがあった。
 また、ジオメトリスケーリングにおいて、重複点を間引く際に、その間引き方(重複する複数のポイントの内、どのポイントを間引くか)は規定されておらず、設計に依存する。つまり、ジオメトリスケーリングに対応する木構造の推定方法は、そのジオメトリスケーリングの設計に応じて新規に設計しなければならず、コストが増大するおそれがあった。
  <符号化方法の制限>
 そこで、図11に示される表の1番上の行に記載のように、適用可能な符号化方法を制限し、スケーラブル復号可能な符号化とジオメトリデータの木構造を更新する処理との併用を禁止する。
 つまり、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御するようにする。
 例えば、情報処理装置において、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する符号化制御部を備えるようにする。
 つまり、スケーラブル符号化を適用する場合は、スケーリング符号化の適用を禁止し、スケーリング符号化を適用する場合は、スケーラブル符号化の適用を禁止する。このようにすることにより、スケーラブル符号化を行う場合において、アトリビュートデータの参照構造とジオメトリデータの木構造との不一致の発生を抑制することができる。したがって、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができる。
 なお、スケーラブル符号化は、スケーラブルに復号可能な符号化データを生成する符号化方法であればどのような方法であってもよい。例えば、非特許文献2に記載のような、アトリビュートデータを、ジオメトリデータの木構造と同様の参照構造でリフティングして符号化するリフティングスケーラビリティ(Lifting Scalability)であるようにしてもよい。つまり、リフティングスケーラビリティとスケーリング符号化との併用を禁止するように符号化を制御してもよい。
 また、スケーリング符号化は、ジオメトリデータの木構造の変更を伴う符号化方法であればどのような方法であってもよい。例えば、非特許文献3に記載のような、ジオメトリデータをスケーリングして符号化するジオメトリスケーリング(Geometry Scaling)であるようにしてもよい。つまり、スケーラブル符号化とジオメトリスケーリングとの併用を禁止するように制御してもよい。
 もちろん、図11に示される表の上から2番目の行に記載のように、リフティングスケーラビリティ(Lifting Scalability)とジオメトリスケーリング(Geometry Scaling)との併用を禁止してもよい(方法1)。
 その際、符号化制御部が、スケーラブル符号化を適用する場合に、スケーリング符号化の適用を禁止するように制御してもよい。例えば、図11に示される表の上から3番目の行に記載のように、リフティングスケーラビリティを適用する場合に、ジオメトリスケーリングの適用を禁止してもよい(方法1-1)。
 また、符号化制御部が、スケーリング符号化を適用する場合に、スケーラブル符号化の適用を禁止するように制御してもよい。例えば、図11に示される表の上から4番目の行に記載のように、ジオメトリスケーリングを適用する場合に、リフティングスケーラビリティの適用を禁止してもよい(方法1-2)。
 また、このような制御を行うために、例えば、図11に示される表の上から5番目の行に記載のように、スケーラブル符号化とスケーリング符号化の適用を許可するか否か(または禁止するか否か)を示すフラグ情報(許可フラグまたは禁止フラグ)を設定してもよい(方法2)。
 例えば、符号化制御部が、スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグと、スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグとのシグナリングを制御してもよい。
 例えば、図11に示される表の上から6番目の行に記載のように、セマンティクスにおいてこのような制限を規定するようにしてもよい(方法2-1)。例えば、セマンティクスにおいて、スケーラブル符号化の適用を示す値のスケーラブル符号化イネーブルフラグをシグナリングする場合、スケーリング符号化の非適用を示す値のスケーリング符号化イネーブルフラグをシグナリングするように規定し、符号化制御部がそのセマンティクスに従ってシグナリングを行うようにしてもよい。また、セマンティクスにおいて、スケーリング符号化の適用を示す値のスケーリング符号化イネーブルフラグをシグナリングする場合、スケーラブル符号化の非適用を示す値のスケーラブル符号化イネーブルフラグをシグナリングするように規定し、符号化制御部がそのセマンティクスに従ってシグナリングを行うようにしてもよい。
 図12にその場合のセマンティクスの例を示す。例えば、図12に示されるセマンティクス161では、geom_scaling_enabled_flagの値が0より大きい場合、lifting_scalability_enabled_flagの値を0にしなければならないことが規定されている。ここで、geom_scaling_enabled_flagは、ジオメトリスケーリングを適用するか否かを示すフラグ情報である。geom_scaling_enabled_flag = 1の場合、ジオメトリスケーリングが適用される。また、geom_scaling_enabled_flag = 0の場合、ジオメトリスケーリングが適用されない。lifting_scalability_enabled_flagは、リフティングスケーラビリティを適用するか否かを示すフラグ情報である。lifting_scalability_enabled_flag = 1の場合、リフティングスケーラビリティが適用される。また、lifting_scalability_enabled_flag = 0の場合、リフティングスケーラビリティが適用されない。
 つまり、このセマンティクス161では、ジオメトリスケーリングが適用される場合、リフティングスケーラビリティの適用が禁止されている。なお、これとは逆に、セマンティクスにおいて、リフティングスケーラビリティが適用される場合、ジオメトリスケーリングの適用が禁止されるようにしてもよい。つまり、セマンティクスにおいて、lifting_scalability_enabled_flagの値が0より大きい場合、geom_scaling_enabled_flagの値を0にしなければならないことを規定してもよい。
 また、例えば、図11に示される表の上から7番目の行に記載のように、プロファイルにおいてこのような制限に基づくシグナリングを行うようにしてもよい(方法2-2)。例えば、スケーラブル符号化を適用する場合、符号化制御部が、プロファイルにおいて、スケーラブル符号化の適用を示す値のスケーラブル符号化イネーブルフラグと、スケーリング符号化の非適用を示す値のスケーリング符号化イネーブルフラグとをシグナリングするように制御してもよい。また、スケーリング符号化を適用する場合、符号化制御部が、プロファイルにおいて、スケーリング符号化の適用を示す値のスケーリング符号化イネーブルフラグと、スケーラブル符号化の非適用を示す値のスケーラブル符号化イネーブルフラグとをシグナリングするように制御してもよい。
 図13にリフティングスケーラビリティを適用する場合のプロファイルの例を示す。例えば、図13に示されるプロファイル162では、lifting_scalability_enabled_flag = 1とgeom_scaling_enabled_flag = 0がシグナリングされている。つまり、このプロファイル162においては、リフティングスケーラビリティを適用し、ジオメトリスケーリングを非適用とすることが示されている。
 なお、ジオメトリスケーリングを適用する場合のプロファイルにおいて、geom_scaling_enabled_flag = 1と、lifting_scalability_enabled_flag = 0とをシグナリングしてもよい。
 さらに、例えば、図11に示される表の1番下の行に記載のように、シンタックスにおいてこのような制限を規定するようにしてもよい(方法2-3)。例えば、スケーラブル符号化の適用を示す値のスケーラブル符号化イネーブルフラグをシグナリングする場合、符号化制御部が、上述のようなシンタックスに従って、スケーリング符号化イネーブルフラグのシグナリングを省略するように制御してもよい。また、スケーリング符号化の適用を示す値のスケーリング符号化イネーブルフラグをシグナリングする場合、符号化制御部が、上述のようなシンタックスに従って、スケーラブル符号化イネーブルフラグのシグナリングを省略するように制御してもよい。
 図14にその場合のシンタックスの例を示す。例えば、図14に示されるシンタックス163では、geom_scaling_enabled_flagをシグナリングしない場合(つまり、値が「0」とされ、ジオメトリスケーリングが非適用とされる場合)のみ、lifting_scalability_enabled_flagがシグナリングされる。つまり、この場合、リフティングスケーラビリティを適用することができる。換言するに、ジオメトリスケーリングを適用可能な場合(すなわちgeom_scaling_enabled_flagがシグナリングされる場合)、lifting_scalability_enabled_flagはシグナリングされない(つまり、値が「0」とされ、リフティングスケーラビリティが非適用とされる)。
 なお、これとは逆に、lifting_scalability_enabled_flagをシグナリングしない場合(つまり、値が「0」とされ、リフティングスケーラビリティが非適用とされる場合)のみ、geom_scaling_enabled_flagがシグナリングされるようにしてもよい。つまり、この場合、ジオメトリスケーリングを適用することができる。換言するに、リフティングスケーラビリティを適用可能な場合(すなわちlifting_scalability_enabled_flagがシグナリングされる場合)、geom_scaling_enabled_flagはシグナリングされない(つまり、値が「0」とされ、ジオメトリスケーリングが非適用とされる)ようにしてもよい。
 <2.第1の実施の形態>
  <符号化装置>
 次に、<1.符号化制御>において上述した本技術を適用する装置について説明する。図15は、本技術を適用した情報処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図15に示される符号化装置200は、ポイントクラウド(3Dデータ)を符号化する装置である。符号化装置200は、<1.符号化制御>において上述した本技術を適用してポイントクラウドを符号化する。
 なお、図15においては、処理部やデータの流れ等の主なものを示しており、図15に示されるものが全てとは限らない。つまり、符号化装置200において、図15においてブロックとして示されていない処理部が存在したり、図15において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
 図15に示されるように符号化装置200は、符号化制御部201、ジオメトリデータ符号化部211、ジオメトリデータ復号部212、ポイントクラウド生成部213、アトリビュートデータ符号化部214、およびビットストリーム生成部215を有する。
 符号化制御部201は、ポイントクラウドデータの符号化の制御に関する処理を行う。例えば、符号化制御部201は、ジオメトリデータ符号化部211を制御する。また、符号化制御部201は、アトリビュートデータ符号化部214を制御する。例えば、符号化制御部201は、<1.符号化制御>において上述したように、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように、これらの処理部を制御する。また、符号化制御部201は、ビットストリーム生成部215を制御し、スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグ(例えば、Lifting_scalability_enabled_flag)と、スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグ(例えば、geom_ scaling_enabled_flag)とのシグナリングを制御する。
 ジオメトリデータ符号化部211は、符号化装置200に入力されたポイントクラウド(3Dデータ)のジオメトリデータ(位置情報)を符号化し、その符号化データを生成する。この符号化方法は任意である。例えば、ノイズ抑制(デノイズ)のためのフィルタリングや量子化等の処理が行われるようにしてもよい。ただし、ジオメトリデータ符号化部211は、符号化制御部201の制御に従って、この符号化を行う。つまり、ジオメトリデータ符号化部211は、この符号化において、符号化制御部201の制御に従って、ジオメトリスケーリングを適用する。ジオメトリデータ符号化部211は、生成したジオメトリデータの符号化データをジオメトリデータ復号部212およびビットストリーム生成部215に供給する。
 ジオメトリデータ復号部212は、ジオメトリデータ符号化部211から供給されるジオメトリデータの符号化データを取得し、その符号化データを復号する。この復号方法は、ジオメトリデータ符号化部211による符号化に対応する方法であれば任意である。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。ジオメトリデータ復号部212は、生成したジオメトリデータ(復号結果)をポイントクラウド生成部213に供給する。
 ポイントクラウド生成部213は、符号化装置200に入力されるポイントクラウドのアトリビュートデータ(属性情報)と、ジオメトリデータ復号部212から供給されるジオメトリデータ(復号結果)を取得する。ポイントクラウド生成部213は、アトリビュートデータをジオメトリデータ(復号結果)に対応させる処理(リカラー処理)を行う。ポイントクラウド生成部213は、ジオメトリデータ(復号結果)に対応させたアトリビュートデータをアトリビュートデータ符号化部214に供給する。
 アトリビュートデータ符号化部214は、ポイントクラウド生成部213から供給されるジオメトリデータ(復号結果)およびアトリビュートデータを取得する。アトリビュートデータ符号化部214は、そのジオメトリデータ(復号結果)を用いて、アトリビュートデータを符号化し、アトリビュートデータの符号化データを生成する。ただし、アトリビュートデータ符号化部214は、符号化制御部201の制御に従って、この符号化を行う。つまり、アトリビュートデータ符号化部214は、この符号化において、符号化制御部201の制御に従って、リフティングスケーラビリティを適用する。アトリビュートデータ符号化部214は、生成したアトリビュートデータの符号化データをビットストリーム生成部215に供給する。
 ビットストリーム生成部215は、ジオメトリデータ符号化部211から供給されるジオメトリデータの符号化データを取得する。また、ビットストリーム生成部215は、アトリビュートデータ符号化部214から供給されるアトリビュートデータの符号化データを取得する。ビットストリーム生成部215は、これらの符号化データを含むビットストリームを生成する。また、ビットストリーム生成部215は、符号化制御部201の制御に従って、スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグ(例えば、Lifting_scalability_enabled_flag)や、スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグ(例えば、geom_ scaling_enabled_flag)等の制御情報のシグナリングを行う(制御情報をビットストリームに含める)。ビットストリーム生成部215は、生成したビットストリームを符号化装置200の外部(例えば復号側)に出力する。
 このような構成とすることにより、符号化装置200は、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止することができ、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができる。
 なお、これらの処理部(符号化制御部201、ジオメトリデータ符号化部211乃至ビットストリーム生成部215)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
  <ジオメトリデータ符号化部>
 図16は、ジオメトリデータ符号化部211の主な構成例を示すブロック図である。なお、図16においては、処理部やデータの流れ等の主なものを示しており、図16に示されるものが全てとは限らない。つまり、ジオメトリデータ符号化部211において、図16においてブロックとして示されていない処理部が存在したり、図16において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
 図16に示されるように、ジオメトリデータ符号化部211は、ボクセル生成部231、木構造生成部232、選択部233、ジオメトリスケーリング部234、および符号化部235を有する。
 ボクセル生成部231は、ボクセルデータの生成に関する処理を行う。例えば、ボクセル生成部231は、入力されるポイントクラウドデータに対してバウンディングボックスを設定し、そのバウンディングボックスを分割するようにボクセルを設定する。そして、ボクセル生成部231は、各ポイントのジオメトリデータをそのボクセルを単位として量子化し、ボクセルデータを生成する。ボクセル生成部231は、生成したボクセルデータを木構造生成部232に供給する。
 木構造生成部232は、木構造の生成に関する処理を行う。例えば、木構造生成部232は、ボクセル生成部231から供給されるボクセルデータを取得する。また、木構造生成部232は、そのボクセルデータを木構造化する。例えば、木構造生成部232は、ボクセルデータを用いてオクツリー(Octree)を生成する。木構造生成部232は、生成したオクツリーのデータを選択部233に供給する。
 選択部233は、ジオメトリスケーリングの適用・非適用の制御に関する処理を行う。例えば、選択部233は、木構造生成部232から供給されるオクツリーのデータを取得する。また、選択部233は、符号化制御部201の制御に従って、そのオクツリーのデータの供給先を選択する。すなわち、選択部233は、符号化制御部201の制御に従って、そのオクツリーのデータを、ジオメトリスケーリング部234に供給するか、符号化部235に供給するかを選択し、その選択した供給先にオクツリーのデータを供給する。
 例えば、符号化制御部201によりジオメトリスケーリングの適用を指示された場合、選択部233は、オクツリーのデータをジオメトリスケーリング部234に供給する。また、符号化制御部201によりジオメトリスケーリングの非適用を指示された場合、選択部233は、オクツリーのデータを符号化部235に供給する。
 ジオメトリスケーリング部234は、ジオメトリスケーリングに関する処理を行う。例えば、ジオメトリスケーリング部234は、選択部233から供給されるオクツリーのデータを取得する。また、ジオメトリスケーリング部234は、そのオクツリーのデータに対してジオメトリスケーリングを行い、ジオメトリデータのスケーリングやポイントのマージを行う。ジオメトリスケーリング部234は、ジオメトリスケーリングを施したオクツリーのデータを符号化部235に供給する。
 符号化部235は、オクツリーのデータ(オクツリー化されたボクセルデータ(すなわちジオメトリデータ))の符号化に関する処理を行う。例えば、符号化部235は、選択部233またはジオメトリスケーリング部234から供給されるオクツリーのデータを取得する。例えば、符号化部235は、符号化制御部201によりジオメトリスケーリングの適用が指示された場合、ジオメトリスケーリング部から供給される、ジオメトリスケーリングが施されたオクツリーのデータを取得する。また、符号化部235は、符号化制御部201によりジオメトリスケーリングの非適用が指示された場合、選択部233から供給される、ジオメトリスケーリングが施されていないオクツリーのデータを取得する。
 符号化部235は、取得したオクツリーのデータを符号化し、ジオメトリデータの符号化データを生成する。この符号化方法は任意である。符号化部235は、生成したジオメトリデータの符号化データをジオメトリデータ復号部212およびビットストリーム生成部215(ともに図15)に供給する。
  <アトリビュートデータ符号化部>
 図17は、アトリビュートデータ符号化部214の主な構成例を示すブロック図である。なお、図17においては、処理部やデータの流れ等の主なものを示しており、図17に示されるものが全てとは限らない。つまり、アトリビュートデータ符号化部214において、図17においてブロックとして示されていない処理部が存在したり、図17において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
 図17に示されるように、アトリビュートデータ符号化部214は、選択部251、スケーラブル階層化処理部252、階層化処理部253、量子化部254、および符号化部255を有する。
 選択部251は、リフティングスケーラビリティの適用・非適用の制御に関する処理を行う。例えば、選択部251は、符号化制御部201の制御に従って、ポイントクラウド生成部213(図15)されたアトリビュートデータやジオメトリデータ(復号結果)等の供給先を選択する。すなわち、選択部251は、符号化制御部201の制御に従って、それらのデータを、スケーラブル階層化処理部252に供給するか、階層化処理部253に供給するかを選択し、その選択した供給先にそれらのデータを供給する。
 例えば、符号化制御部201によりリフティングスケーラビリティの適用を指示された場合、選択部251は、アトリビュートデータやジオメトリデータ(復号結果)等を、スケーラブル階層化処理部252に供給する。また、符号化制御部201によりリフティングスケーラビリティの非適用を指示された場合、選択部251は、アトリビュートデータやジオメトリデータ(復号結果)等を、階層化処理部253に供給する。
 スケーラブル階層化処理部252は、アトリビュートデータのリフティング(参照構造の形成)に関する処理を行う。例えば、スケーラブル階層化処理部252は、選択部251から供給されるアトリビュートデータやジオメトリデータ(復号結果)を取得する。スケーラブル階層化処理部252は、そのジオメトリデータを用いてアトリビュートデータを階層化する(つまり参照構造を形成する)。その際、スケーラブル階層化処理部252は、非特許文献2に記載の方法を適用して階層化を行う。つまり、スケーラブル階層化処理部252は、ジオメトリデータに基づいて、その木構造(オクツリー)を推定し、その推定した木構造に対応するように、アトリビュートデータの参照構造を形成し、その参照構造に従って予測値を導出し、その予測値とアトリビュートデータとの差分値を導出する。スケーラブル階層化処理部252は、このように生成したアトリビュートデータ(差分値)を量子化部254に供給する。
 階層化処理部253は、アトリビュートデータのリフティング(参照構造の形成)に関する処理を行う。例えば、階層化処理部253は、選択部251から供給されるアトリビュートデータやジオメトリデータ(復号結果)を取得する。階層化処理部253は、そのジオメトリデータを用いてアトリビュートデータを階層化する(つまり参照構造を形成する)。その際、階層化処理部253は、非特許文献4に記載の方法を適用して階層化を行う。つまり、階層化処理部253は、ジオメトリデータの木構造(オクツリー)とは独立に、アトリビュートデータの参照構造を形成し、その参照構造に従って予測値を導出し、その予測値とアトリビュートデータとの差分値を導出する。つまり階層化処理部253は、ジオメトリデータの木構造の推定は行わない。階層化処理部253は、このように生成したアトリビュートデータ(差分値)を量子化部254に供給する。
 量子化部254は、スケーラブル階層化処理部252または階層化処理部253から供給されるアトリビュートデータ(差分値)を取得する。量子化部254は、そのアトリビュートデータ(差分値)を量子化する。量子化部254は、その量子化されたアトリビュートデータ(差分値)を、符号化部255に供給する。
 符号化部255は、量子化部254から供給される、量子化されたアトリビュートデータ(差分値)を取得する。符号化部255は、その量子化されたアトリビュートデータ(差分値)を符号化し、アトリビュートデータの符号化データを生成する。この符号化方法は任意である。符号化部255は、生成したアトリビュートデータの符号化データをビットストリーム生成部215(図15)に供給する。
 以上のように構成を有することにより、符号化装置200は、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止することができる。したがって、例えば、アトリビュートデータの符号化においてジオメトリデータの木構造の推定方法を複数用意し、その中から選択する等の煩雑な処理を必要とせず、にポイントクラウドデータのスケーラブルな復号を実現することができる。また、その木構造の推定方法の設計を新たに行う必要がないので、コストの増大を抑制することができる。すなわち、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができる。
  <符号化制御処理の流れ>
 次に、この符号化装置200により実行される処理について説明する。符号化装置200の符号化制御部201は、符号化制御処理を実行することによりポイントクラウドのデータの符号化を制御する。この符号化制御処理の流れの例を、図18のフローチャートを参照して説明する。
 符号化制御処理が開始されると、符号化制御部201は、ステップS101において、リフティングスケーラビリティを適用するか否かを判定する。リフティングスケーラビリティを適用すると判定された場合、処理はステップS102に進む。
 ステップS102において、符号化制御部201は、ジオメトリデータの符号化においてジオメトリスケーリングを禁止する。また、ステップS103において、符号化制御部201は、アトリビュートデータの符号化においてリフティングスケーラビリティを適用する。また、符号化制御部201は、<1.符号化制御>において上述したように、これらの制御に対応するようにLifting_scalability_enabled_flagやgeom_scaling_enabled_flag等の制御情報をシグナリングする。
 ステップS103の処理が終了すると、符号化制御処理が終了する。
 また、ステップS101において、リフティングスケーラビリティを適用しないと判定された場合、処理はステップS104に進む。
 ステップS104において、符号化制御部201は、ジオメトリスケーリングを適用するか否かを判定する。ジオメトリスケーリングを適用すると判定された場合、処理はステップS105に進む。
 ステップS105において、符号化制御部201は、ジオメトリデータの符号化においてジオメトリスケーリングを適用する。また、ステップS106において、符号化制御部201は、アトリビュートデータの符号化においてリフティングスケーラビリティを禁止する。また、符号化制御部201は、<1.符号化制御>において上述したように、これらの制御に対応するようにLifting_scalability_enabled_flagやgeom_scaling_enabled_flag等の制御情報をシグナリングする。
 ステップS106の処理が終了すると、符号化制御処理が終了する。
 また、ステップS104において、ジオメトリスケーリングを適用しないと判定された場合、処理はステップS107に進む。
 ステップS107において、符号化制御部201は、ジオメトリデータの符号化においてジオメトリスケーリングを禁止する。また、ステップS108において、符号化制御部201は、アトリビュートデータの符号化においてリフティングスケーラビリティを禁止する。また、符号化制御部201は、<1.符号化制御>において上述したように、これらの制御に対応するようにLifting_scalability_enabled_flagやgeom_scaling_enabled_flag等の制御情報をシグナリングする。
 ステップS108の処理が終了すると、符号化制御処理が終了する。
 以上のように符号化制御処理を実行することにより、符号化制御部201は、ポイントクラウドデータのスケーラブルな復号をより容易に実現させることができる。
  <符号化処理の流れ>
 符号化装置200は、符号化処理を実行することによりポイントクラウドのデータを符号化する。この符号化処理の流れの例を、図19のフローチャートを参照して説明する。
 符号化処理が開始されると、符号化装置200のジオメトリデータ符号化部211は、ステップS201において、ジオメトリデータ符号化処理を実行することにより、入力されたポイントクラウドのジオメトリデータを符号化し、ジオメトリデータの符号化データを生成する。
 ステップS202において、ジオメトリデータ復号部212は、ステップS201において生成されたジオメトリデータの符号化データを復号し、ジオメトリデータ(復号結果)を生成する。
 ステップS203において、ポイントクラウド生成部213は、入力されたポイントクラウドのアトリビュートデータと、ステップS202において生成されたジオメトリデータ(復号結果)とを用いて、リカラー処理を行い、アトリビュートデータをジオメトリデータに対応させる。
 ステップS204において、アトリビュートデータ符号化部214は、アトリビュートデータ符号化処理を実行することにより、ステップS203においてリカラー処理されたアトリビュートデータを符号化し、アトリビュートデータの符号化データを生成する。
 ステップS205において、ビットストリーム生成部215は、ステップS201において生成されたジオメトリデータの符号化データと、ステップS204において生成されたアトリビュートデータの符号化データとを含むビットストリームを生成し、出力する。
 ステップS205の処理が終了すると符号化処理が終了する。
  <ジオメトリデータ符号化処理の流れ>
 次に、図19のステップS201において実行されるジオメトリデータ符号化処理の流れの例を、図20のフローチャートを参照して説明する。
 ジオメトリデータ符号化処理が開始されると、ジオメトリデータ符号化部211のボクセル生成部231は、ステップS221において、ボクセルデータを生成する。
 ステップS222において、木構造生成部232は、ステップS221において生成されたボクセルデータを用いてジオメトリデータの木構造(オクツリー)を生成する。
 ステップS223において、選択部233は、符号化制御部201の制御に従って、ジオメトリスケーリングを行うか否かを判定する。ジオメトリスケーリングを行うと判定された場合、処理はステップS22に進む。
 ステップS224において、ジオメトリスケーリング部234は、ステップS222において生成された木構造のジオメトリデータ(つまりオクツリーのデータ)に対して、ジオメトリスケーリングを行う。ステップS224の処理が終了すると処理はステップS225に進む。また、ステップS223において、ジオメトリスケーリングを行わないと判定された場合、ステップS224の処理がスキップされて、処理はステップS225に進む。
 ステップS225において、符号化部235は、ステップS222において生成された木構造のジオメトリデータ(つまりオクツリーのデータ)、または、ステップS224においてジオメトリスケーリングが施されたジオメトリデータ(つまりオクツリーのデータ)を符号化し、ジオメトリデータの符号化データを生成する。
 ステップS225の処理が終了するとジオメトリデータ符号化処理が終了し、処理は図19に戻る。
  <アトリビュートデータ符号化処理の流れ>
 次に、図19のステップS204において実行されるアトリビュートデータ符号化処理の流れの例を、図21のフローチャートを参照して説明する。
 アトリビュートデータ符号化処理が開始されると、アトリビュートデータ符号化部214の選択部251は、ステップS241において、符号化制御部201の制御に従って、リフティングスケーラビリティを適用するか否かを判定する。リフティングスケーラビリティを適用すると判定された場合、処理はステップS242に進む。
 ステップS242において、スケーラブル階層化処理部252は、非特許文献2に記載の方法でリフティングを行う。つまり、スケーラブル階層化処理部252は、ジオメトリデータの木構造を推定し、推定した木構造に従ってアトリビュートデータの階層化(参照構造の形成)を行う。そして、スケーラブル階層化処理部252は、その参照構造に従って予測値を導出し、アトリビュートデータとその予測値との差分値を導出する。
 ステップS242の処理が終了すると処理はステップS244に進む。また、ステップS241において、リフティングスケーラビリティを適用しないと判定された場合、処理はステップS243に進む。
 ステップS243において、階層化処理部253は、非特許文献4に記載の方法でリフティングを行う。つまり、階層化処理部253は、ジオメトリデータの木構造とは独立に、アトリビュートデータの階層化(参照構造の形成)を行う。そして、階層化処理部253は、その参照構造に従って予測値を導出し、アトリビュートデータとその予測値との差分値を導出する。ステップS243の処理が終了すると処理はステップS244に進む。
 ステップS244において、量子化部254は、量子化処理を実行することにより、ステップS242またはステップS243において導出された各差分値を量子化する。
 ステップS245において、符号化部255は、ステップS244において量子化された差分値を符号化し、アトリビュートデータの符号化データを生成する。ステップS245の処理が終了するとアトリビュートデータ符号化処理が終了し、処理は図19に戻る。
 以上のように各処理を行うことにより、符号化装置200は、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができる。
 <3.第2の実施の形態>
  <復号装置>
 図22は、本技術を適用した情報処理装置の一態様である復号装置の構成の一例を示すブロック図である。図22に示される復号装置300は、ポイントクラウド(3Dデータ)の符号化データを復号する装置である。復号装置300は、例えば、符号化装置200において生成されたポイントクラウドの符号化データを復号する。
 なお、図22においては、処理部やデータの流れ等の主なものを示しており、図22に示されるものが全てとは限らない。つまり、復号装置300において、図22においてブロックとして示されていない処理部が存在したり、図22において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
 図22に示されるように復号装置300は、符号化データ抽出部311、ジオメトリデータ復号部312、アトリビュートデータ復号部313、およびポイントクラウド生成部314を有する。
 符号化データ抽出部311は、復号装置300に入力されるビットストリームを取得し、保持する。符号化データ抽出部311は、最上位から所望の階層までのジオメトリデータおよびアトリビュートデータの符号化データを、その保持しているビットストリームから抽出する。符号化データがスケーラブルな復号に対応している場合、符号化データ抽出部311は、途中階層までの符号化データを抽出することができる。符号化データがスケーラブルな復号に対応していない場合、符号化データ抽出部311は、全階層の符号化データを抽出する。
 符号化データ抽出部311は、抽出したジオメトリデータの符号化データをジオメトリデータ復号部312に供給する。符号化データ抽出部311は、抽出したアトリビュートデータの符号化データをアトリビュートデータ復号部313に供給する。
 ジオメトリデータ復号部312は、符号化データ抽出部311から供給される位置情報の符号化データを取得する。ジオメトリデータ復号部312は、符号化装置200のジオメトリデータ符号化部211が行うジオメトリデータ符号化処理の逆処理を行うことにより、そのジオメトリデータの符号化データを復号し、ジオメトリデータ(復号結果)を生成する。ジオメトリデータ復号部312は、生成したジオメトリデータ(復号結果)を、アトリビュートデータ復号部313およびポイントクラウド生成部314に供給する。
 アトリビュートデータ復号部313は、符号化データ抽出部311から供給されるアトリビュートデータの符号化データを取得する。アトリビュートデータ復号部313は、ジオメトリデータ復号部312から供給されるジオメトリデータ(復号結果)を取得する。アトリビュートデータ復号部313は、符号化装置200のアトリビュートデータ符号化部214が行うアトリビュートデータ符号化処理の逆処理を行うことにより、そのジオメトリデータ(復号結果)を用いてアトリビュートデータの符号化データを復号し、アトリビュートデータ(復号結果)を生成する。アトリビュートデータ復号部313は、生成したアトリビュートデータ(復号結果)をポイントクラウド生成部314に供給する。
 ポイントクラウド生成部314は、ジオメトリデータ復号部312から供給されるジオメトリデータ(復号結果)を取得する。ポイントクラウド生成部314は、アトリビュートデータ復号部313から供給されるアトリビュートデータ(復号結果)を取得する。ポイントクラウド生成部314は、そのジオメトリデータ(復号結果)およびアトリビュートデータ(復号結果)を用いて、ポイントクラウド(復号結果)を生成する。ポイントクラウド生成部314は、生成したポイントクラウド(復号結果)のデータを復号装置300の外部に出力する。
 以上のように構成を有することにより、復号装置300は、符号化装置200により生成されたポイントクラウドデータの符号化データを正しく復号することができる。つまり、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができる。
 なお、これらの処理部(符号化データ抽出部311乃至ポイントクラウド生成部314)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
  <復号処理の流れ>
 次に、この復号装置300により実行される処理について説明する。復号装置300は、復号処理を実行することによりポイントクラウドの符号化データを復号する。この復号処理の流れの例を、図23のフローチャートを参照して説明する。
 復号処理が開始されると、復号装置300の符号化データ抽出部311は、ステップS301において、ビットストリームを取得して保持し、復号するLoD深度までのジオメトリデータおよびアトリビュートデータの符号化データを抽出する。
 ステップS302において、ジオメトリデータ復号部312は、ステップS301において抽出されたジオメトリデータの符号化データを復号し、ジオメトリデータ(復号結果)を生成する。
 ステップS303において、アトリビュートデータ復号部313は、ステップS301において抽出されたアトリビュートデータの符号化データを復号し、アトリビュートデータ(復号結果)を生成する。
 ステップS304において、ポイントクラウド生成部314は、ステップS302において生成されたジオメトリデータ(復号結果)と、ステップS303において生成されたアトリビュートデータ(復号結果)とを用いてポイントクラウド(復号結果)を生成し、出力する。
 ステップS304の処理が終了すると、復号処理が終了する。
 このように各ステップの処理を行うことにより、復号装置300は、符号化装置200により生成されたポイントクラウドデータの符号化データを正しく復号することができる。つまり、ポイントクラウドデータのスケーラブルな復号をより容易に実現することができる。
 <4.付記>
  <階層化・逆階層化方法>
 以上においては、アトリビュートデータの階層化・逆階層化方法としてリフティング(Lifting)を例に説明したが、アトリビュートデータの階層化・逆階層化の方法は、例えば、RAHT等、リフティング以外であってもよい。
  <制御情報>
 以上の各実施の形態においては、本技術に関する制御情報の例として、イネーブルフラグについて説明したが、これ以外にも任意の制御情報をシグナリングしてもよい。
  <周辺・近傍>
 なお、本明細書において、「近傍」や「周辺」等の位置関係は、空間的な位置関係だけでなく、時間的な位置関係も含みうる。
  <コンピュータ>
 上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
 図24は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
 図24に示されるコンピュータ900において、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903は、バス904を介して相互に接続されている。
 バス904にはまた、入出力インタフェース910も接続されている。入出力インタフェース910には、入力部911、出力部912、記憶部913、通信部914、およびドライブ915が接続されている。
 入力部911は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部912は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部913は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部914は、例えば、ネットワークインタフェースよりなる。ドライブ915は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア921を駆動する。
 以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部913に記憶されているプログラムを、入出力インタフェース910およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。RAM903にはまた、CPU901が各種の処理を実行する上において必要なデータなども適宜記憶される。
 コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア921に記録して適用することができる。その場合、プログラムは、リムーバブルメディア921をドライブ915に装着することにより、入出力インタフェース910を介して、記憶部913にインストールすることができる。
 また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部914で受信し、記憶部913にインストールすることができる。
 その他、このプログラムは、ROM902や記憶部913に、あらかじめインストールしておくこともできる。
  <本技術の適用対象>
 以上においては、ポイントクラウドデータの符号化・復号に本技術を適用する場合について説明したが、本技術は、これらの例に限らず、任意の規格の3Dデータの符号化・復号に対して適用することができる。例えば、メッシュ(Mesh)データの符号化・復号において、メッシュデータをポイントクラウドデータに変換し、本技術を適用して符号化・復号を行うようにしてもよい。つまり、上述した本技術と矛盾しない限り、符号化・復号方式等の各種処理、並びに、3Dデータやメタデータ等の各種データの仕様は任意である。また、本技術と矛盾しない限り、上述した一部の処理や仕様を省略してもよい。
 また、以上においては、本技術の適用例として符号化装置200および復号装置300について説明したが、本技術は、任意の構成に適用することができる。
 例えば、本技術は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機(例えばテレビジョン受像機や携帯電話機)、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置(例えばハードディスクレコーダやカメラ)などの、様々な電子機器に適用され得る。
 また、例えば、本技術は、システムLSI(Large Scale Integration)等としてのプロセッサ(例えばビデオプロセッサ)、複数のプロセッサ等を用いるモジュール(例えばビデオモジュール)、複数のモジュール等を用いるユニット(例えばビデオユニット)、または、ユニットにさらにその他の機能を付加したセット(例えばビデオセット)等、装置の一部の構成として実施することもできる。
 また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV(Audio Visual)機器、携帯型情報処理端末、IoT(Internet of Things)デバイス等の任意の端末に対して、画像(動画像)に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。
 なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
  <本技術を適用可能な分野・用途>
 本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。
  <その他>
 なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の2状態を識別する際に用いる情報だけでなく、3以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の2値であってもよいし、3値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報(フラグも含む)は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。
 また、符号化データ(ビットストリーム)に関する各種情報(メタデータ等)は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る(リンクさせ得る)ようにすることを意味する。つまり、互いに関連付けられたデータは、1つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の記録媒体(または同一の記録媒体の別の記録エリア)に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、1フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。
 なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを1つのデータにまとめるといった、複数の物を1つにまとめることを意味し、上述の「関連付ける」の1つの方法を意味する。
 また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
 また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能(機能ブロック等)を有し、必要な情報を得ることができるようにすればよい。
 また、例えば、1つのフローチャートの各ステップを、1つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、1つのステップに複数の処理が含まれる場合、その複数の処理を、1つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、1つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を1つのステップとしてまとめて実行することもできる。
 また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。
 また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。
 なお、本技術は以下のような構成も取ることができる。
 (1) 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する符号化制御部
 を備える情報処理装置。
 (2) 前記スケーラブル符号化は、アトリビュートデータを、前記ジオメトリデータの木構造と同様の参照構造でリフティングして符号化するリフティングスケーラビリティである
 (1)に記載の情報処理装置。
 (3) 前記スケーリング符号化は、前記ジオメトリデータをスケーリングして符号化するジオメトリスケーリングである
 (1)または(2)に記載の情報処理装置。
 (4) 前記符号化制御部は、前記スケーラブル符号化を適用する場合、前記スケーリング符号化の適用を禁止するように制御する
 (1)乃至(3)のいずれかに記載の情報処理装置。
 (5) 前記符号化制御部は、前記スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグと、前記スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグとのシグナリングを制御する
 (4)に記載の情報処理装置。
 (6) 前記符号化制御部は、前記スケーラブル符号化の適用を示す値の前記スケーラブル符号化イネーブルフラグをシグナリングする場合、前記スケーリング符号化の非適用を示す値の前記スケーリング符号化イネーブルフラグをシグナリングするように制御する
 (5)に記載の情報処理装置。
 (7) 前記符号化制御部は、前記スケーラブル符号化を適用する場合、プロファイルにおいて、前記スケーラブル符号化の適用を示す値の前記スケーラブル符号化イネーブルフラグと、前記スケーリング符号化の非適用を示す値の前記スケーリング符号化イネーブルフラグとをシグナリングするように制御する
 (5)または(6)に記載の情報処理装置。
 (8) 前記符号化制御部は、前記スケーラブル符号化の適用を示す値の前記スケーラブル符号化イネーブルフラグをシグナリングする場合、前記スケーリング符号化イネーブルフラグのシグナリングを省略するように制御する
 (5)乃至(7)のいずれかに記載の情報処理装置。
 (9) 前記符号化制御部は、前記スケーリング符号化を適用する場合、前記スケーラブル符号化の適用を禁止するように制御する
 (1)乃至(3)のいずれかに記載の情報処理装置。
 (10) 前記符号化制御部は、前記スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグと、前記スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグとのシグナリングを制御する
 (9)に記載の情報処理装置。
 (11) 前記符号化制御部は、前記スケーリング符号化の適用を示す値の前記スケーリング符号化イネーブルフラグをシグナリングする場合、前記スケーラブル符号化の非適用を示す値の前記スケーラブル符号化イネーブルフラグをシグナリングするように制御する
 (10)に記載の情報処理装置。
 (12) 前記符号化制御部は、前記スケーリング符号化を適用する場合、プロファイルにおいて、前記スケーリング符号化の適用を示す値の前記スケーリング符号化イネーブルフラグと、前記スケーラブル符号化の非適用を示す値の前記スケーラブル符号化イネーブルフラグとをシグナリングするように制御する
 (10)または(11)に記載の情報処理装置。
 (13) 前記符号化制御部は、前記スケーリング符号化の適用を示す値の前記スケーリング符号化イネーブルフラグをシグナリングする場合、前記スケーラブル符号化イネーブルフラグのシグナリングを省略するように制御する
 (10)乃至(12)のいずれかに記載の情報処理装置。
 (14) 前記符号化制御部の制御に従って前記ポイントクラウドの前記ジオメトリデータを符号化し、前記ジオメトリデータの符号化データを生成するジオメトリデータ符号化部と、
 前記符号化制御部の制御に従って前記ポイントクラウドのアトリビュートデータを符号化し、前記アトリビュートデータの符号化データを生成するアトリビュートデータ符号化部と
 をさらに備える(1)乃至(13)のいずれかに記載の情報処理装置。
 (15) 前記ジオメトリデータ符号化部は、
  前記符号化制御部の制御に従って、前記ジオメトリデータのスケーリングを適用するかを選択する選択部と、
  前記選択部により前記ジオメトリデータのスケーリングの適用が選択された場合、前記ジオメトリデータのスケーリングおよびマージを行うジオメトリスケーリング部と、
  前記選択部により前記ジオメトリデータのスケーリングの適用が選択された場合、前記ジオメトリスケーリング部により前記スケーリングおよび前記マージが行われた前記ジオメトリデータを符号化し、前記選択部により前記ジオメトリデータのスケーリングの非適用が選択された場合、前記スケーリングおよび前記マージが行われていない前記ジオメトリデータを符号化する符号化部と
 を備える(14)に記載の情報処理装置。
 (16) 前記ジオメトリデータ符号化部は、
  前記ジオメトリデータの木構造を生成する木構造生成部
 をさらに備え、
  前記ジオメトリスケーリング部は、前記スケーリングおよび前記マージを行うことにより、前記木構造生成部により生成された前記木構造を更新する
 (15)に記載の情報処理装置。
 (17) 前記アトリビュートデータ符号化部は、
  前記符号化制御部の制御に従って、前記アトリビュートデータを、前記ジオメトリデータの木構造と同様の参照構造でリフティングするスケーラブル階層化を適用するかを選択する選択部と、
  前記選択部により前記スケーラブル階層化の適用が選択された場合、前記アトリビュートデータに対して前記スケーラブル階層化を行うスケーラブル階層化部と、
  前記選択部により前記スケーラブル階層化の適用が選択された場合、前記スケーラブル階層化部により前記スケーラブル階層化が行われた前記アトリビュートデータを符号化し、前記選択部により前記スケーラブル階層化の非適用が選択された場合、前記スケーラブル階層化が行われていない前記アトリビュートデータを符号化する符号化部と
 (14)乃至(16)のいずれかに記載の情報処理装置。
 (18) 前記ジオメトリデータ符号化部により生成された前記ジオメトリデータの符号化データを復号し、前記ジオメトリデータを生成するジオメトリデータ復号部と、
 前記ジオメトリデータ復号部により生成された前記ジオメトリデータを用いて、前記アトリビュートデータのリカラー処理を行うリカラー処理部と
 をさらに備え、
 前記アトリビュートデータ符号化部は、前記リカラー処理部により前記リカラー処理が行われた前記アトリビュートデータを符号化する
 (14)乃至(17)のいずれかに記載の情報処理装置。
 (19) 前記ジオメトリデータ符号化部により生成された前記ジオメトリデータの符号化データと、前記アトリビュートデータ符号化部により生成された前記アトリビュートデータの符号化データとを含むビットストリームを生成するビットストリーム生成部
 をさらに備える(14)乃至(18)のいずれかに記載の情報処理装置。
 (20) 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する
 情報処理方法。
 200 符号化装置, 201 符号化制御部, 211 ジオメトリデータ符号化部, 212 ジオメトリデータ復号部, 213 ポイントクラウド生成部, 214 アトリビュートデータ符号化部, 215 ビットストリーム生成部, 231 ボクセル生成部, 232 木構造生成部, 233 選択部, 234 ジオメトリスケーリング部, 235 符号化部, 251 選択部, 252 スケーラブル階層化処理部, 253 階層化処理部, 254 量子化部, 255 符号化部, 300 復号装置, 311 符号化データ抽出部, 312 ジオメトリデータ復号部, 313 アトリビュートデータ復号部, 314 ポイントクラウド生成部

Claims (20)

  1.  3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する符号化制御部
     を備える情報処理装置。
  2.  前記スケーラブル符号化は、アトリビュートデータを、前記ジオメトリデータの木構造と同様の参照構造でリフティングして符号化するリフティングスケーラビリティである
     請求項1に記載の情報処理装置。
  3.  前記スケーリング符号化は、前記ジオメトリデータをスケーリングして符号化するジオメトリスケーリングである
     請求項1に記載の情報処理装置。
  4.  前記符号化制御部は、前記スケーラブル符号化を適用する場合、前記スケーリング符号化の適用を禁止するように制御する
     請求項1に記載の情報処理装置。
  5.  前記符号化制御部は、前記スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグと、前記スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグとのシグナリングを制御する
     請求項4に記載の情報処理装置。
  6.  前記符号化制御部は、前記スケーラブル符号化の適用を示す値の前記スケーラブル符号化イネーブルフラグをシグナリングする場合、前記スケーリング符号化の非適用を示す値の前記スケーリング符号化イネーブルフラグをシグナリングするように制御する
     請求項5に記載の情報処理装置。
  7.  前記符号化制御部は、前記スケーラブル符号化を適用する場合、プロファイルにおいて、前記スケーラブル符号化の適用を示す値の前記スケーラブル符号化イネーブルフラグと、前記スケーリング符号化の非適用を示す値の前記スケーリング符号化イネーブルフラグとをシグナリングするように制御する
     請求項5に記載の情報処理装置。
  8.  前記符号化制御部は、前記スケーラブル符号化の適用を示す値の前記スケーラブル符号化イネーブルフラグをシグナリングする場合、前記スケーリング符号化イネーブルフラグのシグナリングを省略するように制御する
     請求項5に記載の情報処理装置。
  9.  前記符号化制御部は、前記スケーリング符号化を適用する場合、前記スケーラブル符号化の適用を禁止するように制御する
     請求項1に記載の情報処理装置。
  10.  前記符号化制御部は、前記スケーリング符号化の適用に関するフラグ情報であるスケーリング符号化イネーブルフラグと、前記スケーラブル符号化の適用に関するフラグ情報であるスケーラブル符号化イネーブルフラグとのシグナリングを制御する
     請求項9に記載の情報処理装置。
  11.  前記符号化制御部は、前記スケーリング符号化の適用を示す値の前記スケーリング符号化イネーブルフラグをシグナリングする場合、前記スケーラブル符号化の非適用を示す値の前記スケーラブル符号化イネーブルフラグをシグナリングするように制御する
     請求項10に記載の情報処理装置。
  12.  前記符号化制御部は、前記スケーリング符号化を適用する場合、プロファイルにおいて、前記スケーリング符号化の適用を示す値の前記スケーリング符号化イネーブルフラグと、前記スケーラブル符号化の非適用を示す値の前記スケーラブル符号化イネーブルフラグとをシグナリングするように制御する
     請求項10に記載の情報処理装置。
  13.  前記符号化制御部は、前記スケーリング符号化の適用を示す値の前記スケーリング符号化イネーブルフラグをシグナリングする場合、前記スケーラブル符号化イネーブルフラグのシグナリングを省略するように制御する
     請求項10に記載の情報処理装置。
  14.  前記符号化制御部の制御に従って前記ポイントクラウドの前記ジオメトリデータを符号化し、前記ジオメトリデータの符号化データを生成するジオメトリデータ符号化部と、
     前記符号化制御部の制御に従って前記ポイントクラウドのアトリビュートデータを符号化し、前記アトリビュートデータの符号化データを生成するアトリビュートデータ符号化部と
     をさらに備える請求項1に記載の情報処理装置。
  15.  前記ジオメトリデータ符号化部は、
      前記符号化制御部の制御に従って、前記ジオメトリデータのスケーリングを適用するかを選択する選択部と、
      前記選択部により前記ジオメトリデータのスケーリングの適用が選択された場合、前記ジオメトリデータのスケーリングおよびマージを行うジオメトリスケーリング部と、
      前記選択部により前記ジオメトリデータのスケーリングの適用が選択された場合、前記ジオメトリスケーリング部により前記スケーリングおよび前記マージが行われた前記ジオメトリデータを符号化し、前記選択部により前記ジオメトリデータのスケーリングの非適用が選択された場合、前記スケーリングおよび前記マージが行われていない前記ジオメトリデータを符号化する符号化部と
     を備える請求項14に記載の情報処理装置。
  16.  前記ジオメトリデータ符号化部は、
      前記ジオメトリデータの木構造を生成する木構造生成部
     をさらに備え、
      前記ジオメトリスケーリング部は、前記スケーリングおよび前記マージを行うことにより、前記木構造生成部により生成された前記木構造を更新する
     請求項15に記載の情報処理装置。
  17.  前記アトリビュートデータ符号化部は、
      前記符号化制御部の制御に従って、前記アトリビュートデータを、前記ジオメトリデータの木構造と同様の参照構造でリフティングするスケーラブル階層化を適用するかを選択する選択部と、
      前記選択部により前記スケーラブル階層化の適用が選択された場合、前記アトリビュートデータに対して前記スケーラブル階層化を行うスケーラブル階層化部と、
      前記選択部により前記スケーラブル階層化の適用が選択された場合、前記スケーラブル階層化部により前記スケーラブル階層化が行われた前記アトリビュートデータを符号化し、前記選択部により前記スケーラブル階層化の非適用が選択された場合、前記スケーラブル階層化が行われていない前記アトリビュートデータを符号化する符号化部と
     請求項14に記載の情報処理装置。
  18.  前記ジオメトリデータ符号化部により生成された前記ジオメトリデータの符号化データを復号し、前記ジオメトリデータを生成するジオメトリデータ復号部と、
     前記ジオメトリデータ復号部により生成された前記ジオメトリデータを用いて、前記アトリビュートデータのリカラー処理を行うリカラー処理部と
     をさらに備え、
     前記アトリビュートデータ符号化部は、前記リカラー処理部により前記リカラー処理が行われた前記アトリビュートデータを符号化する
     請求項14に記載の情報処理装置。
  19.  前記ジオメトリデータ符号化部により生成された前記ジオメトリデータの符号化データと、前記アトリビュートデータ符号化部により生成された前記アトリビュートデータの符号化データとを含むビットストリームを生成するビットストリーム生成部
     をさらに備える請求項14に記載の情報処理装置。
  20.  3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドの符号化において、スケーラブルに復号可能な符号化データを生成する符号化方法であるスケーラブル符号化と、ジオメトリデータの木構造の変更を伴う符号化方法であるスケーリング符号化との併用を禁止するように制御する
     情報処理方法。
PCT/JP2021/021665 2020-06-22 2021-06-08 情報処理装置および方法 WO2021261237A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP21829007.0A EP4170597A4 (en) 2020-06-22 2021-06-08 DEVICE AND METHOD FOR PROCESSING INFORMATION
CN202180043038.5A CN115917601A (zh) 2020-06-22 2021-06-08 信息处理装置和方法
JP2022531697A JPWO2021261237A1 (ja) 2020-06-22 2021-06-08
US17/928,836 US20230177735A1 (en) 2020-06-22 2021-06-08 Information processing apparatus and method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-106974 2020-06-22
JP2020106974 2020-06-22

Publications (1)

Publication Number Publication Date
WO2021261237A1 true WO2021261237A1 (ja) 2021-12-30

Family

ID=79282583

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/021665 WO2021261237A1 (ja) 2020-06-22 2021-06-08 情報処理装置および方法

Country Status (5)

Country Link
US (1) US20230177735A1 (ja)
EP (1) EP4170597A4 (ja)
JP (1) JPWO2021261237A1 (ja)
CN (1) CN115917601A (ja)
WO (1) WO2021261237A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018534881A (ja) * 2016-01-22 2018-11-22 三菱電機株式会社 点群を圧縮する方法
WO2019142665A1 (ja) * 2018-01-16 2019-07-25 ソニー株式会社 情報処理装置および方法
WO2019159956A1 (ja) * 2018-02-14 2019-08-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10694210B2 (en) * 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018534881A (ja) * 2016-01-22 2018-11-22 三菱電機株式会社 点群を圧縮する方法
WO2019142665A1 (ja) * 2018-01-16 2019-07-25 ソニー株式会社 情報処理装置および方法
WO2019159956A1 (ja) * 2018-02-14 2019-08-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
K. BLOMP. CESAR.: "Design, Implementation and Evaluation of a Point Cloud Codec for Tele-Immersive Video", IEEE
OHJI NAKAGAMISATORU KUMA: "G-PCC] Spatial scalability support for G-PCC", JTC1/SC29/WG11 MPEG2019/M47352, March 2019 (2019-03-01)
R. MEKURIA, STUDENT MEMBER IEEE
See also references of EP4170597A4
TOURAPISJUNGSUN KIMFABRICE ROBINETVALERY VALENTINYEPING SU: "Lifting Scheme for Lossy Attribute Encoding in TMC1", ISO/IEC JTC1/SC29/WG11 MPEG2018/M42640, April 2018 (2018-04-01)
XIANG ZHANGWEN GAOSEHOON YEASHAN LIU: "G-PCC][New proposal] Signaling delta QPs for adaptive geometry quantization in point cloud coding", ISO/IEC JTC1/SC29/WG11 MPEG2019/M49232, July 2019 (2019-07-01)

Also Published As

Publication number Publication date
EP4170597A1 (en) 2023-04-26
US20230177735A1 (en) 2023-06-08
EP4170597A4 (en) 2023-12-13
CN115917601A (zh) 2023-04-04
JPWO2021261237A1 (ja) 2021-12-30

Similar Documents

Publication Publication Date Title
JP7384159B2 (ja) 画像処理装置および方法
WO2019198523A1 (ja) 画像処理装置および方法
KR102521801B1 (ko) 정보 처리 장치 및 방법
CN112385236B (zh) 点云的编码和解码方法、编码器和解码器、以及存储介质
US20220414940A1 (en) Information processing apparatus and method
US11483363B2 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US11922579B2 (en) Image processing apparatus and method for image processing by deriving voxel and mesh data to generate point cloud data
US20230164353A1 (en) Point cloud data processing device and processing method
CN111727461A (zh) 信息处理装置和方法
WO2021140930A1 (ja) 情報処理装置および方法
WO2021010200A1 (ja) 情報処理装置および方法
WO2022145214A1 (ja) 情報処理装置および方法
WO2021261237A1 (ja) 情報処理装置および方法
KR20210070282A (ko) 화상 처리 장치 및 방법
JP2022047546A (ja) 情報処理装置および方法
WO2021010134A1 (ja) 情報処理装置および方法
WO2021002214A1 (ja) 情報処理装置および方法
US11790602B2 (en) Information processing device and method
CN117581537A (zh) 用于对点云进行编码和解码的方法
WO2021140928A1 (ja) 情報処理装置および方法
US20240179347A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US20230316581A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US20240064332A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21829007

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022531697

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021829007

Country of ref document: EP

Effective date: 20230123