JP2022047546A - 情報処理装置および方法 - Google Patents

情報処理装置および方法 Download PDF

Info

Publication number
JP2022047546A
JP2022047546A JP2019000941A JP2019000941A JP2022047546A JP 2022047546 A JP2022047546 A JP 2022047546A JP 2019000941 A JP2019000941 A JP 2019000941A JP 2019000941 A JP2019000941 A JP 2019000941A JP 2022047546 A JP2022047546 A JP 2022047546A
Authority
JP
Japan
Prior art keywords
attribute information
unit
coding
information
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019000941A
Other languages
English (en)
Inventor
央二 中神
Hisaji Nakagami
幸司 矢野
Koji Yano
智 隈
Satoshi Kuma
毅 加藤
Takeshi Kato
弘幸 安田
Hiroyuki Yasuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Priority to JP2019000941A priority Critical patent/JP2022047546A/ja
Priority to PCT/JP2019/050770 priority patent/WO2020145143A1/ja
Publication of JP2022047546A publication Critical patent/JP2022047546A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Abstract

【課題】3次元形状のオブジェクトをより容易に符号化・復号する情報処理装置及び方法を提供する。【解決手段】属性情報を符号化・復号する方法において、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間し、その補間後の属性情報を符号化する。また、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号し、その符号化データが復号されて生成された属性情報から、ポイントクラウドの位置情報に対応する属性情報を抽出する。【選択図】図5

Description

本開示は、情報処理装置および方法に関し、特に、より容易に符号化・復号することができるようにした情報処理装置および方法に関する。
従来、例えばポイントクラウド(Point cloud)のような3次元構造を表す3Dデータの符号化方法が考えられた(例えば非特許文献1参照)。
例えば3次元構造を点群で表すポイントクラウドは、点の位置情報と属性情報とにより構成される。このようなポイントクラウドは、位置情報を符号化(復号)し、続いて属性情報を符号化(復号)する方法が考えられた。属性情報を符号化する際は、符号化による劣化を含め位置情報を既知であるものとして、点間の位置関係を利用して符号化を行う。
R. Mekuria, Student Member IEEE, K. Blom, P. Cesar., Member, IEEE, "Design, Implementation and Evaluation of a Point Cloud Codec for Tele-Immersive Video",tcsvt_paper_submitted_february.pdf
しかしながら、この方法の場合、属性情報の符号化の際に、符号化対象に空間的に疎なデータが含まれると、近傍点を使う処理において、近傍点の有無に応じた場合分け等が必要となり、処理が複雑化するおそれがあった。
本開示は、このような状況に鑑みてなされたものであり、3Dデータをより容易に符号化・復号することができるようにするものである。
本技術の一側面の情報処理装置は、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間する補間処理部と、前記補間処理部による補間後の前記属性情報を符号化する符号化部とを備える情報処理装置である。
本技術の一側面の情報処理方法は、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間し、補間後の前記属性情報を符号化する情報処理方法である。
本技術の他の側面の情報処理装置は、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号する復号部と、前記復号部により前記符号化データが復号されて生成された前記属性情報から、前記ポイントクラウドの位置情報に対応する属性情報を抽出する抽出部とを備える情報処理装置である。
本技術の他の側面の情報処理方法は、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号し、前記符号化データが復号されて生成された前記属性情報から、前記ポイントクラウドの位置情報に対応する属性情報を抽出する情報処理方法である。
本技術の一側面の情報処理装置および方法においては、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報が補間され、その補間後の属性情報が符号化される。
本技術の他の側面の情報処理装置および方法においては、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データが復号され、その符号化データが復号されて生成された属性情報から、ポイントクラウドの位置情報に対応する属性情報が抽出される。
符号化・復号方法の例を説明する図である。 補間方法の例を説明する図である。 補間方法の例を説明する図である。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 符号化装置の主な構成例を示すブロック図である。 符号化処理の流れの例を説明するフローチャートである。 復号装置の主な構成例を示すブロック図である。 復号処理の流れの例を説明するフローチャートである。 コンピュータの主な構成例を示すブロック図である。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.疎なデータの符号化・復号
2.第1の実施の形態(方法1)
3.第2の実施の形態(方法1-1)
4.第3の実施の形態(方法1-2)
5.第4の実施の形態(方法1-3)
6.第5の実施の形態(方法1-4)
7.付記
<1.疎なデータの符号化・復号>
<技術内容・技術用語をサポートする文献等>
本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。
非特許文献1:(上述)
非特許文献2:TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU(International Telecommunication Union), "Advanced video coding for generic audiovisual services", H.264, 04/2017
非特許文献3:TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU(International Telecommunication Union), "High efficiency video coding", H.265, 12/2016
非特許文献4:Jianle Chen, Elena Alshina, Gary J. Sullivan, Jens-Rainer, Jill Boyce, "Algorithm Description of Joint Exploration Test Model 4", JVET-G1001_v1, Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 7th Meeting: Torino, IT, 13-21 July 2017
つまり、上述の非特許文献に記載されている内容もサポート要件を判断する際の根拠となる。例えば、非特許文献3に記載されているQuad-Tree Block Structure、非特許文献4に記載されているQTBT(Quad Tree Plus Binary Tree) Block Structureが実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、特許請求の範囲のサポート要件を満たすものとする。また、例えば、パース(Parsing)、シンタックス(Syntax)、セマンティクス(Semantics)等の技術用語についても同様に、実施の形態において直接的な記載がない場合でも、本技術の開示範囲内であり、特許請求の範囲のサポート要件を満たすものとする。
<ポイントクラウド>
従来、点群の位置情報や属性情報等により3次元構造を表すポイントクラウド(Point cloud)や、頂点、エッジ、面で構成され、多角形表現を使用して3次元形状を定義するメッシュ(Mesh)等の3Dデータが存在した。
例えばポイントクラウドの場合、立体構造物(3次元形状のオブジェクト)を多数の点の集合(点群)として表現する。つまり、ポイントクラウドのデータ(ポイントクラウドデータとも称する)は、この点群の各点の位置情報や属性情報により構成される。属性情報には、例えば、色情報、反射率情報、法線情報等が含まれる。したがってデータ構造が比較的単純であるとともに、十分に多くの点を用いることにより任意の立体構造物を十分な精度で表現することができる。
<ポイントクラウドの符号化・復号>
このようなポイントクラウドデータはそのデータ量が比較的大きいので、例えば非特許文献1に記載のように、符号化によるデータ量を圧縮することが考えられた。例えば、まず、ポイントクラウドの位置情報を符号化(復号)し、続いて属性情報を符号化(復号)する。属性情報を符号化する際は、符号化による劣化を含め位置情報を既知であるものとして、点間の位置関係を利用して符号化を行う。
しかしながら、この方法の場合、属性情報の符号化の際に、符号化対象に空間的に疎なデータが含まれると、例えば、フィルタリング、直交変換、予測処理等のような近傍点を使う処理において、その近傍点の有無に応じた場合分け等が必要となり、処理が複雑化するおそれがあった。特に、位置情報と属性情報を並列に符号化・復号する場合のボトルネックとなるおそれがあった。
<属性情報の補間>
そこで、図1に示される表の方法1のように、ポイントクラウドの疎な点を補間して密にし、属性情報を符号化・復号するようにする。このようにすることにより、属性情報を密な状態で処理することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化・復号を行うことができる。
なお、方法1-1のように、位置情報の符号化データの復号結果において点を補間するようにしてもよい。また、方法1-2のように、符号化前のデータにおいて点を補間するようにしてもよい。さらに、方法1-3のように、符号化において直交変換を用いる(復号において逆直交変換を用いる)ようにしてもよい。また、方法1-4のように、符号化・復号において予測を用いるようにしてもよい。
<2.第1の実施の形態>
<方法1>
次に、上述の方法1について説明する。方法1では、ポイントクラウドの疎な点を補間して密にし、属性情報を符号化・復号する。例えば、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間し、その補間後の属性情報を符号化する。例えば、情報処理装置において、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間する補間処理部と、その補間処理部による補間後の属性情報を符号化する符号化部とを備えるようにする。
また、例えば、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号し、その符号化データが復号されて生成された属性情報から、ポイントクラウドの位置情報に対応する属性情報を抽出する。例えば、情報処理装置において、3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号する復号部と、その復号部により符号化データが復号されて生成された属性情報から、ポイントクラウドの位置情報に対応する属性情報を抽出する抽出部とを備えるようにする。
このようにすることにより、属性情報を密な状態で処理することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化・復号を行うことができる。
3Dデータであるポイントクラウドの場合、2Dデータである画像等の場合と異なり、点は任意の位置に存在することができる。つまり、画像の場合、画素は等間隔に配置されるが、ポイントクラウドの場合、点の間隔は一定とは限らず、点が疎になる部分が存在し得る。
<疎なデータ>
本明細書においては、点の間隔が他に比べて広くなる(解像度が一定でなく、他の部分に比べて低くなる)状態を「疎」と称する。これに対して、そのような「疎」な部分が存在せず、点が一定の間隔で並ぶ(解像度が一定である)状態を「密」と称する。
このような点が疎な状態を2次元画像で表現すると、例えば図2のAのようになる。図2は、4画素×4画素の画像データを示しており、グレーの四角が画素を示し、白色の四角は画素が存在しない領域を示す。つまり、この場合、16画素存在可能な領域に10画素分の情報しか存在していない。このように所定の解像度において画素が存在し得る位置に、画素が存在しない場合、画素は疎な状態である。3Dデータの場合、この画素が点に相当する。つまり、所定の解像度において点が存在し得る位置に点が存在しない場合、点は疎な状態である。
位置情報および属性情報についても同様である。つまり、位置情報はこのような各点の位置を示し、属性情報は各点に関連付けられているので、点が疎な状態である場合、位置情報および属性情報も疎な状態である。
ところでポイントクラウドの属性情報の符号化や復号においては、ノイズ抑制のためのフィルタリングを行ったり、符号化効率を向上させるための直交変換(逆直交変換)や予測等を行ったりすることができる。これらの処理では、近傍点(処理対象点の周辺に位置する点)の情報が利用される。
しかしながら、点が疎であると、近傍点が存在するか否かによって処理の場合分けが必要になり、処理が複雑化するおそれがあった。例えば図2のAのように、画素が疎であると、隣接画素を参照する処理の場合、処理対象画素の位置によって隣接画素の数や位置が異なるので、全て同一の方法で処理することが困難な場合があり得る。例えば隣接画素が存在しない場合、隣接画素を参照することができないので、参照する画素の範囲を拡大する等の対処が必要となることがあり得る。このように、隣接画素の有無や数等に応じて場合分けが必要になると処理が複雑化する。処理が複雑化すると、符号化や復号の負荷や処理時間が増大するおそれがあった。したがって、符号化や復号のコストが増大するおそれがあった。
<補間方法>
そこで、上述のように属性情報を補間する。例えば、ポイントクラウドの疎な点を補間して密にし、補間した点に対応する属性情報を生成する。このようにすることにより、図2のBに示されるように、画素(すなわち点)が存在しない領域がなくなる(密な状態となる)。したがって、上述のような近傍点の情報を利用する処理において、場合分けが不要になり、より容易に符号化・復号を行うことができる。つまり、符号化や復号の負荷や処理時間の増大を抑制することができる。これにより、符号化や復号のコストの増大を抑制することができる。
なお、補間した点に対応する属性情報を生成する際に、その補間した点の近傍に位置する他の点(近傍点)の属性情報を用いるようにしてもよい。近傍点の属性情報を利用することにより、補間した点に対応する属性情報をより容易に生成することができる。つまり、属性情報の補間をより容易に行うことができる。
また、補間した点に対応する属性情報を生成する際に、その点の最も近い他の点(最近傍点)の属性情報を複製するようにしてもよい。このようにすることにより、複数の近傍点の属性情報を用いて補間した点に対応する属性情報を導出する場合よりも容易に、補間した点に対応する属性情報を生成することができる。
また、補間した点に対応する属性情報を生成する際に、その点の近傍に位置する複数の他の点の属性情報を用いて導出するようにしてもよい。このようにすることにより、最近傍点の属性情報を複製して補間した点に対応する属性情報を生成する場合よりも、周辺の属性情報との差が少ない(より調和のとれた)属性情報を生成することができる。
また、補間されていないポイントクラウドの位置情報をさらに符号化するようにしてもよい。また、復号側において、その補間されていないポイントクラウドの位置情報の符号化データをさらに復号するようにしてもよい。このようにすることにより、復号側において、位置情報と属性情報を互いに関連付け、ポイントクラウドを生成することができる。
また、復号側において、取得する符号化データが、ポイントクラウドの属性情報を補間して符号化することにより生成されたデータであり、その符号化データが復号されて生成された補間後の属性情報から、補間されていない位置情報に対応する属性情報を抽出するようにしてもよい。このようにすることにより、位置情報に対応する属性情報を容易に得ることができる。
<Octree>
ところで、ポイントクラウドの符号化において、Octreeを構築することが考えられた。Octreeは、ポイントクラウドの3次元領域を木構造化したものである。図3にOctreeの例を示す。このOctreeの各ノードの値が、ポイントクラウドの3次元領域の、そのノードに対応する部分領域におけるポイントの有無を示す。例えば、値「1」がポイントを内包する部分領域を示し、値「0」がポイントを内包しない部分領域を示す。Octreeでは、1ノードが8つの部分領域に対応する。つまり、Octreeの各ノードは、8ビットのデータにより構成され、その8ビットが8つの部分領域のポイントの有無を示す。
そして、Octreeの上位のノードは、そのノードに属する下位ノードに対応する8つの部分領域を1つにまとめた領域のポイントの有無を示す。つまり、下位ノードの部分領域の情報をまとめることにより上位ノードが生成される。なお、値が「0」のノード、すなわち、対応する8つの部分領域が全てポイントを内包しない場合、そのノードは削除される。
このようにすることにより、値が「0」でないノードからなる木構造(Octree)が構築される。つまり、Octreeは、各解像度の部分領域のポイントの有無を示すことができる。したがって、ポイントクラウドをOctree化して符号化することにより、復号の際により多様な解像度のポイントクラウドをより容易に復元することができる。つまり、より容易にポイントクラウドのスケーラビリティを実現することができる。
また、上述のように値が「0」のノードを省略することにより、ポイントが存在しない領域を低解像度化することができるので、さらなる情報量の増大の抑制(典型的には情報量の削減)を行うことができる。
<Octreeの補間>
このようなOctreeを適用する場合も、上述のように属性情報を補間するようにしてもよい。例えば、ポイントクラウドのOctreeの疎なノードを補間して密にし、密なノードに対応する属性情報を生成するようにしてもよい。
例えば図3の場合、最下位層の左から4番目(E’)、8番目(L’)、12番目(S’)、14番目(V’)、および16番目(Y’)のノードが存在していない。そこで、これらのノードを補間し、その属性情報を生成する。このようにOctreeを適用する場合、点(ノード)が疎であるか否か、並びに、どの点(ノード)を補間すべきであるかが容易に識別可能であるので、属性情報の補間をより容易に行うことができる。
なお、補間する属性情報の導出方法は任意である。例えば、依存関係のあるOctreeにおいて周辺のノードの情報を用いるようにしてもよい。例えば、ノードBの属性情報は、ノードAおよびノードCの属性情報を用いて以下の式(1)のように表すことができる。
B=(A+C)/2 ・・・(1)
同様に、ノードFの属性情報は、ノードEとノードE’の属性情報を用いて以下の式(2)のように表すことができる。
F=(E+E’)/2 ・・・(2)
つまり、ノードE’の属性情報は、ノードFおよびノードEの属性情報を用いて導出することができる。同様に、ノードL’の属性情報はノードMおよびノードLの属性情報を用いて、ノードS’の属性情報はノードTおよびノードSの属性情報を用いて、ノードV’の属性情報はノードWおよびノードVの属性情報を用いて、ノードY’の属性情報はノードZおよびノードYの属性情報を用いて、それぞれ導出することができる。
このように導出することにより、補間する属性情報をより容易に導出することができる。もちろん、Octreeのノードの依存関係を考慮せずに、3次元空間における近傍点の属性情報を用いて補間を行うようにしてもよい。ただし、その場合、式(1)や式(2)のような依存関係に基づいて、Octreeの上位のノードの属性情報を更新する必要が生じる場合もありうる。
なお、ノードの補間は、Octreeの任意の階層(レベル)において行うことができる。最下位層において補間するようにしてもよいし、より上位のレベルにおいて補間するようにしてもよい。最下位よりも上位のレベルにおいて属性情報を補間する場合、そのレベルよりも下位の属性情報の符号化・復号を省略し、補間を行ったレベルの属性情報を用いて、より下位層の属性情報を導出するようにすればよい。
<3.第2の実施の形態>
<方法1-1>
次に、方法1-1について説明する。方法1-1では、ポイントクラウドの位置情報を符号化して復号した結果を用いて、属性情報を補間する。このようにすることにより、位置情報の符号化・復号結果に対応するように属性情報を補間することができる。したがって、復号の際に、位置情報(復号結果)に対応する属性情報をより容易に得ることができる。つまり、このようにすることにより、第1の実施の形態において説明した効果を得ることができるだけでなく、ポイントクラウドの符号化データをより容易に復号することができる。すなわち、復号の負荷や処理時間の増大をより抑制することができ、コストの増大を抑制することができる。
<従来の符号化装置>
図4は、符号化装置の主な構成例を示すブロック図である。図4に示される符号化装置10は、ポイントクラウドを符号化する従来の符号化装置である。図4に示されるように、符号化装置10は、位置情報符号化部11、位置情報復号部12、ポイントクラウド生成部13、属性情報符号化部14、およびビットストリーム生成部15を有する。
位置情報符号化部11は、符号化装置10に入力されたポイントクラウド(3Dデータ)の位置情報を符号化する。この符号化方法は任意である。例えば、ノイズ抑制(デノイズ)のためのフィルタリングや量子化等の処理が行われるようにしてもよい。位置情報符号化部11は、生成した位置情報の符号化データを位置情報復号部12およびビットストリーム生成部15に供給する。
位置情報復号部12は、位置情報符号化部11から供給される位置情報の符号化データを取得し、その符号化データを復号する。この復号方法は、位置情報符号化部11による符号化に対応する方法であれば任意である。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。位置情報復号部12は、生成した位置情報(復号結果)をポイントクラウド生成部13に供給する。
ポイントクラウド生成部13は、符号化装置10に入力されるポイントクラウドの属性情報と、位置情報復号部12から供給される位置情報(復号結果)を取得する。
位置情報は、位置情報符号化部11による符号化・復号の際のフィルタリングや量子化(または逆量子化)等の処理により、変化する場合がある(つまり、符号化により、点が増減したり、移動したりする可能性がある)。したがって、位置情報復号部12が生成する位置情報(復号結果)は、位置情報符号化部11により符号化される前の位置情報と異なる場合がある。
そこでポイントクラウド生成部13は、属性情報を位置情報(復号結果)に合わせる処理(リカラー処理)を行う。ポイントクラウド生成部13は、位置情報(復号結果)に対応させた属性情報を属性情報符号化部14に供給する。
属性情報符号化部14は、ポイントクラウド生成部13から供給される属性情報を取得し、符号化する。この符号化方法は任意である。属性情報符号化部14は、生成した属性情報の符号化データをビットストリーム生成部15に供給する。
ビットストリーム生成部15は、位置情報符号化部11から供給される位置情報の符号化データと、属性情報符号化部14から供給される属性情報の符号化データとを取得する。ビットストリーム生成部15は、それらの符号化データを含むビットストリームを生成し、そのビットストリームを符号化装置10の外部に出力する。
<従来の符号化処理の流れ>
この符号化装置10により実行される従来の符号化処理の流れの例を、図5のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部11は、ステップS11において、ポイントクラウドの位置情報を符号化する。
ステップS12において、位置情報復号部12は、ステップS11において生成された位置情報の符号化データを復号する。
ステップS13において、ポイントクラウド生成部13は、ステップS12において得られた位置情報の復号結果を用いて、リカラー処理を行い、属性情報を位置情報(復号結果)に対応させる。
ステップS14において、属性情報符号化部14は、ステップS13において位置情報の復号結果に対応付けられた属性情報を符号化し、符号化データを生成する。
ステップS15において、ビットストリーム生成部15は、ステップS11において生成された位置情報の符号化データと、ステップS14において生成された属性情報の符号化データとを含むビットストリームを生成し、出力する。
ステップS15の処理が終了すると符号化処理が終了する。
<従来の復号装置>
図6は、復号装置の主な構成例を示すブロック図である。図6に示される復号装置30は、符号化装置10に対応し、符号化装置10において生成されたポイントクラウドの符号化データを復号する従来の復号装置である。図6に示されるように、復号装置30は、位置情報復号部31、属性情報復号部32、およびポイントクラウド生成部33を有する。
位置情報復号部31は、復号装置30に入力されたポイントクラウド(3Dデータ)の位置情報の符号化データを復号する。この復号方法は、位置情報符号化部11(図4)により行われる符号化に対応する方法であれば、任意である。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。位置情報復号部31は、生成した位置情報をポイントクラウド生成部33に供給する。
属性情報復号部32は、復号装置30に入力されたポイントクラウド(3Dデータ)の属性情報の符号化データを復号する。この復号方法は、属性情報符号化部14(図4)により行われる符号化に対応する方法であれば、任意である。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。属性情報復号部32は、生成した属性情報をポイントクラウド生成部33に供給する。
ポイントクラウド生成部33は、位置情報復号部31から供給される位置情報、および属性情報復号部32から供給される属性情報を取得する。ポイントクラウド生成部33は、それらの位置情報と属性情報とを関連付け、ポイントクラウドを生成し、復号装置30の外部に出力する。
<従来の復号処理の流れ>
この復号装置30により実行される従来の復号処理の流れの例を、図7のフローチャートを参照して説明する。
復号処理が開始されると、位置情報復号部31は、ステップS31において、位置情報の符号化データを復号する。
ステップS32において、属性情報復号部32は、属性情報の符号化データを復号する。
ステップS33において、ポイントクラウド生成部33は、ステップS31において生成された位置情報と、ステップS32において生成された属性情報とを互いに関連付け、ポイントクラウドを生成し、出力する。
ステップS33の処理が終了すると復号処理が終了する。
以上のように符号化装置10および復号装置30の場合、属性情報が疎の状態のまま処理される。したがって、符号化や復号の処理が複雑化し、符号化や復号の負荷や処理時間が増大するおそれがあった。したがって、符号化や復号のコストが増大するおそれがあった。
<符号化装置>
図8は、本技術を適用した情報処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図8に示される符号化装置100は、ポイントクラウド(3Dデータ)を符号化する装置である。符号化装置100は、上述した方法1-1を用いてポイントクラウドを符号化する。
なお、図8においては、処理部やデータの流れ等の主なものを示しており、図8に示されるものが全てとは限らない。つまり、符号化装置100において、図8においてブロックとして示されていない処理部が存在したり、図8において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図8に示されるように符号化装置100は、位置情報符号化部101、位置情報復号部102、ポイントクラウド生成部103、補間処理部104、属性情報符号化部105、およびビットストリーム生成部106を有する。
位置情報符号化部101は、符号化装置100に入力されたポイントクラウド(3Dデータ)の位置情報を符号化する。この符号化方法は任意である。例えば、第1の実施の形態において説明した各手法を適用することができる。例えば、ノイズ抑制(デノイズ)のためのフィルタリングや量子化等の処理が行われるようにしてもよい。位置情報符号化部101は、生成した位置情報の符号化データを位置情報復号部102およびビットストリーム生成部106に供給する。
位置情報復号部102は、位置情報符号化部101から供給される位置情報の符号化データを取得し、その符号化データを復号する。この復号方法は、位置情報符号化部101による符号化に対応する方法であれば任意である。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。位置情報復号部102は、生成した位置情報(復号結果)をポイントクラウド生成部103に供給する。
ポイントクラウド生成部103は、符号化装置100に入力されるポイントクラウドの属性情報と、位置情報復号部102から供給される位置情報(復号結果)を取得する。ポイントクラウド生成部103は、属性情報を位置情報(復号結果)に合わせる処理(リカラー処理)を行う。ポイントクラウド生成部103は、位置情報(復号結果)に対応させた属性情報を補間処理部104に供給する。
補間処理部104は、ポイントクラウド生成部103から供給される属性情報を取得する。補間処理部104は、第1の実施の形態において説明したように、その属性情報の疎な部分を補間し、密にする。この補間方法は任意である。例えば、第1の実施の形態において説明した各手法を適用することができる。補間処理部104は、補間後の属性情報を属性情報符号化部105に供給する。
属性情報符号化部105は、補間処理部104から供給される補間後の属性情報を取得する。属性情報符号化部105は、第1の実施の形態において説明したように、その補間後の属性情報を符号化し、符号化データを生成する。この符号化方法は任意である。例えば、第1の実施の形態において説明した各手法を適用することができる。例えば、ノイズ抑制(デノイズ)のためのフィルタリングや量子化等の処理が行われるようにしてもよい。属性情報符号化部105は、生成した補間後の属性情報の符号化データをビットストリーム生成部106に供給する。
ビットストリーム生成部106は、位置情報符号化部101から供給される位置情報の符号化データを取得する。また、ビットストリーム生成部106は、属性情報符号化部105から供給される補間後の属性情報の符号化データを取得する。ビットストリーム生成部106は、位置情報の符号化データと補間後の属性情報の符号化データとを含むビットストリームを生成する。ビットストリーム生成部106は、生成したビットストリームを符号化装置100の外部に出力する。
なお、位置情報符号化部101と属性情報符号化部105とを一体化してもよい。
このような構成とすることにより、符号化装置100は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置100は、第1の実施の形態において説明した効果を得ることができる。
また、このようにすることにより、位置情報の符号化・復号結果に対応するように属性情報を補間することができる。したがって、復号の際に、位置情報(復号結果)に対応する属性情報をより容易に得ることができる。つまり、ポイントクラウドの符号化データをより容易に復号することができるので、復号の負荷や処理時間の増大をより抑制することができ、コストの増大を抑制することができる。
なお、これらの処理部(位置情報符号化部101乃至ビットストリーム生成部106)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<符号化処理の流れ>
この符号化装置100により実行される符号化処理の流れの例を、図9のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部101は、ステップS101において、ポイントクラウドの位置情報を符号化する。
ステップS102において、位置情報復号部102は、ステップS101において生成された位置情報のポイントクラウドの符号化データを復号する。
ステップS103において、ポイントクラウド生成部13は、ステップS102において得られた位置情報の復号結果を用いて、リカラー処理を行い、属性情報を位置情報(復号結果)に対応させる。
ステップS104において、補間処理部104は、位置情報(点)を補間する。ステップS105において、補間処理部104は、その補間した点に対応する属性情報を補間する。
ステップS106において、属性情報符号化部105は、ステップS105において生成された補間後の属性情報を符号化し、符号化データを生成する。
ステップS107において、ビットストリーム生成部106は、ステップS101において生成された位置情報の符号化データと、ステップS106において生成された属性情報の符号化データとを含むビットストリームを生成し、出力する。
ステップS107の処理が終了すると符号化処理が終了する。
このように符号化処理を行うことにより、符号化装置100は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置100は、第1の実施の形態において説明した効果を得ることができる。
また、このようにすることにより、位置情報の符号化・復号結果に対応するように属性情報を補間することができる。したがって、復号の際に、位置情報(復号結果)に対応する属性情報をより容易に得ることができる。つまり、ポイントクラウドの符号化データをより容易に復号することができるので、復号の負荷や処理時間の増大をより抑制することができ、コストの増大を抑制することができる。
<復号装置>
図10は、本技術を適用した情報処理装置の一態様である復号装置の構成の一例を示すブロック図である。図10に示される復号装置130は、符号化装置100に対応し、符号化装置100において生成されたポイントクラウドの符号化データを復号する。この復号装置130は、上述した方法1-1を用いてポイントクラウドの符号化データを復号する。
なお、図10においては、処理部やデータの流れ等の主なものを示しており、図10に示されるものが全てとは限らない。つまり、復号装置130において、図10においてブロックとして示されていない処理部が存在したり、図10において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図10に示されるように、復号装置130は、位置情報復号部131、属性情報復号部132、属性情報抽出部133、およびポイントクラウド生成部134を有する。
位置情報復号部131は、復号装置130に入力されたポイントクラウド(3Dデータ)の位置情報の符号化データを復号する。この位置情報は、第1の実施の形態等において上述したような補間は行われていない。つまり、位置情報復号部131は、符号化データを復号することにより、補間されていない位置情報を生成する。なお、この復号方法は、位置情報符号化部101(図8)により行われる符号化に対応する方法であれば、任意である。例えば、第1の実施の形態において説明した各手法を適用することができる。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。位置情報復号部131は、生成した、補間されていない位置情報を属性情報抽出部133に供給する。
属性情報復号部132は、復号装置130に入力されたポイントクラウド(3Dデータ)の補間後の属性情報の符号化データを復号する。この符号化データの属性情報は、第1の実施の形態等において上述したように、この符号化データを生成する際に符号化装置100により、データが密になるように補間されている。したがって、属性情報復号部132は、この符号化データを復号することにより、その補間後の属性情報を生成する。なお、この復号方法は、属性情報符号化部105(図8)により行われる符号化に対応する方法であれば、任意である。例えば、第1の実施の形態において説明した各手法を適用することができる。例えば、デノイズのためのフィルタリングや逆量子化等の処理が行われるようにしてもよい。属性情報復号部132は、生成した補間後の属性情報を属性情報抽出部133に供給する。
属性情報抽出部133は、位置情報復号部131から供給される補間されていない位置情報を取得する。また、属性情報抽出部133は、属性情報復号部132から供給される補間後の属性情報を取得する。属性情報抽出部133は、第1の実施の形態において説明したように、その補間後の属性情報から、補間されていない位置情報(つまり点)に対応する属性情報を抽出する。つまり属性情報抽出部133は、復号結果である位置情報に対応する属性情報を抽出する。なお、この抽出方法は任意である。例えば、第1の実施の形態において説明した各手法を適用することができる。
上述したように、属性情報は、符号化装置100において、位置情報(復号結果)に対応するようにリカラー処理されている。したがって、補間後の属性情報は、全ての位置情報(復号結果)に対応する属性情報を含む。したがって、属性情報抽出部133は、位置情報に対応する属性情報を容易に抽出することができる。属性情報抽出部133は、その補間されていない位置情報と抽出した属性情報とをポイントクラウド生成部134に供給する。
ポイントクラウド生成部134は、属性情報抽出部133から供給される位置情報および属性情報を取得する。ポイントクラウド生成部134は、それらの位置情報をおよび属性情報を互いに関連付けてポイントクラウド(つまり補間されていないポイントクラウド)を生成し、復号装置130の外部に出力する。
このような構成とすることにより、復号装置130は、属性情報を密な状態で復号することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に復号を行うことができる。したがって、復号装置130は、第1の実施の形態において説明した効果を得ることができる。
また、補間後の属性情報が位置情報の符号化・復号結果に対応しているので、ポイントクラウドの符号化データをより容易に復号することができる。したがって、復号の負荷や処理時間の増大をより抑制することができ、コストの増大を抑制することができる。
なお、これらの処理部(位置情報復号部131乃至ポイントクラウド生成部134)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<復号処理の流れ>
この復号装置130により実行される復号処理の流れの例を、図11のフローチャートを参照して説明する。
復号処理が開始されると、位置情報復号部131は、ステップS131において、補間されていない位置情報の符号化データを復号する。
ステップS132において、属性情報復号部132は、補間後の属性情報の符号化データを復号する。
ステップS133において、属性情報抽出部133は、ステップS132において生成された補間後の属性情報から、ステップS131において生成された補間されていない位置情報に対応する属性情報を抽出する。
ステップS134において、ポイントクラウド生成部134は、ステップS131において生成された位置情報と、ステップS132において生成された属性情報とを互いに関連付け、ポイントクラウドを生成し、復号装置130の外部に出力する。
ステップS134の処理が終了すると復号処理が終了する。
このように復号処理を実行することにより、復号装置130は、属性情報を密な状態で復号することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に復号を行うことができる。したがって、復号装置130は、第1の実施の形態において説明した効果を得ることができる。
また、補間後の属性情報が位置情報の符号化・復号結果に対応しているので、ポイントクラウドの符号化データをより容易に復号することができる。したがって、復号の負荷や処理時間の増大をより抑制することができ、コストの増大を抑制することができる。
<4.第3の実施の形態>
<方法1-2>
次に、方法1-2について説明する。方法1-2では、ポイントクラウドの符号化前の位置情報を用いて、属性情報を補間する。このようにすることにより、位置情報の符号化と属性情報の符号化とを互いに独立に実行することができる。したがって、例えば、位置情報の符号化と属性情報の符号化とを並列に実行することができる。このようにすることにより、第1の実施の形態において説明した効果を得ることができるだけでなく、さらに処理時間の増大を抑制することができる。これにより、コストの増大を抑制することができる。
<符号化装置>
図12は、この場合の符号化装置100の主な構成例を示すブロック図である。図12に示される符号化装置100は、図8の場合と同様に、ポイントクラウド(3Dデータ)を符号化する装置である。符号化装置100は、上述した方法1-2を用いてポイントクラウドを符号化する。
なお、図12においては、処理部やデータの流れ等の主なものを示しており、図12に示されるものが全てとは限らない。つまり、符号化装置100において、図12においてブロックとして示されていない処理部が存在したり、図12において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図12に示されるように、この場合の符号化装置100は、位置情報符号化部101、補間処理部104、属性情報符号化部105、およびビットストリーム生成部106を有する。つまり、この場合の符号化装置100は、第2の実施の形態(図8)の場合と比べて、位置情報復号部102およびポイントクラウド生成部103が省略されている。
この場合の位置情報符号化部101は、第2の実施の形態(図8)の場合と同様に、符号化装置100に入力されたポイントクラウド(3Dデータ)の位置情報を符号化する。そして、位置情報符号化部101は、生成した位置情報の符号化データをビットストリーム生成部106に供給する。
この場合の補間処理部104は、符号化装置100に入力されたポイントクラウド(3Dデータ)を取得する。そして、補間処理部104は、第2の実施の形態(図8)の場合と同様に、その属性情報の疎な部分を補間し、密にする。ただし、この場合の補間処理部104は、上述したように、符号化前の位置情報を用いて属性情報の補間を行う。補間処理部104は、補間後の属性情報を属性情報符号化部105に供給する。
この場合の属性情報符号化部105は、補間処理部104から供給される補間後の属性情報を取得する。属性情報符号化部105は、第2の実施の形態(図8)の場合と同様に、その補間後の属性情報を符号化し、符号化データを生成する。属性情報符号化部105は、生成した補間後の属性情報の符号化データをビットストリーム生成部106に供給する。
この場合のビットストリーム生成部106は、位置情報符号化部101から供給される位置情報の符号化データを取得する。また、ビットストリーム生成部106は、属性情報符号化部105から供給される補間後の属性情報の符号化データを取得する。ビットストリーム生成部106は、第2の実施の形態(図8)の場合と同様に、その位置情報の符号化データと補間後の属性情報の符号化データとを含むビットストリームを生成する。ビットストリーム生成部106は、生成したビットストリームを符号化装置100の外部に出力する。
なお、この場合も、位置情報符号化部101と属性情報符号化部105とを一体化してもよい。
このような構成とすることにより、符号化装置100は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置100は、第1の実施の形態において説明した効果を得ることができる。
また、このようにすることにより、符号化装置100は、位置情報の符号化と属性情報の符号化を互いに独立に行うことができる。したがって、符号化装置100は、例えば、位置情報の符号化と属性情報の符号化とを並列に実行することができる。このようにすることにより、符号化装置100は、さらに処理時間の増大を抑制することができる。これにより、コストの増大を抑制することができる。
なお、これらの処理部(位置情報符号化部101、並びに、補間処理部104乃至ビットストリーム生成部106)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<符号化処理の流れ>
この場合の符号化装置100により実行される符号化処理の流れの例を、図13のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部101は、ステップS151において、ポイントクラウドの位置情報を符号化する。ステップS151の処理が終了すると処理はステップS155に進む。
また、そのステップS151の処理と並行して(ステップS151の処理とは独立に)、ステップS152乃至ステップS154の各処理が実行される。
ステップS152において、補間処理部104は、符号化前の位置情報(点)を補間する。ステップS153において、補間処理部104は、その補間した点に対応する属性情報を補間する。
ステップS154において、属性情報符号化部105は、ステップS153において生成された補間後の属性情報を符号化し、符号化データを生成する。ステップS154の処理が終了すると処理はステップS155に進む。
ステップS151の処理およびステップS154の処理がともに終了すると、ステップS155において、ビットストリーム生成部106は、ステップS151において生成された補間されていない位置情報の符号化データと、ステップS154において生成された補間後の属性情報の符号化データとを含むビットストリームを生成し、出力する。
ステップS155の処理が終了すると符号化処理が終了する。
このように符号化処理を行うことにより、符号化装置100は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置100は、第1の実施の形態において説明した効果を得ることができる。
また、このようにすることにより、符号化装置100は、位置情報の符号化と属性情報の符号化を互いに独立に行うことができる。したがって、符号化装置100は、例えば、位置情報の符号化と属性情報の符号化とを並列に実行することができる。このようにすることにより、符号化装置100は、さらに処理時間の増大を抑制することができる。これにより、コストの増大を抑制することができる。
<復号装置>
この場合の復号装置130の構成は、第2の実施の形態(図10)の場合と同様であるので、その説明を省略する。ただし、この場合、符号化装置100においてリカラー処理が行われていないので、補間後の属性情報が、符号化結果の全ての位置情報に対応する属性情報を有するとは限らない。そのため、属性情報抽出部133が、全ての位置情報に対応する属性情報を抽出することができるとは限らない。その場合、すなわち、属性情報抽出部133により抽出された属性情報に対応しない位置情報が存在する場合、ポイントクラウド生成部134が、その位置情報(点)の近傍に位置する他の位置情報(点)に対応する属性情報を用いて、その位置情報(点)に対応する属性情報を生成するようにする。このようにすることにより、この場合であっても、全ての位置情報に対応する属性情報を得ることができる。
<復号処理の流れ>
この場合の復号処理の流れは、第2の実施の形態(図11)の場合と同様であるので、その説明を省略する。ただし、属性情報抽出部133により抽出された属性情報に対応しない位置情報が存在する場合、ステップS134において、ポイントクラウド生成部134が、その位置情報(点)の近傍に位置する他の位置情報(点)に対応する属性情報を用いて、その位置情報(点)に対応する属性情報を生成するようにする。このようにすることにより、この場合であっても、全ての位置情報に対応する属性情報を得ることができる。
<5.第4の実施の形態>
<方法1-3>
次に、方法1-3について説明する。方法1-3では、属性情報の符号化・復号において、属性情報の変換・逆変換を適用する。例えば、属性情報を係数データに直交変換して符号化し、復号して得られた係数データを逆直交変換して属性情報を生成するようにする。また例えば、属性情報を係数データに変換する変換処理の処理単位毎に、属性情報を補間する。このようにすることにより、符号化効率を向上させることができる。また、属性情報を補間して密にして符号化・復号するので、例えば、DCT(Discrete Cosine Transform)やウェーブレット変換等の、簡易な直交変換を適用することができる。これにより、符号化・復号の負荷や処理時間の増大を抑制することができる。したがって、コストの増大を抑制することができる。
<従来の符号化装置>
図14は、直交変換を適用する場合の符号化装置の主な構成例を示すブロック図である。図14に示される符号化装置200は、ポイントクラウドを符号化する従来の符号化装置である。上述したように3Dデータであるポイントクラウドは、各点に近傍点が存在することが保証されないため、2DデータのようにDCTやウェーブレット変換を用いることが困難であった。そこで、この符号化装置200は、直交変換としてRAHT(Region Adaptive Hierarchical Transform)を適用する。
RAHTは、3次元構造を考慮した直交変換の1つであり、ボクセル化された空間において、ポイントの位置関係(例えば隣のボクセルにポイントが存在するか否か)に応じた重み付け(Weight値)を用いたハール変換である。
例えば、ハール変換する隣接領域にポイントが存在する場合、Weight値を合算し、存在しない場合は、Weight値をそのまま継承して処理を進める。つまり、ポイントが密な部分程Weight値が大きくなる。したがって、Weight値からポイントの疎密を判断することができる。
例えば、このWeight値に基づいて密な部分のポイントを残すように量子化を行うことにより、ポイントクラウドの品質の低減を抑制しながら、符号化効率を向上させることができる。
図14に示されるように、符号化装置200は、位置情報符号化部201、Weight導出部202、RAHT処理部203、量子化部204、属性情報並び替え部205、属性情報符号化部206、およびビットストリーム生成部207を有する。
位置情報符号化部201は、符号化装置200に入力されたポイントクラウド(3Dデータ)の位置情報を符号化する。位置情報符号化部201は、生成した位置情報の符号化データをWeight導出部202およびビットストリーム生成部207に供給する。
Weight導出部202は、位置情報符号化部201から供給される位置情報の符号化データを取得する。Weight導出部202は、その位置情報の符号化データの係数をモートン符号順にRAHTし、Weight値を導出する。Weight導出部202は、導出したWeight値をRAHT処理部203および属性情報並び替え部205に供給する。
RAHT処理部203は、符号化装置200に入力されたポイントクラウド(3Dデータ)の属性情報に対して、Weight導出部202から供給されるWeight値を用いてRAHTを行う。RAHT処理部203は、その処理により得られた属性情報の変換係数を量子化部204に供給する。量子化部204は、供給された属性情報の変換係数を量子化し、量子化係数を生成する。量子化部204は、その量子化係数を属性情報並び替え部205に供給する。
属性情報並び替え部205は、量子化部204から供給される量子化係数を、Weight導出部202から供給されるWeight値が大きい順に並び替える。属性情報並び替え部205は、その並び替え後の量子化係数を属性情報符号化部206に供給する。
属性情報符号化部206は、属性情報並び替え部205から供給される並び替え後の量子化係数を符号化する。つまり、属性情報符号化部206は、Weight値が大きい順に属性情報の各係数を符号化する。属性情報符号化部206は、その符号化により生成した属性情報の符号化データをビットストリーム生成部207に供給する。
ビットストリーム生成部207は、位置情報符号化部201から供給される位置情報の符号化データと、属性情報符号化部206から供給される属性情報の符号化データとを取得する。ビットストリーム生成部207は、それらの符号化データを含むビットストリームを生成し、そのビットストリームを符号化装置200の外部に出力する。
<従来の符号化処理の流れ>
この符号化装置200により実行される従来の符号化処理の流れの例を、図15のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部201は、ステップS201において、ポイントクラウドの位置情報を符号化する。
ステップS202において、Weight導出部202は、ステップS201において生成された位置情報の符号化データの係数をモートン符号順にRAHTし、Weight値を導出する。
ステップS203において、RAHT処理部203は、符号化装置200に入力されたポイントクラウド(3Dデータ)の属性情報に対して、ステップS202において導出されたWeight値を用いてRAHTを行い、属性情報を変換係数に変換する(属性情報の変換係数を生成する)。
ステップS204において、量子化部204は、ステップS203において生成された属性情報の変換係数を量子化し、量子化係数を生成する。
ステップS205において、属性情報並び替え部205は、ステップS204において生成された量子化係数を、ステップS202において導出されたWeight値が大きい順に並び替える。
ステップS206において、属性情報符号化部206は、ステップS205において並び替えられた順、すなわち、Weight値が大きい順に属性情報の各係数を符号化する。
ステップS207において、ビットストリーム生成部207は、ステップS201において生成された位置情報の符号化データと、ステップS206において生成された属性情報の符号化データとを含むビットストリームを生成し、出力する。
ステップS207の処理が終了すると符号化処理が終了する。
<従来の復号装置>
図16は、復号装置の主な構成例を示すブロック図である。図16に示される復号装置230は、符号化装置200に対応し、符号化装置200において生成されたポイントクラウドの符号化データを復号する従来の復号装置である。図16に示されるように、復号装置230は、位置情報復号部231、Weight導出部232、属性情報復号部233、属性情報並び替え部234、逆量子化部235、逆RAHT処理部236、およびポイントクラウド生成部237を有する。
位置情報復号部231は、復号装置230に入力されるビットストリームに含まれる位置情報の符号化データを取得し、復号する。位置情報復号部231は、生成した位置情報をWeight導出部232およびポイントクラウド生成部237に供給する。
Weight導出部232は、位置情報復号部231から供給される位置情報を取得し、その位置情報をモートン符号順にRAHTし、Weight値を導出する。Weight導出部232は、導出したWeight値を属性情報並び替え部234および逆RAHT処理部236に供給する。
属性情報復号部233は、復号装置230に入力されるビットストリームに含まれる属性情報の符号化データを取得し、復号する。属性情報復号部233は、生成した属性情報の量子化係数を属性情報並び替え部234に供給する。
属性情報並び替え部234は、属性情報復号部233から供給される、Weight値が大きい順に並ぶ属性情報の量子化係数を、Weight導出部232から供給されるWeight値に基づいて、モートン符号順に並び替える。属性情報並び替え部234は、その並び替え後の量子化係数を逆量子化部235に供給する。
逆量子化部235は、属性情報並び替え部234から供給される、モートン符号順に並び替えられた属性情報の量子化係数を、逆量子化する。逆量子化部235は、その逆量子化により生成した属性情報の変換係数を逆RAHT処理部236に供給する。
逆RAHT処理部236は、Weight導出部232から供給される位置情報のWeight値を用いて、逆量子化部235から供給される変換係数に対して、RAHTの逆処理である逆RAHTを行い、その変換係数を属性情報に変換する(属性情報を生成する)。逆RAHT処理部236は、生成した属性情報をポイントクラウド生成部237に供給する。
ポイントクラウド生成部237は、位置情報復号部231から供給される位置情報と、および逆RAHT処理部236から供給される属性情報とを関連付け、ポイントクラウドを生成し、そのポイントクラウドを復号装置230の外部に出力する。
<従来の復号処理の流れ>
この復号装置230により実行される従来の復号処理の流れの例を、図17のフローチャートを参照して説明する。
復号処理が開始されると、位置情報復号部231は、ステップS231において、位置情報の符号化データを復号する。
ステップS232において、Weight導出部232は、ステップS231において生成された位置情報をモートン符号順にRAHTし、Weight値を導出する。
ステップS233において、属性情報復号部233は、属性情報の符号化データを復号する。
ステップS234において、属性情報並び替え部234は、ステップS233において生成された属性情報の量子化係数(Weight値が大きい順に並べられた量子化係数)を、ステップS232において導出されたWeight値に基づいて、モートン符号順に並び替える。
ステップS235において、逆量子化部235は、ステップS234においてモートン符号順に並び替えられた属性情報の量子化係数を逆量子化し、属性情報の変換係数を生成する。
ステップS236において、逆RAHT処理部236は、ステップS235において生成された属性情報の変換係数に対して、ステップS232において導出されたWeight値を用いて逆RAHT処理を行い、変換係数を属性情報に変換する(属性情報を生成する)。
ステップS237において、ポイントクラウド生成部237は、ステップS231において生成された位置情報と、ステップS236において生成された属性情報とを互いに関連付け、ポイントクラウドを生成し、出力する。
ステップS237の処理が終了すると復号処理が終了する。
以上のように符号化装置200および復号装置230の場合、属性情報が疎の状態のまま処理される。したがって、符号化や復号の処理が複雑化し、符号化や復号の負荷や処理時間が増大するおそれがあった。したがって、符号化や復号のコストが増大するおそれがあった。
また、属性情報が疎である可能性があるので、2Dデータに用いられるような(逆)DCTや(逆)ウェーブレット変換等の簡易な(逆)直交変換を適用することが困難であった。そのため、RAHTのような、より処理の負荷が大きい(逆)直交変換を適用しなければならず、符号化や復号の負荷や処理時間が増大するおそれがあった。したがって、符号化や復号のコストが増大するおそれがあった。
<符号化装置>
図18は、本技術を適用した情報処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図18に示される符号化装置300は、ポイントクラウド(3Dデータ)を符号化する装置である。符号化装置300は、上述した方法1-3を用いてポイントクラウドを符号化する。
なお、図18においては、処理部やデータの流れ等の主なものを示しており、図18に示されるものが全てとは限らない。つまり、符号化装置300において、図18においてブロックとして示されていない処理部が存在したり、図18において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図18に示されるように符号化装置300は、位置情報符号化部301、補間処理部302、直交変換部303、量子化部304、属性情報符号化部305、およびビットストリーム生成部306を有する。この場合の符号化装置300は、第3の実施の形態の符号化装置100(図12)と同様に、ポイントクラウドの符号化前の位置情報を用いて、属性情報を補間する。
位置情報符号化部301は、第3の実施の形態(図12)の位置情報符号化部101と同様に、符号化装置300に入力されたポイントクラウド(3Dデータ)を取得し、その位置情報を符号化する。そして、位置情報符号化部301は、生成した位置情報の符号化データをビットストリーム生成部306に供給する。
補間処理部302は、第3の実施の形態(図12)の補間処理部104と同様に、符号化装置300に入力されたポイントクラウド(3Dデータ)を取得し、その属性情報の疎な部分を補間し、密にする。つまり、補間処理部302は、符号化前の位置情報を用いて属性情報の補間を行う。補間処理部302は、補間後の属性情報を直交変換部303に供給する。
直交変換部303は、補間処理部302から供給される属性情報を取得する。直交変換部303は、その属性情報を直交変換し、変換係数に変換する。なお、補間処理部302から供給される属性情報は、補間後の属性情報である。つまり、直交変換部303は、データが密な状態の属性情報を取得する。したがって、直交変換部303は、この属性情報に対する直交変換において、DCTやウェーブレット変換のようなRAHTよりも簡易な直交変換を適用する。直交変換部303は、直交変換により生成した変換係数を量子化部304に供給する。
量子化部304は、直交変換部303から供給される属性情報の変換係数を取得する。量子化部304は、その属性情報の変換係数を量子化し、量子化係数を生成する。この量子化の方法は任意である。量子化部304は、生成した属性情報の量子化係数を属性情報符号化部305に供給する。
属性情報符号化部305は、量子化部304から供給される属性情報の量子化係数を取得する。属性情報符号化部305は、第3の実施の形態(図12)の属性情報符号化部105と同様に、その属性情報の量子化係数を符号化し、符号化データを生成する。属性情報符号化部305は、生成した補間後の属性情報の(量子化係数の)符号化データをビットストリーム生成部306に供給する。
ビットストリーム生成部306は、位置情報符号化部301から供給される位置情報の符号化データを取得する。また、ビットストリーム生成部306は、属性情報符号化部305から供給される補間後の属性情報の符号化データを取得する。ビットストリーム生成部306は、第3の実施の形態(図12)のビットストリーム生成部106と同様に、その位置情報の符号化データと補間後の属性情報の符号化データとを含むビットストリームを生成する。ビットストリーム生成部306は、生成したビットストリームを符号化装置300の外部に出力する。
なお、位置情報符号化部301と属性情報符号化部305とを一体化してもよい。また、直交変換部303(および量子化部304)を属性情報符号化部305と一体化してもよい。また、量子化部304は、省略してもよい。
このような構成とすることにより、符号化装置300は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置300は、第1の実施の形態において説明した効果を得ることができる。
また、このような構成とすることにより、符号化装置300は、位置情報の符号化と属性情報の符号化を互いに独立に行うことができる。例えば、符号化装置300は、位置情報の符号化と属性情報の符号化とを並列に実行することができる。したがって、符号化装置300は、第3の実施の形態において説明した効果を得ることができる。
さらに、このような構成とすることにより、符号化装置300は、DCTやウェーブレット変換のようなRAHTよりも簡易な直交変換を適用することができる。したがって、符号化装置300は、さらに、符号化の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、これらの処理部(位置情報符号化部301乃至ビットストリーム生成部306)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<符号化処理の流れ>
符号化装置300により実行される符号化処理の流れの例を、図19のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部301は、ステップS301において、ポイントクラウドの位置情報を符号化し、補間されていない位置情報の符号化データを生成する。ステップS301の処理が終了すると処理はステップS307に進む。
また、そのステップS301の処理と並行して(ステップS301の処理とは独立に)、ステップS302乃至ステップS306の各処理が実行される。
ステップS302において、補間処理部302は、符号化前の位置情報(点)を補間する。ステップS303において、補間処理部302は、その補間した点に対応する属性情報を補間する。
ステップS304において、直交変換部303は、ステップS303において生成された補間後の属性情報に対して、例えばDCTやウェーブレット変換のようなRAHTよりも簡易な直交変換を行い、変換係数に変換する(属性情報の変換係数を生成する)。
ステップS305において、量子化部304は、ステップS304において生成された補間後の属性情報の変換係数を量子化し、量子化係数を生成する。
ステップS306において、属性情報符号化部305は、ステップS305において生成された補間後の属性情報の量子化係数を符号化し、その符号化データを生成する。ステップS306の処理が終了すると処理はステップS307に進む。
ステップS301の処理およびステップS306の処理がともに終了すると、ステップS307において、ビットストリーム生成部306は、ステップS301において生成された補間されていない位置情報の符号化データと、ステップS306において生成された補間後の属性情報の量子化係数の符号化データとを含むビットストリームを生成し、出力する。
ステップS307の処理が終了すると符号化処理が終了する。
このように符号化処理を実行することにより、符号化装置300は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置300は、第1の実施の形態において説明した効果を得ることができる。
また、このように符号化処理を実行することにより、符号化装置300は、位置情報の符号化と属性情報の符号化を互いに独立に行うことができる。例えば、符号化装置300は、位置情報の符号化と属性情報の符号化とを並列に実行することができる。したがって、符号化装置300は、第3の実施の形態において説明した効果を得ることができる。
さらに、このように符号化処理を実行することにより、符号化装置300は、DCTやウェーブレット変換のようなRAHTよりも簡易な直交変換を適用することができる。したがって、符号化装置300は、さらに、符号化の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、以上においては、符号化装置300が、第3の実施の形態の符号化装置100(図12)と同様に、ポイントクラウドの符号化前の位置情報を用いて、属性情報を補間するように説明したが、これに限らず、第2の実施の形態の符号化装置100(図8)と同様に、ポイントクラウドの位置情報を符号化して復号した結果を用いて、属性情報を補間するようにしてもよい。
その場合、符号化装置300は、第2の実施の形態の符号化装置100(図8)と同様の構成を有し、さらにその補間処理部104と属性情報符号化部105との間に、直交変換部303および量子化部304(図18)を有するようにすればよい。また、その場合の符号化処理は、第2の実施の形態の符号化処理(図9)において、ステップS105とステップS106の処理の間において、ステップS304およびステップS305(図19)の処理を追加すればよい。
<復号装置>
図20は、本技術を適用した情報処理装置の一態様である復号装置の構成の一例を示すブロック図である。図20に示される復号装置330は、符号化装置300に対応し、符号化装置300において生成されたポイントクラウドの符号化データを復号する。この復号装置330は、上述した方法1-3を用いてポイントクラウドの符号化データを復号する。
なお、図20においては、処理部やデータの流れ等の主なものを示しており、図20に示されるものが全てとは限らない。つまり、復号装置330において、図20においてブロックとして示されていない処理部が存在したり、図20において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図20に示されるように、復号装置330は、位置情報復号部331、属性情報復号部332、逆量子化部333、逆直交変換部334、属性情報抽出部335、およびポイントクラウド生成部336を有する。
位置情報復号部331は、第2の実施の形態(図10)の位置情報復号部131と同様に、復号装置330に入力されたポイントクラウド(3Dデータ)の位置情報の符号化データを復号し、補間されていない位置情報を生成する。位置情報復号部331は、生成した、補間されていない位置情報を属性情報抽出部335に供給する。
属性情報復号部332は、第2の実施の形態(図10)の属性情報復号部132と同様に、復号装置330に入力されたポイントクラウド(3Dデータ)の補間後の属性情報の(量子化係数の)符号化データを復号し、補間後の属性情報の量子化係数を生成する。属性情報復号部332は、生成した補間後の属性情報の量子化係数を逆量子化部333に供給する。
逆量子化部333は、属性情報復号部332から供給される補間後の属性情報の量子化係数を取得する。逆量子化部333は、その属性情報の量子化係数を逆量子化し、補間後の属性情報の変換係数を生成する。この逆量子化は、量子化部304(図18)が行う量子化の逆処理であればよい。逆量子化部333は、生成した補間後の属性情報の変換係数を逆直交変換部334に供給する。
逆直交変換部334は、逆量子化部333から供給される属性情報の変換係数を取得する。逆直交変換部334は、その属性情報の変換係数を直交変換し、属性情報に変換する。なお、逆量子化部333から供給される変換係数は、補間後の属性情報の変換係数である。つまり、逆直交変換部334は、データが密な状態の属性情報の変換係数を取得する。したがって、逆直交変換部334は、この変換係数に対する逆直交変換において、DCTやウェーブレット変換のようなRAHTよりも簡易な逆直交変換を適用する。この逆直交変換は、直交変換部303(図18)が行う直交変換の逆処理であればよい。逆直交変換部334は、逆直交変換により生成した補間後の属性情報を属性情報抽出部335に供給する。
属性情報抽出部335は、位置情報復号部331から供給される補間されていない位置情報を取得する。また、属性情報抽出部335は、逆直交変換部334から供給される補間後の属性情報を取得する。属性情報抽出部335は、第2の実施の形態の属性情報抽出部133(図10)と同様に、その補間後の属性情報から、補間されていない位置情報(つまり点)に対応する属性情報を抽出する。属性情報抽出部335は、その補間されていない位置情報と抽出した属性情報とをポイントクラウド生成部336に供給する。
ポイントクラウド生成部336は、属性情報抽出部335から供給される位置情報および属性情報を取得する。ポイントクラウド生成部336は、第2の実施の形態のポイントクラウド生成部134(図10)と同様に、それらの位置情報をおよび属性情報を互いに関連付けてポイントクラウド(つまり補間されていないポイントクラウド)を生成し、復号装置330の外部に出力する。
なお、位置情報復号部331と属性情報復号部332とを一体化してもよい。また、逆直交変換部334(および逆量子化部333)を属性情報復号部332と一体化してもよい。また、逆量子化部333は、省略してもよい。
このような構成とすることにより、復号装置330は、属性情報の符号化データを、属性情報が密な状態で復号することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に復号を行うことができる。したがって、復号装置330は、第1の実施の形態において説明した効果を得ることができる。
さらに、このような構成とすることにより、復号装置330は、逆DCTや逆ウェーブレット変換のようなRAHTよりも簡易な逆直交変換を適用することができる。したがって、復号装置330は、さらに、復号の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、第3の実施の形態の場合と同様に、属性情報抽出部335により抽出された属性情報に対応しない位置情報が存在する場合、ポイントクラウド生成部336が、その位置情報(点)の近傍に位置する他の位置情報(点)に対応する属性情報を用いて、その位置情報(点)に対応する属性情報を生成するようにする。このようにすることにより、この場合であっても、全ての位置情報に対応する属性情報を得ることができる。
なお、これらの処理部(位置情報復号部331乃至ポイントクラウド生成部336)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<復号処理の流れ>
この復号装置330により実行される復号処理の流れの例を、図21のフローチャートを参照して説明する。
復号処理が開始されると、位置情報復号部331は、ステップS331において、補間されていない位置情報の符号化データを復号する。
ステップS332において、属性情報復号部332は、補間後の属性情報の量子化係数の符号化データを復号し、補間後の属性情報の量子化係数を生成する。
ステップS333において、逆量子化部333は、ステップS332において生成された補間後の属性情報の量子化係数を逆量子化し、補間後の属性情報の変換係数を生成する。
ステップS334において、逆直交変換部334は、ステップS333において生成された補間後の属性情報の変換係数に対して、例えば逆DCTや逆ウェーブレット変換のような逆RAHTよりも簡易な逆直交変換を行い、補間後の属性情報に変換する(補間後の属性情報を生成する)。
ステップS335において、属性情報抽出部335は、ステップS334において生成された補間後の属性情報から、ステップS331において生成された補間されていない位置情報に対応する属性情報を抽出する。
ステップS336において、ポイントクラウド生成部336は、その位置情報と属性情報とを互いに関連付け、ポイントクラウドを生成し、出力する。
ステップS336の処理が終了すると復号処理が終了する。
このように復号処理を実行することにより、属性情報の符号化データを、属性情報が密な状態で復号することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に復号を行うことができる。したがって、復号装置330は、第1の実施の形態において説明した効果を得ることができる。
さらに、このように復号処理を実行することにより、復号装置330は、逆DCTや逆ウェーブレット変換のようなRAHTよりも簡易な逆直交変換を適用することができる。したがって、復号装置330は、さらに、復号の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、本実施の形態においては直交変換処理を適用する例について説明したが、これに限らず、直交変換以外の変換処理を適用するようにしてもよい。また、属性情報の補間は、属性情報全体に対して行う(属性情報の解像度がポイントクラウド全体で一定となるようにする)ようにしてもよいし、所定のデータ単位毎に行うようにしてもよい。例えば、直交変換(逆直交変換)の処理単位毎に行うようにしてもよい。
<6.第5の実施の形態>
<方法1-4>
次に、方法1-4について説明する。方法1-4では、属性情報の符号化・復号において、属性情報の予測を適用する。例えば、属性情報の予測値を導出し、その属性情報と予測値との差分を符号化するようにする。また、例えば、符号化データを復号して、属性情報とその予測値との差分を生成し、属性情報の予測値を導出し、生成した差分に導出した予測値を加算して属性情報を生成するようにする。このようにすることにより、符号化効率を向上させることができる。
また、このようにすることにより、属性情報が密な状態で予測を行うことができる。したがって、予測を行う属性情報の近傍(周辺)の属性情報を用いて予測値を導出する場合、位置情報を用いて近傍点を探索する等の煩雑な処理を必要とせずに、容易に、その近傍の属性情報を特定し、予測値の導出に利用することができる。したがって、符号化装置500は、さらに、符号化の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
<従来の符号化装置>
図22は、予測を適用する場合の符号化装置の主な構成例を示すブロック図である。図22に示される符号化装置400は、ポイントクラウドを符号化する従来の符号化装置である。
図22に示されるように、符号化装置400は、位置情報符号化部401、位置情報復号部402、ポイントクラウド生成部403、予測部404、残差導出部405、量子化部406、属性情報符号化部407、およびビットストリーム生成部408を有する。
位置情報符号化部401は、位置情報符号化部11と同様に、符号化装置400に入力されたポイントクラウド(3Dデータ)の位置情報を符号化する。位置情報符号化部401は、生成した位置情報の符号化データを位置情報復号部402およびビットストリーム生成部408に供給する。
位置情報復号部402は、位置情報符号化部401から供給される位置情報の符号化データを取得し、位置情報復号部12と同様に、その符号化データを復号する。位置情報復号部402は、生成した位置情報(復号結果)をポイントクラウド生成部403に供給する。
ポイントクラウド生成部403は、符号化装置400に入力されるポイントクラウドの属性情報と、位置情報復号部402から供給される位置情報(復号結果)を取得する。ポイントクラウド生成部403は、ポイントクラウド生成部13と同様に、属性情報を位置情報(復号結果)に合わせるリカラー処理を行う。ポイントクラウド生成部403は、位置情報(復号結果)に対応させた属性情報を予測部404に供給する。
予測部404は、ポイントクラウド生成部403から供給される属性情報について予測を行い、属性情報の予測値を生成する。例えば、予測部404は、処理対象の属性情報について、その周辺に位置する属性情報に基づいて予測し、処理対象の属性情報の予測値を生成する。予測部404は、属性情報と、その予測値を残差導出部405に供給する。
残差導出部405は、予測部404から供給された属性情報と予測値を用いて、それらの差分(残差)を導出する。残差導出部405は、導出した属性情報とその予測値との差分を量子化部406に供給する。
量子化部406は、残差導出部405から供給された差分を取得し、それを量子化して、差分の量子化係数を生成する。量子化部406は、生成した差分の量子化係数を属性情報符号化部407に供給する。
属性情報符号化部407は、量子化部406から供給される、属性情報とその予測値との差分の量子化係数を取得する。属性情報符号化部407は、属性情報符号化部14と同様に、その量子化係数を符号化し、属性情報の符号化データを生成する。属性情報符号化部407は、生成した属性情報の符号化データ(属性情報とその予測値との差分の量子化係数の符号化データ)をビットストリーム生成部408に供給する。
ビットストリーム生成部408は、位置情報符号化部401から供給される位置情報の符号化データと、属性情報符号化部407から供給される属性情報の符号化データとを取得する。ビットストリーム生成部408は、ビットストリーム生成部15と同様に、それらの符号化データを含むビットストリームを生成し、そのビットストリームを符号化装置400の外部に出力する。
<従来の符号化処理の流れ>
この符号化装置400により実行される従来の符号化処理の流れの例を、図23のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部401は、ステップS401において、ポイントクラウドの位置情報を符号化する。
ステップS402において、位置情報復号部402は、ステップS401において生成された位置情報の符号化データを復号する。
ステップS403において、ポイントクラウド生成部403は、ステップS402において得られた位置情報の復号結果を用いて、リカラー処理を行い、属性情報を位置情報(復号結果)に対応させる。
ステップS404において、予測部404は、処理対象の属性情報に対応する点の近傍点を探索する。ステップS405において、予測部404は、探索した近傍点の属性情報を用いて、処理対象の属性情報の予測値を導出する。
ステップS406において、残差導出部405は、属性情報と予測値との差分(残差)を導出する。
ステップS407において、量子化部406は、ステップS406において導出した差分を量子化し、量子化係数を生成する。
ステップS408において、属性情報符号化部407は、ステップS407において生成された差分の量子化係数を符号化し、属性情報の符号化データを生成する。
ステップS409において、ビットストリーム生成部408は、ステップS401において生成された位置情報の符号化データと、ステップS408において生成された属性情報の符号化データとを含むビットストリームを生成し、出力する。
ステップS409の処理が終了すると符号化処理が終了する。
<従来の復号装置>
図24は、復号装置の主な構成例を示すブロック図である。図24に示される復号装置430は、符号化装置400に対応し、符号化装置400において生成されたポイントクラウドの符号化データを復号する従来の復号装置である。図24に示されるように、復号装置430は、位置情報復号部431、属性情報復号部432、逆量子化部433、予測部434、属性情報導出部435、およびポイントクラウド生成部436を有する。
位置情報復号部431は、位置情報復号部31と同様に、復号装置430に入力されたポイントクラウド(3Dデータ)の位置情報の符号化データを復号し、位置情報を生成する。位置情報復号部431は、生成した位置情報を予測部434およびポイントクラウド生成部436に供給する。
属性情報復号部432は、属性情報復号部32と同様に、復号装置430に入力されたポイントクラウド(3Dデータ)の属性情報の符号化データ(属性情報とその予測値との差分の量子化係数の符号化データ)を復号し、差分の量子化係数を生成する。属性情報復号部432は、生成した量子化係数を逆量子化部433に供給する。
逆量子化部433は、属性情報復号部432から供給される量子化係数を取得し、それを逆量子化し、属性情報とその予測値との差分を生成する。逆量子化部433は、生成した差分を予測部434に供給する。
予測部434は、逆量子化部433から供給される差分を取得する。また、予測部434は、位置情報復号部431から供給される位置情報を取得する。さらに、予測部434は、属性情報導出部435より供給される導出済みの属性情報を取得する。予測部434は、逆量子化部433から供給される差分に対応する属性情報の予測値を導出する。その際、予測部434は、位置情報復号部431から供給される位置情報に基づいて、予測値を導出する属性情報が対応する点の近傍に位置する点(近傍点)を探索する。そして、予測部434は、属性情報導出部435から供給される導出済みの属性情報に基づいて、探索した近傍点に対応する属性情報を求める。予測部434は、このようにして求めた近傍点の属性情報を用いて、処理対象の属性情報(すなわち逆量子化部433から供給される差分に対応する属性情報)の予測値を導出する。予測部434は、逆量子化部433から供給される差分と導出した予測値とを属性情報導出部435に供給する。
属性情報導出部435は、予測部434から供給される差分と予測値とを取得し、それらを用いて属性情報を導出する。つまり、属性情報導出部435は、差分に予測値を加算して属性情報を導出する。属性情報導出部435は、導出した属性情報を予測部434およびポイントクラウド生成部436に供給する。
ポイントクラウド生成部436は、位置情報復号部431から供給される位置情報と、属性情報導出部435から供給される属性情報とを取得する。ポイントクラウド生成部436は、その位置情報と属性情報とを関連付け、ポイントクラウドを生成し、復号装置430の外部に出力する。
<従来の復号処理の流れ>
この復号装置430により実行される従来の復号処理の流れの例を、図25のフローチャートを参照して説明する。
復号処理が開始されると、位置情報復号部431は、ステップS431において、位置情報の符号化データを復号し、位置情報を生成する。
ステップS432において、属性情報復号部432は、属性情報の符号化データ(属性情報とその予測値との差分の量子化係数の符号化データ)を復号し、属性情報とその予測値との差分の量子化係数を生成する。
ステップS433において、逆量子化部433は、ステップS432において生成された量子化係数を逆量子化し、属性情報とその予測値との差分を生成する。
ステップS434において、予測部434は、ステップS431において生成された位置情報に基づいて処理対象の属性情報に対応する点(処理対象の点)の近傍点を探索する。
ステップS435において、予測部434は、ステップS434において探索した近傍点の属性情報を用いて、処理対象の点の属性情報の予測値を導出する。
ステップS436において、属性情報導出部435は、ステップS433において生成した差分に、ステップS435において導出した予測値を加算することにより、属性情報を導出する。
ステップS437において、ポイントクラウド生成部436は、ステップS431において生成された位置情報と、ステップS436において導出された属性情報とを関連付けてポイントクラウドを生成し、出力する。
ステップS437の処理が終了すると復号処理が終了する。
以上のように符号化装置400および復号装置430の場合、属性情報が疎の状態のまま処理される。したがって、符号化や復号の処理が複雑化し、符号化や復号の負荷や処理時間が増大するおそれがあった。したがって、符号化や復号のコストが増大するおそれがあった。
<符号化装置>
図26は、本技術を適用した情報処理装置の一態様である符号化装置の構成の一例を示すブロック図である。図26に示される符号化装置500は、ポイントクラウド(3Dデータ)を符号化する装置である。符号化装置500は、上述した方法1-4を用いてポイントクラウドを符号化する。
なお、図26においては、処理部やデータの流れ等の主なものを示しており、図26に示されるものが全てとは限らない。つまり、符号化装置500において、図26においてブロックとして示されていない処理部が存在したり、図26において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図26に示されるように符号化装置500は、位置情報符号化部501、補間処理部502、予測部503、残差導出部504、量子化部505、属性情報符号化部506、およびビットストリーム生成部507を有する。この場合の符号化装置500は、第4の実施の形態の符号化装置300(図18)と同様に、ポイントクラウドの符号化前の位置情報を用いて、属性情報を補間する。
位置情報符号化部501は、第4の実施の形態(図18)の位置情報符号化部301と同様に、符号化装置500に入力されたポイントクラウド(3Dデータ)を取得し、その位置情報を符号化する。そして、位置情報符号化部501は、生成した位置情報の符号化データをビットストリーム生成部507に供給する。
補間処理部502は、第4の実施の形態(図18)の補間処理部302と同様に、符号化装置500に入力されたポイントクラウド(3Dデータ)を取得し、その属性情報の疎な部分を補間し、密にする。つまり、補間処理部502は、符号化前の位置情報を用いて属性情報の補間を行う。補間処理部502は、補間後の属性情報を予測部503に供給する。
予測部503は、補間処理部502から供給される属性情報を取得する。予測部503は、その属性情報の予測値を導出する。
この予測の方法は任意である。例えば、予測部503は、予測を行う属性情報(処理対象の属性情報)の近傍(周辺)の属性情報を用いて、その処理対象の属性情報の予測値を導出するようにしてもよい。例えば、複数の近傍の属性情報の平均値を予測値としてもよい。また、例えば、処理対象の属性情報に最も近い(最近傍の)属性情報を予測値としてもよい(属性情報を複製して予測値としてもよい)。もちろん、これらの方法以外の方法であってもよい。
なお、補間処理部502から供給される属性情報は、補間後の属性情報である。つまり、予測部503は、データが密な状態の属性情報を取得する。つまり、属性情報には必ず近傍(周辺)の属性情報が存在する。したがって、予測部503は、位置情報を用いて近傍点を探索しなくても、容易に、近傍(周辺)の属性情報を求めることができる。したがって、予測部503は、容易に、その近傍(周辺)の属性情報を用いて予測値を導出することができる。予測部503は、補間処理部502から供給された補間後の属性情報と、導出した予測値とを残差導出部504に供給する。
残差導出部504は、予測部503から供給された属性情報と予測値とを取得する。残差導出部504は、その属性情報と予測値とを用いて、それらの差分(残差)を導出する。残差導出部504は、導出した属性情報とその予測値との差分を量子化部505に供給する。
量子化部505は、残差導出部504から供給された差分を取得する。量子化部505は、第4の実施の形態(図18)の量子化部304と同様に、その差分を量子化して量子化係数を生成する。量子化部505は、生成した差分の量子化係数を属性情報符号化部506に供給する。
属性情報符号化部506は、量子化部505から供給される差分の量子化係数を取得する。属性情報符号化部506は、第4の実施の形態(図18)の属性情報符号化部305と同様に、その差分の量子化係数を符号化し、属性情報の符号化データ(補間後の属性情報とその予測値との差分の量子化係数の符号化データ)を生成する。属性情報符号化部506は、生成した属性情報の符号化データをビットストリーム生成部507に供給する。
ビットストリーム生成部507は、位置情報符号化部501から供給される位置情報の符号化データを取得する。また、ビットストリーム生成部507は、属性情報符号化部506から供給される属性情報の符号化データを取得する。ビットストリーム生成部507は、第4の実施の形態(図18)のビットストリーム生成部306と同様に、その位置情報の符号化データと属性情報の符号化データとを含むビットストリームを生成する。ビットストリーム生成部507は、生成したビットストリームを符号化装置500の外部に出力する。
なお、位置情報符号化部501と属性情報符号化部506とを一体化してもよい。また、予測部503および残差導出部504(並びに量子化部505)を属性情報符号化部506と一体化してもよい。また、量子化部505は、省略してもよい。
このような構成とすることにより、符号化装置500は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置300は、第1の実施の形態において説明した効果を得ることができる。
また、このような構成とすることにより、符号化装置500は、位置情報の符号化と属性情報の符号化を互いに独立に行うことができる。例えば、符号化装置500は、位置情報の符号化と属性情報の符号化とを並列に実行することができる。したがって、符号化装置500は、第3の実施の形態において説明した効果を得ることができる。
さらに、このような構成とすることにより、符号化装置500は、予測値をより容易に導出することができる。したがって、符号化装置500は、さらに、符号化の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、これらの処理部(位置情報符号化部501乃至ビットストリーム生成部507)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<符号化処理の流れ>
符号化装置500により実行される符号化処理の流れの例を、図27のフローチャートを参照して説明する。
符号化処理が開始されると、位置情報符号化部501は、ステップS501において、ポイントクラウドの位置情報を符号化し、補間されていない位置情報の符号化データを生成する。ステップS501の処理が終了すると処理はステップS508に進む。
また、そのステップS501の処理と並行して(ステップS501の処理とは独立に)、ステップS502乃至ステップS507の各処理が実行される。
ステップS502において、補間処理部502は、符号化前の位置情報(点)を補間する。ステップS503において、補間処理部502は、その補間した点に対応する属性情報を補間する。
ステップS504において、予測部503は、ステップS503において生成された補間後の属性情報に対して、その予測値を導出する。予測部503は、例えば、予測を行う属性情報(処理対象の属性情報)の周辺の属性情報を用いて、処理対象の属性情報の予測値を導出する。
ステップS505において、残差導出部504は、ステップS503において生成された補間後の属性情報と、ステップS504において導出されたその予測値との差分(残差)を導出する。
ステップS506において、量子化部505は、ステップS505において導出された補間後の属性情報とその予測値との差分を量子化し、その量子化係数を生成する。
ステップS507において、属性情報符号化部506は、ステップS506において生成された量子化係数を符号化し、属性情報の符号化データ(補間後の属性情報とその予測値との差分の量子化係数の符号化データ)を生成する。ステップS507の処理が終了すると処理はステップS508に進む。
ステップS501の処理およびステップS507の処理がともに終了すると、ステップS508において、ビットストリーム生成部507は、ステップS501において生成された補間されていない位置情報の符号化データと、ステップS507において生成された補間後の属性情報とその予測値との差分の量子化係数の符号化データとを含むビットストリームを生成し、出力する。
ステップS507の処理が終了すると符号化処理が終了する。
このように符号化処理を実行することにより、符号化装置500は、属性情報を密な状態で符号化することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に符号化を行うことができる。したがって、符号化装置300は、第1の実施の形態において説明した効果を得ることができる。
また、このように符号化処理を実行することにより、符号化装置500は、位置情報の符号化と属性情報の符号化を互いに独立に行うことができる。例えば、符号化装置500は、位置情報の符号化と属性情報の符号化とを並列に実行することができる。したがって、符号化装置500は、第3の実施の形態において説明した効果を得ることができる。
さらに、このように符号化処理を実行することにより、符号化装置500は、予測値をより容易に導出することができる。したがって、符号化装置500は、さらに、符号化の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、以上においては、符号化装置500が、第3の実施の形態の符号化装置100(図12)と同様に、ポイントクラウドの符号化前の位置情報を用いて、属性情報を補間するように説明したが、これに限らず、第2の実施の形態の符号化装置100(図8)と同様に、ポイントクラウドの位置情報を符号化して復号した結果を用いて、属性情報を補間するようにしてもよい。
その場合、符号化装置500は、第2の実施の形態の符号化装置100(図8)と同様の構成を有し、さらにその補間処理部104と属性情報符号化部105との間に、予測部503乃至量子化部505(図26)を有するようにすればよい。また、その場合の符号化処理は、第2の実施の形態の符号化処理(図9)において、ステップS105とステップS106の処理の間において、ステップS504乃至ステップS506(図27)の処理を追加すればよい。
<復号装置>
図28は、本技術を適用した情報処理装置の一態様である復号装置の構成の一例を示すブロック図である。図28に示される復号装置530は、符号化装置500に対応し、符号化装置500において生成されたポイントクラウドの符号化データを復号する。この復号装置530は、上述した方法1-4を用いてポイントクラウドの符号化データを復号する。
なお、図28においては、処理部やデータの流れ等の主なものを示しており、図28に示されるものが全てとは限らない。つまり、復号装置530において、図28においてブロックとして示されていない処理部が存在したり、図28において矢印等として示されていない処理やデータの流れが存在したりしてもよい。
図28に示されるように、復号装置530は、位置情報復号部531、属性情報復号部532、逆量子化部533、予測部534、属性情報導出部535、属性情報抽出部536、およびポイントクラウド生成部537を有する。
位置情報復号部531は、第4の実施の形態(図20)の位置情報復号部331と同様に、復号装置530に入力されたポイントクラウド(3Dデータ)の位置情報の符号化データを復号し、補間されていない位置情報を生成する。位置情報復号部531は、生成した、補間されていない位置情報を属性情報抽出部536に供給する。
属性情報復号部532は、第4の実施の形態(図20)の属性情報復号部332と同様に、復号装置530に入力されたポイントクラウド(3Dデータ)の補間後の属性情報の符号化データ(補間後の属性情報とその予測値との差分の量子化係数の符号化データ)を復号し、量子化係数を生成する。属性情報復号部532は、生成した量子化係数を逆量子化部533に供給する。
逆量子化部533は、属性情報復号部532から供給される量子化係数を取得する。逆量子化部533は、第4の実施の形態(図20)の逆量子化部333と同様に、その量子化係数を逆量子化し、差分(補間後の属性情報とその予測値との差分)を生成する。この逆量子化は、量子化部505(図26)が行う量子化の逆処理であればよい。逆量子化部533は、生成した差分を予測部534に供給する。
予測部534は、逆量子化部533から供給される差分を取得する。予測部534は、逆量子化部533から供給される差分に対応する属性情報の予測値を導出する。
予測部503(図26)の場合と同様に、この予測の方法は任意である。例えば、予測部534は、予測を行う属性情報(処理対象の属性情報)の近傍(周辺)の属性情報を用いて、その処理対象の属性情報の予測値を導出するようにしてもよい。例えば、複数の近傍の属性情報の平均値を予測値としてもよい。また、例えば、処理対象の属性情報に最も近い(最近傍の)属性情報を予測値としてもよい(属性情報を複製して予測値としてもよい)。もちろん、これらの方法以外の方法であってもよい。
なお、この場合も、属性情報は密な状態であるので、予測部534は、位置情報を用いて近傍点を探索しなくても、容易に、近傍(周辺)の属性情報を求めることができる。したがって、予測部534は、容易に、その近傍(周辺)の属性情報を用いて予測値を導出することができる。予測部534は、逆量子化部533から供給された差分と、導出した予測値とを属性情報導出部535に供給する。
属性情報導出部535は、予測部534から供給される差分と予測値とを取得する。属性情報導出部535は、それらを用いて属性情報を導出する。つまり、属性情報導出部535は、差分に予測値を加算して属性情報(補間後の属性情報)を導出する。属性情報導出部535は、導出した属性情報を属性情報抽出部536に供給する。
属性情報抽出部536は、位置情報復号部531から供給される補間されていない位置情報を取得する。また、属性情報抽出部536は、属性情報導出部535から供給される補間後の属性情報を取得する。属性情報抽出部536は、第4の実施の形態の属性情報抽出部335(図20)と同様に、その補間後の属性情報から、補間されていない位置情報(つまり点)に対応する属性情報を抽出する。属性情報抽出部536は、その補間されていない位置情報と抽出した属性情報とをポイントクラウド生成部537に供給する。
ポイントクラウド生成部537は、属性情報抽出部536から供給される位置情報および属性情報を取得する。ポイントクラウド生成部537は、第4の実施の形態のポイントクラウド生成部336(図20)と同様に、それらの位置情報をおよび属性情報を互いに関連付けてポイントクラウド(つまり補間されていないポイントクラウド)を生成し、復号装置530の外部に出力する。
なお、位置情報復号部531と属性情報復号部532とを一体化してもよい。また、予測部534および属性情報導出部535(並びに逆量子化部533)を属性情報復号部532と一体化してもよい。また、逆量子化部533は、省略してもよい。
このような構成とすることにより、復号装置530は、属性情報の符号化データを、属性情報が密な状態で復号することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に復号を行うことができる。したがって、復号装置530は、第1の実施の形態において説明した効果を得ることができる。
さらに、このような構成とすることにより、復号装置530は、予測値をより容易に導出することができる。したがって、復号装置530は、さらに、復号の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
なお、第4の実施の形態の場合と同様に、属性情報抽出部536により抽出された属性情報に対応しない位置情報が存在する場合、ポイントクラウド生成部537が、その位置情報(点)の近傍に位置する他の位置情報(点)に対応する属性情報を用いて、その位置情報(点)に対応する属性情報を生成するようにする。このようにすることにより、この場合であっても、全ての位置情報に対応する属性情報を得ることができる。
なお、これらの処理部(位置情報復号部531乃至ポイントクラウド生成部537)は、任意の構成を有する。例えば、各処理部が、上述の処理を実現する論理回路により構成されるようにしてもよい。また、各処理部が、例えばCPU、ROM、RAM等を有し、それらを用いてプログラムを実行することにより、上述の処理を実現するようにしてもよい。もちろん、各処理部が、その両方の構成を有し、上述の処理の一部を論理回路により実現し、他を、プログラムを実行することにより実現するようにしてもよい。各処理部の構成は互いに独立していてもよく、例えば、一部の処理部が上述の処理の一部を論理回路により実現し、他の一部の処理部がプログラムを実行することにより上述の処理を実現し、さらに他の処理部が論理回路とプログラムの実行の両方により上述の処理を実現するようにしてもよい。
<復号処理の流れ>
この復号装置530により実行される復号処理の流れの例を、図29のフローチャートを参照して説明する。
復号処理が開始されると、位置情報復号部531は、ステップS531において、補間されていない位置情報の符号化データを復号する。
ステップS532において、属性情報復号部532は、属性情報の符号化データ(補間後の属性情報とその予測値との差分の量子化係数の符号化データ)を復号し、量子化係数を生成する。
ステップS533において、逆量子化部533は、ステップS532において生成された量子化係数(補間後の属性情報とその予測値との差分の量子化係数)を逆量子化し、差分を生成する。
ステップS534において、予測部534は、ステップS533において生成した差分(補間後の属性情報とその予測値との差分)に対応する属性情報の予測値を導出する。例えば、予測部534は、予測を行う属性情報(処理対象の属性情報)の近傍(周辺)の属性情報を用いて、その処理対象の属性情報の予測値を導出する。
属性情報は補間されており密な状態であるので、予測部534は、位置情報を用いて近傍点を探索する等の煩雑な処理を必要とせずに、容易に、近傍の属性情報を特定し、予測に用いることができる。
ステップS535において、属性情報導出部535は、ステップS533において生成された差分(補間後の属性情報とその予測値との差分)と、ステップS534において導出された属性情報の予測値とを用いて、補間後の属性情報を導出する。つまり、属性情報導出部535は、差分に予測値を加算して、補間後の属性情報を導出する。
ステップS536において、属性情報抽出部536は、ステップS535において生成された補間後の属性情報から、ステップS531において生成された補間されていない位置情報に対応する属性情報を抽出する。
ステップS537において、ポイントクラウド生成部537は、その位置情報と属性情報とを互いに関連付け、ポイントクラウドを生成し、出力する。
ステップS537の処理が終了すると復号処理が終了する。
このように復号処理を実行することにより、属性情報の符号化データを、属性情報が密な状態で復号することができるので、近傍点の属性情報を用いて処理する際に、その近傍点の有無の場合分け等が不要になり、より容易に復号を行うことができる。したがって、復号装置530は、第1の実施の形態において説明した効果を得ることができる。
さらに、このように復号処理を実行することにより、復号装置530は、予測値をより容易に導出することができる。したがって、復号装置530は、さらに、復号の負荷や処理時間の増大を抑制することができる。これによりコストの増大をさらに抑制することができる。
<7.付記>
<制御情報>
以上の各実施の形態において説明した本技術に関する制御情報を符号化側から復号側に伝送するようにしてもよい。例えば、上述した本技術を適用することを許可(または禁止)するか否かを制御する制御情報(例えばenabled_flag)を伝送するようにしてもよい。また、例えば、上述した本技術を適用することを許可(または禁止)する範囲(例えばブロックサイズの上限若しくは下限、またはその両方、スライス、ピクチャ、シーケンス、コンポーネント、ビュー、レイヤ等)を指定する制御情報を伝送するようにしてもよい。
<周辺・近傍>
なお、本明細書において、「近傍」や「周辺」等の位置関係は、空間的な位置関係だけでなく、時間的な位置関係も含みうる。
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図30は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図30に示されるコンピュータ900において、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903は、バス904を介して相互に接続されている。
バス904にはまた、入出力インタフェース910も接続されている。入出力インタフェース910には、入力部911、出力部912、記憶部913、通信部914、およびドライブ915が接続されている。
入力部911は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部912は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部913は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部914は、例えば、ネットワークインタフェースよりなる。ドライブ915は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア921を駆動する。
以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部913に記憶されているプログラムを、入出力インタフェース910およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。RAM903にはまた、CPU901が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア921に記録して適用することができる。その場合、プログラムは、リムーバブルメディア921をドライブ915に装着することにより、入出力インタフェース910を介して、記憶部913にインストールすることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部914で受信し、記憶部913にインストールすることができる。
その他、このプログラムは、ROM902や記憶部913に、あらかじめインストールしておくこともできる。
<本技術の適用対象>
以上においては、ポイントクラウドデータの符号化・復号に本技術を適用する場合について説明したが、本技術は、これらの例に限らず、任意の規格の3Dデータの符号化・復号に対して適用することができる。つまり、上述した本技術と矛盾しない限り、符号化・復号方式等の各種処理、並びに、3Dデータやメタデータ等の各種データの仕様は任意である。また、本技術と矛盾しない限り、上述した一部の処理や仕様を省略してもよい。
また、以上においては、本技術の適用例として符号化装置100、復号装置130、符号化装置300、復号装置330、符号化装置500、および復号装置530について説明したが、本技術は、任意の構成に適用することができる。
例えば、本技術は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、およびセルラー通信による端末への配信などにおける送信機や受信機(例えばテレビジョン受像機や携帯電話機)、または、光ディスク、磁気ディスクおよびフラッシュメモリなどの媒体に画像を記録したり、これら記憶媒体から画像を再生したりする装置(例えばハードディスクレコーダやカメラ)などの、様々な電子機器に適用され得る。
また、例えば、本技術は、システムLSI(Large Scale Integration)等としてのプロセッサ(例えばビデオプロセッサ)、複数のプロセッサ等を用いるモジュール(例えばビデオモジュール)、複数のモジュール等を用いるユニット(例えばビデオユニット)、または、ユニットにさらにその他の機能を付加したセット(例えばビデオセット)等、装置の一部の構成として実施することもできる。
また、例えば、本技術は、複数の装置により構成されるネットワークシステムにも適用することもできる。例えば、本技術を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングとして実施するようにしてもよい。例えば、コンピュータ、AV(Audio Visual)機器、携帯型情報処理端末、IoT(Internet of Things)デバイス等の任意の端末に対して、画像(動画像)に関するサービスを提供するクラウドサービスにおいて本技術を実施するようにしてもよい。
なお、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、および、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
<本技術を適用可能な分野・用途>
本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。
<その他>
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の2状態を識別する際に用いる情報だけでなく、3以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の2値であってもよいし、3値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報(フラグも含む)は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。
また、符号化データ(ビットストリーム)に関する各種情報(メタデータ等)は、符号化データに関連づけられていれば、どのような形態で伝送または記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る(リンクさせ得る)ようにすることを意味する。つまり、互いに関連付けられたデータは、1つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の記録媒体(または同一の記録媒体の別の記録エリア)に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、1フレーム、またはフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。
なお、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを1つのデータにまとめるといった、複数の物を1つにまとめることを意味し、上述の「関連付ける」の1つの方法を意味する。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
また、例えば、上述したプログラムは、任意の装置において実行されるようにしてもよい。その場合、その装置が、必要な機能(機能ブロック等)を有し、必要な情報を得ることができるようにすればよい。
また、例えば、1つのフローチャートの各ステップを、1つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。さらに、1つのステップに複数の処理が含まれる場合、その複数の処理を、1つの装置が実行するようにしてもよいし、複数の装置が分担して実行するようにしてもよい。換言するに、1つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を1つのステップとしてまとめて実行することもできる。
また、例えば、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。
また、例えば、本技術に関する複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。
なお、本技術は以下のような構成も取ることができる。
(1) 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間する補間処理部と、
前記補間処理部による補間後の前記属性情報を符号化する符号化部と
を備える情報処理装置。
(2) 前記補間処理部は、前記ポイントクラウドの疎な点を補間して密にし、補間した点に対応する属性情報を生成する
(1)に記載の情報処理装置。
(3) 前記補間処理部は、補間した前記点に対応する属性情報を、前記点の近傍に位置する他の点の属性情報を用いて生成する
(2)に記載の情報処理装置。
(4) 前記補間処理部は、補間した前記点に対応する属性情報を、前記点の最も近い他の点の属性情報を複製する
(3)に記載の情報処理装置。
(5) 前記補間処理部は、補間した前記点に対応する属性情報を、前記点の近傍に位置する複数の他の点の属性情報を用いて導出する
(3)に記載の情報処理装置。
(6) 前記補間処理部は、前記ポイントクラウドのOctreeの疎なノードを補間して密にし、密なノードに対応する属性情報を生成する
(1)に記載の情報処理装置。
(7) 前記補間処理部は、前記ポイントクラウドの位置情報を符号化して復号した結果を用いて、前記属性情報を補間する
(1)に記載の情報処理装置。
(8) 前記補間処理部は、符号化前の前記ポイントクラウドの位置情報を用いて、前記属性情報を補間する
(1)に記載の情報処理装置。
(9) 前記符号化部は、前記属性情報を係数データに変換して符号化し、
前記補間処理部は、前記属性情報を前記係数データに変換する変換処理の処理単位毎に、前記属性情報を補間する
(1)に記載の情報処理装置。
(10) 前記変換処理は直交変換である
(9)に記載の情報処理装置。
(11) 前記符号化部は、前記属性情報の予測値を導出し、前記属性情報と前記予測値との差分を符号化する
(1)に記載の情報処理装置。
(12) 前記符号化部は、補間されていない前記ポイントクラウドの位置情報をさらに符号化する
(1)に記載の情報処理装置。
(13) 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間し、
補間後の前記属性情報を符号化する
情報処理方法。
(14) 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号する復号部と、
前記復号部により前記符号化データが復号されて生成された前記属性情報から、前記ポイントクラウドの位置情報に対応する属性情報を抽出する抽出部と
を備える情報処理装置。
(15) 前記符号化データは、前記ポイントクラウドの属性情報を補間して符号化することにより生成されたデータであり、
前記抽出部は、前記復号部により生成された補間後の前記属性情報から、補間されていない前記位置情報に対応する属性情報を抽出する
(14)に記載の情報処理装置。
(16) 前記抽出部により抽出された前記属性情報に、前記位置情報に対応する属性情報が含まれていない点が存在する場合、前記点の近傍に位置する他の点の属性情報を用いて前記点に対応する属性情報を生成する生成部をさらに備える
(14)に記載の情報処理装置。
(17) 前記符号化データは、前記属性情報が直交変換された係数データの符号化データであり、
前記復号部は、前記符号化データを復号して前記係数データを生成し、生成した前記係数データを逆直交変換して前記属性情報を生成する
(14)に記載の情報処理装置。
(18) 前記符号化データは、前記属性情報と前記属性情報の予測値との差分の符号化データであり、
前記復号部は、前記符号化データを復号して前記差分を生成し、前記属性情報の予測値を導出し、生成した前記差分に導出した前記予測値を加算して前記属性情報を生成する
(14)に記載の情報処理装置。
(19) 前記復号部は、補間されていない前記ポイントクラウドの位置情報の符号化データをさらに復号する
(14)に記載の情報処理装置。
(20) 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号し、
前記符号化データが復号されて生成された前記属性情報から、前記ポイントクラウドの位置情報に対応する属性情報を抽出する
情報処理方法。
100 符号化装置, 101 位置情報符号化部, 102 位置情報復号部, 103 ポイントクラウド生成部, 104 補間処理部, 105 属性情報符号化部, 106 ビットストリーム生成部, 130 復号装置, 131 位置情報復号部, 132 属性情報復号部, 133 属性情報抽出部, 134 ポイントクラウド生成部, 300 符号化装置, 301 位置情報符号化部, 302 補間処理部, 303 直交変換部, 304 量子化部, 305 属性情報符号化部, 306 ビットストリーム生成部, 330 復号装置, 331 位置情報復号部, 332 属性情報復号部, 333 逆量子化部, 334 逆直交変換部, 335 属性情報抽出部, 336 ポイントクラウド生成部, 500 符号化装置, 501 位置情報符号化部, 502 補間処理部, 503 予測部, 504 残差導出部, 505 量子化部, 506 属性情報符号化部, 507 ビットストリーム生成部, 530 復号装置, 531 位置情報復号部, 532 属性情報復号部, 533 逆量子化部, 534 予測部, 535 属性情報導出部, 536 属性情報抽出部, 537 ポイントクラウド生成部

Claims (20)

  1. 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間する補間処理部と、
    前記補間処理部による補間後の前記属性情報を符号化する符号化部と
    を備える情報処理装置。
  2. 前記補間処理部は、前記ポイントクラウドの疎な点を補間して密にし、補間した点に対応する属性情報を生成する
    請求項1に記載の情報処理装置。
  3. 前記補間処理部は、補間した前記点に対応する属性情報を、前記点の近傍に位置する他の点の属性情報を用いて生成する
    請求項2に記載の情報処理装置。
  4. 前記補間処理部は、補間した前記点に対応する属性情報を、前記点の最も近い他の点の属性情報を複製する
    請求項3に記載の情報処理装置。
  5. 前記補間処理部は、補間した前記点に対応する属性情報を、前記点の近傍に位置する複数の他の点の属性情報を用いて導出する
    請求項3に記載の情報処理装置。
  6. 前記補間処理部は、前記ポイントクラウドのOctreeの疎なノードを補間して密にし、密なノードに対応する属性情報を生成する
    請求項1に記載の情報処理装置。
  7. 前記補間処理部は、前記ポイントクラウドの位置情報を符号化して復号した結果を用いて、前記属性情報を補間する
    請求項1に記載の情報処理装置。
  8. 前記補間処理部は、符号化前の前記ポイントクラウドの位置情報を用いて、前記属性情報を補間する
    請求項1に記載の情報処理装置。
  9. 前記符号化部は、前記属性情報を係数データに変換して符号化し、
    前記補間処理部は、前記属性情報を前記係数データに変換する変換処理の処理単位毎に、前記属性情報を補間する
    請求項1に記載の情報処理装置。
  10. 前記変換処理は直交変換である
    請求項9に記載の情報処理装置。
  11. 前記符号化部は、前記属性情報の予測値を導出し、前記属性情報と前記予測値との差分を符号化する
    請求項1に記載の情報処理装置。
  12. 前記符号化部は、補間されていない前記ポイントクラウドの位置情報をさらに符号化する
    請求項1に記載の情報処理装置。
  13. 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報を補間し、
    補間後の前記属性情報を符号化する
    情報処理方法。
  14. 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号する復号部と、
    前記復号部により前記符号化データが復号されて生成された前記属性情報から、前記ポイントクラウドの位置情報に対応する属性情報を抽出する抽出部と
    を備える情報処理装置。
  15. 前記符号化データは、前記ポイントクラウドの属性情報を補間して符号化することにより生成されたデータであり、
    前記抽出部は、前記復号部により生成された補間後の前記属性情報から、補間されていない前記位置情報に対応する属性情報を抽出する
    請求項14に記載の情報処理装置。
  16. 前記抽出部により抽出された前記属性情報に、前記位置情報に対応する属性情報が含まれていない点が存在する場合、前記点の近傍に位置する他の点の属性情報を用いて前記点に対応する属性情報を生成する生成部をさらに備える
    請求項14に記載の情報処理装置。
  17. 前記符号化データは、前記属性情報が直交変換された係数データの符号化データであり、
    前記復号部は、前記符号化データを復号して前記係数データを生成し、生成した前記係数データを逆直交変換して前記属性情報を生成する
    請求項14に記載の情報処理装置。
  18. 前記符号化データは、前記属性情報と前記属性情報の予測値との差分の符号化データであり、
    前記復号部は、前記符号化データを復号して前記差分を生成し、前記属性情報の予測値を導出し、生成した前記差分に導出した前記予測値を加算して前記属性情報を生成する
    請求項14に記載の情報処理装置。
  19. 前記復号部は、補間されていない前記ポイントクラウドの位置情報の符号化データをさらに復号する
    請求項14に記載の情報処理装置。
  20. 3次元形状のオブジェクトを点群として表現するポイントクラウドの属性情報の符号化データを復号し、
    前記符号化データが復号されて生成された前記属性情報から、前記ポイントクラウドの位置情報に対応する属性情報を抽出する
    情報処理方法。
JP2019000941A 2019-01-08 2019-01-08 情報処理装置および方法 Pending JP2022047546A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019000941A JP2022047546A (ja) 2019-01-08 2019-01-08 情報処理装置および方法
PCT/JP2019/050770 WO2020145143A1 (ja) 2019-01-08 2019-12-25 情報処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019000941A JP2022047546A (ja) 2019-01-08 2019-01-08 情報処理装置および方法

Publications (1)

Publication Number Publication Date
JP2022047546A true JP2022047546A (ja) 2022-03-25

Family

ID=71521112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019000941A Pending JP2022047546A (ja) 2019-01-08 2019-01-08 情報処理装置および方法

Country Status (2)

Country Link
JP (1) JP2022047546A (ja)
WO (1) WO2020145143A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024029348A1 (ja) * 2022-08-01 2024-02-08 ソニーグループ株式会社 情報処理装置および方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230370637A1 (en) * 2020-10-07 2023-11-16 Sony Group Corporation Image processing device and method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170214943A1 (en) * 2016-01-22 2017-07-27 Mitsubishi Electric Research Laboratories, Inc. Point Cloud Compression using Prediction and Shape-Adaptive Transforms
EP3293702B1 (en) * 2016-09-13 2020-04-29 Dassault Systèmes Compressing a signal that represents a physical attribute

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024029348A1 (ja) * 2022-08-01 2024-02-08 ソニーグループ株式会社 情報処理装置および方法

Also Published As

Publication number Publication date
WO2020145143A1 (ja) 2020-07-16

Similar Documents

Publication Publication Date Title
US11910026B2 (en) Image processing apparatus and method
WO2020012967A1 (ja) 画像処理装置および方法
US11943457B2 (en) Information processing apparatus and method
WO2019198523A1 (ja) 画像処理装置および方法
WO2020012968A1 (ja) 画像処理装置および方法
US11399189B2 (en) Image processing apparatus and method
WO2020071114A1 (ja) 画像処理装置および方法
WO2020145143A1 (ja) 情報処理装置および方法
WO2021140930A1 (ja) 情報処理装置および方法
US20220353492A1 (en) Information processing device and method
WO2020071115A1 (ja) 画像処理装置および方法
WO2021002214A1 (ja) 情報処理装置および方法
WO2021010200A1 (ja) 情報処理装置および方法
WO2021010134A1 (ja) 情報処理装置および方法
US11790567B2 (en) Information processing apparatus and method
WO2022145214A1 (ja) 情報処理装置および方法
WO2024084952A1 (ja) 情報処理装置および方法
WO2021140928A1 (ja) 情報処理装置および方法
WO2020262020A1 (ja) 情報処理装置および方法
US20230177735A1 (en) Information processing apparatus and method
WO2023127513A1 (ja) 情報処理装置および方法
JP2022051968A (ja) 情報処理装置および方法