JP2024008353A - 点群復号装置、点群復号方法及びプログラム - Google Patents

点群復号装置、点群復号方法及びプログラム Download PDF

Info

Publication number
JP2024008353A
JP2024008353A JP2022110162A JP2022110162A JP2024008353A JP 2024008353 A JP2024008353 A JP 2024008353A JP 2022110162 A JP2022110162 A JP 2022110162A JP 2022110162 A JP2022110162 A JP 2022110162A JP 2024008353 A JP2024008353 A JP 2024008353A
Authority
JP
Japan
Prior art keywords
trisoup
node
synthesis unit
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022110162A
Other languages
English (en)
Inventor
恭平 海野
Kyohei UNNO
圭 河村
Kei Kawamura
賢史 小森田
Masashi Komorida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2022110162A priority Critical patent/JP2024008353A/ja
Priority to PCT/JP2023/008641 priority patent/WO2024009561A1/ja
Publication of JP2024008353A publication Critical patent/JP2024008353A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】Trisoup時に使用できるノード形状の種類を増やすことができ、符号化効率の向上が期待できる。【解決手段】本発明に係る点群復号装置200は、Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、頂点位置の取り得る値の範囲に基づいて頂点位置を復号するように構成されている近似表面合成部2030を備えることを特徴とする。【選択図】図2

Description

本発明は、点群復号装置、点群復号方法及びプログラムに関する。
非特許文献1では、Trisoupという幾何情報を復号する技術が開示されている。
G-PCC Future Enhancement、ISO/IEC JTC1/SC29/WG11 N19328
非特許文献1の方法では、Trisoupで復号処理を行う際のノードサイズとして立方体のみが想定されている。また、非特許文献1には、直方体のノードサイズも許容することで符号化効率を高める技術が開示されているが、両者を組み合わせて使用することができないという問題点があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、Trisoup時に使用できるノード形状の種類を増やすことができ、符号化効率の向上が期待できる点群復号装置、点群復号方法及びプログラムを提供することを目的とする。
本発明の第1の特徴は、点群復号装置であって、Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、前記頂点位置の取り得る値の範囲に基づいて前記頂点位置を復号するように構成されている近似表面合成部を備えることを要旨とする。
本発明の第2の特徴は、点群復号方法であって、Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、前記頂点位置の取り得る値の範囲に基づいて前記頂点位置を復号する工程を有することを要旨とする。
本発明の第3の特徴は、コンピュータを、点群復号装置として機能させるプログラムであって、前記点群復号装置は、Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、前記頂点位置の取り得る値の範囲に基づいて前記頂点位置を復号するように構成されている近似表面合成部を備えることを要旨とする。
本発明によれば、ノードサイズが直方体である場合も、Trisoupによる復号処理を実現することができるため、Trisoup時に使用できるノード形状の種類を増やすことができ、符号化効率の向上が期待できる点群復号装置、点群復号方法及びプログラムを提供することができる。
図1は、一実施形態に係る点群処理システム10の構成の一例を示す図である。 図2は、一実施形態に係る点群復号装置200の機能ブロックの一例を示す図である。 図3は、一実施形態に係る点群復号装置200の幾何情報復号部2010で受信する符号化データ(ビットストリーム)の構成の一例を示す図である。 図4は、GPS2011のシンタックス構成の一例を示す図である。 図5は、GSH2012のシンタックス構成の一例を示す図である。 図6は、GSH2012のシンタックス構成の一例を示す図である。 図7は、GSH2012のシンタックス構成の一例を示す図である。 図8は、一実施形態に係る点群復号装置200のツリー合成部2020における処理の一例を示すフローチャートである 図9は、一実施形態に係る点群復号装置200のツリー合成部2020における処理の一例を示すフローチャートである。 図10は、一実施形態に係る点群復号装置200の近似表面合成部2030の処理の一例を示すフローチャートである。 図11Aは、図10におけるステップS1006の処理の一例を説明するための図である。 図11Bは、図10におけるステップS1006の処理の一例を説明するための図である。 図12Aは、図10におけるステップS1006の処理の一例を説明するための図である。 図12Bは、図10におけるステップS1006の処理の一例を説明するための図である。 図13は、図10におけるステップS1002で使用する頂点の復号処理の一例を示すフローチャートである。 図14は、図13におけるステップS1304の処理の一例を示すフローチャートである。 図15は、本実施形態に係る点群符号化装置100の機能ブロックの一例について示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
(第1実施形態)
以下、図1~図15を参照して、本発明の第1実施形態に係る点群処理システム10について説明する。図1は、本実施形態に係る実施形態に係る点群処理システム10を示す図である。
図1に示すように、点群処理システム10は、点群符号化装置100及び点群復号装置200を有する。
点群符号化装置100は、入力点群信号を符号化することによって符号化データ(ビットストリーム)を生成するように構成されている。点群復号装置200は、ビットストリームを復号することによって出力点群信号を生成するように構成されている。
なお、入力点群信号及び出力点群信号は、点群内の各点の位置情報と属性情報とから構成される。属性情報は、例えば、各点の色情報や反射率である。
ここで、かかるビットストリームは、点群符号化装置100から点群復号装置200に対して伝送路を介して送信されてもよい。また、ビットストリームは、記憶媒体に格納された上で、点群符号化装置100から点群復号装置200に提供されてもよい。
(点群復号装置200)
以下、図2を参照して、本実施形態に係る点群復号装置200について説明する。図2は、本実施形態に係る点群復号装置200の機能ブロックの一例について示す図である。
図2に示すように、点群復号装置200は、幾何情報復号部2010と、ツリー合成部2020と、近似表面合成部2030と、幾何情報再構成部2040と、逆座標変換部2050と、属性情報復号部2060と、逆量子化部2070と、RAHT部2080と、LoD算出部2090と、逆リフティング部2100と、逆色変換部2110とを有する。
幾何情報復号部2010は、点群符号化装置100から出力されるビットストリームのうち、幾何情報に関するビットストリーム(幾何情報ビットストリーム)を入力とし、シンタックスを復号するように構成されている。
復号処理は、例えば、コンテクスト適応二値算術復号処理である。ここで、例えば、シンタックスは、位置情報の復号処理を制御するための制御データ(フラグやパラメータ)を含む。
ツリー合成部2020は、幾何情報復号部2010によって復号された制御データ及び後述するツリー内のどのノードに点群が存在するかを示すoccupancy codeを入力として、復号対象空間内のどの領域に点が存在するかというツリー情報を生成するように構成されている。
なお、occupancy codeの復号処理をツリー合成部2020内部で行うよう構成されていてもよい。
本処理は、復号対象空間を直方体で区切り、occupancy codeを参照して各直方体内に点が存在するかを判断し、点が存在する直方体を複数の直方体に分割し、occupancy codeを参照するという処理を再帰的に繰り返すことで、ツリー情報を生成することができる。
ここで、かかるoccupancy codeの復号に際して、後述するインター予測を用いてもよい。
本実施形態では、上述の直方体を常に立方体として8分木分割を再帰的に行う「Octree」と呼ばれる手法、及び、8分木分割に加え、4分木分割及び2分木分割を行う「QtBt」と呼ばれる手法を使用することができる。QtBt」を使用するか否かは、制御データとして点群符号化装置100側から伝送される。
なお、本実施形態では、「Octree」によって上述の立方体が1×1×1のサイズになるまで分割を行うことで幾何情報を復号する方法を、特に「Octreeのみ」と呼ぶ。
また、「Octree」に「QtBt」を組み合わせて使用した場合でも、上記同様に「Octree」及び「QtBt」のみで上述の直方体が1×1×1のサイズになるまで分割を行うことで幾何情報を復号する方法についても、「Octreeのみ」と呼んでもよい。
或いは、制御データによってPredictive codingを使用するように指定された場合、ツリー合成部2020は、点群符号化装置100において決定した任意のツリー構成に基づいて各点の座標を復号するように構成されている。
近似表面合成部2030は、ツリー合成部2020によって生成されたツリー情報を用いて近似表面情報を生成し、かかる近似表面情報に基づいて点群を復号するように構成されている。
近似表面情報は、例えば、物体の3次元点群データを復号する際等において、点群が物体表面に密に分布しているような場合に、個々の点群を復号するのではなく、点群の存在領域を小さな平面で近似して表現したものである。
具体的には、近似表面合成部2030は、例えば、「Trisoup」と呼ばれる手法で、近似表面情報を生成し、点群を復号することができる。「Trisoup」の具体的な処理例については後述する。また、Lidar等で取得した疎な点群を復号する場合は、本処理を省略することができる。
幾何情報再構成部2040は、ツリー合成部2020によって生成されたツリー情報及び近似表面合成部2030によって生成された近似表面情報を元に、復号対象の点群データの各点の幾何情報(復号処理が仮定している座標系における位置情報)を再構成するように構成されている。
逆座標変換部2050は、幾何情報再構成部2040によって再構成された幾何情報を入力として、復号処理が仮定している座標系から、出力点群信号の座標系に変換を行い、位置情報を出力するように構成されている。
属性情報復号部2060は、点群符号化装置100から出力されるビットストリームのうち、属性情報に関するビットストリーム(属性情報ビットストリーム)を入力とし、シンタックスを復号するように構成されている。
復号処理は、例えば、コンテクスト適応二値算術復号処理である。ここで、例えば、シンタックスは、属性情報の復号処理を制御するための制御データ(フラグ及びパラメータ)を含む。
また、属性情報復号部2060は、復号したシンタックスから、量子化済み残差情報を復号するように構成されている。
逆量子化部2070は、属性情報復号部2060によって復号された量子化済み残差情報と、属性情報復号部2060によって復号された制御データの一つである量子化パラメータとを元に、逆量子化処理を行い、逆量子化済み残差情報を生成するように構成されている。
逆量子化済み残差情報は、復号対象の点群の特徴に応じて、RAHT部2080及びLoD算出部2090のいずれかに出力される。いずれに出力されるかは、属性情報復号部2060によって復号される制御データによって指定される。
RAHT部2080は、逆量子化部2070によって生成された逆量子化済み残差情報及び幾何情報再構成部2040によって生成された幾何情報を入力とし、RAHT(Region Adaptive Hierarchical Transform)と呼ばれるHaar変換(復号処理においては、逆Haar変換)の一種を用いて、各点の属性情報を復号するように構成されている。RAHTの具体的な処理としては、例えば、非特許文献1に記載の方法を用いることができる。
LoD算出部2090は、幾何情報再構成部2040によって生成された幾何情報を入力とし、LoD(Level of Detail)を生成するように構成されている。
LoDは、ある点の属性情報から、他のある点の属性情報を予測し、予測残差を符号化或いは復号するといった予測符号化を実現するための参照関係(参照する点及び参照される点)を定義するための情報である。
言い換えると、LoDは、幾何情報に含まれる各点を複数のレベルに分類し、下位のレベルに属する点については上位のレベルに属する点の属性情報を用いて属性を符号化或いは復号するといった階層構造を定義した情報である。
LoDの具体的な決定方法としては、例えば、上述の非特許文献1に記載の方法を用いてもよい。
逆リフティング部2100は、LoD算出部2090によって生成されたLoD及び逆量子化部2070によって生成された逆量子化済み残差情報を用いて、LoDで規定した階層構造に基づいて各点の属性情報を復号するように構成されている。逆リフティングの具体的な処理としては、例えば、上述の非特許文献1に記載の方法を用いることができる。
逆色変換部2110は、復号対象の属性情報が色情報であり且つ点群符号化装置100側で色変換が行われていた場合に、RAHT部2080又は逆リフティング部2100から出力される属性情報に逆色変換処理を行うように構成されている。かかる逆色変換処理の実行の有無については、属性情報復号部2060によって復号された制御データによって決定される。
点群復号装置200は、以上の処理により、点群内の各点の属性情報を復号して出力するように構成されている。
(幾何情報復号部2010)
以下、図3~図7を用いて幾何情報復号部2010で復号される制御データについて説明する。
図3は、幾何情報復号部2010で受信する符号化データ(ビットストリーム)の構成の一例である。
第1に、ビットストリームは、GPS2011を含んでいてもよい。GPS2011は、ジオメトリパラメータセットとも呼ばれ、幾何情報の復号に関する制御データの集合である。具体例については後述する。各GPS2011は、複数のGPS2011が存在する場合に個々を識別するためのGPS id情報を少なくとも含む。
第2に、ビットストリームは、GSH2012A/2012Bを含んでいてもよい。GSH2012A/2012Bは、ジオメトリスライスヘッダ或いはジオメトリデータユニットヘッダとも呼ばれ、後述するスライスに対応する制御データの集合である。以降では、スライスという呼称を用いて説明するが、スライスをデータユニットと読み替えることもできる。具体例については後述する。GSH2012A/2012Bは、各GSH2012A/2012Bに対応するGPS2011を指定するためのGPS id情報を少なくとも含む。
第3に、ビットストリームは、GSH2012A/2012Bの次に、スライスデータ2013A/2013Bを含んでいてもよい。スライスデータ2013A/2013Bには、幾何情報を符号化したデータが含まれている。スライスデータ2013A/2013Bの一例としては、後述するoccupancy codeが挙げられる。
以上のように、ビットストリームは、各スライスデータ2013A/2013Bに、1つずつGSH2012A/2012B及びGPS2011が対応する構成となる。
上述のように、GSH2012A/2012Bにて、どのGPS2011を参照するかをGPS id情報で指定するため、複数のスライスデータ2013A/2013Bに対して共通のGPS2011を用いることができる。
言い換えると、GPS2011は、スライスごとに必ずしも伝送する必要がない。例えば、図3のように、GSH2012B及びスライスデータ2013Bの直前では、GPS2011を符号化しないようなビットストリームの構成とすることもできる。
なお、図3の構成は、あくまで一例である。各スライスデータ2013A/2013Bに、GSH2012A/2012B及びGPS2011が対応する構成となっていれば、ビットストリームの構成要素として、上述以外の要素が追加されてもよい。
例えば、図3に示すように、ビットストリームは、シーケンスパラメータセット(SPS)2001を含んでいてもよい。また、同様に、伝送に際して、図3と異なる構成に整形されてもよい。更に、後述する属性情報復号部2060で復号されるビットストリームと合成して単一のビットストリームとして伝送されてもよい。
図4は、GPS2011のシンタックス構成の一例である。
なお、以下で説明するシンタックス名は、あくまで一例である。以下で説明したシンタックスの機能が同様であれば、シンタックス名は異なっていても差し支えない。
GPS2011は、各GPS2011を識別するためのGPS id情報(gps_geom_parameter_set_id)を含んでもよい。
なお、図4のDescriptor欄は、各シンタックスが、どのように符号化されているかを意味している。ue(v)は、符号無し0次指数ゴロム符号であることを意味し、u(1)は、1ビットのフラグであることを意味する。
GPS2011は、近似表面合成部2030でTrisoupを使用するか否かを制御するフラグ(trisoup_enabled_flag)を含んでもよい。
例えば、trisoup_enabled_flagの値が「0」の時はTrisoupを使用しないと定義し、trisoup_enabled_flagの値が「1」の時はTrisoupを使用すると定義してもよい。
幾何情報復号部2020は、Trisoupを使用するとき、すなわち、trisoup_enabled_flagの値が「1」の時、追加で以下のシンタックスを復号するように構成されていてもよい。
なお、trisoup_enabled_flagは、GPS2011ではなくSPS2001に含まれていてもよい。
GPS2011は、複数レベルでのTrisoupを許可するか否かを制御するフラグ(trisoup_multilevel_enabled_flag、第1フラグ)を含んでもよい。
例えば、trisoup_multilevel_enabled_flagの値が「0」の時は複数レベルでのTrisoupを許可しない、すなわち、単一のレベルでのTrisoupを行うと定義し、trisoup_multilevel_enabled_flagの値が「1」の時は複数レベルでのTrisoupを許可すると定義してもよい。
なお、当該シンタックスがGPS2011に含まれない場合、当該シンタックスの値を単一のレベルでのTrisoupを行う場合の値、すなわち、「0」とみなしてよい。
なお、trisoup_multilevel_enabled_flagは、GPS2011ではなくSPS2001に含まれるよう定義してもよい。この場合、SPS2001にtrisoup_multilevel_enabled_flagが含まれていない場合、当該シンタックスの値を単一のレベルでのTrisoupを行う場合の値、すなわち、「0」とみなしてよい。
図5は、GSH2012のシンタックス構成の一例である。なお、前述の通り、GSHは、GDUH(Geometry Data Unit Header)とも呼ばれる。
幾何情報復号部2020は、複数レベルでのTrisoupを許可するとき、すなわち、trisoup_multilevel_enabled_flagの値が「1」の時、追加で以下のシンタックスを復号するように構成されていてもよい。
GSH2012は、複数レベルでのTrisoupを許可するとき、スライス内でOctreeのみとTrisoupとを適応的に選択するモードを有効にするフラグ(adaptive_octree_enabled_flag)を含んでもよい。
例えば、当該フラグの値が「1」の場合はOctreeとTrisoupとを適応的に選択するモード(以降、「適応Octreeモード」と呼ぶ)が有効であり、当該フラグの値が「0」の場合は適応Octreeモードが無効であると定義してもよい。
また、GSH2012に当該フラグが含まれない場合、当該フラグの値を「0」、すなわち、適応Octreeモードが無効であると暗黙的にみなしてもyい。
GSH2012は、複数レベルでのTrisoupを許可するとき、Trisoupノードサイズの最大値を規定するシンタックス(log2_trisoup_max_node_size_minus2)を含んでもよい。
当該シンタックスは、実際のTrisoupノードサイズの最大値について、2を底とする対数に変換した値として表現されていてもよい。更に、当該シンタックスは、実際のTrisoupノードサイズの最大値について、2を底とする対数に変換した後に2を引いた後の値として表現されていてもよい。
GSH2012は、複数レベルでのTrisoupを許可するとき、Trisoupノードサイズの最小値を規定するシンタックス(log2_trisoup_min_node_size_minus2)を含んでもよい。
当該シンタックスは、実際のTrisoupノードサイズの最小値について、2を底とする対数に変換した値として表現されていてもよい。更に、当該シンタックスは、実際のTrisoupノードサイズの最小値を4(=2^2)とし、2を底とする対数に変換した後に2を引いた後の値として表現されていてもよい。
また、当該シンタックスの値は、必ず0以上且つlog2_trisoup_max_node_size_minus2以下となるように制約されていてもよい。
また、この時、図5に示すようにtrisoup_depthをtrisoup_depth=log2_trisoup_max_node_size_minus2-log2_trisoup_min_node_size_minus2+1と定義してもよい。
また、最小Trisoupノードサイズ及び最大Trisoupノードサイズを直接復号する代わりに、後述のOctree処理における最大Trisoupノードサイズ及び最小Trisoupノードサイズに対応するDepth値を復号してもよい。
例えば、最大Depth(全ノードが1×1×1のサイズになるDepth)が10の場合、最小Trisoupノードサイズを4(=2)、最大Trisoupノードサイズを16(=2)としたい場合は、最小Trisoupノードサイズに対応するDepth値として8、最大Trisoupノードサイズに対応するDepth値として6をそれぞれ復号してもよい。
幾何情報復号部2020は、複数レベルでのTrisoupを許可しないとき、すなわち、trisoup_multilevel_enabled_flagの値が「0」の時、追加で以下のシンタックスを復号するように構成されていてもよい。
GSH2012は、複数レベルでのTrisoupを許可しないとき、かつ、Trisoupを使用するとき、Trisoupノードサイズを規定するシンタックス(log2_trisoup_node_size_minus2)を含んでもよい。
当該シンタックスは、実際のTrisoupノードサイズについて、2を底とする対数に変換した値として表現されていてもよい。更に、当該シンタックスは、実際のTrisoupノードサイズについて、2を底とする対数に変換した後に2を引いた後の値として表現されていてもよい。
また、この時、図5に示すようにtrisoup_depthをtrisoup_depth=1と定義してもよい。
GSH2012は、Trisoupを使用するとき、復号点のサンプリング間隔を制御するシンタックス(trisoup_sampling_value_minus1)を含んでもよい。当該シンタックスの具体的な定義は、例えば、上述の非特許文献1に記載の定義と同様とすることができる。
GSH2012は、Trisoupを使用するとき、かつ、複数レベルでのTrisoupを許可するとき、階層i(i=0,...,trisoup_depth-1)ごとにユニークセグメントが対象階層に存在するか否かを示すフラグ(unique_segments_exist_flag[i])を含んでもよい。
例えば、unique_segments_exist_flag[i]の値が「1」の場合は、階層iに少なくとも1つ以上のユニークセグメントが存在することを意味する。また、unique_segments_exist_flag[i]の値が「0」の場合は、階層iにユニークセグメントが1つも存在しないことを意味する。
GSH2012は、階層i(i=0,...,trisoup_depth-1)ごとにユニークセグメントが対象階層に存在する場合、すなわち、unique_segments_exist_flag[i]の値が「1」の場合、追加で対象階層のユニークセグメント数を示すシンタックスのビット数を示すシンタックス(num_unique_segments_bits_minus1[i])及び対象階層のユニークセグメント数を示すシンタックス(num_unique_segments_minus1[i])を含んでもよい。
ここで、num_unique_segments_bits_minus1[i]及びnum_unique_segments_minus1[i]の両方について、それぞれ本来の値から「1」を引いた値をシンタックスの値として符号化してもよい。
図6は、GSH2012のシンタックス構成の一例である。以降では、図5との差分のみ説明する。
図6に示す通り、適応Octreeモードが有効な場合、すなわち、adaptive_octree_enabled_flagの値が「1」の場合、Trisoupノードサイズの最小値を規定するシンタックス(log2_trisoup_min_node_size_minus2)の復号を省略してもよい。その際、Trisoupノードサイズの最小値は予め定めた所定の値とみなしてよい。例えば、所定の値は「0」(すなわち、2=1)と見なしてもよい。
以上のように、幾何情報復号部2010は、同一スライス内或いははデータユニット内においてOctreeのみ及びTrisoupの両方を使用可能とするか否かを制御するフラグを復号し、当該フラグの値が「使用可能」を示している場合、暗黙的に最小Trisoupノードサイズの値を1×1×1とみなすように構成されていてもよい。
以上のような構成とすることで、不要なシンタックスの伝送を排除し、符号量を削減できる。
図7は、GSH2012のシンタックス構成の一例である。以降では、図5との差分のみ説明する。
図7に示すように、Trisoupノードサイズの最大値を規定するシンタックス及びTrisoupノードサイズの最小値を規定するシンタックスのそれぞれについて、それぞれ2を底とする対数に変換した後の値を伝送することとしてもよい。この時、それぞれのシンタックスの最小値を「0」(すなわち、2=1)と規定してもよい。
以上のように、幾何情報復号部2010は、最小Trisoupノードサイズを復号し、前記最小Trisoupノードサイズの取り得る最小値は1×1×1に相当する値にとなるよう構成されていてもよい。
このような構成とすることで、Trisoupのみを使用する場合の処理を共通化できる。
(ツリー合成部2020)
以下、図8~図9を用いてツリー合成部2020の処理について説明する。図6は、ツリー合成部2020における処理の一例を示すフローチャートである。なお、以下では「Octree」を使用してツリーを合成する場合の例について説明する。
ステップS801において、ツリー合成部2020は、全てのDepthの処理が完了したかどうかを確認する。なお、Depth数は、点群符号化装置100から点群復号装置200に伝送するビットストリーム内に制御データとして含まれていてもよい。
ツリー合成部2020は、対象Depthのノードサイズを算出する。「Octree」の場合、最初のDepthのノードサイズは、「2のDepth数乗」と定義されてもよい。すなわち、Depth数をNとする場合、最初のDepthのノードサイズは、2のN乗と定義されてもよい。
また、2番目以降のDepthでのノードサイズは、Nの数を1つずつ減じていくことで定義されてもよい。すなわち、2番目のDepthのノードサイズは、「2の(N-1)乗」として定義され、3番目のDepthのノードサイズは、「2の(N-2)乗」として定義され、・・・と定義されてもよい。
或いは、ノードサイズは、常に2のべき乗で定義されるため、単純に指数部分(N、N-1、N-2、等)の値をノードサイズと考えてもよい。以降の説明では、ノードサイズとは、ノードの1辺の長さの指数部分の値を指すこととする。
なお、以降では簡単のため、ノード形状が立方体の場合、すなわち、ノードの全ての辺の長さが等しい場合を例に説明する。
QtBtを用いる場合、すなわち、ノード形状が直方体になり、ノードの各辺の長さが軸方向(x、y、z)毎に異なる場合、3方向のうち最も短い辺の長さをノードサイズと考えてもよい。同様に、3方向のうち最も長い辺の長さをノードサイズと考えてもよい。
ここで、Trisoupを使用するか否かを制御するフラグ(trisoup_enabled_flag)がTrisoupを使用することを示している場合、すなわち、trisoup_enabled_flagの値が「1」の時は、ツリー合成部2020は、処理するDepth数を、Trisoupノードサイズの最小値を規定するシンタックス(log2_trisoup_min_node_size_minus2)又はTrisoupノードサイズを規定するシンタックス(log2_trisoup_node_size_minus2)の値に基づいて変化させてもよい。かかる場合、例えば、以下のように定義してもよい。
処理Depth数=全Depth数-(最小の)Trisoupノードサイズ
ここで、最小のTrisoupノードサイズについては、例えば、(log2_trisoup_min_node_size_minus2+2)で定義できる。同様に、Trisoupノードサイズについては、(log2_trisoup_node_size_minus2+2)で定義できる。
この場合、全ての処理Depth数の処理が完了した場合は、ツリー合成部2020は、ステップS809へ進み、そうでない場合は、ツリー合成部2020は、ステップS802へ進む。
言い換えると、(処理Depth数-n)=0の場合は、ツリー合成部2020は、ステップS809へ進み、(処理Depth数-n)>0の場合は、ツリー合成部2020は、ステップS802へ進む。
また、ツリー合成部2020は、ステップS809へ進む際のノードサイズ(N-処理Depth数)を持つ全てのノードには、Trisoupが適用されると判定してもよい。
ここで、複数レベルでのTrisoupを許可されている場合、すなわち、trisoup_multilevel_enabled_flagの値が「1」の時、且つ、適応Octreeモードが有効な場合、すなわち、adaptive_octree_enabled_flagの値が「1」の時は、ステップS801では、以下の様に構成されていてもよい。
具体的には、全てのDepthの処理が完了した場合は、ツリー合成部2020は、ステップS809へ進み、全てのDepthの処理が完了していない場合は、ツリー合成部2020は、ステップS802へ進む。
言い換えると、対象Depthがn番目のDepthの時、(N-n)=0の場合は、ツリー合成部2020は、ステップS809へ進み、(N-n)>0の場合は、ツリー合成部2020は、ステップS802へ進む。
ステップS802において、ツリー合成部2020は、対象Depthにて後述するTrisoup_applied_flagを復号する必要があるか否かを判定する。
例えば、「複数レベルでのTrisoupが許可(trisoup_multilevel_enabled_flagの値が「1」)」で、且つ、「対象Depthのノードサイズ(N-n)が最大のTrisoupノードサイズ以下」の場合に、ツリー合成部2020は、「Trisoup_applied_flagの復号が必要である」と判定してもよい。
例えば、「複数レベルでのTrisoupが許可(trisoup_multilevel_enabled_flagの値が「1」)」で、且つ、「対象Depthのノードサイズ(N-n)が最大のTrisoupノードサイズ以下」で、且つ、「対象Depthのノードサイズ(N-n)が最小のTrisoupノードサイズ以上」の場合に、ツリー合成部2020は、「Trisoup_applied_flagの復号が必要である」と判定してもよい。
また、ツリー合成部2020は、上述の条件が満たされない場合、「Trisoup_applied_flagの復号が必要ない」と判定してもよい。
ここで、最大のTrisoupノードサイズについては、例えば、(log2_trisoup_max_node_size_minus3+2)で定義できる。同様に、最小のTrisoupノードサイズについては、例えば、(log2_trisoup_min_node_size_minus2+2)で定義できる。
上述の判定が完了したら、ツリー合成部2020は、ステップS803へ移る。
ステップS803において、ツリー合成部2020は、対象Depthに含まれる全てのノードの処理が完了したかどうかを判定する。
対象Depthの全てのノードの処理が完了したと判定した場合、ツリー合成部2020は、ステップS801へ移り、次のDepthの処理を行う。
一方、対象Depthの全てのノードの処理が完了していない場合、ツリー合成部2020は、ステップS804へ移る。
ステップS804において、ツリー合成部2020は、ステップS802で判定したTrisoup_applied_flagの復号の要否について確認する。
Trisoup_applied_flagの復号が必要であると判定されている場合は、ツリー合成部2020は、ステップS805へ進み、Trisoup_applied_flagの復号が必要でないと判定されている場合は、ツリー合成部2020は、ステップS808へ移る。
ステップS805において、ツリー合成部2020は、Trisoup_applied_flagを復号する。
Trisoup_applied_flagは、対象ノードにTrisoupを適用するか否かを示す1ビットのフラグ(第2フラグ)である。例えば、かかるフラグの値が「1」の時に対象ノードにTrisoupを適用すると定義し、かかるフラグの値が「0」の時に対象ノードにTrisoupを適用しないと定義してもよい。
ツリー合成部2020は、Trisoup_applied_flagを復号した後、ステップS806へ移る。
ステップS806において、ツリー合成部2020は、ステップS805で復号したTrisoup_applied_flagの値を確認する。
対象ノードにTrisoupを適用する場合、すなわち、Trisoup_applied_flagの値が「1」の場合は、ツリー合成部2020は、ステップS807へ移る。
対象ノードにTrisoupを適用しない場合、すなわち、Trisoup_applied_flagの値が「0」の場合は、ツリー合成部2020は、ステップS808へ移る。
ステップS807において、ツリー合成部2020は、対象ノードを、Trisoupを適用するノード、すなわち、Trisoupノードとして記憶する。かかる対象ノードに対しては、これ以上、「Octree」によるノードの分割を適用しないこととする。その後、ツリー合成部2020は、ステップS803に進み、次のノードの処理へ移る。
ステップS808において、ツリー合成部2020は、occpancy codeと呼ばれる情報を復号する。
occpancy codeは、「Octree」の場合は、対象ノードをx、y、z軸方向にそれぞれ半分に分割して、8つのノード(子ノードと呼ぶ)に分割した際に、それぞれの子ノード内に復号対象の点が含まれているか否かを示す情報である。
例えば、occpancy codeは、各子ノードに対して1ビットの情報を割り当て、かかる1ビットの情報が「1」の場合は、かかる子ノード内に復号対象の点が含まれると定義され、かかる1ビットの情報が「0」の場合は、かかる子ノード内に復号対象の点が含まれないと定義されてもよい。
ツリー合成部2020は、かかるoccpancy codeを復号する際に、各子ノードに復号対象の点が存在する確率を予め推定し、その確率に基づいて各子ノードに対応するビットをエントロピー復号してもよい。
同様に、点群符号化装置100においては、エントロピー符号化してもよい。
以上のように、点群復号装置200は、同一スライス内或いはデータユニット内において、Octreeのみ及びTrisoupの両方を使用可能とし、ノード毎にOctreeのみ及びTrisoupのいずれかの方法で、点の幾何情報を復号するように構成されていてもよい。
以上のような構成とすることで、局所的に幾何構造が細かい部分はOctreeのみ、平面で近似可能な箇所はTrisoupといったように切り替えが可能となり、効率の良い符号化が可能となる。
また、以上のように、ツリー合成部2020は、空間を再帰的に分割するOctree分割を行い、所定の最小Trisoupノードサイズより小さくなった全てのノードについて、幾何情報をOctreeのみによって復号するように構成されていてもよい。
また、以上のように、ツリー合成部2020は、適応Octreeモードが有効な場合、所定の最小Trisoupノードサイズの各ノードについて、当該ノードにTrisoupを適用するか否かを示すフラグ(Trisoup_applied_flag)を復号するように構成されていてもよい。
また、以上のように、幾何情報復号部2010は、同一スライス内或いはデータユニット内において、OctreeのみとTrisoupの両方を使用可能とするか否かを制御するフラグを復号し、ツリー合成部2020は、当該フラグの値が「使用可能」を示している場合、所定の最小Trisoupノードサイズより小さくなった全てのノードについて、幾何情報をOctreeのみによって復号するように構成されていてもよい。
以上のような構成とすることで、Trisoupノードサイズの最小時は非特許文献1から変更しなくてもOctreeのみとの併用が可能となるため、Trisoup自体の処理の変更量が少なくなり、設計が容易になるという利点がある。
図9は、ツリー合成部2020における処理の一例を示すフローチャートである。図8と同様の処理を行う箇所については、同一の符号を付しており、説明は省略する。
ステップS901では、全ての処理Depth数の処理が完了した場合は、ツリー合成部2020は、ステップS809へ進み、そうでない場合は、ツリー合成部2020は、ステップS802へ進む。
ここで、複数レベルでのTrisoupが許可(trisoup_multilevel_enabled_flagの値が「1」)されている時は、ツリー合成部2020は、処理するDepth数を、Trisoupノードサイズの最小値を規定するシンタックス(図7に示すlog2_trisoup_node_size)の値に基づいて変化させてもよい。この時、ツリー合成部2020は、Trisoupノードサイズの最小値は0としてもよい。
または、図6に示すように、ツリー合成部2020は、適応Octreeモードが有効の場合は、Trisoupノードサイズの最小値は、0と暗黙的に設定してもよい。かかる場合、例えば、以下のように定義してもよい。
処理Depth数=全Depth数-最小のTrisoupノードサイズ
この場合、全ての処理Depth数の処理が完了した場合は、ツリー合成部2020は、ステップS809へ進み、そうでない場合は、ツリー合成部2020は、ステップS902へ進む。
言い換えると、(処理Depth数-n)=0の場合は、ツリー合成部2020は、ステップS809へ進み、(処理Depth数-n)>0の場合は、ツリー合成部2020は、ステップS902へ進む。
ステップS902において、ツリー合成部2020は、対象Depthにて後述するTrisoup_applied_flagを復号する必要があるか否かを判定する。
例えば、「複数レベルでのTrisoupが許可(trisoup_multilevel_enabled_flagの値が「1」)」で、且つ、「対象Depthのノードサイズ(N-n)が最大のTrisoupノードサイズ以下」の場合に、ツリー合成部2020は、「Trisoup_applied_flagの復号が必要である」と判定してもよい。
また、ツリー合成部2020は、ステップS809へ進む際のノードサイズ(N-処理Depth数)が1以上(2以上)の場合、当該のノードサイズを持つ全てのノードには、Trisoupが適用されると判定してもよい。
また、ツリー合成部2020は、ステップS809へ進む際のノードサイズ(N-処理Depth数)が0(2=1)の場合、すなわち、1×1×1のサイズのノードの場合、後述する近似表面合成部2030では、Trisoupの処理は行わず、Octreeのみを実行した際と同様に、1×1×1のサイズのノード自体を復号した点とみなしてもよい。
以上のように、ツリー合成部2020は、所定の最小Trisoupノードサイズを1に設定し、ノードサイズが1×1×1となったノードについては、Octreeのみで、ノードサイズが1×1×1より大きなノードについては、Trisoupで、それぞれ幾何情報を復号することを決定するように構成されていてもよい。
以上のような構成とすることで、Trisoupのみを用いる場合との処理が共通化されるという利点がある。
(近似表面合成部2030)
近似表面合成部2030は、図10及び図14で説明するように、ツリー合成部2020にて、Trisoupノードと判定された各ノードについて、復号処理を行うように構成されている。
以下、図10~図14を用いて近似表面合成部2030の処理の例について説明する。
図10は、近似表面合成部2030の処理の一例を示すフローチャートである。
図10に示すように、ステップS1001において、近似表面合成部2030は、全てのtrisoup_depthでの処理が完了したかどうかを判定する。
全てのtrisoup_depthについて処理が完了した場合、ステップS1009へ進み、処理を終了する。全てのtrisoup_depthの処理が完了していない場合、ステップS1002へ進む。
ステップS1002において、近似表面合成部2030は、ノード毎の頂点位置の取得及び統合を行う。
ここで、第1に、近似表面合成部2030は、当該trisoup_depthに対応するTrisoupノードサイズ(以降、当該Trisoupノードサイズと呼ぶ)におけるノード毎に頂点位置を復号する。具体的な処理については、図13で説明する。
第2に、当該Trisoupノードサイズが、最大Trisoupノードサイズより小さい場合、近似表面合成部2030は、後述するステップS1008において、当該Trisoupノードサイズより大きなTrisoupノードサイズにおいて生成した頂点との統合処理を行う。
具体的には、近似表面合成部2030は、当該Trisoupノードサイズにおけるノードのエッジ上に、図13に説明する手法で復号した頂点(当該Trisoupノードサイズにおける頂点)と、ステップS1008で説明する方法で生成した頂点(当該Trisoupノードサイズより大きなTrisoupノードサイズにおいて生成した頂点)の両方が存在する場合、一番大きなノードサイズにおいて生成された頂点のみを保持し、その他の頂点については削除する処理を行う。このようにすることで、ノード毎に頂点を最大でも1点ずつにすることができる。
頂点位置の取得及び統合が完了した後、近似表面合成部2030は、ステップS1003へ進む。
ステップS1003において、近似表面合成部2030は、当該Trisoupノードサイズにおけるノード毎に、投影面を決定する。
例えば、x軸、y軸、z軸の3つの軸があるとき、どれか1つの軸を縮退した平面を投影面と呼ぶ。
ステップS1003では、近似表面合成部2030は、上述の軸のうちどの軸を縮退するか、すなわち、x-y平面、x-z平面、y-z平面のうちどの平面を投影面とするかを決定する。具体的な投影面の決定方法は、公知の方法を適用できるため省略する。
投影面を決定した後、近似表面合成部2030は、ステップS1004へ進む。
ステップS1004において、近似表面合成部2030は、投影面に投影した頂点を、例えば、反時計回りの順になるようにソートし、かかる順序に従ってindexを付与する。なお、ステップS1003の処理の過程でソート処理を行う場合は、当該のソート処理結果を保存しておくことで、ステップS1004の処理を省略することができる。
indexを付与した後、近似表面合成部2030は、ステップS1005へ進む。
ステップS1005において、近似表面合成部2030は、上述のindex及び対象ノードに存在する頂点数に基づいて、三角形を生成する。
例えば、近似表面合成部2030は、予め頂点数毎にどのindexから三角形を生成するかを定義した表を作成しておき、それを参照することで三角形を生成できる。具体的な表の例については、例えば、上述の非特許文献1に記載の表を用いることができる。
或いは、近似表面合成部2030は、まず各頂点の座標を平均したセントロイドを生成し、上述のインデックス順に隣り合う2点とセントロイドの3点で、三角形を生成してもよい。
三角形を生成した後、近似表面合成部2030は、ステップS1006へ進む。
ステップS1006において、近似表面合成部2030は、ステップS1005で生成した三角形を基に、点を生成する。具体的な方法は、例えば、上述の非特許文献1に記載の方法を用いることができる。
全てのノードについて点の生成が完了した後、近似表面合成部2030は、ステップS1007へ進む。
ステップS1007では、近似表面合成部2030は、当該Trisoupノードサイズが、最小ノードサイズと等しいかどうかを判定する。
近似表面合成部2030は、当該Trisoupノードサイズが、最小ノードサイズと等しい場合は、ステップS1001へ進み、次のtrisoup_depthの処理を行い、そうでない場合は、ステップS1008へ進む。
ステップS1008では、近似表面合成部2030は、ステップS1006で生成した当該Trisoupノードサイズにおける点群、又は、ステップS1005で生成した三角形に基づいて、最小Trisoupノードサイズにおける頂点を生成する。
図11は、ステップS1006で生成した当該Trisoupノードサイズにおける点群から、最小Trisoupノードサイズにおける頂点を生成する場合の例を示している。
図11Aは、ステップS1006で生成した復号点群の例を示している。
第1に、近似表面合成部2030は、当該ノードを、図11Aの点線で示すように、最小Trisoupノードサイズ毎に分割する。
なお、図11では、当該TrisoupノードサイズがN(=2)であり、最小TrisoupノードサイズがN-1(=2(N-1))の場合を示している。
第2に、近似表面合成部2030は、最小Trisoupノードサイズ毎に分割した際の各エッジ(図11Aの実線及び点線)上に、復号点群内の各点が存在するかどうかを確認する。
例えば、各エッジが、任意の原点から2(N-1)間隔で存在するとみなした場合、z軸方向のエッジの座標は、(A×2(N-1),B×2(N-1),z)で表せる。ここで、A及びBは、定数である。
よって、例えば、復号点群内の点の座標がx=A×2(N-1)及びy=B×2(N-1)となる点があれば、その点をエッジ上に存在する点をみなせる。上述の処理は、x軸方向のエッジ及びy軸方向のエッジについても同様に適用可能である。
近似表面合成部2030は、このような処理を、最小Trisoupノードサイズ毎に分割した際の全てのエッジについて実施することで、復号点群からエッジ上に存在する点を抽出できる。
なお、上述の処理は、一例であり、他の処理でも、最小Trisoupノードサイズにおけるエッジ上の点が抽出できればよい。
例えば、各エッジが、任意の原点から2(N-1)間隔で存在するとみなした場合、近似表面合成部2030は、z軸方向のエッジ上に存在する点を抽出するには、復号点群内の各点のx座標及びy座標をそれぞれ2(N-1)で除算し、x座標、y座標ともに余りがゼロになった点を、エッジ上に存在する点として抽出することもできる。
図11Bは、エッジ上に存在する点の抽出結果の例を示している。図11Bに示すように、近似表面合成部2030は、当該Trisoupノードサイズの表面に存在するエッジ上の点のみを抽出し、当該Trisoupノードサイズの内部に存在するエッジ上の点は抽出対象外としてもよい。
近似表面合成部2030は、以上のようにして抽出したエッジ上の点を、最小Trisoupノードサイズにおける頂点として保存する。
以上のように、近似表面合成部2030は、制御データから復号した最大ノードサイズ及び最小ノードサイズに基づいて、最大と最小との間の各ノードサイズにおいて頂点の復号処理を実行し、ノードサイズが最小ノードサイズではない場合、復号した頂点に基づいて、最小ノードサイズにおける頂点位置を生成し、ある辺上に、かかる辺に隣接する異なるノードサイズのノードから生成された複数の頂点が存在する場合、かかる隣接するノードのうち、最も大きなノードサイズを持つノードによって生成された頂点を、かかる辺の頂点位置とするように構成されていてもよい。
このような構成とすることで、異なるノードサイズ境界においてもメッシュに隙間ができなくなるため、復号点群の主観品質の向上が見込める。
また、以上のように、最小ノードサイズにおける頂点位置を生成する際、ノードの表面のみに頂点を生成するように構成されていてもよい。
上述のように、生成する頂点位置を異なるノードサイズと隣接する可能性があるノード表面のみに限定することで、不要な頂点の生成を避け、処理量の増加を防ぐことができる。
以上のように、近似表面合成部2030は、ノードサイズが最小ノードサイズではない場合、対象のノードの復号点群内の点のうち、対象のノードを最小ノードサイズで分割した際の辺上の点を、最小ノードサイズにおける頂点位置とするように構成されていてもよい。
かかる構成によれば、既に別の目的で生成された復号点群を処理に用いることで、処理量の増加を防ぐことができる。
以上では、当該Trisoupノードサイズにおける復号点群を基に頂点を生成する方法の例を説明したが、頂点は、図12に示すように、当該Trisoupノードサイズにおける頂点から内挿する方法で生成してもよい。
具体的には、例えば、第1に、近似表面合成部2030は、ステップS1003又はステップS1004における頂点のソート結果に基づいて、隣り合う頂点同士を結ぶ直線の式を算出する。
図12Aは、図11Aと同様に、当該Trisoupノードを最小Trisoupノードサイズに分割した場合の例、及び、当該Trisoupノードサイズにおける頂点の例を示している。
図12Aは、ソート後のIndexにおいて、0番目と1番目、1番目と2番目、2番目と0番目の頂点を結ぶ直線をそれぞれ生成した場合の例を示している。
2点a=(ax, ay, az)、b=(bx, by, bz)を結ぶ直線lは、例えば、l=(1-t)a+tbで表せる。
この直線と、最小Trisoupノードサイズにおける各エッジの直線との交点を求めることで、エッジ上の点を算出することができる。
ここで、図11Bと同様に、算出対象を当該Trisoupノードサイズにおける表面上に存在するエッジに限定する場合、以下のように計算を簡素化できる。
第1に、2つの頂点を結んで直線を求める際に、2つの頂点の両方が、当該Trisoupノードの同一表面上に無い場合、計算から除外できる。
図12Aの例では、0番目及び1番目の頂点は、同一表面上に存在している。同様に、2番目及び0番目の頂点も、同一表面上に存在している。一方、1番目及び2番目の頂点は、同一表面上に無いため、この2点を結ぶ直線については計算の対象外とできる。
2頂点を同一表面上に限定した場合、2頂点を結ぶ直線の式は、2次元平面状の直線の式として表現できる。
例えば、0番目の頂点及び1番目の頂点は、それぞれz座標が同一であるため、2頂点を結ぶ直線はx-y平面上の直線としてy=ax+b(aとbは定数)の形で表せる。
このx-y平面上において、最小Trisoupノードサイズに分割した場合のエッジはx=C×2(N-1)又はy=D×2(N-1)(C及びDは、それぞれ定数)の直線と見なせるので、上述の直線の式にx=C×2(N-1)又はy=D×2(N-1)を代入することで、交点を算出できる。
以上のようにして算出した交点、及び、当該Trisoupノードサイズにおける頂点の両方を、内挿後の頂点とする。
図12Bは、以上で説明した方法で生成した頂点の例を示している。
以上のように、近似表面合成部2030は、ノードサイズが最小ノードサイズではない場合、当該ノード頂点のうち2点を結ぶ直線と、当該ノードを前記最小ノードサイズで分割した際の辺との交点を、最小ノードサイズにおける頂点位置とするように構成されていてもよい。
このような構成とすることで、2本の直線の交点は、数学的に一意に算出可能であるため、頂点位置を正確に算出することが可能となる。
以上のように頂点の生成が完了した後、ステップS1001へ進む。
図13は、ステップS1002で使用する頂点の復号処理の一例を示すフローチャートである。
図13に示すように、ステップS1301において、近似表面合成部2030は、全てのtrisoup_depthでの処理が完了したかどうかを判定する。
全てのtrisoup_depthについて処理が完了した場合、ステップS1305へ進み、処理を終了する。全てのtrisoup_depthの処理が完了していない場合、ステップS1302へ進む。
ステップS1302において、近似表面合成部2030は、対象Trisoup階層に属するユニークセグメント数を確認する。
ユニークセグメント数が「0」の場合、すなわち、対象Trisoup階層にはTrisoupノードが1つも含まれない場合は、近似表面合成部2030は、ステップS1301へ進み、次のTrisoup階層の処理へ移る。
ユニークセグメント数が「0」より大きい場合は、近似表面合成部2030は、ステップS1303へ移る。
ステップS1303において、近似表面合成部2030は、各ユニークセグメントに対してTrisoup処理に用いる頂点が含まれるか否かを復号する。
なお、各ユニークセグメントに対して存在できる頂点は、1点のみに制限してもよい。この場合、頂点が存在するユニークセグメント数が頂点数と等しいと解釈できる。
近似表面合成部2030は、対象Trisoup階層の全てのユニークセグメントについて頂点の有無を復号した後、ステップS1304へ移る。
ステップS1304において、近似表面合成部2030は、ステップS1303において頂点が存在すると判定された各ユニークセグメントに対して、各ユニークセグメント上のどこに頂点が存在するのかという位置情報を復号する。
図14は、ステップS1304の処理の一例を示すフローチャートである。
図14に示すように、ステップS1401において、近似表面合成部2030は、全てのセグメントについて処理が終了したかどうかを判定する。
全てのセグメントについて処理が終了した場合、ステップS1406へ進み処理を終了する。全てのセグメントについて処理が終了していない場合、ステップS1402へ進む。
ステップS1402では、近似表面合成部2030は、当該セグメントの方向を取得する。具体的には、近似表面合成部2030は、当該セグメントがx軸、y軸、z軸方向のいずれの方向なのかを取得する。
かかる情報は、例えば、予め復号対象のノードに属するエッジ(=セグメント)に所定の順序でIndexを与えるとともに当該セグメントの方向を記録しておき、本処理では、Index順に各セグメントを処理することで、前記の記録から当該セグメントの方向を判定することができる。
また、別の方法としては、近似表面合成部2030は、セグメントごとに始点の座標と終点の座標の情報を保持しておくことで、どの軸方向に沿った頂点であるかを判別できる。以上のように当該セグメントの方向を取得した後、ステップS1403へ進む。
ステップS1403では、近似表面合成部2030は、当該セグメントのサイズを取得する。
当該セグメントのサイズは、対象のOctreeのDepthにおけるノードサイズに対応する。
Octreeのみを用いる場合はx軸、y軸、z軸方向すべてについて同一のサイズとなる。一方、QtBtを用いる場合はx軸、y軸、z軸方向それぞれについて値が異なる可能性がある。
近似表面合成部2030は、当該Depthにおけるx軸、y軸、z軸方向それぞれのノードサイズと、ステップS1402で取得した当該セグメントの方向とに基づいて、当該セグメントのサイズを取得する。
また、近似表面合成部2030は、別の方法としては、セグメントごとに始点の座標と終点の座標の情報を保持している場合、終点の座標値から始点の座標値を減算することで、当該セグメントのサイズを取得できる。
当該セグメントのサイズ取得後、近似表面合成部2030は、ステップS1404へ進む。
ステップS1404では、近似表面合成部2030は、ステップS1403で取得した当該セグメントのサイズを、これから復号する頂点のPositionの取り得る最大値としてセットする。その後、ステップS1405へ進む。
ステップS1405では、近似表面合成部2030は、Positionの取り得る値の範囲を0~“S1404でセットした最大値”―1と設定したうえで、Positionを復号する。
例えば、近似表面合成部2030は、最大値が2の場合、最大値=2L-1と設定できる。この時、例えば、Positionは、Lビットの等長符号で符号化されていてもよい(点群復号装置200としては、このように符号化されている前提で復号してもよい)。
また、近似表面合成部2030は、Positionの取り得る値の範囲を0~2L-1とした上で、ハフマン符号化や算術符号化等を用いて、エントロピー符号化/復号してもよい。近似表面合成部2030は、Positionの復号後、ステップS1401へ進む。
以上のように、近似表面合成部2030は、Trisoupの頂点位置の復号に際し、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、かかる頂点位置の取り得る値の範囲に基づいて頂点位置を復号するように構成されていてもよい。
また、近似表面合成部2030は、以上のように、ノードからセグメントを生成する際の各セグメントの軸方向と、ノード形状とに基づいて、頂点位置の取り得る値の範囲を設定するように構成されていてもよい。
また、近似表面合成部2030は、以上のように、各セグメントの始点座標と終点座標とに基づいて、頂点位置の取り得る値の範囲を設定するように構成されていてもよい。
このような構成とすることで、ノードサイズが立方体ではなく直方体の場合にもTrisoupが適用できるようになり、符号化効率の改善が見込める。
(点群符号化装置100)
以下、図15を参照して、本実施形態に係る点群符号化装置100について説明する。図15は、本実施形態に係る点群符号化装置100の機能ブロックの一例について示す図である。
図15に示すように、点群符号化装置100は、座標変換部1010と、幾何情報量子化部1020と、ツリー解析部1030と、近似表面解析部1040と、幾何情報符号化部1050と、幾何情報再構成部1060と、色変換部1070と、属性転移部1080と、RAHT部1090と、LoD算出部1100と、リフティング部1110と、属性情報量子化部1120と、属性情報符号化部1130とを有する。
座標変換部1010は、入力点群の3次元座標系から、任意の異なる座標系への変換処理を行うよう構成されている。座標変換は、例えば、入力点群を回転することにより、入力点群のx、y、z座標を任意のs、t、u座標に変換してもよい。また、変換のバリエーションの1つとして、入力点群の座標系をそのまま使用してもよい。
幾何情報量子化部1020は、座標変換後の入力点群の位置情報の量子化及び座標が重複する点の除去を行うように構成されている。なお、量子化ステップサイズが1の場合は、入力点群の位置情報と量子化後の位置情報とが一致する。すなわち、量子化ステップサイズが1の場合は、量子化を行わない場合と等価になる。
ツリー解析部1030は、量子化後の点群の位置情報を入力として、後述のツリー構造に基づいて、符号化対象空間のどのノードに点が存在するかについて示すoccupancy codeを生成するように構成されている。
ツリー解析部1030は、本処理において、符号化対象空間を再帰的に直方体で区切ることにより、ツリー構造を生成するように構成されている。
ここで、ある直方体内に点が存在する場合、かかる直方体を複数の直方体に分割する処理を、直方体が所定のサイズになるまで再帰的に実行することでツリー構造を生成することができる。なお、かかる各直方体をノードと呼ぶ。また、ノードを分割して生成される各直方体を子ノードと呼び、子ノード内に点が含まれるか否かについて0又は1で表現したものがoccupancy codeである。
以上のように、ツリー解析部1030は、所定のサイズになるまでノードを再帰的に分割しながら、occupancy codeを生成するように構成されている。
本実施形態では、上述の直方体を常に立方体として8分木分割を再帰的に行う「Octree」と呼ばれる手法、及び、8分木分割に加え、4分木分割及び2分木分割を行う「QtBt」と呼ばれる手法を使用することができる。
ここで、「QtBt」を使用するか否かについては、制御データとして点群復号装置200に伝送される。
或いは、任意のツリー構成を用いるPredicitive codingを使用するように指定されてもよい。かかる場合、ツリー解析部1030が、ツリー構造を決定し、決定されたツリー構造は、制御データとして点群復号装置200へ伝送される。
例えば、ツリー構造の制御データは、図6で説明した手順で復号できるよう構成されていてもよい。
近似表面解析部1040は、ツリー解析部1030によって生成されたツリー情報を用いて、近似表面情報を生成するように構成されている。
近似表面情報は、例えば、物体の3次元点群データを復号する際等において、点群が物体表面に密に分布しているような場合に、個々の点群を復号するのではなく、点群の存在領域を小さな平面で近似して表現したものである。
具体的には、近似表面解析部1040は、例えば、「Trisoup」と呼ばれる手法で、近似表面情報を生成するように構成されていてもよい。また、Lidar等で取得した疎な点群を復号する場合は、本処理を省略することができる。
幾何情報符号化部1050は、ツリー解析部1030によって生成されたoccupancy code及び近似表面解析部1040によって生成された近似表面情報等のシンタックスを符号化してビットストリーム(幾何情報ビットストリーム)を生成するように構成されている。ここで、ビットストリームには、例えば、図4及び図5で説明したシンタックスを含まれていてもよい。
符号化処理は、例えば、コンテクスト適応二値算術符号化処理である。ここで、例えば、シンタックスは、位置情報の復号処理を制御するための制御データ(フラグやパラメータ)を含む。
幾何情報再構成部1060は、ツリー解析部1030によって生成されたツリー情報及び近似表面解析部1040によって生成された近似表面情報に基づいて、符号化対象の点群データの各点の幾何情報(符号化処理が仮定している座標系、すなわち、座標変換部1010における座標変換後の位置情報)を再構成するように構成されている。
色変換部1070は、入力の属性情報が色情報であった場合に、色変換を行うように構成されている。色変換は、必ずしも実行する必要は無く、色変換処理の実行の有無については、制御データの一部として符号化され、点群復号装置200へ伝送される。
属性転移部1080は、入力点群の位置情報、幾何情報再構成部1060における再構成後の点群の位置情報及び色変換部1070での色変化後の属性情報に基づいて、属性情報の歪みが最小となるように属性値を補正するように構成されている。
RAHT部1090は、属性転移部1080による転移後の属性情報及び幾何情報再構成部1060によって生成された幾何情報を入力とし、RAHT(Region Adaptive Hierarchical Transform)と呼ばれるHaar変換の一種を用いて、各点の残差情報を生成するように構成されている。RAHTの具体的な処理としては、例えば、上述の文献2に記載の方法を用いることができる。
LoD算出部1100は、幾何情報再構成部1060によって生成された幾何情報を入力とし、LoD(Level of Detail)を生成するように構成されている。
LoDは、ある点の属性情報から、他のある点の属性情報を予測し、予測残差を符号化或いは復号するといった予測符号化を実現するための参照関係(参照する点及び参照される点)を定義するための情報である。
言い換えると、LoDは、幾何情報に含まれる各点を複数のレベルに分類し、下位のレベルに属する点については上位のレベルに属する点の属性情報を用いて属性を符号化或いは復号するといった階層構造を定義した情報である。
LoDの具体的な決定方法としては、例えば、上述の文献2に記載の方法を用いてもよい。
リフティング部1110は、LoD算出部1100によって生成されたLoD及び属性転移部1080での属性転移後の属性情報を用いて、リフティング処理により残差情報を生成するように構成されている。
リフティングの具体的な処理としては、例えば、文献(Text of ISO/IEC 23090-9 DIS Geometry-based PCC、ISO/IEC JTC1/SC29/WG11 N19088)に記載の方法を用いてもよい。
属性情報量子化部1120は、RAHT部1090又はリフティング部1110から出力される残差情報を量子化するように構成されている。ここで、量子化ステップサイズが1の場合は、量子化を行わない場合と等価である。
属性情報符号化部1130は、属性情報量子化部1120から出力される量子化後の残差情報等をシンタックスとして符号化処理を行い、属性情報に関するビットストリーム(属性情報ビットストリーム)を生成するように構成されている。
符号化処理は、例えば、コンテクスト適応二値算術符号化処理である。ここで、例えば、シンタックスは、属性情報の復号処理を制御するための制御データ(フラグ及びパラメータ)を含む。
点群符号化装置100は、以上の処理により、点群内の各点の位置情報及び属性情報を入力として符号化処理を行い、幾何情報ビットストリーム及び属性情報ビットストリームを出力するように構成されている。
また、上述の点群符号化装置100及び点群復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
なお、上記の各実施形態では、本発明を点群符号化装置100及び点群復号装置200への適用を例にして説明したが、本発明は、かかる例のみに限定されるものではなく、点群符号化装置100及び点群復号装置200の各機能を備えた点群符号化/復号システムにも同様に適用できる。
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
10…点群処理システム
100…点群符号化装置
1010…座標変換部
1020…幾何情報量子化部
1030…ツリー解析部
1040…近似表面解析部
1050…幾何情報符号化部
1060…幾何情報再構成部
1070…色変換部
1080…属性転移部
1090…RAHT部
1100…LoD算出部
1110…リフティング部
1120…属性情報量子化部
1130…属性情報符号化部
200…点群復号装置
2010…幾何情報復号部
2020…ツリー合成部
2030…近似表面合成部
2040…幾何情報再構成部
2050…逆座標変換部
2060…属性情報復号部
2070…逆量子化部
2080…RAHT部
2090…LoD算出部
2100…逆リフティング部
2110…逆色変換部

Claims (5)

  1. 点群復号装置であって、
    Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、前記頂点位置の取り得る値の範囲に基づいて前記頂点位置を復号するように構成されている近似表面合成部を備えることを特徴とする点群復号装置。
  2. 前記近似表面合成部は、前記ノードから前記セグメントを生成する際の各セグメントの軸方向と前記ノード形状とに基づいて、前記頂点位置の取り得る値の範囲を設定するように構成されていることを特徴とする請求項1に記載の点群復号装置。
  3. 前記近似表面合成部は、各セグメントの始点座標と終点座標とに基づいて、前記頂点位置の取り得る値の範囲を設定するように構成されていることを特徴とする請求項1に記載の点群復号装置。
  4. 点群復号方法であって、
    Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、前記頂点位置の取り得る値の範囲に基づいて前記頂点位置を復号する工程を有することを特徴とする点群復号方法。
  5. コンピュータを、点群復号装置として機能させるプログラムであって、
    前記点群復号装置は、
    Trisoupの頂点位置を復号する際に、ノード形状に応じてセグメントごとに頂点位置の取り得る値の範囲を設定し、前記頂点位置の取り得る値の範囲に基づいて前記頂点位置を復号するように構成されている近似表面合成部を備えることを特徴とするプログラム。

JP2022110162A 2022-07-08 2022-07-08 点群復号装置、点群復号方法及びプログラム Pending JP2024008353A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022110162A JP2024008353A (ja) 2022-07-08 2022-07-08 点群復号装置、点群復号方法及びプログラム
PCT/JP2023/008641 WO2024009561A1 (ja) 2022-07-08 2023-03-07 点群復号装置、点群復号方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022110162A JP2024008353A (ja) 2022-07-08 2022-07-08 点群復号装置、点群復号方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2024008353A true JP2024008353A (ja) 2024-01-19

Family

ID=89452963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022110162A Pending JP2024008353A (ja) 2022-07-08 2022-07-08 点群復号装置、点群復号方法及びプログラム

Country Status (2)

Country Link
JP (1) JP2024008353A (ja)
WO (1) WO2024009561A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220414940A1 (en) * 2019-10-01 2022-12-29 Sony Group Corporation Information processing apparatus and method
JP2022002382A (ja) * 2020-06-22 2022-01-06 Kddi株式会社 点群復号装置、点群復号方法及びプログラム
WO2022138046A1 (ja) * 2020-12-25 2022-06-30 Kddi株式会社 点群復号装置、点群復号方法及びプログラム

Also Published As

Publication number Publication date
WO2024009561A1 (ja) 2024-01-11

Similar Documents

Publication Publication Date Title
CN113574540B (zh) 点云编解码方法、装置和电子设备
CN112771583B (zh) 处理点云数据的方法、装置和存储介质
JP7233561B2 (ja) 点群圧縮のための方法並びにその、装置およびコンピュータプログラム
JP7263550B2 (ja) 点群の情報をコーディングする方法及び装置、及びコンピュータプログラム
WO2021199781A1 (ja) 点群復号装置、点群復号方法及びプログラム
CN113179411A (zh) 点云属性编解码方法、装置、计算机设备及存储介质
JP2023515602A (ja) 点群コーディングのための方法および装置
WO2024009675A1 (ja) 点群復号装置、点群復号方法及びプログラム
WO2024009676A1 (ja) 点群復号装置、点群復号方法及びプログラム
WO2024009562A1 (ja) 点群復号装置、点群復号方法及びプログラム
WO2024009561A1 (ja) 点群復号装置、点群復号方法及びプログラム
CN115088017A (zh) 点云的树内几何量化
WO2023074673A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
WO2021256486A1 (ja) 点群復号装置、点群復号方法及びプログラム
CN113115019B (zh) 视频编解码方法、装置、计算机设备及存储介质
WO2023277128A1 (ja) 点群復号装置、点群復号方法及びプログラム
JP2024058011A (ja) 点群復号装置、点群復号方法及びプログラム
JP2024058012A (ja) 点群復号装置、点群復号方法及びプログラム
WO2023132330A1 (ja) 点群復号装置、点群復号方法及びプログラム
WO2023132329A1 (ja) 点群復号装置、点群復号方法及びプログラム
WO2023132331A1 (ja) 点群復号装置、点群復号方法及びプログラム
WO2024075608A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
WO2022191132A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP2023053827A (ja) 点群復号装置、点群復号方法及びプログラム
JP2024515208A (ja) メッシュ圧縮のための境界uv2xyzインデックスの予測コーディング

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220729