JP7210085B2 - ポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器 - Google Patents

ポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器 Download PDF

Info

Publication number
JP7210085B2
JP7210085B2 JP2021517774A JP2021517774A JP7210085B2 JP 7210085 B2 JP7210085 B2 JP 7210085B2 JP 2021517774 A JP2021517774 A JP 2021517774A JP 2021517774 A JP2021517774 A JP 2021517774A JP 7210085 B2 JP7210085 B2 JP 7210085B2
Authority
JP
Japan
Prior art keywords
instance
semantic
point
features
point cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021517774A
Other languages
English (en)
Other versions
JP2022501740A (ja
Inventor
枢 ▲劉▼
▲シン▼▲龍▼ 王
小勇 沈
佳▲亞▼ ▲賈▼
宇▲榮▼ 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2022501740A publication Critical patent/JP2022501740A/ja
Application granted granted Critical
Publication of JP7210085B2 publication Critical patent/JP7210085B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)
  • Machine Translation (AREA)

Description

(関連出願の相互参照)
本願は、2019年02月25に提出された、出願番号が201910138419.6であり、発明名称が「ポイントクラウドセグメンテーション方法及びその装置、コンピュータ可読記憶媒体並びにコンピュータ機器」である中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本願に組み込まれる。
本願は、コンピュータ技術分野に関し、特にポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器に関する。
コンピュータ技術の成長に伴い、デジタル画像の数は、日増しに増えていて、デジタル画像処理技術に対する需要も日増しに増えてきた。例示的に、デジタル画像をポイントクラウドで表すことができる。ここで、ポイントクラウドは、同一の空間参照システムでターゲット空間分布及びターゲット表面特性を表す大量のポイント集合である。物体表面の各サンプリングポイントの空間座標を取得した後、ポイント集合を得る。該ポイント集合は、ポイントクラウド(Point Cloud)と呼ばれる。デジタル画像処理技術において、ポイントクラウドのセグメンテーション処理は、重要な分岐の1つである。
現在、ポイントクラウドに対してセグメンテーション(例えば、インスタンスセグメンテーション)を行う場合、一般的には、特徴に基づく類似度行列に依存するが、このようなセグメンテーション方式にかかる時間が長く、ポイントクラウドセグメンテーションの効率が低くなってしまう。特に、ポイントクラウドのポイント数が大きい場合、このような現象は、極めて顕著である。
本願の実施例は、ポイントクラウドセグメンテーションの効率を高めることができるポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器を提供する。
一態様によれば、コンピュータ機器に適用されるポイントクラウドセグメンテーション方法を提供する。前記方法は、
処理されるべきポイントクラウドに対して符号化を行い、共有特徴を得るステップであって、前記共有特徴は、セマンティックレベル及びインスタンスレベルで共有される特徴である、ステップと、
異なる復号化方式で前記共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るステップと、
前記セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後に前記インスタンス特徴と融合し、前記ポイントクラウドのセマンティック融合インスタンス特徴を得るステップであって、前記セマンティック融合インスタンス特徴は、セマンティック特徴を融合したインスタンス特徴を表す、ステップと、
前記ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、前記ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得るステップと、
各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記ポイントが属するインスタンスカテゴリを決定するステップと、を含む。
もう1つの態様によれば、ポイントクラウドセグメンテーション装置を提供する。前記装置は、
処理されるべきポイントクラウドに対して符号化を行い、共有特徴を得るように構成される符号化モジュールと、
異なる復号化方式で前記共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るように構成される復号化モジュールと、
前記セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後に前記インスタンス特徴と融合し、前記ポイントクラウドのセマンティック融合インスタンス特徴を得、前記ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、前記ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得るように構成されるセマンティック融合インスタンスモジュールであって、前記セマンティック融合インスタンス特徴は、セマンティック特徴を融合したインスタンス特徴を表す、セマンティック融合インスタンスモジュールと、
各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記ポイントが属するインスタンスカテゴリを決定するように構成されるセマンティック融合インスタンスセグメンテーションモジュールと、を備える。
可能な実現形態において、前記符号化モジュールは更に、処理されるべきポイントクラウドを取得し、前記ポイントクラウドにおける各ポイントの座標特徴とチャネル特徴を組み合わせ、対応するポイントの初期特徴を得、各前記ポイントの初期特徴を共同で符号化し、前記ポイントクラウドに対応する共有特徴を得るように構成される。
可能な実現形態において、前記復号化モジュールは更に、第1復号化構造により前記共有特徴を復号化し、セマンティック特徴を得、第2復号化構造により前記共有特徴を復号化し、インスタンス特徴を得るように構成され、前記第1復号化構造と前記第2復号化構造とは、構造が同じであるが、復号化パラメータが異なる。
可能な実現形態において、前記セマンティック特徴は、セマンティック特徴行列であり、前記インスタンス特徴は、インスタンス特徴行列であり、前記セマンティック融合インスタンスモジュールは更に、各ポイントの独立した第1全結合層により前記セマンティック特徴行列をインスタンス特徴空間にアダプテーションさせ、インスタンス特徴空間にアダプテーションしたセマンティック特徴行列と前記インスタンス特徴行列をビット毎に加算し、前記ポイントクラウドの第1行列を得るように構成され、前記第1行列は、セマンティック融合したインスタンス特徴行列である。
可能な実現形態において、前記セマンティック融合インスタンスモジュールは更に、前記ポイントクラウドのセマンティック融合インスタンス特徴行列を各ポイントの独立した第2全結合層に入力し、前記第2全結合層に含まれる正規化層及び活性化層により、前記ポイントクラウドの第1行列に対して順に処理を行い、前記ポイントクラウドにおける各ポイントの第1ベクトルを得るように構成され、前記第1ベクトルは、セマンティック融合したインスタンス特徴ベクトルである。
可能な実現形態において、前記セマンティック融合インスタンスセグメンテーションモジュールは更に、前記ポイントクラウドにおける各ポイントに対して、前記ポイントのセマンティック融合インスタンス特徴と前記ポイントクラウドにおける前記ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴との特徴距離をそれぞれ算出し、算出された特徴距離に基づいて、前記ポイントクラウドにおけるポイントをクラスタリングし、複数組のポイントを得るように構成され、前記複数組のポイントにおける各組のポイントは、1つのインスタンスカテゴリに対応する。
可能な実現形態において、前記ポイントクラウドセグメンテーション装置は、インスタンス融合セマンティックモジュールと、インスタンス融合セマンティックセグメンテーションモジュールと、を更に備える。
前記インスタンス融合セマンティックモジュールは、前記ポイントクラウドにおける各前記ポイントをそれぞれ中心ポイントとし、各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記中心ポイントに対応する複数の近隣ポイントを決定し、各前記中心ポイントに対応する複数の近隣ポイントのセマンティック特徴を融合し、対応する中心ポイントのインスタンス融合セマンティック特徴を得るように構成され、
前記インスタンス融合セマンティックセグメンテーションモジュールは、各前記中心ポイントのインスタンス融合セマンティック特徴に基づいて、各前記ポイントが属するセマンティックカテゴリを決定するように構成される。
可能な実現形態において、前記インスタンス融合セマンティックモジュールは更に、各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントと前記ポイントクラウドにおける各ポイントとの特徴距離をそれぞれ算出し、前記中心ポイントとの特徴距離が所定の距離未満である複数のポイントを前記中心ポイントに対応する複数の近隣ポイントとして選択するように構成される。
可能な実現形態において、前記復号化モジュールは更に、第1復号化方式で前記共有特徴を復号化し、前記ポイントクラウドのセマンティック特徴行列を得、前記第1復号化方式と異なる第2復号化方式で前記共有特徴を復号化し、前記ポイントクラウドのインスタンス特徴行列を得るように構成され、前記セマンティック特徴行列は、前記ポイントクラウドにおける各ポイントのセマンティック特徴ベクトルを含み、
前記インスタンス融合セマンティックモジュールは更に、各前記中心ポイントに対応する複数の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合し、対応する中心ポイントの第2ベクトルを得るように構成され、前記第2ベクトルは、インスタンス融合したセマンティック特徴ベクトルである。
可能な実現形態において、前記インスタンス融合セマンティックセグメンテーションモジュールは更に、各ポイントの独立した第3全結合層により、各中心ポイントの前記インスタンス融合セマンティック特徴を対応するセマンティック予測ベクトルに変換し、各中心ポイントのセマンティック予測ベクトルにおける最大ベクトル要素に対応するセマンティックカテゴリを各前記ポイントが属するセマンティックカテゴリとするように構成される。
可能な実現形態において、前記セマンティック融合インスタンスセグメンテーションモジュールは更に、前記ポイントクラウドにおける各点に対して、前記ポイントのインスタンス特徴と前記ポイントクラウドにおける前記ポイント以外の他の各ポイントのインスタンス特徴との特徴距離を算出し、算出された特徴距離に基づいて、前記ポイントクラウドにおけるポイントをクラスタリングし、複数組のポイントを得、前記複数組のポイントにおける各組のポイントが属するセマンティックカテゴリに基づいて、各組のポイントが属するインスタンスカテゴリを決定するように構成される。
もう1つの態様によれば、コンピュータプログラムを記憶したコンピュータ可読記憶媒体を提供する。前記コンピュータプログラムがプロセッサにより実行されるときに、前記プロセッサに上記ポイントクラウドセグメンテーション方法のステップを実行させる。
もう1つの態様によれば、コンピュータプログラムを提供する。前記コンピュータプログラムはコンピュータに上記ポイントクラウドセグメンテーション方法のステップを実行させる。
もう1つの態様によれば、メモリと、プロセッサと、を備えるコンピュータ機器を提供する。前記メモリにコンピュータプログラムが記憶されており、前記プロセッサは、コンピュータプログラムを実行して、上記ポイントクラウドセグメンテーション方法のステップを実行する。
上記ポイントクラウドセグメンテーション方法及びその装置、コンピュータプログラム並びにコンピュータ機器によれば、まず、処理されるべきポイントクラウドを符号化し、共有特徴を得、次に、異なる復号化分岐により、共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得、続いて、セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドのセマンティック認識特性に富んだインスタンス特徴を得、更に、ポイントクラウドにおける各ポイントの、セマンティック認識特性に富んだインスタンス特徴を得、各ポイントが属するインスタンスカテゴリを決定することができる。このように、セグメンテーションを行うために、特徴に基づく類似度行列に依存せず、ポイントクラウドセグメンテーションの効率を向上させる。また、セマンティック認識特性に富んだインスタンス特徴を学習することで、インスタンスセグメンテーションは、セマンティックセグメンテーションから利益を受けるようになり、ポイントクラウドセグメンテーションの正確性を大幅に向上させる。
一実施例によるポイントクラウドセグメンテーション方法の適用環境を示す図である。 一実施例によるポイントクラウドセグメンテーション方法を示すフローチャートである。 一実施例によるポイントクラウドセグメンテーションの原理を示す概略図である。 一実施例による複合セグメンテーションネットワークの構造を示す概略図である。 もう1つの実施例によるポイントクラウドセグメンテーション方法を示すフローチャートである。 一実施例による複合セグメンテーション三次元ポイントクラウドにおけるインスタンス及びセマンティックを示す概略図である。 一実施例によるポイントクラウドセグメンテーション装置の構造を示すブロック図である。 もう1つの実施例によるポイントクラウドセグメンテーション装置の構造を示すブロック図である。 一実施例によるコンピュータ機器の構造を示すブロック図である。
本願の目的、技術的解決手段及びメリットをより明確にするために、以下、図面及び実施例を参照して、本願を更に詳しく説明する。ここで記述される具体的な実施例は、本願を説明するためのものに過ぎず、本願を限定するものではないことは理解されるべきである。
人工知能(Artificial Intelligence:AI)は、デジタルコンピュータ又はデジタルコンピュータにより制御された機器を利用して人間の知能をシミュレーション、延長、拡張し、環境を感知して知識を取得し、知識を利用して最適な結果を得る理論、方法、技術及び適用システムである。換言すれば、人工知能は、コンピュータサイエンスにおける1つの総合技術であり、知能の本質を理解し、人間知能と同様な方式で反応可能な新たな知能機器を生み出すことを意図する。人工知能は、種々の知能機器の設計原理及び実現方法を検討し、機器に、感知、推理及び意思決定機能を持たせるためのものである。
人工知能技術は、総合的な学科であり、広い分野に関し、ハードウェアレベルの技術を含むだけでなく、ソフトウェアレベルの技術も含む。人工知能基礎技術は一般的には、センサ、専用人工知能チップ、クラウドコンピューティング、分散型ストレージ、ビッグデータ処理技術、オペレーティング/インタラクションシステム、メカトロニクスなどの技術を含む。人工知能ソフトウェア技術は、主に、コンピュータビジョン技術、音声処理技術、自然言語処理技術及び機械学習/深層学習などの分野を含む。
コンピュータビジョン(Computer Vision:CV)は、マシンを使用して「見る」を研究する科学であり、さらに、人間の肉眼の代わりに撮影機及びコンピュータを使用して目標を識別、追跡、測定等のマシンビジョンを行って、さらに画像処理をして、コンピュータで、人間の肉眼の観察または機器へ送信して検出することに適した画像になるように処理することである。1つの科学分野として、コンピュータビジョンは、関連した理論及び技術を検討し、画像又は多次元データから情報を取得できる人工知能システムを構築することを意図している。コンピュータビジョン技術は一般的には、画像処理、画像認識、画像セマンティック理解、画像検索、OCR、ビデオ処理、ビデオセマンティック理解、ビデオコンテンツ/挙動認識、三次元物体再構築、3D技術、仮想現実、拡張現実、位置推定とマッピングの同時実行等の技術を含み、一般的な顔認識、指紋認識などの生体特徴認識技術を更に含む。
人工知能技術に対する検討及び成長に伴い、人工知能技術は、例えば、一般的なスマートホーム、スマートウェアラブル機器、仮想アシスタント、スマートスピーカ、スマートマーケティング、無人運転、自動運転、無人機、ロボット、スマート医療、スマートカスタマーサービスなどの分野において検討されて適用されてきた。技術の成長に伴い、人工知能技術がより多くの分野に適用され、ますます重要な役割を果たすことは信じられている。
本願の実施例が提供する技術的解決手段は、人工知能のコンピュータビジョンなどの技術に関し、下記実施例により説明される。
図1は一実施例によるポイントクラウドセグメンテーション方法の適用環境を示す図である。図1に示すように、該ポイントクラウドセグメンテーション方法は、ポイントクラウドセグメンテーションシステムに適用される。該ポイントクラウドセグメンテーションシステムは、端末110と、サーバ120と、を備える。端末110とサーバ120はネットワークを介して接続される。一例として、端末110は具体的には、デスクトップ型端末又は携帯端末であってもよい。携帯端末は、携帯電話、タブレット、ノートパソコンなどのうちの少なくとも1つであってもよい。サーバ120は、独立したサーバ又は複数のサーバからなるサーバクラスタにより実現されてもよく、本願の実施例は、これを具体的に限定しない。
本願の実施例におけるポイントクラウドセグメンテーション方法は、端末110又はサーバ120によりそれぞれ独立して実行されてもよく、端末110及びサーバ120により協働で実行されてもよく、本願の実施例は、これを具体的に限定しない。
可能な実現形態において、本願の実施例におけるポイントクラウドは、二次元ポイントクラウド又は三次元ポイントクラウド等を含む。ここで、二次元ポイントクラウドは、例えば、二次元画像における各像素点の集合等であってもよい。三次元ポイントクラウドは、例えば、三次元シーンにおける各三次元ポイントの集合等であってもよい。
本願の実施例におけるポイントクラウドセグメンテーションは、セマンティックセグメンテーションと、インスタンスセグメンテーションと、を含む。
ここで、セマンティックセグメンテーションは、ポイントクラウドを複数の互いに重なり合わない、所定のセマンティックを有するポイントグループにセグメンテーションすると共に、これらのポイントグループに対してセマンティックアノテーションを行うことであってもよい。実際に、セマンティックセグメンテーションにより、ポイントレベルの分類を実現させる。各ポイントを分類することで、ポイントクラウド全体に対するセマンティックアノテーションを実現させる。例えば、二次元画像又は三次元シーンにおいて、どのポイントが猫に属するか、どのポイントがペンに属するか、又はどのポイントが風船に属するかなどを区別する。
インスタンスは、カテゴリの具体的な対象である。1つの具体的な対象は、例えば、1匹の猫、1本のペン又は1つの風船などのような1つのインスタンスと認められてもよい。インスタンスセグメンテーションは、ポイントクラウドを、複数の互いに重なり合わない、1つの具体的な対象に属するポイントグループにセグメンテーションすることであってもよい。1つのポイントグループは、1つのインスタンスに対応する。例えば、二次元画像又は三次元シーンにおいて、どのポイントが1つの具体的な対象に属するか、どのポイントがもう1つの具体的な対象に属するかなどを区別する。
インスタンスセグメンテーションは、セマンティックセグメンテーションと組み合わせられ、セマンティックセグメンテーションの上で、インスタンスのセマンティックカテゴリを区分することができる。例えば、二次元画像又は三次元シーンにおいて複数匹の猫が存在する場合、セマンティックセグメンテーションの結果を参照することで、インスタンスセグメンテーションにより、猫に属するポイントから、どのポイントが1匹目の猫に属するか、どのポイントが2匹目の猫に属するかなどを区分することができる。
図2に示すように、例示的な実施例において、本願の実施例は、ポイントクラウドセグメンテーション方法を提供する。該実施例は、主に、該方法をコンピュータ機器に適用することを例として説明する。該コンピュータ機器は、上記図1における端末110又はサーバ120であってもよい。図2に示すように、該ポイントクラウドセグメンテーション方法は、下記ステップを含む。
S202において、処理されるべきポイントクラウドを符号化し、共有特徴を得る。
ここで、共有特徴は、セマンティックレベル及びインスタンスレベルで共有される特徴である。つまり、共有特徴で処理することによって、セマンティック特徴及びインスタンス特徴をそれぞれ得ることができる。セマンティック特徴は、セマンティックレベルでポイントクラウド特性を表すデータであり、インスタンス特徴は、インスタンスレベルでポイントクラウド特性を表すデータである。
コンピュータ機器は、処理されるべきポイントクラウドを取得した後、処理されるべきポイントクラウドに対して特徴データ抽出を行い、抽出された特徴データを符号化(Encode)処理し、共有特徴を得る。共有特徴は、ポイントクラウドの特性に対する高次元表現であってもよく、該ポイントクラウド全体の情報を包含し、共有特徴は、ポイントクラウドの特性に対する低次元表現であってもよく、該ポイントクラウド全体の情報を包含すると理解されてもよい。共有特徴のデータフォーマットは、複数種であってもよく、例示的に、共有特徴は、共有特徴行列という行列形態であってもよい。
例示的な実施例において、コンピュータ機器は、深層学習ネットワークを特徴エンコーダとして選択し、特徴エンコーダを用いて処理されるべきポイントクラウドに対して特徴データ抽出及び符号化を行い、共有特徴を得ることができる。一例として、該特徴エンコーダとして用いられる深層学習ネットワークは、PointNetネットワークの前半であってもよく、又は、PointNet++ネットワークの前半、又は他のネットワーク構造であってもよい。ここで、PointNetネットワークは、多層パーセプトロン及び最大プーリングからなるポイントクラウド処理ネットワークであり、PointNet++ネットワークは、PointNetネットワークを改良したものである。
例を挙げて説明すると、コンピュータ機器はPointNetネットワークを特徴エンコーダとして用いるとすれば、共有特徴行列は、PointNetネットワークにおけるローカル特徴とグローバル特徴を組み合わせたネットワーク層の出力である。この場合、特徴エンコーダは、PointNetネットワークの第1ネットワーク層からローカル特徴とグローバル特徴を組み合わせたネットワーク層までのネットワーク構造である。コンピュータ機器はPointNet++ネットワークを特徴エンコーダとして用いるとすれば、共有特徴行列は、PointNet++ネットワークにおける最後の集合抽象化(set abstraction)モジュールの出力である。この場合、特徴エンコーダは、PointNet++ネットワークの第1ネットワーク層から最後の集合抽象化モジュールまでのネットワーク構造である。
例示的な実施例において、S202は、処理されるべきポイントクラウドを取得するステップと、処理されるべきポイントクラウドにおける各ポイントの座標特徴とチャネル特徴を組み合わせ、対応する点の初期特徴を得るステップと、各ポイントの初期特徴を共同で符号化、処理されるべきポイントクラウドに対応する共有特徴を得るステップと、を含む。
ここで、ポイントの座標特徴は、ポイントの座標位置であってもよい。ポイントのチャネル特徴は、ポイントのチャネル値であってもよく、例えば、色チャネル値である。座標特徴とチャネル特徴を組み合わせるステップは、各座標位置と各チャネル値をスプライシングすることであってもよい。ポイントの初期特徴は、特徴抽出及び符号化を行うための特徴である。
例を挙げて説明すると、三次元ポイントクラウドにおける三次元ポイントの座標特徴は、X座標次元の座標位置x、Y座標次元の座標位置y及びZ座標次元の座標位置zであり、三次元ポイントクラウドにおける三次元ポイントのチャネル特徴は、R色チャネルのチャネル値r、G色チャネルのチャネル値g及びB色チャネルのチャネル値bである。三次元ポイントクラウドにおける三次元ポイントの座標特徴とチャネル特徴との組み合わせは、(x,y,z,r,g,b)である。
コンピュータ機器は、処理されるべきポイントクラウドを取得した後、該ポイントクラウドにおける各ポイントに対して、該ポイントの座標特徴とチャネル特徴を組み合わせ、該ポイントの初期特徴を得ることができる。コンピュータ機器は、続いて、該ポイントクラウドにおける全てのポイントの初期特徴組み合わせを符号化し、共有特徴を得る。
例示的な実施例において、コンピュータ機器は、該ポイントクラウドにおける全てのポイントの初期特徴を共同で特徴エンコーダに入力し、該特徴エンコーダにより、全てのポイントの初期特徴を処理した後に、共有特徴行列を出力することができる。例を挙げて説明すると、処理されるべきポイントクラウドは、大きさがNであるポイントクラウドである。つまり、該ポイントクラウドは、N個のポイントを含む。コンピュータ機器は、処理されるべきポイントクラウドを符号化する。つまり、該N個のポイントの初期特徴であるN個の(x,y,z,r,g,b)を共同で特徴エンコーダに入力して処理する。つまり、各三次元ポイントの初期特徴は、1×6の初期特徴ベクトルであってもよい。三次元ポイントクラウドにおける全ての三次元ポイントの初期特徴を組み合わせたN×6の初期特徴行列を特徴エンコーダに入力して処理する。
勿論、もう1つの例示的な実施例において、処理されるべきポイントクラウドは、二次元ポイントクラウドであってもよい。この場合の座標特徴は、2つの次元のみを含む。なお、チャネル特徴は、YUV三色チャネル又はグレースケールチャネル等であってもよく、本願の実施例は、これを具体的に限定しない。
上記実施例において、座標レベル及びチャネルレベルという2つの異なる特徴レベルで、ポイントクラウドにおけるポイントの初期特徴を反映し、続いて、2つの特徴レベルを含む該初期特徴を符号化することで、より豊かな、ポイントクラウド特性を反映する特徴データを抽出することができ、後続のポイントクラウドのセグメンテーション処理に寄与する。
例を挙げて説明すると、図3は、一例示的な実施例によるポイントクラウドセグメンテーションの原理を示す概略図である。図3を参照すると、本願の実施例における処理されるべきポイントクラウドは大きさがNである三次元イントクラウドであるとすれば、コンピュータ機器は、特徴エンコーダ(例えばPointNetネットワークの前半)により、N個の三次元ポイントの初期特徴(x,y,z,r,g,b)を符号化し、共有特徴行列Fshareを得る。
S204において、異なる復号化方式で共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得る。
セマンティック特徴及びインスタンス特徴は、2つの異なる特徴レベルの特徴であることが理解されるべきである。同一のデータから、異なる特徴レベルの特徴を復号化しようとする場合、一般的には、異なる復号化方式でそれぞれ復号化を行う必要がある。このようにしてのみ、異なる結果を復号化できる。
ここで、復号化の相違は、復号化原理の相違であってもよい。例えば、深層学習ネットワークにより復号化するか又はロジスティック回帰により復号化する。復号化方式の相違は、ネットワーク構造の相違であってもよい。例えば、構造の異なる深層学習ネットワークにより復号化する。復号化方式の相違は、ネットワーク構造パラメータの相違であってもよい。例えば、モデル構造が同じであるがネットワーク構造パラメータが異なる深層学習ネットワークにより復号化する。
コンピュータ機器は、2つの異なる復号化方式で並行して共有特徴を復号化し、共有特徴から異なる情報を抽出し、抽出された2つの異なる情報に基づいて、セマンティック特徴及びインスタンス特徴をそれぞれ得ることができる。セマンティック特徴は、ポイントクラウドのセマンティック特性に対する高次元表現であってもよく、該ポイントクラウド全体のセマンティックレベルの情報を包含し、セマンティック特徴は、ポイントクラウドのセマンティック特性に対する低次元表現であってもよく、該ポイントクラウド全体のセマンティックレベルの情報を包含することが理解されるべきである。インスタンス特徴は、ポイントクラウドのインスタンス特性に対する高次元表現であってもよく、該ポイントクラウド全体のインスタンスレベルの情報を包含し、インスタンス特徴は、ポイントクラウドのインスタンス特性に対する低次元表現であってもよく、該ポイントクラウド全体のインスタンスレベルの情報を包含する。セマンティック特徴及びインスタンス特徴のデータフォーマットは複数であってもよい。例示的に、セマンティック特徴及びインスタンス特徴は、行列形態であってもよく、つまり、セマンティック特徴行列及びインスタンス特徴行列であってもよく、本願の実施例は、これを具体的に限定しない。
一例示的な実施例において、S204は、第1復号化構造により共有特徴を復号化し、セマンティック特徴を得るステップと、第2復号化構造により前記共有特徴を復号化し、インスタンス特徴を得るステップと、を含み、第1復号化構造と第2復号化構造とは、構造が同じであるが、復号化パラメータが異なる。
ここで、第1復号化構造と第2復号化構造は、構造が同じであるが構造パラメータが異なる2つの復号化構造である。例えば、コンピュータ機器は、PointNetネットワークの前半をデコーダとして選択し、共有特徴を復号化することができる。従って、復号化によりセマンティック特徴を得るPointNetネットワークと復号化によりインスタンス特徴を得るPointNetネットワークのネットワークパラメータが異なる。該ネットワークパラメータは、サンプルデータにより訓練を行うことで得られる。
コンピュータ機器は、並行して第1復号化構造により共有特徴を復号化してセマンティック特徴を得、第2復号化構造により共有特徴を復号化してインスタンス特徴を得ることができる。
例示的な実施例において、コンピュータ機器は、深層学習ネットワークを特徴エンコーダ及び2つの並行した特徴デコーダとして選択し、特徴エンコーダによりポイントクラウドを符号化し、共有特徴を得、更に2つの並行した特徴デコーダにより、共有特徴を復号化し、セマンティック特徴及びインスタンス特徴を得る。ここで、特徴エンコーダは、PointNetネットワーク又はPointNet++ネットワークの前半であり、2つの並行した特徴デコーダはいずれもPointNetネットワーク又はPointNet++ネットワークの後半であってもよい。勿論、特徴エンコーダ及び2つの並行した特徴デコーダは、他のネットワーク構造であってもよく、本願の実施例は、これを具体的に限定しない。
本願の実施例において、構造が同じであるがパラメータが異なる復号化構造により、共有特徴に対してそれぞれ復号化を行うことができる。これにより得られたセマンティック特徴とインスタンス特徴は、特徴表現及び特徴次元でマッチングした。後続の2つの特徴レベルの特徴融合に寄与し、ポイントクラウドセグメンテーションの正確性を向上させることができる。また、構造が同じである2つの復号化構造は、訓練を行う場合、構造が異なるか又は原理が異なる復号化構造の訓練よりも便利である。
引き続き図3を参照すると、コンピュータ機器は、共有特徴行列Fshareを得た後、2つの異なる分岐により、並行して共有特徴行列Fshareを復号化処理することができる。つまり、セマンティックセグメンテーション分岐の復号化構造により、共有特徴行列Fshareを、大きさがN×Nであるセマンティック特徴行列FSEMとなるように復号化し、インスタンスセグメンテーション分岐の復号化構造により、共有特徴行列Fshareを、大きさがN×Nであるインスタンス特徴行列FINSとなるように復号化する。ここで、Nは、特徴の次元であり、その値は、128又は256等であってもよい。例を挙げて説明すると、三次元ポイントの初期特徴は、(x,y,z,r,g,b)であり、6個の数値を含み、特徴の次元は、6である。
S206において、セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドのセマンティック融合インスタンス特徴を得、ポイントクラウドのセマンティック融合インスタンス特徴は、セマンティック特徴を融合したインスタンス特徴を表す。
入力データに対して特徴抽出を行うプロセスは、1つの空間における入力データをもう1つのより高い次元又はより低い次元の空間にマッピングするプロセスと認められてもよいことが理解されるべきである。入力データが位置する空間は、入力空間であり、抽出された特徴が位置する空間は、特徴空間である。特徴空間における特徴は、入力データに対するより高い次元又はより低い次元の抽象化表現である。特徴は異なるが、特徴空間も異なる。全てのインスタンス特徴が位置する空間は、インスタンス特徴空間であり、全てのセマンティック特徴が位置する空間は、セマンティック特徴空間である。異なる特徴空間の特徴同士は、マッピング関係を有するため、相互変換されてもよい。
コンピュータ機器は、セマンティック特徴空間とインスタンス特徴空間とのマッピング関係により、得られたセマンティック特徴をインスタンス特徴空間にマッピングし、セマンティックの、インスタンス特徴空間にアダプテーションした変換特徴を得、続いて、該変換特徴とインスタンス特徴に対して融合処理を行い、セマンティック認識特性に富んだインスタンス特徴を得る。つまり、セマンティック特徴を融合したインスタンス特徴を得る。
例示的な実施例において、セマンティック特徴は、セマンティック特徴行列であり、インスタンス特徴は、インスタンス特徴行列である。セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、セマンティック融合インスタンス特徴を得るステップは、各ポイントの独立した第1全結合層(fully connected layers:FC)によりセマンティック特徴行列をインスタンス特徴空間にアダプテーションさせるステップと、インスタンス特徴空間にアダプテーションしたセマンティック特徴行列とインスタンス特徴行列をビット毎に加算し、第1行列を得るステップであって、第1行列は、セマンティック融合したインスタンス特徴行列である、ステップと、を含む。
本願の実施例において、セマンティック特徴及びインスタンス特徴はいずれも行列形態である。セマンティック特徴空間とインスタンス特徴空間とのマッピング関係は、各ポイントの独立した全結合層により実現される。ここで、各ポイントの独立した全結合層は、各ポイントをそれぞれ処理する全結合層である。コンピュータ機器は、セマンティック特徴行列を各ポイントの独立した第1全結合層に入力し、第1全結合層によりセマンティック特徴行列を処理することで、インスタンス特徴空間にアダプテーションしたセマンティック特徴行列を出力することができる。
例示的な実施例において、セマンティック融合インスタンス特徴行列の演算式は、下記式に示すとおりである。

Figure 0007210085000001
ここで、FSINSは、セマンティック融合インスタンス特徴行列であり、FINSは、インスタンス特徴行列であり、FSEMは、セマンティック特徴行列であり、FC(FSEM)は、インスタンス特徴空間にアダプテーションしたセマンティック特徴行列である。
例示的な実施例において、各ポイントの独立した第1全結合層のネットワーク構造は、正規化層及び活性化層を含み、該2つのネットワーク層は、入力されたデータに対して順に処理を行う。ここで、活性化層の活性化関数は、ReLU活性化関数等であってもよく、本願の実施例は、これを具体的に限定しない。
更に、コンピュータ機器は更に、インスタンス特徴空間にアダプテーションした該セマンティック特徴行列とインスタンス特徴行列をビット毎に加算し(Element-wise addition)、セマンティック融合インスタンス特徴行列を得ることができる。ここで、ビット毎に加算するステップは、同一の行列要素位置での行列要素を加算することである。
例えば、行列

Figure 0007210085000002
行列

Figure 0007210085000003
について、行列F1と行列F2をビット毎に加算すると、行列

Figure 0007210085000004
を得る。
本願の実施例において、セマンティック特徴とインスタンス特徴は、意味が異なる特徴であるため、特徴融合の場合、一定の障害が存在する。ここで、全結合層により、セマンティック特徴をインスタンス特徴空間にアダプテーションさせることで、特徴融合の障害を克服し、セマンティック認識特性に富んだインスタンス特徴を得ることができ、後続のセグメンテーション処理に寄与する。
例示的な実施例において、コンピュータ機器は、複合セグメンテーションネットワーク構造により特徴融合処理を実現させることができる。図4は、一例示的な実施例による複合セグメンテーションネットワーク構造(Associatively Segmenting Instances and Semantics:ASIS)を示す概略図である。図4に示すように、複合セグメンテーションネットワーク構造は、セマンティック特徴行列FSEM及びインスタンス特徴行列FINSを同時に受信して共同で入力とし、セマンティック特徴行列FSEMをインスタンス特徴空間にアダプテーション(Adaptation)させた後に、インスタンス特徴行列FINSとビット毎に加算し、セマンティック融合インスタンス特徴行列FSINSを得る。ここで、セマンティック特徴行列FSEMをインスタンス特徴空間にアダプテーションさせるプロセスは、各ポイントの独立した全結合層により実現されてもよい。
S208において、ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得る。
S206で得られたセマンティック融合インスタンス特徴は、処理されるべきポイントクラウド全体に対応することが理解されるべきである。ここで、ポイントクラウド全体のセマンティック融合インスタンス特徴を処理し、分割することで、処理されるべきポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得る。
例示的な実施例において、S208は、第1行列を各ポイントの独立した第2全結合層に入力するステップと、第2全結合層に含まれる正規化層及び活性化層により、第1行列に対して順に処理を行い、処理されるべきポイントクラウドにおける各ポイントの第1ベクトルを得るステップであって、第1ベクトルは、セマンティック融合したインスタンス特徴ベクトルである、ステップと、を含む。
本願の実施例において、各ポイントの独立した全結合層により、ポイントクラウド全体のセマンティック融合インスタンス特徴を処理し、分割により、処理されるべきポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得る。コンピュータ機器は、ポイントクラウド全体のセマンティック融合インスタンス特徴行列を各ポイントの独立した第2全結合層に入力し、第2全結合層により、ポイントクラウド全体のセマンティック融合インスタンス特徴行列に対して処理を行うことで、処理されるべきポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を出力することができる。
例示的な実施例において、各ポイントの独立した第2全結合層のネットワーク構造は、正規化層及び活性化層を含む。該2つのネットワーク層は、入力されたデータに対して順に処理を行う。ここで、活性化層の活性化関数は具体的には、ReLU活性化関数等であってもよく、本願の実施例は、これを具体的に限定しない。
本願の実施例において、ポイントクラウド全体のセマンティック融合インスタンス特徴を得た後、全結合層により、各ポイントの第1ベクトルを得、後続のインスタンスセグメンテーションを順調に実行することを確保する。
引き続き図4を参照すると、コンピュータ機器は、複合セグメンテーションネットワーク構造により、セマンティック融合インスタンス特徴行列FSINSを得た後、各ポイントの独立した全結合層により、ポイントクラウドのインスタンス埋め込みベクトルEINSを出力する。ここで、EINSの大きさは、N×Nであり、Nは、嵌め込みベクトルの次元である。ポイントクラウドのインスタンス嵌め込みベクトルは、各ポイント(N個のポイント)の第1ベクトル(1×N)の集合と理解されてもよい。引き続き図3を参照すると、セマンティック特徴行列FSEM及びインスタンス特徴行列FINSを複合セグメンテーションネットワーク構造に入力した後に得られた出力の1つは、ポイントクラウドのインスタンス嵌め込みベクトルEINSであり、つまり、ポイントクラウドにおける各ポイントの第1ベクトルである。
S210において、各ポイントのセマンティック融合インスタンス特徴に基づいて、各ポイントが属するインスタンスカテゴリを決定する。
ここで、各ポイントが属するインスタンスカテゴリは、抽象レベルのインスタンスカテゴリであってもよい。例えば、第1インスタンスカテゴリ又は第2インスタンスカテゴリ等である。例示的に、ここの抽象は、これが1つのインスタンスであることを知っているが、具体的にどのインスタンスであるかを知っていないことである。例えば、自然人であることを知っているが、その名前を知っていない。各ポイントが属するインスタンスカテゴリは、具体的なレベルのインスタンスカテゴリであってもよい。例えば、1匹目の猫又は2匹目の猫などである。
ポイントクラウドのインスタンス嵌め込みベクトルは、ポイントクラウド内に含まれるポイントのインスタンス関係を表すことができることが理解されるべきである。同一のインスタンスに属するポイントは、インスタンス嵌め込みベクトル空間において互いに近接し、異なるインスタンスに属するポイントは、互いに離間する。従って、各ポイントが属する抽象レベルのインスタンスカテゴリにおいて、各ポイントのセマンティック融合インスタンス特徴に基づいてポイントをクラスタリングし、複数組のポイントを得ることができる。つまり、ポイントをインスタンスに応じて分割し、各組のポイントは、1つのインスタンスカテゴリに対応する。各ポイントが属する具体的なレベルのインスタンスカテゴリは、セマンティックセグメンテーション結果により決定する必要がある。
例示的な実施例において、S210は、ポイントクラウドにおける各ポイントに対して、該ポイントのセマンティック融合インスタンス特徴とポイントクラウドにおける該ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴との特徴距離を算出するステップと、算出された特徴距離に基づいて、ポイントクラウドにおける全てのポイントをクラスタリング(Clustering)し、複数組のポイントを得るステップであって、複数組のポイントにおける各組のポイントは、1つのインスタンスカテゴリに対応する、ステップと、を含む。
コンピュータ機器は、ポイントクラウドにおける各ポイントに対して、該ポイントのセマンティック融合インスタンス特徴とポイントクラウドにおける該ポイント以外の他のポイントのセマンティック融合インスタンス特徴との特徴距離を算出することができる。特徴距離は、該ポイントのセマンティック融合インスタンス特徴ベクトルとポイントクラウドにおける該ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴ベクトルとのベクトル距離である。例示的に、ここのベクトル距離は、ユークリッド距離又は他の距離などであってもよく、本願の実施例は、これを具体的に限定しない。上記演算プロセスにより、ポイントクラウドにおけるいずれか2つのポイントの間の特徴距離を算出することができる。
更に、コンピュータ機器は、ポイントクラウドにおけるいずれか2つのポイントの間の特徴距離を算出した後、ポイントクラウドにおける全てのポイントに対してクラスタリングを行い、複数組のポイントを得る。該複数組のポイントにおける各組のポイントは、それぞれ1つのインスタンスカテゴリに対応する。ポイントクラウドにおけるポイントのインスタンスセグメンテーションを行い、抽象レベルのインスタンス分割を実現させる。つまり、クラスタリング結果は、どの点が同一のインスタンスに属するかを示す。ここで、ポイントをクラスタリングするためのアルゴリズムは、mean-shiftクラスタリングアルゴリズム又はk近傍クラスタリングアルゴリズム等であってもよく、本願の実施例は、これを具体的に限定しない。
例を挙げて説明すると、1つのポイントクラウドに10個のポイントが存在する。これらのポイントは、クラスタリングにより得られた。ここで、3つのポイントは、第1インスタンスに属し、また3つのポイントは、第2インスタンスに属し、残った4つのポイントは、第3インスタンスに属する。これは、抽象レベルのインスタンスセグメンテーションである。
引き続き図3を参照すると、コンピュータ機器は、ポイントクラウドにおける各ポイントの第1ベクトルを得、つまり、ポイントクラウドのインスタンス嵌め込みベクトルEINSを得た後、各ポイントのセマンティック融合インスタンス特徴に対してクラスタリングを行い、抽象レベルのインスタンスセグメンテーション結果を得、どの点が同一のインスタンスカテゴリに属するかを決定することができる。
コンピュータ機器は、ポイントクラウドにおける全てのポイントをクラスタリングし、どのポイントが同一のインスタンスカテゴリに属するかを知った後、該インスタンス内の各ポイントのセマンティックセグメンテーション結果を参照しながら、該インスタンスの具体的なインスタンスカテゴリを決定することができる。例を挙げて説明すると、1つのポイントクラウドに10個のポイントが存在する。これらのポイントは、クラスタリングにより得られた。ここで、3つのポイントは、第1インスタンスに属し、また3つのポイントは、第2インスタンスに属し、残った4つのポイントは、第3インスタンスに属する。この場合、第1インスタンスにおける3つのポイントのセマンティックセグメンテーション結果は、猫である。従って、第1インスタンスは、1匹目の猫である。該インスタンス内のポイントのインスタンスカテゴリは、1匹目の猫である。第2インスタンスにおける3つのポイントのセマンティックセグメンテーション結果は、猫である。従って、第2インスタンスは、2匹目の猫である。該インスタンス内のポイントのインスタンスカテゴリは、2匹目の猫である。第3インスタンスにおける4つのポイントのセマンティックセグメンテーション結果は、猫である。従って、第3インスタンスは、3匹目の猫である。該インスタンス内のポイントのインスタンスカテゴリは、3匹目の猫である。これは、具体的なレベルのインスタンスセグメンテーション結果である。ポイントクラウドにおけるポイントのセマンティックセグメンテーションは、後続の実施例を参照することができる。
上記ポイントクラウドセグメンテーション方法は、まず、処理されるべきポイントクラウドを符号化し、共有特徴を得、次に、異なる復号化分岐により、共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得、続いて、セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドの、セマンティック認識特性に富んだインスタンス特徴を得、更に、ポイントクラウドにおける各ポイントの、セマンティック認識特性に富んだインスタンス特徴を得、各ポイントが属するインスタンスカテゴリを決定することができる。このように、セグメンテーションを行うために、特徴に基づく類似度行列に依存せず、ポイントクラウドセグメンテーションの効率を向上させる。また、セマンティック認識特性に富んだインスタンス特徴を学習することで、インスタンスセグメンテーションは、セマンティックセグメンテーションから利益を受けるようになり、ポイントクラウドセグメンテーションの正確性を大幅に向上させる。
図5に示すように、例示的な実施例において、本願の実施例が提供するポイントクラウドセグメンテーション方法は、セマンティックセグメンテーションステップを更に含み、該セマンティックセグメンテーションステップは、下記ステップを含む。
S502において、ポイントクラウドにおけるポイントをそれぞれ中心ポイントとする。
前記実施例は、ポイントクラウドに対してインスタンスセグメンテーションを実行しようとする場合、セマンティック特徴をインスタンス特徴に融合させてインスタンスセグメンテーションを行うプロセスであることに留意されたい。本実施例及び後続の実施例は、ポイントクラウドに対してセマンティックセグメンテーションを実行しようとする場合、インスタンス特徴をセマンティック特徴に融合させてセマンティックセグメンテーションを行うプロセスである。
ポイントクラウドにおけるいずれか2つのポイントの、インスタンス嵌め込みベクトル空間に対応するセマンティック融合インスタンス特徴の間の距離が距離要件を満たす場合、1つのポイントがもう1つのポイントの近隣店であると決定することが理解されるべきである。インスタンス嵌め込みベクトル空間は、セマンティック特徴を埋め込んだインスタンス特徴が位置する空間であり、つまり、セマンティック融合インスタンス特徴が位置する空間である。同一のインスタンスに属するこれらのポイントを融合してセマンティックセグメンテーションを行うべきである。同一のインスタンスに属するポイントがインスタンス嵌め込みベクトル空間において互いに近接し、異なるインスタンスに属するポイントが互いに離間するため、各ポイントのセマンティック融合インスタンス特徴間の特徴距離に基づいて、ポイントクラウドにおけるポイントに対して、インスタンスを単位としてクラスタリングを行い、後続のセマンティックセグメンテーションを行うことができる。
コンピュータ機器は、処理により、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得た後、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴間の特徴距離に基づいて、それぞれポイントクラウドにおける各ポイントを中心ポイントとしてクラスタリングを行い、各ポイントに近接する複数の近隣ポイント(中心ポイント自体を含む)を見出すことができる。各ポイントの複数の近隣ポイントは、1組のポイントであり、1組のポイントは、局所的ポイントクラウドと認められてもよい。
S504において、各ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントに対応する複数の近隣ポイントを決定する。
例示的な実施例において、各ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントに対応する複数の近隣ポイントを決定するステップは、各ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントとポイントクラウドにおける各ポイントとの特徴距離をそれぞれ算出するステップと、該中心ポイントとの特徴距離が所定の距離未満である複数のポイントを該中心ポイントに対応する複数の近隣ポイントとして選択するステップと、を含む。
コンピュータ機器は、ポイントクラウドにおけるポイントをそれぞれ中心ポイントとし、各中心ポイントに対して、該中心ポイントのセマンティック融合インスタンス特徴とポイントクラウドにおける該中心ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴との特徴距離を算出することができる。特徴距離は、該中心ポイントのセマンティック融合インスタンス特徴ベクトルとポイントクラウドにおける該中心ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴ベクトルとのベクトル距離である。
更に、コンピュータ機器は、各中心ポイントに対して、他のポイントと該中心ポイントとの特徴距離を算出した後、距離が小さい所定の数(K)のポイントを該中心ポイントの複数の近隣ポイント(中心ポイント自体を含む)として選別する。ここで、選別されたK個のポイントが同一のインスタンスに属することを確保するために、閾値δにより周辺ポイントをフィルタリングすることができる。例示的に、δの値は、0.5であってもよく、本願の実施例は、これを具体的に限定しない。
本願の実施例において、ポイントをクラスタリングすることで、ポイントクラウドにおける各ポイントをインスタンスに応じて分類する。このように、インスタンス特徴をセマンティック特徴に融合させる時、同一のインスタンスに属するポイントを融合してセマンティックセグメンテーションを行うことができる。セマンティックセグメンテーションは、インスタンスセグメンテーションから利益を受けるようになり、セマンティックセグメンテーションの正確性を大幅に向上させる。
例示的な実施例において、ポイントクラウドにおける各ポイントの複数の近隣ポイントの数は同じ出会っても異なってもよい。本願の実施例は、これを具体的に限定しない。
引き続き図4を参照すると、コンピュータ機器は、ポイントクラウドのインスタンス嵌め込みベクトルEINSを得、つまり、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴ベクトルを得た後、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴ベクトルに基づいて、kNN(k-NearestNeighbor:k近傍アルゴリズム)を用いて、各ポイントに対して、インスタンス嵌め込みベクトル空間において、所定の数(K)の近隣ポイント(自己を含む)を見出すことができる。
S506において、各中心ポイントに対応する複数の近隣ポイントのセマンティック特徴を融合し、対応する中心ポイントのインスタンス融合セマンティック特徴を得る。
各中心ポイントとそれに隣接する複数の近隣ポイントは、同一のインスタンスに属する。同一のインスタンスに属する点を融合してセマンティックセグメンテーションを行うことができることが理解されるべきである。従って、各中心ポイントに対して、該中心ポイントの複数の近隣ポイントを融合することで、対応する中心ポイントのインスタンス融合セマンティック特徴を得ることができる。つまり、インスタンス特徴を融合したセマンティック特徴である。
例示的な実施例において、異なる復号化方式で共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るステップは、第1復号化方式で共有特徴を復号化し、ポイントクラウドのセマンティック特徴行列を得、第1復号化方式と異なる第2復号化方式で共有特徴を復号化し、ポイントクラウドのインスタンス特徴行列を得るステップであって、セマンティック特徴行列は、ポイントクラウドにおける各ポイントのセマンティック特徴ベクトルを含む、ステップを含む。
コンピュータ機器は、第1復号化方式で共有特徴を復号化することで、ポイントクラウドのセマンティック特徴行列を得る。該ポイントクラウドのセマンティック特徴行列は、ポイントクラウドにおける各ポイントのセマンティック特徴ベクトルの集合と認められてもよい。例を挙げて説明すると、コンピュータ機器は、共有特徴行列を復号化し、セマンティック特徴行列(大きさがN×NであるFSEM)を得る。つまり、各ポイント(N個のポイント)のセマンティック特徴ベクトル(大きさが1×Nである)を得る。
例示的な実施例において、各複数の近隣ポイントのセマンティック特徴を融合し、対応する中心ポイントのインスタンス融合セマンティック特徴を得るステップは、各中心ポイントに対応する複数の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合し、対応する中心ポイントの第2ベクトルを得るステップであって、第2ベクトルは、インスタンス融合したセマンティック特徴ベクトルである、ステップを含む。
更に、コンピュータ機器は、ポイントクラウドにおける各ポイントの複数の近隣ポイントを得た後、該複数の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合し、該ポイントの第2ベクトルを得る。第2ベクトルは、インスタンス融合したセマンティック特徴ベクトルである。ここで、複数の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合するステップは、ビット毎に最大集合演算を行うことであり、つまり、ビット毎に最大値を取る。例を挙げて説明すると、ベクトルX1=(1,2,3)、ベクトルX2=(3,4,5)、ベクトルX1=(2,6,1)である。従って、該3つのベクトルに対してビット毎に最大値を取ると、X=(3,6,5)を得る。
本願の実施例において、ポイントをクラスタリングし、ポイントクラウドにおけるポイントをインスタンスに応じて分類する。従って、インスタンス特徴をセマンティック特徴に融合する時、同一のインスタンスに属するこれらのポイントを融合してセマンティックセグメンテーションを行うことができる。セマンティックセグメンテーションは、インスタンスセグメンテーションから利益を受けるようになり、セマンティックセグメンテーションの正確性を向上させる。
ポイントクラウドにおけるポイントをクラスタリングした後、各ポイントは、1つのインデックス行列に対応することが理解されるべきである。インデックス行列は、特徴融合のための根拠である。インデックス行列は、1つのポイントクラウドにおけるポイントの間の隣接関係を表す。つまり、1つのポイントのインデックス行列は、該ポイントに近接する複数の近隣ポイントに指向する。ポイントクラウド内のポイントのセマンティック特徴ベクトルが組み合わせられて大きさがN×K×Nである特徴テンソルとなる。該特徴テンソルは、各ポイントの局所ポイントクラウドを明示的に記述する。つまり、N組のセマンティック特徴ベクトルが存在する。各組にK個のセマンティック特徴ベクトルが存在する。ここで、Kは、1つのポイントの近隣ポイントの数である。
引き続き図4を参照すると、コンピュータ機器は、各ポイントに対して、インスタンス嵌め込みベクトル空間において、所定の数(K)の近隣ポイント(自己を含む)を見出した後、該K個の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合(Aggregation)して、該K個の近隣ポイントの中心ポイントのインスタンス融合セマンティック特徴ベクトルとする。更に、ポイントクラウドのセマンティック嵌め込みベクトルFISEMを得る。つまり、ポイントクラウドにおける全てのポイントのインスタンス融合セマンティック特徴ベクトルの集合を得る。
S508において、ポイントクラウドにおける各中心ポイントのインスタンス融合セマンティック特徴に基づいて、各ポイントが属するセマンティックカテゴリを決定する。
ポイントクラウドにおける各ポイントは、いずれも中心ポイントとされてもよい。従って、ポイントクラウドにおける各ポイントはいずれも複数の近隣ポイントに対応する。つまり、ポイントクラウドにおける各ポイントに対して、いずれも、1つのインスタンス融合セマンティック特徴を算出することができる。ポイントクラウドにおける各ポイントは、いずれも、インスタンス融合セマンティック特徴に基づいて、これが属するセマンティックカテゴリを決定することができる。
例示的な実施例において、ポイントクラウドにおける各ポイントのインスタンス融合セマンティック特徴に基づいて、対応するポイントが属するセマンティックカテゴリを決定するステップは、各ポイントの独立した第3全結合層により、各中心ポイントのインスタンス融合セマンティック特徴を対応するセマンティック予測ベクトルに変換するステップと、各中心ポイントのセマンティック予測ベクトルにおける最大ベクトル要素に対応するセマンティックカテゴリを各ポイントが属するセマンティックカテゴリとするステップと、を含む。
本願の実施例において、各ポイントの独立した全結合層により、インスタンス融合セマンティック特徴に基づいてポイントクラウドにおけるポイントに対してセマンティックセグメンテーション処理を行うことを実現させる。コンピュータ機器は、ポイントクラウド全体のセマンティック嵌め込みベクトルである、各ポイントのインスタンス融合セマンティック特徴ベクトルを、各ポイントの独立した第3全結合層に入力し、第3全結合層によりポイントクラウド全体のセマンティック嵌め込みベクトルに対して処理を行うことで、ポイントクラウドのセマンティック予測行列を出力することができる。該ポイントクラウドのセマンティック予測行列は、各ポイントのセマンティック予測ベクトルを含む。ここで、各ポイントのセマンティック予測ベクトルの次元は、所定のセマンティックカテゴリの数である。これにより、各ポイントのセマンティック予測ベクトルにおける最大ベクトル要素に対応するセマンティックカテゴリを各ポイントが属するセマンティックカテゴリとすることができる。
セマンティック予測ベクトルにおける各ベクトル要素は、それぞれ1つのセマンティックカテゴリの確率に対応してもよい。例を挙げて説明すると、1つのポイントのセマンティック予測ベクトルがXSEM=(0.1,0.1,0.6,0.1,0.1)であり、第3ビットのベクトル要素が最も大きいとすれば、該ベクトル要素に対応するセマンティックカテゴリは、該ポイントが属するセマンティックカテゴリである。
例示的な実施例において、各ポイントの独立した第3全結合層のネットワーク構造は、正規化層及び活性化層を含み、該2つのネットワーク層は、入力されたデータに対して順に処理を行う。
引き続き図4を参照すると、コンピュータ機器は、ポイントクラウドのセマンティック嵌め込みベクトルFISEMを得、つまり、ポイントクラウドにおける各ポイントのインスタンス融合セマンティック特徴ベクトルを得た後、各ポイントの独立した全結合層により、ポイントクラウドのセマンティック予測行列PSEMである、各ポイントのセマンティック予測ベクトルの集合を出力する。
引き続き図3を参照すると、セマンティック特徴行列FSEM及びインスタンス特徴行列FINSを複合セグメンテーションネットワーク構造に入力した後、セマンティック予測行列PSEMというもう1つの出力を得る。ここで、コンピュータ機器における所定のセマンティックカテゴリの数はNであり、セマンティック予測行列PSEMの大きさは、N×Nである。コンピュータ機器は、PSEMに対してArgmax(最大値引数ポイント集合)演算を行い、各ポイントが属するセマンティックカテゴリを決定することができる。
本願の実施例において、ポイントクラウド全体のインスタンス融合セマンティック特徴を得た後、全結合層により、各ポイントに対してセマンティックセグメンテーションを行い、セグメンテーション結果をより正確にすることができる。
例示的な実施例において、ステップS510を更に含む。
S510において、各ポイントのセマンティック融合インスタンス特徴及び属するセマンティックカテゴリに基づいて、各ポイントが属するインスタンスカテゴリを決定する。
例示的な実施例において、各ポイントのセマンティック融合インスタンス特徴及び属するセマンティックカテゴリに基づいて、各ポイントが属するインスタンスカテゴリを決定するステップは、ポイントクラウドにおける各点に対して、該ポイントのインスタンス特徴とポイントクラウドにおける該ポイント以外の他の各ポイントのインスタンス特徴との特徴距離を算出するステップと、算出された特徴距離に基づいて、ポイントクラウドにおける全てのポイントをクラスタリングし、複数組のポイントを得るステップと、複数組のポイントにおける各組のポイントが属するセマンティックカテゴリに基づいて、各組のポイントが属するインスタンスカテゴリを決定するステップと、を含み、つまり、各組のポイントに含まれるポイントが属するセマンティックカテゴリに基づいて、各組のポイントに含まれるポイントが属するインスタンスカテゴリを決定する。ここで、S510は、S210に含まれる。
セマンティックセグメンテーション結果を取得していない場合、ポイントクラウドに対するインスタンスセグメンテーションは、抽象レベルのインスタンスセグメンテーションであることが理解されるべきである。その結果により、どのポイントが1つのインスタンスに属するかのみを決定できる。セマンティックセグメンテーション結果を得た後、セマンティックセグメンテーション結果を参照しながら、具体的レベルのインスタンスセグメンテーション結果を得ることができる。
引き続き図3を参照すると、コンピュータ機器は、ポイントクラウドにおける各ポイントのセマンティックセグメンテーション結果を得た後、抽象レベルのインスタンスセグメンテーション結果をそれと組み合わせて、具体的レベルのインスタンスセグメンテーション結果を得、どのポイントがどのインスタンスに属するかを決定することができる。
例を挙げて説明すると、コンピュータ機器は、どのポイントが同一のインスタンスに属するかを決定した後、該インスタンス内の各ポイントのセマンティックセグメンテーション結果を参照しながら、該インスタンスの具体的な具体インスタンスカテゴリを決定することができる。例を挙げて説明すると、1つのポイントクラウドに10個のポイントが存在する。これらは、クラスタリングにより得られた。ここで、3つのポイントは、第1インスタンスに属し、また3つのポイントは、第2インスタンスに属し、残った4つのポイントは、第3インスタンスに属する。この場合、第1インスタンスにおける3つのポイントのセマンティックセグメンテーション結果は、猫である。従って、第1インスタンスは、1匹目の猫であり、該インスタンス内のポイントのインスタンスカテゴリは、1匹目の猫である。第2インスタンスにおける3つのポイントのセマンティックセグメンテーション結果は、猫である。従って、第2インスタンスは、2匹目の猫であり、該インスタンス内のポイントのインスタンスカテゴリは、2匹目の猫である。第3インスタンスにおける4つのポイントのセマンティックセグメンテーション結果は、猫である。従って、第3インスタンスは、3匹目の猫であり、該インスタンス内のポイントのインスタンスカテゴリは、3匹目の猫である。これは、具体的レベルのインスタンスセグメンテーション結果である。
本願の実施例において、抽象レベルのインスタンスセグメンテーション結果を得た後、セマンティックセグメンテーション結果を参照しながら、具体的レベルのインスタンスセグメンテーション結果を決定することができる。ここで、セマンティックセグメンテーションは、インスタンスセグメンテーションから利益を受け、インスタンスセグメンテーションもセマンティックセグメンテーションから利益を受ける。これにより、ポイントクラウドセグメンテーションの正確性を大幅に向上させる。
図6は、一実施例による複合セグメンテーション三次元ポイントクラウドにおけるインスタンス及びセマンティックを示す概略図である。図6を参照すると、処理されるべき三次元ポイントクラウドを符号化(Encoder)した後に共有特徴を得る。並行して共有特徴をセマンティックセグメンテーション分岐により復号化(Sem.Decoder)してセマンティック特徴を得てインスタンスセグメンテーション分岐により復号化(Ins.Decoder)してインスタンス特徴を得た後、セマンティック特徴とインスタンス特徴を更に複合セグメンテーション(ASIS)により、セマンティック融合インスタンスセグメンテーションした三次元ポイントクラウド及びインスタンス融合セマンティックセグメンテーションした三次元ポイントクラウドを得る。
上記実施例において、まず、処理されるべきポイントクラウドを符号化し、共有特徴を得、次に、異なる復号化分岐により、共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得る。セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドの、セマンティック認識特性に富んだインスタンス特徴を得、更に、ポイントクラウドにおける各ポイントの、セマンティック認識特性に富んだインスタンス特徴を得る。一方で、各ポイントの、セマンティック認識特性に富んだインスタンス特徴に基づいて、ポイントクラウドにおける各ポイントをインスタンスに応じて分類し、1つのインスタンスに属するポイントのセマンティック特徴を融合する。これにより、セマンティックセグメンテーションは、インスタンスセグメンテーションから利益を受けるようになる。このように、セマンティック認識特性に富んだインスタンス特徴を学習することで、インスタンスセグメンテーションがセマンティックセグメンテーションから利益を受けるようになる。それと同時に、同一のインスタンスに属するポイントのセマンティック特徴は融合されて、より正確なセマンティックカテゴリ予測結果を生成する。2種のセグメンテーションは、互いに相手から利益を受け、双方が満足した特性向上を実現させ、セグメンテーションの効率を向上させるだけでなく、セグメンテーションの正確性も向上させる。
例示的な実施例において、ポイントクラウドセグメンテーション方法は、ステップS202-S208又はS502-S508のみを含んでもよい。つまり、ポイントクラウドに対してセマンティック融合インスタンスセグメンテーション又はインスタンス融合セマンティックセグメンテーションを行うステップのみを含んでもよい。
例示的な実施例において、本願の実施例で提供されるポイントクラウドセグメンテーション方法は、処理されるべきポイントクラウドを符号化し、共有特徴を得るステップと、異なる復号化方式で共有特徴を復号化し、ポイントクラウドのセマンティック特徴及びポイントクラウドのインスタンス特徴をそれぞれ得るステップと、ポイントクラウドのセマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にポイントクラウドのインスタンス特徴と融合し、ポイントクラウドのセマンティック融合インスタンス特徴を得るステップと、ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得るステップと、各ポイントのセマンティック融合インスタンス特徴に基づいて、各ポイントに対応する複数の近隣ポイントを決定するステップと、各ポイントに対応する複数の近隣ポイントのセマンティック特徴を融合し、対応するポイントのインスタンス融合セマンティック特徴を得るステップと、各ポイントのインスタンス融合セマンティック特徴に基づいて、対応するポイントが属するセマンティックカテゴリを決定するステップと、各ポイントのセマンティック融合インスタンス特徴及び属するセマンティックカテゴリに基づいて、各ポイントが属するインスタンスカテゴリを決定するステップと、を含んでもよい。つまり、ポイントクラウドに対してインスタンス融合セマンティックセグメンテーションとセマンティック融合インスタンスセグメンテーションとの複合処理を行うステップを含んでもよい。
例示的な実施例において、処理されるべきポイントクラウドを取得した後、ポイントクラウドに対して処理を行い、インスタンスセグメンテーション結果及びセマンティックセグメンテーション結果を得るまで継続するプロセスにおいて、用いられる深層学習ネットワーク構造は、統合訓練により得られる。該訓練プロセスは、教師あり訓練プロセスである。訓練データは、ポイントクラウドサンプルである。コンピュータ機器は、各ポイントクラウドサンプルにおける各ポイントサンプルに対して、インスタンスカテゴリタグ及びセマンティックカテゴリタグを決定して、教師あり訓練を行うことができる。
要するに、本願の実施例が提供する技術的解決手段は、幅広い応用見通しを有し、自動運転、室内ナビゲーション及び拡張現実などの分野において大きな潜在性を有する。また、三次元センサの成長及び普及に伴い、三次元空間に対するセンシングは特に重要になる。例えば、室内ロボットの制御において、走査により得られた三次元ポイントクラウドをセグメンテーションし、例えば、セマンティック及びインスタンスに応じてセグメンテーションを行うことができれば、ロボットが各種の物体(セマンティックセグメンテーション)、延いては各物体(インスタンスセグメンテーション)を感知できるようになり、ロボットのナビゲーション及び制御能力を更に向上させることができる。
ここで、セマンティックセグメンテーションは、室内ロボットの制御を指導するために用いられる。例えば、室内シーンにおいて、ロボットは、センサにより、手前のポイントクラウドを得る。本願が提供する技術的解決手段によれば、ロボットに、手前がドアであることを知らせ、どの部分がドアのハンドルであるかを知らせることができる。これにより、後続のドア開け等の動作を行うことができる。
インスタンスセグメンテーションについて、初段の適用は、数統計であり、例えば、部屋内の椅子の数を統計する。ロボットに対する制御を指導することもできる。例えば、各椅子の位置を知ることができる。又は、拡張現実シーンにおいて、各椅子をモンスターに変換することができる。
上記各実施例のフローチャートにおける各ステップは矢印に示される順番で表示されるが、これらのステップは、必ずしも矢印に示される順番で順次実行されるとは限らないと理解されるべきである。本明細書に特に明記しない限り、これらのステップの実行は厳格な順番に限定されるものではない。これらのステップは、他の順番で実行されてもよい。また、各実施例における少なくとも一部のステップは、複数のサブステップ又は複数の段階を含んでもよい。これらのサブステップ又は段階は、必ずしも同一の時刻で実行されるとは限らず、異なる時刻で実行されてもよい。これらのサブステップ又は段階は必ずしも実行順番で実行されるとは限らず、他のステップ又は他のステップのサブステップや段階の少なくとも一部と共に順次実行されてもよいし、交替で実行されてもよい。
図7に示すように、例示的な実施例において、ポイントクラウドセグメンテーション装置700を提供する。図7を参照すると、該ポイントクラウドセグメンテーション装置700は、符号化モジュール701と、復号化モジュール702と、セマンティック融合インスタンスモジュール703と、セマンティック融合インスタンスセグメンテーションモジュール704と、を備える。
符号化モジュール701は、処理されるべきポイントクラウドに対して符号化を行い、共有特徴を得るように構成される。
復号化モジュール702は、異なる復号化方式で共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るように構成される。
セマンティック融合インスタンスモジュール703は、セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドのセマンティック融合インスタンス特徴を得るように構成され、セマンティック融合インスタンス特徴は、セマンティック特徴を融合したインスタンス特徴を表す。セマンティック融合インスタンスモジュール703は、ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得るように構成される。
セマンティック融合インスタンスセグメンテーションモジュール704は、各ポイントのセマンティック融合インスタンス特徴に基づいて、各ポイントが属するインスタンスカテゴリを決定するように構成される。
上記ポイントクラウドセグメンテーション装置700は、まず、処理されるべきポイントクラウドを符号化し、共有特徴を得、次に、異なる復号化分岐により、共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得、続いて、セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドの、セマンティック認識特性に富んだインスタンス特徴を得、更に、ポイントクラウドにおける各ポイントの、セマンティック認識特性に富んだインスタンス特徴を得、各ポイントが属するインスタンスカテゴリを決定することができる。このように、セグメンテーションを行うために、特徴に基づく類似度行列に依存せず、ポイントクラウドセグメンテーションの効率を向上させる。また、セマンティック認識特性に富んだインスタンス特徴を学習することで、インスタンスセグメンテーションは、セマンティックセグメンテーションから利益を受けるようになり、ポイントクラウドセグメンテーションの正確性を大幅に向上させる。
例示的な実施例において、符号化モジュール701は更に、処理されるべきポイントクラウドを取得し、ポイントクラウドにおける各ポイントの座標特徴とチャネル特徴を組み合わせ、対応するポイントの初期特徴を得、各前記ポイントの初期特徴を共同で符号化し、前記ポイントクラウドに対応する共有特徴を得るように構成される。
例示的な実施例において、復号化モジュール702は更に、第1復号化構造により共有特徴を復号化し、セマンティック特徴を得、第2復号化構造により共有特徴を復号化し、インスタンス特徴を得るように構成され、第1復号化構造と第2復号化構造とは、構造が同じであるが、復号化パラメータが異なる。
例示的な実施例において、セマンティック特徴は、セマンティック特徴行列であり、インスタンス特徴は、インスタンス特徴行列である。セマンティック融合インスタンスモジュール703は更に、各ポイントの独立した第1全結合層によりセマンティック特徴行列をインスタンス特徴空間にアダプテーションさせ、インスタンス特徴空間にアダプテーションしたセマンティック特徴行列とインスタンス特徴行列をビット毎に加算し、ポイントクラウドの第1行列を得るように構成され、前記第1行列は、セマンティック融合したインスタンス特徴行列である。
例示的な実施例において、セマンティック融合インスタンスモジュール703は更に、ポイントクラウドのセマンティック融合インスタンス特徴行列を各ポイントの独立した第2全結合層に入力し、第2全結合層に含まれる正規化層及び活性化層により、ポイントクラウドの第1行列に対して順に処理を行い、ポイントクラウドにおける各ポイントの第1ベクトルを得るように構成され、第1ベクトルは、セマンティック融合したインスタンス特徴ベクトルである。
例示的な実施例において、セマンティック融合インスタンスセグメンテーションモジュール704は更に、ポイントクラウドにおける各ポイントに対して、ポイントのセマンティック融合インスタンス特徴とポイントクラウドにおける前記ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴との特徴距離をそれぞれ算出し、算出された特徴距離に基づいて、ポイントクラウドにおけるポイントをクラスタリングし、複数組のポイントを得るように構成され、複数組のポイントにおける各組のポイントは、1つのインスタンスカテゴリに対応する。
図8に示すように、例示的な実施例において、ポイントクラウドセグメンテーション装置700は、インスタンス融合セマンティックモジュール705と、インスタンス融合セマンティックセグメンテーションモジュール706と、を更に備える。
インスタンス融合セマンティックモジュール705は、ポイントクラウドにおける各ポイントをそれぞれ中心ポイントとし、各ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントに対応する複数の近隣ポイントを決定し、各中心ポイントに対応する複数の近隣ポイントのセマンティック特徴を融合し、対応する中心ポイントのインスタンス融合セマンティック特徴を得るように構成される。
インスタンス融合セマンティックセグメンテーションモジュール706は、各中心ポイントのインスタンス融合セマンティック特徴に基づいて、各ポイントが属するセマンティックカテゴリを決定するように構成される。
上記ポイントクラウドセグメンテーション装置700は、まず、処理されるべきポイントクラウドを符号化し、共有特徴を得、次に、異なる復号化分岐により、共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得る。セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドの、セマンティック認識特性に富んだインスタンス特徴を得、更に、ポイントクラウドにおける各ポイントの、セマンティック認識特性に富んだインスタンス特徴を得る。一方で、各ポイントの、セマンティック認識特性に富んだインスタンス特徴に基づいて、ポイントクラウドにおける各ポイントをインスタンスに応じて分類し、1つのインスタンスに属するポイントのセマンティック特徴を融合する。これにより、セマンティックセグメンテーションは、インスタンスセグメンテーションから利益を受けるようになる。このように、セマンティック認識特性に富んだインスタンス特徴を学習することで、インスタンスセグメンテーションがセマンティックセグメンテーションから利益を受けるようになる。それと同時に、同一のインスタンスに属するポイントのセマンティック特徴は融合されて、より正確なセマンティックカテゴリ予測結果を生成する。2種のセグメンテーションは、互いに相手から利益を受け、双方が満足した特性向上を実現させ、セグメンテーションの効率を向上させるだけでなく、セグメンテーションの正確性も向上させる。
例示的な実施例において、インスタンス融合セマンティックモジュール705は更に、各ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントとポイントクラウドにおける各ポイントとの特徴距離をそれぞれ算出し、中心ポイントとの特徴距離が所定の距離未満である複数のポイントを中心ポイントに対応する複数の近隣ポイントとして選択するように構成される。
例示的な実施例において、復号化モジュール702は更に、第1復号化方式で共有特徴を復号化し、ポイントクラウドのセマンティック特徴行列を得、第1復号化方式と異なる第2復号化方式で共有特徴を復号化し、ポイントクラウドのインスタンス特徴行列を得るように構成され、セマンティック特徴行列は、ポイントクラウドにおける各ポイントのセマンティック特徴ベクトルを含む。インスタンス融合セマンティックモジュール705は更に、各中心ポイントに対応する複数の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合し、対応する中心ポイントの第2ベクトルを得るように構成され、第2ベクトルは、インスタンス融合したセマンティック特徴ベクトルである。
例示的な実施例において、インスタンス融合セマンティックセグメンテーションモジュール706は更に、各ポイントの独立した第3全結合層により、各中心ポイントのインスタンス融合セマンティック特徴を対応するセマンティック予測ベクトルに変換し、各中心ポイントのセマンティック予測ベクトルにおける最大ベクトル要素に対応するセマンティックカテゴリを各ポイントが属するセマンティックカテゴリとするように構成される。
例示的な実施例において、セマンティック融合インスタンスセグメンテーションモジュール704は更に、ポイントクラウドにおける各点に対して、前記ポイントのインスタンス特徴とポイントクラウドにおける前記ポイント以外の他の各ポイントのインスタンス特徴との特徴距離を算出し、算出された特徴距離に基づいて、ポイントクラウドにおけるポイントをクラスタリングし、複数組のポイントを得、複数組のポイントにおける各組のポイントが属するセマンティックカテゴリに基づいて、各組のポイントが属するインスタンスカテゴリを決定するように構成される。
図9は、一例示的な実施例によるコンピュータ機器の内部構造を示す図である。該コンピュータ機器は、図1に示した端末110又はサーバ120であってもよい。図9に示すように、該コンピュータ機器は、システムバスを介して接続されるプロセッサ、メモリ及びネットワークインタフェースを備える。ここで、メモリは、不揮発性記憶媒体及び内部メモリを含む。該コンピュータ機器の不揮発性記憶媒体には、オペレーティングシステムが記憶されており、コンピュータプログラムが記憶されてもよい。該コンピュータプログラムがプロセッサにより実行されるときに、プロセッサに、ポイントクラウドセグメンテーション方法を実行させる。該内部メモリには、コンピュータプログラムが記憶されてもよい。該コンピュータプログラムがプロセッサにより実行されるときに、プロセッサに、ポイントクラウドセグメンテーション方法を実行させる。当業者には明らかなように、図9示した構造は、本願の技術的解決手段に関連する一部の構造のブロック図に過ぎず、本願の技術的解決手段に適用されるコンピュータ機器を限定するものではなく、具体的なコンピュータ機器は、図示したものより多く又はより少ない部材を備えてもよいし、幾つかの部材を組み合わせたものであってもよいし、異なる部材配置を備えてもよい。
例示的な実施例において、本願が提供するポイントクラウドセグメンテーション装置は、コンピュータプログラムの形態として実現してもよい。コンピュータプログラムは、図9に示したコンピュータ機器上で実行可能である。コンピュータ機器のメモリに、該ポイントクラウドセグメンテーション装置を構成する各プログラムモジュールが記憶されてもよい。例えば、図7に示した符号化モジュール701、復号化モジュール702、セマンティック融合インスタンスモジュール703及びセマンティック融合インスタンスセグメンテーションモジュール704が記憶されてもよい。各プログラムモジュールで構成されるコンピュータプログラムは、プロセッサに本明細書に記載の本願の各実施例のポイントクラウドセグメンテーション方法におけるステップを実行させる。
例えば、図9に示したコンピュータ機器は、図7に示したポイントクラウドセグメンテーション装置700における符号化モジュール701により、処理されるべきポイントクラウドを符号化し、共有特徴を得ることができる。復号化モジュール702により、異なる復号化方式で共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得る。セマンティック融合インスタンスモジュール703により、セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後にインスタンス特徴と融合し、ポイントクラウドのセマンティック融合インスタンス特徴を得る。ポイントクラウドのセマンティック融合インスタンス特徴は、セマンティック特徴を融合したインスタンス特徴を表す。ポイントクラウドのセマンティック融合インスタンス特徴を分割し、ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得る。セマンティック融合インスタンスセグメンテーションモジュール704により、各ポイントのセマンティック融合インスタンス特徴に基づいて、各ポイントが属するインスタンスカテゴリを決定する。
例示的な実施例において、メモリと、プロセッサと、を備えるコンピュータ機器を提供する。メモリにコンピュータプログラムが記憶されており、コンピュータプログラムがプロセッサにより実行されるときに、プロセッサに上記ポイントクラウドセグメンテーション方法のステップを実行させる。ここのポイントクラウドセグメンテーション方法のステップは、上記各実施例のポイントクラウドセグメンテーション方法におけるステップであってもよい。
例示的な実施例において、コンピュータプログラムを記憶したコンピュータ可読記憶媒体を提供する。コンピュータプログラムがプロセッサにより実行されるときに、プロセッサに上記ポイントクラウドセグメンテーション方法のステップを実行させる。ここのポイントクラウドセグメンテーション方法のステップは、上記各実施例のポイントクラウドセグメンテーション方法におけるステップであってもよい。
例示的な実施例において、コンピュータプログラム提供する。コンピュータプログラムはコンピュータに上記ポイントクラウドセグメンテーション方法のステップを実行させる。ここのポイントクラウドセグメンテーション方法のステップは、上記各実施例のポイントクラウドセグメンテーション方法におけるステップであってもよい。
当業者であれば、上述した実施例の方法におけるすべて又は一部のフローの実現について、コンピュータプログラムによって関連したハードウェアに指示を出すことで完成することができ、前記プログラムが不揮発性コンピュータ可読記憶媒体に記憶されてもよく、該プログラムが実行される場合、上記各方法の実施例のフローを含んでもよいことが理解すべきである。ここで、本願が提供する各実施例に用いられるメモリ、記憶、データベース又は他の媒体へのあらゆる言及は不揮発性及び/又は揮発性メモリを含む。不揮発性メモリは、リードオンリーメモリ(ROM)、プログラマブルROM(PROM)、電気的プログラマブルROM(EPROM)、電気的に消去可能なプログラマブルROM(EEPROM)又はフラッシュメモリを含んでもよい。揮発性メモリは、ランダムアクセスメモリ(RAM)又は外部キャッシュメモリを含んでもよい。非限定的な例証として、RAMは、スタティックRAM(SRAM)、ダイナミックRAM(DRAM)、同期DRAM(SDRAM)、ダブルデータレートSDRAM(DDRSDRAM)、エンハンストSDRAM(ESDRAM)、同期リンク(Synchlink)DRAM(SLDRAM)及び、メモリラムバス(Rambus)ダイレクトRAM(RDRAM)、ダイレクトメモリラムバスダイナミックRAM(DRDRAM)及びメモリラムバスダイナミックRAM(RDRAM)などの多数の形態で使用可能である。
以上の実施例の各技術的特徴は任意に組み合わせることができ、説明を簡潔にするために、上記実施例における各技術的特徴のすべての可能な組合せについて説明していないが、これらの技術的特徴の組合せは矛盾しない限り、本明細書に記載されている範囲に属すると考えられる。
以上の実施例は本願の幾つかの実施形態を示したものに過ぎず、具体的かつ詳細に記載はしたが、これにより本願の特許請求の範囲が限定されると解釈すべきではない。当業者にとって、本願の構想を離脱しない前提で、さらに複数の変形及び改良を行うことができるが、これらは全て本願の保護範囲に属されるべきであることに留意されたい。従って、本願の特許の保護範囲は添付の請求項に準ずるべきである。
700 ポイントクラウドセグメンテーション装置
701 符号化モジュール
702 復号化モジュール
703 セマンティック融合インスタンスモジュール
704 セマンティック融合インスタンスセグメンテーションモジュール
705 インスタンス融合セマンティックモジュール
706 インスタンス融合セマンティックセグメンテーションモジュール

Claims (13)

  1. コンピュータ機器が実行するポイントクラウドセグメンテーション方法であって、
    処理されるべきポイントクラウドに対して符号化を行い、共有特徴を得るステップであって、前記共有特徴は、セマンティックレベル及びインスタンスレベルで共有される特徴である、ステップと、
    異なる復号化方式で前記共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るステップと、
    各ポイントをそれぞれ処理する各ポイントの独立した全結合層により前記セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後に前記インスタンス特徴と融合し、前記ポイントクラウドのセマンティック融合インスタンス特徴を得るステップであって、前記セマンティック融合インスタンス特徴は、セマンティック特徴を融合したインスタンス特徴を表す、ステップと、
    前記ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、前記ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得るステップと、
    各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記ポイントが属するインスタンスカテゴリを決定するステップと、を含む、ポイントクラウドセグメンテーション方法。
  2. 前記処理されるべきポイントクラウドに対して符号化を行い、共有特徴を得るステップは、
    処理されるべきポイントクラウドを取得するステップと、
    前記ポイントクラウドにおける各ポイントの座標特徴とチャネル特徴を組み合わせ、対応するポイントの初期特徴を得るステップと、
    各前記ポイントの初期特徴を共同で符号化し、前記ポイントクラウドに対応する共有特徴を得るステップと、を含むことを特徴とする
    請求項1に記載のポイントクラウドセグメンテーション方法。
  3. 前記異なる復号化方式で前記共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るステップは、
    第1復号化構造により前記共有特徴を復号化し、セマンティック特徴を得るステップと、
    第2復号化構造により前記共有特徴を復号化し、インスタンス特徴を得るステップと、を含み、
    前記第1復号化構造と前記第2復号化構造とは、構造が同じであるが、復号化パラメータが異なることを特徴とする
    請求項1に記載のポイントクラウドセグメンテーション方法。
  4. 前記セマンティック特徴は、セマンティック特徴行列であり、前記インスタンス特徴は、インスタンス特徴行列であり、各ポイントをそれぞれ処理する各ポイントの独立した全結合層により前記セマンティック特徴をインスタンス特徴空間にアダプテーションさせた後に前記インスタンス特徴と融合し、前記ポイントクラウドのセマンティック融合インスタンス特徴を得るステップは、
    各ポイントの独立した第1全結合層により前記セマンティック特徴行列をインスタンス特徴空間にアダプテーションさせるステップと、
    前記インスタンス特徴空間にアダプテーションしたセマンティック特徴行列と前記インスタンス特徴行列をビット毎に加算し、前記ポイントクラウドの第1行列を得るステップであって、前記第1行列は、セマンティック融合したインスタンス特徴行列である、ステップと、を含むことを特徴とする
    請求項1に記載のポイントクラウドセグメンテーション方法。
  5. 前記ポイントクラウドのセマンティック融合インスタンス特徴に対して分割を行い、前記ポイントクラウドにおける各ポイントのセマンティック融合インスタンス特徴を得るステップは、
    前記ポイントクラウドのセマンティック融合インスタンス特徴行列を各ポイントの独立した第2全結合層に入力するステップと、
    前記第2全結合層に含まれる正規化層及び活性化層により、前記ポイントクラウドの第1行列に対して順に処理を行い、前記ポイントクラウドにおける各ポイントの第1ベクトルを得るステップであって、前記第1ベクトルは、セマンティック融合したインスタンス特徴ベクトルである、ステップと、を含むことを特徴とする
    請求項4に記載のポイントクラウドセグメンテーション方法。
  6. 前記各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記ポイントが属するインスタンスカテゴリを決定するステップは、
    前記ポイントクラウドにおける各ポイントに対して、前記ポイントのセマンティック融合インスタンス特徴と前記ポイントクラウドにおける前記ポイント以外の他の各ポイントのセマンティック融合インスタンス特徴との特徴距離をそれぞれ算出するステップと、
    算出された前記特徴距離に基づいて、前記ポイントクラウドにおけるポイントをクラスタリングし、複数組のポイントを得るステップであって、前記複数組のポイントにおける各組のポイントは、1つのインスタンスカテゴリに対応する、ステップと、を含むことを特徴とする請求項1に記載のポイントクラウドセグメンテーション方法。
  7. 前記ポイントクラウドにおける各前記ポイントをそれぞれ中心ポイントとするステップと、
    各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記中心ポイントに対応する複数の近隣ポイントを決定するステップと、
    各前記中心ポイントに対応する複数の近隣ポイントのセマンティック特徴を融合し、対応する中心ポイントのインスタンス融合セマンティック特徴を得るステップと、
    各前記中心ポイントのインスタンス融合セマンティック特徴に基づいて、各前記ポイントが属するセマンティックカテゴリを決定するステップと、を更に含むことを特徴とする
    請求項1~5のうちいずれか一項に記載のポイントクラウドセグメンテーション方法。
  8. 各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記中心ポイントに対応する複数の近隣ポイントを決定するステップは、
    各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各中心ポイントと前記ポイントクラウドにおける各ポイントとの特徴距離をそれぞれ算出するステップと、
    前記中心ポイントとの特徴距離が所定の距離未満である複数のポイントを前記中心ポイントに対応する複数の近隣ポイントとして選択するステップと、を含むことを特徴とする
    請求項7に記載のポイントクラウドセグメンテーション方法。
  9. 異なる復号化方式で前記共有特徴を復号化し、セマンティック特徴及びインスタンス特徴をそれぞれ得るステップは、
    第1復号化方式で前記共有特徴を復号化し、前記ポイントクラウドのセマンティック特徴行列を得るステップと、
    前記第1復号化方式と異なる第2復号化方式で前記共有特徴を復号化し、前記ポイントクラウドのインスタンス特徴行列を得るステップであって、前記セマンティック特徴行列は、前記ポイントクラウドにおける各ポイントのセマンティック特徴ベクトルを含む、ステップと、を含み、
    各前記中心ポイントに対応する複数の近隣ポイントのセマンティック特徴を融合し、対応する中心ポイントのインスタンス融合セマンティック特徴を得るステップは、
    各前記中心ポイントに対応する複数の近隣ポイントのセマンティック特徴ベクトルをビット毎に融合し、対応する中心ポイントの第2ベクトルを得るステップであって、前記第2ベクトルは、インスタンス融合したセマンティック特徴ベクトルである、ステップを含むことを特徴とする
    請求項8に記載のポイントクラウドセグメンテーション方法。
  10. 各前記中心ポイントのインスタンス融合セマンティック特徴に基づいて、各前記ポイントが属するセマンティックカテゴリを決定するステップは、
    各ポイントの独立した第3全結合層により、各中心ポイントの前記インスタンス融合セマンティック特徴を対応するセマンティック予測ベクトルに変換するステップと、
    各中心ポイントのセマンティック予測ベクトルにおける最大ベクトル要素に対応するセマンティックカテゴリを各前記ポイントが属するセマンティックカテゴリとするステップと、を含むことを特徴とする
    請求項7に記載のポイントクラウドセグメンテーション方法。
  11. 各前記ポイントのセマンティック融合インスタンス特徴に基づいて、各前記ポイントが属するインスタンスカテゴリを決定するステップは、
    前記ポイントクラウドにおける各点に対して、前記ポイントのインスタンス特徴と前記ポイントクラウドにおける前記ポイント以外の他の各ポイントのインスタンス特徴との特徴距離を算出するステップと、
    算出された特徴距離に基づいて、前記ポイントクラウドにおけるポイントをクラスタリングし、複数組のポイントを得るステップと、
    前記複数組のポイントにおける各組のポイントが属するセマンティックカテゴリに基づいて、各組のポイントが属するインスタンスカテゴリを決定するステップと、を含むことを特徴とする
    請求項10に記載のポイントクラウドセグメンテーション方法。
  12. コンピュータに請求項1から11のうちいずれか一項に記載の方法を実行させる、コンピュータプログラム。
  13. コンピュータ機器であって、メモリと、プロセッサと、を備え、前記メモリにコンピュータプログラムが記憶されており、前記プロセッサはコンピュータプログラムを実行して、請求項1から11のうちいずれか一項に記載の方法を実行する、コンピュータ機器。
JP2021517774A 2019-02-25 2020-02-10 ポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器 Active JP7210085B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910138419.6A CN109886272B (zh) 2019-02-25 2019-02-25 点云分割方法、装置、计算机可读存储介质和计算机设备
CN201910138419.6 2019-02-25
PCT/CN2020/074637 WO2020173297A1 (zh) 2019-02-25 2020-02-10 点云分割方法、计算机可读存储介质和计算机设备

Publications (2)

Publication Number Publication Date
JP2022501740A JP2022501740A (ja) 2022-01-06
JP7210085B2 true JP7210085B2 (ja) 2023-01-23

Family

ID=66929189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021517774A Active JP7210085B2 (ja) 2019-02-25 2020-02-10 ポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器

Country Status (6)

Country Link
US (1) US11810377B2 (ja)
EP (1) EP3933688B1 (ja)
JP (1) JP7210085B2 (ja)
KR (1) KR102510745B1 (ja)
CN (1) CN109886272B (ja)
WO (1) WO2020173297A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10549186B2 (en) * 2018-06-26 2020-02-04 Sony Interactive Entertainment Inc. Multipoint SLAM capture
CN109886272B (zh) * 2019-02-25 2020-10-30 腾讯科技(深圳)有限公司 点云分割方法、装置、计算机可读存储介质和计算机设备
US11202054B2 (en) * 2019-07-05 2021-12-14 Tencent America LLC Method and apparatus for inter-channel prediction and transform for point-cloud attribute coding
US11232599B2 (en) * 2019-07-11 2022-01-25 Tencent America LLC Method and apparatus for inter-channel prediction and transform for point cloud attribute coding
CN110334237B (zh) * 2019-07-15 2022-03-01 清华大学 一种基于多模态数据的立体对象检索方法与系统
CN111047596A (zh) * 2019-12-12 2020-04-21 中国科学院深圳先进技术研究院 一种三维点云实例分割方法、系统及电子设备
CN111192265B (zh) * 2019-12-25 2020-12-01 中国科学院上海微系统与信息技术研究所 一种基于点云的语义实例确定方法、装置、电子设备及存储介质
CN111178253B (zh) * 2019-12-27 2024-02-27 佑驾创新(北京)技术有限公司 自动驾驶的视觉感知方法、装置、计算机设备和存储介质
CN111191582B (zh) * 2019-12-27 2022-11-01 深圳市越疆科技有限公司 三维目标检测方法、检测装置、终端设备及计算机可读存储介质
CN111242954B (zh) * 2020-01-20 2022-05-13 浙江大学 一种带有双向连接和遮挡处理的全景分割方法
CN111311691A (zh) * 2020-03-05 2020-06-19 上海交通大学 拆垛机器人拆垛方法及系统
CN111275026B (zh) * 2020-03-23 2022-09-13 复旦大学 一种三维点云联合语义和实例分割的方法
CN112418235B (zh) * 2020-11-20 2023-05-30 中南大学 一种基于膨胀最近邻特征增强的点云语义分割方法
CN112583803A (zh) * 2020-12-04 2021-03-30 上海交通大学 数据处理方法、装置、通信节点和存储介质
CN112489060B (zh) * 2020-12-07 2022-05-10 北京医准智能科技有限公司 一种用于肺炎病灶分割的系统及方法
US11455161B2 (en) * 2021-02-01 2022-09-27 Accenture Global Solutions Limited Utilizing machine learning models for automated software code modification
CN112819833B (zh) * 2021-02-05 2022-07-12 四川大学 一种大场景点云语义分割方法
CN113487722B (zh) * 2021-06-18 2023-10-31 浙江大学 一种基于三维激光扫描方法的混凝土构件自动化检测方法
CN113516663B (zh) * 2021-06-30 2022-09-27 同济大学 点云语义分割方法及装置、电子设备及存储介质
CN113591869A (zh) * 2021-08-03 2021-11-02 北京地平线信息技术有限公司 点云实例分割方法和装置、电子设备和存储介质
US20230062313A1 (en) * 2021-08-24 2023-03-02 International Business Machines Corporation Generating 2d mapping using 3d data
CN114241226A (zh) * 2021-12-07 2022-03-25 电子科技大学 一种基于混合模型多邻域特征的三维点云语义分割方法
CN114419250B (zh) * 2021-12-27 2023-03-10 广州极飞科技股份有限公司 点云数据矢量化方法及装置、矢量地图生成方法及装置
CN114528950B (zh) * 2022-04-24 2022-07-12 北京中超伟业信息安全技术股份有限公司 一种基于三维点云识别保密介质类型的销毁方法与系统
WO2023224304A1 (en) * 2022-05-19 2023-11-23 Samsung Electronics Co., Ltd. Method and electronic device for achieving accurate point cloud segmentation
CN114937122A (zh) * 2022-06-16 2022-08-23 黄冈强源电力设计有限公司 一种水泥纤维板房的快速三维模型重建方法
CN114926699B (zh) * 2022-07-20 2022-12-06 深圳大学 一种室内三维点云语义分类方法、装置、介质及终端
CN117523547B (zh) * 2024-01-04 2024-03-29 山东省凯麟环保设备股份有限公司 一种三维场景语义感知方法、系统、设备与介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102238693B1 (ko) * 2014-06-20 2021-04-09 삼성전자주식회사 포인트 클라우드에서 특징 영역을 추출하는 방법 및 장치
CN105006016B (zh) * 2015-05-21 2017-10-27 北京航空航天大学 一种贝叶斯网络约束的部件级三维模型构建方法
US10424064B2 (en) * 2016-10-18 2019-09-24 Adobe Inc. Instance-level semantic segmentation system
US10176388B1 (en) * 2016-11-14 2019-01-08 Zoox, Inc. Spatial and temporal information for semantic segmentation
EP3333538B1 (en) * 2016-12-07 2020-09-09 Hexagon Technology Center GmbH Scanner vis
CN108509820B (zh) * 2017-02-23 2021-12-24 百度在线网络技术(北京)有限公司 障碍物分割方法及装置、计算机设备及可读介质
CN106709481A (zh) * 2017-03-03 2017-05-24 深圳市唯特视科技有限公司 一种基于二维‑三维语义数据集的室内场景理解方法
US10635927B2 (en) * 2017-03-06 2020-04-28 Honda Motor Co., Ltd. Systems for performing semantic segmentation and methods thereof
US20180336454A1 (en) * 2017-05-19 2018-11-22 General Electric Company Neural network systems
WO2019015785A1 (en) * 2017-07-21 2019-01-24 Toyota Motor Europe METHOD AND SYSTEM FOR LEARNING A NEURAL NETWORK TO BE USED FOR SEMANTIC INSTANCE SEGMENTATION
CN108229479B (zh) * 2017-08-01 2019-12-31 北京市商汤科技开发有限公司 语义分割模型的训练方法和装置、电子设备、存储介质
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
US10824862B2 (en) * 2017-11-14 2020-11-03 Nuro, Inc. Three-dimensional object detection for autonomous robotic systems using image proposals
CN108230329B (zh) * 2017-12-18 2021-09-21 孙颖 基于多尺度卷积神经网络的语义分割方法
CN108427951B (zh) * 2018-02-08 2023-08-04 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质和计算机设备
CN108460411B (zh) * 2018-02-09 2021-05-04 北京市商汤科技开发有限公司 实例分割方法和装置、电子设备、程序和介质
CN108335305B (zh) * 2018-02-09 2020-10-30 北京市商汤科技开发有限公司 图像分割方法和装置、电子设备、程序和介质
CN109118519A (zh) * 2018-07-26 2019-01-01 北京纵目安驰智能科技有限公司 基于实例分割的目标Re-ID方法、系统、终端和存储介质
CN109345540B (zh) * 2018-09-15 2021-07-13 北京市商汤科技开发有限公司 一种图像处理方法、电子设备及存储介质
CN109886727A (zh) 2019-01-08 2019-06-14 秒针信息技术有限公司 揽客效率的评估方法及装置
CN109886272B (zh) * 2019-02-25 2020-10-30 腾讯科技(深圳)有限公司 点云分割方法、装置、计算机可读存储介质和计算机设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Weiyue Wang et al.,SGPN: Similarity Group Proposal Network for 3D Point Cloud Instance Segmentation,2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition,IEEE,2018年06月23日
Zhidong Liang et al.,3D Graph Embedding Learning with a Structure-aware Loss Function for Point Cloud Semantic Instance Segmentation,[online],2019年02月14日,[令和4年5月25日検索],インターネット <url: http://export.arxiv.org/pdf/1902.05247v1>

Also Published As

Publication number Publication date
JP2022501740A (ja) 2022-01-06
KR102510745B1 (ko) 2023-03-15
CN109886272B (zh) 2020-10-30
EP3933688A4 (en) 2022-05-11
CN109886272A (zh) 2019-06-14
EP3933688A1 (en) 2022-01-05
WO2020173297A1 (zh) 2020-09-03
US11810377B2 (en) 2023-11-07
EP3933688B1 (en) 2024-05-29
US20210350183A1 (en) 2021-11-11
KR20210074353A (ko) 2021-06-21

Similar Documents

Publication Publication Date Title
JP7210085B2 (ja) ポイントクラウドセグメンテーション方法、コンピュータプログラム及びコンピュータ機器
Zhang et al. Visual place recognition: A survey from deep learning perspective
Von Stumberg et al. Gn-net: The gauss-newton loss for multi-weather relocalization
CN107871106B (zh) 人脸检测方法和装置
Kostavelis et al. Learning spatially semantic representations for cognitive robot navigation
CN110717411A (zh) 一种基于深层特征融合的行人重识别方法
CN111428619B (zh) 基于有序回归和软标签的三维点云头部姿态估计系统和方法
CN111325766B (zh) 三维边缘检测方法、装置、存储介质和计算机设备
WO2023142602A1 (zh) 图像处理方法、装置和计算机可读存储介质
Xin et al. A review of visual-based localization
CN109492610B (zh) 一种行人重识别方法、装置及可读存储介质
CN113705596A (zh) 图像识别方法、装置、计算机设备和存储介质
Korrapati et al. Multi-resolution map building and loop closure with omnidirectional images
US20230099521A1 (en) 3d map and method for generating a 3d map via temporal and unified panoptic segmentation
CN114358109A (zh) 特征提取模型训练、样本检索方法、装置和计算机设备
Lu et al. Memory efficient large-scale image-based localization
Li et al. An attention-based prototypical network for forest fire smoke few-shot detection
CN114387304A (zh) 目标跟踪方法、计算机程序产品、存储介质及电子设备
CN114638953B (zh) 点云数据的分割方法、装置及计算机可读存储介质
CN115063831A (zh) 一种高性能行人检索与重识别方法及装置
Zhou et al. A lightweight neural network for loop closure detection in indoor visual slam
Ye et al. Condition-invariant and compact visual place description by convolutional autoencoder
CN113704528A (zh) 聚类中心确定方法、装置和设备及计算机存储介质
Joshi et al. Meta-Learning, Fast Adaptation, and Latent Representation for Head Pose Estimation
Liu et al. Enhancing point features with spatial information for point-based 3D object detection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230105

R150 Certificate of patent or registration of utility model

Ref document number: 7210085

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150