JP7310932B2 - 3次元点群識別装置、学習装置、3次元点群識別方法、学習方法、及びプログラム - Google Patents
3次元点群識別装置、学習装置、3次元点群識別方法、学習方法、及びプログラム Download PDFInfo
- Publication number
- JP7310932B2 JP7310932B2 JP2021570551A JP2021570551A JP7310932B2 JP 7310932 B2 JP7310932 B2 JP 7310932B2 JP 2021570551 A JP2021570551 A JP 2021570551A JP 2021570551 A JP2021570551 A JP 2021570551A JP 7310932 B2 JP7310932 B2 JP 7310932B2
- Authority
- JP
- Japan
- Prior art keywords
- points
- coordinates
- representative
- dimensional
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/88—Radar or analogous systems specially adapted for specific applications
- G01S13/89—Radar or analogous systems specially adapted for specific applications for mapping or imaging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Electromagnetism (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Description
図1は、本実施形態の3次元点群識別装置10の一例の構成を示すブロック図である。図1に示すように、本実施形態の3次元点群識別装置10は、入力部20、キーポイント選別部22、推論部24、及び出力部26を備える。また、本実施形態の3次元点群識別装置10は、モデル記憶部12及びクラスラベル記憶部14を備える。
Y. Zhong, "Intrinsic shape signatures: A shape descriptor for 3D object recognition," 2009 IEEE 12th International Conference on Computer Vision Workshops, ICCV Workshops, Kyoto, 2009, pp. 689-696. B. Steder, R. B. Rusu, K. Konolige and W. Burgard, "Point feature extraction on 3D range scans taking into account object boundaries," 2011 IEEE International Conference on Robotics and Automation, Shanghai, 2011, pp. 2601-2608.
次に、本実施形態の3次元点群識別装置10の作用について図面を参照して説明する。図7は、本実施形態の3次元点群識別装置10において実行される識別処理ルーチンの一例を示すフローチャートである。
上述した推論部24に用いられるDNNのモデルは、予め学習されモデル記憶部12に記憶される。以下、当該モデルを学習する学習装置について説明する。図8は、本実施形態の学習装置100の一例の構成を示すブロック図である。図8に示すように、本実施形態の学習装置100は、入力部70、及び学習部72を備える。
次に、本実施形態の学習装置100の作用について図面を参照して説明する。図9は、本実施形態の学習装置100において実行される学習処理ルーチンの一例を示すフローチャートである。
本実施形態の3次元点群識別装置10及び学習装置100の各々は、以下のハードウェアにより構成することができる。図10は、本実施形態の3次元点群識別装置10及び学習装置100各々のハードウェア構成を示すブロック図である。図10に示すように、3次元点群識別装置10及び学習装置100の各々は、CPU(Central Processing Unit)80、ROM(Read Only Memory)82、RAM(Random Access Memory)84、ストレージ86、入力部88、表示部90、及び通信インタフェース(I/F)92を備える。各構成は、バス99を介して相互に通信可能に接続されている。なお、CPU80に加えて、GPU(Graphics Processing Unit)を備えていてもよい。
(付記項1)
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、物体の表面上の点を表現する複数の3次元点により構成される3次元点群により表現される前記物体の種類を示すクラスラベルを識別する3次元点群識別装置であって、
前記プロセッサは、
3次元点群を構成する各3次元点の座標データ及び前記3次元点各々の属性情報を入力として受け付け、
入力された前記3次元点群を構成する前記3次元点から、前記3次元点群が表現する物体の特徴を効率的に表現する3次元点であるキーポイントを複数含むキーポイント群と、前記複数のキーポイント以外の複数の3次元点を含むキーポイント以外点群とを抽出しと、
抽出した前記キーポイント群と、前記キーポイント以外点群との各々からダウンサンプリングにより選択した複数の点の各々を代表点とし、複数の前記代表点の各々について、前記代表点の座標及び特徴量と、前記代表点の近傍に位置する近傍点の座標及び特徴量とから、前記代表点の特徴量を抽出し、複数の前記代表点の座標及び前記特徴量を出力し、
出力された複数の前記代表点の座標及び前記特徴量と、新たな代表点とする前記ダウンサンプリング前の複数の3次元点の座標及び特徴量と、前記新たな代表点の近傍に位置する近傍点の座標及び特徴量とから、複数の前記新たな代表点の特徴量を抽出し、複数の前記新たな代表点の座標及び前記特徴量を出力し、
出力された複数の前記代表点の座標及び前記特徴量、又は出力された複数の前記新たな代表点の座標及び前記特徴量から、前記クラスラベルを導出して出力する、
する3次元点群識別装置。
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、物体の表面上の点を表現する複数の3次元点により構成される3次元点群により表現される前記物体の種類を示すクラスラベルを識別するためのモデルを学習する学習装置であって、
前記プロセッサは、
正解のクラスラベルが与えられた複数の代表点の各々について、前記代表点の座標及び特徴量と、前記代表点の近傍に位置する近傍点の座標及び特徴量とから、前記代表点の特徴量を抽出し、複数の前記代表点の座標及び前記特徴量を出力し、
出力された複数の前記代表点の座標及び前記特徴量と、新たな代表点とする前記ダウンサンプリング前の複数の3次元点の座標及び特徴量と、前記新たな代表点の近傍に位置する近傍点の座標及び特徴量とから、複数の前記新たな代表点の特徴量を抽出し、複数の前記新たな代表点の座標及び前記特徴量を出力する、
及び出力された複数の前記代表点の座標及び前記特徴量、又は出力された複数の前記新たな代表点の座標及び前記特徴量から、前記クラスラベルを導出して出力するモデルに対し、
前記3次元点群が入力された場合に、前記正解のクラスラベルを出力するよう前記モデルを学習する
学習装置。
20 入力部
22 キーポイント選別部
24 推論部
40 第1推論情報抽出部
42 第2推論情報抽出部
44 クラスラベル推論部
72 学習部
100 学習装置
Claims (6)
- 物体の表面上の点を表現する複数の3次元点により構成される3次元点群により表現される前記物体の種類を示すクラスラベルを識別する3次元点群識別装置であって、
3次元点群を構成する各3次元点の座標データ及び前記3次元点各々の属性情報を入力として受け付ける入力部と、
前記入力部に入力された前記3次元点群を構成する前記3次元点から、前記3次元点群が表現する物体の特徴を効率的に表現する3次元点であるキーポイントを複数含むキーポイント群と、前記複数のキーポイント以外の複数の3次元点を含むキーポイント以外点群とを抽出するキーポイント選別部と、
前記キーポイント選別部が抽出した前記キーポイント群と、前記キーポイント以外点群との各々からダウンサンプリングにより選択した複数の点の各々を代表点とし、複数の前記代表点の各々について、前記代表点の座標及び特徴量と、前記代表点の近傍に位置する近傍点の座標及び特徴量とから、前記代表点の特徴量を抽出し、複数の前記代表点の座標及び前記特徴量を出力する第1推論情報抽出部、
前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量と、新たな代表点とする前記ダウンサンプリング前の複数の3次元点の座標及び特徴量と、前記新たな代表点の近傍に位置する近傍点の座標及び特徴量とから、複数の前記新たな代表点の特徴量を抽出し、複数の前記新たな代表点の座標及び前記特徴量を出力する第2推論情報抽出部、
及び前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量、又は前記第2推論情報抽出部から出力された複数の前記新たな代表点の座標及び前記特徴量から、前記クラスラベルを導出して出力するクラスラベル推論部を含む推論部と、
を備えた3次元点群識別装置。 - 前記入力部に入力された前記3次元点群が、複数の物体を表すシーンデータの場合、前記クラスラベル推論部は、前記第2推論情報抽出部から出力された前記新たな代表点の座標及び前記特徴量から、前記3次元点群を構成する各3次元点に対する物体の種類を示す前記クラスラベルを導出して出力し、
前記入力部に入力された前記3次元点群が、単一の物体を表すオブジェクトデータの場合、前記クラスラベル推論部は、前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量から、前記3次元点群が表す単一の物体の種類を示す前記クラスラベルを導出して出力する、
請求項1に記載の3次元点群識別装置。 - 物体の表面上の点を表現する複数の3次元点により構成される3次元点群により表現される前記物体の種類を示すクラスラベルを識別するためのモデルを学習する学習装置であって、
正解のクラスラベルが与えられた複数の代表点の各々について、前記代表点の座標及び特徴量と、前記代表点の近傍に位置する近傍点の座標及び特徴量とから、前記代表点の特徴量を抽出し、複数の前記代表点の座標及び前記特徴量を出力する第1推論情報抽出部、
前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量と、新たな代表点とする前記ダウンサンプリング前の複数の3次元点の座標及び特徴量と、前記新たな代表点の近傍に位置する近傍点の座標及び特徴量とから、複数の前記新たな代表点の特徴量を抽出し、複数の前記新たな代表点の座標及び前記特徴量を出力する第2推論情報抽出部、
及び前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量、又は前記第2推論情報抽出部から出力された複数の前記新たな代表点の座標及び前記特徴量から、前記クラスラベルを導出して出力するクラスラベル推論部を含むモデルに対し、
前記3次元点群が入力された場合に、前記正解のクラスラベルを出力するよう前記モデルを学習する学習部と、
を備えた学習装置。 - 物体の表面上の点を表現する複数の3次元点により構成される3次元点群により表現される前記物体の種類を示すクラスラベルを識別する3次元点群識別方法であって、
入力部が、3次元点群を構成する各3次元点の座標データ及び前記3次元点各々の属性情報を入力として受け付けるステップと、
キーポイント選別部が、前記入力部に入力された前記3次元点群を構成する前記3次元点から、前記3次元点群が表現する物体の特徴を効率的に表現する3次元点であるキーポイントを複数含むキーポイント群と、前記複数のキーポイント以外の複数の3次元点を含むキーポイント以外点群とを抽出するステップと、
第1推論情報抽出部が、前記キーポイント選別部が抽出した前記キーポイント群と、前記キーポイント以外点群との各々からダウンサンプリングにより選択した複数の点の各々を代表点とし、複数の前記代表点の各々について、前記代表点の座標及び特徴量と、前記代表点の近傍に位置する近傍点の座標及び特徴量とから、前記代表点の特徴量を抽出し、複数の前記代表点の座標及び前記特徴量を出力するステップと、
第2推論情報抽出部が、前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量と、新たな代表点とする前記ダウンサンプリング前の複数の3次元点の座標及び特徴量と、前記新たな代表点の近傍に位置する近傍点の座標及び特徴量とから、複数の前記新たな代表点の特徴量を抽出し、複数の前記新たな代表点の座標及び前記特徴量を出力するステップと、
クラスラベル推論部が、前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量、又は前記第2推論情報抽出部から出力された複数の前記新たな代表点の座標及び前記特徴量から、前記クラスラベルを導出して出力するステップと、
を備えた3次元点群識別方法。 - 物体の表面上の点を表現する複数の3次元点により構成される3次元点群により表現される前記物体の種類を示すクラスラベルを識別するためのモデルを学習する学習方法であって、
正解のクラスラベルが与えられた複数の代表点の各々について、前記代表点の座標及び特徴量と、前記代表点の近傍に位置する近傍点の座標及び特徴量とから、前記代表点の特徴量を抽出し、複数の前記代表点の座標及び前記特徴量を出力する第1推論情報抽出部、
前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量と、新たな代表点とする前記ダウンサンプリング前の複数の3次元点の座標及び特徴量と、前記新たな代表点の近傍に位置する近傍点の座標及び特徴量とから、複数の前記新たな代表点の特徴量を抽出し、複数の前記新たな代表点の座標及び前記特徴量を出力する第2推論情報抽出部、
及び前記第1推論情報抽出部から出力された複数の前記代表点の座標及び前記特徴量、又は前記第2推論情報抽出部から出力された複数の前記新たな代表点の座標及び前記特徴量から、前記クラスラベルを導出して出力するクラスラベル推論部を含むモデルに対し、
学習部が、前記3次元点群が入力された場合に、前記正解のクラスラベルを出力するよう前記モデルを学習するステップ、
を備えた学習方法。 - コンピュータを、請求項1または請求項2に記載の3次元点群識別装置、又は請求項3記載の学習装置を構成する各部として機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/001131 WO2021144897A1 (ja) | 2020-01-15 | 2020-01-15 | 3次元点群識別装置、学習装置、3次元点群識別方法、学習方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021144897A1 JPWO2021144897A1 (ja) | 2021-07-22 |
JP7310932B2 true JP7310932B2 (ja) | 2023-07-19 |
Family
ID=76864561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021570551A Active JP7310932B2 (ja) | 2020-01-15 | 2020-01-15 | 3次元点群識別装置、学習装置、3次元点群識別方法、学習方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230040195A1 (ja) |
JP (1) | JP7310932B2 (ja) |
WO (1) | WO2021144897A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023188179A1 (ja) * | 2022-03-30 | 2023-10-05 | 日本電信電話株式会社 | 三次元点群セグメンテーション装置、三次元点群セグメンテーション方法、及び三次元点群セグメンテーションプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014093006A (ja) | 2012-11-06 | 2014-05-19 | Advanced Telecommunication Research Institute International | 頭部姿勢の推定装置、頭部姿勢の推定方法およびコンピュータに頭部姿勢の推定方法を実行させるためのプログラム |
JP2019211900A (ja) | 2018-06-01 | 2019-12-12 | 株式会社デンソー | 物体識別装置、移動体用システム、物体識別方法、物体識別モデルの学習方法及び物体識別モデルの学習装置 |
-
2020
- 2020-01-15 US US17/792,655 patent/US20230040195A1/en active Pending
- 2020-01-15 WO PCT/JP2020/001131 patent/WO2021144897A1/ja active Application Filing
- 2020-01-15 JP JP2021570551A patent/JP7310932B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014093006A (ja) | 2012-11-06 | 2014-05-19 | Advanced Telecommunication Research Institute International | 頭部姿勢の推定装置、頭部姿勢の推定方法およびコンピュータに頭部姿勢の推定方法を実行させるためのプログラム |
JP2019211900A (ja) | 2018-06-01 | 2019-12-12 | 株式会社デンソー | 物体識別装置、移動体用システム、物体識別方法、物体識別モデルの学習方法及び物体識別モデルの学習装置 |
Non-Patent Citations (1)
Title |
---|
QI R. Charles, et al.,PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space,31st Conference on Neural Information Processing Systems (NIPS 2017),2017年,pp.1-10 |
Also Published As
Publication number | Publication date |
---|---|
WO2021144897A1 (ja) | 2021-07-22 |
US20230040195A1 (en) | 2023-02-09 |
JPWO2021144897A1 (ja) | 2021-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A review of deep learning-based semantic segmentation for point cloud | |
JP7163504B2 (ja) | 画像処理方法並びにその、装置、コンピュータプログラム及び電子機器 | |
US10229499B2 (en) | Skin lesion segmentation using deep convolution networks guided by local unsupervised learning | |
CN111652217A (zh) | 文本检测方法、装置、电子设备及计算机存储介质 | |
CN112434721A (zh) | 一种基于小样本学习的图像分类方法、系统、存储介质及终端 | |
CN111414953B (zh) | 点云分类方法和装置 | |
El‐Sayed et al. | Plane detection in 3D point cloud using octree‐balanced density down‐sampling and iterative adaptive plane extraction | |
Cong et al. | Image segmentation algorithm based on superpixel clustering | |
CN113159232A (zh) | 一种三维目标分类、分割方法 | |
Wang et al. | Automatic segmentation of urban point clouds based on the Gaussian map | |
Maduako et al. | Deep learning for component fault detection in electricity transmission lines | |
JP7310932B2 (ja) | 3次元点群識別装置、学習装置、3次元点群識別方法、学習方法、及びプログラム | |
Sun et al. | Semantic labeling of high-resolution aerial images using an ensemble of fully convolutional networks | |
Wang et al. | A region-line primitive association framework for object-based remote sensing image analysis | |
CN114283343A (zh) | 基于遥感卫星图像的地图更新方法、训练方法和设备 | |
JP7310912B2 (ja) | 3次元点群ラベル学習装置、3次元点群ラベル推定装置、方法、及びプログラム | |
Meng et al. | Merged region based image retrieval | |
CN110348311B (zh) | 一种基于深度学习的道路交叉口识别系统及方法 | |
CN114913330B (zh) | 点云部件分割方法、装置、电子设备与存储介质 | |
CN114972361B (zh) | 一种血流分割方法、装置、设备及存储介质 | |
CN114691918B (zh) | 基于人工智能的雷达图像检索方法、装置以及电子设备 | |
CN108154107B (zh) | 一种确定遥感图像归属的场景类别的方法 | |
CN113658338A (zh) | 点云树木单体分割方法、装置、电子设备及存储介质 | |
CN114511571A (zh) | 一种点云数据语义分割方法、系统及相关组件 | |
Vetsch et al. | Neuralmeshing: Differentiable meshing of implicit neural representations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7310932 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |