JP7131612B2 - 物体認識装置、物体認識システム、及びプログラム - Google Patents
物体認識装置、物体認識システム、及びプログラム Download PDFInfo
- Publication number
- JP7131612B2 JP7131612B2 JP2020528688A JP2020528688A JP7131612B2 JP 7131612 B2 JP7131612 B2 JP 7131612B2 JP 2020528688 A JP2020528688 A JP 2020528688A JP 2020528688 A JP2020528688 A JP 2020528688A JP 7131612 B2 JP7131612 B2 JP 7131612B2
- Authority
- JP
- Japan
- Prior art keywords
- dimensional
- object recognition
- dimensional information
- recognition device
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 78
- 238000013527 convolutional neural network Methods 0.000 claims description 33
- 238000010586 diagram Methods 0.000 claims description 25
- 239000002131 composite material Substances 0.000 claims description 23
- 239000007787 solid Substances 0.000 claims description 13
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 238000004891 communication Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
本開示に係る物体認識システムが適用可能な一例について、図1を用いて説明する。図1は、本開示に係る物体認識システム1の適用例を説明するための図である。
以下、物体認識システム1の構成例としての実施形態を説明する。
実施形態1に係る物体認識システム1の構成と動作を以下に説明する。
本実施形態に係る物体認識システム1の構成について、図2及び図3を用いて説明する。図2は、物体認識システム1の構成を例示するブロック図である。図3は、距離センサ100による測距を説明するための図である。
距離センサ100は、投光部11、受光部12、走査部13、センサ制御部14、及び入出力インタフェース部15を含む。距離センサ100は、例えば、LIDAR(Light Detection and Ranging、あるいは、Laser Imaging Detection and Ranging)装置である。
物体認識装置200は、例えばPCや種々の情報端末などの情報処理装置である。物体認識装置200は、入出力インタフェース部21、演算処理部22、及び記憶部23を備える。
2.1 物体認識処理
以上のように構成される物体認識システム1の物体認識処理に関する動作について、図4~図10を参照して説明する。
図11は、畳み込みニューラルネットワーク60の学習処理を示している。例えば、演算処理部22が、物体認識処理を実行する前に、図11に示す学習処理を行って畳み込みニューラルネットワーク60を学習させる。
図12は、物体認識に使用される要素の数を比較した図であって、従来のVoxNetにおける要素数(ボクセル数)と、本開示の三面図における要素数(画素数)を示している。一辺の要素が32個の場合、VoxNetの要素数は32×32×32=32768となり、三面図では32×32×3=3072となる。よって、三面図の要素数は、VoxNetの要素数の約1/10である。一辺の要素が64個の場合は、VoxNetの要素数は64×64×64=262144となり、三面図では64×64×3=12288となる。よって、三面図の要素数は、VoxNetの要素数の約1/20となる。一辺のボクセルが128個の場合は、VoxNetの要素数は2097152となり、三面図では49152となる。よって、三面図の要素数は、VoxNetの要素数の約1/40となる。このように、三面図にすることによって要素数が減少するため、三面図の画像を用いた二次元のCNNによる画像処理は、三次元のCNNによる画像処理よりも、処理負荷が低減する。よって、物体認識の処理速度が向上する。
本実施形態に係る物体認識システム1は、距離センサ100と物体認識装置200とを含む。距離センサ100は、物体までの距離を計測して、物体の少なくとも一部の外形に沿った三次元位置を含むセンシングデータを生成する。本実施形態に係る物体認識装置200は、入出力インタフェース部21と演算処理部22とを備える。入出力インタフェース部21は、センシングデータを入力する。演算処理部22は、センシングデータに基づいて物体を認識する。具体的には、演算処理部22は、センシングデータに基づいて、三次元位置によって表される立体を複数の方向から見た複数の二次元図面を生成し、複数の二次元図面に基づいて物体を認識する。
実施形態1では、物体認識装置200は、一つの距離センサ100による投影面R10内の測距に基づいて生成した三面図を使用して物体認識を行った。本実施形態では、六面図を使用して物体認識を行う。六面図は、複数の二次元情報の一例である。
上記実施形態では、センシングデータが距離画像であって、物体認識装置200は、距離画像に基づいて占有グリッド45を生成する例について説明した。しかし、センシングデータは、距離画像に限らない。センシングデータは、物体の少なくとも一部の外形に沿った三次元位置を含めばよい。例えば、センシングデータは、距離センサ100が計測した物体の外形までの距離を示す三次元点群情報であってもよい。このような三次元点群情報は、例えば、x座標、y座標、及びz座標を含む。
以上のように、本開示の各種実施形態について説明したが、本開示は上記の内容に限定されるものではなく、技術的思想が実質的に同一の範囲内で種々の変更を行うことができる。以下、本開示に係る各種態様を付記する。
2 車両駆動装置
3 車両
11 投光部
12 受光部
13 走査部
14 センサ制御部
15、21 入出力インタフェース部
22 演算処理部
22a 領域検出部
22b 占有グリッド生成部
22c 2D図面生成部
22d 物体認識部
23 記憶部
100 距離センサ
200 物体認識装置
Claims (8)
- 物体の一部の外形に沿った三次元位置を含む三次元情報を入力する入力部と、
前記三次元情報に基づいて前記物体を認識する演算処理部と、
を備え、
前記演算処理部は、
前記三次元情報に基づいて、前記三次元位置によって表される立体を直交3軸方向の各々から見た3つの二次元図面であって、赤色の二次元図面、緑色の二次元図面、及び青色の二次元図面を含む三面図である複数の二次元情報を生成し、
前記三面図の各画素の画素値に基づいて合成図の各画素の画素値を決定するように、前記複数の二次元情報を合成して前記合成図を生成し、
前記合成図に基づいて前記物体を認識する、
物体認識装置。 - 前記演算処理部は、生成した前記複数の二次元情報に基づき畳み込みニューラルネットワークによる画像処理を実行して、前記物体を認識する、
請求項1に記載の物体認識装置。 - 前記三次元情報は、基準点から前記物体の少なくとも一部の外形までの距離を示す距離画像である、
請求項1又は請求項2に記載の物体認識装置。 - 前記演算処理部は、前記三次元情報に基づいて、前記立体を表すボクセルの集合体を生成する、
請求項1から請求項3のいずれか一つに記載の物体認識装置。 - 前記演算処理部は、複数のボクセルに分割可能な三次元空間を定義し、前記三次元位置を前記三次元空間に対応付けて、前記複数のボクセルのうち前記物体が占有しているボクセルによって前記立体を表す、
請求項4に記載の物体認識装置。 - 前記複数の二次元情報は、各々の基準位置から前記立体までの距離に応じた画素値を有する、
請求項1から請求項5のいずれか一つに記載の物体認識装置。 - 物体までの距離を計測して前記三次元情報を生成するセンサと、
請求項1から請求項6のいずれか一つに記載の前記物体認識装置と、
を含む、物体認識システム。 - 物体の一部の外形に沿った三次元位置を含む三次元情報を入力するステップと、
前記三次元情報に基づいて、前記三次元位置によって表される立体を直交3軸方向の各々から見た3つの二次元図面であって、赤色の二次元図面、緑色の二次元図面、及び青色の二次元図面を含む三面図である複数の二次元情報を生成するステップと、
前記三面図の各画素の画素値に基づいて合成図の各画素の画素値を決定するように、前記複数の二次元情報を合成して前記合成図を生成するステップと、
前記合成図に基づいて前記物体を認識するステップと、
をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018127743 | 2018-07-04 | ||
JP2018127743 | 2018-07-04 | ||
PCT/JP2019/009990 WO2020008684A1 (ja) | 2018-07-04 | 2019-03-12 | 物体認識装置、物体認識システム、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020008684A1 JPWO2020008684A1 (ja) | 2021-07-08 |
JP7131612B2 true JP7131612B2 (ja) | 2022-09-06 |
Family
ID=69060631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020528688A Active JP7131612B2 (ja) | 2018-07-04 | 2019-03-12 | 物体認識装置、物体認識システム、及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7131612B2 (ja) |
WO (1) | WO2020008684A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002288687A (ja) | 2001-03-22 | 2002-10-04 | Olympus Optical Co Ltd | 特徴量算出装置および方法 |
JP2004094825A (ja) | 2002-09-03 | 2004-03-25 | Toyota Motor Corp | 三次元物体認識装置 |
JP2014120026A (ja) | 2012-12-18 | 2014-06-30 | Toyohashi Univ Of Technology | 三次元物体モデルを検索するための方法、コンピュータプログラム及びシステム、及び、三次元物体を分類するための方法、コンピュータプログラム及びシステム |
-
2019
- 2019-03-12 JP JP2020528688A patent/JP7131612B2/ja active Active
- 2019-03-12 WO PCT/JP2019/009990 patent/WO2020008684A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002288687A (ja) | 2001-03-22 | 2002-10-04 | Olympus Optical Co Ltd | 特徴量算出装置および方法 |
JP2004094825A (ja) | 2002-09-03 | 2004-03-25 | Toyota Motor Corp | 三次元物体認識装置 |
JP2014120026A (ja) | 2012-12-18 | 2014-06-30 | Toyohashi Univ Of Technology | 三次元物体モデルを検索するための方法、コンピュータプログラム及びシステム、及び、三次元物体を分類するための方法、コンピュータプログラム及びシステム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020008684A1 (ja) | 2021-07-08 |
WO2020008684A1 (ja) | 2020-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11861790B2 (en) | Procedural world generation using tertiary data | |
US11521009B2 (en) | Automatically generating training data for a lidar using simulated vehicles in virtual space | |
US10823818B2 (en) | Detector for optically detecting at least one object | |
US10859684B1 (en) | Method and system for camera-lidar calibration | |
JP6548691B2 (ja) | 画像生成システム、プログラム及び方法並びにシミュレーションシステム、プログラム及び方法 | |
US11275673B1 (en) | Simulated LiDAR data | |
CN108419446B (zh) | 用于激光深度图取样的系统及方法 | |
US10872228B1 (en) | Three-dimensional object detection | |
WO2014103433A1 (ja) | 車両周辺監視装置 | |
JP2022513428A (ja) | 知覚を改善するための多重チャネル多重偏光イメージング | |
JP2022512290A (ja) | 色覚困難の知覚を改善する多重スペクトル多重偏光(msmp)フィルタ処理 | |
CN112789521B (zh) | 感知区域的确定方法、装置、存储介质及车辆 | |
CN112990049A (zh) | 用于车辆自动驾驶的aeb紧急制动方法、装置 | |
CN114118247A (zh) | 一种基于多传感器融合的无锚框3d目标检测方法 | |
CN117423102A (zh) | 点云数据处理方法以及相关设备 | |
JP7131612B2 (ja) | 物体認識装置、物体認識システム、及びプログラム | |
WO2023203814A1 (en) | System and method for motion prediction in autonomous driving | |
WO2023009180A1 (en) | Lidar-based object tracking | |
CN115964446B (zh) | 一种基于移动端的雷达数据交互处理方法 | |
WO2023123150A1 (zh) | 一种控制方法、激光雷达及终端设备 | |
US20230398692A1 (en) | System and method for unknown object manipulation from pure synthetic stereo data | |
Zhu et al. | Stereo vision based road scene segment and vehicle detection | |
CN117095365A (zh) | 物件的双感测方法及用于物件感测的运算装置 | |
CN117373012A (zh) | 用于执行多任务点云感知的方法、装置和介质 | |
CN117034579A (zh) | 点云数据生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7131612 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |