JP2022148383A - 学習方法、学習装置、及び、プログラム - Google Patents
学習方法、学習装置、及び、プログラム Download PDFInfo
- Publication number
- JP2022148383A JP2022148383A JP2021050042A JP2021050042A JP2022148383A JP 2022148383 A JP2022148383 A JP 2022148383A JP 2021050042 A JP2021050042 A JP 2021050042A JP 2021050042 A JP2021050042 A JP 2021050042A JP 2022148383 A JP2022148383 A JP 2022148383A
- Authority
- JP
- Japan
- Prior art keywords
- class
- correct
- learning
- evaluation value
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000011156 evaluation Methods 0.000 claims abstract description 209
- 238000001514 detection method Methods 0.000 claims abstract description 129
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 description 23
- 238000010801 machine learning Methods 0.000 description 14
- 238000011895 specific detection Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 230000005484 gravity Effects 0.000 description 12
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 240000001973 Ficus microcarpa Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
- G06T2207/30261—Obstacle
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
近年、車載カメラ等が撮像した画像データを用いて、車両周囲の対象物を検知する物体検知装置について、様々な検討が行われている。例えば、カメラで撮像した画像データに基づいて、対象物の位置を推定する検討が行われている。対象物の位置には、車両から対象物までの距離が含まれる。車両等が自動運転を行う場合、当該車両では、例えば、TTC(Time To Collision)による制御が行われる。TTCによる制御において、対象物の位置の精度は重要である。
以下、本実施の形態に係る位置推定システム、及び、学習装置について、図2~図7を参照しながら説明する。
まず、本実施の形態に係る位置推定システムの構成について、図2を参照しながら説明する。図2は、本実施の形態に係る位置推定システム1の機能構成を示すブロック図である。
続いて、本実施の形態に係る学習装置40について、図4を参照しながら説明する。図4は、本実施の形態に係る学習装置40の機能構成を示すブロック図である。
続いて、上記の学習装置40の動作について、図5~図7を参照しながら説明する。図5は、本実施の形態に係る学習装置40の動作を示すフローチャートである。
以下、本実施の形態に係る学習装置40について、図8及び図9を参照しながら説明する。なお、本実施の形態に係る学習装置40の機能構成は、実施の形態1に係る学習装置40と同様であり、説明を省略する。なお、図8は、本実施の形態に係る位置推定装置の検知対象となるクラスを示す図である。図8に示すように、クラスは、人物、車両、自転車及びバイクのラベルを含む。本実施の形態では、複数のラベルの中に重視するラベルが含まれる例について説明する。以下では、特定の検知対象が人物であり、人物が他のラベルに比べて重視される例について説明する。なお、図8では、クラスの一例として、物体を分類したときの物体クラスを示している。
本実施の形態に係る学習装置40の動作について、図9を参照しながら説明する。図9は、本実施の形態に係る学習装置40の動作を示すフローチャートである。なお、実施の形態1の図5に示す動作と同一又は類似の動作については、同一の符号を付し、説明を省略又は簡略化する。
以下、本実施の形態に係る学習装置40について、図10及び図11を参照しながら説明する。なお、本変形例に係る学習装置40の機能構成は、実施の形態1に係る学習装置40と同様であり、説明を省略する。なお、図10は、本変形例に係る位置推定装置の検知対象となるクラスを示す図である。図10に示すように、クラスは、クラス1、クラス2及びクラス3の3つのクラスを出力する。3つのクラスは、物体検知結果に含まれる。なお、クラスの数は、3つに限定されず、2以上であればよい。なお、複数のクラスのそれぞれは、互いに異なる種類のクラスである。
以上、一つまたは複数の態様に係る学習方法等について、実施の形態等に基づいて説明したが、本開示は、この実施の形態等に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示に含まれてもよい。
10 車両
20 カメラ
30 位置推定装置
31 検知部
32 位置推定部
40 学習装置
41 取得部
42 推定部
43 評価部
44 調整部
45 出力部
A、B、C、D 重み
L 道路
P 位置
U 歩行者
Claims (9)
- 物体を含む学習用画像と、前記物体のクラスを示す正解クラス及び前記物体の前記学習用画像上での領域を示す正解枠を含む正解情報とを取得し、
画像を入力として物体検知結果を出力する学習モデルに前記学習用画像を入力することにより得られる前記物体のクラスを示す検知クラス及び前記物体の前記学習用画像上での領域を示す検知枠を含む物体検知結果を取得し、取得した前記物体検知結果と前記正解情報との差に基づいて、前記学習モデルに対する評価値を算出し、
算出された前記評価値に基づいて、前記学習モデルのパラメータを調整することを含み、
前記評価値の算出では、前記正解枠及び前記検知枠における2以上の位置又は長さの差のそれぞれに対する重みを互いに異ならせる、及び、前記正解クラスが特定クラスであるか否かに応じて前記正解クラス及び前記検知クラスの差に対する重みを互いに異ならせることの少なくとも1つを行うことで、前記評価値を算出する
学習方法。 - 前記評価値の算出では、前記正解枠及び前記検知枠における特定の位置又は特定の長さの差に対する第1の重みと、前記正解枠及び前記検知枠における前記特定の位置又は前記特定の長さ以外の位置又は長さの差に対する第2の重みとを異ならせる、及び、前記正解クラスが前記特定クラスである場合の前記正解クラスと前記検知クラスとの差に対する第3の重みと、前記正解クラスが前記特定クラス以外である場合の前記正解クラスと前記検知クラスとの差に対する第4の重みとを異ならせることの少なくとも1つを行い、前記評価値を算出する
請求項1に記載の学習方法。 - 前記評価値の算出では、少なくとも前記第1の重みと前記第2の重みとを異ならせ、
前記第1の重みは、前記第2の重みより大きい
請求項2に記載の学習方法。 - 前記評価値の算出では、前記第2の重みをゼロにする
請求項2又は3に記載の学習方法。 - 前記特定の位置は、前記正解枠及び前記検知枠における下端の位置である
請求項2~4のいずれか1項に記載の学習方法。 - 前記評価値の算出では、少なくとも前記第3の重みと前記第4の重みとを異ならせ、
前記第3の重みは、前記第4の重みより大きい
請求項2~5のいずれか1項に記載の学習方法。 - 前記正解クラスは、前記物体を分類するための第1の正解クラスと、前記物体の属性又は状態を示す第2の正解クラスとを含み、
前記検知クラスは、前記物体が分類された第1の検知クラスと、検知された前記物体の属性又は状態を示す第2の検知クラスとを含み、
前記第2の正解クラスが前記特定クラスである場合、前記評価値の算出では、前記第1の正解クラスと前記第1の検知クラスとの差に対する重みを前記第4の重みとし、前記第2の正解クラスと前記第2の検知クラスとの差に対する重みを前記第3の重みとする
請求項2~6のいずれか1項に記載の学習方法。 - 物体を含む学習用画像と、前記物体のクラスを示す正解クラス及び前記物体の前記学習用画像上での領域を示す正解枠を含む正解情報とを取得する取得部と、
画像を入力として物体検知結果を出力する学習モデルに前記学習用画像を入力することにより得られる前記物体のクラスを示す検知クラス及び前記物体の前記学習用画像上での領域を示す検知枠を含む物体検知結果を取得し、取得した前記物体検知結果と前記正解情報との差に基づいて、前記学習モデルに対する評価値を算出する評価部と、
算出された前記評価値に基づいて、前記学習モデルのパラメータを調整する調整部とを備え、
前記評価部は、前記評価値の算出において、前記正解枠及び前記検知枠における2以上の位置又は長さの差のそれぞれに対する重みを互いに異ならせる、及び、前記正解クラスが特定クラスであるか否かに応じて前記正解クラス及び前記検知クラスの差に対する重みを互いに異ならせることの少なくとも1つを行うことで、前記評価値を算出する
学習装置。 - 請求項1~7のいずれか1項に記載の学習方法をコンピュータに実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050042A JP7361342B2 (ja) | 2021-03-24 | 2021-03-24 | 学習方法、学習装置、及び、プログラム |
CN202210253435.1A CN115131752A (zh) | 2021-03-24 | 2022-03-15 | 学习方法、学习装置以及程序记录介质 |
US17/701,560 US20220309400A1 (en) | 2021-03-24 | 2022-03-22 | Learning method, learning device, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050042A JP7361342B2 (ja) | 2021-03-24 | 2021-03-24 | 学習方法、学習装置、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022148383A true JP2022148383A (ja) | 2022-10-06 |
JP7361342B2 JP7361342B2 (ja) | 2023-10-16 |
Family
ID=83364874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021050042A Active JP7361342B2 (ja) | 2021-03-24 | 2021-03-24 | 学習方法、学習装置、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220309400A1 (ja) |
JP (1) | JP7361342B2 (ja) |
CN (1) | CN115131752A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021152691A (ja) * | 2020-03-24 | 2021-09-30 | 株式会社 日立産業制御ソリューションズ | 学習画像判定装置、プログラムおよび学習画像判定方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013149146A (ja) * | 2012-01-20 | 2013-08-01 | Nec Corp | 物体検知装置、物体検知方法、および、コンピュータ・プログラム |
CN110378243A (zh) * | 2019-06-26 | 2019-10-25 | 深圳大学 | 一种行人检测方法及装置 |
US20200193609A1 (en) * | 2018-12-18 | 2020-06-18 | Qualcomm Incorporated | Motion-assisted image segmentation and object detection |
JP2020126633A (ja) * | 2019-01-31 | 2020-08-20 | 株式会社ストラドビジョンStradvision,Inc. | Avm及び強化学習を利用して自律走行の安全性を達成するためのアテンション−ドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置{method and device for attention−driven resource allocation by using avmand reinforcement learning to thereby achieve safety of autonomous driving} |
-
2021
- 2021-03-24 JP JP2021050042A patent/JP7361342B2/ja active Active
-
2022
- 2022-03-15 CN CN202210253435.1A patent/CN115131752A/zh active Pending
- 2022-03-22 US US17/701,560 patent/US20220309400A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013149146A (ja) * | 2012-01-20 | 2013-08-01 | Nec Corp | 物体検知装置、物体検知方法、および、コンピュータ・プログラム |
US20200193609A1 (en) * | 2018-12-18 | 2020-06-18 | Qualcomm Incorporated | Motion-assisted image segmentation and object detection |
JP2020126633A (ja) * | 2019-01-31 | 2020-08-20 | 株式会社ストラドビジョンStradvision,Inc. | Avm及び強化学習を利用して自律走行の安全性を達成するためのアテンション−ドリブンアルゴリズムを利用したリソース割り当てのための方法及び装置{method and device for attention−driven resource allocation by using avmand reinforcement learning to thereby achieve safety of autonomous driving} |
CN110378243A (zh) * | 2019-06-26 | 2019-10-25 | 深圳大学 | 一种行人检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
JIANAN LI ET AL.: ""Scale-Aware Fast R-CNN for Pedestrian Detection"", IEEE TRANSACTIONS ON MULTIMEDIA, vol. 20, no. 4, JPN6023010666, April 2018 (2018-04-01), pages 985 - 995, ISSN: 0005082450 * |
SEBASTIAN SCHMIDT ET AL.: ""Advanced Active Learning Strategies for Object Detection"", 2020 IEEE INTELLIGENT VEHICLES SYMPOSIUM (IV), JPN6023024349, 19 October 2020 (2020-10-19), pages 871 - 876, XP033873389, ISSN: 0005082451, DOI: 10.1109/IV47402.2020.9304565 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021152691A (ja) * | 2020-03-24 | 2021-09-30 | 株式会社 日立産業制御ソリューションズ | 学習画像判定装置、プログラムおよび学習画像判定方法 |
JP7266008B2 (ja) | 2020-03-24 | 2023-04-27 | 株式会社 日立産業制御ソリューションズ | 学習画像判定装置、プログラムおよび学習画像判定方法 |
Also Published As
Publication number | Publication date |
---|---|
US20220309400A1 (en) | 2022-09-29 |
CN115131752A (zh) | 2022-09-30 |
JP7361342B2 (ja) | 2023-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635685B (zh) | 目标对象3d检测方法、装置、介质及设备 | |
CN107169421B (zh) | 一种基于深度卷积神经网络的汽车驾驶场景目标检测方法 | |
US20190043216A1 (en) | Information processing apparatus and estimating method for estimating line-of-sight direction of person, and learning apparatus and learning method | |
US9626766B2 (en) | Depth sensing using an RGB camera | |
US10366300B1 (en) | Systems and methods regarding 2D image and 3D image ensemble prediction models | |
US8406470B2 (en) | Object detection in depth images | |
JP2021523443A (ja) | Lidarデータと画像データの関連付け | |
JP6398979B2 (ja) | 映像処理装置、映像処理方法および映像処理プログラム | |
US11527077B2 (en) | Advanced driver assist system, method of calibrating the same, and method of detecting object in the same | |
US11068754B1 (en) | Systems and methods regarding image distification and prediction models | |
US11670097B2 (en) | Systems and methods for 3D image distification | |
CN109598781B (zh) | 通过回归分析从2d边界框获取伪3d框的方法以及使用该方法的学习装置和测试装置 | |
KR102416227B1 (ko) | 건설 객체 실시간 모니터링 장치 및 모니터링 방법 및 이를 실행하기 위한 컴퓨터프로그램 | |
KR20180056685A (ko) | 비 장애물 영역 검출을 위한 시스템 및 방법 | |
KR20170056860A (ko) | 이미지 생성 방법 및 장치 | |
JP7091686B2 (ja) | 立体物認識装置、撮像装置および車両 | |
CN110956662A (zh) | 载体避障方法、装置及电子设备 | |
JP2021503139A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US11640530B2 (en) | Learning device, learning method, computer program product, and recognition device | |
JP2022148383A (ja) | 学習方法、学習装置、及び、プログラム | |
JP2021015479A (ja) | 行動認識装置、行動認識方法、及び行動認識プログラム | |
US20230021591A1 (en) | Model generation method, model generation apparatus, non-transitory storage medium, mobile object posture estimation method, and mobile object posture estimation apparatus | |
US20220270351A1 (en) | Image recognition evaluation program, image recognition evaluation method, evaluation apparatus, and evaluation system | |
KR101909326B1 (ko) | 얼굴 모션 변화에 따른 삼각 매쉬 모델을 활용하는 사용자 인터페이스 제어 방법 및 시스템 | |
JP2013149146A (ja) | 物体検知装置、物体検知方法、および、コンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230925 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7361342 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
SZ03 | Written request for cancellation of trust registration |
Free format text: JAPANESE INTERMEDIATE CODE: R313Z03 |