JP6897335B2 - 学習プログラム、学習方法および物体検知装置 - Google Patents
学習プログラム、学習方法および物体検知装置 Download PDFInfo
- Publication number
- JP6897335B2 JP6897335B2 JP2017108456A JP2017108456A JP6897335B2 JP 6897335 B2 JP6897335 B2 JP 6897335B2 JP 2017108456 A JP2017108456 A JP 2017108456A JP 2017108456 A JP2017108456 A JP 2017108456A JP 6897335 B2 JP6897335 B2 JP 6897335B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- object detection
- learning
- unit
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
実施例1にかかる物体検知装置は、複数の学習器を有するコンピュータ装置の一例であり、深層学習を用いた物体検知手法において、入力画像から特徴量を抽出する部分について、自己符号化器により半教師あり学習を行う。この際、物体検知装置は、半教師あり学習により、入手コストの高い教師ありデータが少ない場合にも、教師なしデータを用いることで高い汎化性能を達成する、深層学習に基づく物体検知を実現する。
次に、実施例1にかかる物体検知装置の機能構成について説明する。図4は、実施例1にかかる物体検知装置の機能構成を説明する図である。図4に示すように、物体検知装置10は、記憶部11、撮影部12、検知部13、集計部14、表示部15を有する。なお、ここで示した機能は例示であり、例えば通信制御を実行する通信処理部などを有することもできる。また、撮影部12、検知部13、集計部14、表示部15は、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例である。
図11は、処理の流れを示すフローチャートである。図11に示すように、学習処理が開始されると(S101:Yes)、特徴抽出部26は、訓練データを読み込み(S102)、特徴量を抽出する(S103)。
実施例1にかかる物体検知装置10は、訓練データを用いて過学習を抑制しつつ、深層学習を用いた半教師あり学習による物体検知を行うことができる。また、物体検知装置10は、半教師あり学習の導入により、少ない教師ありデータと、多数の教師なしデータとを用いることで汎化性能の高い物体検知器を構成することができる。この結果、物体検知装置10は、過学習による汎化性能の低下を抑制することができる。
上記実施例1では、物体検知結果をそのまま用いて確率マップによる対応付けを行う例を説明したが、これに限定されるものではない。例えば、対応付け部30は、物体検知結果を分割してから対応付けを行うこともできる。図12は、検知結果を分割して対応付ける例を説明する図である。図12に示すように、対応付け部30は、物体検知結果を種類ごとに分類し、分類された種類ごとに確率マップを生成して対応付けを実行する。
上記実施例1では、画像復元部31は、対応付け結果とメタ情報とを用いて元の入力画像を復元する例を説明したが、これに限定されるものではない。例えば、画像復元部31は、特徴量をさらに加えて、元の入力画像を復元することもできる。図13は、特徴量を用いた画像復元を説明する図である。図13に示すように、画像復元部31は、メタ情報と対応付け処理による対応付け結果と特徴抽出用NNが抽出した特徴量とを元画像復元用NNに入力して、復元画像を生成する。
上記実施例1では、元の入力画像を復元する例を説明したが、これに限定されるものではなく、中間画像を復元することもできる。図14は、中間画像を復元する例を説明する図である。図14に示すように、画像復元部31は、元画像復元用NNのパラメータや構成を変更することで、復元の目標を入力画像から中間画像に変更する。そして、画像復元部31は、対応付け結果とメタ情報とを用いて、中間画像を復元する。
上記実施例では、各学習器にNNを用いて、バックプロパゲーションによる学習を実行する例を説明したが、これに限定されるものではなく、例えば勾配法などの他の学習手法を採用することもできる。
上記実施例では、車線などの画像を例にして説明したが、これに限定されるものではなく、例えば文字や文字を含む画像を処理対象とすることができる。この場合、上記物体として文字の検出および復元を実行する。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。なお、特徴抽出部26は抽出部の一例であり、物体検知部27は検知部の一例であり、対応付け部30と画像復元部31は復元部の一例であり、検知用最適化部29と特徴量用最適化部34は第1の学習部の一例であり、検知用最適化部29と特徴量用最適化部34と復元用最適化部33は第2の学習部の一例である。
図15は、ハードウェア構成例を説明する図である。図15に示すように、物体検知装置10は、通信インタフェース10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。
11 記憶部
12 撮影部
13 検知部
14 集計部
15 表示部
20 教師ありデータDB
21 教師なしデータDB
22 メタ情報DB
23 特徴量用パラメータDB
24 物体検知用パラメータDB
25 復元用パラメータDB
26 特徴抽出部
27 物体検知部
28 物体検知評価部
29 検知用最適化部
30 対応付け部
31 画像復元部
32 復元評価部
33 復元用最適化部
34 特徴量用最適化部
Claims (6)
- ラベルありデータ、および、ラベル無しデータの双方を含む入力データに対する、符号化器を用いた特徴量抽出処理と、
前記入力データに対する、物体検知器を用いた物体検知処理と、
前記入力データそれぞれについて、前記物体検知処理により検知された物体に対応した当該入力データの領域データ、および、前記検知された物体に対応したメタ情報から、前記符号化器に対応した復号化器を用いて復元データを生成する復元データ生成処理と、
前記入力データがラベルありデータである場合、前記物体検知処理の結果、および、前記入力データに対応づけられたラベルに基づき、前記符号化器および前記物体検知器の学習を実行させる第1の学習処理と、
前記入力データおよび前記復元データから、前記符号化器、前記物体検知器、および、前記復号化器の学習を実行させる第2の学習処理と
をコンピュータに実行させる学習プログラム。 - 前記復元データ生成処理は、前記物体検知処理の結果と前記メタ情報とを微分可能な分布に適用して、前記領域データに対して物体が存在する領域を推定する確率マップを生成し、前記物体検知処理の結果と前記メタ情報とを対応付ける前記領域データを生成する請求項1に記載の学習プログラム。
- 前記復元データ生成処理は、前記物体検知処理の結果に含まれる、前記検知された物体の大きさに関するスケール情報に基づき、前記物体検知処理の結果と前記メタ情報とを対応付ける前記領域データを生成する請求項1に記載の学習プログラム。
- 前記復元データ生成処理は、前記物体検知処理の結果に含まれる、前記検知された物体の種類に関するクラス情報に基づき、前記物体検知処理の結果と前記メタ情報とを対応付ける前記領域データを生成する請求項1に記載の学習プログラム。
- ラベルありデータ、および、ラベル無しデータの双方を含む入力データに対する、符号化器を用いた特徴量抽出処理と、
前記入力データに対する、物体検知器を用いた物体検知処理と、
前記入力データそれぞれについて、前記物体検知処理により検知された物体に対応した当該入力データの領域データ、および、前記検知された物体に対応したメタ情報から、前記符号化器に対応した復号化器を用いて復元データを生成する復元データ生成処理と、
前記入力データがラベルありデータである場合、前記物体検知処理の結果、および、前記入力データに対応づけられたラベルに基づき、前記符号化器および前記物体検知器の学習を実行させる第1の学習処理と、
前記入力データおよび前記復元データから、前記符号化器、前記物体検知器、および、前記復号化器の学習を実行させる第2の学習処理と
をコンピュータが実行する学習方法。 - ラベルありデータ、および、ラベル無しデータの双方を含む入力データに対する、符号化器を用いて特徴量抽出処理を実行する抽出部と、
前記入力データに対する、物体検知器を用いた物体検知処理を実行する検知部と、
前記入力データそれぞれについて、前記物体検知処理により検知された物体に対応した当該入力データの領域データ、および、前記検知された物体に対応したメタ情報から、前記符号化器に対応した復号化器を用いて復元データを生成する復元データ生成処理を実行する復元部と、
前記入力データがラベルありデータである場合、前記物体検知処理の結果、および、前記入力データに対応づけられたラベルに基づき、前記符号化器および前記物体検知器の学習を実行させる第1の学習部と、
前記入力データおよび前記復元データから、前記符号化器、前記物体検知器、および、前記復号化器の学習を実行させる第2の学習部と
を有する物体検知装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017108456A JP6897335B2 (ja) | 2017-05-31 | 2017-05-31 | 学習プログラム、学習方法および物体検知装置 |
EP18175076.1A EP3410351B1 (en) | 2017-05-31 | 2018-05-30 | Learning program, learning method, and object detection device |
US15/992,754 US10803357B2 (en) | 2017-05-31 | 2018-05-30 | Computer-readable recording medium, training method, and object detection device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017108456A JP6897335B2 (ja) | 2017-05-31 | 2017-05-31 | 学習プログラム、学習方法および物体検知装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018205920A JP2018205920A (ja) | 2018-12-27 |
JP6897335B2 true JP6897335B2 (ja) | 2021-06-30 |
Family
ID=62492455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017108456A Active JP6897335B2 (ja) | 2017-05-31 | 2017-05-31 | 学習プログラム、学習方法および物体検知装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10803357B2 (ja) |
EP (1) | EP3410351B1 (ja) |
JP (1) | JP6897335B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7163786B2 (ja) * | 2019-01-17 | 2022-11-01 | 富士通株式会社 | 学習方法、学習プログラムおよび学習装置 |
JP7279368B2 (ja) * | 2019-01-17 | 2023-05-23 | 富士通株式会社 | 学習方法、学習プログラムおよび学習装置 |
JP7156049B2 (ja) * | 2019-01-17 | 2022-10-19 | 富士通株式会社 | 学習方法、学習プログラムおよび学習装置 |
JP7151501B2 (ja) * | 2019-01-18 | 2022-10-12 | 富士通株式会社 | Dnn選択プログラム、dnn選択方法および情報処理装置 |
CN109784323B (zh) * | 2019-01-21 | 2020-11-27 | 北京旷视科技有限公司 | 图像识别的方法、装置、电子设备和计算机存储介质 |
CN109887276B (zh) * | 2019-01-30 | 2020-11-03 | 北京同方软件有限公司 | 基于前景提取与深度学习融合的夜间交通拥堵检测方法 |
JP2020140346A (ja) * | 2019-02-27 | 2020-09-03 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
WO2020219971A1 (en) | 2019-04-25 | 2020-10-29 | Google Llc | Training machine learning models using unsupervised data augmentation |
US11132826B2 (en) | 2019-05-16 | 2021-09-28 | Caterpillar Inc. | Artificial image generation for training an object detection system |
WO2021009986A1 (ja) * | 2019-07-12 | 2021-01-21 | 村田機械株式会社 | 画像認識方法及び画像認識装置 |
JP2021026550A (ja) * | 2019-08-06 | 2021-02-22 | Fringe81株式会社 | 投稿管理サーバ、及び投稿管理システム |
JP7490359B2 (ja) * | 2019-12-24 | 2024-05-27 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7441312B2 (ja) * | 2020-06-11 | 2024-02-29 | 富士フイルム株式会社 | 学習装置、学習方法、及びプログラム |
WO2022201276A1 (ja) * | 2021-03-23 | 2022-09-29 | 三菱電機株式会社 | 信頼度判定装置および信頼度判定方法 |
US20240161445A1 (en) * | 2021-04-07 | 2024-05-16 | Nec Corporation | Object detection apparatus, object detection system, object detection method, and recording medium |
KR20220148011A (ko) * | 2021-04-28 | 2022-11-04 | 주식회사 에이치엘클레무브 | 차량의 주행을 보조하는 장치 및 그 방법 |
US11893346B2 (en) | 2021-05-05 | 2024-02-06 | International Business Machines Corporation | Transformer-based encoding incorporating metadata |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7519201B2 (en) | 2005-10-28 | 2009-04-14 | Honda Motor Co., Ltd. | Detecting humans via their pose |
US7603330B2 (en) * | 2006-02-01 | 2009-10-13 | Honda Motor Co., Ltd. | Meta learning for question classification |
JP5335536B2 (ja) | 2009-04-23 | 2013-11-06 | キヤノン株式会社 | 情報処理装置及び情報処理方法 |
JP5513960B2 (ja) | 2010-04-12 | 2014-06-04 | 株式会社メガチップス | 画像処理装置 |
US11144889B2 (en) * | 2016-04-06 | 2021-10-12 | American International Group, Inc. | Automatic assessment of damage and repair costs in vehicles |
GB201615051D0 (en) * | 2016-09-05 | 2016-10-19 | Kheiron Medical Tech Ltd | Multi-modal medical image procesing |
US10074038B2 (en) * | 2016-11-23 | 2018-09-11 | General Electric Company | Deep learning medical systems and methods for image reconstruction and quality evaluation |
US10719780B2 (en) * | 2017-03-31 | 2020-07-21 | Drvision Technologies Llc | Efficient machine learning method |
-
2017
- 2017-05-31 JP JP2017108456A patent/JP6897335B2/ja active Active
-
2018
- 2018-05-30 EP EP18175076.1A patent/EP3410351B1/en active Active
- 2018-05-30 US US15/992,754 patent/US10803357B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10803357B2 (en) | 2020-10-13 |
EP3410351A1 (en) | 2018-12-05 |
EP3410351B1 (en) | 2023-12-27 |
US20180349741A1 (en) | 2018-12-06 |
JP2018205920A (ja) | 2018-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6897335B2 (ja) | 学習プログラム、学習方法および物体検知装置 | |
Kim et al. | End-to-end ego lane estimation based on sequential transfer learning for self-driving cars | |
US10580164B2 (en) | Automatic camera calibration | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
US20200117937A1 (en) | Convolutional neural network for object detection | |
US20200012865A1 (en) | Adapting to appearance variations when tracking a target object in video sequence | |
KR101848019B1 (ko) | 차량 영역 검출을 통한 차량 번호판 검출 방법 및 장치 | |
US10964033B2 (en) | Decoupled motion models for object tracking | |
CN106651774B (zh) | 一种车牌超分辨率模型重建方法及装置 | |
US20210232851A1 (en) | Image segmentation | |
WO2013012091A1 (ja) | 情報処理装置、物体追跡方法およびプログラム記憶媒体 | |
JP2016062610A (ja) | 特徴モデル生成方法及び特徴モデル生成装置 | |
CN105989334A (zh) | 基于单目视觉的道路检测方法 | |
JP2017538196A (ja) | 商品画像のセグメンテーション方法および装置 | |
CN110781980B (zh) | 目标检测模型的训练方法、目标检测方法及装置 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
Srividhya et al. | [Retracted] A Machine Learning Algorithm to Automate Vehicle Classification and License Plate Detection | |
CN112699711B (zh) | 车道线检测方法、装置、存储介质及电子设备 | |
Murugan et al. | Automatic moving vehicle detection and classification based on artificial neural fuzzy inference system | |
Bao et al. | Unpaved road detection based on spatial fuzzy clustering algorithm | |
JP2017076394A (ja) | 移動物体の計数装置及び方法 | |
CN115223123A (zh) | 基于计算机视觉识别的路面目标检测方法 | |
Lee | Neural network approach to identify model of vehicles | |
Al Mamun et al. | Efficient lane marking detection using deep learning technique with differential and cross-entropy loss. | |
KR102026280B1 (ko) | 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6897335 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |