JP2020091543A - 学習装置、処理装置、ニューラルネットワーク、学習方法、及びプログラム - Google Patents
学習装置、処理装置、ニューラルネットワーク、学習方法、及びプログラム Download PDFInfo
- Publication number
- JP2020091543A JP2020091543A JP2018226721A JP2018226721A JP2020091543A JP 2020091543 A JP2020091543 A JP 2020091543A JP 2018226721 A JP2018226721 A JP 2018226721A JP 2018226721 A JP2018226721 A JP 2018226721A JP 2020091543 A JP2020091543 A JP 2020091543A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- detection result
- image
- error
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000013016 learning Effects 0.000 title claims abstract description 265
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims description 77
- 238000012545 processing Methods 0.000 title claims description 57
- 238000001514 detection method Methods 0.000 claims abstract description 197
- 230000006870 function Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 description 17
- 210000000746 body region Anatomy 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
Description
前記ニューラルネットワークは、前記入力画像が入力されると、前記入力画像の各位置に対する第1の種類の検出結果及び第2の種類の検出結果を出力し、
前記学習装置は、
学習のために前記ニューラルネットワークに入力する学習画像を取得する学習データ取得手段と、
前記学習画像の各位置について前記第1の種類の検出結果における検出誤差を示す、誤差マップを取得する誤差マップ取得手段と、
学習画像を前記ニューラルネットワークに入力して得られた前記第1の種類の検出結果及び前記第2の種類の検出結果と、前記誤差マップと、を用いて前記ニューラルネットワークの学習を行う、学習手段と、
を備えることを特徴とする。
[実施形態1]
E=−ΣqΣpt(p,q)logy(p,q) ……(1)
式(1)においては、推定マップにおける座標(p,q)の画素値をy(p,q)とする。また、教師画像における座標(p,q)の画素値をt(p,q)とする。
E=−ΣqΣpw(p,q)t(p,q)logy(p,q) ……(2)
図8は、実施形態2に係る処理装置8000の構成を示す。本実施形態は、誤差マップ作成部121が学習部120と独立している点で、実施形態1とは異なる。また、本実施形態に係る処理装置8000は、プレモデル810を備えている。その他の構成は、実施形態1と同様であり、以下では異なる点について説明する。
実施形態1,2においては、メインタスクの誤差マップを利用して、誤りが発生しやすい領域における損失に重みづけすることで、このような領域における誤りを効率的に抑制するように学習が行われた。一方で、あるタスクにおける誤検出領域は、検出対象に類似した物体が存在する領域であることが多い。すなわち、未検出領域は検出対象が存在する領域であるし、過検出領域は検出対象に類似する物体が存在するために過検出が生じた可能性が高い。より詳細には、頭部領域を検出するタスクにおいては、タイヤ又はボールのような丸い物体や、手又は胴体のように頭部と同じ人体の一部である領域が、頭部領域と誤検出されやすい。また、未検出領域においては、検出対象が検出しづらい特定の状態で存在している可能性が高い。例えば、頭が後ろを向いている状態、及び頭部領域の一部が遮蔽されている状態では、頭部領域の未検出が生じやすい。このように、誤りが発生する場合には、被写体が特定の特性を有している可能性が高い。したがって、このような、検出対象に類似する物体や、被写体が有する特定の特性を判別しやすいように、ニューラルネットワークの学習を行うことにより、メインタスクについての検出精度も向上することが期待される。
Claims (16)
- 入力画像の各位置に対する検出結果を推定マップとして出力するニューラルネットワークの学習を行う学習装置であって、
前記ニューラルネットワークは、前記入力画像が入力されると、前記入力画像の各位置に対する第1の種類の検出結果及び第2の種類の検出結果を出力し、
前記学習装置は、
学習のために前記ニューラルネットワークに入力する学習画像を取得する学習データ取得手段と、
前記学習画像の各位置について前記第1の種類の検出結果における検出誤差を示す、誤差マップを取得する誤差マップ取得手段と、
学習画像を前記ニューラルネットワークに入力して得られた前記第1の種類の検出結果及び前記第2の種類の検出結果と、前記誤差マップと、を用いて前記ニューラルネットワークの学習を行う、学習手段と、
を備えることを特徴とする学習装置。 - 前記第2の種類の検出結果は、前記第1の種類の検出結果から生成可能であることを特徴とする、請求項1に記載の学習装置。
- 前記誤差マップは、前記第1の種類の検出結果における検出誤差により生じた未検出領域又は過検出領域の位置を示すことを特徴とする、請求項1又は2に記載の学習装置。
- 前記ニューラルネットワークは、前記入力画像が入力される入力層、処理が行われる中間層、前記第1の種類の検出結果を出力する第1の出力層、及び前記中間層から分岐して前記第2の種類の検出結果を出力する第2の出力層を備えることを特徴とする、請求項1から3のいずれか1項に記載の学習装置。
- 前記学習データ取得手段は、前記学習画像について予め用意された前記第1の種類の検出結果を示す第1の教師データをさらに取得し、
前記誤差マップ取得手段は、前記学習画像を前記ニューラルネットワークに入力して得られた前記第1の種類の検出結果と、前記第1の教師データと、の誤差に基づいて前記誤差マップを生成する
ことを特徴とする、請求項1から4のいずれか1項に記載の学習装置。 - 前記誤差マップ取得手段は、前記学習画像を学習前のニューラルネットワークに入力して得られた前記第1の種類の検出結果と、前記第1の教師データと、の誤差に基づいて前記誤差マップを生成し、
前記学習手段は、前記学習画像を学習後のニューラルネットワークに入力して得られた前記第1の種類の検出結果及び前記第2の種類の検出結果と、前記誤差マップと、を用いて前記ニューラルネットワークのさらなる学習を行う
ことを特徴とする、請求項5に記載の学習装置。 - 前記誤差マップ取得手段は、
前記学習画像を学習前のニューラルネットワークに入力して得られた前記第1の種類の検出結果と、前記第1の教師データと、の誤差、及び、
前記学習画像を学習後のニューラルネットワークに入力して得られた前記第1の種類の検出結果と、前記第1の教師データと、の誤差、
に基づいて、さらなる学習に用いられる前記誤差マップを生成することを特徴とする、請求項5又は6に記載の学習装置。 - 前記学習データ取得手段は、前記学習画像について予め用意された、前記第1の種類の検出結果を示す第1の教師データ及び前記第2の種類の検出結果を示す第2の教師データを取得し、
前記学習手段は、前記第1の種類の検出結果と前記第1の教師データとの誤差、及び前記第2の種類の検出結果と前記第2の教師データとの誤差、に基づいて前記ニューラルネットワークの学習を行う
ことを特徴とする、請求項1から7のいずれか1項に記載の学習装置。 - 前記学習手段は、前記学習画像の各位置について、前記第1の種類の検出結果における検出誤差を用いて、前記第2の種類の検出結果と前記第2の教師データとの誤差を重み付けすることを特徴とする、請求項8に記載の学習装置。
- 前記第1の種類の検出結果及び前記第2の種類の検出結果は、同種の検出対象に対する異なる情報を示すことを特徴とする、請求項8又は9に記載の学習装置。
- 前記学習データ取得手段は、前記第1の教師データを用いて前記第2の教師データを生成することを特徴とする、請求項8から10のいずれか1項に記載の学習装置。
- 前記第2の種類の検出結果は、前記第1の種類の検出結果についての検出誤差を示し、
前記学習手段は、前記第2の教師データとして前記誤差マップを用いる
ことを特徴とする、請求項8に記載の学習装置。 - 入力画像の各位置に対する検出結果を推定マップとして出力する処理装置であって、
請求項1から12のいずれか1項に記載の学習装置により学習が行われたニューラルネットワークを有し、入力画像を前記ニューラルネットワークに入力することにより前記推定マップを生成する生成手段を備えることを特徴とする処理装置。 - 入力画像の各位置に対する検出結果を推定マップとして出力するニューラルネットワークであって、前記入力画像が入力される入力層、処理が行われる中間層、及び前記検出結果を出力する出力層を有し、前記検出結果から生成可能である別の検出結果が前記中間層から得られるように学習されていることを特徴とする、ニューラルネットワーク。
- 入力画像の各位置に対する検出結果を推定マップとして出力するニューラルネットワークの学習を行う学習装置が行う学習方法であって、
前記ニューラルネットワークは、前記入力画像が入力されると、前記入力画像の各位置に対する第1の種類の検出結果及び第2の種類の検出結果を出力し、
前記学習方法は、
学習のために前記ニューラルネットワークに入力する学習画像を取得する工程と、
前記学習画像の各位置について前記第1の種類の検出結果における検出誤差を示す、誤差マップを取得す工程と、
学習画像を前記ニューラルネットワークに入力して得られた前記第1の種類の検出結果及び前記第2の種類の検出結果と、前記誤差マップと、を用いて前記ニューラルネットワークの学習を行う工程と、
を有することを特徴とする学習方法。 - コンピュータを、請求項1乃至12の何れか1項に記載の学習装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018226721A JP7296715B2 (ja) | 2018-12-03 | 2018-12-03 | 学習装置、処理装置、ニューラルネットワーク、学習方法、及びプログラム |
US16/693,025 US20200175377A1 (en) | 2018-12-03 | 2019-11-22 | Training apparatus, processing apparatus, neural network, training method, and medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018226721A JP7296715B2 (ja) | 2018-12-03 | 2018-12-03 | 学習装置、処理装置、ニューラルネットワーク、学習方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020091543A true JP2020091543A (ja) | 2020-06-11 |
JP7296715B2 JP7296715B2 (ja) | 2023-06-23 |
Family
ID=70848692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018226721A Active JP7296715B2 (ja) | 2018-12-03 | 2018-12-03 | 学習装置、処理装置、ニューラルネットワーク、学習方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20200175377A1 (ja) |
JP (1) | JP7296715B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159183A (zh) * | 2021-04-23 | 2021-07-23 | 中国科学院合肥物质科学研究院 | 基于局部密集区域密度特征检测的微小害虫图像识别方法 |
JP2022024118A (ja) * | 2020-12-24 | 2022-02-08 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 感知データ検出方法及び装置 |
WO2022209500A1 (ja) * | 2021-03-30 | 2022-10-06 | 富士フイルム株式会社 | 機械学習モデル作成支援装置、機械学習モデル作成支援装置の作動方法、機械学習モデル作成支援装置の作動プログラム |
WO2023084900A1 (ja) | 2021-11-10 | 2023-05-19 | 富士フイルム株式会社 | 学習方法、学習装置、学習プログラム、及び画像処理装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11314609B2 (en) * | 2019-10-24 | 2022-04-26 | EMC IP Holding Company LLC | Diagnosing and remediating errors using visual error signatures |
CN112016603B (zh) * | 2020-08-18 | 2021-04-30 | 上海松鼠课堂人工智能科技有限公司 | 基于图神经网络的错因分析方法 |
CN112668544B (zh) * | 2021-01-13 | 2022-03-22 | 昆明理工大学 | 一种基于难样本混淆增强特征鲁棒性的行人重识别方法 |
CN113570592B (zh) * | 2021-08-05 | 2022-09-20 | 印迹信息科技(北京)有限公司 | 肠胃病检测和模型训练方法、装置、设备及介质 |
CN113869246B (zh) * | 2021-09-30 | 2022-04-01 | 安徽大学 | 基于改进CenterNet技术的小麦条锈病菌夏孢子显微图像检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10013613B2 (en) * | 2016-03-23 | 2018-07-03 | International Business Machines Corporation | Identifying objects in an image |
-
2018
- 2018-12-03 JP JP2018226721A patent/JP7296715B2/ja active Active
-
2019
- 2019-11-22 US US16/693,025 patent/US20200175377A1/en active Pending
Non-Patent Citations (1)
Title |
---|
KUN NIE ET AL.: "Semantic Labeling based Vehicle Detection in Aerial Imagery", 2018 IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION (WACV), JPN6022054148, 12 March 2018 (2018-03-12), pages 626 - 634, XP033337679, ISSN: 0004950813, DOI: 10.1109/WACV.2018.00074 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022024118A (ja) * | 2020-12-24 | 2022-02-08 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 感知データ検出方法及び装置 |
US11869247B2 (en) | 2020-12-24 | 2024-01-09 | Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd. | Perception data detection method and apparatus |
WO2022209500A1 (ja) * | 2021-03-30 | 2022-10-06 | 富士フイルム株式会社 | 機械学習モデル作成支援装置、機械学習モデル作成支援装置の作動方法、機械学習モデル作成支援装置の作動プログラム |
CN113159183A (zh) * | 2021-04-23 | 2021-07-23 | 中国科学院合肥物质科学研究院 | 基于局部密集区域密度特征检测的微小害虫图像识别方法 |
CN113159183B (zh) * | 2021-04-23 | 2022-08-30 | 中国科学院合肥物质科学研究院 | 基于局部密集区域密度特征检测的微小害虫图像识别方法 |
WO2023084900A1 (ja) | 2021-11-10 | 2023-05-19 | 富士フイルム株式会社 | 学習方法、学習装置、学習プログラム、及び画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7296715B2 (ja) | 2023-06-23 |
US20200175377A1 (en) | 2020-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7296715B2 (ja) | 学習装置、処理装置、ニューラルネットワーク、学習方法、及びプログラム | |
CN109145781B (zh) | 用于处理图像的方法和装置 | |
CN109376267B (zh) | 用于生成模型的方法和装置 | |
JP6954003B2 (ja) | データベースのための畳み込みニューラルネットワークモデルの決定装置及び決定方法 | |
KR20070117472A (ko) | 정보처리장치 및 정보처리방법과 컴퓨터 프로그램 | |
US20200372298A1 (en) | Model reselection for accommodating unsatisfactory training data | |
CN111612756B (zh) | 冠状动脉特异性钙化检测方法及装置 | |
CN112668608B (zh) | 一种图像识别方法、装置、电子设备及存储介质 | |
JP7040634B2 (ja) | 群集推定手法の統合及び自動切り替えのための方法、システム及びプログラム | |
TW201812339A (zh) | 震央距離推定裝置、震央距離推定方法及電腦可讀取之記錄媒體 | |
CN115082740B (zh) | 目标检测模型训练方法、目标检测方法、装置、电子设备 | |
JP6950504B2 (ja) | 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置 | |
CN112686317A (zh) | 神经网络训练方法、装置、电子设备及存储介质 | |
CN110489602B (zh) | 知识点能力值预估方法、系统、设备及介质 | |
CN113743572A (zh) | 一种基于Fuzz的人工神经网络测试方法 | |
JP6241790B2 (ja) | 生成モデル作成装置、推定装置、それらの方法およびプログラム | |
CN108665455B (zh) | 图像显著性预测结果的评价方法和装置 | |
CN111626098A (zh) | 模型的参数值更新方法、装置、设备及介质 | |
US20200034739A1 (en) | Method and device for estimating user's physical condition | |
CN114067442B (zh) | 洗手动作检测方法、模型训练方法、装置及电子设备 | |
CN115937991A (zh) | 人体摔倒识别方法、装置、计算机设备及存储介质 | |
CN115862119A (zh) | 基于注意力机制的人脸年龄估计方法及装置 | |
KR102413588B1 (ko) | 학습 데이터에 따른 객체 인식 모델 추천 방법, 시스템 및 컴퓨터 프로그램 | |
JP6962450B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
KR20190033884A (ko) | Sns의 사용자 정보를 이용한 딥러닝 기반의 관심지점 예측 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230515 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230613 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7296715 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |