JP7210489B2 - 学習装置、学習方法および学習プログラム - Google Patents
学習装置、学習方法および学習プログラム Download PDFInfo
- Publication number
- JP7210489B2 JP7210489B2 JP2020004837A JP2020004837A JP7210489B2 JP 7210489 B2 JP7210489 B2 JP 7210489B2 JP 2020004837 A JP2020004837 A JP 2020004837A JP 2020004837 A JP2020004837 A JP 2020004837A JP 7210489 B2 JP7210489 B2 JP 7210489B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- learning
- similarity
- prototype
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
続いて、本発明の実施形態の詳細について説明する。本発明の実施形態では、学習用データと正解値との組み合わせに基づいてニューラルネットワークの学習を行う学習装置10(図1)について説明した後、学習済みのニューラルネットワークと識別用データ(テストデータ)とに基づいて推論値を出力する識別装置20(図10)について説明を行う。
まず、本発明の実施形態に係る学習装置10の構成例について説明する。図1は、本発明の実施形態に係る学習装置10の機能構成例を示す図である。図1に示されるように、本発明の実施形態に係る学習装置10は、入力部121と、重要領域推定部122と、トリミング処理部123と、特徴抽出部124と、類似度算出部125と、推論部126と、評価部140と、更新部150とを備える。
データセット110は、複数の学習用データ(入力データ)と当該複数の学習用データそれぞれの正解値とを含んで構成される。なお、本発明の実施形態では、学習用データが画像データである場合(特に、静止画像データである場合)を主に想定する。しかし、学習用データの種類は特に限定されない。例えば、学習用データは、複数のフレームを含んだ動画像データであってもよいし、音響データであってもよい。
入力部121は、データセット110から学習用データおよび正解値の組み合わせを順次に取得する。入力部121は、学習用データおよび正解値の組み合わせを順次に重要領域推定部122およびトリミング処理部123それぞれに出力する。入力部121よりも後段の各ブロックにおいては、前段のブロックからの入力に基づいて順次に各自の処理が繰り返し実行される。
重要領域推定部122は、入力部121から出力された学習用データと重要領域推定NNとに基づいて学習用データから1または複数の重要領域を推定する。より詳細に、重要領域推定部122は、重要領域推定NNに学習用データを入力させたことに基づいて、重要領域推定NNから出力されるデータを1または複数の重要領域それぞれを示す情報(1または複数の重要領域それぞれの位置およびサイズ)として得る。重要領域推定部122は、1または複数の重要領域それぞれを示す情報をトリミング処理部123に出力する。ここで、図2を参照しながら、重要領域推定部122の機能についてより詳細に説明する。
図1に戻って説明を続ける。トリミング処理部123は、入力部121から出力された学習用データG1と、重要領域推定部122から出力された重要領域R1~R4それぞれを示す情報とに基づいて、学習用データG1の重要領域R1~R4に対してトリミングを行って重要領域R1~R4を特徴抽出部124に出力する。ここで、図3を参照しながら、トリミング処理部123の機能についてより詳細に説明する。
図1に戻って説明を続ける。特徴抽出部124は、トリミング処理部123から出力された重要領域R1~R4と特徴抽出NNとに基づいて特徴量を抽出する。より詳細に、特徴抽出部124は、特徴抽出NNに重要領域R1~R4を入力させたことに基づいて、特徴抽出NNから出力されるデータを特徴量として得る。特徴抽出部124は、特徴量を類似度算出部125に出力する。ここで、図4を参照しながら、特徴抽出部124の機能についてより詳細に説明する。
図1に戻って説明を続ける。類似度算出部125は、特徴抽出部124から出力された特徴量F1~F4とプロトタイプ134との類似度を算出する。特徴抽出部124から出力される特徴量F1~F4の次元とプロトタイプ134の次元とは同じに設定されている。ここでは、特徴量F1~F4とプロトタイプ134それぞれが、複数チャネルに分かれた二次元データ(すなわち、三次元データ)である場合を想定するが、次元数は限定されない。そして、類似度算出部125は、算出した特徴量F1~F4とプロトタイプ134との類似度を推論部126に出力する。ここで、図5を参照しながら、類似度算出部125の機能についてより詳細に説明する。
図1に戻って説明を続ける。推論部126は、類似度算出部125から出力された類似度M1~M4に基づいて推論を行って推論値を得る。そして、推論部126は、推論値を評価部140に出力する。ここで、図6を参照しながら、推論部126の機能についてより詳細に説明する。
図1に戻って説明を続ける。評価部140は、入力部121によって取得された正解値に基づいて、推論部126から出力された推論値を評価して評価結果を得る。そして、評価部140は、評価結果を更新部150に出力する。ここで、図7を参照しながら、評価部140の機能についてより詳細に説明する。
図1に戻って説明を続ける。更新部150は、評価部140から出力された評価結果に基づいて、重要領域推定NNの重みパラメータ131と、特徴抽出NNの重みパラメータ132と、推論NNの重みパラメータ133と、プロトタイプ134との更新を行う。これによって、推論部126から出力される推論値が正解値に近づくように、重要領域推定NNの重みパラメータ131と、特徴抽出NNの重みパラメータ132と、推論NNの重みパラメータ133と、プロトタイプ134とが訓練され得る。ここで、図8を参照しながら、更新部150の機能についてより詳細に説明する。
続いて、本発明の実施形態に係る学習装置10の動作例について説明する。図9は、本発明の実施形態に係る学習装置10の動作例を示すフローチャートである。まず、図9に示されたように、入力部121は、データセット110から学習用データおよび正解値の組み合わせを取得する。また、重要領域推定部122は、重みパラメータ131を取得し、特徴抽出部124は、重みパラメータ132を取得し、推論部126は、重みパラメータ133を取得し、類似度算出部125は、プロトタイプ134を取得する(S11)。
続いて、本発明の実施形態に係る識別装置20の構成例について説明する。図10は、本発明の実施形態に係る識別装置20の機能構成例を示す図である。図10に示されるように、本発明の実施形態に係る識別装置20は、学習装置10によって学習された学習済みのニューラルネットワーク120を備える。その他、識別装置20は、表示制御部220および表示部230を備える。
テストデータ210は、識別用データに相当する。なお、本発明の実施形態では、テストデータ210が、学習用データと同様に、画像データである場合(特に、静止画像データである場合)を主に想定する。しかし、テストデータ210の種類は特に限定されない。例えば、テストデータ210は、学習用データと同様に、複数のフレームを含んだ動画像データであってもよいし、音響データであってもよい。
入力部121は、テストデータ210を取得する。入力部121は、テストデータ210を重要領域推定部122およびトリミング処理部123それぞれに出力する。重要領域推定部122は、入力部121から出力されたテストデータ210と重要領域推定NNとに基づいてテストデータ210から1または複数の重要領域を推定する。テストデータ210から1または複数の重要領域を推定する手法は、学習装置10における重要領域推定部122が、学習用データから重要領域を推定する手法と同様である。
上記したように、プロトタイプと最も類似度が高い特徴量(類似特徴量)が抽出された学習用データの類似特徴量に対応する領域データが類似部位として、チャネルごとにプロトタイプに対応付けられている。そこで、表示制御部220は、学習用データのプロトタイプに対応する類似部位がチャネルごとに表示されるように表示部230を制御する。以下では、類似部位の提示について、図11を参照しながら詳細に説明する。
続いて、本発明の実施形態に係る識別装置20の動作例について説明する。図12は、本発明の実施形態に係る識別装置20の動作例を示すフローチャートである。まず、図12に示されたように、入力部121は、テストデータを取得する。また、重要領域推定部122は、重みパラメータ131を取得し、特徴抽出部124は、重みパラメータ132を取得し、推論部126は、重みパラメータ133を取得し、類似度算出部125は、プロトタイプ134を取得する(S31)。
続いて、本発明の実施形態に係る学習装置10のハードウェア構成例について説明する。ただし、本発明の実施形態に係る識別装置20のハードウェア構成例も同様に実現され得る。
以上に説明したように、本発明の実施形態によれば、ニューラルネットワークの判断根拠のより有用な説明材料を提示することを可能とする技術が提供される。より詳細に、本発明の実施形態によれば、重要領域がトリミングされて重要領域以外の領域が除外された上で特徴量が抽出され、特徴量とプロトタイプとの類似度が算出される。これによって、プロトタイプと類似する特徴量(類似特徴量)が抽出された学習用データの類似特徴量に対応する類似部位が提示され得る。したがって、類似例全体が提示されるよりも、類似例とテストデータとの類似性が部位ごとに容易に理解されやすくなる。
110 データセット
120 ニューラルネットワーク
121 入力部
122 重要領域推定部
123 トリミング処理部
124 特徴抽出部
125 類似度算出部
126 推論部
131~133 パラメータ
134 プロトタイプ
140 評価部
150 更新部
160 保存データ
20 識別装置
220 表示制御部
230 表示部
Claims (12)
- 学習用データと正解値とを取得する入力部と、
前記学習用データに基づいて1または複数の重要領域を推定する重要領域推定部と、
前記学習用データと前記1または複数の重要領域それぞれを示す情報とに基づいて前記1または複数の重要領域に対してトリミングを行って前記1または複数の重要領域を出力するトリミング処理部と、
前記1または複数の重要領域と第1のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量とプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度に基づいて推論値を出力する推論部と、
前記正解値に基づいて前記推論値を評価して評価結果を得る評価部と、
前記評価結果に基づいて、前記第1のニューラルネットワークの重みパラメータと前記プロトタイプとの更新を行う更新部と、
を備える、学習装置。 - 前記重要領域推定部は、前記学習用データと第2のニューラルネットワークとに基づいて前記1または複数の重要領域を推定し、
前記更新部は、前記評価結果に基づいて前記第2のニューラルネットワークの重みパラメータの更新を行う、
請求項1に記載の学習装置。 - 前記推論部は、前記類似度と第3のニューラルネットワークとに基づいて前記推論値を出力し、
前記更新部は、前記評価結果に基づいて前記第3のニューラルネットワークの重みパラメータの更新を行う、
請求項1または2に記載の学習装置。 - 前記1または複数の重要領域それぞれのサイズは、可変である、
請求項1~3のいずれか一項に記載の学習装置。 - 前記1または複数の重要領域それぞれのサイズに対して、所定の制約が課されている、
請求項1~4のいずれか一項に記載の学習装置。 - 前記特徴量のサイズは、可変である、
請求項1~5のいずれか一項に記載の学習装置。 - 前記特徴量のチャネル数は、前記プロトタイプのチャネル数と同一であり、
前記類似度算出部は、前記特徴量のチャネルデータの1または複数個所それぞれと前記プロトタイプのチャネルデータとの類似度の中で最も高い類似度を、当該チャネルに対応する類似度として前記推論部に出力する、
請求項1~6のいずれか一項に記載の学習装置。 - 前記類似度算出部は、複数の学習用データの一部または全部それぞれにおいて、前記推論部に出力した類似度と、前記類似度に対応する特徴量とを、チャネルごとに保存データとして保存し、
前記更新部は、前記プロトタイプと最も類似度が高い特徴量を類似特徴量としてチャネルごとに前記保存データから検出し、前記類似特徴量が抽出された学習用データの前記類似特徴量に対応する領域データをチャネルごとに前記プロトタイプに対応付ける、
請求項1~7のいずれか一項に記載の学習装置。 - 前記更新部は、前記類似特徴量によって前記プロトタイプをチャネルごとに上書きする、
請求項8に記載の学習装置。 - 前記更新部は、学習の途中において、前記類似特徴量によって前記プロトタイプを上書きした場合、前記プロトタイプの更新を停止する、
請求項9に記載の学習装置。 - 学習用データと正解値とを取得することと、
前記学習用データに基づいて1または複数の重要領域を推定することと、
前記学習用データと前記1または複数の重要領域それぞれを示す情報とに基づいて前記1または複数の重要領域に対してトリミングを行って前記1または複数の重要領域を出力することと、
前記1または複数の重要領域と第1のニューラルネットワークとに基づいて特徴量を抽出することと、
前記特徴量とプロトタイプとの類似度を算出して出力することと、
前記類似度に基づいて推論値を出力することと、
前記正解値に基づいて前記推論値を評価して評価結果を得ることと、
前記評価結果に基づいて、前記第1のニューラルネットワークの重みパラメータと前記プロトタイプとの更新を行うことと、
を含む、学習方法。 - コンピュータを、
学習用データと正解値とを取得する入力部と、
前記学習用データに基づいて1または複数の重要領域を推定する重要領域推定部と、
前記学習用データと前記1または複数の重要領域それぞれを示す情報とに基づいて前記1または複数の重要領域に対してトリミングを行って前記1または複数の重要領域を出力するトリミング処理部と、
前記1または複数の重要領域と第1のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量とプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度に基づいて推論値を出力する推論部と、
前記正解値に基づいて前記推論値を評価して評価結果を得る評価部と、
前記評価結果に基づいて、前記第1のニューラルネットワークの重みパラメータと前記プロトタイプとの更新を行う更新部と、
を備える学習装置として機能させるための学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004837A JP7210489B2 (ja) | 2020-01-16 | 2020-01-16 | 学習装置、学習方法および学習プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004837A JP7210489B2 (ja) | 2020-01-16 | 2020-01-16 | 学習装置、学習方法および学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111299A JP2021111299A (ja) | 2021-08-02 |
JP7210489B2 true JP7210489B2 (ja) | 2023-01-23 |
Family
ID=77060048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020004837A Active JP7210489B2 (ja) | 2020-01-16 | 2020-01-16 | 学習装置、学習方法および学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7210489B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023148914A1 (ja) * | 2022-02-04 | 2023-08-10 | 三菱電機株式会社 | 機械学習装置、機械学習システム、機械学習方法、及び機械学習プログラム |
JP7313501B1 (ja) | 2022-03-03 | 2023-07-24 | ソフトバンク株式会社 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6524475B2 (ja) * | 2015-01-16 | 2019-06-05 | 株式会社レイトロン | 画像認識に使用するウィンドウの配置や組合せを、構成情報に従って変化させることができる画像認識装置 |
-
2020
- 2020-01-16 JP JP2020004837A patent/JP7210489B2/ja active Active
Non-Patent Citations (3)
Title |
---|
Chaofan Chen et al.,"This Looks Like That: Deep Learning for Interpretable Image Recognition",arXiv,2019年,https://arxiv.org/pdf/1806.10574.pdf |
Ramprasaath R.Selvaraju et al.,"Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization,arXiv,2019年,https://arxiv.org/pdf/1610.02391v4.pdf |
久保田智規 外2名、「ディープラーニングによる物体検出において正しく検出できない原因を解析する手法の提案」、電子情報通信学会技術研究報告〔人工知能と知識処理〕、Vol.119、No.317、AI2019-30、2019年11月、1~6頁 |
Also Published As
Publication number | Publication date |
---|---|
JP2021111299A (ja) | 2021-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6522060B2 (ja) | オブジェクト認識装置、分類ツリー学習装置及びその動作方法 | |
Luo et al. | End-to-end optimization of scene layout | |
US11763603B2 (en) | Physical activity quantification and monitoring | |
US20190156204A1 (en) | Training a neural network model | |
CN112614213B (zh) | 人脸表情确定方法、表情参数确定模型、介质及设备 | |
Jörg et al. | Data-driven finger motion synthesis for gesturing characters | |
JP7210489B2 (ja) | 学習装置、学習方法および学習プログラム | |
JP2020087103A (ja) | 学習方法、コンピュータプログラム、分類器、及び生成器 | |
JP6948851B2 (ja) | 情報処理装置、情報処理方法 | |
JP5573443B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20230061175A1 (en) | Real-Time Simulation of Elastic Body | |
JP2023527136A (ja) | 診断結果を提供するための方法及び装置(method and apparatus for providing diagnosis result) | |
KR20230121018A (ko) | 신경망 모델을 제공하는 방법 및 이를 수행하는 장치 | |
JP2019045929A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN109964229A (zh) | 用于人脸对准的形状预测 | |
Ankireddy | Assistive diagnostic tool for brain tumor detection using computer vision | |
US20230186092A1 (en) | Learning device, learning method, computer program product, and learning system | |
JP5162512B2 (ja) | 多次元時系列データ分析装置及び多次元時系列データ分析プログラム | |
Sorour et al. | A Deep Learning System for Detecting Cardiomegaly Disease Based on CXR Image | |
JPWO2019207714A1 (ja) | 動作推定システム、動作推定方法および動作推定プログラム | |
CN110348406B (zh) | 参数推断方法及装置 | |
JP7107340B2 (ja) | 学習装置、学習方法およびプログラム | |
CN115023742A (zh) | 具有详细褶皱的面部网格变形 | |
JP7092228B1 (ja) | 学習装置、学習方法およびプログラム | |
US20240212228A1 (en) | Image generating and retrieving apparatus, image generating and retrieving system, and image generating and retrieving method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210824 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20211118 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220510 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220711 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20221129 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20230110 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20230110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230111 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7210489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |