JP2022053637A - 画像判定装置、画像判定方法及び画像判定プログラム - Google Patents
画像判定装置、画像判定方法及び画像判定プログラム Download PDFInfo
- Publication number
- JP2022053637A JP2022053637A JP2020160374A JP2020160374A JP2022053637A JP 2022053637 A JP2022053637 A JP 2022053637A JP 2020160374 A JP2020160374 A JP 2020160374A JP 2020160374 A JP2020160374 A JP 2020160374A JP 2022053637 A JP2022053637 A JP 2022053637A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- evaluation value
- value
- image
- activity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
GradCAMでは、属性判定モデルの対象の層の特徴量と、検出対象の属性の傾き情報との重み付け和が正規化され、ヒートマップとして表示される。
重み付け和の最大値を用いて正規化が行われると、1つの画像データにおける判断根拠となった箇所は明確になるが、他の画像データにおける判断根拠となった箇所と反応の強さを比較することはできなくなる。
本開示は、複数の画像データ間で判断根拠となった箇所の反応の強さを比較可能にすることを目的とする。
ニューラルネットワークを用いて構成されたモデルによって処理対象の画像データである対象データを分析した場合において前記対象データの各画素の判断根拠となった度合から、前記対象データにおける各画素の評価値を計算する評価値計算部と、
前記評価値計算部によって計算された前記各画素の評価値を、前記各画素の評価値の最大値とは別に事前に定められた設定値で除して、前記各画素の活性度を計算する活性度計算部と
を備える。
前記活性度計算部は、前記複数の対象データそれぞれについて、その対象データにおける各画素の評価値を、前記複数の対象データに共通して事前に定められた前記設定値で除して、前記各画素の活性度を計算する。
前記活性度計算部によって計算された前記各画素の活性度を示すヒートマップを表示する表示部
を備える。
画像判定装置の評価値計算部が、ニューラルネットワークを用いて構成されたモデルによって処理対象の画像データである対象データを分析した場合において前記対象データの各画素の判断根拠となった度合から、前記対象データにおける各画素の評価値を計算し、
前記画像判定装置の活性度計算部が、前記各画素の評価値を、前記各画素の評価値の最大値とは別に事前に定められた設定値で除して、前記各画素の活性度を計算する。
ニューラルネットワークを用いて構成されたモデルによって処理対象の画像データである対象データを分析した場合において前記対象データの各画素の判断根拠となった度合から、前記対象データにおける各画素の評価値を計算する評価値計算処理と、
前記評価値計算処理によって計算された前記各画素の評価値を、前記各画素の評価値の最大値とは別に事前に定められた設定値で除して、前記各画素の活性度を計算する活性度計算処理と
を行う画像判定装置としてコンピュータを機能させる。
***構成の説明***
図1を参照して、実施の形態1に係る画像判定装置10の構成を説明する。
画像判定装置10は、コンピュータである。
画像判定装置10は、プロセッサ11と、メモリ12と、ストレージ13と、通信インタフェース14とのハードウェアを備える。プロセッサ11は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。
ストレージ13には、画像判定装置10の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ11によりメモリ12に読み込まれ、プロセッサ11によって実行される。これにより、画像判定装置10の各機能構成要素の機能が実現される。
図2及び図3を参照して、実施の形態1に係る画像判定装置10の動作を説明する。
実施の形態1に係る画像判定装置10の動作手順は、実施の形態1に係る画像判定方法に相当する。また、実施の形態1に係る画像判定装置10の動作を実現するプログラムは、実施の形態1に係る画像判定プログラムに相当する。
(ステップS11:モデル読込処理)
モデル処理部22は、物体の属性判定モデル(学習済みモデルの一例、以下単にモデルと表することもある)をストレージ13から読み込む。属性判定モデルは、画像データに含まれる対象物体の属性を判定する、ニューラルネットワークを用いて構成されたモデルである。対象物体は、予め指定された種類の物体である。属性判定モデルは、事前に生成され、ストレージ13に記憶されているものとする。
この際、モデル処理部22は、属性判定モデルによる検出処理を実行するために必要なネットワークの設計情報と、パラメータと、ラベル情報といった情報も合わせてストレージ13から読み込む。
活性度計算部24は、後述する正規化で使用される設定値をストレージ13から読み込む。設定値は、事前に定められストレージ13に記憶されているものとする。
画像取得部21は、処理対象の画像データである対象データを取得する。
具体的には、画像取得部21は、ユーザによって指定された画像データを対象データとして取得する。
モデル処理部22は、ステップS11で読み込まれた属性判定モデルを用いて、ステップS13で取得された対象データに含まれる予め指定された種類の物体である対象物体を検出する。
評価値計算部23は、属性判定モデルによって対象データを分析した場合において対象データの各画素の判断根拠となった度合から対象データにおける各画素の評価値を計算する。実施の形態1では、評価値計算部23は、属性判定モデルにおける対象の層の出力結果から、対象データにおける各画素の評価値を計算する。評価値は、各画素が対象物体の検出の判断根拠となった度合を示す。ここでは、評価値が大きいほど判断根拠となった度合が高いとする。
具体的には、評価値計算部23は、GradCAMといった属性判定モデルによる判断根拠となった箇所を可視化する手法と同様に、評価値を計算する。
(ステップS151:出力結果取得処理)
評価値計算部23は、属性判定モデルにおける対象の層の出力結果を取得する。例えば、評価値計算部23は、属性判定モデルを構成する複数の層のうち識別層に近い特徴抽出層を対象の層として、対象の層の出力結果を取得する。
ここでは、対象の層の出力結果は、N×(W行×H列)の行列形式になっているとする。つまり、対象の層の出力結果は、(W行×H列)の行列1×・・・×(W行×H列)の行列Nの形式になっている。Nは特徴マップ数であり、Wは特徴マップの幅であり、Hは特徴マップの高さである。なお、出力結果の形式は、属性判定モデルによって異なる。
評価値計算部23は、属性判定処理における逆伝播処理時の勾配データを取得する。逆伝播処理時の勾配データについては、GradCAMで用いられるものであるため、説明は省略する。
ここでは、勾配データは、N×Gの行列形式になっているとする。Nは特徴マップ数であり、Gは勾配値である。つまり、勾配データは、G1×・・・×GNの形式になっている。なお、勾配データの形式は、属性判定モデルによって異なる。
評価値計算部23は、ステップS151で取得された出力結果と、ステップS152で取得された勾配データの重み付け和を計算する。ここでは、重み付け和は、(W行×H列)の行列であり、重み付け和=(W行×H列)の行列1×G1+・・・?(W行×H列)の行列N×GNである。
評価値計算部23は、対象データの各画素について、重み付け和における対応する要素の値を、その画素の評価値とする。
活性度計算部24は、ステップS15で計算された各画素の評価値を、ステップS12で読み込まれた設定値で正規化して、各画素の活性度を計算する。ここで、設定値は、各画素の評価値の最大値とは別に事前に定められた値である。したがって、活性度計算部24は、各画素の評価値を、各画素の評価値の最大値とは別に事前に定められた設定値で除して、各画素の活性度を計算することになる。
具体的には、活性度計算部24は、各画素の評価値のうち最小値を特定する。活性度計算部24は、各画素の評価値から最小値を減算する。そして、活性度計算部24は、最小値を減算した後の各画素の評価値を、設定値で除して、各画素の活性度を計算する。ここで、各画素の評価値から最小値を減算するのは、評価値の最小値を0にして、活性度を0から設定値までの値に正規化するためである。
活性度計算部24は、ステップS16で計算された各画素の活性度のうち、値が1.0以上の活性度は、値を全て1.0に設定する。
表示部25は、ステップS17で得られた各画素の活性度を示すヒートマップを生成して、表示する。
具体的には、表示部25は、通信インタフェース14を介して、各画素の活性度を示すヒートマップを表示装置に送信して、表示装置にヒートマップを表示する。
複数の画像データについてのヒートマップが生成された場合には、ステップS18で表示部25は、各画像データについてのヒートマップを並べて表示してもよい。
以上のように、実施の形態1に係る画像判定装置10は、各画素の評価値の最大値とは別に事前に定められた設定値を用いて、各画素の評価値を正規化して活性度を計算する。そのため、他の画像データにおける判断根拠となった箇所と反応の強さを比較することが可能になる。
図4及び図5では、画像データ1及び画像データ2それぞれから対象物体であるスーツケースが検出された際の判断根拠となった度合を示すヒートマップが生成されている。図4及び図5のヒートマップでは、ハッチングの密度が高い部分(濃い部分)ほど、活性度が高いものとする。
図4では、判断根拠となった度合である活性度が計算される際、対象とする画像データの各画素の評価値のうち最大値を用いて正規化が行われている。つまり、画像データ1についての活性度は、画像データ1の各画素の評価値のうち最大値を用いて正規化が行われて計算されており、画像データ2についての活性度は、画像データ2の各画素の評価値のうち最大値を用いて正規化が行われて計算されている。一方、図5では、各画素の評価値の最大値とは別に事前に設定された設定値を用いて正規化が行われている。つまり、画像データ1及び画像データ2についての活性度は、設定値を用いて正規化が行われて計算されている。
図4及び図5では、画像データ1の各画素の評価値のうち最大値が100、画像データ2の各画素の評価値のうち最大値が10、設定値が110であるとする。
これは、属性判定モデルは、画像データ1及び画像データ2のどちらからも対象物体であるスーツケースを検出しているが、画像データ1に示すスーツケースに比べ、画像データ2に示すスーツケースについては、判断根拠となった箇所の評価値が高くなっていないことを表している。つまり、画像データ2に示すスーツケースについては、検出はされているものの、画像データ1に示すスーツケースに比べ検出の根拠があまり強くないことを表している。したがって、画像データ2に示すスーツケースについては、属性判定モデルの学習が不足している可能性があるということが分かる。つまり、画像データ1のヒートマップと画像データ2のヒートマップとを比較することにより、画像データ1に示すスーツケースに比べ、画像データ2に示すスーツケースについての学習データを用いて、属性判定モデルを改善することが有効であるということが分かる。
しかし、実施の形態1に係る画像判定装置10を用いることにより、画像データ2に示すスーツケースについての学習データを用いることが有効であると特定することが可能である。
また属性判定モデルとして、画像データ2の特徴を持つ学習データの学習が不足していることが確認できる。そのため本実施の形態の出力結果により、画像データ2の特徴を持つ学習データを追加し属性判定モデルを追加学習するように、構成することができる。
<変形例1>
実施の形態1では、各機能構成要素がソフトウェアで実現された。しかし、変形例1として、各機能構成要素はハードウェアで実現されてもよい。この変形例1について、実施の形態1と異なる点を説明する。
各機能構成要素がハードウェアで実現される場合には、画像判定装置10は、プロセッサ11とメモリ12とストレージ13とに代えて、電子回路15を備える。電子回路15は、各機能構成要素と、メモリ12と、ストレージ13との機能とを実現する専用の回路である。
各機能構成要素を1つの電子回路15で実現してもよいし、各機能構成要素を複数の電子回路15に分散させて実現してもよい。
変形例2として、一部の各機能構成要素がハードウェアで実現され、他の各機能構成要素がソフトウェアで実現されてもよい。
実施の形態2では、適切な設定値を特定する方法を説明する。実施の形態2では、実施の形態1と同一の点については説明を省略する。
図7を参照して、実施の形態2に係る画像判定装置10の構成を説明する。
画像判定装置10は、機能構成要素として、設定値特定部26を備える点が図1に示す画像判定装置10と異なる。設定値特定部26の機能は、他の機能構成要素と同様に、ソフトウェア又はハードウェアによって実現される。
図8を参照して、実施の形態2に係る画像判定装置10の動作を説明する。
実施の形態2に係る画像判定装置10の動作手順は、実施の形態2に係る画像判定方法に相当する。また、実施の形態2に係る画像判定装置10の動作を実現するプログラムは、実施の形態2に係る画像判定プログラムに相当する。
画像取得部21は、対象の学習データを取得する。
具体的には、複数の学習データのうち未だ選択されていない学習データをストレージ13から読み出す。複数の学習データは、ストレージ13に記憶されているものとする。
設定値特定部26は、ステップS24で計算された各画素の評価値のうち最大値を仮設定値としてメモリ12に書き込む。
設定値特定部26は、ステップS25でメモリ12に書き込まれた各学習データについての仮設定値のうち最大値を、設定値として特定する。
以上のように、実施の形態2に係る画像判定装置10は、属性判定モデルを生成する際に学習用に用いられた複数の学習データを用いて設定値を特定する。属性判定モデルは、学習データに対して正しく特徴を取得できるようにパラメータ調整がされている。したがって、学習データを用いて設定値を特定することにより、画像データにおける判断根拠となった箇所の反応の強さの比較に適した設定値を特定することが可能である。
<変形例3>
実施の形態2では、属性判定モデルが1種類の物体を対象物体として検出する場合を想定して説明した。しかし、属性判定モデルが2種類以上の物体を対象物体として検出する場合もある。
変形例3に係る画像判定装置10の動作は、ステップS24からステップS25の処理が、対象物体の各種類を対象として実行される点が図8に示す実施の形態2に係る画像判定装置10の動作と異なる。つまり、属性判定モデルが2種類以上の物体を対象物体として検出する場合には、対象物体の種類毎に評価値を計算して、評価値の最大値を特定する。
実施の形態2では、複数の学習データにおける各画素の評価値のうちの最大値を設定値として特定した。しかし、一部の画素の評価値だけが突出して大きい値となってしまう可能性がある。この場合に、最大値を設定値としてしまうと、ほとんどの値が0に近い値となり、反応の強さの比較を適切に行うことができない可能性がある。
そこで、設定値特定部26は、複数の学習データにおける各画素の評価値から外れ値を除いて残った残り値のうちの最大値を設定値として特定してもよい。外れ値は、検定統計量を用いる方法と、スミルノフ・グラブス検定を用いる方法といった既存の方法によって検出することができる。
Claims (8)
- ニューラルネットワークを用いて構成されたモデルによって処理対象の画像データである対象データを分析した場合において前記対象データの各画素の判断根拠となった度合から、前記対象データにおける各画素の評価値を計算する評価値計算部と、
前記評価値計算部によって計算された前記各画素の評価値を、前記各画素の評価値の最大値とは別に事前に定められた設定値で除して、前記各画素の活性度を計算する活性度計算部と
を備える画像判定装置。 - 前記評価値計算部は、複数の対象データそれぞれについて、その対象データにおける各画素の評価値を計算し、
前記活性度計算部は、前記複数の対象データそれぞれについて、その対象データにおける各画素の評価値を、前記複数の対象データに共通して事前に定められた前記設定値で除して、前記各画素の活性度を計算する
請求項1に記載の画像判定装置。 - 前記画像判定装置は、さらに、
前記活性度計算部によって計算された前記各画素の活性度を示すヒートマップを表示する表示部
を備える請求項1又は2に記載の画像判定装置。 - 前記設定値は、前記モデルを生成する際に学習用に用いられた複数の画像データである複数の学習データにおける各画素の評価値から決定された値である
請求項1から3までのいずれか1項に記載の画像判定装置。 - 前記設定値は、前記複数の学習データにおける各画素の評価値のうちの最大値である
請求項4に記載の画像判定装置。 - 前記設定値は、前記複数の学習データにおける各画素の評価値から外れ値を除いて残った残り値のうちの最大値である
請求項4に記載の画像判定装置。 - 画像判定装置の評価値計算部が、ニューラルネットワークを用いて構成されたモデルによって処理対象の画像データである対象データを分析した場合において前記対象データの各画素の判断根拠となった度合から、前記対象データにおける各画素の評価値を計算し、
前記画像判定装置の活性度計算部が、前記各画素の評価値を、前記各画素の評価値の最大値とは別に事前に定められた設定値で除して、前記各画素の活性度を計算する画像判定方法。 - ニューラルネットワークを用いて構成されたモデルによって処理対象の画像データである対象データを分析した場合において前記対象データの各画素の判断根拠となった度合から、前記対象データにおける各画素の評価値を計算する評価値計算処理と、
前記評価値計算処理によって計算された前記各画素の評価値を、前記各画素の評価値の最大値とは別に事前に定められた設定値で除して、前記各画素の活性度を計算する活性度計算処理と
を行う画像判定装置としてコンピュータを機能させる画像判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020160374A JP7177806B2 (ja) | 2020-09-25 | 2020-09-25 | 画像判定装置、画像判定方法及び画像判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020160374A JP7177806B2 (ja) | 2020-09-25 | 2020-09-25 | 画像判定装置、画像判定方法及び画像判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022053637A true JP2022053637A (ja) | 2022-04-06 |
JP7177806B2 JP7177806B2 (ja) | 2022-11-24 |
Family
ID=80996843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020160374A Active JP7177806B2 (ja) | 2020-09-25 | 2020-09-25 | 画像判定装置、画像判定方法及び画像判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7177806B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080082468A1 (en) * | 2004-11-11 | 2008-04-03 | The Trustees Of Columbia University In The City Of New York | Methods and systems for identifying and localizing objects based on features of the objects that are mapped to a vector |
JP2020008896A (ja) * | 2018-07-02 | 2020-01-16 | カシオ計算機株式会社 | 画像識別装置、画像識別方法及びプログラム |
-
2020
- 2020-09-25 JP JP2020160374A patent/JP7177806B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080082468A1 (en) * | 2004-11-11 | 2008-04-03 | The Trustees Of Columbia University In The City Of New York | Methods and systems for identifying and localizing objects based on features of the objects that are mapped to a vector |
JP2020008896A (ja) * | 2018-07-02 | 2020-01-16 | カシオ計算機株式会社 | 画像識別装置、画像識別方法及びプログラム |
Non-Patent Citations (3)
Title |
---|
ALEXANDER KOLESNIKOV, 外1名: ""Improving Weakly-Supervised Object Localization By Micro-Annotation"", COMPUTER VISION AND PATTERN RECOGNITION, JPN7022004042, 18 May 2016 (2016-05-18), US, pages 1 - 13, ISSN: 0004862042 * |
寺元陶冶, 外1名: ""VGGモデルの視覚野的解釈における解析の検討"", 電子情報通信学会技術研究報告, vol. 第118巻, 第470号, JPN6022035207, 25 February 2019 (2019-02-25), JP, pages 239 - 244, ISSN: 0004862041 * |
柿下容弓, 外1名: ""Deep Neural Networkのモデル逆解析による識別根拠可視化技術"", 情報処理学会論文誌数理モデル化と応用(TOM), vol. 第12巻, 第2号, JPN6022035206, 17 July 2019 (2019-07-17), JP, pages 20 - 33, ISSN: 0004862040 * |
Also Published As
Publication number | Publication date |
---|---|
JP7177806B2 (ja) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11113836B2 (en) | Object detection method, device, apparatus and computer-readable storage medium | |
US9171264B2 (en) | Parallel processing machine learning decision tree training | |
US8442327B2 (en) | Application of classifiers to sub-sampled integral images for detecting faces in images | |
JP6935522B2 (ja) | 物体検出装置、物体検出方法及び物体検出プログラム | |
CN111161346B (zh) | 将商品在货架中进行分层的方法、装置和电子设备 | |
CN108875504A (zh) | 基于神经网络的图像检测方法和图像检测装置 | |
BR112021008735A2 (pt) | sistema automático de análise de conteúdo de alta faixa dinâmica em tempo real | |
JP2021071757A (ja) | 物体検出装置、物体検出方法、物体検出プログラム及び学習装置 | |
US20090324131A1 (en) | System and method for video based scene analysis | |
JP7177806B2 (ja) | 画像判定装置、画像判定方法及び画像判定プログラム | |
CN107992277B (zh) | 图像数据输出方法和系统、计算机设备、存储介质 | |
JP7139369B2 (ja) | 検出結果分析装置、検出結果分析方法及び検出結果分析プログラム | |
CN114222121B (zh) | 视频编码方法、装置、电子设备和计算机可读存储介质 | |
JP7340487B2 (ja) | プログラム作成装置、対象物検知システム、アンカー設定方法及びアンカー設定プログラム | |
CN114612710A (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
Gillespie | The poweRlaw package: Examples | |
CN111985423A (zh) | 活体检测方法、装置、设备及可读存储介质 | |
JP2022078377A (ja) | 学習方法、判定方法、プログラム、学習システム、学習用データセットの生成方法、及び、学習用データセット | |
JP7266075B2 (ja) | データ選別支援装置、データ選別支援方法及びデータ選別支援プログラム | |
CN112907459B (zh) | 图像处理方法及装置 | |
KR102251898B1 (ko) | 태양 영상 노이즈 처리 장치 및 방법 | |
JP7532318B2 (ja) | 学習装置、方法およびプログラム | |
US11875547B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2018181308A (ja) | 画像処理装置及び画像処理方法 | |
US20210217194A1 (en) | Method and apparatus with object information estimation and virtual object generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221111 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7177806 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |