JP7351186B2 - 解析装置、解析プログラム及び解析方法 - Google Patents

解析装置、解析プログラム及び解析方法 Download PDF

Info

Publication number
JP7351186B2
JP7351186B2 JP2019200863A JP2019200863A JP7351186B2 JP 7351186 B2 JP7351186 B2 JP 7351186B2 JP 2019200863 A JP2019200863 A JP 2019200863A JP 2019200863 A JP2019200863 A JP 2019200863A JP 7351186 B2 JP7351186 B2 JP 7351186B2
Authority
JP
Japan
Prior art keywords
image
inference
unit
refined
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019200863A
Other languages
English (en)
Other versions
JP2021076924A (ja
Inventor
智規 久保田
康之 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019200863A priority Critical patent/JP7351186B2/ja
Priority to US17/031,966 priority patent/US11663487B2/en
Publication of JP2021076924A publication Critical patent/JP2021076924A/ja
Application granted granted Critical
Publication of JP7351186B2 publication Critical patent/JP7351186B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Description

本発明は、解析装置、解析プログラム及び解析方法に関する。
近年、CNN(Convolutional Neural Network)を用いた画像認識処理において、誤ったラベルが推論された場合の誤推論の原因を解析する解析技術が提案されている。一例として、スコア最大化法(Activation Maximization)が挙げられる。また、画像認識処理において推論時に注目される画像箇所を解析する解析技術が提案されている。一例として、BP(Back Propagation)法、GBP(Guided Back Propagation)法等が挙げられる。
スコア最大化法は、推論の正解ラベルが最大スコアとなるように入力画像を変更した際の変更部分を、誤推論の原因となる画像箇所として特定する方法である。また、BP法やGBP法は、推論したラベルから逆伝播し、入力画像までたどることで、推論の際に反応した特徴部分を可視化する方法である。
特開2018-097807号公報 特開2018-045350号公報 Ramprasaath R. Selvariju, et al.: Grad-cam: Visual explanations from deep networks via gradient-based localization. The IEEE International Conference on Computer Vision (ICCV), pp. 618-626, 2017.
しかしながら、上述した解析技術の場合、誤推論の原因となる画像箇所を十分な精度で特定することができないという問題がある。
一つの側面では、誤推論の原因となる画像箇所を特定する際の精度を向上させることを目的としている。
一態様によれば、解析装置は、
画像認識処理の際に誤ったラベルが推論される誤推論画像と、リファイン画像との差分を用いて、前記誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成するリファイン画像生成部と、
前記誤推論画像の複数の画素のうち前記スコアを最大化させたリファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記スコアを最大化させたリファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップであって、各注目度合いの出現頻度に基づいて調整した第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成するマップ生成部と、
前記誤推論画像において、ピクセルの集合ごとに前記第3のマップの画素値を算出することで、誤推論の原因となるピクセルの集合を特定する特定部と、を有し、
前記リファイン画像生成部は、
前記特定部により前記ピクセルの集合が特定された場合、前記特定されたピクセルの集合の領域について前記差分を補正し、補正後の差分を用いて、前記誤推論画像から、前記推論の正解ラベルのスコアを最大化させたリファイン画像を再生成する
誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
解析装置の機能構成の一例を示す図である。 解析装置のハードウェア構成の一例を示す図である。 誤推論原因抽出部の機能構成の一例を示す第1の図である。 リファイン画像生成部の処理の具体例を示す図である。 マップ生成部の処理の具体例を示す図である。 重要特徴マップ生成部の機能構成の詳細を示す図である。 選択的逆誤差伝播部の処理の具体例を示す図である。 非注目画素オフセット調整部の処理内容を示す図である。 非注目画素オフセット調整部の処理の具体例を示す図である。 スーパーピクセル分割部の処理の具体例を示す図である。 重要スーパーピクセル決定部の処理の具体例を示す図である。 領域抽出部及び合成部の処理の具体例を示す図である。 誤推論原因抽出処理の流れを示す第1のフローチャートである。 誤推論原因抽出処理の流れを示す第2のフローチャートである。 重要特徴マップ生成処理の流れを示すフローチャートである。 誤推論原因抽出処理の具体例を示す第1の図である。 誤推論原因抽出部の機能構成の一例を示す第2の図である。 誤推論原因抽出処理の具体例を示す第2の図である。 誤推論原因抽出部の機能構成の一例を示す第3の図である。 誤推論原因抽出処理の具体例を示す第3の図である。 誤推論原因抽出部の機能構成の一例を示す第4の図である。 詳細原因解析部の機能構成の一例を示す第1の図である。 詳細原因解析部の処理の具体例を示す第1の図である。 詳細原因解析処理の流れを示す第1のフローチャートである。 誤推論原因抽出部の機能構成の一例を示す第5の図である。 詳細原因解析部の機能構成の一例を示す第2の図である。 詳細原因解析部の処理の具体例を示す第2の図である。 詳細原因解析処理の流れを示す第2のフローチャートである。
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
[第1の実施形態]
<解析装置の機能構成>
はじめに、第1の実施形態に係る解析装置の機能構成について説明する。図1は、解析装置の機能構成の一例を示す図である。解析装置100には、解析プログラムがインストールされており、当該プログラムが実行されることで、解析装置100は、推論部110、誤推論画像抽出部120、誤推論原因抽出部140として機能する。
推論部110は、学習済みのCNNを用いて画像認識処理を行う。具体的には、推論部110は、入力画像10が入力されることで、入力画像10に含まれるオブジェクトの種類(本実施形態では、車両の種類)を示すラベルを推論し、推論したラベルを出力する。
誤推論画像抽出部120は、入力画像10に含まれるオブジェクトの種類を示すラベル(既知)と、推論部110により推論されたラベルとが一致するか否かを判定する。また、誤推論画像抽出部120は、一致しないと判定した際の(誤ったラベルが推論された際の)入力画像を、"誤推論画像"として抽出し、誤推論画像格納部130に格納する。
誤推論原因抽出部140は、誤推論画像について、誤推論の原因となる画像箇所を特定し、誤推論原因情報を出力する。具体的には、誤推論原因抽出部140は、リファイン画像生成部141と、マップ生成部142と、特定部143とを有する。
リファイン画像生成部141は、誤推論画像格納部130に格納された誤推論画像を読み出す。また、リファイン画像生成部141は、読み出した誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
マップ生成部142は、誤推論の原因を解析する既知の解析技術等を用いて、ラベルの推論に影響する領域を識別するマップを生成する。
特定部143は、誤推論画像のうち、生成されたマップに含まれる、ラベルの推論に影響する領域について、生成されたリファイン画像で置き換える。また、特定部143は、当該領域をリファイン画像で置き換えた誤推論画像を入力としてラベルを推論し、推論したラベルのスコアから、置き換えの効果を判定する。
また、特定部143は、ラベルの推論に影響する領域の大きさを変えながら入力することでラベルを推論し、推論したラベルのスコアから、誤推論の原因となる画像箇所を特定する。更に、特定部143は、特定した誤推論の原因となる画像箇所を、誤推論原因情報として出力する。
このように、ラベルの推論に影響する領域をリファイン画像で置き換える際、置き換えの効果を参照することで、誤推論の原因となる画像箇所を精度よく特定することができる。
<解析装置のハードウェア構成>
次に、解析装置100のハードウェア構成について説明する。図2は、解析装置のハードウェア構成の一例を示す図である。図2に示すように、解析装置100は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。CPU201、ROM202、RAM203は、いわゆるコンピュータを形成する。
また、解析装置100は、補助記憶装置204、表示装置205、操作装置206、I/F(Interface)装置207、ドライブ装置208を有する。なお、解析装置100の各ハードウェアは、バス209を介して相互に接続されている。
CPU201は、補助記憶装置204にインストールされている各種プログラム(例えば、解析プログラム等)を実行する演算デバイスである。なお、図2には示していないが、演算デバイスとしてアクセラレータ(例えば、GPU(Graphics Processing Unit)など)を組み合わせてもよい。
ROM202は、不揮発性メモリである。ROM202は、補助記憶装置204にインストールされている各種プログラムをCPU201が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM202はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
RAM203は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM203は、補助記憶装置204にインストールされている各種プログラムがCPU201によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
補助記憶装置204は、各種プログラムや、各種プログラムが実行される際に用いられる情報を格納する補助記憶デバイスである。例えば、誤推論画像格納部130は、補助記憶装置204において実現される。
表示装置205は、誤推論原因情報等を含む各種表示画面を表示する表示デバイスである。操作装置206は、解析装置100のユーザが解析装置100に対して各種指示を入力するための入力デバイスである。
I/F装置207は、例えば、不図示のネットワークと接続するための通信デバイスである。
ドライブ装置208は記録媒体210をセットするためのデバイスである。ここでいう記録媒体210には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体210には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
なお、補助記憶装置204にインストールされる各種プログラムは、例えば、配布された記録媒体210がドライブ装置208にセットされ、該記録媒体210に記録された各種プログラムがドライブ装置208により読み出されることでインストールされる。あるいは、補助記憶装置204にインストールされる各種プログラムは、不図示のネットワークよりダウンロードされることでインストールされてもよい。
<誤推論原因抽出部の機能構成>
次に、第1の実施形態に係る解析装置100において実現される機能のうち、誤推論原因抽出部140の機能構成の詳細について説明する。図3は、誤推論原因抽出部の機能構成の一例を示す第1の図である。以下、誤推論原因抽出部140の各部(リファイン画像生成部141、マップ生成部142、特定部143)の詳細について説明する。
(1)リファイン画像生成部の詳細
はじめに、リファイン画像生成部141の詳細について説明する。図3に示すように、リファイン画像生成部141は、画像リファイナ部301、画像誤差演算部302、推論部303、スコア誤差演算部304を有する。
画像リファイナ部301は、例えば、画像の生成モデルとしてCNNを用いて、誤推論画像からリファイン画像を生成する。
なお、画像リファイナ部301では、生成したリファイン画像を用いて推論した際に、正解ラベルのスコアが最大となるように、誤推論画像を変更する。また、画像リファイナ部301では、例えば、画像の生成モデルを用いてリファイン画像を生成する場合には、誤推論画像からの変更量(リファイン画像と誤推論画像との差分)が小さくなるように、リファイン画像を生成する。これにより、画像リファイナ部301によれば、視覚的に変更前の画像(誤推論画像)に近い画像(リファイン画像)を得ることができる。
具体的には、画像リファイナ部301では、画像の生成モデルとしてCNNを用いる場合、
・生成したリファイン画像を用いて推論した際のスコアと、正解ラベルのスコアを最大にしたスコアとの誤差であるスコア誤差と、
・生成したリファイン画像と誤推論画像との差分である画像差分値(例えば、画像差分(L1差分)やSSIM(Structural Similarity)やそれらの組み合わせ)と、
を最小化するようにCNNの学習を行う。
画像誤差演算部302は、誤推論画像と、学習中に画像リファイナ部301より出力されるリファイン画像との差分を算出し、画像差分値を、画像リファイナ部301に入力する。画像誤差演算部302では、例えば、画素ごとの差分(L1差分)やSSIM(Structural Similarity)演算を行うことにより、画像差分値を算出し、画像リファイナ部301に入力する。
推論部303は、画像リファイナ部301により生成されたリファイン画像または後述する重要スーパーピクセル決定部322で生成された合成画像を入力として推論し、推論したラベルのスコアを出力する、学習済みのCNNを有する。合成画像とは、誤推論画像のうち、マップ生成部142で生成されたマップ(重要特徴指標マップ)に含まれる、正解ラベルの推論に影響する領域について、リファイン画像で置き換えた誤推論画像に他ならない。
なお、推論部303により出力されたスコアは、スコア誤差演算部304または重要スーパーピクセル評価部323に通知される。
スコア誤差演算部304は、推論部303により通知されたスコアと、正解ラベルのスコアを最大にしたスコアとの誤差を算出し、画像リファイナ部301にスコア誤差を通知する。スコア誤差演算部304により通知されたスコア誤差は、画像リファイナ部301においてCNNの学習に用いられる。
なお、画像リファイナ部301が有するCNNの学習中に画像リファイナ部301から出力されるリファイン画像は、リファイン画像格納部305に格納される。画像リファイナ部301が有するCNNの学習は、
・予め定められた学習回数分(例えば、最大学習回数=N回分)、あるいは、
・正解ラベルのスコアが所定の閾値を超えるまで、あるいは、
・正解ラベルのスコアが所定の閾値を超え、かつ、画像差分値が所定の閾値より小さくなるまで、
行われ、推論部303より出力される正解ラベルのスコアが最大化した際のリファイン画像を、以下では、"スコア最大化リファイン画像"と称す。
(2)マップ生成部の詳細
次に、マップ生成部142の詳細について説明する。図3に示すように、マップ生成部142は、重要特徴マップ生成部311、劣化尺度マップ生成部312、重畳部313を有する。
重要特徴マップ生成部311は、スコア最大化リファイン画像を入力として推論した際の推論部構造情報を、推論部303より取得する。また、重要特徴マップ生成部311は、BP(Back Propagation)法、GBP(Guided Back Propagation)法または選択的BP法を用いることで、推論部構造情報に基づいて"グレイスケール化重要特徴マップ"を生成する。グレイスケール化重要特徴マップは第2のマップの一例であり、スコア最大化リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップを、グレイスケール化したものである。
なお、BP法は、推論したラベルが正解する入力データ(ここでは、スコア最大化リファイン画像)の推論を行うことで得た分類確率から各ラベルの誤差を計算し、入力層まで逆伝播して得られる勾配の大小を画像化することで、特徴部分を可視化する方法である。また、GBP法は、勾配情報の正値のみを特徴部分として画像化することで、特徴部分を可視化する方法である。
更に、選択的BP法は、正解ラベルの誤差のみを最大にしたうえで、BP法またはGBP法を用いて処理を行う方法である。選択的BP法の場合、可視化される特徴部分は、正解ラベルのスコアのみに影響を与える特徴部分となる。
劣化尺度マップ生成部312は、誤推論画像とスコア最大化リファイン画像とに基づいて、第1のマップの一例である"劣化尺度マップ"を生成する。劣化尺度マップは、スコア最大化リファイン画像を生成する際に変更がなされた各画素の変更度合いを示している。
重畳部313は、重要特徴マップ生成部311において生成されたグレイスケール化重要特徴マップと、劣化尺度マップ生成部312において生成された劣化尺度マップとに基づいて、第3のマップの一例である"重要特徴指標マップ"を生成する。重要特徴指標マップは、正解ラベルを推論するための各画素の重要度を示している。
(3)特定部の詳細
次に、特定部143の詳細について説明する。図3に示すように、特定部143は、スーパーピクセル分割部321、重要スーパーピクセル決定部322、重要スーパーピクセル評価部323を有する。
スーパーピクセル分割部321は、誤推論画像を、誤推論画像に含まれるオブジェクト(本実施形態では車両)の部品ごとの領域(ピクセルの集合)である"スーパーピクセル"に分割し、スーパーピクセル分割情報を出力する。なお、誤推論画像をスーパーピクセルに分割するにあたっては、既存の分割機能を利用するか、あるいは、車両の部品ごとに分割するように学習したCNN等を利用する。
重要スーパーピクセル決定部322は、スーパーピクセル分割部321により出力されたスーパーピクセル分割情報に基づいて、重畳部313により生成された重要特徴指標マップの各画素の値を、スーパーピクセルごとに加算する。
また、重要スーパーピクセル決定部322は、各スーパーピクセルのうち、加算した各画素の加算値が所定の条件を満たす(重要特徴指標閾値以上)のスーパーピクセルを抽出する。また、重要スーパーピクセル決定部322は、抽出したスーパーピクセルの中から選択したスーパーピクセルを組み合わせたスーパーピクセル群を、変更可能領域(スコア最大化リファイン画像によって置き換えられる領域)と規定する。また、重要スーパーピクセル決定部322は、組み合わせたスーパーピクセル群以外のスーパーピクセル群を変更不可領域(スコア最大化リファイン画像によって置き換えられない領域)と規定する。
更に、重要スーパーピクセル決定部322は、誤推論画像から、変更不可領域に対応する画像部分を抽出し、リファイン画像から、変更可能領域に対応する画像部分を抽出し、両者を合成することで、合成画像を生成する。画像リファイナ部301からは、学習回数に応じた数のリファイン画像であって、画像リファイナ部301で出力条件を満たしたリファイン画像が出力される。このため、重要スーパーピクセル決定部322では、当該数のリファイン画像それぞれについて、合成画像を生成する。
なお、重要スーパーピクセル決定部322では、変更可能領域及び変更不可領域を規定する際に用いる重要特徴指標閾値を徐々に下げることで、抽出するスーパーピクセルの数を増やす(変更可能領域を広げ、変更不可領域を狭めていく)。また、重要スーパーピクセル決定部322では、抽出したスーパーピクセルの中から選択するスーパーピクセルの組み合わせを変えながら、変更可能領域及び変更不可領域を更新する。
重要スーパーピクセル評価部323は、重要スーパーピクセル決定部322において生成された合成画像が推論部303に入力されるごとに推論される正解ラベルのスコアを取得する。上述したように、重要スーパーピクセル決定部322では、画像リファイナ部301により出力されたリファイン画像の数、重要特徴指標閾値を下げる回数、スーパーピクセルの組み合わせの数、に応じた数の合成画像を生成する。このため、重要スーパーピクセル評価部323では、当該数に応じた正解ラベルのスコアを取得する。また、重要スーパーピクセル評価部323は、取得したスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
このとき、重要スーパーピクセル評価部323では、面積がなるべく小さくなるように、変更可能領域を特定する。例えば、重要スーパーピクセル評価部323では、推論部303より取得したスコアを評価する際、重要特徴指標閾値を下げる前のスーパーピクセルあるいはスーパーピクセルの組み合わせのうち、面積が小さいものから優先して評価する。また、重要スーパーピクセル評価部323では、重要特徴指標閾値が下がることで、正解ラベルが推論されるようになった時点での変更可能領域(正解ラベルを推論可能な限界の重要特徴指標閾値により抽出され、面積が最小の変更可能領域)を特定する。
<誤推論原因抽出部の各部の処理の具体例>
次に、誤推論原因抽出部140の各部の処理の具体例について説明する。
(1)リファイン画像生成部の処理の具体例
はじめに、リファイン画像生成部141の処理の具体例について説明する。図4は、リファイン画像生成部の処理の具体例を示す図である。図4の左側の例は、正解ラベル="車種A"の車両が含まれる誤推論画像410を入力として推論した結果、ラベル="車種B"と誤推論した様子を示している。
また、図4の左側の例は、誤推論画像410を入力として推論した際のスコアが、
・車種Aのスコア=0.0142、
・車種Bのスコア=0.4549、
・車種Cのスコア=0.0018、
であったことを示している。
一方、図4の右側の例は、リファイン画像生成部141が、誤推論画像410からリファイン画像を生成する処理を行い、スコア最大化リファイン画像420を生成した様子を示している。図4の右側の例では、リファイン画像生成部141が、誤推論画像410に対して、ヘッドライト421の色や、道路標示422の色を変更することで、スコア最大化リファイン画像420を生成したことを示している。
また、図4の右側の例は、スコア最大化リファイン画像420を入力として推論した場合、正解ラベル="車種A"と一致するラベルを推論できたことを示している。更に、図4の右側の例は、スコア最大化リファイン画像420を入力として推論した際のスコアが、
・車種Aのスコア=0.9927、
・車種Bのスコア=0.0042、
・車種Cのスコア=0.0022、
であったことを示している。
このように、リファイン画像生成部141によれば、誤推論画像410を変更することで、正解ラベルと一致するラベルを推論でき、かつ、正解ラベルのスコアが最大となるスコア最大化リファイン画像420を生成することができる。
なお、図4の右側の例で示すように、リファイン画像生成部141により生成されるスコア最大化リファイン画像420の場合、誤推論画像410に対して、車両と無関係な路面標示まで変更される可能性がある。正解ラベルのスコアを最大化する学習での誤差逆伝播は、正解ラベルのスコアに影響するCNNの経路(ユニット)に影響を及ぼすが、影響を及ぼされた経路(ユニット)が必ずしも誤推論の原因と関係しているとは限らないためである。
つまり、既知のスコア最大化法のように、変更部分に基づいて誤推論の原因となる画像箇所を特定しようとした場合、十分な精度で特定することができないという問題がある(変更部分について、更なる絞り込みが必要である)。本実施形態に係る誤推論原因抽出部140ではマップ生成部142、特定部143が機能することで、更なる絞り込みが行われる。
(2)マップ生成部の処理の具体例
(2-1)マップ生成部全体の処理の具体例
次に、マップ生成部142の処理の具体例について説明する。はじめに、マップ生成部142全体の処理の具体例について説明する。図5は、マップ生成部の処理の具体例を示す図である。
図5に示すように、マップ生成部142において重要特徴マップ生成部311は、推論部303がスコア最大化リファイン画像を入力として推論した際の推論部構造情報501を、推論部303から取得する。また、重要特徴マップ生成部311は、取得した推論部構造情報501に基づいて、例えば、選択的BP法を用いて重要特徴マップを生成し、生成した重要特徴マップについてオフセット調整を行う。なお、重要特徴マップ生成部311によるこれらの処理の詳細は、後述する。
また、重要特徴マップ生成部311は、オフセット調整した重要特徴マップをグレイスケール化し、グレイスケール化重要特徴マップ502を生成する。
図5に示すグレイスケール化重要特徴マップ502は、0から255の画素値でグレイスケール化されている。このため、グレイスケール化重要特徴マップ502において、画素値が255に近い画素は、推論時に注目される画素(注目画素)であり、画素値が0に近い画素は、推論時に注目されない画素(非注目画素)である。
一方、劣化尺度マップ生成部312は、リファイン画像格納部305よりスコア最大化リファイン画像512を読み出し、誤推論画像511との間でSSIM(Structural Similarity)演算を行う。これにより、劣化尺度マップ生成部312は、劣化尺度マップ513を生成する。劣化尺度マップ513は0から1の値をとり、画素値が1に近いほど、画像の差分が小さいことを表し、画素値が0に近いほど、画像の差分が大きいことを表す。
また、重畳部313は、重要特徴マップ生成部311により生成されたグレイスケール化重要特徴マップ502と、劣化尺度マップ生成部312により生成された劣化尺度マップ513とを用いて、重要特徴指標マップ520を生成する。
具体的には、重畳部313は、下式に基づいて、重要特徴指標マップ520を生成する。
(式1)
重要特徴指標マップ=グレイスケール化重要特徴マップ×(1-劣化尺度マップ)
上式において、(1-劣化尺度マップ)の項は、0から1の値をとり、1に近いほど画像の差分が大きく、0に近いほど画像の差分が小さい。したがって、重要特徴指標マップ520は、スコア最大化リファイン画像の複数の画素のうち推論時に注目される画素の注目度合いを示すグレイスケール化重要特徴マップに、画像の差分の大小による強弱をつけた画像となる。
具体的には、重要特徴指標マップ520は、
・劣化尺度マップ513において画像の差分が小さい部分について、グレイスケール化重要特徴マップの画素値を小さくし、
・劣化尺度マップ513において画像の差分が大きい部分について、グレイスケール化重要特徴マップの画素値を大きくする、
ことで生成される。
なお、より識別しやすく可視化するために、重要特徴指標マップを反転させてもよい。図5に示す重要特徴指標マップは、下式に基づいて反転させたものを表示している。
(式2)
(反転した)重要特徴指標マップ=255-[グレイスケール化重要特徴マップ×(1-劣化尺度マップ)]
ここで、重畳部313が、上式に基づいて、グレイスケール化重要特徴マップ502と劣化尺度マップ513とを重畳することによる利点について説明する。
重要特徴マップ生成部311において生成されるグレイスケール化重要特徴マップ502は、スコア最大化リファイン画像を入力として推論し、正解ラベルのスコアが最大となった際に、推論部303が算出した注目部分に他ならない。
一方、劣化尺度マップ生成部312において生成される劣化尺度マップ513は、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分を表しており、誤推論の原因となる領域を表している。ただし、劣化尺度マップ生成部312において生成される劣化尺度マップ513は、正解ラベルのスコアを最大化するために必要な最小限の領域ではない。
重畳部313では、正解ラベルのスコアが最大化するように誤推論画像を変更した際の変更部分と、推論部303が算出した注目部分とを重畳することで、正解ラベルのスコアを最大化するために必要な領域を絞り込む。これにより、誤推論の原因となる領域を絞り込むことができる。
(2-2)重要特徴マップ生成部の処理の具体例
次に、マップ生成部142の重要特徴マップ生成部311の更なる詳細について、図7~図9を参照しながら、図6を用いて説明する。図6は、重要特徴マップ生成部の機能構成の詳細を示す図である。
図6に示すように、重要特徴マップ生成部311は、選択的逆誤差伝播部611、非注目画素オフセット調整部612、グレイスケール化部613を有する。
選択的逆誤差伝播部611は生成部の一例であり、推論部303から推論部構造情報501を取得し、選択的BP法を用いて重要特徴マップ601を生成する。図7は、選択的逆誤差伝播部の処理の具体例を示す図である。図7に示すように、選択的逆誤差伝播部611では、推論部303において推論された正解ラベルについて、推論の誤差がゼロでないという制約のもとで選択的逆誤差伝播を行う。これにより、選択的逆誤差伝播部611では、重要特徴マップ601を生成する。なお、重要特徴マップ601の生成に際しては、選択的逆誤差伝播部611の出力をそのまま用いてもよいし、あるいは、絶対値をとったものを用いてもよい。
非注目画素オフセット調整部612は調整部の一例であり、生成された重要特徴マップ601において、非注目画素の画素値がゼロになるように、オフセット調整を行う。ここで、選択的逆誤差伝播部611により生成される重要特徴マップ601は、非注目画素の画素値がゼロとして算出される場合と、非ゼロとして算出される場合とがありうる(推論部303に用いられるCNNの種類によって変わる)。
そこで、非注目画素オフセット調整部612では、重要特徴マップ601に含まれる非注目画素の画素値がゼロになるように、オフセット調整を行う。ここで、非注目画素オフセット調整部612では、重要特徴マップ601に含まれる各画素値の出現頻度が最大となる画素値の画素を、非注目画素としてオフセット調整を行う。
図8は、非注目画素オフセット調整部の処理内容を示す図である。図8(a)に示すように、非注目画素オフセット調整部612では、選択的逆誤差伝播部611より重要特徴マップ601を取得すると、各画素値の出現頻度を示すヒストグラムを生成する。続いて、非注目画素オフセット調整部612では、最小値が"0"、最大値が"255"になるようにスケーリング処理を行う(図8(b))。なお、選択的逆誤差伝播部611の信号出力を維持した可視化や適用を行う場合には、スケーリング処理を行わない方法を用いてもよい。以下の説明では、特に断わりがない場合には、スケーリングを行うものとする。
続いて、非注目画素オフセット調整部612では、選択的逆誤差伝播部611の出力の絶対値が用いる場合にあっては、出現頻度が最大となる画素値を探索し(図8(c))、出現頻度が最大となる画素値がゼロになるように、オフセット調整を行う(図8(d))。
続いて、非注目画素オフセット調整部612では、画素値の絶対値を算出する(図8(e))。これにより、非注目画素オフセット調整部612では、オフセット重要特徴マップ602(図6参照)を生成する。
図9は、非注目画素オフセット調整部の処理の具体例を示す図である。このうち、図9(a)は、選択的逆誤差伝播部611により生成される重要特徴マップにおいて、非注目画素の画素値がゼロとして算出されたケースを示している。一方、図9(b)は、選択的逆誤差伝播部611により生成される重要特徴マップにおいて、非注目画素の画素値が非ゼロとして算出されたケースを示している。非注目画素をオフセットで調整するのは、例えば、上記のように注目度合いで情報をフィルタリングしたり、信号の強さを調整する場合に、注目度合いに応じた信号の強さに調整した情報を作用させることで、意図した情報に加工することができるからである。既知の可視化に用いる場合には、注目されていない箇所が暗黙的に何らかの画素値であることを読み取ることは可能であるが、例えば、コンピュータで処理する場合には、暗黙的な扱いはなされないため、上記のようなオフセット調整が必要になる。
なお、上述したように、いずれのケースになるかは、推論部303に用いられるCNNの種類によって変わる。したがって、それぞれのオフセット量は、例えば、均一な画素値からなる画像(図9(a)、(b)に示す画像901のように、特徴のない画像(つまり、非注目画素からなる画像))に基づいて算出することができる。具体的には、画像901を、異なる種類のCNNが用いられた推論部303にそれぞれ入力した際の推論部構造情報501を取得し、選択的BP法を用いて重要特徴マップを生成することで、オフセット量を算出することができる。
図9(a)は、オフセット量が"0"のケースであり、この場合、非注目画素オフセット調整部612では、オフセット調整を行わない(符号902に示す重要特徴マップ=オフセット重要特徴マップ)。一方、図9(b)は、オフセット量が"128"のケースであり、この場合、非注目画素オフセット調整部612では、オフセット調整を行う(符号912に示す重要特徴マップ→符号913に示すオフセット重要特徴マップ)。
図6の説明に戻る。グレイスケール化部613では、非注目画素オフセット調整部612によりオフセット調整された、オフセット重要特徴マップ602について、グレイスケール化処理を行い、グレイスケール化重要特徴マップ502を生成する。具体的には、オフセット重要特徴マップ602がカラーであった場合に、グレイスケール化処理を行い、グレイスケール化重要特徴マップ502を生成する。なお、RGBの各チャネルを分離し、個々のチャネルをグレイスケールとして扱い、チャネルごとにグレイスケール化重要特徴マップ502を生成してもよい。ただし、オフセット重要特徴マップ602がカラーでない場合、グレイスケール化部613では、グレイスケール化処理を行わない。
(3)特定部の処理の具体例
次に、特定部143の各部(スーパーピクセル分割部321、重要スーパーピクセル決定部322、重要スーパーピクセル評価部323)の処理の具体例について説明する。
(3-1)スーパーピクセル分割部の処理の具体例
はじめに、特定部143に含まれるスーパーピクセル分割部321の処理の具体例について説明する。図10は、スーパーピクセル分割部の処理の具体例を示す図である。図10に示すように、スーパーピクセル分割部321は、例えば、SLIC(Simple Linear Iterative Clustering)処理を行う分割部1010を有する。分割部1010は、誤推論画像511を、誤推論画像511に含まれる車両の部品ごとの部分画像であるスーパーピクセルに分割する。また、スーパーピクセル分割部321は、分割部1010によりスーパーピクセルに分割されることで生成されたスーパーピクセル分割情報1001を出力する。
(3-2)重要スーパーピクセル決定部の処理の具体例
次に、特定部143に含まれる重要スーパーピクセル決定部322の処理の具体例について説明する。図11は、重要スーパーピクセル決定部の処理の具体例を示す図である。
図11に示すように、重要スーパーピクセル決定部322は、領域抽出部1110、合成部1111を有する。
重要スーパーピクセル決定部322では、重畳部313より出力された重要特徴指標マップ520と、スーパーピクセル分割部321より出力されたスーパーピクセル分割情報1001とを重ね合わせる。これにより、重要スーパーピクセル決定部322では、重要スーパーピクセル画像1101を生成する。なお、図11では、重要特徴指標マップ520として、(反転した)重要特徴指標マップを表示している。
また、重要スーパーピクセル決定部322では、生成した重要スーパーピクセル画像1101内の各スーパーピクセルについて、重要特徴指標マップ520の各画素の値を加算する。
また、重要スーパーピクセル決定部322では、スーパーピクセルごとの加算値が、重要特徴指標閾値以上であるかを判定し、加算値が重要特徴指標閾値以上であると判定したスーパーピクセルを抽出する。なお、図11において、重要スーパーピクセル画像1102は、スーパーピクセルごとの加算値の一例を明示したものである。
また、重要スーパーピクセル決定部322では、抽出したスーパーピクセルの中から、選択したスーパーピクセルを組み合わせて変更可能領域と規定し、組み合わせたスーパーピクセル以外のスーパーピクセルを変更不可領域と規定する。更に、重要スーパーピクセル決定部322は、規定した変更可能領域及び変更不可領域を領域抽出部1110に通知する。
領域抽出部1110は、誤推論画像511から、変更不可領域に対応する画像部分を抽出し、リファイン画像1121から、変更可能領域に対応する画像部分を抽出する。
合成部1111は、リファイン画像1121から抽出した変更可能領域に対応する画像部分と、誤推論画像511から抽出した変更不可領域に対応する画像部分とを合成し、合成画像を生成する。
図12は、領域抽出部及び合成部の処理の具体例を示す図である。図12において、上段は、領域抽出部1110が、リファイン画像1121から、変更可能領域に対応する画像部分(画像1201の白色部分)を抽出した様子を示している。
一方、図12において、下段は、領域抽出部1110が、誤推論画像511から、変更不可領域に対応する画像部分(画像1201'の白色部分)を抽出した様子を示している。なお、画像1201'は、画像1201の白色部分と黒色部分とを反転した画像である(説明の便宜上、図12の下段では、白色部分を、変更不可領域に対応する画像部分としている)。
合成部1111は、図12に示すように、領域抽出部1110より出力された、リファイン画像1121の変更可能領域に対応する画像部分と、誤推論画像511の変更不可領域に対応する画像部分とを合成し、合成画像1220を生成する。
このように、特定部143によれば、合成画像1220を生成する際、重要特徴指標マップ520を用いることで、リファイン画像1121で置き換える領域を、スーパーピクセル単位で特定することができる。
<誤推論原因抽出処理の流れ>
次に、誤推論原因抽出部140による誤推論原因抽出処理の流れについて説明する。図13及び図14は、誤推論原因抽出処理の流れを示す第1及び第2のフローチャートである。
ステップS1301において、誤推論原因抽出部140の各部は、初期化処理を行う。具体的には、画像リファイナ部301は、CNNの学習回数をゼロに設定するとともに、最大学習回数をユーザが指示した値に設定する。また、判断部325は、重要特徴指標閾値及びその下限値を、ユーザが指示した値に設定する。
ステップS1302において、画像リファイナ部301は、誤推論画像を変更し、リファイン画像を生成する。
ステップS1303において、推論部303は、リファイン画像を入力として推論し、正解ラベルのスコアを算出する。
ステップS1304において、画像リファイナ部301は、画像差分値とスコア誤差とを用いてCNNの学習を行う。
ステップS1305において、画像リファイナ部301は、学習回数が最大学習回数を超えたか否かを判定する。ステップS1305において、学習回数が最大学習回数を超えていないと判定した場合には(ステップS1305においてNoの場合には)、ステップS1302に戻り、リファイン画像の生成を継続する。
一方、ステップS1305において、学習回数が最大学習回数を超えたと判定した場合には(ステップS1305においてYesの場合は)、ステップS1306に進む。なお、この時点で、リファイン画像格納部305には、学習ごとに生成されたリファイン画像(スコア最大化リファイン画像を含む)が格納されている。
ステップS1306において、重要特徴マップ生成部311は、推論部303よりスコア最大化リファイン画像を入力として推論された際の推論部構造情報を取得し、取得した推論部構造情報に基づいてグレイスケール化重要特徴マップを生成する(詳細は後述)。
ステップS1307において、劣化尺度マップ生成部312は、誤推論画像とスコア最大化リファイン画像とに基づいて、劣化尺度マップを生成する。
ステップ1308において、重畳部313は、グレイスケール化重要特徴マップと劣化尺度マップとに基づいて、重要特徴指標マップを生成する。
ステップS1309において、スーパーピクセル分割部321は、誤推論画像をスーパーピクセルに分割し、スーパーピクセル分割情報を生成する。
ステップS1310において、重要スーパーピクセル決定部322は、重要特徴指標マップの各画素の値を、スーパーピクセル単位で加算する。
ステップS1311において、重要スーパーピクセル決定部322は、加算値が重要特徴指標閾値以上のスーパーピクセルを抽出し、抽出したスーパーピクセルの中から選択したスーパーピクセルを組み合わせて変更可能領域を規定する。また、重要スーパーピクセル決定部322は、組み合わせたスーパーピクセル以外のスーパーピクセルを変更不可領域と規定する。
続いて、図14のステップS1401において、重要スーパーピクセル決定部322は、リファイン画像格納部305からリファイン画像を読み出す。
ステップS1402において、重要スーパーピクセル決定部322は、リファイン画像から、変更可能領域に対応する画像部分を抽出する。
ステップS1403において、重要スーパーピクセル決定部322は、誤推論画像から、変更不可領域に対応する画像部分を抽出する。
ステップS1404において、重要スーパーピクセル決定部322は、リファイン画像から抽出した変更可能領域に対応する画像部分と、誤推論画像から抽出した変更不可領域に対応する画像部分とを合成し、合成画像を生成する。
ステップS1405において、推論部303は、合成画像を入力として推論し、正解ラベルのスコアを算出する。また、重要スーパーピクセル評価部323は、推論部303により算出された正解ラベルのスコアを取得する。
ステップS1407において、画像リファイナ部301は、リファイン画像格納部305に格納された全てのリファイン画像を読み出したか否かを判定する。ステップS1407において、読み出していないリファイン画像があると判定した場合には(ステップS1407においてNoの場合には)、ステップS1401に戻る。
一方、ステップS1407において、全てのリファイン画像を読み出したと判定した場合には(ステップS1407においてYesの場合には)、ステップS1408に進む。
ステップS1408において、重要スーパーピクセル決定部322は、重要特徴指標閾値が下限値に到達したか否かを判定する。ステップS1408において、下限値に到達していないと判定した場合には(ステップS1408においてNoの場合には)、ステップS1409に進む。
ステップS1409において、重要スーパーピクセル決定部322は、重要特徴指標閾値を下げた後、図13のステップS1311に戻る。
一方、ステップS1408において、下限値に到達したと判定した場合には(ステップS1408においてYesの場合には)、ステップS1410に進む。
ステップS1410において、重要スーパーピクセル評価部323は、取得した正解ラベルのスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
<重要特徴マップ生成処理の流れ>
次に、図13のステップS1306の重要特徴マップ生成処理の詳細について説明する。図15は、重要特徴マップ生成処理の流れを示すフローチャートである。
ステップS1501において、選択的逆誤差伝播部611は、推論部303から推論部構造情報を取得する。
ステップS1502において、選択的逆誤差伝播部611は、推論部構造情報について選択的BP法を用いて、重要特徴マップを生成する。
ステップS1503において、非注目画素オフセット調整部612は、重要特徴マップに基づいてヒストグラムを生成し、出現頻度が最大となる画素値を特定する。
ステップS1504において、非注目画素オフセット調整部612は、出現頻度が最大となる画素値に基づいて、オフセット量を算出する。
ステップS1505において、非注目画素オフセット調整部612は、算出したオフセット量に基づいて、重要特徴マップのオフセット調整を行い、オフセット重要特徴マップを生成する。
ステップS1506において、グレイスケール化部613は、オフセット重要特徴マップについて、グレイスケール化処理を行い、グレイスケール化重要特徴マップを生成する。
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。図16は、誤推論原因抽出処理の具体例を示す第1の図である。
図16に示すように、はじめに、リファイン画像生成部141により、誤推論画像からスコア最大化リファイン画像が生成されると、マップ生成部142では、重要特徴指標マップを生成する。
続いて、誤推論画像に基づいて、スーパーピクセル分割部321によりスーパーピクセル分割情報が生成されると、重要スーパーピクセル決定部322では、重要スーパーピクセル画像を生成する。
続いて、重要スーパーピクセル決定部322では、重要特徴指標マップのもと、重要スーパーピクセル画像において変更可能領域及び変更不可領域を規定する。このとき、重要スーパーピクセル決定部322では、重要特徴指標閾値を変えるとともに、重要特徴指標閾値を超えるスーパーピクセルの中から選択する組み合わせを変えることで、複数の変更可能領域と変更不可領域との組を生成する。また、重要スーパーピクセル決定部322では、生成した複数の変更可能領域と変更不可領域との組を用いて、合成画像を生成する。
続いて、重要スーパーピクセル評価部323では、生成された合成画像を入力として推論部303が推論した正解ラベルのスコアを取得する。これにより、重要スーパーピクセル評価部323では、取得した正解ラベルのスコアに基づいて、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
なお、合成画像の生成処理は、図16に示すように、リファイン画像生成部141により生成された複数のリファイン画像それぞれに対して行ってもよいし、
・最後の回のリファイン画像に対して行ってもよい、あるいは、
・それぞれのリファイン画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像(スコア最大化リファイン画像)に対して行ってもよい。
以上の説明から明らかなように、第1の実施形態に係る解析装置100は、画像認識処理の際に誤ったラベルが推論される誤推論画像から、推論の正解ラベルのスコアを最大化させたスコア最大化リファイン画像を生成する。
また、第1の実施形態に係る解析装置100は、スコア最大化リファイン画像を生成した際の推論部構造情報に基づいて、スコア最大化リファイン画像の複数の画素のうち推論時の非注目画素の画素値がゼロとなるグレイスケール化重要特徴マップを生成する。
また、第1の実施形態に係る解析装置100は、スコア最大化リファイン画像と誤推論画像との差分に基づいて、スコア最大化リファイン画像を生成する際に変更された画素の変更度合いを示す劣化尺度マップを生成する。
また、第1の実施形態に係る解析装置100は、グレイスケール化重要特徴マップと、劣化尺度マップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す重要特徴指標マップを生成する。
また、第1の実施形態に係る解析装置100は、誤推論画像を分割することでスーパーピクセルを生成し、重要特徴指標マップの各画素値を、スーパーピクセル単位で加算する。また、第1の実施形態に係る解析装置100は、加算値が重要特徴指標閾値以上のスーパーピクセルを抽出し、抽出したスーパーピクセルの中から選択したスーパーピクセルの組み合わせに基づいて、変更可能領域と変更不可領域とを規定する。
また、第1の実施形態に係る解析装置100は、規定した変更可能領域をリファイン画像で置き換えた誤推論画像を、推論部に入力することで正解ラベルを推論する。更に第1の実施形態に係る解析装置100は、重要特徴指標閾値及び選択するスーパーピクセルの組み合わせを変えながら推論し、推論した正解ラベルの各スコアから、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定する。
このように、第1の実施形態では、正解ラベルの推論に影響するスーパーピクセルをリファイン画像で置き換え、置き換えの効果を参照しながら、スーパーピクセルを特定することで、誤推論の原因となる画像箇所を特定する。これにより、第1の実施形態によれば、誤推論の原因となる画像箇所を特定する際の精度を向上させることができる。
[第2の実施形態]
上記第1の実施形態では、スコア最大化リファイン画像を生成した際の推論部構造情報に基づいて、重要特徴指標マップを生成した。これに対して、第2の実施形態では、スコア最大化リファイン画像を生成するまでの学習中に取得した、リファイン画像それぞれに基づいて重要特徴指標マップを生成し、生成した重要特徴指標マップに基づいて、平均重要特徴指標マップを生成する。そして、重要スーパーピクセル決定部322では、平均重要特徴指標マップに基づいて、重要特徴指標閾値以上のスーパーピクセルを抽出する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
<誤推論原因抽出部の機能構成>
はじめに、第2の実施形態に係る解析装置の、誤推論原因抽出部の機能構成について説明する。図17は、誤推論原因抽出部の機能構成の一例を示す第2の図である。図3に示した誤推論原因抽出部の機能構成との相違点は、マップ生成部1710である。以下、マップ生成部1710の詳細について説明する。
図17に示すように、マップ生成部1710は、重要特徴マップ生成部311、劣化尺度マップ生成部312、重畳部313に加えて、平均化部1711を有する。
マップ生成部1710は、画像リファイナ部301の学習中に生成されたリファイン画像と、当該リファイン画像を入力として推論部303が推論した際の推論部構造情報とを、逐次、取得する。また、リファイン画像及び推論部構造情報を取得するごとに、マップ生成部1710では、重要特徴マップ生成部311、劣化尺度マップ生成部312、重畳部313が動作し、重要特徴指標マップを生成する。
平均化部1711は、重要特徴マップ生成部311及び劣化尺度マップ生成部312がリファイン画像及び推論部構造情報を取得するごとに重畳部313が生成した複数回分の重要特徴指標マップの平均値を算出し、平均重要特徴指標マップを生成する。
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。図18は、誤推論原因抽出処理の具体例を示す第2の図である。
図18に示すように、リファイン画像生成部141において、画像リファイナ部301が、1回目の学習結果に基づき、誤推論画像からリファイン画像を生成すると、マップ生成部1710では、重要特徴指標マップを生成する。
また、リファイン画像生成部141において、画像リファイナ部301が、2回目の学習結果に基づき、誤推論画像からリファイン画像を生成すると、マップ生成部1710では、重要特徴指標マップを生成する。以降、同様の処理を繰り返し、リファイン画像生成部141がスコア最大化リファイン画像を生成すると、マップ生成部1710では、重要特徴指標マップを生成する。
続いて、平均化部1711では、1回目のリファイン画像が生成されてからスコア最大化リファイン画像が生成されるまでの間に生成された、複数回分の重要特徴指標マップを取得する。また、平均化部1711では、取得した複数回分の重要特徴指標マップの平均値を算出し、平均重要特徴指標マップを生成する。
続いて、スーパーピクセル分割部321では、誤推論画像に基づいて、スーパーピクセル分割情報を生成し、重要スーパーピクセル決定部322では、重要スーパーピクセル画像を生成する。
続いて、重要スーパーピクセル決定部322では、平均重要特徴指標マップのもと、重要スーパーピクセル画像において変更可能領域及び変更不可領域を規定する。このとき、重要スーパーピクセル決定部322では、重要特徴指標閾値を変えるとともに、重要特徴指標閾値を超えるスーパーピクセルの中から選択する組み合わせを変えることで、複数の変更可能領域と変更不可領域との組を生成する。また、重要スーパーピクセル決定部322では、生成した複数の変更可能領域と変更不可領域との組を用いて、合成画像を生成する。
続いて、重要スーパーピクセル評価部323では、生成された合成画像を入力として推論部303が推論した正解ラベルのスコアを取得する。これにより、重要スーパーピクセル評価部323では、取得した正解ラベルに基づいて誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力する。
なお、上記誤推論原因抽出処理において、リファイン画像を取得して重要特徴指標マップを生成する間隔は任意であり、1回の学習ごとに重要特徴指標マップを生成しても、複数回の学習ごとに重要特徴指標マップを生成してもよい。あるいは、リファイン画像を入力した際の推論部303の正解ラベルのスコアを評価し、所定の閾値よりも大きい場合に、当該リファイン画像を取得して重要特徴指標マップを生成してもよい。
また、合成画像の生成処理は、図18に示すように、リファイン画像生成部141により生成された複数のリファイン画像それぞれに対して行ってもよいし、
・最後の回のリファイン画像に対して行ってもよい、あるいは、
・それぞれのリファイン画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像(スコア最大化リファイン画像)に対して行ってもよい。
以上の説明から明らかなように、第2の実施形態に係る解析装置100は、スコア最大化リファイン画像を生成するまでの学習中に生成した、重要特徴指標マップに基づいて、平均重要特徴指標マップを生成する。また、第2の実施形態に係る解析装置100は、平均重要特徴指標マップに基づいて、重要特徴指標閾値以上のスーパーピクセルを抽出する。
これにより、第2の実施形態によれば、上記第1の実施形態による効果に加えて、更に、リファイン画像のゆらぎによる、重要特徴指標マップへの影響を低減させることが可能となる。
[第3の実施形態]
上記第1の実施形態では、スコア最大化リファイン画像が生成され、重要特徴指標マップが生成されると、特定部143では、変更可能領域及び変更不可領域を規定し、誤推論の原因となる画像箇所を特定する処理を開始するものとして説明した。
また、上記第2の実施形態では、スコア最大化リファイン画像が生成され、平均重要特徴指標マップが生成されると、特定部143では、変更可能領域及び変更不可領域を規定し、誤推論の原因となる画像箇所を特定する処理を開始するものとして説明した。
これに対して、第3の実施形態では、特定部143が変更可能領域及び変更不可領域を規定した後に、リファイン画像生成部が、規定された変更可能領域を加味して、再度、スコア最大化リファイン画像を生成しなおす。
このように、変更可能領域を加味してスコア最大化リファイン画像を再生成することで、第3の実施形態によれば、正解ラベルの推論に影響する特徴部分がより明確になった重要特徴指標マップ(あるいは平均重要特徴指標マップ)を生成することが可能となる。この結果、合成画像を入力としてラベルを推論した際のスコアを上げることが可能となる。
以下、第3の実施形態について、上記第1または第2の実施形態との相違点を中心に説明する。
<誤推論原因抽出部の機能構成>
はじめに、第3の実施形態に係る解析装置の、誤推論原因抽出部の機能構成について説明する。図19は、誤推論原因抽出部の機能構成の一例を示す第3の図である。図17に示した誤推論原因抽出部の機能構成との相違点は、リファイン画像生成部1910及び特定部1920である。以下、リファイン画像生成部1910及び特定部1920の詳細について説明する。
(1)リファイン画像生成部の詳細
はじめに、リファイン画像生成部1910の詳細について説明する。図19に示すように、リファイン画像生成部1910は、リファイン画像生成部141の画像誤差演算部302とは機能の異なる画像誤差演算部1911を有する。
画像誤差演算部1911は、画像誤差演算部302と同様、学習中に画像リファイナ部301に入力される誤推論画像と、学習中に画像リファイナ部301より出力されるリファイン画像との差分を算出し、画像差分値を、画像リファイナ部301に入力する。ただし、画像誤差演算部1911の場合、画像リファイナ部301に画像差分値を入力する際、補正部1921より通知された変更可能領域に対応する画像部分について、画像差分値を補正する。
具体的には、画像誤差演算部1911は、変更可能領域に対応する画像部分の画像差分値に1未満の係数をかけて補正する。これにより、画像リファイナ部301では、変更可能領域に対応する画像部分の画像差分値を、変更可能領域以外の領域に対応する画像部分の画像差分値よりも弱めて再学習したうえで、スコア最大化リファイン画像を再生成することができる。
(2)特定部の詳細
次に、特定部1920の詳細について説明する。図19に示すように、特定部1920は、スーパーピクセル分割部321、重要スーパーピクセル決定部322、重要スーパーピクセル評価部323に加えて、補正部1921を有する。
補正部1921は、重要スーパーピクセル決定部322において規定された変更可能領域を取得し、画像誤差演算部1911に通知する。これにより、リファイン画像生成部1910では、変更可能領域を加味して再学習したうえで、スコア最大化リファイン画像を再生成することができる。
<誤推論原因抽出処理の具体例>
次に、誤推論原因抽出処理の具体例について説明する。図20は、誤推論原因抽出処理の具体例を示す第3の図である。図18を用いて説明した、誤推論原因抽出処理の具体例との相違点は、重要スーパーピクセル画像に基づいて変更可能領域と変更不可領域との組が生成された際、補正部1921が、変更可能領域を画像誤差演算部1911に通知する点である。これにより、リファイン画像生成部1910では、変更可能領域を加味して再学習したうえで、スコア最大化リファイン画像を再生成し、マップ生成部1710では、平均重要特徴指標マップを再生成することができる。
なお、上記誤推論原因抽出処理において、リファイン画像を取得して重要特徴指標マップを生成する間隔は任意であり、1回の学習ごとに重要特徴指標マップを生成しても、複数回の学習ごとに重要特徴指標マップを生成してもよい。あるいは、リファイン画像を入力した際の推論部303の正解ラベルのスコアを評価し、所定の閾値よりも大きい場合に、当該リファイン画像を取得して重要特徴指標マップを生成してもよい。
また、合成画像の生成処理は、図20に示すように、リファイン画像生成部1910により生成された複数のリファイン画像それぞれに対して行ってもよいし、
・最後の回のリファイン画像に対して行ってもよい、あるいは、
・それぞれのリファイン画像を入力とした推論での正解ラベルのスコアが一番よいリファイン画像(スコア最大化リファイン画像)に対して行ってもよい。
以上の説明から明らかなように、第3の実施形態に係る解析装置100は、変更可能領域を加味して再学習することで、スコア最大化リファイン画像を再生成するとともに、重要特徴指標マップ(あるいは平均重要特徴指標マップ)を再生成する。
これにより、第3の実施形態によれば、正解ラベルの推論に影響する特徴部分がより明確になった重要特徴指標マップ(あるいは平均重要特徴指標マップ)を生成することが可能となり、合成画像を入力としてラベルを推論した際のスコアを上げることが可能となる。
[第4の実施形態]
上記第1乃至第3の実施形態では、誤推論の原因となるスーパーピクセルの組み合わせ(変更可能領域)を特定し、誤推論原因情報として出力するものとして説明した。しかしながら、誤推論原因情報の出力方法はこれに限定されず、例えば、変更可能領域内の重要部分を可視化して出力してもよい。以下、第4の実施形態について、上記第1乃至第3の実施形態との相違点を中心に説明する。
<誤推論原因抽出部の機能構成>
はじめに、第4の実施形態に係る解析装置100における、誤推論原因抽出部の機能構成について説明する。図21は、誤推論原因抽出部の機能構成の一例を示す第4の図である。図3に示した誤推論原因抽出部140の機能構成との相違点は、詳細原因解析部2110を有する点である。
詳細原因解析部2110は、誤推論画像とスコア最大化リファイン画像とを用いて、変更可能領域内の重要部分を可視化し、作用結果画像として出力する。
<詳細原因解析部の機能構成>
次に、詳細原因解析部2110の機能構成について説明する。図22は、詳細原因解析部の機能構成の一例を示す第1の図である。図22に示すように、詳細原因解析部2110は、画像差分演算部2201、SSIM演算部2202、切り出し部2203、作用部2204を有する。
画像差分演算部2201は、誤推論画像とスコア最大化リファイン画像との画素単位での差分を演算し、差分画像を出力する。
SSIM演算部2202は、誤推論画像とスコア最大化リファイン画像とを用いて、SSIM演算を行うことで、SSIM画像を出力する。
切り出し部2203は、差分画像から変更可能領域に対応する画像部分を切り出す。また、切り出し部2203は、SSIM画像から変更可能領域に対応する画像部分を切り出す。更に、切り出し部2203は、変更可能領域に対応する画像部分を切り出した、差分画像とSSIM画像とを乗算して、乗算画像を生成する。
作用部2204は、誤推論画像と乗算画像とに基づいて、作用結果画像を生成する。
<詳細原因解析部の処理の具体例>
次に、詳細原因解析部2110の処理の具体例について説明する。図23は、詳細原因解析部の処理の具体例を示す図である。
図23に示すように、はじめに、画像差分演算部2201において、誤推論画像(A)とスコア最大化リファイン画像(B)との差分(=(A)-(B))が演算され、差分画像が出力される。差分画像は、誤推論の原因となる画像箇所での画素修正情報である。
続いて、SSIM演算部2202において、誤推論画像(A)とスコア最大化リファイン画像(B)とに基づいてSSIM演算が行われる(y=SSIM((A),(B))。更に、SSIM演算部2202において、SSIM演算の結果が反転されることで(y'=255-(y×255))、SSIM画像が出力される。SSIM画像は、誤推論の原因となる画像箇所を高精度に指定した画像であり、画素値が大きいと差分が大きく、画素値が小さいと差分が小さいことを表す。なお、SSIM演算の結果を反転する処理は、例えば、y'=1-yを算出することにより行ってもよい。
続いて、切り出し部2203において、差分画像から変更可能領域に対応する画像部分が切り出され、切り出し画像(C)が出力される。同様に、切り出し部2203において、SSIM画像から変更可能領域に対応する画像部分が切り出され、切り出し画像(D)が出力される。
ここで、変更可能領域は、誤推論の原因となる画像部分の領域を特定したものであり、詳細原因解析部2110では、特定した領域の中で、更に、画素粒度での原因解析を行うことを目的としている。
このため、切り出し部2203では、切り出し画像(C)と切り出し画像(D)とを乗算し、乗算画像(G)を生成する。乗算画像(G)は、誤推論の原因となる画像箇所での画素修正情報を更に高精度に指定した、画素修正情報に他ならない。
また、切り出し部2203では、乗算画像(G)に対して強調処理を行い、強調乗算画像(H)を出力する。なお、切り出し部2203では、強調乗算画像(H)を下式に基づいて算出する。
(式3)
強調乗算画像(H)=255×(G)/(max(G)-min(G))
続いて作用部2204では、誤推論画像(A)から強調乗算画像(H)を減算することで重要部分を可視化し、作用結果画像を生成する。
なお、図23に示した強調処理の方法は一例にすぎず、可視化した際に重要部分がより識別しやすくなる方法であれば、他の方法により強調処理を行ってもよい。
<詳細原因解析処理の流れ>
次に、詳細原因解析部2110による詳細原因解析処理の流れについて説明する。図24は、詳細原因解析処理の流れを示す第1のフローチャートである。
ステップS2401において、画像差分演算部2201は、誤推論画像とスコア最大化リファイン画像との差分画像を算出する。
ステップS2402において、SSIM演算部2202は、誤推論画像とスコア最大化リファイン画像とに基づいて、SSIM画像を演算する。
ステップS2403において、切り出し部2203は、変更可能領域に対応する差分画像を切り出す。
ステップS2404において、切り出し部2203は、変更可能領域に対応するSSIM画像を切り出す。
ステップS2405において、切り出し部2203は、切り出した差分画像と切り出したSSIM画像とを乗算し、乗算画像を生成する。
ステップS2406において、切り出し部2203は、乗算画像に対して強調処理を行う。また、作用部2204は、強調処理された乗算画像を、誤推論画像から減算し、作用結果画像を出力する。
以上の説明から明らかなように、第4の実施形態に係る解析装置100は、誤推論画像とスコア最大化リファイン画像とに基づいて、差分画像とSSIM画像とを生成し、変更可能領域を切り出して乗算する。これにより、第4の実施形態に係る解析装置100によれば、変更可能領域内において、誤推論の原因となる画像箇所を画素単位で視認することが可能となる。
[第5の実施形態]
上記第4の実施形態では、誤推論画像とスコア最大化リファイン画像とに基づいて生成した差分画像とSSIM画像とを用いて、誤推論の原因となる画像箇所を画素単位で可視化する場合について説明した。
これに対して、第5の実施形態では、更に、グレイスケール化重要特徴マップを用いて、誤推論の原因となる画像箇所を画素単位で可視化する。以下、第5の実施形態について、上記第4の実施形態との相違点を中心に説明する。
<誤推論原因抽出部の機能構成>
はじめに、第5の実施形態に係る解析装置100における、誤推論原因抽出部の機能構成について説明する。図25は、誤推論原因抽出部の機能構成の一例を示す第5の図である。図21に示した誤推論原因抽出部の機能構成との相違点は、図25の場合、詳細原因解析部2510の機能が、図21に示す詳細原因解析部2110の機能とは異なる点、及び、詳細原因解析部2510が、推論部303より推論部構造情報を取得する点である。
詳細原因解析部2510は、誤推論画像とスコア最大化リファイン画像と推論部構造情報とに基づいて生成した、差分画像とSSIM画像とグレイスケール化重要特徴マップとを用いて、誤推論の原因となる画像箇所を画素単位で可視化する。
なお、詳細原因解析部2510が誤推論の原因となる画像箇所を画素単位で可視化する際に用いる差分画像、SSIM画像、グレイスケール化重要特徴マップは、以下のような属性を有する。
・差分画像:画素ごとの差分情報であり、指定したラベルの分類確率をよくするために画素をどのくらい修正すればよいかを示す、正負値を有する情報である。
・SSIM画像:画像全体及び局所領域の変化状況を考慮した差分情報であり、画素ごとの差分情報よりもアーティファクト(意図しないノイズ)が少ない情報である。つまり、より高い精度の差分情報である(ただし、正値のみの情報である)。
・グレイスケール化重要特徴マップ:正解ラベルの推論に影響を与える特徴部分を可視化したマップである。
<詳細原因解析部の機能構成>
次に、詳細原因解析部2510の機能構成について説明する。図26は、詳細原因解析部の機能構成の一例を示す第2の図である。図22に示す機能構成との相違点は、図26の場合、重要特徴マップ生成部2601を有する点、及び、切り出し部2602の機能が、図22の切り出し部2203の機能とは異なる点である。
重要特徴マップ生成部2601は、スコア最大化リファイン画像を入力として推論した際の推論部構造情報を、推論部303より取得する。また、重要特徴マップ生成部2601は、選択的BP法を用いることで、推論部構造情報に基づいて、グレイスケール化重要特徴マップを生成する。
切り出し部2602は、差分画像及びSSIM画像から、変更可能領域に対応する画像部分を切り出すことに加えて、グレイスケール化重要特徴マップから、変更可能領域に対応する画像部分を切り出す。更に、切り出し部2602は、変更可能領域に対応する画像部分を切り出した、差分画像とSSIM画像とグレイスケール化重要特徴マップとを乗算して、乗算画像を生成する。
このように、差分画像とSSIM画像とグレイスケール化重要特徴マップとを乗算することで、作用結果画像において、誤推論の原因となる画像箇所を画素単位で視認することが可能となる。
なお、乗算の際に差分画像を用いることで、作用結果画像は、正解ラベルのスコアが上がる画像に自動的に修正されることになる。したがって、差分画像を作用結果画像として出力してもよい。更に、このような利点を考慮しないのであれば、詳細原因解析部2510は、(差分画像を用いずに)SSIM画像とグレイスケール化重要特徴マップとを用いて乗算を行い、作用結果画像を出力してもよい。
<詳細原因解析部の処理の具体例>
次に、詳細原因解析部2510の処理の具体例について説明する。図27は、詳細原因解析部の処理の具体例を示す第2の図である。なお、図23の詳細原因解析部2110の処理の具体例との相違点は、重要特徴マップ生成部2601が、推論部構造情報(I)に基づいて、選択的BP法を用いた重要特徴マップ生成処理を行い、グレイスケール化重要特徴マップを生成している点である。また、切り出し部2602が、グレイスケール化重要特徴マップから変更可能領域に対応する画像部分が切り出され、切り出し画像(J)を出力している点である。更に、切り出し部2602が、切り出し画像(C)と切り出し画像(D)と切り出し画像(J)とを乗算し、乗算画像(G)を生成している点である。
<詳細原因解析処理の流れ>
次に、詳細原因解析部2510による詳細原因解析処理の流れについて説明する。図28は、詳細原因解析処理の流れを示す第2のフローチャートである。図24に示したフローチャートとの相違点は、ステップS2801、ステップS2802、ステップS2803である。
ステップS2801において、重要特徴マップ生成部2601は、スコア最大化リファイン画像を入力としてラベルを推論した際の推論部構造情報を、推論部303より取得する。また、重要特徴マップ生成部2601は、選択的BP法を用いることで、推論部構造情報に基づいてグレイスケール化重要特徴マップを生成する。
ステップS2802において、切り出し部2602は、グレイスケール化重要特徴マップから、変更可能領域に対応する画像部分を切り出す。
ステップS2803において、切り出し部2602は、変更可能領域に対応する画像部分を切り出した、差分画像とSSIM画像とグレイスケール化重要特徴マップとを乗算して、乗算画像を生成する。
以上の説明から明らかなように、第5の実施形態に係る解析装置100は、誤推論画像とスコア最大化リファイン画像と推論部構造情報とに基づいて、差分画像とSSIM画像とグレイスケール化重要特徴マップとを生成し、変更可能領域を切り出して乗算する。これにより、第5の実施形態に係る解析装置100によれば、変更可能領域内において、誤推論の原因となる画像箇所を画素単位で視認することが可能となる。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
100 :解析装置
140 :誤推論原因抽出部
141 :リファイン画像生成部
142 :マップ生成部
143 :特定部
301 :画像リファイナ部
302 :画像誤差演算部
303 :推論部
304 :スコア誤差演算部
311 :重要特徴マップ生成部
312 :劣化尺度マップ生成部
313 :重畳部
321 :スーパーピクセル分割部
322 :重要スーパーピクセル決定部
323 :重要スーパーピクセル評価部
611 :選択的逆誤差伝播部
612 :非注目画素オフセット調整部
613 :グレイスケール化部
1110 :領域抽出部
1111 :合成部
1710 :マップ生成部
1711 :平均化部
1910 :リファイン画像生成部
1911 :画像誤差演算部
1920 :特定部
1921 :補正部
2110 :詳細原因解析部
2201 :画像差分演算部
2202 :SSIM演算部
2203 :切り出し部
2204 :作用部
2510 :詳細原因解析部
2601 :重要特徴マップ生成部
2602 :切り出し部

Claims (6)

  1. 画像認識処理の際に誤ったラベルが推論される誤推論画像と、リファイン画像との差分を用いて、前記誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成するリファイン画像生成部と、
    前記誤推論画像の複数の画素のうち前記スコアを最大化させたリファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記スコアを最大化させたリファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップであって、各注目度合いの出現頻度に基づいて調整した第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成するマップ生成部と、
    前記誤推論画像において、ピクセルの集合ごとに前記第3のマップの画素値を算出することで、誤推論の原因となるピクセルの集合を特定する特定部と、を有し、
    前記リファイン画像生成部は、
    前記特定部により前記ピクセルの集合が特定された場合、前記特定されたピクセルの集合の領域について前記差分を補正し、補正後の差分を用いて、前記誤推論画像から、前記推論の正解ラベルのスコアを最大化させたリファイン画像を再生成する、解析装置。
  2. 前記マップ生成部は、各注目度合いの出現頻度が最大となる画素値を特定し、特定した画素値がゼロになるように、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップを調整する、請求項1に記載の解析装置。
  3. 前記マップ生成部は、BP法、GBP法または選択的BP法のいずれかを用いて、前記リファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップを生成する、請求項2に記載の解析装置。
  4. 前記誤推論画像と前記スコアを最大化させたリファイン画像との差分に基づいて算出される差分画像から、所定の領域を切り出した画像と、
    前記誤推論画像と前記スコアを最大化させたリファイン画像とをSSIM演算することで得られるSSIM画像から、所定の領域を切り出した画像と、
    前記第2のマップから、所定の領域を切り出した画像と、
    を乗算することで得られる乗算画像を、前記誤推論画像にて可視化する請求項1に記載の解析装置。
  5. 画像認識処理の際に誤ったラベルが推論される誤推論画像と、リファイン画像との差分を用いて、前記誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
    前記誤推論画像の複数の画素のうち前記スコアを最大化させたリファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記スコアを最大化させたリファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップであって、各注目度合いの出現頻度に基づいて調整した第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成し、
    前記誤推論画像において、ピクセルの集合ごとに前記第3のマップの画素値を算出することで、誤推論の原因となるピクセルの集合を特定する、処理をコンピュータに実行させ
    前記ピクセルの集合が特定された場合、前記特定されたピクセルの集合の領域について前記差分を補正し、補正後の差分を用いて、前記誤推論画像から、前記推論の正解ラベルのスコアを最大化させたリファイン画像を再生成する、解析プログラム。
  6. 画像認識処理の際に誤ったラベルが推論される誤推論画像と、リファイン画像との差分を用いて、前記誤推論画像から、推論の正解ラベルのスコアを最大化させたリファイン画像を生成し、
    前記誤推論画像の複数の画素のうち前記スコアを最大化させたリファイン画像を生成する際に変更がなされた画素を示す第1のマップと、前記スコアを最大化させたリファイン画像の複数の画素のうち推論時に注目した各画素の注目度合いを示すマップであって、各注目度合いの出現頻度に基づいて調整した第2のマップと、を重畳することで、正解ラベルを推論するための各画素の重要度を示す第3のマップを生成し、
    前記誤推論画像において、ピクセルの集合ごとに前記第3のマップの画素値を算出することで、誤推論の原因となるピクセルの集合を特定する、処理をコンピュータが実行し、
    前記ピクセルの集合が特定された場合、前記特定されたピクセルの集合の領域について前記差分を補正し、補正後の差分を用いて、前記誤推論画像から、前記推論の正解ラベルのスコアを最大化させたリファイン画像を再生成する、解析方法。
JP2019200863A 2019-11-05 2019-11-05 解析装置、解析プログラム及び解析方法 Active JP7351186B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019200863A JP7351186B2 (ja) 2019-11-05 2019-11-05 解析装置、解析プログラム及び解析方法
US17/031,966 US11663487B2 (en) 2019-11-05 2020-09-25 Analysis apparatus, non-transitory computer-readable storage medium for analysis program, and analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019200863A JP7351186B2 (ja) 2019-11-05 2019-11-05 解析装置、解析プログラム及び解析方法

Publications (2)

Publication Number Publication Date
JP2021076924A JP2021076924A (ja) 2021-05-20
JP7351186B2 true JP7351186B2 (ja) 2023-09-27

Family

ID=75687413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019200863A Active JP7351186B2 (ja) 2019-11-05 2019-11-05 解析装置、解析プログラム及び解析方法

Country Status (2)

Country Link
US (1) US11663487B2 (ja)
JP (1) JP7351186B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191481A (ja) 2014-03-28 2015-11-02 株式会社ニコン 画像処理装置および画像処理プログラム
JP2016523405A (ja) 2013-06-04 2016-08-08 メドスナップ・リミテッド・ライアビリティ・カンパニーMedsnap, LLC 錠剤の識別における印の解析を使用したシステム及び方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6582416B2 (ja) 2014-05-15 2019-10-02 株式会社リコー 画像処理装置、画像処理方法及びプログラム
JP6267139B2 (ja) 2015-02-10 2018-01-24 有限会社葛山製作所 転造タッピング装置
JP6697356B2 (ja) 2016-09-13 2020-05-20 Kddi株式会社 所定対象のうちの特定対象における状態を識別する装置、プログラム及び方法
JP2018097807A (ja) 2016-12-16 2018-06-21 株式会社デンソーアイティーラボラトリ 学習装置
JP7279526B2 (ja) * 2019-05-31 2023-05-23 富士通株式会社 解析プログラム、解析装置及び解析方法
JP7363382B2 (ja) * 2019-11-05 2023-10-18 富士通株式会社 解析装置、解析プログラム及び解析方法
JP7363383B2 (ja) * 2019-11-05 2023-10-18 富士通株式会社 解析装置、解析プログラム及び解析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016523405A (ja) 2013-06-04 2016-08-08 メドスナップ・リミテッド・ライアビリティ・カンパニーMedsnap, LLC 錠剤の識別における印の解析を使用したシステム及び方法
JP2015191481A (ja) 2014-03-28 2015-11-02 株式会社ニコン 画像処理装置および画像処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
久保田智規他,CNNを用いた物体認識における誤認識の原因を可視化する一手法,情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM) 2019-CVIM-218 [online] ,日本,情報処理学会,2019年08月28日

Also Published As

Publication number Publication date
JP2021076924A (ja) 2021-05-20
US20210133481A1 (en) 2021-05-06
US11663487B2 (en) 2023-05-30

Similar Documents

Publication Publication Date Title
Kim et al. Tag2pix: Line art colorization using text tag with secat and changing loss
US11507788B2 (en) Non-transitory computer-readable storage medium for storing analysis program, analysis apparatus, and analysis method
KR102275452B1 (ko) 색상과 형태를 동시에 고려한 실시간 영상 추적 방법 및 이를 위한 장치
JP7011146B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法
JP5487610B2 (ja) 画像処理装置および方法、並びにプログラム
US11341361B2 (en) Analysis apparatus, storage medium storing analysis program, and analysis method
US11436431B2 (en) Analysis apparatus, non-transitory computer-readable storage medium for analysis program, and analysis method
CN111145188A (zh) 一种基于ResNet与UNet模型的图像分割方法
CN104732509A (zh) 自适应图像分割方法和设备
US11526963B2 (en) Image processing apparatus, image processing method, and storage medium
JP7363383B2 (ja) 解析装置、解析プログラム及び解析方法
CN112132164B (zh) 目标检测方法、系统、计算机装置及存储介质
US20090315910A1 (en) Systems and methods for obtaining an image alpha matte
CN113409224B (zh) 一种图像目标针对性增强方法、装置、设备及存储介质
JP7351186B2 (ja) 解析装置、解析プログラム及び解析方法
US9916694B2 (en) Method for hole filling in 3D model, and recording medium and apparatus for performing the same
JP7392835B2 (ja) 解析装置及び解析プログラム
JP7392834B2 (ja) 解析装置及び解析プログラム
Xia et al. Lazy texture selection based on active learning
Huang et al. Evaluations of Image Completion Algorithms: Exemplar-Based Inpainting vs. Deep Convolutional GAN
US20240185574A1 (en) Composite car image generator
CN117173534A (zh) 计算机视觉任务的对抗样本生成方法、终端及介质
CN113920133A (zh) 一种图像分割方法和装置
CN116309902A (zh) 血管影像重建方法、装置、电子设备和存储介质
Aurdal et al. Continuous label Bayesian segmentation, applications to medical brain images

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220708

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230828

R150 Certificate of patent or registration of utility model

Ref document number: 7351186

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150