JP2022046085A - 重要度解析装置、方法及びプログラム - Google Patents

重要度解析装置、方法及びプログラム Download PDF

Info

Publication number
JP2022046085A
JP2022046085A JP2020151951A JP2020151951A JP2022046085A JP 2022046085 A JP2022046085 A JP 2022046085A JP 2020151951 A JP2020151951 A JP 2020151951A JP 2020151951 A JP2020151951 A JP 2020151951A JP 2022046085 A JP2022046085 A JP 2022046085A
Authority
JP
Japan
Prior art keywords
importance
input data
distribution
graph
analysis device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020151951A
Other languages
English (en)
Other versions
JP7419200B2 (ja
Inventor
健太郎 高木
Kentaro Takaki
康太 中田
Kota Nakata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2020151951A priority Critical patent/JP7419200B2/ja
Priority to US17/187,374 priority patent/US20220076049A1/en
Publication of JP2022046085A publication Critical patent/JP2022046085A/ja
Application granted granted Critical
Publication of JP7419200B2 publication Critical patent/JP7419200B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pathology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】機械学習における特徴量の重要度の解析精度を向上させること。【解決手段】 実施形態に係る重要度解析装置は、重要度算出部と分布算出部とを有する。重要度算出部は、学習済みモデルと複数個の入力データとに基づいて前記複数個の入力データ各々の複数の特徴量毎の重要度を算出する。分布算出部は、前記複数個の入力データに亘る前記複数の特徴量毎の前記重要度の分布を算出する。【選択図】 図2

Description

本発明の実施形態は、重要度解析装置、方法及びプログラムに関する。
機械学習の実用において、学習済みモデルから入力データに関する特徴量の重要度を算出したい場合がある。例えば、重要度を参照することにより、入力データの特徴量が多く、次元数が多いときに必要のない次元を削減することが考えられる。他には、歩留まりや出来栄えの予測モデルを構築し、歩留まりや出来栄えに影響の大きい特徴量を抽出することも考えられる。
機械学習における重要度として、複数個の入力データ全体に対する特徴量の平均重要度を算出する方法がある。複数個の入力データに亘る平均重要度が算出されるため、全入力データのうちの一部の入力データのみに重要度が高い特徴量がある場合や重要度の分布に多峰性がある場合などを見逃してしまう可能性がある。入力データ毎に特徴量の重要度を算出する手法もあるが複数個の入力データ全体に亘る重要度を算出することはできない。
Andre Altmann, Laura Tolosi, Oliver Sander, Thomas Lengauer, "Permutation importance: a corrected feature importance measure", Bioinformatics, Volume 26, Issue 10, 15 May 2010, Pages 1340-1347. Karen Simonyan, Andrea Vedaldi, Andrew Zisserman, "Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps", arXiv:1312.6034v2 [cs.CV], 19 Apr 2014.
本発明が解決しようとする課題は、機械学習における特徴量の重要度の解析精度を向上させることが可能な重要度解析装置、方法及びプログラムを提供することである。
実施形態に係る重要度解析装置は、重要度算出部と分布算出部とを有する。重要度算出部は、学習済みモデルと複数個の入力データとに基づいて前記複数個の入力データ各々の複数の特徴量毎の重要度を算出する。分布算出部は、前記複数個の入力データに亘る前記複数の特徴量毎の前記重要度の分布を算出する。
本実施形態に係る重要度解析装置の構成例を示す図 図1の処理回路による重要度可視化処理の流れの一例を示す図 入力データ#i毎の特徴量x の一例を示す図 入力データ#i毎の特徴量x 及び推定出力値yiの一例を示す図 入力データ#i毎の重要度c の一例を示す図 バイオリンプロットの表示例(グループ分け有り)を示す図 リッジラインプロットの表示例を示す図 バイオリンプロットの他の表示例(グループ分け無し)を示す図 ボックスプロットの表示例(グループ分け無し)を示す図 ジッタープロットの表示例(グループ分け無し)を示す図 スワームプロットの表示例(グループ分け無し)を示す図
以下、図面を参照しながら本実施形態に係わる重要度解析装置、方法及びプログラムを説明する。
図1は、本実施形態に係る重要度解析装置100の構成例を示す図である。重要度解析装置100は、機械学習における特徴量の重要度を解析するためのコンピュータである。図1に示すように、重要度解析装置100は、処理回路1、記憶装置2、入力機器3、通信機器4及び表示機器5を有する。
処理回路1は、CPU(Central Processing Unit)等のプロセッサとRAM(Random Access Memory)等のメモリとを有する。処理回路1は、機械学習における特徴量の重要度を算出し可視化するための重要度可視化処理を実行する。処理回路1は、記憶装置2に記憶されているプログラムを実行することにより推定部11、重要度算出部12、分布算出部13及び表示制御部14を実現する。処理回路1のハードウェア実装は上記態様のみに限定されない。例えば、推定部11、重要度算出部12、分布算出部13及び/又は表示制御部14を実現する特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等の回路により構成されても良い。推定部11、重要度算出部12、分布算出部13及び/又は表示制御部14は、単一の集積回路に実装されても良いし、複数の集積回路に個別に実装されても良い。
推定部11は、学習済みモデルに複数個の入力データ各々を適用して出力値(以下、推定出力値と呼ぶ)を算出する。本実施形態に係る学習済みモデルは、入力データを入力して推定出力値を出力するように学習されたニューラルネットワークである。本実施形態に係る学習済みモデルは、クラス分類や回帰を行うニューラルネットワークである。入力データは、数値データでもよいし画像データでもよい。出力値は、各クラスのスコアや確率、割合等の数値である。なお、出力層の前段において画像データが出力され、出力層から当該画像データに基づく推定出力値が出力されてもよい。
重要度算出部12は、学習済みモデルと複数個の入力データとに基づいて、複数個の入力データ各々の複数の特徴量毎の重要度を算出する。重要度は、特徴量毎に推定出力値に与える影響の度合いを評価するための指標である。
分布算出部13は、複数個の入力データに亘る複数の特徴量毎の重要度の分布を算出する。分布は、重要度の数値毎の発生頻度や確率、確率密度等に関する分布である。典型的には、分布として確率密度関数が算出される。
表示制御部14は、種々の情報を表示機器5を介して表示する。例えば、表示制御部14は、分布を可視化する。より詳細には、表示制御部14は、複数の特徴量毎に分布を表すグラフを生成し、グラフを表示機器5に表示する。
記憶装置2は、ROM(Read Only Memory)やHDD(Hard Disk Drive)、SSD(Solid State Drive)、集積回路記憶装置等により構成される。記憶装置2は、処理回路1による種々の演算結果や処理回路1が実行する種々のプログラム等を記憶する。また、記憶装置2は、学習済みモデルや複数個の入力データ等を記憶する。
入力機器3は、ユーザからの各種指令を入力する。入力機器3としては、キーボードやマウス、各種スイッチ、タッチパッド、タッチパネルディスプレイ等が利用可能である。入力機器3からの出力信号は処理回路1に供給される。なお、入力機器3としては、処理回路1に有線又は無線を介して接続されたコンピュータであっても良い。
通信機器4は、重要度解析装置100にネットワークを介して接続された外部機器との間で情報通信を行うためのインタフェースである。
表示機器5は、種々の情報を表示する。例えば、表示機器5は、表示制御部14による制御に従い、分布を表すグラフを表示する。表示機器5としては、CRT(Cathode-Ray Tube)ディスプレイや液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、LED(Light-Emitting Diode)ディスプレイ、プラズマディスプレイ又は当技術分野で知られている他の任意のディスプレイが適宜利用可能である。
以下、本実施形態に係る重要度解析装置100について詳細に説明する。
図2は、処理回路1による重要度可視化処理の流れの一例を示す図である。処理回路1は、ユーザにより入力機器3等を介して重要度可視化処理の開始指示がなされたことを契機として重要度可視化処理に関するプログラムを記憶装置2から読み出して実行する。当該プログラムを実行することにより処理回路1は、図2に示す一連の処理及び機能を実現する。なおプログラムは、図2に示す一連の処理及び機能を実現する単一のモジュールにより構成されてもよいし、一連の処理及び機能を分担する複数のモジュールにより構成されてもよい。
図2に示すように、推定部11は、学習済みモデルにN個の入力データ#iを適用して入力データ#i毎に推定出力値yiを算出する(ステップS1)。Nは、入力データの個数を示す2以上の整数である。iは、入力データの番号を示す1≦i≦Nの整数である。入力データは数値データでもよいし画像データでもよいし他のデータでもよい。
ステップS1において推定部11は、学習済みモデルに入力データ#iを適用して順伝播処理を行うことにより、学習済みモデルの目的変数である推定出力値yiを推定する。本実施形態に係る学習済みモデルは、多クラス分類や回帰のためのニューラルネットワークであり、推定出力値yiは、複数の離散値又は連続値であるとする。推定部11は、順伝播処理の過程において推定過程においてJ次元(個)の特徴量x を算出する。Jは特徴量の次元数(個数)を示す2以上の整数である。jは、特徴量の次元番号を示す1≦j≦Jの整数である。特徴量x は、i番目の入力データ#iに含まれるJ次元の特徴量のうちのj次元目の特徴量である。特徴量x は、入力データ#iの特徴量を表す指標値である。特徴量x は、例えば、学習済みモデルに含まれる畳み込み層の順伝播により得られる特徴マップ又は特徴ベクトルに対応する。推定部11は、入力データ#iからJ次元の特徴量x を経て推定出力値yiを推定する。なお、特徴量x は、学習済みモデルの順伝播により推定する方法に限定されない。例えば、入力データ#iが製造データである場合、特徴量x は、製造データを表す数値でもよいし、製造データに基づく平均値や分散値、標準偏差等の統計演算値でもよい。また、入力データ#iが画像データである場合、特徴量x は、輝度等の画素値でもよいし、輝度分布に基づくエッジや粒度等のテクスチャ解析により算出される特徴量でもよい。これら特徴量x は、学習済みモデルを介さずに解析学的手法により算出されてもよい。
図3は、入力データ#i毎の特徴量x の一例を示す図である。図3においては、特徴量の次元数Jは4であるとする。例えば、入力データ#1は、1次元目の特徴量x ,2次元目の特徴量x ,3次元目の特徴量x ,4次元目の特徴量x を有しており、それぞれ、0.1,0.4,0.1,0.8である。他の入力データ#iも同様である。
図4は、入力データ#i毎の特徴量x 及び推定出力値yiの一例を示す図である。図4の入力データは図3と同一である。例えば、入力データ#1に関する推定出力値y1は0.9である。他の推定出力値yiも同様である。推定出力値yiは入力データ#iに関連付けて記憶装置2に格納される。
ここで、学習済みモデル、入力データ及び推定出力値の一例について説明する。例えば、学習済みモデルとしては、半導体製造チップの歩留まり予測モデルが挙げられる。歩留まり予測モデルの入力データとしては、複数の半導体チップを光学撮影することにより得られた光学画像データが用いられる。歩留まり予測モデルに光学画像データが入力されることにより、光学画像データに描画されている半導体チップの良品及び/又は不良品の判定結果である推定出力値が得られる。推定出力値としては、例えば、光学画像データに描画されている複数の半導体チップの良品及び/又は不良品の個数、良品及び/又は不良品である確率、不良品の欠陥種を示すラベル等が得られる。推定出力値は、光学画像データに描画されている半導体チップ毎又は画素毎に得ることが可能である。
学習済みモデルの他の例としては、病気の罹患予測モデルが挙げられる。罹患予測モデルの入力データとしては、患者を各種医用画像診断装置により医用撮像することにより得られた医用画像データが用いられる。罹患予測モデルに医用画像データが入力されることにより、医用画像データに描画されている患者の正常/又は罹患の判定結果である推定出力値が得られる。推定出力値としては、例えば、医用画像データに描画されている人体部位に関する特定疾患の罹患の有無、特定疾患の罹患の確率等が得られる。推定出力値は、医用画像データ又は医用画像データの関心領域毎又は画素毎に得ることが可能である。
ステップS1が行われると重要度算出部12は、学習済みモデルとN個の入力データ#1~#Nとに基づいて、入力データ#i各々について、特徴量x 毎の重要度c を算出する(ステップS2)。より詳細には、ステップS2において重要度算出部12は、特徴量x の変化に対する学習済みモデルの推定出力値yiの変化を測定することにより、特徴量x 毎の重要度c を算出する。重要度は、Saliency MapやOcculusion Sensitivity等の方法により算出可能である。例えば、Saliency Mapの手法を用いる場合、重要度算出部12は、推定出力値yiを特徴量x で微分することにより、各特徴量x に対する重要度c を算出する。
図5は、入力データ#i毎の重要度c の一例を示す図である。図5の入力データは図3及び図4と同一である。例えば、入力データ#1については、1次元目の特徴量x に対応する重要度c ,2次元目の特徴量x に対応する重要度c ,3次元目の特徴量x に対応する重要度c ,4次元目の特徴量x に対応する重要度c は、それぞれ、0.4,0.1,0.4,0.8である。他の重要度c も同様である。重要度c は入力データ#i及び推定出力値yiに関連付けて記憶装置2に格納される。
ステップS2が行われると分布算出部13は、グループ化閾値を設定する(ステップS3)。グループ化閾値は、推定出力値yiに応じて入力データ#1~#Nをグループ分けするための閾値である。グループ化閾値は、例えば、表示制御部14の有するユーザインタフェースにおいてユーザにより指定された値に設定されればよい。グループ化閾値は、1個でもよいし、2個以上でもよい。グループ化閾値は、推定出力値yiの取り得る値であれば如何なる値に設定されてもよい。本実施例においてグループ化閾値は、1個であり、0.5であるとする。
ステップS3が行われると分布算出部13は、グループ化閾値を用いてN個の入力データ#1~#Nをグループ分けする(ステップS4)。ステップS4において分布算出部13は、複数の推定出力値yiにグループ化閾値を適用してN個の入力データ#1~#Nを複数のグループに分ける。グループ化閾値が1個である場合、分布算出部13は、入力データ#i各々について、推定出力値yiとグループ化閾値との大小関係を判定し、推定出力値yiがグループ化閾値未満の場合、入力データ#iをグループG1に、推定出力値yiがグループ化閾値以上の場合、入力データ#iをグループG2に分類する。例えば、図4の場合、入力データ#2の推定出力値y2が0.1であり、入力データ#3の推定出力値y3が0.4であり、両者はグループ化閾値未満であるので、入力データ#2及び#3はグループG1に分類される。入力データ#1の推定出力値y2が0.9であり、入力データ#Nの推定出力値yNが0.9であり、両者はグループ化閾値以上であるので、入力データ#1及び#NはグループG2に分類される。
ステップS4が行われると分布算出部13は、グループ毎に特徴量x毎の重要度cの分布を算出する(ステップS5)。特徴量xは、全入力データ#1~#Nに関するj番目の特徴量を表す。ステップS5において算出される分布は、表示制御部14による分布の表示形式に応じて設定可能である。分布としては、確率密度関数、平均、標準偏差及び分位点等から任意に設定可能である。例えば、確率密度関数に設定された場合、分布算出部13は、j番目の特徴量xについて、グループG1に属する全入力データ#1~#Nの重要度cに基づいて重要度cの確率密度関数を算出する。同様に、分布算出部13は、j番目の特徴量について、グループG2に属する全入力データ#1~#Nの重要度cに基づいて重要度cの確率密度関数を算出する。同様に、J個の全ての特徴量xについてグループ毎に確率密度関数が算出される。確率密度関数は既存の方法により算出されればよい。
ステップS5が行われると表示制御部14は、分布を表すグラフを生成し(ステップS6)、ステップS6が行われると表示制御部14は、グラフを表示する(ステップS7)。表示制御部14は、グループ毎にJ個の特徴量x毎の分布を表すグラフを生成し、生成されたグラフを表示機器5に表示する。グラフは、重要度cとJ個の特徴量xとにより規定された第1のグラフを有する。J個の特徴量x毎の分布は、重要度cと当該重要度cの出現度合いを示す分布値とにより規定された第2のグラフにより表される。第2のグラフはグループ毎に生成される。J個の特徴量x毎の第2のグラフは、第1のグラフに重要度cの軸の方向を一致させて並べられる。
表示制御部14は、ステップS5において算出された分布の種類に応じた種類のグラフを生成する。例えば、分布が確率密度関数である場合、グラフとしてバイオリンプロットが生成されるとよい。
図6は、バイオリンプロットの表示例を示す図である。図6に示すバイオリンプロットは、グループ化閾値が1個、分布が確率密度関数の場合を例示している。図6に示すように、バイオリンプロットは、縦軸に重要度cが規定され、横軸にJ個の特徴量xに規定された第1のグラフGr1Aを有する。また、バイオリンプロットは、各特徴量xについて、縦軸が重要度cに規定され、横軸がcの確率密度に規定された第2のグラフGr2Aを有する。各第2のグラフGr2Aは、重要度軸が第1のグラフGr1Aの重要度軸と同一方向を向き、特徴量x軸に沿って並べられる。第2のグラフGr2Aは、グループG1のグラフGr21AとグループG2のグラフGr22Aとを有する。グラフGr21Aは、縦軸が重要度cに規定され、横軸が確率密度に規定され紙面左方向がプラス方向に規定される。グラフGr22Aは、縦軸が重要度cに規定され、横軸が確率密度に規定され紙面右方向がプラス方向に規定される。グラフGr21AとグラフGr22Aとは縦軸が共有される。
グラフGr21Aの確率密度関数の波形とグラフGr22Aの確率密度関数の波形とは、色や線種等の視覚態様が異なるように表示される。例えば、グラフGr21Aの確率密度関数の波形は青色で表示され、グラフGr22Aの確率密度関数の波形は橙色で表示されるとよい。これにより、グループ間の波形を視覚的に容易に区別して観察することが可能になる。
図6の表示例によれば、特徴量毎にN個の入力データ全体に亘る重要度の確率密度関数をグループ毎に観察し解析することが可能になる。推定出力値に応じたグループ毎に重要度が可視化されるので、推定出力値に応じた重要度の振る舞いを観察し解析することができる。また、グループ毎に特徴量毎の重要度が可視化されるので、特徴量に応じた重要度の振る舞い、推定出力値に応じた当該振る舞いの違い等を観察し解析することができる。例えば、特徴量x1や特徴量x3のように、グループG1とグループG2とで重要度の確率密度関数が異なることを見出すことが可能になる。
特徴量1に関しては、グループG2の入力データは、2つの重要度に確率密度のピークを有する多峰性(二峰性)を有していることが分かる。また、グループG1の入力データは、1つの重要度に確率密度のピークを有する単峰性を有していることが分かる。特徴量3に関しては、グループG1の入力データは、高い重要度に確率密度のピークがあり、グループG2の入力データに関しては低い重要度に確率密度のピークがあることが分かる。すなわち、推定出力値に応じて重要度が異なり、特にグループG1に属する入力データに対して特徴量3の重要度が高いことが分かる。グループ分けせず平均重要度を可視化した場合、1個の値(平均重要度)が可視化されるだけなので、グループG1に属する入力データに対して特徴量3の重要度が高いことを見逃してしまう。本表示例によれば、特徴量3がグループG1に属する入力データに対して重要度が高いことを可視化することができるので、重要な特徴量を見逃す可能性を低減することができる。重要度の高い特徴量を見出すことができれば、例えば、当該特徴量に関する演算部分のみが抽出された低コストの学習済みモデルを生成したり、当該特徴量を解析したりすることが可能である。また、歩留まり予測モデル等においては、歩留まりが悪い一部の入力データに対する重要度の高い特徴量を抽出することができるので、当該特徴量に関係する製造装置等を特定することにより、歩留まり悪化の原因と思われる当該製造装置を迅速且つ容易に特定することができる。
表示制御部14は、J個の特徴量x毎の分布を、グループ間で分布の差が大きい順番に並べてもよい。例えば、図6の例の場合、表示制御部14は、各特徴量xについて、グループG1の確率密度とグループG2の確率密度との差分値を算出し、差分値が大きい順に左から並べてグラフGr2を表示してもよい。これによりユーザは、グループ間で確率密度の差が大きいグラフGr2をより効率的且つより確実に観察し解析することが可能になる。表示制御部14は、特定の重要度におけるグループG1の確率密度とグループG2の確率密度との差分を算出し、差分値が大きい順に左から並べてグラフGr2を表示してもよい。特定の重要度は、例えば、各確率密度関数におけるピーク値等に設定されるとよい。
表示制御部14は、J個の特徴量x毎の分布のうち、グループ間での分布の差が閾値よりも大きい分布を強調してもよい。例えば、図6の例の場合、表示制御部14は、各特徴量xについて、グループG1の確率密度とグループG2の確率密度との差分値を算出し、差分値が閾値よりも大きいグラフGr2を色や点滅等の視覚効果で強調する。また、差分値が閾値よりも大きいことを示すマークやメッセージを当該グラフGr2に付してもよい。これによりユーザは、グループ間で確率密度関数の差が大きいグラフGr2をより効率的且つより確実に観察し解析することが可能になる。
以上により、重要度可視化処理が終了する。
なお、上記の重要度可視化処理は一例であり種々の変形が可能である。
例えば、グループ化閾値は2個以上設定されてもよい。この場合、分布算出部13は、2個以上のグループ化閾値を用いてN個の入力データ#1~#Nを、3個以上のグループに分けてもよい。この場合、分布算出部13は、3個以上のグループから任意の2個のグループを選択し、選択された2個のグループに関して、上記の通り、重要度の分布を算出してもよい。2個のグループは、ユーザにより入力機器3を介して指定されたグループが選択されてもよいし、自動的に選択されてもよい。また、分布算出部13は、3個以上のグループ各々について重要度の分布を算出してもよい。この場合、表示制御部14は、分布を表すグラフとしてリッジラインプロットを生成及び表示するとよい。
図7は、リッジラインプロットの表示例を示す図である。図7に示すリッジラインプロットGr2Bは、単一の特徴量に関する5個のグループG1~G5にそれぞれ対応する5個のグラフGr21B~Gr25Bの集合である。各グラフは、縦軸が確率密度に規定され横軸が重要度に規定された確率密度関数を示している。表示制御部14は、単一の特徴量に関する5個のグラフGr21B~Gr25Bを並べて表示する。これによりユーザは、5個のグループG1~G5に亘る重要度の確率密度関数を俯瞰することができる。
なお、3個以上のグループの場合のグラフはリッジラインプロットに限定されない。例えば、3Dバイオリンプロットでもよい。この場合、表示制御部14は、複数のグループそれぞれに対応する複数の重要度の確率密度関数のグラフを生成し、重要度軸を共有して複数のグラフを3次元空間に配置することにより3Dバイオリンプロットを生成し表示すればよい。3Dバイオリンプロットは、ユーザにより入力機器3を介した指示に従い視点を変更可能に表示されるとよい。また、表示制御部14は、複数のグラフが視認可能であれば如何なる表示方法でもよく、例えば、複数のグラフを色等の視覚効果を変えて重ねて表示してもよいし、積み上げ表示してもよいし、他の方法で表示してもよい。
上記の実施例において学習済みモデルは1チャネルの推定出力値を出力するものとした。しかしながら、本実施形態はこれに限定されず、学習済みモデルは複数チャネルの推定出力値を出力してもよい。この場合、各チャネルについてステップS2~ステップS7が行われればよい。
上記の実施例において分布算出部13は、グループ化閾値を用いて入力データ#1~#Nを複数のグループに分類するものとした。しかしながら、本実施形態はこれに限定されず、分布算出部13は、入力データ#1~#Nを複数のグループに分類しなくてもよい。この場合、分布算出部13は、N個の入力データ#1~#N全体に亘るJ個の特徴量x毎の重要度cの分布を算出する。そして表示制御部14は、分布を表すグラフを生成し、グラフを表示する。この場合においても、分布は、確率密度関数、平均、標準偏差及び分位点等から任意に設定可能である。例えば、分布が確率密度関数である場合、グラフとしてバイオリンプロットが生成される。
図8は、バイオリンプロットの他の表示例を示す図である。図8に示すバイオリンプロットは、グループ分けがされていない場合を例示している。図8に示すように、バイオリンプロットは、縦軸が重要度cに規定され、横軸がJ個の特徴量xに規定された第1のグラフGr1Cを有する。また、バイオリンプロットは、各特徴量xについて、縦軸が重要度cに規定され、横軸がcの確率密度に規定された第2のグラフGr2Cを有する。グループ分けされていないため、第2のグラフGr2Cは、単一の確率密度関数を左右対称で表示している。図8の表示例においても、N個の入力データ#1~#N全体に亘る特徴量x毎の重要度の分布を観察することができる。
なお、グラフは、バイオリンプロットに限定されず、ボックスプロット、ジッタープロット又はスワームプロットでもよい。図9は、ボックスプロットの表示例を示す図であり、図10は、ジッタープロットの表示例を示す図であり、図11は、スワームプロットの表示例を示す図である。図9、図10及び図11は、図8に示すバイオリンプロットと同様、グループ化無しの場合を例示している。図9、図10及び図11に示すように、ボックスプロット、ジッタープロット及びスワームプロットは、図8に示すバイオリンプロットと同様、縦軸に重要度cが規定され、横軸にJ個の特徴量xにそれぞれ対応するJ個のグラフが並べられている。
図9に示すボックスプロットにおいては、各特徴量xに対応するグラフとして、重要度cの密集度を箱の大きさで示す図が生成される。図10に示すジッタープロットにおいては、各特徴量xに対応するグラフとして、重要度cのプロットを左右に散らばらせた散布図が生成される。図11に示すスワームプロットにおいては、各特徴量xに対応するグラフとして、重要度cのプロットを重複無く左右に散らばらせた散布図が生成される。これらグラフによっても重要度の各種分布を観察することが可能である。なお、ボックスプロット、ジッタープロット及びスワームプロットは、2以上のグループに関する重要度cの分布を表すグラフに使用されてもよい。
また、上記の実施例において学習済みモデルは、多クラス分類や回帰のためのニューラルネットワークであるとしたが、本実施形態に係る学習済みモデルは、特徴量毎の重要度を定義可能であれば、これに限定されない。例えば、本実施形態に係る学習済みモデルは、ランダムフォレストやGBDT(Gradient Boosting Decision Tree)等の決定木アンサンブル系の機械学習モデルでもよいし、任意のブラックボックスでもよい。この場合、入力データとして、数値が表形式に並べられた表形式データが入力されればよい。
上記の通り、重要度解析装置100は、重要度算出部12と分布算出部13とを有する。重要度算出部12は、学習済みモデルと複数個の入力データとに基づいて複数個の入力データ各々の複数の特徴量毎の重要度を算出する。分布算出部13は、複数個の入力データに亘る複数の特徴量毎の重要度の分布を算出する。
上記の構成によれば、複数個の入力データ全体に亘る重要度を算出することが可能であるので、複数個の入力データ全体に亘る各特徴量の重要性を評価することが可能になる。また、上記の構成によれば、複数個の入力データ全てのうちの一部の入力データのみに重要度が高い特徴量がある場合や重要度の分布に多峰性がある場合などを見逃すおそれが低減する。
かくして、本実施形態によれば、機械学習における特徴量の重要度の解析精度を向上させることが可能になる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…処理回路、2…記憶装置、3…入力機器、4…通信機器、5…表示機器、11…推定部、12…重要度算出部、13…分布算出部、14…表示制御部、100…重要度解析装置。

Claims (16)

  1. 学習済みモデルと複数個の入力データとに基づいて前記複数個の入力データ各々の複数の特徴量毎の重要度を算出する重要度算出部と、
    前記複数個の入力データに亘る前記複数の特徴量毎の前記重要度の分布を算出する分布算出部と、
    を具備する重要度解析装置。
  2. 前記学習済みモデルに前記複数個の入力データ各々を適用して推定出力値を算出する推定部を更に備え、
    前記分布算出部は、前記複数の推定出力値に応じて前記複数個の入力データを複数のグループに分け、前記グループ毎に前記分布を算出する、
    請求項1記載の重要度解析装置。
  3. 前記分布算出部は、前記複数の推定出力値に閾値を適用して前記複数個の入力データを前記複数のグループに分ける、請求項2記載の重要度解析装置。
  4. 前記閾値は、1個である、請求項3記載の重要度解析装置。
  5. 前記閾値は、2個以上である、請求項3記載の重要度解析装置。
  6. 前記グループ毎に前記複数の特徴量毎の前記分布を表すグラフを生成し、前記グラフを表示機器に表示する表示制御部、を更に備える、請求項2記載の重要度解析装置。
  7. 前記グラフは、前記重要度と前記複数の特徴量とにより規定された第1のグラフであり、
    前記複数の特徴量毎の前記分布は、前記重要度と前記重要度の出現度合いを示す分布値とにより規定され、前記グループ毎に生成される第2のグラフであり、
    前記複数の特徴量毎の前記第2のグラフは、前記第1のグラフに前記重要度の軸の方向を一致させて並べられる、
    請求項6記載の重要度解析装置。
  8. 前記表示制御部は、前記複数の特徴量毎の前記分布を、前記グループ間で前記分布の差が大きい順番に並べる、請求項6記載の重要度解析装置。
  9. 前記表示制御部は、前記複数の特徴量毎の前記分布のうち、前記グループ間での分布値の差が閾値よりも大きい前記分布を強調する、請求項6記載の重要度解析装置。
  10. 前記表示制御部は、前記グループ毎に異なる視覚態様で前記分布を表示する、請求項6記載の重要度解析装置。
  11. 前記グラフは、バイオリンプロット、ボックスプロット、ジッタープロット、スワームプロット又はリッジラインプロットである、請求項6記載の重要度解析装置。
  12. 前記分布算出部は、前記分布として、前記複数のデータセットに亘る前記複数の特徴量毎の前記重要度の確率密度関数を算出する、請求項1記載の重要度解析装置。
  13. 前記複数の特徴量毎に前記分布を表すグラフを生成し、前記グラフを表示機器に表示する表示制御部、を更に備える、請求項1記載の重要度解析装置。
  14. 前記学習済みモデルに前記複数個の入力データ各々を適用して前記複数の特徴量を算出する推定部を更に備える、請求項1記載の重要度解析装置。
  15. 学習済みモデルと複数個の入力データとに基づいて前記複数個の入力データ各々の複数の特徴量毎の重要度を算出し、
    前記複数個の入力データに亘る前記複数の特徴量毎の前記重要度の分布を算出する、
    ことを具備する重要度解析方法。
  16. コンピュータに、
    学習済みモデルと複数個の入力データとに基づいて前記複数個の入力データ各々の複数の特徴量毎の重要度を算出する機能と、
    前記複数個の入力データに亘る前記複数の特徴量毎の前記重要度の分布を算出する機能と、
    を実現させる重要度解析プログラム。
JP2020151951A 2020-09-10 2020-09-10 重要度解析装置、方法及びプログラム Active JP7419200B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020151951A JP7419200B2 (ja) 2020-09-10 2020-09-10 重要度解析装置、方法及びプログラム
US17/187,374 US20220076049A1 (en) 2020-09-10 2021-02-26 Importance analysis apparatus, method, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020151951A JP7419200B2 (ja) 2020-09-10 2020-09-10 重要度解析装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2022046085A true JP2022046085A (ja) 2022-03-23
JP7419200B2 JP7419200B2 (ja) 2024-01-22

Family

ID=80470726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020151951A Active JP7419200B2 (ja) 2020-09-10 2020-09-10 重要度解析装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US20220076049A1 (ja)
JP (1) JP7419200B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020026873A1 (ja) * 2018-08-02 2021-08-02 シャープ株式会社 表示データ生成装置、表示データ生成方法、プログラム、及び、プログラムの記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020154615A (ja) * 2019-03-19 2020-09-24 株式会社デンソーアイティーラボラトリ 情報推定装置及び情報推定方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020154615A (ja) * 2019-03-19 2020-09-24 株式会社デンソーアイティーラボラトリ 情報推定装置及び情報推定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANDRE ALTMANN ET AL.: "Permutation importance: a corrected feature importance measure", [ONLINE], JPN7023002956, 2010, ISSN: 0005118738 *
PROJECT CABINET BLOG: "進化形?箱ひげ図", [ONLINE], JPN7023002955, 2018, ISSN: 0005118739 *

Also Published As

Publication number Publication date
JP7419200B2 (ja) 2024-01-22
US20220076049A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
Fuhrman et al. A review of explainable and interpretable AI with applications in COVID‐19 imaging
CN109643399B (zh) 多类别分类器的交互式性能可视化
Long et al. Visualization and analysis of 3D microscopic images
WO2021093451A1 (zh) 病理切片图像的处理方法、装置、系统及存储介质
CN110419057A (zh) 用于确定分段的混合式主动机器学习系统和方法
Martins et al. Explaining Neighborhood Preservation for Multidimensional Projections.
CN108426994A (zh) 分析数字全息显微术数据以用于血液学应用
CN111986189B (zh) 一种基于ct影像的多类别肺炎筛查深度学习装置
JP6480918B2 (ja) フローサイトメトリにおける効率的なコンター及びゲーティング
Manninen et al. Leukemia prediction using sparse logistic regression
Acosta-Mesa et al. Application of time series discretization using evolutionary programming for classification of precancerous cervical lesions
JP2021002354A (ja) 表示制御装置、表示制御方法及び表示制御プログラム
JP7419200B2 (ja) 重要度解析装置、方法及びプログラム
Cao et al. Untangle map: Visual analysis of probabilistic multi-label data
Sallam et al. An efficient EGWO algorithm as feature selection for B-ALL diagnoses and its subtypes classification using peripheral blood smear images
JP6665999B2 (ja) データ処理装置、決定木生成方法、識別装置及びプログラム
Ain et al. Genetic programming for multiple feature construction in skin cancer image classification
CN114580501A (zh) 骨髓细胞分类方法、系统、计算机设备及存储介质
Geurts et al. Visual comparison of 3D medical image segmentation algorithms based on statistical shape models
de Sousa et al. Evolved explainable classifications for lymph node metastases
US20210201053A1 (en) Visual analytics platform for updating object detection models in autonomous driving applications
Ma et al. Gaussian mixture model-based target feature extraction and visualization
Areosa et al. Explaining the performance of black box regression models
WO2018165530A1 (en) Method of constructing a reusable low-dimensionality map of high-dimensionality data
Walker Visualising multi-objective populations with treemaps

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220826

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240110

R150 Certificate of patent or registration of utility model

Ref document number: 7419200

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150