JPWO2018092317A1 - 選択装置、選択方法、および選択プログラム - Google Patents

選択装置、選択方法、および選択プログラム Download PDF

Info

Publication number
JPWO2018092317A1
JPWO2018092317A1 JP2018551008A JP2018551008A JPWO2018092317A1 JP WO2018092317 A1 JPWO2018092317 A1 JP WO2018092317A1 JP 2018551008 A JP2018551008 A JP 2018551008A JP 2018551008 A JP2018551008 A JP 2018551008A JP WO2018092317 A1 JPWO2018092317 A1 JP WO2018092317A1
Authority
JP
Japan
Prior art keywords
representative data
variable
cluster
selection
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018551008A
Other languages
English (en)
Other versions
JP6529688B2 (ja
Inventor
真知子 朝家
真知子 朝家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2018092317A1 publication Critical patent/JPWO2018092317A1/ja
Application granted granted Critical
Publication of JP6529688B2 publication Critical patent/JP6529688B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

観測対象からのデータ群が取り得る値の範囲である変数を選択する選択装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する。プロセッサは、複数の前記変数に対応する複数の前記データ群の各々について前記変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成し、前記代表データ群の各データの第1特徴を規定する第1成分に関する第1軸および第2特徴を規定する第2成分に関する第2軸により構成される座標平面に、前記代表データ群を与えてマップを生成し、前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データの中から特定の代表データを前記クラスタごとに選択することにより、前記特定の代表データが代表する特定の変数を選択する、処理を実行する。

Description

本発明は、変数を選択する選択装置、選択方法、および選択プログラムに関する。
多くの製造業は、機械装置の稼働データを取得および監視をして、機械装置の不具合や製品品質への影響を分析し、予防保守や品質向上策を講じる。数千〜万単位の多数のセンサ群が稼働データを監視する。しかし、これらのセンサの中から、品質に直接的または間接的に影響を与える温度や速度といった少数のセンサ群を自動的に抽出し、さらに、温度条件などの制御範囲を決めることは困難である。また、多数のセンサ群による監視は、監視サーバへの通信負荷や分析処理・監視負荷が大きくなるため、監視センサは最小限にとどめたいという要求がある。
従来、多変数の観測値を低次元で表現する方法として、主成分分析(Principal Component Analysis; PCA)が活用されている。非特許文献1記載の主成分分析は、多変数の観測値を次元圧縮することにより、監視総センサ数MからM’(M>M’,M>0,M’>0)に次元を減らした主成分空間に変換し、少ない次元でデータ表現する。主成分分析は、多次元データの情報をできるだけ損失せずに、低次元データに縮約する方法である。すなわち、変数M個のデータは、M>M’のM’個の主成分に変換される。
非特許文献2は、各主成分の代表変数を選択する方法を開示する。具体的には、変数M、レコード数Nのデータを主成分分析して、採用する主成分数Q(Q<M)とするとき、非特許文献2は、固有値のもっとも大きい主成分から、各主成分に対応する固有ベクトルを順に評価し、固有ベクトルのうち係数のもっとも大きい変数を残す方法を使って、p個の変数を選択する。
特許文献1は、変量全体のデータ構造を反映した変量を選択可能とする多変量データ選択装置を開示する。多変量データ選択装置は、変数m個データを主成分分析によって生成された固有ベクトル平面と、全変数nから変数選択数pを選択するmCpの組合せの正規直交基底平面との角度をそれぞれ計算し、一番角度の小さい変数組合せを採用する。
特開2005−78186号公報
しかしながら、非特許文献1においては、新たに定義された主成分空間では、抽象的な値に変換され、主成分軸の解釈は分析者のスキルや業務知識に依存する。主成分は、原データの相関行列から固有ベクトルを計算することによって得られる。このように、主成分がどのような特徴を持つか、どの変数の特徴を継承しているかを、分析者が解釈する必要がある。主成分軸が原データと照らしてどのような意味の軸に変換されたかを解釈する場合、数千〜万単位の多数のセンサ群から、データ特性を表現する数十〜数百のセンサを選択するのは、膨大な手間がかかり、機械的な抽出方法が必要である。
また、非特許文献1の主成分分析では、分析目的によって変数選択基準が変わる。したがって、選択された変数群が適当であったか否かは、さらに機械学習などの分析を試行錯誤する必要がある。
非特許文献2は、各主成分に対し、変数Mに対し十分小さいQ個の変数を選択するが、大量変数を対象とする場合、類似した観測値挙動を示す冗長な変数を選択してしまう可能性が高い。
特許文献1は、主成分分析を用いた変数選択装置であるが、すべての変数組合せを求めて、元データで構成される主成分との比較をする。したがって、変数が数千レベル以上の場合、すべての変数組合せを計算するのは、計算機リソース、計算時間とも膨大となる。
このように、従来の方法では、大量変数の場合に類似した冗長な変数を選択してしまう可能性がある。さらに、分析者や製造現場の経験知が反映されず、選択された変数の妥当性を評価するのが困難である。
本発明は、変数選択を容易かつ適切におこなうことを目的とする。
本願において開示される発明の一側面となる選択装置、選択方法、および選択プログラムは、観測対象からのデータ群が取り得る値の範囲である変数を選択する選択装置、選択方法、および選択プログラムであって、前記プロセッサは、複数の前記変数に対応する複数の前記データ群の各々について前記変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成し、前記代表データ群の各データの第1特徴を規定する第1成分に関する第1軸および第2特徴を規定する第2成分に関する第2軸により構成される座標平面に、前記代表データ群を与えてマップを生成し、前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データの中から特定の代表データを前記クラスタごとに選択することにより、前記特定の代表データが代表する特定の変数を選択する、処理を実行することを特徴とする。
本発明の代表的な実施の形態によれば、変数選択を容易かつ適切におこなうことができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
図1は、選択システムのシステム構成例を示すブロック図である。 図2は、選択装置のハードウェア構成例を示すブロック図である。 図3は、図1に示した入力データ群の一例を示す説明図である。 図4は、図1に示した変数選択条件の一例を示す説明図である。 図5は、図4に示したラベル指定表の一例を示す説明図である。 図6は、図4に示した指定変数表の一例を示す説明図である。 図7は、選択装置の機能的構成例を示すブロック図である。 図8は、主成分分析の一例を示す説明図である。 図9は、主成分分析結果の一例を示す説明図である。 図10は、固有ベクトル解析部によってクラスタリングされた固有ベクトルクラスタ表を示す説明図である。 図11は、因子負荷量クラスタ表の一例を示す説明図である。 図12は、因子負荷量マップの一例を示す説明図である。 図13は、図12に示した各変数の負荷判定指標を示すグラフの一例を示す説明図である。 図14は、クラスタと負荷量判定指標閾値との関係を示す説明図である。 図15は、変数選択結果出力画面の一例を示す説明図である。 図16は、一致率出力画面の一例を示す説明図である。 図17は、変数選択結果出力画面の他の例を示す説明図である。 図18は、選択装置による変数選択処理手順例を示すフローチャートである。 図19は、図18に示した因子負荷量解析(ステップS1805)における固有ベクトルクラスタリングによる変数選択の詳細な処理手順例を示すフローチャートである。 図20は、図19に示したステップS1903の負荷量判定指標の最大値dj[I]の算出処理手順例を示すフローチャートである。 図21は、因子負荷量クラスタ表の他の例を示す説明図である。 図22は、因子負荷量マップの他の例を示す説明図である。 図23は、図22に示した各変数の負荷判定指標を示すグラフの一例を示す説明図である。
<選択システムのシステム構成例>
図1は、選択システムのシステム構成例を示すブロック図である。選択システム100は、1以上の製造装置102と、1以上の品質検査装置103と、選択装置101と、を有する。選択装置101と、1以上の製造装置102とは、ともに選択装置の観測対象であり、ネットワーク104を介して通信可能に接続される。選択装置101と、1以上の品質検査装置103とは、ネットワーク104を介して通信可能に接続される。1以上の品質検査装置103および1以上の品質検査装置103は、製造業の製造ラインを構成する。
なお、本実施例では、説明の便宜上、1台の製造装置102または品質検査装置103を観測対象とした場合、当該観測対象が1つの変数に対応するが、1つの観測対象が複数の変数に対応してもよい。また、1台の装置(製造装置102、品質検査装置103)に複数の観測対象が存在してもよい。
選択装置101は、観測対象からのデータ群が取り得る値の範囲である変数を選択する装置である。選択装置101は、たとえば、当該製造ラインにおいて、1以上の製造装置102から稼働ログデータと、1以上の品質検査装置103から製造装置102が製造した製品の品質検査結果データとを、入力データ群105として取得する。また、選択装置101は、変数選択条件106を設定する。そして、選択装置101は、各装置および製品の異常を検知するために主成分分析の変数群から選択された選択変数リスト107を出力する。このように、選択装置101は、主成分分析から得られる大量の変数群から適切な変数群を効率的に選択する。
図2は、選択装置101のハードウェア構成例を示すブロック図である。選択装置101は、プロセッサ201と、記憶デバイス202と、入力デバイス203と、出力デバイス204と、通信インターフェース(通信IF)205と、を有する。プロセッサ201、記憶デバイス202、入力デバイス203、出力デバイス204、および通信IF205は、バス206により接続される。プロセッサ201は、選択装置101を制御する。記憶デバイス202は、プロセッサ201の作業エリアとなる。また、記憶デバイス202は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス202としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス203は、データを入力する。入力デバイス203としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス204は、データを出力する。出力デバイス204としては、たとえば、ディスプレイ、プリンタがある。通信IF205は、ネットワーク104と接続し、データを送受信する。
図3は、図1に示した入力データ群105の一例を示す説明図である。入力データ群105は、M×N個のデータ集合である。X1〜X13は、M=13個の変数である。M(M>1の整数)は変数の個数である。N(N>1の整数)は、変数X1〜X13のデータ群の個数である。ここでは、例として、入力データ群105は、12台の製造装置102と1台の品質検査装置103から時系列に得られる稼働ログデータおよび品質検査結果データを示す。
図4は、図1に示した変数選択条件106の一例を示す説明図である。変数選択条件106は、選択装置101が主成分分析から得られる大量の変数群から適切な変数群を効率的に選択するための条件である。変数選択条件106は、たとえば、(1)選択数P(0<P<Mの整数)、(2)累積寄与率基準値C%、(3)負荷量判定基準値、(4)クラスタ数K、(5)ラベル指定表、(6)指定変数表、を含む。
(1)選択数P(<M)は、選択装置101が選択する変数の個数である。(2)累積寄与率基準値C%は、主成分数を決めるための閾値であり、主成分でデータがどのくらいの割合で表現されているかを示す値である。累積寄与率基準値は、たとえば、通常、C=70%〜80%以上の値で指定される。累積寄与率基準値に替えて、固有値の閾値が指定されてもよい。後述する図7のデータ基準化処理部701で分散が1となるように基準化されるため、固有値が1未満となる場合、すなわち、もともと持っている分散より小さくなる場合には、その主成分には意味がない。したがって、固有値1未満の主成分を採用しない、と指定されてもよい。
負荷量判定基準値は、後述する図7の因子負荷量解析部705が変数を選択する際の閾値である。因子負荷量解析部705は、負荷量判定基準値より大きい値を示す変数を選択する。クラスタ数Kは、後述する図6の固有ベクトル解析部704が変数をクラスタリングする際に指定するクラスタの個数である。
ラベル指定表は、同じ条件で選択された複数の変数の選択優先順を指定する表データである。指定変数表は、熟練の管理者や技術者の知見に基づいて、監視すべき変数とその属性の組である項目を指定する表データである。
図5は、図4に示したラベル指定表の一例を示す説明図である。ラベル指定表500は、変数(variable)501と、変数属性(attribute)502と、優先ラベル(preferred)503と、を有する。変数501は、変数のインデックスを格納する。変数属性502は、変数の属性を格納する。優先ラベル503は、変数を優先すべきか否かを示すラベルを格納する。優先ラベル503は、入力デバイス203を介して設定される。たとえば、変数X1の変数属性502は「監視対象Aの温度」であり、優先ラベル503が付与されている。たとえば、温度Aは低コストで測定が簡単、あるいは、温度制御しやすい、といった業務上の理由で指定されている。ラベル指定表500は、後述する図7のラベル判定部706が、優先ラベル因子を優先して選択するために使用される。
図6は、図4に示した指定変数表の一例を示す説明図である。指定変数表700は、変数(variable)501と、変数属性(attribute)502と、指定ラベル(essential)603と、を有する。指定ラベル603は、変数を指定すべきか否かを示すラベルを格納する。指定ラベル603は、入力デバイス203を介して設定される。たとえば、変数X1の変数属性502は「監視対象Aの温度」であり、指定ラベル603が付与されている。指定変数表700では、製造メカニズムに基づき、異常検知するために監視すべき項目(変数501と変数属性502の組)として、業務上定義されている項目が指定される。あるいは、製造装置102または品質検査装置103の構成が変更された場合や、監視対象が追加されたことで新たに監視パラメータを選択する必要がある場合に、今まで監視していた項目が指定されてもよい。指定変数表600は、後述する図7の変数判定部707が、変数選択部708が選択した変数群との一致率を計算するために使用される。
<選択装置101の機能的構成例>
図7は、選択装置101の機能的構成例を示すブロック図である。選択装置101は、データ基準化処理部701と、主成分分析部702と、累積寄与率判定部703と、固有ベクトル解析部704と、因子負荷量解析部705と、ラベル判定部706と、変数判定部707と、変数選択部708と、を有する。これらは、具体的には、たとえば、図1に示した記憶デバイス202に記憶されたプログラムをプロセッサ201に実行させることで実現される機能である。
データ基準化処理部701は、データ基準化処理を実行する。具体的には、たとえば、M×N個の入力データ群105を、分散が1でかつ平均が0のデータに正規化する。正規化された入力データ群105を、第1入力データ群105と称す。
主成分分析部702は、データ基準化処理部701によって正規化された第1入力データ群105を用いて主成分分析を実行し、主成分分析結果を出力する。
累積寄与率判定部703は、累積寄与率判定を実行する。具体的には、たとえば、累積寄与率判定部703は、累積寄与率C%を示す上位主成分M’個を選択する。
図8は、主成分分析の一例を示す説明図である。(A)は、入力データ群105をX1,X2,X3の3変数の3次元データとして示す。主成分分析部702は、データ集合のうち、分散の一番大きい方向に第1主成分(PC1)を定義し、その直線に垂直に交わる直線のうち、最も大きい分散を示す直線を第2主成分(PC2)と定め、以下、同様に第3主成分、第4主成分、…と定義する。主成分分析部702は、第1主成分から順に、入力データ群105の特徴を反映する。(B)は、主成分分析によって定義された新たな軸PC1,PC2上にデータを変換してプロットした主成分スコアである。
図9は、主成分分析結果の一例を示す説明図である。主成分分析結果730は、固有値表901と、固有ベクトル表902と、を有する。固有値表901は、主成分911と、固有値912と、寄与率913と、累積寄与率914と、を有する。固有値912は、その主成分911が持つ情報量である。ここでは、主成分911は、固有値912が大きい順に、第1主成分(PC1)、第2主成分(PC2)、…、第13主成分(PC13)と命名する。寄与率913は、その主成分911が全データに占める割合を示す。具体的には、たとえば、寄与率913は、その主成分911の固有値912を、固有値912の合計で除算した値となる。
累積寄与率914は、固有値912の大きい主成分911から順に寄与率913を累積した値である。たとえば、通常全体の70%から80%を示す累積寄与率914までの主成分911を採用して、縮約した次元数とする。たとえば、固有値表901の例では、累積寄与率914が、70%を超える第5主成分までの主成分911を採用し、入力データ群105は、第1入力データ群105のM=13次元から主成分分析後のM’=5次元空間で次元圧縮されたデータ群となる。
固有ベクトル表902は、主成分PC1〜CP13ごとに、固有ベクトル921〜9213を格納する。固有ベクトルは、第1入力データ群105の相関行列から計算される。固有ベクトルの各要素の絶対値の大小は、主成分911に対する変数の寄与の大きさを表す。当該主成分911の特徴は、固有ベクトル要素絶対値が大きい変数の特徴を持っており、かつ固有ベクトル要素絶対値の大きい変数同士の相関が高いことを示している。たとえば、第1主成分PC1の固有ベクトル921の中で絶対値の大きい変数X4(−0.409)、X5(−0.461)、X6(0.454)が、第1主成分PC1の特徴に寄与する。
固有ベクトル解析部704は、固有ベクトル解析を実行する。具体的には、たとえば、固有ベクトル解析部704は、固有ベクトル表902の固有ベクトル群を解析して、固有ベクトル群をクラスタリングする。固有ベクトル解析部704は、たとえば、変数選択条件106のクラスタ数Kを用いて、k−meansクラスタリング法によりクラスタリングを実行する。
図10は、固有ベクトル解析部704によってクラスタリングされた固有ベクトルクラスタ表740を示す説明図である。固有ベクトルクラスタ表740は、累積寄与率判定部703により、固有ベクトル表902から、変数501および第1主成分PC1〜第5主成分PC5の固有ベクトル921〜925を抽出したデータ群を有する。また、固有ベクトルクラスタ表740は、固有ベクトルの要素でクラスタリングしたクラスタ番号(cluster)1000を有する。
固有ベクトル解析部704は、変数X1〜X13の各固有ベクトル(第1主成分PC1〜第5主成分PC5の値)と、変数選択条件106のクラスタ数K=5とにより、K−meansクラスタリング法で分類する。これにより、たとえば、変数X1,X8,X11は、クラスタ番号1に分類され、類似の特性を持った変数といえる。同様に、変数X6,X7,X19,X13はクラスタ番号2に分類される。
因子負荷量解析部705は、因子負荷量解析を実行する。具体的には、たとえば、因子負荷量解析部705は、負荷量判定指標が大きい変数を各クラスタから選択する。具体的には、たとえば、因子負荷量解析部705は、図10に示した固有ベクトルクラスタ表740の固有ベクトルの値を正規化することにより、因子負荷量を算出する。
図11は、因子負荷量クラスタ表の一例を示す説明図である。因子負荷量クラスタ表750は、変数501と、入力データ群105における第1主成分PC1〜第5主成分PC5の因子負荷量1101〜1105と、第1最大値1111と、第2最大値1112と、クラスタ番号1000と、を有する。第1最大値1111は、同一変数の因子負荷量のうち絶対値の最大値となる値である。第2最大値1112は、同一変数の因子負荷量のうち2番目に大きい絶対値となる値である。
因子負荷量は、各主成分がどの変数に関係が深いかを考察するときに利用される。因子負荷量は、下記式により算出され、変数Xiと主成分軸PCjとの相関係数に相当する。
Figure 2018092317
図12は、因子負荷量マップの一例を示す説明図である。因子負荷量マップ1200は、図11で求めた第1最大値1111を横軸とし、第2最大値1112を縦軸として、半径1の円1201の中にプロットしたマップである。内側の破線円1202が、負荷量判定指標閾値に相当する。原点(0,0)から各変数X1〜X13までの距離が負荷量判定指標である。X1からX13は変数を示し、5クラスタに色分けされる。
変数Xiに対する負荷判定指標をd(Xi)、負荷量の最大値をmax(i)、2番目に大きい負荷量をmax2(i)とすると、負荷判定指標d(Xi)は、下記式で表現される。
負荷判定指標d(Xi)=√((max(i))+max2(i)
図13は、図12に示した各変数X1〜X13の負荷判定指標dk(kはクラスタ番号)を示すグラフの一例を示す説明図である。グラフ1300において、負荷判定指標d1〜d5は、それぞれ、因子負荷量マップ1200の原点(0,0)から該当するクラスタに所属する変数X1〜X13までの距離である。破線1301は、負荷量判定指標閾値である。図12の因子負荷量マップ1200と図13のグラフ1300とが表示画面に表示されている場合、入力デバイス203で、因子負荷量マップ1200の破線円1202を拡縮させると、グラフ1300の破線1301も連動して左右に移動する。逆に、入力デバイス203で、グラフ1300の破線1301も連動して左右に移動させると、因子負荷量マップ1200の破線円1202を拡縮する。
図14は、クラスタと負荷量判定指標閾値との関係を示す説明図である。(A)の因子負荷量マップ1200には、破線円1202の半径da(0<da<1)を内側の円とし、当該破線円1202と、半径1の外側の円1401と、の間に環状領域1400が設定される。C1A〜C3Aは、クラスタである。因子負荷量解析部705は、環状領域1400に存在する変数のうち、一番外側の変数を選択する。一番外側の変数を選択するのは、主成分への寄与が高いからである。因子負荷量解析部705は、クラスタC1から、因子負荷量マップ1200の原点(0,0)から一番遠い、一番外側の変数Xmを選択する。同様に、因子負荷量解析部705は、クラスタC2から変数X3、クラスタC3から変数X4を選択する。
主成分への寄与のより高い変数を選択したい場合、(B)に示したように、因子負荷量マップ1200において、たとえば、ユーザ操作により、半径daが大きくなるように変更される。これにより、外側の円1401と破線円1202との間の環状領域1400の面積が小さくなり、環状領域1400に存在する変数の個数が少なくなる。たとえば、(A)のクラスタC2Aは、(B)ではクラスタC2Bとなり、このクラスタC2Bの中で一番外側に存在する変数X3も、環状領域1400から外れる。
この場合、因子負荷量解析部705は、クラスタC2Bを却下し、クラスタC2Bから変数を選択しない。変数の選択数が足りない場合には、因子負荷量解析部705は、変数の個数が最大のクラスタから2番目に外側に存在する変数を選択する。たとえば、因子負荷量解析部705は、クラスタC1Bから2番目の変数X1を選択する。このように、因子負荷量解析部705によって選択された変数が、後述する推奨(Recommended)変数となる。
ラベル判定部706は、ラベル判定を実行する。具体的には、たとえば、ラベル判定部706は、図5に示したラベル指定表500を参照し、各変数が制御可能な因子であるか否かを判定する。ラベル判定部706は、制御可能な因子であれば、当該因子に該当する変数を優先的に選択する。具体的には、たとえば、ラベル判定部706は、図5に示したラベル指定表500の優先ラベル503が設定されている変数を選択する。図5の例では、変数X1、X4、X5、X7が選択される。
変数判定部707は、変数判定を実行する。具体的には、たとえば、変数判定部707は、図6に示した指定変数表600を参照し、一致率(agreement rate)を算出する。一致率は、指定変数表600において指定ラベルが付与された項目を含む指定変数の個数を分母とし、指定変数で、かつ、因子負荷量解析部705で選択された推奨変数である個数を分子とした場合の割合である。
変数選択部708は、変数選択を実行する。具体的には、たとえば、変数選択部708は、入力デバイス203を操作することにより、変数を選択する。また、変数選択部708は、変数選択結果と一致率とを出力して、画面に表示させる。
図15は、変数選択結果出力画面の一例を示す説明図である。変数選択結果出力画面1500は、変数501と、変数属性502と、クラスタ1000と、指定ラベル603と、優先ラベル503と、推奨ラベル1501と、選択ラベル1502と、を表示する。推奨ラベル1501は、因子負荷量解析部705で選択されたか否かを示すラベルを格納する。図15では、変数X1、X2、X5、X7、X8が因子負荷量解析部705で選択されたことを示す。すなわち、変数X1、X2、X5、X7、X8は、推奨変数である。選択ラベル1502は、変数選択部708で選択されたか否かを示すラベルを格納する。変数選択結果出力画面1500は、図7に示した選択変数リスト107である。
図16は、一致率出力画面の一例を示す説明図である。一致率出力画面1700は、一致率を表示する。図15の例では、指定変数は、変数X1、X2、X4、X7の4個である。推奨変数は、変数X1、X2、X5、X7、X8の5個である。指定変数で、かつ、推奨変数は、変数X1、X2、X7の3個である。したがって、一致率は、3/4=75%となる。
ユーザは、推奨変数と指定変数とを比較し、選択変数として、変更することができる。たとえば、変数X5(Electric Power 2)はRecommendedとして選択され、変数X4(Electric Power 1)は選択されていない。クラスタ1000が同じクラスタ番号であれば、類似している変数と捉えることができるため、ユーザは、同じクラスタ番号1に属する変数X4と変数X5のうちどちらかを選択すればよい。Essentialとして指定している変数X4の方が、通常から監視対象であり、ユーザになじみ深い変数であれば、変数X5を却下して、変数X4を選択することが可能である。
図17は、変数選択結果出力画面1500の他の例を示す説明図である。図17は、変数選択結果出力画面1500がフィルタリングされた状態を示す。変数501が増加すると、一画面で、出力結果を検討することが困難になる。図15の各フィールドのフィルタリングボタンのうちいずれかのフィルタリングボタンが押下された場合、当該フィルタリングボタンが押下されたフィールドでソートされる。図17は、図15において、クラスタ1000のフィルタリングボタンが押下されたことで、クラスタ番号がソートされた状態を示す。クラスタ1000を吟味したいときには、クラスタ1000をフィルタリングし、同一クラスタ内の類似変数の変数属性やラベルを比較評価することが可能になる。
<変数選択処理手順例>
図18は、選択装置101による変数選択処理手順例を示すフローチャートである。選択装置101は、データ基準化処理部701により、データ基準化処理を実行し(ステップS1801)、主成分分析部702により、主成分分析を実行する(ステップS1802)。また、選択装置101は、累積寄与率判定部703により、累積寄与率判定を実行し(ステップS1803)、固有ベクトル解析部704により、固有ベクトル解析を実行する(ステップS1804)。また、選択装置101は、因子負荷量解析部705により、因子負荷量解析を実行し、ラベル判定部706により、ラベル判定を実行する。また、選択装置101は、変数判定部707により、変数判定を実行し、変数選択部708により、変数選択を実行する。
図19は、図18に示した因子負荷量解析(ステップS1805)における固有ベクトルクラスタリングによる変数選択の詳細な処理手順例を示すフローチャートである。なお、図19において、変数の個数をM、選択した変数の個数をP、負荷量判定基準値をd0、ある変数Xi(1≦i≦M)に対する負荷量判定指標d(Xi),クラスタ数をKとする。
まず、選択装置101は、各クラスタj(1≦j≦K)に含まれる変数のうち負荷量判定基準値d0以上より大きい変数の個数を計算し、各クラスタjに対し、d(Xi)≧d0を示す変数Xiがクラスタjに含まれる数をカウントし、N0(j)とする(ステップS1901)。
選択装置101は、変数が一つ以上含まれる、N0(j)>0のクラスタを有効クラスタとし、有効クラスタ数をKvalidとする(ステップS1902)。ただし、有効クラスタ数Kvalid≦クラスタ数Kとする。つぎに、選択装置101は、各有効クラスタに対し、当該有効クラスタに含まれる変数のうち、負荷量判定指標の最大値dj[I]を求める(ステップS1903)。
選択装置101は、変数選択数Pが有効クラスタ数Kvalidより小さいか否かを判断する(ステップS1904)。
小さい場合(ステップS1904:Yes)、選択装置101は、各クラスタjの負荷量判定指標最大値dj[I]を降順にソートし(ステップS1905)、大きい順にP個のクラスタから各々変数XIを選択する(ステップS1906)。これにより、固有ベクトルクラスタリングによる変数選択を終了する。
一方、小さくない場合(ステップS1904:No)、選択装置101は、変数選択数Pが有効クラスタ数Kvalidに一致するか否かを判断する(ステップS1907)。
一致する場合(ステップS1907:Yes)、選択装置101は、各クラスタjの負荷量判定指標最大値dj[i]を示す変数XIを、各々クラスタから1個ずつ選択する(ステップS1908)。これにより、固有ベクトルクラスタリングによる変数選択を終了する。
一方、一致しない場合(ステップS1907:No)、変数選択数Pは有効クラスタ数Kvalidより大きいことになる。したがって、選択装置101は、各クラスタjの負荷量判定指標最大値dj[I]を示す変数XIを、各々クラスタから1個ずつ選択する(ステップS1909)。
そして、選択装置101は、ステップS1904と同様、変数選択数Pが有効クラスタ数Kvalidより小さいか否かを判断する(ステップS1910)。
小さくない場合(ステップS1910:No)、選択装置101は、未選択の残余の変数のうち、各クラスタに含まれる負荷量判定指標d(Xi)の最大値dj[I’]を示す変数XI’を選択する(ステップS1911)。そして、選択装置101は、変数選択数Pから有効クラスタ数Kvalidを減算して変数選択数Pを更新し(ステップS1912)、ステップS1910に戻る。
小さい場合(ステップS1910:Yes)、ステップS1905に移行して、選択装置101は、残りのP個の変数を選択することになる。
図20は、図19に示したステップS1903の負荷量判定指標の最大値dj[I]の算出処理手順例を示すフローチャートである。選択装置101は、クラスタjをj=1とし(ステップS2001)、j≦Kであるか否かを判断する(ステップS2002)。j≦Kである場合(ステップS2002:Yes)、選択装置101は、j≦Kである場合(ステップS2002:Yes)、クラスタjの変数の個数N0(j)が、N0(j)>0であるか否かを判断する。
N0(j)>0でない場合(ステップS2003:No)、すなわち、クラスタjの変数の個数N0(j)が0個である場合、選択装置101は、jをインクリメントして(ステップS2006)、ステップS2002に戻る。
一方、N0(j)>0である場合(ステップS2003:Yes)、選択装置101は、クラスタjに存在する変数Xiの負荷量判定指標d(Xi)を算出する(ステップS2004)。ただし、iは、1≦i≦N0(j)である。そして、選択装置101は、負荷量判定指標d(Xi)の最大値dj[I]=max(d(Xi))を計算する(ステップS2005)。そして、選択装置101は、jをインクリメントして(ステップS2006)、ステップS2002に戻る。ステップS2002において、j≦Kでない場合(ステップS2002:No)、ステップS1904に移行する。
また、上述した因子負荷量解析において、因子負荷量マップ1200のプロット対象を第1主成分および第2主成分としてもよい。累積寄与率により、累積寄与率判定では、第5主成分まで採用される。
図21は、因子負荷量クラスタ表750の他の例を示す説明図である。因子負荷量クラスタ表750は、変数501と、入力データ群105における第1主成分PC1〜第5主成分PC5の因子負荷量1101〜1105と、クラスタ番号1000と、負荷量判定指標2100と、を有する。負荷量判定指標2100の値d(以下、負荷量判定指標d)は、第1主成分PC1〜第5主成分PC5の各値を要素とするベクトルの長さである。
変数Xiの負荷量判定指標をd(Xi)、第1主成分PC1に対応する因子負荷量をPC1i,第2主成分PC2に対応する因子負荷量をPC2i,第3主成分PC3に対応する因子負荷量をPC3i,第4主成分PC4に対応する因子負荷量をPC4i,第5主成分PC5に対応する因子負荷量をPC5iとする。変数Xiの負荷量判定指標d(Xi)は、下記式で表現される。
d(Xi)=√(PC1i+PC2i+PC3i+PC4i+PC5i
図22は、因子負荷量マップの他の例を示す説明図である。因子負荷量マップ2200は、第1主成分を横軸2201とし、第2主成分を縦軸2202とする。因子負荷量マップ2200には、各変数の第1主成分(PC1)1101の値である因子負荷量と、第2主成分(PC2)1102の値である因子負荷量と、がプロットされる。円2203は、半径1の円である。第1主成分(PC1)1101は、円2203と交わる横軸2201の値1または−1に近い変数の特徴を持つ。第2主成分は、半円2203と交わる縦軸2202の値1または−1に近い変数の特徴を持つ。
図23は、図22に示した各変数X1〜X13の負荷判定指標dk(kはクラスタ番号)を示すグラフの一例を示す説明図である。グラフ2300において、負荷判定指標d1〜d5は、それぞれ、因子負荷量マップ2200の原点(0,0)から該当するクラスタに所属する変数X1〜X13までの距離である。破線2301は、負荷量判定指標閾値である。入力デバイス203で、破線2301を左右に動かすことによって、負荷量判定指標閾値を変更することができる。負荷量判定指標閾値を変更することにより、選択対象の変数の個数を変更することができる。たとえば、各クラスタに属する変数のうち、閾値より大きく、かつ一番大きい変数が選択される。
以上説明したように、本実施例にかかる選択装置は、複数の変数に対応する複数のデータ群の各々について変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成する。ここで、複数のデータ群とは、たとえば、上述した入力データ群105である。複数のデータ群の各データ群は、各変数に対応する。代表データとは、たとえば、図10に示した第1主成分PC1〜PC5の要素の集合、すなわち、固有ベクトルである。本例では、代表データは、上述したように、図9に示した固有値表901によって第1主成分PC1〜第13主成分PC15を第1主成分PC1〜PC5に絞り込むことによって決定される。
選択装置は、代表データ群の各データの第1特徴を規定する第1成分に関する第1軸(因子負荷量マップ1200の横軸)および第2特徴を規定する第2成分に関する第2軸(因子負荷量マップ1200の縦軸)により構成される座標平面に、代表データ群を与えて因子負荷量マップ1200を生成する。第1特徴とは、たとえば、上述した例では、第1主成分PC1〜第5主成分PC5の因子負荷量1101〜1105の最大値である。第2特徴とは、第1主成分PC1〜第5主成分PC5の因子負荷量1101〜1105の2番目に高い値である。第1成分とは、最大値の因子負荷量についての主成分であり、第2成分とは、2番目に高い因子負荷量についての主成分である。
選択装置は、因子負荷量マップ1200上の原点(0,0)を中心とする円1202に基づいて、クラスタに所属する1以上の代表データの中から特定の代表データをクラスタごとに選択することにより、特定の代表データが代表する特定の変数を選択する。
これにより、数千から数万といった大規模な変数が与えられた場合においても、数十から数百の適切な変数を機械的に、かつ、容易に選択することが可能になる。
また、上述した実施例では、選択装置は、因子負荷量マップにおいて円外の最大値を示す変数を選択することとしたが、縦軸および横軸の成分が小さいほど良い変数を示す場合、円内の最小値を示す変数を選択することになる。
また、複数の変数の中から優先すべき1以上の変数を特定した優先情報として、ラベル指定表500を用いることにより、選択装置101は、ラベル指定表で優先的に特定された変数を含むように選択する。これにより、変数の優先的な選択が可能となる。
また、複数の変数の中から1以上の変数を指定した指定情報として、指定変数表600を用いることにより、指定された変数群のうち特定の変数がどの程度含まれているかを示す割合(一致率)を算出する。したがって、業務知識など過去の経験知による変数選択の妥当性を提示することで、決定木分析による条件分類やSupport Vector Machine(SVM)による異常判定などの分析にかける変数を、選択しやすくなる。たとえば、指定変数表600において過去に選択された変数に指定ラベルを付与すると、過去の履歴との一致度を確認することができる。
また、因子負荷量マップ1200(2200)の円の半径とグラフ1300(2300)のしきい値とを連動させることで、ユーザの利便性の向上を図ることができる。
また、選択装置101は、複数の観測対象からの複数の観測データ群を用いた主成分分析により、変数に対応する観測データ群を第1成分および第2成分を含む複数の成分で構成されるデータ群に変換する。選択装置101は、変換された複数のデータ群の各々について変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成する。このように、データが変換されても容易かつ適切に変数を選択することができる。したがって、分析者のスキルや業務知識が必要で、かつ、時間のかかっていた分析や変数選択の工数を、大幅に軽減することができる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

Claims (9)

  1. 観測対象からのデータ群が取り得る値の範囲である変数を選択する選択装置であって、
    プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有し、
    前記プロセッサは、
    複数の前記変数に対応する複数の前記データ群の各々について前記変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成し、
    前記代表データ群の各データの第1特徴を規定する第1成分に関する第1軸および第2特徴を規定する第2成分に関する第2軸により構成される座標平面に、前記代表データ群を与えてマップを生成し、
    前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データの中から特定の代表データを前記クラスタごとに選択することにより、前記特定の代表データが代表する特定の変数を選択する、
    処理を実行することを特徴とする選択装置。
  2. 請求項1に記載の選択装置であって、
    前記第1成分および前記第2成分は、前記原点から離れるほど選択する価値が高い特徴を示し、
    前記プロセッサは、
    前記円の外側において、前記クラスタに所属する1以上の代表データの中から前記原点から最も離れた代表データを前記特定の代表データとして前記クラスタごとに選択する、
    処理を実行することを特徴とする選択装置。
  3. 請求項1に記載の選択装置であって、
    前記第1成分および前記第2成分は、前記原点に近づくほど選択する価値が高い特徴を示し、
    前記プロセッサは、
    前記円の内側において、前記クラスタに所属する1以上の代表データの中から前記原点から最も近い代表データを前記特定の代表データとして前記クラスタごとに選択する、
    処理を実行することを特徴とする選択装置。
  4. 請求項1に記載の選択装置であって、
    前記記憶デバイスは、前記複数の変数の中から優先すべき1以上の変数を特定した優先情報を記憶しており、
    前記プロセッサは、
    前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データの中から、前記優先情報によって特定された変数に関する代表データを前記特定の代表データとして前記クラスタごとに選択する、
    処理を実行することを特徴とする選択装置。
  5. 請求項1に記載の選択装置であって、
    前記記憶デバイスは、前記複数の変数の中から1以上の変数を指定した指定情報を記憶しており、
    前記プロセッサは、
    前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データのうち、前記指定情報によって指定された変数に関する代表データの個数と、前記特定の代表データの個数と、に基づいて、前記変数の一致度を算出する、
    処理を実行することを特徴とする選択装置。
  6. 請求項1に記載の選択装置であって、
    前記プロセッサは、
    前記マップ上の前記代表データ群の各々について、前記原点と前記代表データとの間の距離と、前記円の半径に対応する前記距離のしきい値と、を示す棒グラフを生成し、
    前記円の半径または前記しきい値のうちいずれか一方の大きさを変更すると、他方の大きさを連動して変更する、
    処理を実行することを特徴とする選択装置。
  7. 請求項1に記載の選択装置であって、
    前記プロセッサは、
    前記複数の観測対象からの複数の観測データ群を用いた主成分分析により、前記変数に対応する前記観測データ群を前記第1成分および前記第2成分を含む複数の成分で構成される前記データ群に変換し、
    変換された複数の前記データ群の各々について前記変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、前記複数のクラスタを生成する、
    処理を実行することを特徴とする選択装置。
  8. 観測対象からのデータ群が取り得る値の範囲である変数を選択する選択装置による選択方法であって、
    前記選択装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有し、
    前記プロセッサは、
    複数の前記変数に対応する複数の前記データ群の各々について前記変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成し、
    前記代表データ群の各データの第1特徴を規定する第1成分に関する第1軸および第2特徴を規定する第2成分に関する第2軸により構成される座標平面に、前記代表データ群を与えてマップを生成し、
    前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データの中から特定の代表データを前記クラスタごとに選択することにより、前記特定の代表データが代表する特定の変数を選択する、
    処理を実行することを特徴とする選択方法。
  9. 観測対象からのデータ群が取り得る値の範囲である変数の選択をプロセッサに実行させる選択プログラムであって、
    前記プロセッサに、
    複数の前記変数に対応する複数の前記データ群の各々について前記変数を代表する代表データ群を、当該代表データ群の類似性に基づいてクラスタリングすることにより、複数のクラスタを生成し、
    前記代表データ群の各データの第1特徴を規定する第1成分に関する第1軸および第2特徴を規定する第2成分に関する第2軸により構成される座標平面に、前記代表データ群を与えてマップを生成し、
    前記マップ上の原点を中心とする円に基づいて、前記クラスタに所属する1以上の代表データの中から特定の代表データを前記クラスタごとに選択することにより、前記特定の代表データが代表する特定の変数を選択する、
    処理を実行させることを特徴とする選択プログラム。
JP2018551008A 2016-11-21 2016-11-21 選択装置、選択方法、および選択プログラム Active JP6529688B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/084489 WO2018092317A1 (ja) 2016-11-21 2016-11-21 選択装置、選択方法、および選択プログラム

Publications (2)

Publication Number Publication Date
JPWO2018092317A1 true JPWO2018092317A1 (ja) 2019-02-14
JP6529688B2 JP6529688B2 (ja) 2019-06-12

Family

ID=62146344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018551008A Active JP6529688B2 (ja) 2016-11-21 2016-11-21 選択装置、選択方法、および選択プログラム

Country Status (3)

Country Link
US (1) US10846312B2 (ja)
JP (1) JP6529688B2 (ja)
WO (1) WO2018092317A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423080B2 (en) * 2018-07-30 2022-08-23 Sap Se Clustering process for objects using comparison structures
JP6937330B2 (ja) * 2019-03-04 2021-09-22 株式会社東芝 機械学習モデル圧縮システム、機械学習モデル圧縮方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003114713A (ja) * 2001-10-09 2003-04-18 Nippon Steel Corp 品質不良の原因解析方法
JP2007329415A (ja) * 2006-06-09 2007-12-20 Fujitsu Ltd データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP2017138643A (ja) * 2016-02-01 2017-08-10 株式会社神戸製鋼所 解析対象決定装置及び解析対象決定方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544352A (en) * 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
DE19801240A1 (de) * 1998-01-12 1999-07-29 Cybernetic Vision Ag Verfahren und Vorrichtung zur Darstellung und Überwachung von Funktionsparametern eines physiologischen Systems
US7149961B2 (en) * 2003-04-30 2006-12-12 Hewlett-Packard Development Company, L.P. Automatic generation of presentations from “path-enhanced” multimedia
JP4188181B2 (ja) 2003-08-28 2008-11-26 株式会社エヌ・ティ・ティ・データ 多変量データ選択装置および多変量データ選択プログラム
JP4919236B2 (ja) * 2007-03-12 2012-04-18 国立大学法人高知大学 泳動波形を用いた検査値予測装置、予測方法および予測プログラム
US20140297642A1 (en) * 2009-02-10 2014-10-02 Ayasdi, Inc. Systems and methods for mapping patient data from mobile devices for treatment assistance
US8429153B2 (en) * 2010-06-25 2013-04-23 The United States Of America As Represented By The Secretary Of The Army Method and apparatus for classifying known specimens and media using spectral properties and identifying unknown specimens and media
US10120747B2 (en) * 2016-08-26 2018-11-06 International Business Machines Corporation Root cause analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003114713A (ja) * 2001-10-09 2003-04-18 Nippon Steel Corp 品質不良の原因解析方法
JP2007329415A (ja) * 2006-06-09 2007-12-20 Fujitsu Ltd データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP2017138643A (ja) * 2016-02-01 2017-08-10 株式会社神戸製鋼所 解析対象決定装置及び解析対象決定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JOLLIFFE,IAN: ""Discarding Variables in a Principal Component Analysis. I: Artificial Data"", JOURNAL OF THE ROYAL STATISTICAL SOCIETY. SERIES C (APPLIED STATISTICS), vol. 第21巻,第2号, JPN6019013922, 1972, pages 160 - 173, ISSN: 0004020125 *
MITRA, PABITRA: ""Unsupervised feature selection using feature similarity"", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 第24巻,第3号, JPN6019013925, 7 August 2002 (2002-08-07), pages 301 - 312, ISSN: 0004020126 *

Also Published As

Publication number Publication date
WO2018092317A1 (ja) 2018-05-24
JP6529688B2 (ja) 2019-06-12
US20200293555A1 (en) 2020-09-17
US10846312B2 (en) 2020-11-24

Similar Documents

Publication Publication Date Title
JP6555061B2 (ja) クラスタリングプログラム、クラスタリング方法、および情報処理装置
US8812274B2 (en) Methods for mapping data into lower dimensions
JP5242959B2 (ja) 異常要因特定方法およびシステム、上記異常要因特定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
JP5823943B2 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP2015184942A (ja) 故障原因分類装置
EP2333629A1 (en) Error detection method and system
CN110352389B (zh) 信息处理装置及信息处理方法
US20180137129A1 (en) Retrieving device, retrieving method, and retrieving program
WO2022038804A1 (ja) 診断装置及びパラメータ調整方法
JP6586764B2 (ja) データ分析装置及びデータ分析方法
JP6529688B2 (ja) 選択装置、選択方法、および選択プログラム
JP2021192155A (ja) 異常検知支援プログラム、異常検知支援方法および異常検知支援システム
JP2018124851A (ja) 支援装置および支援方法
KR101777387B1 (ko) 고장발생기간 기반 데이터 분석 장치
WO2020262353A1 (ja) 異常検知装置および異常検知方法
JP5668425B2 (ja) 障害検知装置、情報処理方法、およびプログラム
CN113518983A (zh) 用于处理大宽数据的过程控制工具
JP7272582B2 (ja) 類似材料検索システム、試験装置およびコンピュータプログラム
US11507961B2 (en) Fabricated data detection method
Nanditha et al. Optimized defect prediction model using statistical process control and Correlation-Based feature selection method
Schmidt et al. Human-Based and Automatic Feature Ideation for Time Series Data: A Comparative Study
KR101777386B1 (ko) 고장발생기간 기반 데이터 분석 방법
Shen et al. Machine learning based anomaly detection and diagnosis method of spinning equipment driven by spectrogram data
JP2020166443A (ja) データ加工方法レコメンドシステム、データ加工方法レコメンド方法、及びデータ加工方法レコメンドプログラム
US20220284061A1 (en) Search system and search method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190514

R150 Certificate of patent or registration of utility model

Ref document number: 6529688

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150