JP2020154891A - 外れ値要因推定支援装置、外れ値要因推定支援方法及び外れ値要因推定支援プログラム - Google Patents
外れ値要因推定支援装置、外れ値要因推定支援方法及び外れ値要因推定支援プログラム Download PDFInfo
- Publication number
- JP2020154891A JP2020154891A JP2019053875A JP2019053875A JP2020154891A JP 2020154891 A JP2020154891 A JP 2020154891A JP 2019053875 A JP2019053875 A JP 2019053875A JP 2019053875 A JP2019053875 A JP 2019053875A JP 2020154891 A JP2020154891 A JP 2020154891A
- Authority
- JP
- Japan
- Prior art keywords
- data
- variable
- outlier
- factor
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
しかし、データが多種多様となると、要因を見つけるまでに時間がかかる上、外れ値毎に要因を探っていったのでは、工数が増大してしまうという課題がある。そこで、これらの作業を自動化することで分析の精度向上と作業の効率向上を図ることが行われている。
特許文献1には、「熱処理プレートによる処理温度の測定によって得られた温度データに基づいて、所定の現象が起きたか否かを判定する現象判定過程(ステップS401、S403、S411、S421、S431、S432)と、現象が起きたと現象判定過程が判定した場合には、起きたと判定された現象の原因、および、その原因を解消するための対策の少なくともいずれかを推定する推定過程(ステップS402、404、412、422、433)と、を備えている」分析方法、分析装置および基板処理装置が開示されている(要約参照)。
特許文献2では、ベイジアンネットワークモデルが用いられている。ここで、ベイジアンネットワークモデルは異常(閾値を超える場合)事象において共通条件を抽出している。そのため、ある一定以上の異常の数が必要である。
特許文献3に記載の発明では、高次元のデータを散布図にプロットし、データを可視化することが困難であるため、高次元のデータを低次元(2次元)のデータに圧縮している。このようにすることで、二次元のデータを散布図にプロットし、データの可視化が可能となっている。しかし、高次元のデータを低次元に圧縮する際に、データの正確性が失われるおそれがある。
その他の解決手段は実施形態において適宜記載する。
図1は、本実施形態に係る要因推定装置1の構成例を示す機能ブロック図である。
要因推定装置1は、PC(Personal Computer)等である。そして、図1に示すように、要因推定装置1は、メモリ100、CPU(central Processing Unit)131、HD(Hard Disk)等の記憶装置120、キーボードや、マウス等の入力装置132、ディスプレイ等の表示装置133を有する。
また、記憶装置120に格納されているプログラムがメモリ100にロードされ、CPU131によって実行される。これによって、処理部110、処理部110を構成する距離算出処理部111、ランキング表示処理部112、登録処理部113が具現化する。
ここで、図2を参照して記憶装置120に格納されている計測データ121について説明する。
図2は、本実施形態で使用される計測データ121の一例を示す図である。
図2の例では、計測データ121は、レコード(第2項目)R1〜R10を有し、カラム(第1項目)C1〜C8を有している。それぞれのカラムC1〜C8は、「交換回数」、「機械使用時間」、「変数A」、「変数B」、・・・、「変数F」に対応している。なお、「交換回数」とは「部品の交換回数」である。本実施形態では、「交換回数」、「機械使用時間」、「変数A」、「変数B」、・・・を、変数と称する。
計測データ121の各フィールドに入力されているデータは、図示しない所定の計測器から取得したり、ユーザが手動で入力したものである。
図3は、図2の計測データ121の内、「交換回数」と、「機械使用時間」とが、それぞれを軸とする散布図として表示装置133に表示されたものである。図3では、散布図に回帰直線が加わっている。なお、「変数A」、「変数B」、・・・、「変数F」は、散布図には示されていない。
この外れ値は、図2の網掛けで示されているレコードR2に対応しているものとする。本実施形態では、図3の符号201のような外れ値が生じた理由(要因)を、散布図に示されていない「変数A」、「変数B」、・・・、「変数F」から探ることを目的とする。
過去統計データ122は、過去において外れ値が生じた要因と、その外れ値が生じた際のデータの基礎統計量(過去基礎統計量)が対応付けられて格納されている。なお、過去統計データ122については後記する。
(全体処理)
図4は、本実施形態における要因推定装置1の処理手順を示すフローチャートである。
まず、処理部110によって図3に示すような散布図が表示される(S1)。
そして、マウス等の入力装置132によって、散布図による外れ値が指定される(S2)。
つまり、表示装置133に表示されている図3に示す散布図において、外れ値となっている符号201のデータが、マウス等の入力装置132によって、手動で指定される。前記したように、外れ値として指定された符号201のデータは、図2のレコードR2に格納されているものである。
このようにすることで、容易に外れ値を指定することができる。
なお、外れ値は、処理部110が指定することも可能である。この場合、処理部110は、散布図における互いのプロット点の距離を算出し、その距離が所定の値以上、あるいは、他の距離と比べて所定のパーセンテージ以上(150%以上等)である場合、処理部110は、そのプロット点を外れ値と判定する。
そして、距離算出処理部111が、質的データのカラムと、別の質的データのカラムの組み合わせのすべてにおけるマハラノビス距離を算出する(S4)。ステップS4の処理については後記する。
続いて、距離算出処理部111が、質的データのカラムと、別の量的データのカラムとの組み合わせのすべてにおけるマハラノビス距離を算出する(S5)。ステップS5の処理については後記する。
さらに、距離算出処理部111が、量的データのカラムと、別の量的データのカラムとの組み合わせのすべてにおけるマハラノビス距離を算出する(S6)。ステップS6では、一般的な2変数のマハラノビス距離を用いればよいので、ここでの詳細な説明を省略する。
図5は、単独のカラム毎についてのマハラノビス距離算出処理の手順を示すフローチャートである。
図5は、図4のステップS3で行われる処理である。
距離算出処理部111は、計測データ121のうち、計算対象とするカラムを決定する(S301)。ここでは、例えば、図2のカラムC3(「変数A」)が決定される。
次に、距離算出処理部111は、決定されたカラムのデータが質的データであるか否かを判定する(S302)。
質的データである場合(S302→Yes)、距離算出処理部111は、決定されたカラムにおける各データをダミー変数に変換する(S311)。
その後、距離算出処理部111は、変換したダミー変数を用いて対象となるデータの平均値μ1、及び、標準偏差σ1を算出する(S312)。
続いて、距離算出処理部111は、算出された平均μ1、標準偏差σ1を用いて、質的データによるマハラノビス距離D1を算出する(S313)。
ステップS311〜S313の処理について図2を参照して説明する。
ここでは、図2のカラムC3(「変数A」)について説明する。
まず、距離算出処理部111は、カラムC3(「変数A」)のうち、図4のステップS2で選択指定された外れ値に対応するデータと同じデータと、それ以外のデータとに分ける。以降では、図4のステップS2で選択指定された外れ値を、単に外れ値と称する。そして、距離算出処理部111は、外れ値に対応するデータ(第1データ)を「1」(第1数字)、それ以外のデータを「0」(第2数字)とする。
図2の例では、外れ値に対応するレコードはレコードR2であり、レコードR2における「変数A」のデータは「B2」である。よって、外れ値に対応するデータは「B2」、それ以外のデータは「A1」、「A2」、「A3」、「B1」となる。
そこで、距離算出処理部111は、カラムC3に格納されているすべてのデータ(第1データ群)について、「B2」を「1」とし、「B2」以外(「A1」、「A2」、「A3」、「B1」)を「0」とする。ここでの「1」、「0」をダミー変数と称する。この処理は、図5のステップS311に相当する処理である。
図2の例では、「B2」を有するレコードは、レコードR2,R6,R9,R10の4つである。従って、図2の例では、「1」が4つ、「0」が6つ検出される。
μ1は、処理対象となっているカラムにおけるダミー変数の集合の平均である。σ1は、処理対象となっているカラムにおけるダミー変数の集合の標準偏差である。
ここで、図2のカラムC3(「変数A」)の各データは、レコードR1から順に、それぞれ「0,1,0,0,0,1,0,0,1,1」とダミー変数に変換される。この「0,1,0,0,0,1,0,0,1,1」が、処理対象となっているカラムにおけるダミー変数の集合である。
図6に示すように、外れ値に対応しているデータ以外のデータ(「0」)のヒストグラムと、外れ値に対応しているデータ(「1」)のヒストグラムとから、平均μ1、標準偏差σ1が算出される。そして、対象となるデータが平均μ1から、どれくらい離れているかが、標準偏差σ1で正規化された形でマハラノビス距離D1として算出される。
このような手法でマハラノビス距離D1を算出することで、対象となるデータが平均μ1から、どれくらい離れているかを顕著に表すことができる。
ステップS302で、量的データである場合(S302→No)、距離算出処理部111は、対象となるデータの平均値μ2、及び、標準偏差σ2を算出する(S321)。
続いて、距離算出処理部111は、算出された平均μ2、標準偏差σ2を用いて量的データに対するマハラノビス距離D2を算出する(S322)。
ここでは、カラムC4(「変数B」)について説明する。
つまり、距離算出処理部111は、カラムC4(「変数B」)におけるデータ(10,30,12,・・・)の平均μ2、標準偏差σ2を算出する。この処理は、図5のステップS321に相当する処理である。
図7に示すように、量的データにおけるマハラノビス距離D2は、全体の平均μ2から外れ値に対応するデータ301までの距離に相当する。図7において、符号301は、図2の例におけるレコードR2の「変数B」の値「30」に相当する。
ステップS313及びステップS322の処理の後、距離算出処理部111は、すべてのカラムについて処理を終了したか否かを判定する(S331)。
すべてのカラムについて処理を終了していない場合(S331→No)、距離算出処理部111は、次のカラムを処理対象として決定し(S332)、ステップS302へ処理を戻す。
すべてのカラムについて処理を終了している場合(S331→Yes)、距離算出処理部111は、図4のステップS4へ処理をリターンする。
図8は、質的データと、質的データとの組み合わせによるマハラノビス距離算出処理の手順を示すフローチャートである。
図8は、図4のステップS4で行われる処理である。
まず、距離算出処理部111はカラムの組み合わせを決定する(S401)。ここで、組み合わされるカラムは、両方とも質的データを有するカラムである。図2の例では、以下の組み合わせが図8の処理の対象となる。
・カラムC3(「変数A」)とカラムC6(「変数D」)との組み合わせ。
・カラムC3(「変数A」)とカラムC7(「変数E」)との組み合わせ。
・カラムC6(「変数D」)とカラムC7(「変数E」)との組み合わせ。
その後、距離算出処理部111は、絞り込まれた結果におけるダミー変数への変換を行う(S403)。
そして、距離算出処理部111は、絞り込みの結果を用いて対象となるデータの平均値μ3、及び、標準偏差σ3を算出する(S404)。
続いて、距離算出処理部111は、算出された平均μ3、標準偏差σ3を用いてマハラノビス距離D3を算出する(S405)。
ステップS402〜S405の処理について図9を参照して説明する。
図9に示すデータは、図2に示すデータと同じものである。
ここでは、カラムC3(「変数A」)(第2データ群)と、カラムC6(「変数D」)(第3データ群)との組み合わせについてマハラノビス距離を算出する。
レコードR2は、図2と同様、外れ値が含まれるレコードである。そして、レコードR2における「変数A」のデータは「B2」(第2データ)である。
ここで、距離算出処理部111は、カラムC3(「変数A」)について「B2」を有するレコードを絞り込む。図9の例では、レコードR2,R6,R9、R10が絞り込まれる(網掛け)(第4データ群)。この処理は、図8のステップS402に相当する処理である。
まず、図10Aに示すように、距離算出処理部111は、まず、一方のカラムについて、外れ値に対応するデータと、それ以外のデータとで分け、外れ値に対応するデータと同じデータを有するレコードで他方のカラムを絞り込む(破線で囲まれた部分)。
そして、図10Bに示すように、距離算出処理部111は、絞り込まれたレコードについて、外れ値に対応するデータと、それ以外のデータとで分け、この結果を用いてマハラノビス距離D3を算出する。
このような手法でマハラノビス距離D3を算出することで、対象となるデータが平均μ3から、どれくらい離れているかを顕著に表すことができる。
そして、ステップS405の後、距離算出処理部111は、すべての質的データ同士のカラムの組み合わせについて処理を終了したか否かを判定する(S411)。
すべての質的データ同士のカラムの組み合わせについて処理を終了していない場合(S411→No)、距離算出処理部111は、次のカラムの組み合わせを決定し(S412)、ステップS402へ処理をリターンする。
すべての質的データ同士のカラムの組み合わせについて処理を終了している場合(S411→Yes)、距離算出処理部111は、図4のステップS5へ処理をリターンする。
図11は、質的データと、量的データとの組み合わせによるマハラノビス距離D4の算出処理の手順を示すフローチャートである。
図11に示す処理は、図4のステップS5で行われる処理である。
まず、距離算出処理部111はカラムの組み合わせを決定する(S501)。ここで、組み合わされるカラムは、一方が質的データを有し、他方が量的データを有するカラムである。図2の例では、以下の組み合わせが図11の処理の対象となる。
・カラムC3(「変数A」)とカラムC4(「変数B」)との組み合わせ。
・カラムC3(「変数A」)とカラムC5(「変数C」)との組み合わせ。
・カラムC3(「変数A」)とカラムC8(「変数F」)との組み合わせ。
・カラムC6(「変数D」)とカラムC4(「変数B」)との組み合わせ。
・カラムC6(「変数D」)とカラムC5(「変数C」)との組み合わせ。
・カラムC6(「変数D」)とカラムC8(「変数F」)との組み合わせ。
・カラムC7(「変数E」)とカラムC4(「変数B」)との組み合わせ。
・カラムC7(「変数E」)とカラムC5(「変数C」)との組み合わせ。
・カラムC7(「変数E」)とカラムC8(「変数F」)との組み合わせ。
そして、距離算出処理部111は、絞り込みの結果を用いて量的データの平均μ4、標準偏差σ4を算出する(S503).
続いて、距離算出処理部111は、算出された量的データの平均μ4、標準偏差σ4を用いてマハラノビス距離D4を算出する(S504)。
ステップS502〜S504の処理について図12を用いて説明する。
図12に示すデータは、図2に示すデータと同じものである。
ここでは、カラムC3(「変数A」)(第6データ群)と、カラムC4(「変数B」)(第7データ群)との組み合わせについてマハラノビス距離D4を算出する。
まず、距離算出処理部111は、カラムC3(「変数A」)について「B2」を有するレコードを絞り込む。図12の例では、レコードR2,R6,R9、R10(第8データ群)が絞り込まれる(網掛け)。この処理は、図11のステップS502に相当する処理である。
まず、図13Aに示すように、距離算出処理部111は、まず、質的データのカラムについて、外れ値に対応するデータと、それ以外のデータとで分け、外れ値に対応するデータと同じデータを有するレコードで、量的データを絞り込む(破線で囲まれた部分)。
そして、図13Bに示すように、距離算出処理部111は、絞り込まれた量的データのレコードを対象に全体の平均μ4から指定された外れ値に対応するデータ302までの距離に相当するマハラノビス距離D4を算出する。図13Bにおいて、符号302は、図12の例におけるレコードR2の「変数B」の値「30」に相当する。
このような手法でマハラノビス距離D4を算出することで、対象となるデータが平均μ4から、どれくらい離れているかを顕著に表すことができる。
そして、ステップS504の後、距離算出処理部111は、質的データと、量的データのカラムのすべての組み合わせについて処理を終了したか否かを判定する(S511)。
質的データと、量的データのカラムのすべての組み合わせについて処理を終了していない場合(S511→No)、距離算出処理部111は、次のカラムの組み合わせを決定し(S512)、ステップS502へ処理をリターンする。
質的データと、量的データのカラムのすべての組み合わせについて処理を終了している場合(S511→Yes)、距離算出処理部111は、図5のステップS6へ処理をリターンする。
図14は、ランキング表示処理の手順を示すフローチャートである。
図14の処理は、図4のステップS7で行われる処理である。
まず、ランキング表示処理部112は、図4のステップS3〜S6で算出されたマハラノビス距離が大きい順に変数及び変数の組み合わせをランキング化する(S701)。
例えば、図2の例では、「変数C」、(「変数B」,「変数C」)、(「変数C」,「変数F」)、・・・の順にマハラノビス距離が大きい。なお、(「変数B」,「変数C」)は、「変数B」と「変数C」との組み合わせを意味する。
なお、ここで、算出される基礎統計量は、標準偏差、歪度、尖度、中央値、最頻値である。
ここで、図15に示すように、記憶装置120には、過去における外れ値が生じた際におけるデータの基礎統計量と、マハラノビス距離とが過去統計データ122として格納されている。基礎統計量は、図15に示すように標準偏差、歪度、尖度、中央値、最頻値等が含まれる。各基礎統計量と、マハラノビス距離とは、図15に示すように、外れ値が生じた要因に対応付けられて格納されている。
(A)の誤記は、小数点の入力ミスや、質的データにおけるデータの打ち間違い等を指す。小数点の入力ミスであれば、本来の値より10倍や、100倍大きくなる等といった現象が生じる。一般に、このような場合、マハラノビス距離は大きくなる傾向がある。
(D)の(A)〜(D)以外として、例えば、(C)とは異なり、同じ計測対象のデータではあるが、温度等の計測時の環境条件が異なる場合等である。
・・・ (11)
(1)2次元統計量における、それぞれの基礎統計量について、今回データの基礎統計量と、過去統計データ122の基礎統計量との差の2乗を足し合わせて、ルートをとったものが一致度Iとなる。例えば、一方の変数が、標準偏差STD11、歪度SK11、・・・の基礎統計量を有し、他方の変数が、標準偏差STD12、歪度SK12、・・・の基礎統計量を有しているものとする。また、過去統計データ122が、これらの基礎統計量に対応するように、標準偏差STD21,STD22、歪度SK21,SK22、・・・の基礎統計量を有しているものとする。このとき、一致度Iは、以下の式(12)によって算出される。
・・・ (12)
・・・ (13)
ステップS703の後、ランキング表示処理部112は、ランキングの結果と、推定された要因とを対応付けたランキング表示画面を表示装置133に表示する(S704)。
ランキング表示画面は、「変数名1」、「データ1」、「変数名2」、「データ2」、「影響度」、「判定種別」、「判定種別正解登録」の各カラムを有する。
「変数名1」、「変数名2」では、マハラノビス距離が大きいと判定された変数の組み合わせが格納される。「データ1」、「データ2」には、外れ値に対応する「変数名1」、「変数名2」のデータが表示される。
例えば、図16の例では、「変数C」で算出されたマハラノビス距離が最も大きいと判定されている(レコードR11)。従って、この場合、「変数C」が、先頭に表示されている。そして、「データ1」には、外れ値に対応する図2のレコードR2における「変数C」の値「90」が表示されている。また、レコードR11は、単独の変数であるので「変数名2」、「データ2」は空欄となっている。
「判定種別」は、図14のステップS703におけるマッチングの結果、推定された要因が表示される。ここでは、ランキングが最も上位の「変数C」の要因として「(A)〜(C)以外」が表示されている。また、次のランキングの「変数B」、「変数C」の要因として「(A)〜(C)以外」が表示されている。
「判定種別正解登録」では、ユーザによる確認の結果、表示されている要因が正しければ、登録ボタン401が入力装置132を介して選択入力される。すると、登録処理部113が、該当する変数のデータを過去統計データ122に追加格納する。例えば、レコードR11の登録ボタン401が選択入力されると、過去統計データ122の「(D)(A)〜(C)以外」のデータとして、ステップS702で算出された「変数C」の基礎統計量と、ステップS3で算出されたマハラノビス距離が追加登録される(図14のS711)。
また、本実施形態では、外れ値が、この外れ値に対応している他のカラム(データ)においても外れている点に着目して抽出している。そのため、指定される外れ値のデータは1つでも推定可能である。
さらに、本実施形態では、高次元のデータを低次元(2次元)のデータに圧縮せずに、要因の推定を行っている。従って、本実施形態によれば、データの正確性を維持することができる。
さらに、本実施形態では、外れ値をユーザが選択指定することで、要因の推定処理が開始される。このようにすることで、容易に外れ値の要因の推定を行うことができる。
また、各実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には、ほとんどすべての構成が相互に接続されていると考えてよい。
110 処理部
111 距離算出処理部(指標算出部)
112 ランキング表示処理部(要因推定部、ランキング処理部、表示処理部)
113 登録処理部
120 記憶装置(記憶部)
121 計測データ(処理対象データ)
122 過去統計データ(要因データ)
132 入力装置(指定部)
133 表示装置(表示部)
S2 外れ値の指定(指定ステップ)
S3〜S6 マハラノビス距離算出(指標算出ステップ)
S703 マッチング(要因推定ステップ)
S704 表示(表示ステップ)
その他の解決手段は実施形態において適宜記載する。
ここで、図2を参照して記憶装置120に格納されている計測データ121について説明する。
図2は、本実施形態で使用される計測データ121の一例を示す図である。
図2の例では、計測データ121は、レコードR1〜R10を有し、カラムC1〜C8を有している。それぞれのカラムC1〜C8は、「交換回数」、「機械使用時間」、「変数A」、「変数B」、・・・、「変数F」に対応している。なお、「交換回数」とは「部品の交換回数」である。本実施形態では、「交換回数」、「機械使用時間」、「変数A」、「変数B」、・・・を、変数と称する。
計測データ121の各フィールドに入力されているデータ(処理対象データ)は、図示しない所定の計測器から取得したり、ユーザが手動で入力したものである。
この外れ値は、図2の網掛けで示されているレコードR2に対応しているものとする。本実施形態では、図3の符号201のような外れ値が生じた理由(要因)を、散布図に示されていない「変数A」、「変数B」、・・・、「変数F」から探ることを目的とする。
過去統計データ122は、過去において外れ値(第1外れ値)が生じた要因と、その外れ値が生じた際のデータの基礎統計量(過去基礎統計量)(第1基礎統計量)が対応付けられて格納されている。なお、過去統計データ122については後記する。
そして、距離算出処理部111が、質的データのカラムと、別の質的データのカラムの組み合わせのすべてにおけるマハラノビス距離(第2指標)を算出する(S4)。ステップS4の処理については後記する。
続いて、距離算出処理部111が、質的データのカラムと、別の量的データのカラムとの組み合わせのすべてにおけるマハラノビス距離(第2指標)を算出する(S5)。ステップS5の処理については後記する。
さらに、距離算出処理部111が、量的データのカラム(第5カラム)と、別の量的データのカラム(第6カラム)との組み合わせのすべてにおけるマハラノビス距離を算出する(S6)。ステップS6では、一般的な2変数のマハラノビス距離を用いればよいので、ここでの詳細な説明を省略する。
ここでは、図2のカラムC3(「変数A」)(第2指標の算出対象となっているカラム)について説明する。
まず、距離算出処理部111は、カラムC3(「変数A」)のうち、図4のステップS2で選択指定された外れ値に対応するデータと同じデータと、それ以外のデータとに分ける。以降では、図4のステップS2で選択指定された外れ値を、単に外れ値と称する。そして、距離算出処理部111は、外れ値に対応するデータを「1」(第1数字)、それ以外のデータを「0」(第2数字)とする。
図2の例では、外れ値に対応するレコードはレコードR2(第1レコード)であり、レコードR2における「変数A」のデータは「B2」である。よって、外れ値に対応するデータは「B2」、それ以外のデータは「A1」、「A2」、「A3」、「B1」となる。
そこで、距離算出処理部111は、カラムC3に格納されているすべてのデータについて、「B2」を「1」とし、「B2」以外(「A1」、「A2」、「A3」、「B1」)を「0」とする。ここでの「1」、「0」をダミー変数と称する。この処理は、図5のステップS311に相当する処理である。
図2の例では、「B2」を有するレコードは、レコードR2,R6,R9,R10の4つである。従って、図2の例では、「1」が4つ、「0」が6つ検出される。
図9に示すデータは、図2に示すデータと同じものである。
ここでは、カラムC3(「変数A」)(第1カラム)と、カラムC6(「変数D」)(第2カラム)との組み合わせについてマハラノビス距離を算出する。
レコードR2は、図2と同様、外れ値が含まれるレコードである(第2レコード)。そして、レコードR2における「変数A」のデータは「B2」である。
ここで、距離算出処理部111は、カラムC3(「変数A」)について「B2」を有するレコードを絞り込む。図9の例では、レコードR2,R6,R9、R10が絞り込まれる(網掛け)(第3レコード)。この処理は、図8のステップS402に相当する処理である。
図12に示すデータは、図2に示すデータと同じものである。
ここでは、カラムC3(「変数A」)(第3カラム)と、カラムC4(「変数B」)(第4カラム)との組み合わせについてマハラノビス距離D4を算出する。
まず、距離算出処理部111は、カラムC3(「変数A」)について「B2」を有するレコードを絞り込む。図12の例では、レコードR2,R6,R9、R10(第5レコード)が絞り込まれる(網掛け)。この処理は、図11のステップS502に相当する処理である。
ここで、図15に示すように、記憶装置120には、過去における外れ値が生じた際におけるデータの基礎統計量と、マハラノビス距離(第1指標)とが過去統計データ122として格納されている。基礎統計量は、図15に示すように標準偏差、歪度、尖度、中央値、最頻値等が含まれる。各基礎統計量と、マハラノビス距離とは、図15に示すように、外れ値が生じた要因に対応付けられて格納されている。
110 処理部
111 距離算出処理部(算出部)
112 ランキング表示処理部(要因推定部、ランキング処理部、表示処理部)
113 登録処理部
120 記憶装置(記憶部)
121 計測データ(テーブル、フィールド、処理対象データ)
122 過去統計データ(要因データ、第1指標及び第1基礎統計量を格納)
132 入力装置(指定部)
133 表示装置(表示部)
201 外れ値(第2外れ値)
C1〜C8 カラム(第2指標の算出対象となっているカラム、第1カラム〜第4カラム)
R1〜R10 レコード(第1レコード〜第5レコード)
S2 外れ値の指定(指定ステップ)
S3〜S6 マハラノビス距離算出(算出ステップ)
S703 マッチング(要因推定ステップ)
S704 表示(表示ステップ)
その他の解決手段は実施形態において適宜記載する。
Claims (11)
- 過去における外れ値が生じた要因と、その要因が生じた際のデータの基礎統計量と、距離とが、対応付けられて格納されている要因データ、及び、要因推定の対象となるデータが格納されている処理対象データを保持している記憶部と、
前記処理対象データを構成するデータは、一方は同種のデータで構成される第1項目に対応付けられ、他方では第2項目に対応付けられており、
前記処理対象データにおいて、所定の外れ値を指定する指定部と、
前記処理対象データにおいて、指定された前記外れ値と同一の前記第2項目に属するデータである第1データが、前記第1データと同一の前記第1項目に属する第1データ群から、どれほど離れているかの指標を、複数の前記第1項目について算出する指標算出部と、
前記指標に基づいて、指定された前記外れ値の要因を推定する要因推定部と、
前記推定された要因を表示部に表示する表示処理部と、
を有することを特徴とする外れ値要因推定支援装置。 - 前記指標は、マハラノビス距離である
ことを特徴とする請求項1に記載の外れ値要因推定支援装置。 - 前記第1データ群が、質的データで構成されている場合、
前記指標算出部は、
前記第1データ群において、前記第1データと同じデータである場合、当該データを所定の数字である第1数字で変換し、前記第1データとは異なるデータを、前記第1数字とは異なる第2数字で変換し、式(1)に基づく前記マハラノビス距離を算出することで、前記指標を算出する
ことを特徴とする請求項2に記載の外れ値要因推定支援装置。
D1=|(X1−μ1)|/σ1 ・・・ (1)
ここで、D1はマハラノビス距離であり、X1は、前記第1数字で変換された前記第1データであり、μ1は、前記第1データ群におけるすべての変換されたデータの平均値であり、σ1は、前記第1データ群におけるすべての変換されたデータの標準偏差である。 - 前記第1データは、第2データおよび第3データで構成されており、
前記第2データと同一の前記第1項目に属するデータ群である第2データ群と、前記第3データと同一の前記第1項目に属するデータ群である第3データ群と、の両方が質的データで構成されており、
前記指標算出部は、
前記第2データ群において、前記第2データと同じデータを有するデータ群である第4データ群を抽出し、
前記第3データ群において、前記第4データ群におけるデータと同じ前記第2項目に属しているデータである第5データ群を抽出し、
前記第5データ群におけるデータのうち、前記第3データと同じデータを第3数字で変換し、前記第5データ群におけるデータのうち、前記第3データとは異なるデータを前記第3数字とは異なる第4数字で変換し、式(2)に基づく前記マハラノビス距離を算出することで、前記指標を算出する
ことを特徴とする請求項2に記載の外れ値要因推定支援装置。
D3=|(X3−μ3)|/σ3 ・・・ (1)
ここで、D3は、マハラノビス距離であり、X3は、前記第3数字で変換された前記第3データであり、μ3は、前記第3データ群におけるすべての変換されたデータの平均値であり、σ3は、前記第3データ群におけるすべての変換されたデータの標準偏差である。 - 前記第1データは、第6データおよび第7データで構成されており、
前記第6データと同一の前記第1項目に属するデータ群である第6データ群が質的データで構成されており、前記第7データと同一の前記第1項目に属するデータ群である第7データ群が量的データで構成されており、
前記指標算出部は、
前記第6データ群において、前記第6データと同じデータを有するデータ群である第8データ群を抽出し、
前記第7データ群において、前記第8データ群におけるデータと同じ前記第2項目に属しているデータである第9データ群を抽出し、
前記第9データ群におけるデータにおける前記第7データについて、式(3)に基づく前記マハラノビス距離を算出することで、前記指標を算出する
ことを特徴とする請求項2に記載の外れ値要因推定支援装置。
D4=|(X4−μ4)|/σ4 ・・・ (3)
ここで、D4は、マハラノビス距離であり、X4は、前記第7データであり、μ4は、前記第9データ群におけるデータの平均値であり、σ4は、前記第9データ群におけるデータの標準偏差である。 - 前記指標に基づいて、前記第1項目のランキングを算出するランキング処理部
を有することを特徴とする請求項1に記載の外れ値要因推定支援装置。 - 前記表示処理部は、
前記ランキング処理部によって算出された前記第1項目のランキングを、前記推定した要因とともに前記表示部に表示する
ことを特徴とする請求項6に記載の外れ値要因推定支援装置。 - 前記要因推定部は、
それぞれの前記第1項目における前記第1データ群の基礎統計量と、前記要因データに格納されている、それぞれの要因に対応付けられている基礎統計量とを比較することで、前記第1項目における前記第1データ群の基礎統計量が、どの要因の基礎統計量と近いかを判定することで、前記外れ値の要因を推定する
ことを特徴とする請求項1に記載の外れ値要因推定支援装置。 - 前記表示部に表示されている変数に関するデータを、前記要因データに格納する格納処理部
を有することを特徴とする請求項1に記載の外れ値要因推定支援装置。 - 過去における外れ値が生じた要因と、その要因が生じた際のデータの基礎統計量と、距離とが、対応付けられて格納されている要因データ、及び、要因推定の対象となるデータが格納されている処理対象データを保持している記憶部と、
前記処理対象データを構成するデータは、一方は同種のデータで構成される第1項目に対応付けられ、他方では第2項目に対応付けられている外れ値要因推定支援装置が、
前記処理対象データにおいて、所定の外れ値を指定する指定ステップと、
前記処理対象データにおいて、指定された前記外れ値と同一の前記第2項目に属すデータである第1データが、前記第1データと同一の前記第1項目に属する第1データ群から、どれほど離れているかの指標を、複数の前記第1項目について算出する指標算出ステップと、
前記指標に基づいて、指定された前記外れ値の要因を推定する要因推定ステップと、
前記推定された要因を表示部に表示する表示ステップと、
を実行することを特徴とする外れ値要因推定支援方法。 - 過去における外れ値が生じた要因と、その要因が生じた際のデータの基礎統計量と、距離とが、対応付けられて格納されている要因データ、及び、要因推定の対象となるデータが格納されている処理対象データを保持している記憶部を有し、
前記処理対象データを構成するデータは、一方は同種のデータで構成される第1項目に対応付けられ、他方では第2項目に対応付けられているコンピュータに、
前記処理対象データにおいて、所定の外れ値を指定する指定ステップと、
前記処理対象データにおいて、指定された前記外れ値と同一の前記第2項目に属すデータである第1データが、前記第1データと同一の前記第1項目に属する第1データ群から、どれほど離れているかの指標を、複数の前記第1項目について算出する指標算出ステップと、
前記指標に基づいて、指定された前記外れ値の要因を推定する要因推定ステップと、
前記推定された要因を表示部に表示する表示ステップと、
を実行させることを特徴とする外れ値要因推定支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019053875A JP6719612B1 (ja) | 2019-03-20 | 2019-03-20 | 外れ値要因推定支援装置、外れ値要因推定支援方法及び外れ値要因推定支援プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019053875A JP6719612B1 (ja) | 2019-03-20 | 2019-03-20 | 外れ値要因推定支援装置、外れ値要因推定支援方法及び外れ値要因推定支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6719612B1 JP6719612B1 (ja) | 2020-07-08 |
JP2020154891A true JP2020154891A (ja) | 2020-09-24 |
Family
ID=71402452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019053875A Active JP6719612B1 (ja) | 2019-03-20 | 2019-03-20 | 外れ値要因推定支援装置、外れ値要因推定支援方法及び外れ値要因推定支援プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6719612B1 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005038256A (ja) * | 2003-07-16 | 2005-02-10 | Jgs:Kk | 有効因子情報選択装置、有効因子情報選択方法、プログラム、および、記録媒体 |
JP2009258890A (ja) * | 2008-04-15 | 2009-11-05 | Sharp Corp | 影響要因特定装置 |
JP2011253489A (ja) * | 2010-06-04 | 2011-12-15 | Metawater Co Ltd | プラント運転監視装置およびシステムならびにプログラム |
JP2015072515A (ja) * | 2013-10-01 | 2015-04-16 | 株式会社日立製作所 | データ表示システム |
WO2017109903A1 (ja) * | 2015-12-24 | 2017-06-29 | 株式会社 東芝 | 異常原因推定装置及び異常原因推定方法 |
JP2019003389A (ja) * | 2017-06-15 | 2019-01-10 | 株式会社 日立産業制御ソリューションズ | 異常診断装置、異常診断方法及び異常診断プログラム |
JP2019016209A (ja) * | 2017-07-07 | 2019-01-31 | 株式会社東芝 | 診断装置、診断方法およびコンピュータプログラム |
-
2019
- 2019-03-20 JP JP2019053875A patent/JP6719612B1/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005038256A (ja) * | 2003-07-16 | 2005-02-10 | Jgs:Kk | 有効因子情報選択装置、有効因子情報選択方法、プログラム、および、記録媒体 |
JP2009258890A (ja) * | 2008-04-15 | 2009-11-05 | Sharp Corp | 影響要因特定装置 |
JP2011253489A (ja) * | 2010-06-04 | 2011-12-15 | Metawater Co Ltd | プラント運転監視装置およびシステムならびにプログラム |
JP2015072515A (ja) * | 2013-10-01 | 2015-04-16 | 株式会社日立製作所 | データ表示システム |
WO2017109903A1 (ja) * | 2015-12-24 | 2017-06-29 | 株式会社 東芝 | 異常原因推定装置及び異常原因推定方法 |
JP2019003389A (ja) * | 2017-06-15 | 2019-01-10 | 株式会社 日立産業制御ソリューションズ | 異常診断装置、異常診断方法及び異常診断プログラム |
JP2019016209A (ja) * | 2017-07-07 | 2019-01-31 | 株式会社東芝 | 診断装置、診断方法およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6719612B1 (ja) | 2020-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10572512B2 (en) | Detection method and information processing device | |
US20190301979A1 (en) | Abnormality detection system, support device, and abnormality detection method | |
JP4046309B2 (ja) | プラント監視装置 | |
JP7221644B2 (ja) | 機器故障診断支援システムおよび機器故障診断支援方法 | |
JP6886870B2 (ja) | プラント運転監視システム及びプラント運転監視方法 | |
WO2011138911A1 (ja) | 障害分析装置、障害分析方法および記録媒体 | |
JP2007034700A (ja) | 予測プログラムおよび予測装置 | |
JP2019036186A (ja) | 異常検知モデル構築装置、異常検知モデル構築方法及びプログラム | |
WO2021103624A1 (zh) | 一种脓毒血症的预警装置、设备及存储介质 | |
JP2014235654A (ja) | リスク評価装置 | |
CN112970070A (zh) | 用于健康护理提供者辅助系统的方法和系统 | |
JP6915693B2 (ja) | システム分析方法、システム分析装置、および、プログラム | |
KR101595784B1 (ko) | 패혈증 고위험군 예측 방법 및 시스템 | |
JP6719612B1 (ja) | 外れ値要因推定支援装置、外れ値要因推定支援方法及び外れ値要因推定支援プログラム | |
JP2013205894A (ja) | 異常検出装置、プログラムおよび異常検出方法 | |
JP2019113970A (ja) | プロセスの状態診断方法及び状態診断装置 | |
US11112779B2 (en) | Computer system and facility monitoring method | |
JP6247777B2 (ja) | 異常診断装置および異常診断方法 | |
CN113990512A (zh) | 异常数据检测方法及装置、电子设备和存储介质 | |
CN114095345A (zh) | 主机网络健康状况评估方法、装置、设备和存储介质 | |
JP2021185469A (ja) | 性能分析装置および性能分析方法 | |
JP2017207878A (ja) | 欠落データ推定方法、欠落データ推定装置および欠落データ推定プログラム | |
JP6785715B2 (ja) | 正常異常判別装置、正常異常判別方法、及び正常異常判別システム | |
JP2020091669A (ja) | 状態変化検出システム | |
JP7355108B2 (ja) | 予測方法、予測装置、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190320 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190320 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190730 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6719612 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |