JP2011086037A

JP2011086037A - データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置

Info

Publication number: JP2011086037A
Application number: JP2009237073A
Authority: JP
Inventors: Takeshi Furuhashi; 武古橋; Ohiro Yoshikawa; 大弘吉川; Yosuke Watanabe; 庸介渡邉
Original assignee: Nagoya University NUC
Current assignee: Nagoya University NUC
Priority date: 2009-10-14
Filing date: 2009-10-14
Publication date: 2011-04-28

Abstract

【課題】新規な多変量データのフィルタリング方法を提案する。
【解決手段】第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する第１の出力源からの第３のデータ（２−１）と第２の出力源からの第４のデータ（２−２）とを比較して異常なデータをフィルタリングするデータのフィルタリング方法であって、第１の対象の指標と第２の対象の指標とで規定される仮想空間における第１の出力源からデータ（１−１，２−１）と第２の出力源からのデータ（２−１，２−２）との間の距離を演算し、演算された該距離に基づき、異常なデータを除去する。
【選択図】なし

Description

本発明は、データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置に関する。本発明は多変量データの処理および多変量データの出力源の異常を特定することに好適に利用される。

多変量データ処理の一例としてアンケート処理がある。例えばｎ個の対象に対するｍ個の質問項目からなるアンケート結果は、アンケートの回答者数をｋ人とすると、ｎ×ｍ×ｋ通りのデータとなりうる。
このような多変量データからなるアンケート結果の処理は、ｍ本の質問項目軸空間に回答者の評点がプロットされ、これら評点に対して解析がなされる。アンケート結果には、矛盾した回答が含まれる可能性がある。矛盾した回答はアンケートの解析結果をゆがめてしまう怖れがある。この問題に対応するために、従来より、矛盾した回答の組合せパターンに基づくデータクリーニングおよび関連質問に関する回答結果を利用した矛盾度判定手法が提案されている（非特許文献１参照）。
しかし、この手法では複数の同一内容の質問に対する回答が異なる回答者を特定できるが、アンケート中に複数回登場しないと質問に対する回答の矛盾は特定できない。即ち、質問内容の同一性がアンケート回答者の解釈に依存し、アンケート実施者の意図とは異なることがあり、回答者の解釈においては矛盾していない回答結果を除去してしまうおそれがある。
これに対して、ライフスタイルなどの関連質問に関する回答結果を利用して、実際のアンケート回答結果の矛盾度を判定し、矛盾する回答数が一定割合以上の回答者を矛盾回答者とする手法が提案されている（特許文献１参照）。

特開２００５−２０２６１９号公報

後藤秀雄、「市場調査ケーススタディ改訂新版」、日本マーケティング教育センタ、１９９６

特許文献１に記載の手法では、アンケート中に本来の質問事項に加えて別途ライフスタイルなどの関連質問が設定される。その結果、質問数が増大して回答者を疲労させ、不真面目なひいては矛盾した回答を増やしてしまうおそれがある。また、アンケートの実施者と回答者との間で生じうる質問に対する解釈の齟齬を解消できない。

本発明者らは上記課題を解決すべく鋭意検討を重ねてきところ、ｍ本の質問項目軸空間における回答者の評点分布を解析するのではなく、回答者の評点をプロットする空間をｎ本の対象軸から形成されるものとしたところ全く新しい展開が見えてきた。
例えばアンケートの対象が商品デリバリに関するサービスA（第１の対象）及びサービスB（第２の対象）であり、アンケートの結果として確認したい情報として（１）斬新性、（２）必要性、（３）認知度が含まれるときのアンケートの質問例を次に示す。

一般的なアンケート手法としてカウンター質問対を設けることがあり、上記のアンケートにおいても確認したい情報（アンケート実施者の意図）（１）、（２）及び（３）にカウンター質問対が設けられている。
回答者に求める評価を五段階としたとき、一人の回答者甲がカウンター質問対のそれぞれにくだす評価は相対になると考えられる。例えば、質問Ｑ４「こんなサービスがほしい」に「５」の評価をくだした回答者は質問Ｑ１３「必要性を感じない無駄なサービスだ」には「１」の評価をくだすと予想される。
そこでサービスＡに対する評価を横軸に、サービスＢに対する評価を縦軸にして回答者甲の回答結果をプロットする。結果を図１（Ａ）に示す。サービスＡ及びサービスＢに関するカウンター質問に対する評価どうしが大きく離れており、この結果では確認したい情報（１）、（２）及び（３）についてカウンター質問対が有効に作用していることがわかる。

他方、回答者乙の回答結果を示す図１（Ｂ）では（３）の質問対Ｑ９及びＱ１１の評価が近くにあり、カウンター質問対が有効に作用していない。このことは、質問の文章があいまいであってアンケート実施者による質問の意図が充分に回答者乙に伝わらない場合と、回答者乙自身の資質（まじめさ、文章の理解能力等）に問題がある場合とが考えられる。
そこで、同様の処理を回答者丙 …… ｎのアンケート結果について実行し、各質問に対する評価の平均値を図１（Ｃ）に示す。

図１（Ｃ）の結果から、比較的近くに位置する質問対Ｑ９及びＱ１１については、アンケート実施者の意図が回答者にうまく伝わっていないことがわかる。これは、回答者の資質ではなく質問の文章自体に問題があることを意味する。換言すれば、異常な評価を引き出すおそれのある質問を特定することができる。
他方、質問対Ｑ４及びＱ１３や質問対Ｑ８及びＱ１４は充分に離散しているのでカウンター質問対として有効に作用していることがわかる。従って、かかるカウンター質問対に対して離散した評価を下していない回答者はその資質に問題があると推定される。よって、かかる回答者の回答はアンケート結果として採用しないようにすることが好ましい。

以上より、本発明者らが開発した手法によれば、従来例で採用されたような余計な質問（ライフスタイルなどの関連質問）を何ら含めることなく、かつアンケート実施者の意図と回答者の解釈との整合性を担保しつつ、有効なアンケート結果のみを抽出（フィルタリング）できることがわかる。

この発明は、上記で説明したアンケート結果処理方法に関する本発明者らの新たな知見を多変量データの処理に敷衍したものであり、次のように規定される。即ち、
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータをフィルタリングするデータのフィルタリング方法であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算し、
演算された該領域に基づき、前記異常なデータをフィルタリングすることを特徴とするデータのフィルタリング方法（第１の局面）。
ここに、ｎ＝２、ｍ＝２として、第１の対象及び第２の対象をそれぞれサービスＡ及びサービスＢとし、第１の出力源及び第２の出力源をアンケートの質問とし、第１〜第４のデータを質問に対する評価とすれば（第２の局面）、この方法が多変量データのフィルタリングに適するものであることがわかる。アンケート結果の処理は多変量データ処理の一例であるからである。なお、このように第２の局面で規定の多変量データのフィルタリング方法がアンケート結果のフィルタリング以外の多変量データのフィルタリングに適用可能なことは、後述の実施の形態で説明する。

この発明の第３の局面は次のように規定される。即ち、
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定方法であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算し、
演算された該領域に基づき、前記異常出力源を特定することを特徴とする異常出力源特定方法。

このように規定される第３の局面の異常出力源特定方法において、第２の局面と同様に、ｎ＝２、ｍ＝２として第１の対象及び第２の対象をそれぞれサービスＡ及びサービスＢとし、第１の出力源及び第２の出力源をアンケートの質問とし、第１〜第４のデータを質問に対する評価とすれば、第３の局面に記載の方法が異常出力源（即ち、異常な回答を引き出すおそれのある質問）を特定することに適していることがわかる（第４の局面）。

この発明の第５の局面は次のように規定される。即ち、上記第４の異常出力源特定方法において、前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存し、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存し、
前記第１〜第４のデータの各平均値を演算し、
得られた平均値を前記仮想空間へプロットして前記第１の出力源からのデータ平均値と前記第２の出力源からのデータ平均値との間の距離を演算し、
演算された該距離と所定の第１のしきい値とを比較して、前記しきい値から外れた距離に関係する前記第１の出力源及び／又は前記第２の出力源を前記異常出力源とする。

このように規定される第５の局面の異常出力源特定方法によれば、各データの平均値をとってその距離を演算するので、データ取得時におけるデータ評価のバラつき（アンケート調査においては回答者の資質バラつき）を相殺し、出力源の出力の異常性を際立たせることができる。

この発明の第６の局面は次のように規定される。即ち、上記第４の異常出力源特定方法において、前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存し、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存し、
前記各データを前記仮想空間へプロットして、前記第１の出力源からのデータと前記第２の出力源からのデータとの間の平均及び分散を演算し、
演算された平均及び分散と、個別の前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較して異常出力源を特定する。

このように規定される第６の局面の異常出力源特定方法によれば、第１の対象の指標と第２の対象の指標とで形成される仮想空間へ第１の出力源から出力されたデータと第２の出力源から出力されたデータをプロットする。その結果、各データはクラスタ（集合体）を形成するので、第１の出力源から出力されたデータの第１のクラスタと第２の出力源から出力されたデータの第２のクラスタの、仮想空間上における位置関係を、平均と分散で表す。
得られた平均と分散より、例えば第２のしきい値を定め、個別のデータ間の距離を当該第２のしきい値と比較して、データの異常即ち、出力源の異常を特定することができる。
この局面の発明を第３の局面の発明と比較すると、この局面の発明ではデータを統計処理することにより、データの分散に応じてしきい値を変化させることができる。これは各出力源から出力されるデータの変動幅が大きいときに有効である。

この発明の第７の局面は次のように規定される。即ち、上記第４の局面異常出力源特定方法において、第１の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータと間の距離と、第２の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較し、
比較の結果に基づき異常出力源を特定する。

このように規定される第７の局面異常出力源特定装置によれば、異なる時刻におけるデータ間の距離を比較することにより、異常なデータを出力する出力源を特定可能となる。例えば、一つのプラントにおいて、第１の箇所（第１の対象）に第１のセンサ（第１の出力源）と第２のセンサ（第２の出力源）とを設置し、第２の箇所（第２の対象）に同じ定格の第１のセンサと第２のセンサとを設置する。プラントに要求される処理対象や処理速度において、各センサからの出力は変化するものとする。この場合、個別のセンサの出力を単独でモニタリングしてもそれが異常をきたしたか否かの判断は困難である。しかしながら、第７の局面で規定するように各センサを関連付ければ、異常な出力を出したセンサを抽出し、特定できる。

この発明の第８の局面の異常出力源特定装置は次のように規定される。即ち、第３の局面の異常出力源特定方法において、前記ｍ＝３として、第１の対象に関する第１の出力源からの第１のデータ（１−１）、第２の出力源からの第２のデータ（１−２）及び第３の出力源からの第５のデータ（１−３）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）、前記第２の出力源からの第４のデータ（２−２）及び第３の出力源からの第６のデータ（２−３）を前記第１〜第ｎの対象の指標で規定される仮想空間へプロットし、前記第１の出力源からのデータ（１−１，２−１）、前記第２の出力源からのデータ（１−２，２−２）及び第３の出力源からのデータ（１−３，２−３）とで囲まれる領域の面積を規定し、
演算された該面積に基づき、前記異常出力源を特定する。

ｍ＝２の場合、アンケート調査におけるカウンタ−質問対の有効性判断等に利用できることは既述の通りであり、ｍ＝３としたこの局面においても、例えばアンケート調査において３つの関連する質問の有効性判断等に利用できることは容易に想定されよう。更には、サプライヤの品質、納期、コストの管理に適用できることは実施の形態で詳述する。
ｍ＝３の場合、仮想空間において３つの出力源からのデータによって平面が規定される。従って、この平面の面積を基準にして異常なデータ、即ち異常な出力源を特定することができる。
さらには、対象の指標を変化させたときの上記面積の変化をモニタリングし、所定のしきい値内に上記面積が収まるように対象の指標を規定ないし調節することができる。
ここに、この明細書において、対象の指標とは対象を評価するための指標であり、任意に付与できる。例えばアンケート調査では５段階評価を用いることができる。
ｍ＝４の場合は、ｎ＝２の場合は４つの出力源から規定されるのは平面であるが、ｎ＝３の場合は、体積が規定されるので、この体積を基準にして異常なデータ、即ち異常な出力源を特定することができる。さらには、対象の指標を変化させたときの上記体積の変化をモニタリングし、所定のしきい値内に上記体積が収まるように対象の指標を規定ないし調節することができる。
さらに敷衍すれば、ｍ＝４以上の場合に４以上の出力源により、対象ｎの次数の領域（即ち、ｎ＝２ときは平面、ｎ＝３のとき体積、ｎ＝４のときはｎ次元空間）が規定される。このｎ次領域を基準にして異常なデータ、即ち異常な出力源を特定することができる。さらには、対象の指標を変化させたときの上記ｎ次領域の変化をモニタリングし、所定の閾値内に上記ｎ次領域が収まるように対象の指標を規定ないし調節することができる。

この発明の第９の局面は次のように規定される。即ち、
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータをフィルタリングするデータのフィルタリング装置であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算する手段と、
演算された該領域に基づき、前記異常なデータをフィルタリングする手段と、を備えることを特徴とするデータのフィルタリング装置。
このように規定される第９の局面の多変量データのフィルタリング装置によれば、第１の局面の発明と同じ効果が得られる。

この発明の第１０の局面は次のように規定される。即ち、第９の局面に規定の装置において、前記ｍ＝２として、第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）及び前記第２の出力源からの第４のデータ（２−２）とを前記第１〜第ｎの対象の指標で規定される仮想空間へプロットする手段と、
前記第１の出力源からデータ（１−１，２−１）と前記第２の出力源からのデータ（２−１，２−２）との間の距離を演算する手段と、
演算された該距離に基づき、前記異常なデータを除去する手段と、
を備える。
このように規定される第１０の局面の異常出力源特定装置によれば、第２の局面の同じ効果が得られる。

この発明の第１１の局面は次のように規定される。即ち、
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定装置であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算する手段と、
演算された該領域に基づき、前記異常出力源を特定する手段と、を備えることを特徴とする異常出力源特定装置。
このように規定される第１１の局面の異常出力源特定装置によれば、第３の局面の同じ効果が得られる。

この発明の第１２の局面は次のように規定される。即ち、第１１の局面に規定の装置において、前記ｍ＝２として、第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）及び前記第２の出力源からの第４のデータ（２−２）を前記第１〜第ｎの対象の指標と規定される仮想空間へプロットする手段と、
前記第１の出力源からデータ（１−１，２−１）と前記第２の出力源からのデータ（２−１，２−２）との間の距離を演算する手段と、
演算された該距離に基づき、前記異常出力源を特定する手段と、
を備える。
このように規定される第１２の局面の異常出力源特定装置によれば、第４の局面の同じ効果が得られる。

この発明の第１３の局面は次のように規定される。即ち、第１２の局面に規定の装置において、前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存する手段と、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存する手段と、
前記第１〜第４のデータの各平均値を演算する手段と、
得られた平均値を前記仮想空間へプロットして前記第１の出力源からのデータ平均値と前記第２の出力源からのデータ平均値との間の距離を演算する手段と、
演算された該距離と所定の第１のしきい値距離とを比較して、しきい値を超えた距離に関係する前記第１の出力源及び／又は前記第２の出力源を前記異常出力源とする手段と、を備える。
このように規定される第の１３の局面の異常出力源特定装置によれば、第５の局面の同じ効果が得られる。

この発明の第１４の局面は次のように規定される。即ち、第１２の局面に規定の装置において、前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存する手段と、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存する手段と、
前記各データを前記仮想空間へプロットして、前記第１の出力源からのデータと前記第２の出力源からのデータとの間の平均及び分散を演算する手段と、
演算された平均及び分散と、個別の前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較して、異常出力源を特定する手段と、を備える。
このように規定される第の１４の局面の異常出力源特定装置によれば、第６の局面の同じ効果が得られる。

この発明の第１５の局面は次のように規定される。即ち、第１２の局面に規定の装置において、第１の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータと間の距離と、第２の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較する手段と、
比較の結果に基づき異常出力源を特定する手段と、を備える。
このように規定される第の１５の局面の異常出力源特定装置によれば、第７の局面の同じ効果が得られる。

この発明の第１６の局面は次のように規定される。即ち、第１１の局面の装置において、前記ｍ＝３として、第１の対象に関する第１の出力源からの第１のデータ（１−１）、第２の出力源からの第２のデータ（１−２）及び第３の出力源からの第５のデータ（１−３）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）、前記第２の出力源からの第４のデータ（２−２）及び第３の出力源からの第６のデータ（２−３）を前記第１〜第ｎの対象の指標で規定される仮想空間へプロットする手段と、
前記第１の出力源からのデータ（１−１，２−１）、前記第２の出力源からのデータ（１−２，２−２）及び第３の出力源からのデータ（１−３，２−３）とで囲まれる領域の面積を演算する手段と、
演算された該面積に基づき、前記異常出力源を特定する手段と、
を備える。
このように規定される第の１６の局面の異常出力源特定装置によれば、第８の局面の同じ効果が得られる。

本発明の一実施の形態であるアンケートの処理方法の原理を示すグラフである。アンケート処理方法の実施形態を示すフローチャートである。本発明の他の実施の形態であるサプライヤ管理方法の原理を示すグラフである。本発明の他の実施の形態であるプラントとセンサの配置関係を示す模式図である。本発明の他の実施の形態であるプラントのセンサ管理方法の原理を示すグラフである。本発明の他の実施の形態であるサプライヤ管理方法の原理を示すグラフである。この発明の実施の形態のデータ処理装置の構成を示すブロック図である。

この発明がアンケート調査において不適な質問を特定することに役立つことは図１をもって既述した。
さらには、カウンター質問対の有効性について検証するには、カウンター質問対の一方の評価指標を反転し、その距離の遠近を所定の第２のしきい値と比較する。カウンター質問対として有効に作用していれば反転後は充分に近接することになる。従って、反転後の距離が上記第２のしきい値を上回る場合はカウンター質問対の有効性に疑問が生じる。そこで、反転後における回答者毎のデータ間距離の相関を演算することが好ましい。そして、データ間距離の相関係数が所定の範囲内にあれば、カウンター質問対は有効なものと判断することができる。

以上より、アンケート調査において不適な質問を特定する方法は図２のフローチャートに示すものとなる。
ステップ１では、第１の対象（サービスＡ）及び第２の対象（サービスＢ）につきその評価の指標に基づいて仮想空間を設定する。ステップ３では仮想空間に各質問に対する回答の評価をプロットする。ステップ５ではカウンター質問対を抽出して、平均値の仮想空間内における距離を演算し（図１（Ｃ）参照）、その距離が所定の第１のしきい値以下のものはカウンター質問対として無効とする（ステップ７）。ステップ９では、有効とされたカウンタ−質問対の一方の評価を反転する。即ち、五段階評価において評価１を評価５に、評価２を評価４に、評価３はそのままに、評価４は評価２に、評価５は評価１にする。そして、平均値の仮想空間におけるカウンター質問対間の距離を再度演算し（ステップ１１）、その距離が所定の第２のしきい値以上のときは、カウンター質問対として無効とする（ステップ１３）。ステップ１３でも有効とされた各カウンター質問対について（図１（Ａ）,図１（Ｂ）参照）、ステップ９の回答者毎の距離の相関を演算し（ステップ１５）、相関係数が所定の第３のしきい値以上にあるもの抽出し（ステップ１７）、それを有効なカウンター質問対とする（ステップ１８）。

次に、この発明の異常出力源特定方法がサプライヤの管理手法として使用できることを説明する。ここにサプライヤの管理手法における出力源は個別のサプライヤであり、その出力、即ちパフォーマンスが不適となったサプライヤの地位を変動し、またはサプライチェーン等を構成するサプライヤグループから外す場合を想定する。
あるユーザは２つのサプライヤグループを管理している。１つのサプライヤグループは納期が短く且つ不良率が低い優良サプライヤグループであり、他のサプライヤグループ（一般サプライヤグループ）はその納期及び不良率がともに優良サプライヤグループに比較して劣っている。ユーザはその取扱い（買い取り価格等）において優良サプライヤグループと一般サプライヤグループとの間に差を設けている。
ここでサプライヤの扱う物の納期（第１の対象）や不良率（第２の対象）が季節、景気その他の要因で大きく変動するものとする（例えば貴重な農産物、海産物、鉱物等）。

図３において優良サプライヤグループの各サプライヤの納期（第１の出力）及び不良率（第２の出力）の実績を実太線で示してある。符号１１がある商品Ｘに対する優良サプライヤグループの納期及び不良率（以下、「パフォーマンス」ということがある）の分布であり、符号１３はある商品Ｙに対する優良サプライヤグループの同じくパフォーマンスの分布である。他方、一般サプライヤグループの各サプライヤの納期及び不良率の範囲を実細線で示してある。符号１５は商品Ｘに対する一般サプライヤグループの納期及び不良率の分布であり、符号１７は商品Ｙに対する一般サプライヤグループの同じくパフォーマンスの分布である。季節等の要因により各サプライヤの納期及び不良率は大きく変動する。図中の点線は変動の方向及び範囲を示す。
しかしながら、同じ要因のもとでは、ユーザからみれば、優良サプライヤグループに属するサプライヤと一般サプライヤグループに属するサプライヤとでは依然として納期及び不良率に差が生じているべきである。

変動幅が大きいので、瞬間的には、一般サプライヤグループに属するサプライヤのパフォーマンスが優良サプライヤグループに属するサプライヤＳのパフォーマンスを凌駕することがある。
このとき、当該優良サプライヤグループに属するサプライヤＳの低パフォーマンス原因が当該サプライヤＳの怠慢にあるか、若しくは避けがたい外部要因にあるかを判断するにあたり、優良サプライヤグループに属する他のサプライヤのパフォーマンスの変化を参照する。
このとき、優良サプライヤグループに属する各サプライヤのパフォーマンスの変化（図２のグラフ上の距離）の平均値のみを基準とするのではなく、その分散を考慮に入れることが好ましい。即ち、サプライヤグループのデータ分布が大きな分散を示すときはしきい値を平均値より大きくとり、反対に分散が小さいときはしきい値を平均値より小さくし、このしきい値とサプライヤＳのデータ間距離とを比較する。サプライヤＳのデータ間距離がこのしきい値から大きく外れるときはサプライヤＳの低パフォーマンスの原因がサプライヤＳ自身に起因するものと考えられる。

更には、参考として一般サプライヤグループにおける各サプライヤのデータ間距離の平均を求め、これとサプライヤＳのデータ間距離とを比較することもできる。
例えば、優良サプライヤグループの平均データ間距離と一般サプライヤグループの平均データ間距離とに大きな差があるところ、サプライＳのデータ間距離が一般サプライヤグループの平均データ間距離に近いときはサプライヤＳの低パフォーマンはサプライヤＳ自身に原因があるのとみることができる。

図４に他の実施の形態を示す。
図４はあるプラントの配管を示す。主配管３０から２つの配管３１、３３が分岐している。第１の配管（第１の対象）３１には流量センサＴ１（第１の出力源）と温度計Ｔ２（第２の出力源）が付設される。同様に第２の配管（第２の対象）３３にも流量センサＴ１と温度計Ｔ２が付設される。第１の配管３１と第２の配管３３に付設される流量センサＴ１及び温度計Ｔ２はそれぞれ同じ定格としたが、これに限られるものではない。
プラントへ流通させる処理対象及び目的とする処理速度に応じて、各センサＴ１，Ｔ２の出力は刻々と変化するものとする。従って、センサＴ１の単体の出力をモニタリングしてもその出力に異常をきたしているか否かを判定することは困難である。

ここに、図４に示す通り第１の配管３１での流量センサＴ１と温度Ｔ２の出力を横軸にし（即ち横軸には流量と温度とが指標として含まれる）、第２の配管３３での流量センサＴ１と温度センサＴ２の出力を縦軸にする（即ち縦軸にも流量と温度との指標ある）。そして、第１の時刻における各配管３１、３３での流量センサＴ１及び温度センサＴ２の出力をプロットし（図５の○参照）、そのデータ間距離Ｌ１を求める。
同様に第２の時刻における各配管３１、３３での流量センサＴ１及び温度センサＴ２の出力をプロットし（図５の●参照）、そのデータ間距離Ｌ２を求める。
第１の配管３１と第２の配管３３とには相関があるので、各流量センサＴ１及び温度センサＴ２の出力にも相関が生じ、それぞれの絶対出力は変化しているものの、データ間距離は一定の範囲に収まる。そして、このデータ間距離が一定の範囲から逸脱したとき、いずれかのセンサに異常が来たしたものと判断される。
この場合、異常な出力となったセンサを個別に特定できるものではないが、センサの出力をモニタする異常出力のセンサの絞り込みができるので、メンテナンス上有効である。

図６に他の実施の形態を示す。
図６の例では部品Ａ及び部品Ｂをそれぞれ第１の対象及び第２の対象とし、サプライヤごとにその納期、コスト及び品質を評価する。評価の指標は対象毎に任意に設定可能とする。
サプライヤ（イ）の部品Ａ及び部品Ｂについて納期、コスト及び品質を図６（Ａ）のようにプロットする。同様にサプライヤ（ロ）のプロット結果を図６（Ｂ）に示す。他のサプライヤも含めた結果は図６（Ｃ）となり、図６（Ｃ）において円はサプライヤの分布を示す。また、図６（Ｃ）の三角の各頂点は、各分布における重心を指す。
上記において、個別のサプライヤ（イ）、(ロ)のパフォーマンスを、各図中の三角形（い）、（ろ）の面積と平均したグラフの三角形（は）の面積とを比較することにより、評価できる。

また、図６（Ｃ）においては品質においてサプライヤの評価の分散が大きい。品質の評価は任意に設定可能であるので、対象Ａ，Ｂにおける評価の指標を変更することにより（即ち、縦横軸のスケールを調整することにより）仮想空間における分散も変更する。従って、図６（Ｃ）の結果をモニタリングしながら、対象の評価の指標を調整することができる。このとき、三角形（は）の面積若しくは形状についても、対象の評価の指標を調整するときの参照となる。

図７は、図１〜図６で説明したデータ処理を行う装置５０の構成を示すブロック図であり、このデータ処理装置５０として汎用的なコンピュータ装置を利用することができる。
このデータ処理装置５０は制御部５１、入力装置５３、メモリ装置６０、データ処理装置７０及び出力装置８０を備える。
制御部５１は他の要素の動作を制御する。入力装置５３はキーボード、マウス、媒体リーダ等の汎用的な入力インターフェースからなる。例えばアンケート結果の入力は所定のフォーマットに対して回答者の評価を数値としてキーボード入力する。入力されたデータは一次データ保存部６１に保存される。予め定められるしきい値も入力装置５３を介して入力され、しきい値保存部６３に保存される。

メモリ装置６０は一次データ保存部６１としきい値保存部６３を備える。メモリ装置６０としては汎用のハードディスクを用いることができ、その所定の領域を一次データ保存部６１としきい値保存部６３とに割り付ける。
データ処理装置７０は仮想空間作成部７１、データプロット部７３、異常データ抽出部７５及び異常出力源特定部７７を備える。
仮想空間作成部７１は一次データ保存部６１に保存されているデータから対象（アンケートデータ処理の例ではサービス）を抽出し、その評価を指標として（軸にとり）、仮想空間を形成する。図１〜図６の例では説明を簡単にするため、２つの指標からなる二次元空間を例にとっているが、勿論三次元以上の多次元空間を採用することができる。

仮想空間作成部７１で作成された仮想空間に対して、データプロット部７３は一次データ保存部から対応するデータを読み出してプロットする。例えば、アンケートデータ処理の例では質問毎に回答者の評点をプロットする。
異常データ抽出部７５は、プロットさえたデータ間の距離を演算する。図１〜図６に示すような二次元の場合は三角法でそのデータ間の距離を演算することができるが、多次元空間においては、次のようにして演算することができる。

得られたデータ間の距離をしきい値保存部６３に保存されているしきい値と比較し、得られたデータ間距離がしきい値範囲外にあるとき、異常なデータであると特定する。
特定結果は異常出力源特定部７７へ送られる。この異常出力源特定部７７において、図１に示すアンケートデータ処理の例では不適切な質問が特定される。
異常出力源特定部７７で特定された異常出力源はディスプレイ等からなる出力装置８０を介してオペレータに知らされる。

この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。

５０データ処理装置
５１制御部
６０メモリ装置
７０データ処理装置

Claims

第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータをフィルタリングするデータのフィルタリング方法であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算し、
演算された該領域に基づき、前記異常なデータをフィルタリングすることを特徴とするデータのフィルタリング方法。
前記ｍ＝２として、第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）及び前記第２の出力源からの第４のデータ（２−２）とを
前記第１〜第ｎの対象の指標で規定される仮想空間へプロットし、前記第１の出力源からデータ（１−１，２−１）と前記第２の出力源からのデータ（２−１，２−２）との間の距離を演算し、
演算された該距離に基づき、前記異常なデータを除去する、
ことを特徴とする請求項１に記載のデータのフィルタリング方法。
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定方法であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算し、
演算された該領域に基づき、前記異常出力源を特定することを特徴とする異常出力源特定方法。
前記ｍ＝２として、第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）及び前記第２の出力源からの第４のデータ（２−２）を前記第１〜第ｎの対象の指標と規定される仮想空間へプロットし、前記第１の出力源からデータ（１−１，２−１）と前記第２の出力源からのデータ（２−１，２−２）との間の距離を演算し、
演算された該距離に基づき、前記異常出力源を特定する、
ことを特徴とする請求項３に記載の異常出力源特定方法。
前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存し、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存し、
前記第１〜第４のデータの各平均値を演算し、
得られた平均値を前記仮想空間へプロットして前記第１の出力源からのデータ平均値と前記第２の出力源からのデータ平均値との間の距離を演算し、
演算された該距離と所定の第１のしきい値距離とを比較して、しきい値を超えた距離に関係する前記第１の出力源及び／又は前記第２の出力源を前記異常出力源とする、ことを特徴とする請求項４に記載の異常出力源特定方法。
前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存し、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存し、
前記各データを前記仮想空間へプロットして、前記第１の出力源からのデータと前記第２の出力源からのデータとの間の平均及び分散を演算し、
演算された平均及び分散と、個別の前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較して、異常出力源を特定する、ことを特徴とする請求項４に記載の異常出力源特定方法。
第１の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータと間の距離と、第２の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較し、
比較の結果に基づき異常出力源を特定する、ことを特徴とする請求項４に記載の異常出力源特定方法。
前記ｍ＝３として、第１の対象に関する第１の出力源からの第１のデータ（１−１）、第２の出力源からの第２のデータ（１−２）及び第３の出力源からの第５のデータ（１−３）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）、前記第２の出力源からの第４のデータ（２−２）及び第３の出力源からの第６のデータ（２−３）を前記第１〜第ｎの対象の指標で規定される仮想空間へプロットし、前記第１の出力源からのデータ（１−１，２−１）、前記第２の出力源からのデータ（１−２，２−２）及び第３の出力源からのデータ（１−３，２−３）とで囲まれる領域の面積を演算し、
演算された該面積に基づき、前記異常出力源を特定する、
ことを特徴とする請求項３に記載の異常出力源特定方法。
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータをフィルタリングするデータのフィルタリング装置であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算する手段と、
演算された該領域に基づき、前記異常なデータをフィルタリングする手段と、を備えることを特徴とするデータのフィルタリング装置。
前記ｍ＝２として、第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）及び前記第２の出力源からの第４のデータ（２−２）とを
前記第１〜第ｎの対象の指標で規定される仮想空間へプロットする手段と、
前記第１の出力源からデータ（１−１，２−１）と前記第２の出力源からのデータ（２−１，２−２）との間の距離を演算する手段と、
演算された該距離に基づき、前記異常なデータを除去する手段と、
を備えることを特徴とする請求項９に記載のデータのフィルタリング装置。
第１〜第ｎの対象（ｎは２以上の自然数）のそれぞれに関する第１〜第ｍ（ｍは２以上の自然数）の出力源からの第１〜第ｍのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定装置であって、
前記第１〜第ｎの対象の指標で規定される仮想空間における前記第１〜第ｍの出力源からのデータで規定される領域（ただし、ｍ＝２のときは距離）を演算する手段と、
演算された該領域に基づき、前記異常出力源を特定する手段と、を備えることを特徴とする異常出力源特定装置。
前記ｍ＝２として、第１の対象に関する第１の出力源からの第１のデータ（１−１）及び第２の出力源からの第２のデータ（１−２）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）及び前記第２の出力源からの第４のデータ（２−２）を前記第１〜第ｎの対象の指標と規定される仮想空間へプロットする手段と、
前記第１の出力源からデータ（１−１，２−１）と前記第２の出力源からのデータ（２−１，２−２）との間の距離を演算する手段と、
演算された該距離に基づき、前記異常出力源を特定する手段と、
を備えることを特徴とする請求項１１に記載の異常出力源特定装置。
前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存する手段と、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存する手段と、
前記第１〜第４のデータの各平均値を演算する手段と、
得られた平均値を前記仮想空間へプロットして前記第１の出力源からのデータ平均値と前記第２の出力源からのデータ平均値との間の距離を演算する手段と、
演算された該距離と所定の第１のしきい値距離とを比較して、しきい値を超えた距離に関係する前記第１の出力源及び／又は前記第２の出力源を前記異常出力源とする手段と、を備えることを特徴とする請求項１２に記載の異常出力源特定装置。
前記第１の出力源からの前記第１のデータ及び第２のデータをそれぞれ複数保存する手段と、
前記第２の出力源からの前記第３のデータ及び第４のデータをそれぞれ複数保存する手段と、
前記各データを前記仮想空間へプロットして、前記第１の出力源からのデータと前記第２の出力源からのデータとの間の平均及び分散を演算する手段と、
演算された平均及び分散と、個別の前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較して、異常出力源を特定する手段と、を備えることを特徴とする請求項１２に記載の異常出力源特定装置。
第１の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータと間の距離と、第２の時刻における前記第１の出力源からのデータと前記第２の出力源からのデータとの間の距離と、を比較する手段と、
比較の結果に基づき異常出力源を特定する手段と、を備えることを特徴とする請求項１２に記載の異常出力源特定装置。
前記ｍ＝３として、第１の対象に関する第１の出力源からの第１のデータ（１−１）、第２の出力源からの第２のデータ（１−２）及び第３の出力源からの第５のデータ（１−３）と、第２の対象に関する前記第１の出力源からの第３のデータ（２−１）、前記第２の出力源からの第４のデータ（２−２）及び第３の出力源からの第６のデータ（２−３）を前記第１〜第ｎの対象の指標で規定される仮想空間へプロットする手段と、
前記第１の出力源からのデータ（１−１，２−１）、前記第２の出力源からのデータ（１−２，２−２）及び第３の出力源からのデータ（１−３，２−３）とで囲まれる領域の面積を演算する手段と、
演算された該面積に基づき、前記異常出力源を特定する手段と、
を備えることを特徴とする請求項１１に記載の異常出力源特定装置。