JP2011086037A - データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置 - Google Patents

データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置 Download PDF

Info

Publication number
JP2011086037A
JP2011086037A JP2009237073A JP2009237073A JP2011086037A JP 2011086037 A JP2011086037 A JP 2011086037A JP 2009237073 A JP2009237073 A JP 2009237073A JP 2009237073 A JP2009237073 A JP 2009237073A JP 2011086037 A JP2011086037 A JP 2011086037A
Authority
JP
Japan
Prior art keywords
data
output source
output
abnormal
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009237073A
Other languages
English (en)
Inventor
Takeshi Furuhashi
武 古橋
Ohiro Yoshikawa
大弘 吉川
Yosuke Watanabe
庸介 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagoya University NUC
Original Assignee
Nagoya University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nagoya University NUC filed Critical Nagoya University NUC
Priority to JP2009237073A priority Critical patent/JP2011086037A/ja
Publication of JP2011086037A publication Critical patent/JP2011086037A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】新規な多変量データのフィルタリング方法を提案する。
【解決手段】第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する第1の出力源からの第3のデータ(2−1)と第2の出力源からの第4のデータ(2−2)とを比較して異常なデータをフィルタリングするデータのフィルタリング方法であって、第1の対象の指標と第2の対象の指標とで規定される仮想空間における第1の出力源からデータ(1−1,2−1)と第2の出力源からのデータ(2−1,2−2)との間の距離を演算し、演算された該距離に基づき、異常なデータを除去する。
【選択図】 なし

Description

本発明は、データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置に関する。本発明は多変量データの処理および多変量データの出力源の異常を特定することに好適に利用される。
多変量データ処理の一例としてアンケート処理がある。例えばn個の対象に対するm個の質問項目からなるアンケート結果は、アンケートの回答者数をk人とすると、n×m×k通りのデータとなりうる。
このような多変量データからなるアンケート結果の処理は、m本の質問項目軸空間に回答者の評点がプロットされ、これら評点に対して解析がなされる。アンケート結果には、矛盾した回答が含まれる可能性がある。矛盾した回答はアンケートの解析結果をゆがめてしまう怖れがある。この問題に対応するために、従来より、矛盾した回答の組合せパターンに基づくデータクリーニングおよび関連質問に関する回答結果を利用した矛盾度判定手法が提案されている(非特許文献1参照)。
しかし、この手法では複数の同一内容の質問に対する回答が異なる回答者を特定できるが、アンケート中に複数回登場しないと質問に対する回答の矛盾は特定できない。即ち、質問内容の同一性がアンケート回答者の解釈に依存し、アンケート実施者の意図とは異なることがあり、回答者の解釈においては矛盾していない回答結果を除去してしまうおそれがある。
これに対して、ライフスタイルなどの関連質問に関する回答結果を利用して、実際のアンケート回答結果の矛盾度を判定し、矛盾する回答数が一定割合以上の回答者を矛盾回答者とする手法が提案されている(特許文献1参照)。
特開2005−202619号公報
後藤秀雄、「市場調査ケーススタディ改訂新版」、日本マーケティング教育センタ、1996
特許文献1に記載の手法では、アンケート中に本来の質問事項に加えて別途ライフスタイルなどの関連質問が設定される。その結果、質問数が増大して回答者を疲労させ、不真面目なひいては矛盾した回答を増やしてしまうおそれがある。また、アンケートの実施者と回答者との間で生じうる質問に対する解釈の齟齬を解消できない。
本発明者らは上記課題を解決すべく鋭意検討を重ねてきところ、m本の質問項目軸空間における回答者の評点分布を解析するのではなく、回答者の評点をプロットする空間をn本の対象軸から形成されるものとしたところ全く新しい展開が見えてきた。
例えばアンケートの対象が商品デリバリに関するサービスA(第1の対象)及びサービスB(第2の対象)であり、アンケートの結果として確認したい情報として(1)斬新性、(2)必要性、(3)認知度が含まれるときのアンケートの質問例を次に示す。
Figure 2011086037
一般的なアンケート手法としてカウンター質問対を設けることがあり、上記のアンケートにおいても確認したい情報(アンケート実施者の意図)(1)、(2)及び(3)にカウンター質問対が設けられている。
回答者に求める評価を五段階としたとき、一人の回答者甲がカウンター質問対のそれぞれにくだす評価は相対になると考えられる。例えば、質問Q4「こんなサービスがほしい」に「5」の評価をくだした回答者は質問Q13「必要性を感じない無駄なサービスだ」には「1」の評価をくだすと予想される。
そこでサービスAに対する評価を横軸に、サービスBに対する評価を縦軸にして回答者甲の回答結果をプロットする。結果を図1(A)に示す。サービスA及びサービスBに関するカウンター質問に対する評価どうしが大きく離れており、この結果では確認したい情報(1)、(2)及び(3)についてカウンター質問対が有効に作用していることがわかる。
他方、回答者乙の回答結果を示す図1(B)では(3)の質問対Q9及びQ11の評価が近くにあり、カウンター質問対が有効に作用していない。このことは、質問の文章があいまいであってアンケート実施者による質問の意図が充分に回答者乙に伝わらない場合と、回答者乙自身の資質(まじめさ、文章の理解能力等)に問題がある場合とが考えられる。
そこで、同様の処理を回答者丙 …… nのアンケート結果について実行し、各質問に対する評価の平均値を図1(C)に示す。
図1(C)の結果から、比較的近くに位置する質問対Q9及びQ11については、アンケート実施者の意図が回答者にうまく伝わっていないことがわかる。これは、回答者の資質ではなく質問の文章自体に問題があることを意味する。換言すれば、異常な評価を引き出すおそれのある質問を特定することができる。
他方、質問対Q4及びQ13や質問対Q8及びQ14は充分に離散しているのでカウンター質問対として有効に作用していることがわかる。従って、かかるカウンター質問対に対して離散した評価を下していない回答者はその資質に問題があると推定される。よって、かかる回答者の回答はアンケート結果として採用しないようにすることが好ましい。
以上より、本発明者らが開発した手法によれば、従来例で採用されたような余計な質問(ライフスタイルなどの関連質問)を何ら含めることなく、かつアンケート実施者の意図と回答者の解釈との整合性を担保しつつ、有効なアンケート結果のみを抽出(フィルタリング)できることがわかる。
この発明は、上記で説明したアンケート結果処理方法に関する本発明者らの新たな知見を多変量データの処理に敷衍したものであり、次のように規定される。即ち、
第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータをフィルタリングするデータのフィルタリング方法であって、
前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算し、
演算された該領域に基づき、前記異常なデータをフィルタリングすることを特徴とするデータのフィルタリング方法(第1の局面)。
ここに、n=2、m=2として、第1の対象及び第2の対象をそれぞれサービスA及びサービスBとし、第1の出力源及び第2の出力源をアンケートの質問とし、第1〜第4のデータを質問に対する評価とすれば(第2の局面)、この方法が多変量データのフィルタリングに適するものであることがわかる。アンケート結果の処理は多変量データ処理の一例であるからである。なお、このように第2の局面で規定の多変量データのフィルタリング方法がアンケート結果のフィルタリング以外の多変量データのフィルタリングに適用可能なことは、後述の実施の形態で説明する。
この発明の第3の局面は次のように規定される。即ち、
第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定方法であって、
前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算し、
演算された該領域に基づき、前記異常出力源を特定することを特徴とする異常出力源特定方法。
このように規定される第3の局面の異常出力源特定方法において、第2の局面と同様に、n=2、m=2として第1の対象及び第2の対象をそれぞれサービスA及びサービスBとし、第1の出力源及び第2の出力源をアンケートの質問とし、第1〜第4のデータを質問に対する評価とすれば、第3の局面に記載の方法が異常出力源(即ち、異常な回答を引き出すおそれのある質問)を特定することに適していることがわかる(第4の局面)。
この発明の第5の局面は次のように規定される。即ち、上記第4の異常出力源特定方法において、前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存し、
前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存し、
前記第1〜第4のデータの各平均値を演算し、
得られた平均値を前記仮想空間へプロットして前記第1の出力源からのデータ平均値と前記第2の出力源からのデータ平均値との間の距離を演算し、
演算された該距離と所定の第1のしきい値とを比較して、前記しきい値から外れた距離に関係する前記第1の出力源及び/又は前記第2の出力源を前記異常出力源とする。
このように規定される第5の局面の異常出力源特定方法によれば、各データの平均値をとってその距離を演算するので、データ取得時におけるデータ評価のバラつき(アンケート調査においては回答者の資質バラつき)を相殺し、出力源の出力の異常性を際立たせることができる。
この発明の第6の局面は次のように規定される。即ち、上記第4の異常出力源特定方法において、前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存し、
前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存し、
前記各データを前記仮想空間へプロットして、前記第1の出力源からのデータと前記第2の出力源からのデータとの間の平均及び分散を演算し、
演算された平均及び分散と、個別の前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較して異常出力源を特定する。
このように規定される第6の局面の異常出力源特定方法によれば、第1の対象の指標と第2の対象の指標とで形成される仮想空間へ第1の出力源から出力されたデータと第2の出力源から出力されたデータをプロットする。その結果、各データはクラスタ(集合体)を形成するので、第1の出力源から出力されたデータの第1のクラスタと第2の出力源から出力されたデータの第2のクラスタの、仮想空間上における位置関係を、平均と分散で表す。
得られた平均と分散より、例えば第2のしきい値を定め、個別のデータ間の距離を当該第2のしきい値と比較して、データの異常即ち、出力源の異常を特定することができる。
この局面の発明を第3の局面の発明と比較すると、この局面の発明ではデータを統計処理することにより、データの分散に応じてしきい値を変化させることができる。これは各出力源から出力されるデータの変動幅が大きいときに有効である。
この発明の第7の局面は次のように規定される。即ち、上記第4の局面異常出力源特定方法において、第1の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータと間の距離と、第2の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較し、
比較の結果に基づき異常出力源を特定する。
このように規定される第7の局面異常出力源特定装置によれば、異なる時刻におけるデータ間の距離を比較することにより、異常なデータを出力する出力源を特定可能となる。例えば、一つのプラントにおいて、第1の箇所(第1の対象)に第1のセンサ(第1の出力源)と第2のセンサ(第2の出力源)とを設置し、第2の箇所(第2の対象)に同じ定格の第1のセンサと第2のセンサとを設置する。プラントに要求される処理対象や処理速度において、各センサからの出力は変化するものとする。この場合、個別のセンサの出力を単独でモニタリングしてもそれが異常をきたしたか否かの判断は困難である。しかしながら、第7の局面で規定するように各センサを関連付ければ、異常な出力を出したセンサを抽出し、特定できる。
この発明の第8の局面の異常出力源特定装置は次のように規定される。即ち、第3の局面の異常出力源特定方法において、前記m=3として、第1の対象に関する第1の出力源からの第1のデータ(1−1)、第2の出力源からの第2のデータ(1−2)及び第3の出力源からの第5のデータ(1−3)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)、前記第2の出力源からの第4のデータ(2−2)及び第3の出力源からの第6のデータ(2−3)を前記第1〜第nの対象の指標で規定される仮想空間へプロットし、前記第1の出力源からのデータ(1−1,2−1)、前記第2の出力源からのデータ(1−2,2−2)及び第3の出力源からのデータ(1−3,2−3)とで囲まれる領域の面積を規定し、
演算された該面積に基づき、前記異常出力源を特定する。
m=2の場合、アンケート調査におけるカウンタ−質問対の有効性判断等に利用できることは既述の通りであり、m=3としたこの局面においても、例えばアンケート調査において3つの関連する質問の有効性判断等に利用できることは容易に想定されよう。更には、サプライヤの品質、納期、コストの管理に適用できることは実施の形態で詳述する。
m=3の場合、仮想空間において3つの出力源からのデータによって平面が規定される。従って、この平面の面積を基準にして異常なデータ、即ち異常な出力源を特定することができる。
さらには、対象の指標を変化させたときの上記面積の変化をモニタリングし、所定のしきい値内に上記面積が収まるように対象の指標を規定ないし調節することができる。
ここに、この明細書において、対象の指標とは対象を評価するための指標であり、任意に付与できる。例えばアンケート調査では5段階評価を用いることができる。
m=4の場合は、n=2の場合は4つの出力源から規定されるのは平面であるが、n=3の場合は、体積が規定されるので、この体積を基準にして異常なデータ、即ち異常な出力源を特定することができる。さらには、対象の指標を変化させたときの上記体積の変化をモニタリングし、所定のしきい値内に上記体積が収まるように対象の指標を規定ないし調節することができる。
さらに敷衍すれば、m=4以上の場合に4以上の出力源により、対象nの次数の領域(即ち、n=2ときは平面、n=3のとき体積、n=4のときはn次元空間)が規定される。このn次領域を基準にして異常なデータ、即ち異常な出力源を特定することができる。さらには、対象の指標を変化させたときの上記n次領域の変化をモニタリングし、所定の閾値内に上記n次領域が収まるように対象の指標を規定ないし調節することができる。
この発明の第9の局面は次のように規定される。即ち、
第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータをフィルタリングするデータのフィルタリング装置であって、
前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算する手段と、
演算された該領域に基づき、前記異常なデータをフィルタリングする手段と、を備えることを特徴とするデータのフィルタリング装置。
このように規定される第9の局面の多変量データのフィルタリング装置によれば、第1の局面の発明と同じ効果が得られる。
この発明の第10の局面は次のように規定される。即ち、第9の局面に規定の装置において、前記m=2として、第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)及び前記第2の出力源からの第4のデータ(2−2)とを前記第1〜第nの対象の指標で規定される仮想空間へプロットする手段と、
前記第1の出力源からデータ(1−1,2−1)と前記第2の出力源からのデータ(2−1,2−2)との間の距離を演算する手段と、
演算された該距離に基づき、前記異常なデータを除去する手段と、
を備える。
このように規定される第10の局面の異常出力源特定装置によれば、第2の局面の同じ効果が得られる。
この発明の第11の局面は次のように規定される。即ち、
第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定装置であって、
前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算する手段と、
演算された該領域に基づき、前記異常出力源を特定する手段と、を備えることを特徴とする異常出力源特定装置。
このように規定される第11の局面の異常出力源特定装置によれば、第3の局面の同じ効果が得られる。
この発明の第12の局面は次のように規定される。即ち、第11の局面に規定の装置において、前記m=2として、第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)及び前記第2の出力源からの第4のデータ(2−2)を前記第1〜第nの対象の指標と規定される仮想空間へプロットする手段と、
前記第1の出力源からデータ(1−1,2−1)と前記第2の出力源からのデータ(2−1,2−2)との間の距離を演算する手段と、
演算された該距離に基づき、前記異常出力源を特定する手段と、
を備える。
このように規定される第12の局面の異常出力源特定装置によれば、第4の局面の同じ効果が得られる。
この発明の第13の局面は次のように規定される。即ち、第12の局面に規定の装置において、前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存する手段と、
前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存する手段と、
前記第1〜第4のデータの各平均値を演算する手段と、
得られた平均値を前記仮想空間へプロットして前記第1の出力源からのデータ平均値と前記第2の出力源からのデータ平均値との間の距離を演算する手段と、
演算された該距離と所定の第1のしきい値距離とを比較して、しきい値を超えた距離に関係する前記第1の出力源及び/又は前記第2の出力源を前記異常出力源とする手段と、を備える。
このように規定される第の13の局面の異常出力源特定装置によれば、第5の局面の同じ効果が得られる。
この発明の第14の局面は次のように規定される。即ち、第12の局面に規定の装置において、前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存する手段と、
前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存する手段と、
前記各データを前記仮想空間へプロットして、前記第1の出力源からのデータと前記第2の出力源からのデータとの間の平均及び分散を演算する手段と、
演算された平均及び分散と、個別の前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較して、異常出力源を特定する手段と、を備える。
このように規定される第の14の局面の異常出力源特定装置によれば、第6の局面の同じ効果が得られる。
この発明の第15の局面は次のように規定される。即ち、第12の局面に規定の装置において、第1の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータと間の距離と、第2の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較する手段と、
比較の結果に基づき異常出力源を特定する手段と、を備える。
このように規定される第の15の局面の異常出力源特定装置によれば、第7の局面の同じ効果が得られる。
この発明の第16の局面は次のように規定される。即ち、第11の局面の装置において、前記m=3として、第1の対象に関する第1の出力源からの第1のデータ(1−1)、第2の出力源からの第2のデータ(1−2)及び第3の出力源からの第5のデータ(1−3)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)、前記第2の出力源からの第4のデータ(2−2)及び第3の出力源からの第6のデータ(2−3)を前記第1〜第nの対象の指標で規定される仮想空間へプロットする手段と、
前記第1の出力源からのデータ(1−1,2−1)、前記第2の出力源からのデータ(1−2,2−2)及び第3の出力源からのデータ(1−3,2−3)とで囲まれる領域の面積を演算する手段と、
演算された該面積に基づき、前記異常出力源を特定する手段と、
を備える。
このように規定される第の16の局面の異常出力源特定装置によれば、第8の局面の同じ効果が得られる。
本発明の一実施の形態であるアンケートの処理方法の原理を示すグラフである。 アンケート処理方法の実施形態を示すフローチャートである。 本発明の他の実施の形態であるサプライヤ管理方法の原理を示すグラフである。 本発明の他の実施の形態であるプラントとセンサの配置関係を示す模式図である。 本発明の他の実施の形態であるプラントのセンサ管理方法の原理を示すグラフである。 本発明の他の実施の形態であるサプライヤ管理方法の原理を示すグラフである。 この発明の実施の形態のデータ処理装置の構成を示すブロック図である。
この発明がアンケート調査において不適な質問を特定することに役立つことは図1をもって既述した。
さらには、カウンター質問対の有効性について検証するには、カウンター質問対の一方の評価指標を反転し、その距離の遠近を所定の第2のしきい値と比較する。カウンター質問対として有効に作用していれば反転後は充分に近接することになる。従って、反転後の距離が上記第2のしきい値を上回る場合はカウンター質問対の有効性に疑問が生じる。そこで、反転後における回答者毎のデータ間距離の相関を演算することが好ましい。そして、データ間距離の相関係数が所定の範囲内にあれば、カウンター質問対は有効なものと判断することができる。
以上より、アンケート調査において不適な質問を特定する方法は図2のフローチャートに示すものとなる。
ステップ1では、第1の対象(サービスA)及び第2の対象(サービスB)につきその評価の指標に基づいて仮想空間を設定する。ステップ3では仮想空間に各質問に対する回答の評価をプロットする。ステップ5ではカウンター質問対を抽出して、平均値の仮想空間内における距離を演算し(図1(C)参照)、その距離が所定の第1のしきい値以下のものはカウンター質問対として無効とする(ステップ7)。ステップ9では、有効とされたカウンタ−質問対の一方の評価を反転する。即ち、五段階評価において評価1を評価5に、評価2を評価4に、評価3はそのままに、評価4は評価2に、評価5は評価1にする。そして、平均値の仮想空間におけるカウンター質問対間の距離を再度演算し(ステップ11)、その距離が所定の第2のしきい値以上のときは、カウンター質問対として無効とする(ステップ13)。ステップ13でも有効とされた各カウンター質問対について(図1(A),図1(B)参照)、ステップ9の回答者毎の距離の相関を演算し(ステップ15)、相関係数が所定の第3のしきい値以上にあるもの抽出し(ステップ17)、それを有効なカウンター質問対とする(ステップ18)。
次に、この発明の異常出力源特定方法がサプライヤの管理手法として使用できることを説明する。ここにサプライヤの管理手法における出力源は個別のサプライヤであり、その出力、即ちパフォーマンスが不適となったサプライヤの地位を変動し、またはサプライチェーン等を構成するサプライヤグループから外す場合を想定する。
あるユーザは2つのサプライヤグループを管理している。1つのサプライヤグループは納期が短く且つ不良率が低い優良サプライヤグループであり、他のサプライヤグループ(一般サプライヤグループ)はその納期及び不良率がともに優良サプライヤグループに比較して劣っている。ユーザはその取扱い(買い取り価格等)において優良サプライヤグループと一般サプライヤグループとの間に差を設けている。
ここでサプライヤの扱う物の納期(第1の対象)や不良率(第2の対象)が季節、景気その他の要因で大きく変動するものとする(例えば貴重な農産物、海産物、鉱物等)。
図3において優良サプライヤグループの各サプライヤの納期(第1の出力)及び不良率(第2の出力)の実績を実太線で示してある。符号11がある商品Xに対する優良サプライヤグループの納期及び不良率(以下、「パフォーマンス」ということがある)の分布であり、符号13はある商品Yに対する優良サプライヤグループの同じくパフォーマンスの分布である。他方、一般サプライヤグループの各サプライヤの納期及び不良率の範囲を実細線で示してある。符号15は商品Xに対する一般サプライヤグループの納期及び不良率の分布であり、符号17は商品Yに対する一般サプライヤグループの同じくパフォーマンスの分布である。季節等の要因により各サプライヤの納期及び不良率は大きく変動する。図中の点線は変動の方向及び範囲を示す。
しかしながら、同じ要因のもとでは、ユーザからみれば、優良サプライヤグループに属するサプライヤと一般サプライヤグループに属するサプライヤとでは依然として納期及び不良率に差が生じているべきである。
変動幅が大きいので、瞬間的には、一般サプライヤグループに属するサプライヤのパフォーマンスが優良サプライヤグループに属するサプライヤSのパフォーマンスを凌駕することがある。
このとき、当該優良サプライヤグループに属するサプライヤSの低パフォーマンス原因が当該サプライヤSの怠慢にあるか、若しくは避けがたい外部要因にあるかを判断するにあたり、優良サプライヤグループに属する他のサプライヤのパフォーマンスの変化を参照する。
このとき、優良サプライヤグループに属する各サプライヤのパフォーマンスの変化(図2のグラフ上の距離)の平均値のみを基準とするのではなく、その分散を考慮に入れることが好ましい。即ち、サプライヤグループのデータ分布が大きな分散を示すときはしきい値を平均値より大きくとり、反対に分散が小さいときはしきい値を平均値より小さくし、このしきい値とサプライヤSのデータ間距離とを比較する。サプライヤSのデータ間距離がこのしきい値から大きく外れるときはサプライヤSの低パフォーマンスの原因がサプライヤS自身に起因するものと考えられる。
更には、参考として一般サプライヤグループにおける各サプライヤのデータ間距離の平均を求め、これとサプライヤSのデータ間距離とを比較することもできる。
例えば、優良サプライヤグループの平均データ間距離と一般サプライヤグループの平均データ間距離とに大きな差があるところ、サプライSのデータ間距離が一般サプライヤグループの平均データ間距離に近いときはサプライヤSの低パフォーマンはサプライヤS自身に原因があるのとみることができる。
図4に他の実施の形態を示す。
図4はあるプラントの配管を示す。主配管30から2つの配管31、33が分岐している。第1の配管(第1の対象)31には流量センサT1(第1の出力源)と温度計T2(第2の出力源)が付設される。同様に第2の配管(第2の対象)33にも流量センサT1と温度計T2が付設される。第1の配管31と第2の配管33に付設される流量センサT1及び温度計T2はそれぞれ同じ定格としたが、これに限られるものではない。
プラントへ流通させる処理対象及び目的とする処理速度に応じて、各センサT1,T2の出力は刻々と変化するものとする。従って、センサT1の単体の出力をモニタリングしてもその出力に異常をきたしているか否かを判定することは困難である。
ここに、図4に示す通り第1の配管31での流量センサT1と温度T2の出力を横軸にし(即ち横軸には流量と温度とが指標として含まれる)、第2の配管33での流量センサT1と温度センサT2の出力を縦軸にする(即ち縦軸にも流量と温度との指標ある)。そして、第1の時刻における各配管31、33での流量センサT1及び温度センサT2の出力をプロットし(図5の○参照)、そのデータ間距離L1を求める。
同様に第2の時刻における各配管31、33での流量センサT1及び温度センサT2の出力をプロットし(図5の●参照)、そのデータ間距離L2を求める。
第1の配管31と第2の配管33とには相関があるので、各流量センサT1及び温度センサT2の出力にも相関が生じ、それぞれの絶対出力は変化しているものの、データ間距離は一定の範囲に収まる。そして、このデータ間距離が一定の範囲から逸脱したとき、いずれかのセンサに異常が来たしたものと判断される。
この場合、異常な出力となったセンサを個別に特定できるものではないが、センサの出力をモニタする異常出力のセンサの絞り込みができるので、メンテナンス上有効である。
図6に他の実施の形態を示す。
図6の例では部品A及び部品Bをそれぞれ第1の対象及び第2の対象とし、サプライヤごとにその納期、コスト及び品質を評価する。評価の指標は対象毎に任意に設定可能とする。
サプライヤ(イ)の部品A及び部品Bについて納期、コスト及び品質を図6(A)のようにプロットする。同様にサプライヤ(ロ)のプロット結果を図6(B)に示す。他のサプライヤも含めた結果は図6(C)となり、図6(C)において円はサプライヤの分布を示す。また、図6(C)の三角の各頂点は、各分布における重心を指す。
上記において、個別のサプライヤ(イ)、(ロ)のパフォーマンスを、各図中の三角形(い)、(ろ)の面積と平均したグラフの三角形(は)の面積とを比較することにより、評価できる。
また、図6(C)においては品質においてサプライヤの評価の分散が大きい。品質の評価は任意に設定可能であるので、対象A,Bにおける評価の指標を変更することにより(即ち、縦横軸のスケールを調整することにより)仮想空間における分散も変更する。従って、図6(C)の結果をモニタリングしながら、対象の評価の指標を調整することができる。このとき、三角形(は)の面積若しくは形状についても、対象の評価の指標を調整するときの参照となる。
図7は、図1〜図6で説明したデータ処理を行う装置50の構成を示すブロック図であり、このデータ処理装置50として汎用的なコンピュータ装置を利用することができる。
このデータ処理装置50は制御部51、入力装置53、メモリ装置60、データ処理装置70及び出力装置80を備える。
制御部51は他の要素の動作を制御する。入力装置53はキーボード、マウス、媒体リーダ等の汎用的な入力インターフェースからなる。例えばアンケート結果の入力は所定のフォーマットに対して回答者の評価を数値としてキーボード入力する。入力されたデータは一次データ保存部61に保存される。予め定められるしきい値も入力装置53を介して入力され、しきい値保存部63に保存される。
メモリ装置60は一次データ保存部61としきい値保存部63を備える。メモリ装置60としては汎用のハードディスクを用いることができ、その所定の領域を一次データ保存部61としきい値保存部63とに割り付ける。
データ処理装置70は仮想空間作成部71、データプロット部73、異常データ抽出部75及び異常出力源特定部77を備える。
仮想空間作成部71は一次データ保存部61に保存されているデータから対象(アンケートデータ処理の例ではサービス)を抽出し、その評価を指標として(軸にとり)、仮想空間を形成する。図1〜図6の例では説明を簡単にするため、2つの指標からなる二次元空間を例にとっているが、勿論三次元以上の多次元空間を採用することができる。
仮想空間作成部71で作成された仮想空間に対して、データプロット部73は一次データ保存部から対応するデータを読み出してプロットする。例えば、アンケートデータ処理の例では質問毎に回答者の評点をプロットする。
異常データ抽出部75は、プロットさえたデータ間の距離を演算する。図1〜図6に示すような二次元の場合は三角法でそのデータ間の距離を演算することができるが、多次元空間においては、次のようにして演算することができる。
Figure 2011086037
得られたデータ間の距離をしきい値保存部63に保存されているしきい値と比較し、得られたデータ間距離がしきい値範囲外にあるとき、異常なデータであると特定する。
特定結果は異常出力源特定部77へ送られる。この異常出力源特定部77において、図1に示すアンケートデータ処理の例では不適切な質問が特定される。
異常出力源特定部77で特定された異常出力源はディスプレイ等からなる出力装置80を介してオペレータに知らされる。
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
50 データ処理装置
51 制御部
60 メモリ装置
70 データ処理装置

Claims (16)

  1. 第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータをフィルタリングするデータのフィルタリング方法であって、
    前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算し、
    演算された該領域に基づき、前記異常なデータをフィルタリングすることを特徴とするデータのフィルタリング方法。
  2. 前記m=2として、第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)及び前記第2の出力源からの第4のデータ(2−2)とを
    前記第1〜第nの対象の指標で規定される仮想空間へプロットし、前記第1の出力源からデータ(1−1,2−1)と前記第2の出力源からのデータ(2−1,2−2)との間の距離を演算し、
    演算された該距離に基づき、前記異常なデータを除去する、
    ことを特徴とする請求項1に記載のデータのフィルタリング方法。
  3. 第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定方法であって、
    前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算し、
    演算された該領域に基づき、前記異常出力源を特定することを特徴とする異常出力源特定方法。
  4. 前記m=2として、第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)及び前記第2の出力源からの第4のデータ(2−2)を前記第1〜第nの対象の指標と規定される仮想空間へプロットし、前記第1の出力源からデータ(1−1,2−1)と前記第2の出力源からのデータ(2−1,2−2)との間の距離を演算し、
    演算された該距離に基づき、前記異常出力源を特定する、
    ことを特徴とする請求項3に記載の異常出力源特定方法。
  5. 前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存し、
    前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存し、
    前記第1〜第4のデータの各平均値を演算し、
    得られた平均値を前記仮想空間へプロットして前記第1の出力源からのデータ平均値と前記第2の出力源からのデータ平均値との間の距離を演算し、
    演算された該距離と所定の第1のしきい値距離とを比較して、しきい値を超えた距離に関係する前記第1の出力源及び/又は前記第2の出力源を前記異常出力源とする、ことを特徴とする請求項4に記載の異常出力源特定方法。
  6. 前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存し、
    前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存し、
    前記各データを前記仮想空間へプロットして、前記第1の出力源からのデータと前記第2の出力源からのデータとの間の平均及び分散を演算し、
    演算された平均及び分散と、個別の前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較して、異常出力源を特定する、ことを特徴とする請求項4に記載の異常出力源特定方法。
  7. 第1の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータと間の距離と、第2の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較し、
    比較の結果に基づき異常出力源を特定する、ことを特徴とする請求項4に記載の異常出力源特定方法。
  8. 前記m=3として、第1の対象に関する第1の出力源からの第1のデータ(1−1)、第2の出力源からの第2のデータ(1−2)及び第3の出力源からの第5のデータ(1−3)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)、前記第2の出力源からの第4のデータ(2−2)及び第3の出力源からの第6のデータ(2−3)を前記第1〜第nの対象の指標で規定される仮想空間へプロットし、前記第1の出力源からのデータ(1−1,2−1)、前記第2の出力源からのデータ(1−2,2−2)及び第3の出力源からのデータ(1−3,2−3)とで囲まれる領域の面積を演算し、
    演算された該面積に基づき、前記異常出力源を特定する、
    ことを特徴とする請求項3に記載の異常出力源特定方法。
  9. 第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータをフィルタリングするデータのフィルタリング装置であって、
    前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算する手段と、
    演算された該領域に基づき、前記異常なデータをフィルタリングする手段と、を備えることを特徴とするデータのフィルタリング装置。
  10. 前記m=2として、第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)及び前記第2の出力源からの第4のデータ(2−2)とを
    前記第1〜第nの対象の指標で規定される仮想空間へプロットする手段と、
    前記第1の出力源からデータ(1−1,2−1)と前記第2の出力源からのデータ(2−1,2−2)との間の距離を演算する手段と、
    演算された該距離に基づき、前記異常なデータを除去する手段と、
    を備えることを特徴とする請求項9に記載のデータのフィルタリング装置。
  11. 第1〜第nの対象(nは2以上の自然数)のそれぞれに関する第1〜第m(mは2以上の自然数)の出力源からの第1〜第mのデータを比較して異常なデータを出力した出力源を特定する異常出力源特定装置であって、
    前記第1〜第nの対象の指標で規定される仮想空間における前記第1〜第mの出力源からのデータで規定される領域(ただし、m=2のときは距離)を演算する手段と、
    演算された該領域に基づき、前記異常出力源を特定する手段と、を備えることを特徴とする異常出力源特定装置。
  12. 前記m=2として、第1の対象に関する第1の出力源からの第1のデータ(1−1)及び第2の出力源からの第2のデータ(1−2)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)及び前記第2の出力源からの第4のデータ(2−2)を前記第1〜第nの対象の指標と規定される仮想空間へプロットする手段と、
    前記第1の出力源からデータ(1−1,2−1)と前記第2の出力源からのデータ(2−1,2−2)との間の距離を演算する手段と、
    演算された該距離に基づき、前記異常出力源を特定する手段と、
    を備えることを特徴とする請求項11に記載の異常出力源特定装置。
  13. 前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存する手段と、
    前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存する手段と、
    前記第1〜第4のデータの各平均値を演算する手段と、
    得られた平均値を前記仮想空間へプロットして前記第1の出力源からのデータ平均値と前記第2の出力源からのデータ平均値との間の距離を演算する手段と、
    演算された該距離と所定の第1のしきい値距離とを比較して、しきい値を超えた距離に関係する前記第1の出力源及び/又は前記第2の出力源を前記異常出力源とする手段と、を備えることを特徴とする請求項12に記載の異常出力源特定装置。
  14. 前記第1の出力源からの前記第1のデータ及び第2のデータをそれぞれ複数保存する手段と、
    前記第2の出力源からの前記第3のデータ及び第4のデータをそれぞれ複数保存する手段と、
    前記各データを前記仮想空間へプロットして、前記第1の出力源からのデータと前記第2の出力源からのデータとの間の平均及び分散を演算する手段と、
    演算された平均及び分散と、個別の前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較して、異常出力源を特定する手段と、を備えることを特徴とする請求項12に記載の異常出力源特定装置。
  15. 第1の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータと間の距離と、第2の時刻における前記第1の出力源からのデータと前記第2の出力源からのデータとの間の距離と、を比較する手段と、
    比較の結果に基づき異常出力源を特定する手段と、を備えることを特徴とする請求項12に記載の異常出力源特定装置。
  16. 前記m=3として、第1の対象に関する第1の出力源からの第1のデータ(1−1)、第2の出力源からの第2のデータ(1−2)及び第3の出力源からの第5のデータ(1−3)と、第2の対象に関する前記第1の出力源からの第3のデータ(2−1)、前記第2の出力源からの第4のデータ(2−2)及び第3の出力源からの第6のデータ(2−3)を前記第1〜第nの対象の指標で規定される仮想空間へプロットする手段と、
    前記第1の出力源からのデータ(1−1,2−1)、前記第2の出力源からのデータ(1−2,2−2)及び第3の出力源からのデータ(1−3,2−3)とで囲まれる領域の面積を演算する手段と、
    演算された該面積に基づき、前記異常出力源を特定する手段と、
    を備えることを特徴とする請求項11に記載の異常出力源特定装置。
JP2009237073A 2009-10-14 2009-10-14 データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置 Pending JP2011086037A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009237073A JP2011086037A (ja) 2009-10-14 2009-10-14 データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009237073A JP2011086037A (ja) 2009-10-14 2009-10-14 データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置

Publications (1)

Publication Number Publication Date
JP2011086037A true JP2011086037A (ja) 2011-04-28

Family

ID=44078946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009237073A Pending JP2011086037A (ja) 2009-10-14 2009-10-14 データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置

Country Status (1)

Country Link
JP (1) JP2011086037A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020074439A (ja) * 2020-01-17 2020-05-14 キヤノン株式会社 インプリント装置、物品製造方法および位置合わせ方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020074439A (ja) * 2020-01-17 2020-05-14 キヤノン株式会社 インプリント装置、物品製造方法および位置合わせ方法

Similar Documents

Publication Publication Date Title
Sun et al. Leak localization in water distribution networks using pressure and data-driven classifier approach
Ko et al. Efficiency analysis of retail chain stores in Korea
Toloo et al. A powerful discriminative approach for selecting the most efficient unit in DEA
Lagerkvist et al. Country of origin or EU/non-EU labelling of beef? Comparing structural reliability and validity of discrete choice experiments for measurement of consumer preferences for origin and extrinsic quality cues
Milne et al. An ecological niche theory approach to the measurement of brand competition
Casillas et al. Leak signature space: An original representation for robust leak location in water distribution networks
Dettrick et al. Measuring quality of maternal and newborn care in developing countries using demographic and health surveys
Wang et al. Determining critical service quality from the view of performance influence
Lo et al. An ITARA-TOPSIS based integrated assessment model to identify potential product and system risks
Gupta et al. Influence of vertically treaded outsoles on interfacial fluid pressure, mass flow rate, and shoe–floor traction during slips
Štefko et al. The application of graphic methods and the DEA in predicting the risk of bankruptcy
Capelo et al. Near–real time burst location and sizing in water distribution systems using artificial neural networks
Gabbianelli A territorial perspective of SME’s default prediction models
Li et al. Understanding out-of-home food environment, family restaurant choices, and childhood obesity with an agent-based Huff model
Kang et al. Event-based heat-related risk assessment model for South Korea using maximum perceived temperature, wet-bulb globe temperature, and air temperature data
van Ruth et al. Which company characteristics make a food business at risk for food fraud?
Gomes et al. COVID-19’s Impact on the Restaurant Industry
Lee et al. Exploring fatalities and injuries in construction by considering thermal comfort using uncertainty and relative importance analysis
Prataviera et al. Heading for tomorrow: resilience strategies for post-Covid-19 grocery supply chains
Demirdöğen et al. Determination of business intelligence and analytics-based healthcare facility management key performance indicators
Zorić et al. The importance of digitalization for the sustainability of the food supply chain
Magalhaes et al. Knowledge, utility, and preferences for beef label traceability information: A cross-cultural market analysis comparing Spain and Brazil
Yoo et al. Optimal placement of pressure gauges for water distribution networks using entropy theory based on pressure dependent hydraulic simulation
JP2011086037A (ja) データのフィルタリング方法及びその装置並びに異常出力源特定方法及びその装置
Guerriero et al. Modelling prospective flood hazard in a changing climate, Benevento Province, Southern Italy