JP2006215737A - 新規クラスター分析方法 - Google Patents
新規クラスター分析方法 Download PDFInfo
- Publication number
- JP2006215737A JP2006215737A JP2005026749A JP2005026749A JP2006215737A JP 2006215737 A JP2006215737 A JP 2006215737A JP 2005026749 A JP2005026749 A JP 2005026749A JP 2005026749 A JP2005026749 A JP 2005026749A JP 2006215737 A JP2006215737 A JP 2006215737A
- Authority
- JP
- Japan
- Prior art keywords
- entity
- efficiency
- analysis method
- attributes
- cluster analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000007621 cluster analysis Methods 0.000 title claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000009472 formulation Methods 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 abstract description 30
- 230000006872 improvement Effects 0.000 abstract description 14
- 230000000694 effects Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 9
- 230000009977 dual effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 5
- 238000007500 overflow downdraw method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 目標とする改善方向が類似する事業体どうしを、的確に同じグループに分類することができるクラスター分析方法を提供する。
【解決手段】 (a)属性を入力属性と出力属性とに区分し、(b)各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法(DEA)による効率を計算する定式化モデルを用いて計算し、(c)前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類する。
【選択図】図1
【解決手段】 (a)属性を入力属性と出力属性とに区分し、(b)各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法(DEA)による効率を計算する定式化モデルを用いて計算し、(c)前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類する。
【選択図】図1
Description
本発明は、生産活動を行う企業体や個人等(これら生産活動を行う主体を総称して事業体という)を複数有する集団に対し、各事業体が行う生産活動の生産効率の改善方向が共通する事業体どうしを、いくつかのグループに分類するクラスター分析方法(クラスタリング方法)に関する。本発明は、例えば、企業体の経営改善における方向付けや個人の能力改善における方向付けの際に利用することができる。
多数の事業体からなる集団において、各事業体の特徴を、数値で表現できる複数の属性のデータにより表現する場合がある。例えば、事業体が企業体である場合では、企業体の特徴を現す数値表現可能な属性データとして、従業員数、店舗数、予算規模、来客数、売上高、利益、シェアなどを用いることができる。また、事業体が個人、例えば野球選手である場合では、野球選手の特徴を現す数値表現が可能属性データとして年俸、練習量、出塁数、ホームラン数、打率などを用いることができる。
企業体や個人などの事業体は、その業績や能力を高めるためにさまざまな努力をしているが、そのひとつとして、事業体の生産活動における生産効率(効率ともいう)を高めることに努力を払っている。ここでいう生産活動や生産効率は、広義の意味である。すなわち、事業体の生産活動とは、何らかの入力属性(投入原資)を元にして、何らかの出力属性(成果)を得るための活動であると考えることができ、生産効率は、入力属性や出力属性を数値的に表現することで、出力属性と入力属性との比、すなわち出力属性値/入力属性値(入力属性や出力属性のデータを複数考慮する場合は、属性ごとに重み(ウェイト)を考慮して「(ウェイト×出力属性値)の総和/(ウェイト×入力属性値)の総和」)と定義することができる。
例えば、上述した企業体の属性については、従業員、店舗数、予算規模が入力属性データとなり、来客数、売上高、利益、シェアが出力属性データとなる。また、野球選手の属性については、年俸、練習量が入力属性データとなり、出塁数、ホームラン数、打率が出力属性データとなる。
そして、事業体は、入力属性データの値をできるだけ小さくするか、出力属性データの値をできるだけ大きくするか、あるいは、その両方を行うことで生産効率(効率)を改善しようと努力する。
そして、事業体は、入力属性データの値をできるだけ小さくするか、出力属性データの値をできるだけ大きくするか、あるいは、その両方を行うことで生産効率(効率)を改善しようと努力する。
この場合、各事業体は自己に適した様々な方向で生産効率を改善することが考えられる。例えば、企業体が、従業員および売上高の属性についての生産効率の改善を検討した場合に、従業員数を現状のままで売上高を高める努力、従業員を削減して売上高を減らさないようにする努力、従業員を微増して売上高を倍増させる努力など、生産効率を改善する場合の種々の方向からいずれかを選択することができる。この場合、事業体が、どの方向で生産効率を改善すべきかを検討することは有意義であり、特に、各事業体が自分の最も得意な方向で生産効率を改善することができるようにすることは望ましい。
事業体が、自らが得意とする改善方向を知る上で有力な手掛かりとなる分析手法として、包絡分析法(Data Envelopment Analysis;DEAと略す)が注目されている(非特許文献1参照)。
包絡分析法(DEA)によれば、効率的と考えられる複数の事業体(効率が100%の事業体)が形成する包絡面(Envelopment; 効率的フロンティア)が求められ、その他の非効率的と考えられる事業体(効率が100%未満の事業体)がその入力属性、出力属性、あるいは双方の属性をどれくらい改善すれば包絡面(効率的フロンティア)に到達することができるかを算出するようにしている。
各事業体は、包絡分析法による分析結果から、自らが効率的な事業体(効率100%の事業体)となるための改善目標量を把握することができ、しかもこのときの改善方向から自らの長所、すなわち最も得意とする方向での改善方向を把握することができるようになっている。
包絡分析法(DEA)によれば、効率的と考えられる複数の事業体(効率が100%の事業体)が形成する包絡面(Envelopment; 効率的フロンティア)が求められ、その他の非効率的と考えられる事業体(効率が100%未満の事業体)がその入力属性、出力属性、あるいは双方の属性をどれくらい改善すれば包絡面(効率的フロンティア)に到達することができるかを算出するようにしている。
各事業体は、包絡分析法による分析結果から、自らが効率的な事業体(効率100%の事業体)となるための改善目標量を把握することができ、しかもこのときの改善方向から自らの長所、すなわち最も得意とする方向での改善方向を把握することができるようになっている。
一方、上述したような事業体は、生産効率を向上させることで自らの業績や能力を高めようとする場合、自らの生産活動と類似する生産活動を行っている他の事業体の効率改善の成功事例や失敗事例を参考にしたい場合がある。すなわち、改善方向が近い他の事業体が存在する場合に、そこでの成功例を取り入れ、自らの生産効率の改善を図りたい場合がある。このような場合、生産活動のスタイルが類似する事業体どうしを同一グループとして分類するクラスタリングを行うことができれば有意義である。
一般に、複数の個体(ここでは事業体)を、何らかの特徴に基づいて、いくつかのグループに分類するクラスタリング技術については、従来から、様々な提案、改良がなされている(例えば特許文献1参照)。
ある特徴に基づいて個体を分類するクラスター分析方法のひとつに融合法がある。融合法によれば、対象となる個体(事業体)間で、何らかの意味で定義された距離(類似度)を手掛かりにして、距離が近いもの(類似度が高いもの)どうしを融合してクラスタを形成する。
ある特徴に基づいて個体を分類するクラスター分析方法のひとつに融合法がある。融合法によれば、対象となる個体(事業体)間で、何らかの意味で定義された距離(類似度)を手掛かりにして、距離が近いもの(類似度が高いもの)どうしを融合してクラスタを形成する。
例えば、上述した企業体の例で融合法によるクラスタリングを行う場合は、従業員、店舗数、予算規模、来客数、売上高、利益、シェア等の属性を有しているので、これらの属性のいずれか(単数でも複数でもよい)を手掛かりとして、対応する属性について距離(類似度)を計測、判断することが行われることになる。
A.charnes, W.W.Cooper, E.Rhodes: "Measuring Efficiency of Decision Making Units", European Journal of Operations Research,2,pp.429-444,1978. 特開2001−92841号公報
A.charnes, W.W.Cooper, E.Rhodes: "Measuring Efficiency of Decision Making Units", European Journal of Operations Research,2,pp.429-444,1978.
上述したように、各事業体を類似するグループごとに分類することは、事業体が他の事業体の例を参考にして、自らの改善を図る場合に有意義である。ただ、これまでのクラスター分析方法では、単に属性どうしの類似度を検討して(検討する属性数は単数でも複数でもよい)、グループ分類することがほとんどであった。
すなわち、例えば企業体の例では、利益が出ている企業体、売上高が高い企業体、従業員が少ない企業体など、単に特定の属性どうしを単純に比較して、類似性を把握することがほとんどであり、入力属性と出力属性との属性の違いを考慮して、ひいては生産効率を考慮してグループ分けすることはなかった。
すなわち、例えば企業体の例では、利益が出ている企業体、売上高が高い企業体、従業員が少ない企業体など、単に特定の属性どうしを単純に比較して、類似性を把握することがほとんどであり、入力属性と出力属性との属性の違いを考慮して、ひいては生産効率を考慮してグループ分けすることはなかった。
しかしながら、特定の属性どうしの単純な比較により分類されたグループでは、必ずしも生産効率の改善方向が近い事業体が同じグループになることにはならない。
そのため、自らの改善方向を検討する上で参考にすべき他の事業体を、適切に把握することができないおそれがあった。
そのため、自らの改善方向を検討する上で参考にすべき他の事業体を、適切に把握することができないおそれがあった。
そこで、本発明は、目標とする改善方向が同じか、類似する事業体どうしを、的確に同じグループに分類することができるクラスター分析方法を提供することを目的とする。
上記課題を解決するためになされた本発明のクラスター分析方法は、複数の事業体で構成され、数値で表現可能な複数種類の属性データを前記各事業体が共通に有している集団について、各事業体をいくつかのグループに分類するクラスター分析方法であって、(a)属性を入力属性と出力属性とに区分し、(b)各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法(DEA)による効率を計算する定式化モデルを用いて計算し、(c)前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類するようにしている。
本発明によれば、前提条件として、各事業体は数値表現が可能な複数の属性データを共通に有している。この属性データは、それぞれ生産効率に関係するものであり、各属性データは入力属性か出力属性のいずれかに分類できるものである。なお、入力属性または出力属性のいずれか一方が空であってもよい。この場合はすべての事業体が架空の入力属性(あるいは出力属性)のデータを持つこととし、各事業体は架空の入力(出力)属性データがすべて一定の値、すなわち「1」のデータを持つものとして扱えばよい。
まず、事業体が有する属性データについて、入力属性データと出力属性データとに区分する。そして、包絡分析法(DEA)による効率(「(ウェイト×出力属性値)の総和/(ウェイト×入力属性値)の総和」)が実質的に最大となるための計算を、包絡分析法(DEA)による効率を計算する定式化モデルを用いて演算処理する。ここで、「実質的に最大」としているのは、定式化モデルには、互いに双対関係にある主問題形式と双対問題形式とがあり、主問題が最大を求める問題では、双対問題は最小を求める問題となり、いずれの形式で求めても最終的には実質的に同じ結果が得られるからである。
定式化モデルを用いた演算では、効率的フロンティアを生成するためのウェイトの概念が導入され、このウェイトを変数として数値計算を行う。その結果、各事業体の効率が最適となるような効率値とともに、そのときのウェイト値(最適な効率となるときのウェイト値)が自動的に決定される。
包絡分析法(DEA)では、最適な効率値を求めることが目的であり、効率値と同時に算出されるウェイト値については、単に効率値を算出するときの変数として導入したものであり、付加的なものにすぎず、これまであまり利用されていなかった。
しかしながら、ウェイト値は効率的な事業体(効率100%の事業体)と非効率的な事業体(効率100%未満の事業体)とを関係つけるものである。すなわち非効率な事業体(効率100%未満の事業体)が、効率的な事業体(効率100%の事業体)と類似する度合いを表していることから、これを用いて事業体のグループを分類するようにする。
包絡分析法(DEA)では、最適な効率値を求めることが目的であり、効率値と同時に算出されるウェイト値については、単に効率値を算出するときの変数として導入したものであり、付加的なものにすぎず、これまであまり利用されていなかった。
しかしながら、ウェイト値は効率的な事業体(効率100%の事業体)と非効率的な事業体(効率100%未満の事業体)とを関係つけるものである。すなわち非効率な事業体(効率100%未満の事業体)が、効率的な事業体(効率100%の事業体)と類似する度合いを表していることから、これを用いて事業体のグループを分類するようにする。
ここで、事業体は、企業体、個人等のような生産活動を行うものであれば何でもよく、要するに、生産活動における生産効率の改善を図ることができる対象であればよい。属性データの種類は、事業体に応じて異なるが、入力属性と出力属性のいずれかに分類できる数値データであればよい。
また、包絡分析法(DEA)による効率を計算する定式化モデルとしては、包絡分析法(DEA)の最も基本となるCCRモデル(Charnes-Cooper-Rhodesモデル)をはじめ、BCCモデル(Banker-Charnes-Cooperモデル)、DRSモデル(Decreasing Returns to Scaleモデル)、IRSモデル(Increasing Returns to Scaleモデル)、GRSモデル(General Returns to Scaleモデル)、加法モデル、乗法モデルなどが提案されているが、いずれを用いてもよい。
また、包絡分析法(DEA)による効率を計算する定式化モデルとしては、包絡分析法(DEA)の最も基本となるCCRモデル(Charnes-Cooper-Rhodesモデル)をはじめ、BCCモデル(Banker-Charnes-Cooperモデル)、DRSモデル(Decreasing Returns to Scaleモデル)、IRSモデル(Increasing Returns to Scaleモデル)、GRSモデル(General Returns to Scaleモデル)、加法モデル、乗法モデルなどが提案されているが、いずれを用いてもよい。
本発明によれば、改善方向が類似あるいは同じ事業体を、同じ分類にクラスタリングすることができるので、生産効率の改善を図ろうとする場合に、他の事業体での成功事例(あるいは失敗事例)などの情報を参考にしたい場合に、参考とする事業体を的確に選択することができる。
(その他の課題を解決するための手段および効果)
また、上記発明において、(b)工程における定式化モデルとして、線形計画法による式(1)を用いるようにしてもよい。
また、上記発明において、(b)工程における定式化モデルとして、線形計画法による式(1)を用いるようにしてもよい。
すなわち、包絡分析法(DEA)の最も基本であるCCRモデルの線形計画法による双対問題の式(1)を用いることにより、入力属性データから出力属性データを生産する効率値、および、効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイト値を求めることで、そのときのウェイト値に基づいてグループを分類することができる。
さらに、上記発明の(c)工程において、効率的フロンティアを生成するためのウェイトの算出結果に基づいて、グループ化の基準として利用する所定の参照集合を事業体ごとに求め、各事業体の参照集合どうしを比較することにより各事業体をいくつかのグループに分類するようにしてもよい。
これによれば、(c)前記定式化モデルによる効率値の計算の際に同時に算出されるウェイトに基づいて、グループ化の基準として利用する参照集合を求める。参照集合は、効率的な活動をしている事業体(効率100%の事業体)で形成される集合である。すべての事業体は効率的な活動をしている事業体と、非効率な活動をしている事業体(効率100%未満の事業体)とからなり、非効率的な活動をしている事業体は、効率的な活動をしている事業体の線形結合として表現される。そこで、各事業体についての線形結合の関係を、参照集合どうしの比較により把握することで、効率的な活動をしている事業体を基準にしたグループに分類することができる。
これによれば、(c)前記定式化モデルによる効率値の計算の際に同時に算出されるウェイトに基づいて、グループ化の基準として利用する参照集合を求める。参照集合は、効率的な活動をしている事業体(効率100%の事業体)で形成される集合である。すべての事業体は効率的な活動をしている事業体と、非効率な活動をしている事業体(効率100%未満の事業体)とからなり、非効率的な活動をしている事業体は、効率的な活動をしている事業体の線形結合として表現される。そこで、各事業体についての線形結合の関係を、参照集合どうしの比較により把握することで、効率的な活動をしている事業体を基準にしたグループに分類することができる。
さらに、上記の(c)工程において、効率的フロンティアを生成するためのウェイトに基づいてグループ化の基準として利用する所定の参照集合行列を作成し、参照集合行列に対する行列操作により参照集合行列の行および列の並べ替えを行うことにより、事業体をグループごとに並べるようにしてもよい。
これによれば、参照集合行列を求め、行列計算により対角行列化、部分行列化を図ることにより、グループ化を高速かつ容易に行うことができる。
これによれば、参照集合行列を求め、行列計算により対角行列化、部分行列化を図ることにより、グループ化を高速かつ容易に行うことができる。
さらに、(c)工程において、参照集合行列の並べ替えに際し、二値化を行うようにしてもよい。
二値化により、演算が容易かつ高速に行うことができるので、複雑な系であっても処理時間を短縮することができる。
二値化により、演算が容易かつ高速に行うことができるので、複雑な系であっても処理時間を短縮することができる。
以下、本発明の一実施形態について、図面を用いて説明する。なお、本発明は、以下に説明する実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々の態様が含まれることは言うまでもない。
最初に、本発明の一実施形態であるクラスター分析方法における処理手順の全体的な流れを、図1に示したフローチャートに基づいて説明する。このクラスター分析方法は、扱うデータ量が小さいときは手計算によっても実行可能であるが、基本的にはコンピュータを用いた計算処理により実行されるものであるので、コンピュータ(クラスタリング装置という)による処理を前提として説明する。
まず、事業体ごとのデータをクラスタリング装置に入力する(S101)。各事業体のデータには、それぞれの特徴を表す属性データが含まれている。
このとき、入力された各事業体の属性データを、入力属性データと出力属性データとに区分する(s102)。入力属性には、事業体が投入(投資)する項目を、出力属性には、事業体が得る項目を振り分ける。入力属性および出力属性に何を選択するかは、分析対象者が任意に選択することができる。コンピュータにより自動的に分類させる場合は、予め入力属性の項目と出力属性の項目とをデータベースとして記憶させておき、これと比較すればよい。
続いて、公知の包絡分析法(DEA)における効率を計算する定式化モデルを用いて、入力属性値から出力属性値を生産する効率値を計算する。効率値の計算の際に変数として扱われる、効率的フロンティアを生成するためのウェイト値についても求める(S103)。
続いて、効率的フロンティアを生成するためのウェイト値の計算結果に基づいて、参照集合行列を作成する(S104)。参照集合行列は、各事業体のウェイト値を行列で表現したものである(図4参照)。
続いて、参照集合行列に対して、行列操作を行う(S105)。ここでは並べ替えなどの行列操作を行うことで、対角化、部分行列化する。このようにして簡単化された行列のデータに基づいて、グループ化処理を行う。そしてグループ化処理の結果を表示画面などに出力する(S106)。
このとき、入力された各事業体の属性データを、入力属性データと出力属性データとに区分する(s102)。入力属性には、事業体が投入(投資)する項目を、出力属性には、事業体が得る項目を振り分ける。入力属性および出力属性に何を選択するかは、分析対象者が任意に選択することができる。コンピュータにより自動的に分類させる場合は、予め入力属性の項目と出力属性の項目とをデータベースとして記憶させておき、これと比較すればよい。
続いて、公知の包絡分析法(DEA)における効率を計算する定式化モデルを用いて、入力属性値から出力属性値を生産する効率値を計算する。効率値の計算の際に変数として扱われる、効率的フロンティアを生成するためのウェイト値についても求める(S103)。
続いて、効率的フロンティアを生成するためのウェイト値の計算結果に基づいて、参照集合行列を作成する(S104)。参照集合行列は、各事業体のウェイト値を行列で表現したものである(図4参照)。
続いて、参照集合行列に対して、行列操作を行う(S105)。ここでは並べ替えなどの行列操作を行うことで、対角化、部分行列化する。このようにして簡単化された行列のデータに基づいて、グループ化処理を行う。そしてグループ化処理の結果を表示画面などに出力する(S106)。
次に、この処理手順を実行するクラスタリング装置の概略構成について説明する。クラスタリング装置は、CPU(制御部)と、メモリ(記憶部)と、入力装置と、出力装置とを有している。具体的には、図2に示す機能ブロック図に見られるように、データを入力するための入力部11(例えばマウス、キーボード)、入力画面や計算結果を表示する出力装置としての表示部12(例えば液晶ディスプレイパネル)、包絡分析のために入力された各データが入力属性であるか出力属性であるかの区分けするときに参照するデータが蓄積された入力出力属性データベース13(例えばハードディスク)、クラスタリングに必要な演算処理を行う制御部14(CPU)とから構成される。
入力出力属性データベース13は、属性データ項目(例えば、上述した例では従業員数、店舗数、予算規模、来客数、売上高、利益、シェア、年俸、練習量、出塁数、ホームラン数、打率など)とその属性(入力属性、出力属性)とが関連つけて記憶してある。
制御部14は、クラスタリングに必要な種々の制御、演算を実行する。この制御、演算内容を機能ごとに分けると、属性区分部21、効率計算部22、参照集合行列作成部23、グループ化処理部24とに分けられる。
このうち、属性区分部21は、入力出力属性データベース13を参照して、入力されたデータの属性の区分けを行う。
効率計算部22は、包絡分析(DEA)を用いて入力属性値から出力属性値を生産する効率値およびウェイトを計算する演算処理を行う。
参照集合行列作成部23は、効率計算部22によって求められたウエイトのデータを利用して参照集合行列を作成する。
グループ化処理部23は、作成された参照集合行列行列に対し、2値化処理や並べ替え処理を行うことにより、行列の対角化、部分行列化処理を行い、計算結果に基づいていくつかのグループに分類する処理を行う。
制御部14は、クラスタリングに必要な種々の制御、演算を実行する。この制御、演算内容を機能ごとに分けると、属性区分部21、効率計算部22、参照集合行列作成部23、グループ化処理部24とに分けられる。
このうち、属性区分部21は、入力出力属性データベース13を参照して、入力されたデータの属性の区分けを行う。
効率計算部22は、包絡分析(DEA)を用いて入力属性値から出力属性値を生産する効率値およびウェイトを計算する演算処理を行う。
参照集合行列作成部23は、効率計算部22によって求められたウエイトのデータを利用して参照集合行列を作成する。
グループ化処理部23は、作成された参照集合行列行列に対し、2値化処理や並べ替え処理を行うことにより、行列の対角化、部分行列化処理を行い、計算結果に基づいていくつかのグループに分類する処理を行う。
以上が、本発明のクラスター分析方法の処理手順の流れ、および、その処理を実行するための装置構成であるが、個々の手順ごとに、具体的な実施例に基づいて、さらに詳細に説明する。以下の説明では、グループに分類しようとする事業体が会社であることとする。
(データ入力と属性の区分け)
本実施例では、事業体である会社の数はA〜Lまでの12社とし、表1に示すようにそれぞれ従業員、店舗数、来客数、売上高の4つの属性データを有しているものとする。これを、従業員と店舗数とを入力属性にし、来客数と売上高とを出力属性に区分けして、入力する。
本実施例では、事業体である会社の数はA〜Lまでの12社とし、表1に示すようにそれぞれ従業員、店舗数、来客数、売上高の4つの属性データを有しているものとする。これを、従業員と店舗数とを入力属性にし、来客数と売上高とを出力属性に区分けして、入力する。
(包絡分析法による効率値の計算)
一般に、n個の事業体(以下DMU)すなわち(DMU1、・・・、DMUk、・・・、DMUn)が存在し、m個の入力(x1k、x2k、・・・、xmk)と、s個の出力(y1k、y2k、・・・、ysk)で、それぞれの事業体が特徴付けられるとする。このときk番目のDMUの効率値は、以下に示す式(1)で表される線形計画法(LP)の双対問題として解くことで求めることができる。
線形計画法(LP)は、制約条件の下で、目的関数を最大化することを狙いとした最適化問題として確立された方式である。線形計画法では、目的関数を最大化するように定式化した主問題方式と、これと双対な関係にあり、目的関数を最小化するように定式化した双対問題方式とが確立されている。ここでは式(1)による双対問題方式で計算を行うが、主問題を計算することと実質的に同じ結果が得られる。
一般に、n個の事業体(以下DMU)すなわち(DMU1、・・・、DMUk、・・・、DMUn)が存在し、m個の入力(x1k、x2k、・・・、xmk)と、s個の出力(y1k、y2k、・・・、ysk)で、それぞれの事業体が特徴付けられるとする。このときk番目のDMUの効率値は、以下に示す式(1)で表される線形計画法(LP)の双対問題として解くことで求めることができる。
線形計画法(LP)は、制約条件の下で、目的関数を最大化することを狙いとした最適化問題として確立された方式である。線形計画法では、目的関数を最大化するように定式化した主問題方式と、これと双対な関係にあり、目的関数を最小化するように定式化した双対問題方式とが確立されている。ここでは式(1)による双対問題方式で計算を行うが、主問題を計算することと実質的に同じ結果が得られる。
なお、制約条件を変更することにより、いくつかの他の定式化モデル(BCCモデルなど)が提案されているが、これらについても以下の説明と同様であるので説明を省略する。
式(1)の最適値をλ*、最適目的関数値をθ*と置き、それらが表す意味について説明する。
例えば、
θ*=0.85
λ*=(λ1=0、・・・、λν−1=0、λν=0.7、λν+1=0、・・・、λω−1=0、λω=0.3、λω+1=0、・・・、λn=0)
とした例を用いて説明する。
λ* j>0となるλjの添え字で示されるDMU集合を「参照集合」と呼ぶ。この参照集合に選ばれるDMUは、全て「効率的な活動をしている」(効率100%)と判定されるものである。この例では、k番目のDMUの参照集合は、{DMUν、DMUω}になる。
例えば、
θ*=0.85
λ*=(λ1=0、・・・、λν−1=0、λν=0.7、λν+1=0、・・・、λω−1=0、λω=0.3、λω+1=0、・・・、λn=0)
とした例を用いて説明する。
λ* j>0となるλjの添え字で示されるDMU集合を「参照集合」と呼ぶ。この参照集合に選ばれるDMUは、全て「効率的な活動をしている」(効率100%)と判定されるものである。この例では、k番目のDMUの参照集合は、{DMUν、DMUω}になる。
上記結果は、図3のように図示することができる。すなわち、ν番目のDMU(DMUν)とω番目のDMU(DMUω)との線形結合で示される点k’と、k番目のDMU(DMUk)とは、同一直線上に載り、1対0.85で区分される。
図3において、点k’を求める際に用いた線分は、包絡分析(DEA)では効率的フロンティアと呼ぶ。なお、本例では参照集合が2つであるために効率的フロンティアが線分で示されたのであり、参照集合が3つになれば面、4つ以上であれば超平面となる。
図3において、点k’を求める際に用いた線分は、包絡分析(DEA)では効率的フロンティアと呼ぶ。なお、本例では参照集合が2つであるために効率的フロンティアが線分で示されたのであり、参照集合が3つになれば面、4つ以上であれば超平面となる。
効率的フロンティア上にある点は、ν番目のDMU(DMUν)やω番目のDMU(DMUω)と同様に、効率的な活動(効率100%)をしているものと判定される。したがって、k番目のDMUの効率値(0.85)は、k番目のDMUの理想的な点k’と比較することにより求めることができる。
ここで重要な点は、原点と点k’とを結ぶ線分が、包絡分析を行う者が定めているのではなく、k番目の効率値が最大となるように、そのウェイト値をDMUのデータに基づいて求めていることにある。同様に、k+1番目のDMUの効率値は、式(1)において添え字が「k」であるものを「k+1」に置換することで求められる。
ここで重要な点は、原点と点k’とを結ぶ線分が、包絡分析を行う者が定めているのではなく、k番目の効率値が最大となるように、そのウェイト値をDMUのデータに基づいて求めていることにある。同様に、k+1番目のDMUの効率値は、式(1)において添え字が「k」であるものを「k+1」に置換することで求められる。
(ウェイト値によるクラスタリング)
図4は、n個(n=12)すべてのDMU(DMUA〜DMUL)に対し、式(1)により、効率値とウェイト値とを計算したときの計算結果を、表形式で示したものである。すべてのDMUは、「効率的な活動をしている」(効率100%)DMUとなるか、「効率的な活動をしている」(効率100%)DMUの線形結合として表される。例えば、DMUBとDMUCとに着目すると、参照集合はともに(DMUG、DMUJ、DMUK)で同じである。これらは効率改善の際の理想点(効率的フロンティア上の点)が、DMUG、DMUJ、DMUKにより挟まれる効率的フロンティアに向かうものである。これに対し、DMUDの参照集合は(DMUA、DMUJ)で、効率改善の際の理想点がDMUA、DMUJにより挟まれる効率的フロンティアに向かうものである。
図5は、包絡分析により効率値を計算した複数のDMU(黒丸印)と、効率的フロンティアとの関係を説明する概念図である。「効率的な活動をしている」(効率100%の)DMUは、図中の右上側に配置される。これら効率的な活動をしているDMUどうしを結ぶ包絡面(包絡線)が効率的フロンティアを形成する。そして「非効率な活動をしている」DMUは、包絡面により包まれた領域内のいずれかにくることになる。図5中、星印を付したDMUの効率値は、(原点から星印までの距離)/(原点から五角形印までの距離)で表現され、このときの方向がそのDMUにとって最も有利(すなわち長所を生かすことができる)改善方向を示すことになる。
図4は、n個(n=12)すべてのDMU(DMUA〜DMUL)に対し、式(1)により、効率値とウェイト値とを計算したときの計算結果を、表形式で示したものである。すべてのDMUは、「効率的な活動をしている」(効率100%)DMUとなるか、「効率的な活動をしている」(効率100%)DMUの線形結合として表される。例えば、DMUBとDMUCとに着目すると、参照集合はともに(DMUG、DMUJ、DMUK)で同じである。これらは効率改善の際の理想点(効率的フロンティア上の点)が、DMUG、DMUJ、DMUKにより挟まれる効率的フロンティアに向かうものである。これに対し、DMUDの参照集合は(DMUA、DMUJ)で、効率改善の際の理想点がDMUA、DMUJにより挟まれる効率的フロンティアに向かうものである。
図5は、包絡分析により効率値を計算した複数のDMU(黒丸印)と、効率的フロンティアとの関係を説明する概念図である。「効率的な活動をしている」(効率100%の)DMUは、図中の右上側に配置される。これら効率的な活動をしているDMUどうしを結ぶ包絡面(包絡線)が効率的フロンティアを形成する。そして「非効率な活動をしている」DMUは、包絡面により包まれた領域内のいずれかにくることになる。図5中、星印を付したDMUの効率値は、(原点から星印までの距離)/(原点から五角形印までの距離)で表現され、このときの方向がそのDMUにとって最も有利(すなわち長所を生かすことができる)改善方向を示すことになる。
したがって、参照集合どうしを比較し、参照集合が類似するものを同じグループに分類することで、効率改善の方向が類似したDMUどうしが同じグループになるクラスター分析方法とすることができる。
次に、上述した参照集合の比較による分類を、効率的に行うクラスター分析方法について説明する。図4の枠で囲んだ領域10を行列とし(この行列を参照集合行列と呼ぶ)、King, J.Rが提案したランクオーダーアルゴリズムを用いて行列操作を行う。
まず、参照集合行列の各要素を0と0以外に区分けし、0以外を1にすることで2値化行列を形成する。2値化行列に対し、図6に示すように、順次、行と列との並べ替えを交互に行い、最終的に各行および各列を2進数の数とした場合に降順に並ぶようにする。
まず、参照集合行列の各要素を0と0以外に区分けし、0以外を1にすることで2値化行列を形成する。2値化行列に対し、図6に示すように、順次、行と列との並べ替えを交互に行い、最終的に各行および各列を2進数の数とした場合に降順に並ぶようにする。
図7は、並び替えを終えた2値化行列を示す図であり、対角方向に沿って部分行列が形成される。この部分行列に基づいて参照集合の類似性を判定することにより、効率的にクラスタリングを行うことができる。扱うデータのサイズが大きい場合に、この方法を用いることにより、類似性の判定が迅速かつ容易に行うことができる。
図8は、分析結果に基づいて、各DMUを4つに分類したときのグループの概念図(正確には4次元超空間で表現されるべき図を、説明の便宜上、2次元面上に描いているため概念図としている)を示す図である。本例では、参照集合を形成するDMUであるA、J、K、Gを中心とした(A、D)、(B、C、E、I、K、L)、(F、G、H)、(J)の4つのグループに分類される。
本発明は、目標とする改善方向が同じか、類似する事業体どうしを、的確に同じグループに分類する際に利用することができる。
10: 参照集合行列
11:入力部
12:表示部
13:入力出力属性データベース
14:制御部
21:属性区分部
22:効率計算部
23:参照集合行列作成部
24:グループ化処理部
DMUA〜DMUL :事業体
11:入力部
12:表示部
13:入力出力属性データベース
14:制御部
21:属性区分部
22:効率計算部
23:参照集合行列作成部
24:グループ化処理部
DMUA〜DMUL :事業体
Claims (5)
- 複数の事業体で構成され、数値で表現可能な複数種類の属性データを前記各事業体が共通に有している集団について、各事業体をいくつかのグループに分類するクラスター分析方法であって、
(a)属性を入力属性と出力属性とに区分し、
(b)各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法(DEA)による効率を計算する定式化モデルを用いて計算し、
(c)前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類することを特徴とするクラスター分析方法。 - (c)工程において、効率的フロンティアを生成するためのウェイトの算出結果に基づいて、グループ化の基準として利用する所定の参照集合を事業体ごとに求め、各事業体の参照集合どうしを比較することにより各事業体をいくつかのグループに分類することを特徴とする請求項2に記載のクラスター分析方法。
- (c)工程において、効率的フロンティアを生成するためのウェイトに基づいてグループ化の基準として利用する所定の参照集合行列を作成し、参照集合行列に対する行列操作により参照集合行列の行および列の並べ替えを行うことにより、事業体をグループごとに並べることを特徴とする請求項2に記載のクラスター分析方法。
- (c)工程における参照集合行列の並べ替えに際し、二値化を行うことを特徴とする請求項4に記載のクラスター分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005026749A JP2006215737A (ja) | 2005-02-02 | 2005-02-02 | 新規クラスター分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005026749A JP2006215737A (ja) | 2005-02-02 | 2005-02-02 | 新規クラスター分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006215737A true JP2006215737A (ja) | 2006-08-17 |
Family
ID=36978941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005026749A Pending JP2006215737A (ja) | 2005-02-02 | 2005-02-02 | 新規クラスター分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006215737A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079325A (ja) * | 2008-09-24 | 2010-04-08 | Nec Corp | モデルの構築方法、構築システム及び構築用プログラム |
JP2010240209A (ja) * | 2009-04-07 | 2010-10-28 | Sumitomo Rubber Ind Ltd | ゴルフクラブシャフトの設計変数及び製造方法 |
JP2011134268A (ja) * | 2009-12-25 | 2011-07-07 | Canon It Solutions Inc | 情報処理装置、情報処理方法、及びコンピュータプログラム |
JP2011215927A (ja) * | 2010-03-31 | 2011-10-27 | Ntt Data Corp | 生産性評価装置、生産性評価方法およびプログラム |
JP2011232864A (ja) * | 2010-04-26 | 2011-11-17 | Nomura Research Institute Ltd | 施設情報分類システムおよび施設情報分類プログラム |
CN109670640A (zh) * | 2018-12-17 | 2019-04-23 | 北京化工大学 | 基于ap算法的dea乙烯装置的能效评价方法 |
CN117493817A (zh) * | 2023-12-29 | 2024-02-02 | 中国西安卫星测控中心 | 一种对处理卫星异常的效益进行评估的方法、系统及装置 |
-
2005
- 2005-02-02 JP JP2005026749A patent/JP2006215737A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079325A (ja) * | 2008-09-24 | 2010-04-08 | Nec Corp | モデルの構築方法、構築システム及び構築用プログラム |
JP2010240209A (ja) * | 2009-04-07 | 2010-10-28 | Sumitomo Rubber Ind Ltd | ゴルフクラブシャフトの設計変数及び製造方法 |
JP2011134268A (ja) * | 2009-12-25 | 2011-07-07 | Canon It Solutions Inc | 情報処理装置、情報処理方法、及びコンピュータプログラム |
JP2011215927A (ja) * | 2010-03-31 | 2011-10-27 | Ntt Data Corp | 生産性評価装置、生産性評価方法およびプログラム |
JP2011232864A (ja) * | 2010-04-26 | 2011-11-17 | Nomura Research Institute Ltd | 施設情報分類システムおよび施設情報分類プログラム |
CN109670640A (zh) * | 2018-12-17 | 2019-04-23 | 北京化工大学 | 基于ap算法的dea乙烯装置的能效评价方法 |
CN117493817A (zh) * | 2023-12-29 | 2024-02-02 | 中国西安卫星测控中心 | 一种对处理卫星异常的效益进行评估的方法、系统及装置 |
CN117493817B (zh) * | 2023-12-29 | 2024-04-16 | 中国西安卫星测控中心 | 一种对处理卫星异常的效益进行评估的方法、系统及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luo et al. | Deepeye: Towards automatic data visualization | |
Gupta et al. | Toward the development of a big data analytics capability | |
Overmans et al. | Managing austerity: rhetorical and real responses to fiscal stress in local government | |
CN105528387B (zh) | 分割发现、评估和实施平台 | |
Pham et al. | The bees algorithm: modelling foraging behaviour to solve continuous optimization problems | |
Nobre et al. | Lineage: Visualizing multivariate clinical data in genealogy graphs | |
Na et al. | Multi-level job scheduling in a flexible job shop environment | |
Chen | Multiple criteria ABC inventory classification using two virtual items | |
Pinheiro et al. | A random-key genetic algorithm for solving the nesting problem | |
Brinkmann et al. | Machine culture | |
Azadeh et al. | A hybrid genetic algorithm-TOPSIS-computer simulation approach for optimum operator assignment in cellular manufacturing systems | |
JP2006215737A (ja) | 新規クラスター分析方法 | |
Kumar et al. | A similarity score-based two-phase heuristic approach to solve the dynamic cellular facility layout for manufacturing systems | |
US20170255688A1 (en) | Parameter set determination for clustering of datasets | |
JP2022013573A (ja) | 表示ページを確定する方法及び装置、並びに、コンピュータシステム、コンピュータプログラム及び記憶媒体 | |
Kheirandish et al. | An artificial bee colony algorithm for a two-stage hybrid flowshop scheduling problem with multilevel product structures and requirement operations | |
Rodríguez-Déniz et al. | A frontier-based hierarchical clustering for airport efficiency benchmarking | |
Liu et al. | A review on business analytics: definitions, techniques, applications and challenges | |
Abdrabo et al. | Enhancing big data value using knowledge discovery techniques | |
Sasi Kumar et al. | DeepQ Based Heterogeneous Clustering Hybrid Cloud Prediction Using K-Means Algorithm | |
Koç et al. | Particle swarm optimization-based variable selection in Poisson regression analysis via information complexity-type criteria | |
Bolsi et al. | Heuristic algorithms for integrated workforce allocation and scheduling of perishable products | |
Ranjan et al. | The impact of estimation: A new method for clustering and trajectory estimation in patient flow modeling | |
Emrouznejad et al. | Performance measurement in the health sector: uses of frontier efficiency methodologies and multi-criteria decision making | |
JP5506629B2 (ja) | 準頻出構造パターンマイニング装置と頻出構造パターンマイニング装置とそれらの方法、及びプログラム |