JP2006215737A

JP2006215737A - 新規クラスター分析方法

Info

Publication number: JP2006215737A
Application number: JP2005026749A
Authority: JP
Inventors: Shingo Aoki; 真吾青木; Yusuke Nishiuchi; 勇佑西内; Hiroshi Tsuji; 洋辻
Original assignee: Osaka Prefecture
Current assignee: Osaka Prefecture
Priority date: 2005-02-02
Filing date: 2005-02-02
Publication date: 2006-08-17

Abstract

【課題】目標とする改善方向が類似する事業体どうしを、的確に同じグループに分類することができるクラスター分析方法を提供する。
【解決手段】（ａ）属性を入力属性と出力属性とに区分し、（ｂ）各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法（ＤＥＡ）による効率を計算する定式化モデルを用いて計算し、（ｃ）前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類する。
【選択図】図１

Description

本発明は、生産活動を行う企業体や個人等（これら生産活動を行う主体を総称して事業体という）を複数有する集団に対し、各事業体が行う生産活動の生産効率の改善方向が共通する事業体どうしを、いくつかのグループに分類するクラスター分析方法（クラスタリング方法）に関する。本発明は、例えば、企業体の経営改善における方向付けや個人の能力改善における方向付けの際に利用することができる。

多数の事業体からなる集団において、各事業体の特徴を、数値で表現できる複数の属性のデータにより表現する場合がある。例えば、事業体が企業体である場合では、企業体の特徴を現す数値表現可能な属性データとして、従業員数、店舗数、予算規模、来客数、売上高、利益、シェアなどを用いることができる。また、事業体が個人、例えば野球選手である場合では、野球選手の特徴を現す数値表現が可能属性データとして年俸、練習量、出塁数、ホームラン数、打率などを用いることができる。

企業体や個人などの事業体は、その業績や能力を高めるためにさまざまな努力をしているが、そのひとつとして、事業体の生産活動における生産効率（効率ともいう）を高めることに努力を払っている。ここでいう生産活動や生産効率は、広義の意味である。すなわち、事業体の生産活動とは、何らかの入力属性（投入原資）を元にして、何らかの出力属性（成果）を得るための活動であると考えることができ、生産効率は、入力属性や出力属性を数値的に表現することで、出力属性と入力属性との比、すなわち出力属性値／入力属性値（入力属性や出力属性のデータを複数考慮する場合は、属性ごとに重み（ウェイト）を考慮して「（ウェイト×出力属性値）の総和／（ウェイト×入力属性値）の総和」）と定義することができる。

例えば、上述した企業体の属性については、従業員、店舗数、予算規模が入力属性データとなり、来客数、売上高、利益、シェアが出力属性データとなる。また、野球選手の属性については、年俸、練習量が入力属性データとなり、出塁数、ホームラン数、打率が出力属性データとなる。
そして、事業体は、入力属性データの値をできるだけ小さくするか、出力属性データの値をできるだけ大きくするか、あるいは、その両方を行うことで生産効率（効率）を改善しようと努力する。

この場合、各事業体は自己に適した様々な方向で生産効率を改善することが考えられる。例えば、企業体が、従業員および売上高の属性についての生産効率の改善を検討した場合に、従業員数を現状のままで売上高を高める努力、従業員を削減して売上高を減らさないようにする努力、従業員を微増して売上高を倍増させる努力など、生産効率を改善する場合の種々の方向からいずれかを選択することができる。この場合、事業体が、どの方向で生産効率を改善すべきかを検討することは有意義であり、特に、各事業体が自分の最も得意な方向で生産効率を改善することができるようにすることは望ましい。

事業体が、自らが得意とする改善方向を知る上で有力な手掛かりとなる分析手法として、包絡分析法（Data Envelopment Analysis；ＤＥＡと略す）が注目されている（非特許文献１参照）。
包絡分析法（ＤＥＡ）によれば、効率的と考えられる複数の事業体（効率が１００％の事業体）が形成する包絡面（Envelopment; 効率的フロンティア）が求められ、その他の非効率的と考えられる事業体（効率が１００％未満の事業体）がその入力属性、出力属性、あるいは双方の属性をどれくらい改善すれば包絡面（効率的フロンティア）に到達することができるかを算出するようにしている。
各事業体は、包絡分析法による分析結果から、自らが効率的な事業体（効率１００％の事業体）となるための改善目標量を把握することができ、しかもこのときの改善方向から自らの長所、すなわち最も得意とする方向での改善方向を把握することができるようになっている。

一方、上述したような事業体は、生産効率を向上させることで自らの業績や能力を高めようとする場合、自らの生産活動と類似する生産活動を行っている他の事業体の効率改善の成功事例や失敗事例を参考にしたい場合がある。すなわち、改善方向が近い他の事業体が存在する場合に、そこでの成功例を取り入れ、自らの生産効率の改善を図りたい場合がある。このような場合、生産活動のスタイルが類似する事業体どうしを同一グループとして分類するクラスタリングを行うことができれば有意義である。

一般に、複数の個体（ここでは事業体）を、何らかの特徴に基づいて、いくつかのグループに分類するクラスタリング技術については、従来から、様々な提案、改良がなされている（例えば特許文献1参照）。
ある特徴に基づいて個体を分類するクラスター分析方法のひとつに融合法がある。融合法によれば、対象となる個体（事業体）間で、何らかの意味で定義された距離（類似度）を手掛かりにして、距離が近いもの（類似度が高いもの）どうしを融合してクラスタを形成する。

例えば、上述した企業体の例で融合法によるクラスタリングを行う場合は、従業員、店舗数、予算規模、来客数、売上高、利益、シェア等の属性を有しているので、これらの属性のいずれか（単数でも複数でもよい）を手掛かりとして、対応する属性について距離（類似度）を計測、判断することが行われることになる。
A.charnes, W.W.Cooper, E.Rhodes: "Measuring Efficiency of Decision Making Units", European Journal of Operations Research,2,pp.429-444,1978. 特開２００１−９２８４１号公報

上述したように、各事業体を類似するグループごとに分類することは、事業体が他の事業体の例を参考にして、自らの改善を図る場合に有意義である。ただ、これまでのクラスター分析方法では、単に属性どうしの類似度を検討して（検討する属性数は単数でも複数でもよい）、グループ分類することがほとんどであった。
すなわち、例えば企業体の例では、利益が出ている企業体、売上高が高い企業体、従業員が少ない企業体など、単に特定の属性どうしを単純に比較して、類似性を把握することがほとんどであり、入力属性と出力属性との属性の違いを考慮して、ひいては生産効率を考慮してグループ分けすることはなかった。

しかしながら、特定の属性どうしの単純な比較により分類されたグループでは、必ずしも生産効率の改善方向が近い事業体が同じグループになることにはならない。
そのため、自らの改善方向を検討する上で参考にすべき他の事業体を、適切に把握することができないおそれがあった。

そこで、本発明は、目標とする改善方向が同じか、類似する事業体どうしを、的確に同じグループに分類することができるクラスター分析方法を提供することを目的とする。

上記課題を解決するためになされた本発明のクラスター分析方法は、複数の事業体で構成され、数値で表現可能な複数種類の属性データを前記各事業体が共通に有している集団について、各事業体をいくつかのグループに分類するクラスター分析方法であって、（ａ）属性を入力属性と出力属性とに区分し、（ｂ）各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法（ＤＥＡ）による効率を計算する定式化モデルを用いて計算し、（ｃ）前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類するようにしている。

本発明によれば、前提条件として、各事業体は数値表現が可能な複数の属性データを共通に有している。この属性データは、それぞれ生産効率に関係するものであり、各属性データは入力属性か出力属性のいずれかに分類できるものである。なお、入力属性または出力属性のいずれか一方が空であってもよい。この場合はすべての事業体が架空の入力属性（あるいは出力属性）のデータを持つこととし、各事業体は架空の入力（出力）属性データがすべて一定の値、すなわち「１」のデータを持つものとして扱えばよい。

まず、事業体が有する属性データについて、入力属性データと出力属性データとに区分する。そして、包絡分析法（ＤＥＡ）による効率（「（ウェイト×出力属性値）の総和／（ウェイト×入力属性値）の総和」）が実質的に最大となるための計算を、包絡分析法（ＤＥＡ）による効率を計算する定式化モデルを用いて演算処理する。ここで、「実質的に最大」としているのは、定式化モデルには、互いに双対関係にある主問題形式と双対問題形式とがあり、主問題が最大を求める問題では、双対問題は最小を求める問題となり、いずれの形式で求めても最終的には実質的に同じ結果が得られるからである。

定式化モデルを用いた演算では、効率的フロンティアを生成するためのウェイトの概念が導入され、このウェイトを変数として数値計算を行う。その結果、各事業体の効率が最適となるような効率値とともに、そのときのウェイト値（最適な効率となるときのウェイト値）が自動的に決定される。
包絡分析法（ＤＥＡ）では、最適な効率値を求めることが目的であり、効率値と同時に算出されるウェイト値については、単に効率値を算出するときの変数として導入したものであり、付加的なものにすぎず、これまであまり利用されていなかった。
しかしながら、ウェイト値は効率的な事業体（効率１００％の事業体）と非効率的な事業体（効率１００％未満の事業体）とを関係つけるものである。すなわち非効率な事業体（効率１００％未満の事業体）が、効率的な事業体（効率１００％の事業体）と類似する度合いを表していることから、これを用いて事業体のグループを分類するようにする。

ここで、事業体は、企業体、個人等のような生産活動を行うものであれば何でもよく、要するに、生産活動における生産効率の改善を図ることができる対象であればよい。属性データの種類は、事業体に応じて異なるが、入力属性と出力属性のいずれかに分類できる数値データであればよい。
また、包絡分析法（ＤＥＡ）による効率を計算する定式化モデルとしては、包絡分析法（ＤＥＡ）の最も基本となるＣＣＲモデル（Charnes-Cooper-Rhodesモデル）をはじめ、ＢＣＣモデル（Banker-Charnes-Cooperモデル）、ＤＲＳモデル（Decreasing Returns to Scaleモデル）、ＩＲＳモデル（Increasing Returns to Scaleモデル）、ＧＲＳモデル（General Returns to Scaleモデル）、加法モデル、乗法モデルなどが提案されているが、いずれを用いてもよい。

本発明によれば、改善方向が類似あるいは同じ事業体を、同じ分類にクラスタリングすることができるので、生産効率の改善を図ろうとする場合に、他の事業体での成功事例（あるいは失敗事例）などの情報を参考にしたい場合に、参考とする事業体を的確に選択することができる。

（その他の課題を解決するための手段および効果）
また、上記発明において、（ｂ）工程における定式化モデルとして、線形計画法による式（１）を用いるようにしてもよい。

ただし、θ_ｋはｋ番目の事業体の効率値、ｎは事業体の数、ｍは入力属性の数、ｓは出力属性の数、ｘ_ijはｊ番目の事業体のｉ番目の入力属性値、ｙ_ijはｊ番目の事業体のｉ番目の出力属性値、λ_ｊは効率的フロンティアを生成するためのウェイト（変数）

すなわち、包絡分析法（ＤＥＡ）の最も基本であるＣＣＲモデルの線形計画法による双対問題の式（１）を用いることにより、入力属性データから出力属性データを生産する効率値、および、効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイト値を求めることで、そのときのウェイト値に基づいてグループを分類することができる。

さらに、上記発明の（ｃ）工程において、効率的フロンティアを生成するためのウェイトの算出結果に基づいて、グループ化の基準として利用する所定の参照集合を事業体ごとに求め、各事業体の参照集合どうしを比較することにより各事業体をいくつかのグループに分類するようにしてもよい。
これによれば、（ｃ）前記定式化モデルによる効率値の計算の際に同時に算出されるウェイトに基づいて、グループ化の基準として利用する参照集合を求める。参照集合は、効率的な活動をしている事業体（効率１００％の事業体）で形成される集合である。すべての事業体は効率的な活動をしている事業体と、非効率な活動をしている事業体（効率１００％未満の事業体）とからなり、非効率的な活動をしている事業体は、効率的な活動をしている事業体の線形結合として表現される。そこで、各事業体についての線形結合の関係を、参照集合どうしの比較により把握することで、効率的な活動をしている事業体を基準にしたグループに分類することができる。

さらに、上記の（ｃ）工程において、効率的フロンティアを生成するためのウェイトに基づいてグループ化の基準として利用する所定の参照集合行列を作成し、参照集合行列に対する行列操作により参照集合行列の行および列の並べ替えを行うことにより、事業体をグループごとに並べるようにしてもよい。
これによれば、参照集合行列を求め、行列計算により対角行列化、部分行列化を図ることにより、グループ化を高速かつ容易に行うことができる。

さらに、（ｃ）工程において、参照集合行列の並べ替えに際し、二値化を行うようにしてもよい。
二値化により、演算が容易かつ高速に行うことができるので、複雑な系であっても処理時間を短縮することができる。

以下、本発明の一実施形態について、図面を用いて説明する。なお、本発明は、以下に説明する実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々の態様が含まれることは言うまでもない。

最初に、本発明の一実施形態であるクラスター分析方法における処理手順の全体的な流れを、図１に示したフローチャートに基づいて説明する。このクラスター分析方法は、扱うデータ量が小さいときは手計算によっても実行可能であるが、基本的にはコンピュータを用いた計算処理により実行されるものであるので、コンピュータ（クラスタリング装置という）による処理を前提として説明する。

まず、事業体ごとのデータをクラスタリング装置に入力する（Ｓ１０１）。各事業体のデータには、それぞれの特徴を表す属性データが含まれている。
このとき、入力された各事業体の属性データを、入力属性データと出力属性データとに区分する（ｓ１０２）。入力属性には、事業体が投入（投資）する項目を、出力属性には、事業体が得る項目を振り分ける。入力属性および出力属性に何を選択するかは、分析対象者が任意に選択することができる。コンピュータにより自動的に分類させる場合は、予め入力属性の項目と出力属性の項目とをデータベースとして記憶させておき、これと比較すればよい。
続いて、公知の包絡分析法（ＤＥＡ）における効率を計算する定式化モデルを用いて、入力属性値から出力属性値を生産する効率値を計算する。効率値の計算の際に変数として扱われる、効率的フロンティアを生成するためのウェイト値についても求める（Ｓ１０３）。
続いて、効率的フロンティアを生成するためのウェイト値の計算結果に基づいて、参照集合行列を作成する（Ｓ１０４）。参照集合行列は、各事業体のウェイト値を行列で表現したものである（図４参照）。
続いて、参照集合行列に対して、行列操作を行う（Ｓ１０５）。ここでは並べ替えなどの行列操作を行うことで、対角化、部分行列化する。このようにして簡単化された行列のデータに基づいて、グループ化処理を行う。そしてグループ化処理の結果を表示画面などに出力する（Ｓ１０６）。

次に、この処理手順を実行するクラスタリング装置の概略構成について説明する。クラスタリング装置は、ＣＰＵ（制御部）と、メモリ（記憶部）と、入力装置と、出力装置とを有している。具体的には、図２に示す機能ブロック図に見られるように、データを入力するための入力部１１（例えばマウス、キーボード）、入力画面や計算結果を表示する出力装置としての表示部１２（例えば液晶ディスプレイパネル）、包絡分析のために入力された各データが入力属性であるか出力属性であるかの区分けするときに参照するデータが蓄積された入力出力属性データベース１３（例えばハードディスク）、クラスタリングに必要な演算処理を行う制御部１４（ＣＰＵ）とから構成される。

入力出力属性データベース１３は、属性データ項目（例えば、上述した例では従業員数、店舗数、予算規模、来客数、売上高、利益、シェア、年俸、練習量、出塁数、ホームラン数、打率など）とその属性（入力属性、出力属性）とが関連つけて記憶してある。
制御部１４は、クラスタリングに必要な種々の制御、演算を実行する。この制御、演算内容を機能ごとに分けると、属性区分部２１、効率計算部２２、参照集合行列作成部２３、グループ化処理部２４とに分けられる。
このうち、属性区分部２１は、入力出力属性データベース１３を参照して、入力されたデータの属性の区分けを行う。
効率計算部２２は、包絡分析（ＤＥＡ）を用いて入力属性値から出力属性値を生産する効率値およびウェイトを計算する演算処理を行う。
参照集合行列作成部２３は、効率計算部２２によって求められたウエイトのデータを利用して参照集合行列を作成する。
グループ化処理部２３は、作成された参照集合行列行列に対し、２値化処理や並べ替え処理を行うことにより、行列の対角化、部分行列化処理を行い、計算結果に基づいていくつかのグループに分類する処理を行う。

以上が、本発明のクラスター分析方法の処理手順の流れ、および、その処理を実行するための装置構成であるが、個々の手順ごとに、具体的な実施例に基づいて、さらに詳細に説明する。以下の説明では、グループに分類しようとする事業体が会社であることとする。

（データ入力と属性の区分け）
本実施例では、事業体である会社の数はＡ〜Ｌまでの１２社とし、表１に示すようにそれぞれ従業員、店舗数、来客数、売上高の４つの属性データを有しているものとする。これを、従業員と店舗数とを入力属性にし、来客数と売上高とを出力属性に区分けして、入力する。

（包絡分析法による効率値の計算）
一般に、ｎ個の事業体（以下ＤＭＵ）すなわち（ＤＭＵ_１、・・・、ＤＭＵ_ｋ、・・・、ＤＭＵ_ｎ）が存在し、ｍ個の入力（ｘ_１ｋ、ｘ_２ｋ、・・・、ｘ_ｍｋ）と、ｓ個の出力（ｙ_１ｋ、ｙ_２ｋ、・・・、ｙ_ｓｋ）で、それぞれの事業体が特徴付けられるとする。このときｋ番目のＤＭＵの効率値は、以下に示す式（１）で表される線形計画法（ＬＰ）の双対問題として解くことで求めることができる。
線形計画法（ＬＰ）は、制約条件の下で、目的関数を最大化することを狙いとした最適化問題として確立された方式である。線形計画法では、目的関数を最大化するように定式化した主問題方式と、これと双対な関係にあり、目的関数を最小化するように定式化した双対問題方式とが確立されている。ここでは式（１）による双対問題方式で計算を行うが、主問題を計算することと実質的に同じ結果が得られる。

ここで、変数λｊは、効率的フロンティアを生成するためのウェイトである。θ_ｋはｋ番目のＤＭＵの効率値を示し、１以下の数字で示される。効率値θ_ｋは、１以下の数字で示され、θ_Ｋ＝１であれば「効率的な活動をしている」（効率１００％）とされ、θ_Ｋ＜１であれば非効率的な活動をしている」（効率１００％未満）とされる。
なお、制約条件を変更することにより、いくつかの他の定式化モデル（ＢＣＣモデルなど）が提案されているが、これらについても以下の説明と同様であるので説明を省略する。

式（１）の最適値をλ^＊、最適目的関数値をθ^＊と置き、それらが表す意味について説明する。
例えば、
θ^＊＝０．８５
λ^＊＝（λ_１＝０、・・・、λ_ν−１＝０、λ_ν＝０．７、λ_ν＋１＝０、・・・、λ_ω−１＝０、λ_ω＝０．３、λ_ω＋１＝０、・・・、λ_ｎ＝０）
とした例を用いて説明する。
λ^＊ _ｊ＞０となるλ_ｊの添え字で示されるＤＭＵ集合を「参照集合」と呼ぶ。この参照集合に選ばれるＤＭＵは、全て「効率的な活動をしている」（効率１００％）と判定されるものである。この例では、ｋ番目のＤＭＵの参照集合は、{ＤＭＵ_ν、ＤＭＵ_ω}になる。

上記結果は、図３のように図示することができる。すなわち、ν番目のＤＭＵ（ＤＭＵ_ν）とω番目のＤＭＵ（ＤＭＵ_ω）との線形結合で示される点ｋ’と、ｋ番目のＤＭＵ（ＤＭＵ_ｋ）とは、同一直線上に載り、１対０．８５で区分される。
図３において、点ｋ’を求める際に用いた線分は、包絡分析（ＤＥＡ）では効率的フロンティアと呼ぶ。なお、本例では参照集合が２つであるために効率的フロンティアが線分で示されたのであり、参照集合が３つになれば面、４つ以上であれば超平面となる。

効率的フロンティア上にある点は、ν番目のＤＭＵ（ＤＭＵ_ν）やω番目のＤＭＵ（ＤＭＵ_ω）と同様に、効率的な活動（効率１００％）をしているものと判定される。したがって、ｋ番目のＤＭＵの効率値（０．８５）は、ｋ番目のＤＭＵの理想的な点ｋ’と比較することにより求めることができる。
ここで重要な点は、原点と点ｋ’とを結ぶ線分が、包絡分析を行う者が定めているのではなく、ｋ番目の効率値が最大となるように、そのウェイト値をＤＭＵのデータに基づいて求めていることにある。同様に、ｋ＋１番目のＤＭＵの効率値は、式（１）において添え字が「ｋ」であるものを「ｋ＋１」に置換することで求められる。

（ウェイト値によるクラスタリング）
図４は、ｎ個（ｎ＝１２）すべてのＤＭＵ（ＤＭＵ_Ａ〜ＤＭＵ_Ｌ）に対し、式（１）により、効率値とウェイト値とを計算したときの計算結果を、表形式で示したものである。すべてのＤＭＵは、「効率的な活動をしている」（効率１００％）ＤＭＵとなるか、「効率的な活動をしている」（効率１００％）ＤＭＵの線形結合として表される。例えば、ＤＭＵ_ＢとＤＭＵ_Ｃとに着目すると、参照集合はともに（ＤＭＵ_Ｇ、ＤＭＵ_Ｊ、ＤＭＵ_Ｋ）で同じである。これらは効率改善の際の理想点（効率的フロンティア上の点）が、ＤＭＵ_Ｇ、ＤＭＵ_Ｊ、ＤＭＵ_Ｋにより挟まれる効率的フロンティアに向かうものである。これに対し、ＤＭＵ_Ｄの参照集合は（ＤＭＵ_Ａ、ＤＭＵ_Ｊ）で、効率改善の際の理想点がＤＭＵ_Ａ、ＤＭＵ_Ｊにより挟まれる効率的フロンティアに向かうものである。
図５は、包絡分析により効率値を計算した複数のＤＭＵ（黒丸印）と、効率的フロンティアとの関係を説明する概念図である。「効率的な活動をしている」（効率１００％の）ＤＭＵは、図中の右上側に配置される。これら効率的な活動をしているＤＭＵどうしを結ぶ包絡面（包絡線）が効率的フロンティアを形成する。そして「非効率な活動をしている」ＤＭＵは、包絡面により包まれた領域内のいずれかにくることになる。図５中、星印を付したＤＭＵの効率値は、（原点から星印までの距離）／（原点から五角形印までの距離）で表現され、このときの方向がそのＤＭＵにとって最も有利（すなわち長所を生かすことができる）改善方向を示すことになる。

したがって、参照集合どうしを比較し、参照集合が類似するものを同じグループに分類することで、効率改善の方向が類似したＤＭＵどうしが同じグループになるクラスター分析方法とすることができる。

次に、上述した参照集合の比較による分類を、効率的に行うクラスター分析方法について説明する。図４の枠で囲んだ領域１０を行列とし（この行列を参照集合行列と呼ぶ）、King, J.Rが提案したランクオーダーアルゴリズムを用いて行列操作を行う。
まず、参照集合行列の各要素を０と０以外に区分けし、０以外を１にすることで２値化行列を形成する。２値化行列に対し、図６に示すように、順次、行と列との並べ替えを交互に行い、最終的に各行および各列を２進数の数とした場合に降順に並ぶようにする。

図７は、並び替えを終えた２値化行列を示す図であり、対角方向に沿って部分行列が形成される。この部分行列に基づいて参照集合の類似性を判定することにより、効率的にクラスタリングを行うことができる。扱うデータのサイズが大きい場合に、この方法を用いることにより、類似性の判定が迅速かつ容易に行うことができる。

図８は、分析結果に基づいて、各ＤＭＵを４つに分類したときのグループの概念図（正確には４次元超空間で表現されるべき図を、説明の便宜上、２次元面上に描いているため概念図としている）を示す図である。本例では、参照集合を形成するＤＭＵであるＡ、Ｊ、Ｋ、Ｇを中心とした（Ａ、Ｄ）、（Ｂ、Ｃ、Ｅ、Ｉ、Ｋ、Ｌ）、（Ｆ、Ｇ、Ｈ）、（Ｊ）の４つのグループに分類される。

本発明は、目標とする改善方向が同じか、類似する事業体どうしを、的確に同じグループに分類する際に利用することができる。

本発明の一実施形態であるクラスター分析方法の処理手順を説明するフローチャート。本発明の一実施形態であるクラスター分析方法を実行するクラスタリング装置の構成を示す機能ブロック図。効率的な活動の事業体（ＤＭＵ）と非効率的な活動の事業体（ＤＥＡ）との効率値と効率的フロンティアとの関係を説明する図。包絡分析（ＤＥＡ）による効率値およびウェイトの計算例を示す図。包絡分析（ＤＥＡ）により効率値を計算した複数の事業体（ＤＭＵ）と、効率的フロンティアとの関係を説明する概念図。ランクオーダーアルゴリズムによる参照集合行列の並べ替え操作を説明する図。２値化および並べ替え後の参照集合行列を説明する図。包絡分析（ＤＥＡ）を用いたクラスタリングによるグループを説明する概念図。

符号の説明

１０：参照集合行列
１１：入力部
１２：表示部
１３：入力出力属性データベース
１４：制御部
２１：属性区分部
２２：効率計算部
２３：参照集合行列作成部
２４：グループ化処理部
ＤＭＵ_Ａ〜ＤＭＵ_Ｌ：事業体

Claims

複数の事業体で構成され、数値で表現可能な複数種類の属性データを前記各事業体が共通に有している集団について、各事業体をいくつかのグループに分類するクラスター分析方法であって、
（ａ）属性を入力属性と出力属性とに区分し、
（ｂ）各事業体について入力属性データから出力属性データを生産する効率を、包絡分析法（ＤＥＡ）による効率を計算する定式化モデルを用いて計算し、
（ｃ）前記定式化モデルによる効率値の計算の際に同時に算出される、効率的フロンティアを生成するためのウェイトに基づいて各事業体をいくつかのグループに分類することを特徴とするクラスター分析方法。
（ｂ）工程における定式化モデルとして、線形計画法による次式（１）を用いることを特徴とする請求項１に記載のクラスター分析方法。

ただし、θ_ｋはｋ番目の事業体の効率値、ｎは事業体の数、ｍは入力属性の数、ｓは出力属性の数、ｘ_ijはｊ番目の事業体のｉ番目の入力属性値、ｙ_ijはｊ番目の事業体のｉ番目の出力属性値、λ_ｊは効率的フロンティアを生成するためのウェイト（変数）
（ｃ）工程において、効率的フロンティアを生成するためのウェイトの算出結果に基づいて、グループ化の基準として利用する所定の参照集合を事業体ごとに求め、各事業体の参照集合どうしを比較することにより各事業体をいくつかのグループに分類することを特徴とする請求項２に記載のクラスター分析方法。
（ｃ）工程において、効率的フロンティアを生成するためのウェイトに基づいてグループ化の基準として利用する所定の参照集合行列を作成し、参照集合行列に対する行列操作により参照集合行列の行および列の並べ替えを行うことにより、事業体をグループごとに並べることを特徴とする請求項２に記載のクラスター分析方法。
（ｃ）工程における参照集合行列の並べ替えに際し、二値化を行うことを特徴とする請求項４に記載のクラスター分析方法。