JP2010079325A

JP2010079325A - モデルの構築方法、構築システム及び構築用プログラム

Info

Publication number: JP2010079325A
Application number: JP2008243483A
Authority: JP
Inventors: Eiji Hirao; 英司平尾
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2008-09-24
Filing date: 2008-09-24
Publication date: 2010-04-08
Anticipated expiration: 2028-09-24
Also published as: JP5401885B2

Abstract

【課題】定期的なモニタリングが難しいアンケートなどのデータでも目的事象の挙動を精度良く表現できるモデルの構築を可能にする。
【解決手段】パラメータ算出部４０は、クラスタデータベース３０から、最新の帰属情報及び状態値データセットを参照して、各クラスタに帰属する対象群の状態値データセット毎に目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータ及び代表パラメータの代表性を示す評価値を算出する。収束判定部５０は、パラメータ算出部４０からの代表パラメータ及び評価値を受信して、評価値の変化率などを算出し、評価値の収束条件と照らし合わせて収束を判定する。帰属変更部６０は、収束判定部５０で未収束と判定された場合に、帰属変更ルールによって各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する。
【選択図】図１

Description

本発明はモデルの構築方法、構築システム及び構築用プログラムに係り、特にマーケティングや労働生産性などの要因間に関係を持つ現象に関するモデルの構築方法、構築システム及び構築用プログラムに関する。

マーケティングや労働生産性などの要因間に相関や因果の関係を持つ社会現象に関して、特定の要因の変化を関係のある他の複数の要因で記述する方法として重回帰分析や判別分析がある。これらの分析技術は、目的とする変数に各要因がどの程度寄与するのかを定量化でき、寄与の大きい要因を見出すことで、マーケティング（購買行動）や労働生産性などの効率的な管理のための施策の考案などに活用される。

要因間に関係を持つ現象に関するモデル構築方法及びシステムの一例が、特許文献１に記載されている。この特許文献１に記載された要因間に関係を持つ現象に関するモデル構築方法及びシステムでは、候補説明変数に基づいて説明変数を生成し、目的変数の変化を説明する関係式の適切度が最も高い説明変数と回帰式を探索することにより、候補説明変数それ自体だけでなく、候補説明変数の組み合わせや、候補説明変数に対して何らかの演算処理を施した結果を説明変数として出力可能にする方法を提案している。

また、要因間に関係を持つ現象に関するモデル構築方法及びシステムの別の例が、特許文献２に記載されている。この特許文献２に記載された要因間に関係を持つ現象に関するモデル構築方法及びシステムは、対象データを分析し、相関係数などで属性間の関連度の大きさを求め、モデルの初期条件を自動設定し、さらに使用者がモデルの条件を修正し、設定された条件の下でモデルを推定し、推定されたモデルを評価するという、条件設定、推定、評価、修正を繰り返し行うことにより少ない労力で有効な説明変数の抽出やその関係を表すモデルの作成を可能にする方法を提案している。

特開２０００−２０５０４号公報特開平９−１６７１５２号公報

上記の特許文献１及び２に記載された、要因間に関係を持つ現象に関するモデルの構築方法及びシステムは、以下の課題を有する。

第一の課題は、工業製品の歩留まり検査データや気象の時系列データといった定期的なモニタリングが可能なデータを取り扱うことを前提としており、アンケートなどのデータでモデルを解析・構築する場合、モデルのパラメータ算出が困難となることである。モデルのパラメータの算出には、説明変数よりもサンプル数が多いことが条件として求められる。しかし、上記の要因間に関係を持つ現象に関するモデルの構築方法及びシステムが取り扱う社会現象に関するアンケートデータなどは、調査の負担が大きいことや、調査期間が長くなることで一定とすべき測定条件が変化してしまうことなど、分析に必要な条件を備えたデータを得ることが難しい場合が多い。従って、上記の要因間に関係を持つ現象に関するモデルの構築方法及びシステムでは、必要なサンプル数の確保が困難であるため、モデルのパラメータ算出が困難となる。

第二の課題は、工業製品の歩留まり検査データや気象の時系列データといった同一条件であれば同一の値を仮定する同質なデータを取り扱うことを前提としており、アンケートにおける異なる被験者のデータのような同一条件であっても同一の回答を想定することができない異質なデータでモデルを解析・構築する場合、得られるモデルで目的事象の挙動を表現することが困難となることである。社会現象に関するモデルの構築には、少ない回数の調査データで必要なサンプル数を確保するために、被験者毎といった質の異なるサンプルのデータを集計して利用すると、被験者によって説明事象と目的事象との間の関係に相違があるため、得られるモデルの精度が低くなってしまうためである。

本発明は以上の点に鑑みなされたもので、定期的なモニタリングが難しいアンケートなどのデータでも目的事象の挙動を精度良く表現できるモデルの構築を可能にする要因間に関係を持つ現象に関するモデルの構築方法、構築システム及び構築用プログラムを提供することを目的とする。

上記の目的を達成するため、第１の発明のモデルの構築方法は、複数の対象について、目的事象に関する第１の状態値と目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、状態値データセットを収集した複数の対象のそれぞれについて、第１の状態値を第２の状態値で表現するモデルの各パラメータの類似性から各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の対象の帰属を示す帰属情報を作成する帰属決定ステップと、クラスタ毎に、少なくともモデルを満足する代表パラメータを算出するパラメータ算出ステップと、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータとを出力する出力ステップと、を含むことを特徴とする。

また、上記の目的を達成するため、第２の発明のモデルの構築システムは、複数の対象について、目的事象に関する第１の状態値と目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、状態値データセットを収集した複数の対象のそれぞれについて、第１の状態値を第２の状態値で表現するモデルの各パラメータの類似性から各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の対象の帰属を示す帰属情報を作成する帰属決定手段と、クラスタ毎に、少なくともモデルを満足する代表パラメータを算出するパラメータ算出手段と、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータとを出力する出力手段と、を備えたことを特徴とする。

更に、上記の目的を達成するため、第３の発明のモデルの構築用プログラムは、複数の対象について、目的事象に関する第１の状態値と目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、状態値データセットを収集した複数の対象のそれぞれについて、第１の状態値を第２の状態値で表現するモデルの各パラメータの類似性から各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の対象の帰属を示す帰属情報を作成する帰属決定ステップと、クラスタ毎に、少なくともモデルを満足する代表パラメータを算出するパラメータ算出ステップと、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータとを出力する出力ステップとを、コンピュータにより実行させることを特徴とする。

本発明によれば、定期的なモニタリングが難しいアンケートなどのデータでも目的事象の挙動を精度良く表現するモデルの構築を可能にできる。

次に、本発明の実施形態について、図面を参照して詳細に説明する。

（第１の実施形態）
図１は、本発明になるモデルの構築システムの第１の実施形態のブロック図を示す。本実施形態のモデルの構築システム１は、基本的に電子機器内もしくはサーバと電子機器及びこれらを相互に接続するインターネット等の情報通信ネットワークからなるシステム内に、少なくとも、状態値データセット準備部１０と、初期帰属決定部２０と、クラスタデータベース３０と、パラメータ算出部４０と、収束判定部５０と、帰属変更部６０と、出力部７０と、を含む。ただし、状態値データセット準備部１０は、必ずしも上記システム内に含まれる必要は無く、紙などの媒体を利用してもよい。

状態値データセット準備部１０は、データ取得手段（図示せず）により、人もしくは物といった複数の対象に関して、目的事象に関する状態値と説明事象に関する状態値とからなる状態値データセットを収集する。本明細書において、「目的事象に関する状態値」とは、分析・管理の目的とする現象の挙動を表現する変数を意味し、例えば回帰モデルにおける従属変数や目的変数などが考えられる。また、「説明事象に関する状態値」とは、目的事象と相関関係や因果関係を持つ現象の挙動を表現する変数を意味し、例えば回帰モデルにおける独立変数や説明変数などが考えられる。

上記データ取得手段としては、アンケートやセンサを用いたモニタリングなどのいずれか又はその併用が考えられる。また、上記状態値としては、目的事象と説明事象に関するアンケートへの回答やセンサなどによってモニタリングされたデータなどが相当する。状態値は、アンケートへの回答を利用する場合、順序尺度、間隔尺度、比例尺度などで回答された評点の他、名義尺度として回答された値である。更には、状態値を得るためには、自由記述などのテキストデータにおける任意の用語の使用頻度や用語間の共起度などを利用することも考えられる。また、説明事象は複数あってもよい。

初期帰属決定部２０は、状態値データセット準備部１０で状態値データセットを収集した対象のそれぞれについて、初期帰属設定ルールによって任意に設定したクラスタ数のクラスタへ各対象を帰属させ、クラスタ毎の対象の帰属を示す帰属情報を作成し、状態値データセットと共にクラスタデータベース３０に送信する。上記の初期帰属設定ルールは任意に設定してよい。例えば、初期帰属設定ルールには、対象をランダムに分配する方法や、状態値データセット準備部１０で収集した対象の状態値データセット間のミンコフスキー距離や相関などを非類似度としてｋ−ｍｅａｎｓ法などのクラスタリング手法を適用し各対象の状態値データセットの類似性によって分類を行う方法などが考えられる。また、クラスタ数も任意に設定してよい。ただし、クラスタ数は、各クラスタに帰属する対象の数が、目的事象の挙動を説明事象の挙動を用いて表現するモデルを満足する代表パラメータの算出に必要なサンプル数を超えるように設定する必要がある。

クラスタデータベース３０は、初期帰属決定部２０で算出された帰属情報と各対象の状態値データセット、及び後述する帰属変更部６０で算出された帰属情報を収集し、更新して蓄積することで、最新の情報を参照可能にする。

パラメータ算出部４０は、クラスタデータベース３０に帰属情報が新規登録もしくは更新された場合、クラスタデータベース３０から、最新の帰属情報及び状態値データセットを参照して、各クラスタに帰属する対象群の状態値データセット毎に目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータ及び代表パラメータの代表性を示す評価値を算出し、収束判定部５０に送信する。上記のモデルとしては重回帰分析の回帰式や数量化I類の推算式などの線形モデルの他、決定木などの非線形モデルが考えられ、上記代表パラメータとしては重回帰係数やウエイト、決定木の構造情報などが考えられる。また、上記評価値としては決定係数や自由度修正済み決定係数、重回帰係数の変動幅や変動率、数量化I類のウエイトの変動幅や変動率などが考えられる。

収束判定部５０は、パラメータ算出部４０から送信された代表パラメータ及び評価値を受信した際に、評価値の変化率を算出し、評価値の収束条件と照らし合わせて収束を判定する。上記収束条件としては指標値と任意の閾値との比較や、指標値の変動率と任意の閾値との比較による方法などが考えられる。

帰属変更部６０は、収束判定部５０で未収束と判定された場合に、帰属変更ルールによって各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成し、更新するためにクラスタデータベース３０に送信する。上記帰属変更ルールとしては、帰属を変更する対象をランダムに選択する方法や、残差を最小化する方法、遺伝的アルゴリズムを利用する方法などが考えられる。

出力部７０は、収束判定部５０で収束完了と判定された場合、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータを出力する。

次に、図１のブロック図及び図２のシーケンス図を併せ参照して本発明の第１の実施形態の全体の動作について詳細に説明する。

状態値データセット準備部１０は、アンケートやセンサによるモニタリングなどを用いて、分析・管理の目的とする目的事象及び目的事象に対して相関関係や因果関係を持つ説明事象に関する状態値からなる状態値データセットを複数の対象から収集する（ステップＡ１）。

初期帰属決定部２０は、状態値データセット準備部１０で収集した状態値データセットの対象のそれぞれについて、初期帰属設定ルールによって任意に設定したクラスタ数のクラスタへ各対象を帰属させ、クラスタ毎の対象の帰属関係を示す帰属情報を作成する（ステップＡ２）。更に初期帰属決定部２０は、作成した上記の帰属情報を状態値データセットと共にクラスタデータベース３０に新規登録するために送信する（ステップＡ３）。

クラスタデータベース３０は、初回は初期帰属決定部２０で算出された帰属情報と各対象の状態値データセットを新規登録し、２回目以降は登録している帰属情報を帰属変更部６０で算出された帰属情報に更新して蓄積することで、最新の情報を参照可能にする（ステップＡ４）。

パラメータ算出部４０は、クラスタデータベース３０に帰属情報が新規登録もしくは更新された場合、クラスタデータベース３０から、最新の帰属情報及び状態値データセットを参照して、各クラスタに帰属する対象群の状態値データセット毎に目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータ及び代表パラメータの代表性を示す評価値を算出する（ステップＡ５）。続いて、パラメータ算出部４０は、算出した代表パラメータ及び評価値を収束判定部５０に送信する（ステップＡ６）。

収束判定部５０は、パラメータ算出部４０から送信された代表パラメータ及び評価値を受信して、評価値の変化率を算出し、評価値の収束条件と照らし合わせて収束を判定する（ステップＡ７）。

帰属変更部６０は、収束判定部５０で未収束と判定された場合に、帰属変更ルールによって各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する（ステップＡ８）。続いて、帰属変更部６０は、新たに作成した帰属情報をクラスタデータベース３０に送信する（ステップＡ９）。帰属情報更新のためである。

ステップＡ７で収束判定部５０が収束完了と判定するまで、ステップＡ４からステップＡ９までの動作が繰り返される。出力部７０は、収束判定部５０で収束完了と判定された場合、収束完了と判定された各クラスタへの対象の帰属情報及び各クラスタの代表パラメータを出力する（ステップＡ１０）。

次に、本発明の第１の実施形態の実施例について詳細に説明する。

本実施例では、実際のオフィスにおける知的生産性を分析・管理の目的とし、知的生産性の関連要因の重要性や向上に向けて実施した複数の施策の活用性を説明事象として、施策の導入後に従業員に対して行ったアンケート結果、及び各従業員が専属的に使用しているパーソナルコンピュータ（以下、ＰＣ）端末から得られる各種操作履歴に基づき、各施策の活用性と最終的な知的生産性の向上との関係をモデル化し、従業員の特性に合わせて最も有効な施策を抽出することでオフィスの知的生産性を向上することを目的としている。また、本実施例において、アンケートにより商品への印象を抽出する装置が、インターネットを介して各従業員の持つＰＣ端末と接続されている。この装置は、イントラネット上でアンケートの募集、情報の提示、アンケート質問の提示、回答の入力、集計などを実現するＷｅｂアンケートシステムＷと、各従業員の持つＰＣ端末の操作履歴を取得するログ収集システムＰと、データの蓄積と解析を行うコンピュータＳとを備えている。

状態値データセット準備部１０は、ＷｅｂアンケートシステムＷ内及びログ収集システムＰ内に含まれている。また、初期帰属決定部２０と、クラスタデータベース３０と、パラメータ算出部４０と、収束判定部５０と、帰属変更部６０と、出力部７０とはコンピュータＳ内に含まれている。この様な手段を備えたＷｅｂアンケートシステムＷ、ログ収集システムＰ、コンピュータＳは以下のような動作をする。

ＷｅｂアンケートシステムＷは、施策の導入後にｍ人の従業員に対して、図３に示すような知的生産性、及び知的生産性に関連すると思われるｐ種類の生産性関連要因のそれぞれの重要度に関する質問項目群ｋ（ｋ１，ｋ２，・・，ｋｐ）への尺度法アンケートを各従業員のＰＣ端末を通じて提示し、回答の入力を受け付ける。質問項目群ｋは上記に加え、各従業員の年齢、性別、所属などの属性情報を含んでもよい。

更に、ＷｅｂアンケートシステムＷは、図３に示したアンケートにおいて水平方向の５箇所のチェック箇所（○をつける箇所）のうちチェックをつけた箇所が一番左の場合は「１」、左から二番目の場合は「２」、左から三番目の場合は「３」、左から四番目の場合は「４」、一番右の場合は「５」というように、図４に示すように、「１」〜「５」の整数でチェックをつけた箇所を数値化する。そして、ＷｅｂアンケートシステムＷは、上記の数値化した結果に基づいて、従業員毎にアンケートの回答を知的生産性評点データＥと評点データセットＸ（ｘ１、ｘ２、・・・、ｘｐ）に変換し、従業員毎に割り振られた従業員ＩＤとともに紐付けして集計し、コンピュータＳ内のデータベースに格納する。

ログ収集システムＰは、施策の導入後にｍ人の従業員のそれぞれのＰＣ端末の操作・動作ログから、知的生産性の向上のために導入した施策の利用状況として図５に示すようなｑ種類のモニタリング項目群ｌ（ｌ１、ｌ２、・・・、ｌｑ）に対する施策活用の定量情報を施策評点データセットＹ（ｙ１、ｙ２、・・・、ｙｑ）としてモニタリングする。そして、ログ収集システムＰは、それぞれのモニタリング項目群ｌに関する施策評点データセットＹを従業員毎に割り振られた従業員ＩＤとともに紐付けして集計し、コンピュータＳ内のデータベースに格納する。

コンピュータＳは、ＷｅｂアンケートシステムＷ及びログ収集システムＰが知的生産性評点データＥ、評点データセットＸ及び施策評点データセットＹを収集したｍ人の従業員のそれぞれについて、各従業員の知的生産性評点データＥ、評点データセットＸ及び施策評点データセットＹを合わせたデータ列間のユークリッド距離を非類似度としてｋ−ｍｅａｎｓ法を適用し、データセットの類似性によって任意に設定したクラスタ数に各従業員を分類する。更に、コンピュータＳは、分類結果として得られた各クラスタと従業員との帰属関係情報をコンピュータＳ内のデータベースに新規登録する。

図６は、クラスタリングのイメージとして評点データセットＸ及び施策評点データセットＹの類似性で従業員をクラスタＣｔ（ｔ＝ａ，ｂ，ｃ）の３つのクラスタに分類した結果を評点空間に表した概念図である。図６において、図形は各従業員の評点データセットに対応しており、点線の囲みはクラスタの境界を意味している。なお、図６ではイメージを掴みやすくするために各従業員の位置関係を平面上で表現しているが、実際には各従業員はｐ＋ｑ次元の空間に配置される。（１）式は、従業員IとIIの類似性指標の例を示す。

更に、コンピュータＳは、データベース内の帰属情報が新規登録もしくは更新された場合、データベースから、クラスタ別に帰属する全従業員の従業員ＩＤと従業員ＩＤに対応する知的生産性評点データＥ、評点データセットＸ及び施策評点データセットＹを参照して、知的生産性を目的変数、質問項目群ｋとモニタリング項目群ｌを説明変数とする重回帰分析を実施することで、図７に示すように、クラスタＣｔの全てのクラスタ毎に代表重回帰係数データセットＦｔ及び決定係数Ｒ２ｔ（すなわち、Ｒ２ａ,Ｒ２ｂ,Ｒ２ｃ,・・・）を算出する。代表重回帰係数データセットＦｔは以下の（２）式のようなｐ＋ｑ個の代表重回帰係数データｆからなるデータ構造となっている。

Ｆt＝（ｆ_t,k1,ｆ_t,k2,・・・ｆ_t,kp,ｆ_t,l1,ｆ_t,l2,・・・ｆ_t,lq）（２）
この代表重回帰係数データセットＦｔは、目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータである。また、決定係数Ｒ２ｔは、代表重回帰係数データセットＦｔの代表性を示すモデル評価値である。

図８は、クラスタリングのイメージとして重回帰係数空間において、評点データセットの類似性でクラスタリングされた各従業員の布置と、クラスタ数を３つにした場合での各クラスタの代表重回帰係数データセットＦｔの関係を示す。図８において、図形は各従業員の重回帰係数データセットに対応しており、点数の囲みはクラスタの境界を意味している。なお、図８でも図６と同様にイメージを掴みやすくするために各従業員の位置関係を平面上で表現しているが、実際には各従業員はｐ＋ｑ次元の空間に配置される。

原理的に従業員単位の重回帰係数データセットは算出できないため、図８は、各従業員の位置をイメージとして置いた想像値を点線で示しており、数値が得られる各クラスタＣｔ（ｔ＝ａ，ｂ，ｃ）の代表重回帰係数データセットＦｔのみを実線で表示している。また、図６とは空間が異なるため各従業員の位置関係が変化し、必ずしも距離の近い各従業員同士が同一クラスタに含まれるわけではない。

次に、コンピュータＳは、算出した全クラスタの決定係数Ｒ２ｔの平均値と閾値とを比較し、決定係数Ｒ２ｔの平均値が閾値以上になった場合は収束、閾値未満になった場合は未収束として、収束判定を行う。ここで、全クラスタの決定係数Ｒ２ｔの平均値の算出方法としては、各クラスタを対等とした単純平均でもよいし、各クラスタの人数比で重み付けした重み付け平均などを利用してもよい。

続いて、コンピュータＳは、決定係数Ｒ２ｔの平均値が閾値未満で未収束と判定された場合に、各クラスタに帰属する従業員の一人をランダムに選択し、他のクラスタに帰属させる帰属変更手順によって各クラスタに帰属する従業員を入れ替え、新たなクラスタ毎の従業員の帰属を示す帰属情報を作成し、コンピュータＳ内のデータベースを更新する。

図９は、前記帰属変更手順の一例を示す。この図９は、図８の状態から、クラスタＣａでランダムに選ばれた従業員ａ５をクラスタＣｂに、クラスタＣｂでランダムに選ばれた従業員ｂ１をクラスタＣａに、クラスタＣｃでランダムに選ばれた従業員ｃ４をクラスタＣｂに入れ替えた状態のイメージを示す。

そして、コンピュータＳは、上記の帰属変更手順によって更新された帰属情報に基づき代表重回帰係数データセットＦｔ及び決定係数Ｒ２ｔを再計算し、決定係数Ｒ２ｔの平均値が閾値以上と判定されるまで、帰属情報の更新を繰り返す。

一方、コンピュータＳは、決定係数Ｒ２ｔの平均値が閾値以上で収束と判定された場合は、その判定時の各クラスタへの従業員の帰属情報及び各クラスタの代表重回帰係数データセットＦｔを出力する。更に、コンピュータＳは、その出力結果から、クラスタ毎の代表重回帰係数の相対的な値の比較を行い、クラスタ毎の知的生産性の向上に寄与する項目の抽出と施策の立案を行うことや、クラスタに帰属する従業員の属性との相関を分析し、属性毎の知的生産性向上施策の立案などを実施することが考えられる。

次に、本発明の第１の実施形態の効果について説明する。本実施形態では、対象をクラスタに分けてパラメータの類似する対象の組み合わせを抽出することで、異質でバラつきが大きい対象間のデータを集計したデータセットから、説明事象の挙動を用いて、目的事象の挙動を精度良く表現できるモデルの代表パラメータを抽出することができる。

また、本実施形態によれば、定期的なモニタリングが難しいアンケートなどのデータでも目的変数の挙動を表現するモデルの構築が可能になる。その理由は、分析・管理の対象とする目的事象に対して相関や因果の関係を持つ説明事象に関する状態値のデータセットを複数の対象に対して調査し、モデルの各パラメータの類似する対象の組み合わせを探索させて対象をクラスタリングすることによって、調査回数がパラメータ数より少なく個々の対象毎にパラメータを算出できないデータでも、対象の属するクラスタのパラメータという形で対象に対応するパラメータの算出を可能にしていることと、異質でバラつきが大きい対象間のデータを集計したデータセットから、説明事象の挙動を用いて、目的事象の挙動を精度良く表現できるモデルの代表パラメータを抽出することができるためである。

（第２の実施形態）
次に、本発明の第２の実施形態について説明する。図１０は、本発明になるモデルの構築システムの第２の実施形態のブロック図を示す。同図中、図１と同一構成部分には同一符号を付し、その説明を省略する。図１０に示す本発明の第２の実施形態のモデルの構築システム２は、第１の実施形態のモデルの構築システム１の帰属変更部６０の替りに、変更対象選定部８０１と移行クラスタ決定部８０２とを含む帰属変更部８０を設けたものである。

変更対象選定部８０１は、収束判定部５０で未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択する。移行クラスタ決定部８０２は、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する。ここで、前記変更対象選定ルールとしては、各クラスタについて帰属する各対象の状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象や、評価値の上昇が最大となる対象、又は評価値が最大となる対象を、入れ替える対象として選択するルールなどが考えられる。また、前記移行クラスタ選定ルールとしては、各クラスタについて帰属する各対象の状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールなどが考えられる。

更に、前記移行クラスタ選定ルールとして、上記以外に、各クラスタについて変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、クラスタ内の被験者を除外した場合の代表パラメータとクラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタや、算出した上記評価値の上昇が最大となるクラスタ、又は上記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールなども考えられる。

なお、上記の評価値の上昇は、被験者が除外された時点（ｎ人のクラスタ）と、他のクラスタからの被験者が帰属した時点(n+1人のクラスタ）との差に相当する。また、上記の評価値が最大となるクラスタとは、各クラスタに対して被験者の再帰属先の候補となる全クラスタでの比較の結果得られる複数の評価値（例えば、５つのクラスタがある場合は５つの評価値）のうち、最大の評価値のクラスタのことである。

次に、図１０のブロック図及び図１１のシーケンス図を併せ参照して本実施形態の全体の動作について説明する。図１１中、図２と同一処理部分は同一符号を付し、その説明を省略する。本実施形態では、帰属変更部８０が、収束判定部５０で未収束と判定された場合に、変更対象選定部８０１により変更対象選定ルールに最も適合する対象を帰属を入れ替える対象として選択する（ステップＢ１）。続いて、帰属変更部８０は、移行クラスタ決定部８０２により移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する（ステップＢ２）。

その後、帰属変更部８０は、作成した帰属情報をクラスタデータベース３０に送信する（ステップＡ９）。そして、ステップＡ７で収束判定部５０が収束完了と判定するまで、ステップＡ４〜Ａ７の各動作とステップＢ１、Ｂ２、Ａ９の各動作が繰り返される。

次に、本発明の第２の実施形態の実施例について詳細に説明する。本実施例では、第１の実施形態の実施例と比較して、コンピュータＳが、決定係数Ｒ２ｔの平均値が閾値未満で未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成し、コンピュータＳ内のデータベースを更新する点が異なる。

変更対象選定ルール及び移行クラスタ選定ルールに従った手順の例を、クラスタ数を３つに設定（ｔ＝ａ，ｂ，ｃ）した図８、図１２を利用して説明する。コンピュータＳは図８のクラスタＣａに帰属している従業員ａｉ（ａ１、ａ２、ａ３、ａ４、ａ５）のうちから、図１２に示すように従業員ａ１を除いたクラスタＣａ'１（帰属する従業員：ａ２、ａ３、ａ４、ａ５）について仮代表重回帰係数データセットＦａ'１を算出する。続いて、コンピュータＳは、同様に図８のクラスタＣａに帰属している従業員の中から１名（ａ２、ａ３、ａ４、又はａ５）だけ除いたクラスタＣａ'２、Ｃａ'３、Ｃａ'４、Ｃａ'５について仮代表重回帰係数データセットＦａ'２、Ｆａ'３、Ｆａ'４、Ｆａ'５を算出する（図１２には図示せず）。

次に、コンピュータＳは、図１２に示すように従業員ａ１をクラスタＣａから除外することで、代表重回帰係数データセットＦａがどのように移動するかを示す差分ベクトルΔＦａ'１を算出する。続いて、コンピュータＳは、同様に差分ベクトルΔＦａ'２、ΔＦａ'３、ΔＦａ'４、ΔＦａ'５をそれぞれ算出する（図１２には図示せず）。続いて、コンピュータＳは、算出した差分ベクトルΔＦａ'１〜ΔＦａ'５のうち、大きさの絶対値が最大となる差分ベクトルに対応したクラスタで除外されている従業員を抽出し、除外する。例えば、差分ベクトルΔＦａ'１の絶対値の大きさが最も大きかった場合、差分ベクトルΔＦａ'１に対応したクラスタＣａ'１で除外されている従業員ａ１が除外される。一般化した差分ベクトルΔＦｔ'ｉの算出式は（３）式で表される。

次に、コンピュータＳは、除外された従業員の新たな帰属クラスタを決定するために、差分ベクトルの符号を逆転させた逆差分ベクトルに調整係数α_tiを掛けた値と、除外された従業員の除外前の代表重回帰係数データセットＦａとの和によって、除外された従業員の仮想データセットを算出する。ここで、調整係数α_tiはクラスタｔにおける従業員ｉの有無が差分ベクトルの絶対値に与える影響力を補正する係数で、クラスタｔに帰属する従業員数と正の相関を持つ関数などの利用が考えられる。除外された従業員がクラスタＣａ'１で除外されている従業員ａ１とすると、上記の逆差分ベクトルは、図１２に−ΔＦa'1で示され、上記の除外された従業員ａ１の仮想データセットは、図１２にＦa1で示される。

一般化した仮想データセットＦ_t ⁱの算出式は、（４）式で表される。

Ｆ_t ⁱ＝Ｆ_t−α_ti・ΔＦ_t ^'i （４）
次に、コンピュータＳは、除外された従業員の仮想データセットＦ_t ⁱと、各クラスタＣｔの代表重回帰係数データセットＦｔとのユークリッド距離をそれぞれ算出し、最も距離が近いクラスタに帰属させる。また、最も距離が近いクラスタが除外前のクラスタと同じ場合、コンピュータＳは大きさの絶対値が２番目に大きな差分ベクトルに対応したクラスタで除外されている従業員を抽出して除外し、仮想データセットと最も距離が近いクラスタに再帰属させる。

同様に、コンピュータＳは、上記の帰属変更ルールによる各従業員の帰属するクラスタの入れ替え手続きをクラスタＣｂ、Ｃｃといった他の全クラスタについて実施し、各従業員の帰属するクラスタの入れ替えを行う。

次に、本発明の第２の実施形態の効果について説明する。本実施形態では、第１の実施形態の効果に加え、パラメータの類似する対象の組み合わせを探索する際に、ステップＢ１、Ｂ２により相対的に異質な対象を抽出し、より同質なクラスタに帰属を変更することで、より高速かつ確実にパラメータの類似する対象の組み合わせの探索ができるという効果が得られる。

本発明は、マーケティングや生産性管理などの社会現象を扱う分野において、集団単位での因子間の関係を的確に把握することが可能になるため、集団単位で有効性の高い施策の抽出や、最適なシステムをカスタマイズするといった用途に適用できる。

本発明のモデルの構築システムの第１の実施形態のブロック図である。本発明の第１の実施形態の動作説明用シーケンス図である。知的生産性及び関連要因の重要度に関する尺度法アンケートの一例を示す図である。尺度法アンケート結果を変換した知的生産性評点データＥと評点データセットＸの一例を示す図である。モニタリングした施策活用の定量情報に基づく施策評点データセットＹの一例を示す図である。評点データセットＸ及び施策評点データセットＹの類似性で従業員を３つのクラスタに分類した結果を評点空間に表した概念図である。全てのクラスタ毎に代表重回帰係数データセットＦｔ及び決定係数Ｒ２ｔを算出した例を示す図である。各クラスタの代表重回帰係数データセットと各従業員の重回帰係数データセットの想像値を重回帰係数空間に布置した概念図である。ランダムに従業員を入れ替える帰属変更手順で各クラスタの代表重回帰係数データセットを更新する例を示す概念図である。本発明のモデルの構築システムの第２の実施形態のブロック図である。本発明の第２の実施形態の動作説明用シーケンス図である。変更対象選定ルール及び移行クラスタ選定ルールに従って各クラスタの代表重回帰係数データセットを更新する例を示す概念図である。

符号の説明

１、２モデルの構築システム
１０状態値データセット準備部
２０初期帰属決定部
３０クラスタデータベース
４０パラメータ算出部
５０収束判定部
６０、８０帰属変更部
７０出力部
８０１変更対象選定部
８０２移行クラスタ決定部

Claims

複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、前記第１の状態値を前記第２の状態値で表現するモデルの各パラメータの類似性から前記各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の前記対象の帰属を示す帰属情報を作成する帰属決定ステップと、
前記クラスタ毎に、少なくとも前記モデルを満足する代表パラメータを算出するパラメータ算出ステップと、
前記各クラスタへの前記対象の帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと
を含むことを特徴とするモデルの構築方法。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
前記クラスタデータベースの前記帰属情報と前記状態値データセットとが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第１の状態値を前記第２の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
前記収束判定ステップで未収束と判定された場合に、帰属変更ルールによって前記各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと
を含むことを特徴とするモデルの構築方法。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
前記クラスタデータベースの前記帰属情報又は前記状態値データセットが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第１の状態値を前記第２の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
前記収束判定ステップで未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、かつ、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと
を含むことを特徴とするモデルの構築方法。
前記収束判定ステップは、前記クラスタのすべての前記評価値の平均値と閾値とを比較し、前記平均値が前記閾値以上のときに収束と判定し、前記平均値が前記閾値未満のときに未収束と判定することを特徴とする請求項２又は３記載のモデルの構築方法。
前記帰属変更ルールは、帰属を変更する前記対象をランダムに選択する方法、残差を最小化する方法、及び遺伝的アルゴリズムを利用する方法のうち、いずれか一の方法を利用したルールであることを特徴とする請求項２記載のモデルの構築方法。
前記変更対象選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象、又は前記評価値の上昇が最大となる対象、又は前記評価値が最大となる対象を、入れ替える対象として選択するルールであることを特徴とする請求項３記載のモデルの構築方法。
前記移行クラスタ選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールであることを特徴とする請求項３記載のモデルの構築方法。
前記移行クラスタ選定ルールは、前記クラスタについて前記変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは前記他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、前記クラスタ内の被験者を除外した場合の代表パラメータと前記クラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタ、前記評価値の上昇が最大となるクラスタ、又は前記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールであることを特徴とする請求項３記載のモデルの構築方法。
前記モデルは、線形モデルであることを特徴とする請求項１乃至８のうちいずれか一項記載のモデルの構築方法。
前記線形モデルは、重回帰分析の回帰式又は数量化Ｉ類の推算式であることを特徴とする請求項９記載のモデルの構築方法。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、前記第１の状態値を前記第２の状態値で表現するモデルの各パラメータの類似性から前記各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の前記対象の帰属を示す帰属情報を作成する帰属決定手段と、
前記クラスタ毎に、少なくとも前記モデルを満足する代表パラメータを算出するパラメータ算出手段と、
前記各クラスタへの前記対象の帰属情報及び前記各クラスタの前記代表パラメータを出力する出力手段と、
を備えたことを特徴とするモデルの構築システム。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成する初期帰属決定手段と、
前記初期帰属決定手段で作成された前記帰属情報と前記状態値データセット準備手段で収集された前記状態値データセットとを初期値として蓄積するクラスタデータベースと、
前記クラスタデータベースの前記帰属情報と前記状態値データセットとが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第１の状態値を前記第２の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出手段と、
前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定手段と、
前記収束判定手段で未収束と判定された場合に、帰属変更ルールによって前記各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更手段と、
前記収束判定手段で収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力手段と、
を備えたことを特徴とするモデルの構築システム。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成する初期帰属決定手段と、
前記初期帰属決定手段で作成された前記帰属情報と前記状態値データセット準備手段で収集された前記状態値データセットとを初期値として蓄積するクラスタデータベースと、
前記クラスタデータベースの前記帰属情報又は前記状態値データセットが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第１の状態値を前記第２の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出手段と、
前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定手段と、
前記収束判定手段で未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、かつ、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更手段と、
前記収束判定手段で収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力手段と、
を備えたことを特徴とするモデルの構築システム。
前記収束判定手段は、前記クラスタのすべての前記評価値の平均値と閾値とを比較し、前記平均値が前記閾値以上のときに収束と判定し、前記平均値が前記閾値未満のときに未収束と判定することを特徴とする請求項１２又は１３記載のモデルの構築システム。
前記帰属変更手段は、前記帰属変更ルールとして、帰属を変更する前記対象をランダムに選択する方法、残差を最小化する方法、及び遺伝的アルゴリズムを利用する方法のうち、いずれか一の方法を利用したルールを用いることを特徴とする請求項１２記載のモデルの構築システム。
前記帰属変更手段は、前記変更対象選定ルールとして、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象、又は前記評価値の上昇が最大となる対象、又は前記評価値が最大となる対象を、入れ替える対象として選択するルールを用いることを特徴とする請求項１３記載のモデルの構築システム。
前記帰属変更手段は、前記移行クラスタ選定ルールとして、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールを用いることを特徴とする請求項１３記載のモデルの構築システム。
前記帰属変更手段は、前記移行クラスタ選定ルールとして、前記クラスタについて前記変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは前記他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、前記クラスタ内の被験者を除外した場合の代表パラメータと前記クラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタ、前記評価値の上昇が最大となるクラスタ、又は前記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールを用いることを特徴とする請求項１３記載のモデルの構築システム。
前記モデルは、線形モデルであることを特徴とする請求項１２乃至１８のうちいずれか一項記載のモデルの構築システム。
前記線形モデルは、重回帰分析の回帰式又は数量化Ｉ類の推算式であることを特徴とする請求項１９記載のモデルの構築システム。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、前記第１の状態値を前記第２の状態値で表現するモデルの各パラメータの類似性から前記各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の前記対象の帰属を示す帰属情報を作成する帰属決定ステップと、
前記クラスタ毎に、少なくとも前記モデルを満足する代表パラメータを算出するパラメータ算出ステップと、
前記各クラスタへの前記対象の帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと、
をコンピュータにより実行させることを特徴とするモデルの構築用プログラム。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
前記クラスタデータベースの前記帰属情報と前記状態値データセットとが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第１の状態値を前記第２の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
前記収束判定ステップで未収束と判定された場合に、帰属変更ルールによって前記各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと、
をコンピュータにより実行させることを特徴とするモデルの構築用プログラム。
複数の対象について、目的事象に関する第１の状態値と前記目的事象と関係を持つ説明事象に関する第２の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
前記クラスタデータベースの前記帰属情報又は前記状態値データセットが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第１の状態値を前記第２の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
前記収束判定ステップで未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、かつ、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと、
をコンピュータにより実行させることを特徴とするモデルの構築用プログラム。
前記収束判定ステップは、前記クラスタのすべての前記評価値の平均値と閾値とを比較し、前記平均値が前記閾値以上のときに収束と判定し、前記平均値が前記閾値未満のときに未収束と判定することを特徴とする請求項２２又は２３記載のモデルの構築用プログラム。
前記帰属変更ルールは、帰属を変更する前記対象をランダムに選択する方法、残差を最小化する方法、及び遺伝的アルゴリズムを利用する方法のうち、いずれか一の方法を利用したルールであることを特徴とする請求項２２記載のモデルの構築用プログラム。
前記変更対象選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象、又は前記評価値の上昇が最大となる対象、又は前記評価値が最大となる対象を、入れ替える対象として選択するルールであることを特徴とする請求項２３記載のモデルの構築用プログラム。
前記移行クラスタ選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールであることを特徴とする請求項２３記載のモデルの構築用プログラム。
前記移行クラスタ選定ルールは、前記クラスタについて前記変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは前記他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、前記クラスタ内の被験者を除外した場合の代表パラメータと前記クラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタ、前記評価値の上昇が最大となるクラスタ、又は前記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールであることを特徴とする請求項２３記載のモデルの構築用プログラム。
前記モデルは、線形モデルであることを特徴とする請求項２０乃至２８のうちいずれか一項記載のモデルの構築用プログラム。
前記線形モデルは、重回帰分析の回帰式又は数量化Ｉ類の推算式であることを特徴とする請求項２９記載のモデルの構築用プログラム。