JP2010079325A - モデルの構築方法、構築システム及び構築用プログラム - Google Patents

モデルの構築方法、構築システム及び構築用プログラム Download PDF

Info

Publication number
JP2010079325A
JP2010079325A JP2008243483A JP2008243483A JP2010079325A JP 2010079325 A JP2010079325 A JP 2010079325A JP 2008243483 A JP2008243483 A JP 2008243483A JP 2008243483 A JP2008243483 A JP 2008243483A JP 2010079325 A JP2010079325 A JP 2010079325A
Authority
JP
Japan
Prior art keywords
cluster
attribution
state value
data set
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008243483A
Other languages
English (en)
Other versions
JP5401885B2 (ja
Inventor
Eiji Hirao
英司 平尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008243483A priority Critical patent/JP5401885B2/ja
Publication of JP2010079325A publication Critical patent/JP2010079325A/ja
Application granted granted Critical
Publication of JP5401885B2 publication Critical patent/JP5401885B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】定期的なモニタリングが難しいアンケートなどのデータでも目的事象の挙動を精度良く表現できるモデルの構築を可能にする。
【解決手段】パラメータ算出部40は、クラスタデータベース30から、最新の帰属情報及び状態値データセットを参照して、各クラスタに帰属する対象群の状態値データセット毎に目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータ及び代表パラメータの代表性を示す評価値を算出する。収束判定部50は、パラメータ算出部40からの代表パラメータ及び評価値を受信して、評価値の変化率などを算出し、評価値の収束条件と照らし合わせて収束を判定する。帰属変更部60は、収束判定部50で未収束と判定された場合に、帰属変更ルールによって各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する。
【選択図】図1

Description

本発明はモデルの構築方法、構築システム及び構築用プログラムに係り、特にマーケティングや労働生産性などの要因間に関係を持つ現象に関するモデルの構築方法、構築システム及び構築用プログラムに関する。
マーケティングや労働生産性などの要因間に相関や因果の関係を持つ社会現象に関して、特定の要因の変化を関係のある他の複数の要因で記述する方法として重回帰分析や判別分析がある。これらの分析技術は、目的とする変数に各要因がどの程度寄与するのかを定量化でき、寄与の大きい要因を見出すことで、マーケティング(購買行動)や労働生産性などの効率的な管理のための施策の考案などに活用される。
要因間に関係を持つ現象に関するモデル構築方法及びシステムの一例が、特許文献1に記載されている。この特許文献1に記載された要因間に関係を持つ現象に関するモデル構築方法及びシステムでは、候補説明変数に基づいて説明変数を生成し、目的変数の変化を説明する関係式の適切度が最も高い説明変数と回帰式を探索することにより、候補説明変数それ自体だけでなく、候補説明変数の組み合わせや、候補説明変数に対して何らかの演算処理を施した結果を説明変数として出力可能にする方法を提案している。
また、要因間に関係を持つ現象に関するモデル構築方法及びシステムの別の例が、特許文献2に記載されている。この特許文献2に記載された要因間に関係を持つ現象に関するモデル構築方法及びシステムは、対象データを分析し、相関係数などで属性間の関連度の大きさを求め、モデルの初期条件を自動設定し、さらに使用者がモデルの条件を修正し、設定された条件の下でモデルを推定し、推定されたモデルを評価するという、条件設定、推定、評価、修正を繰り返し行うことにより少ない労力で有効な説明変数の抽出やその関係を表すモデルの作成を可能にする方法を提案している。
特開2000−20504号公報 特開平9−167152号公報
上記の特許文献1及び2に記載された、要因間に関係を持つ現象に関するモデルの構築方法及びシステムは、以下の課題を有する。
第一の課題は、工業製品の歩留まり検査データや気象の時系列データといった定期的なモニタリングが可能なデータを取り扱うことを前提としており、アンケートなどのデータでモデルを解析・構築する場合、モデルのパラメータ算出が困難となることである。モデルのパラメータの算出には、説明変数よりもサンプル数が多いことが条件として求められる。しかし、上記の要因間に関係を持つ現象に関するモデルの構築方法及びシステムが取り扱う社会現象に関するアンケートデータなどは、調査の負担が大きいことや、調査期間が長くなることで一定とすべき測定条件が変化してしまうことなど、分析に必要な条件を備えたデータを得ることが難しい場合が多い。従って、上記の要因間に関係を持つ現象に関するモデルの構築方法及びシステムでは、必要なサンプル数の確保が困難であるため、モデルのパラメータ算出が困難となる。
第二の課題は、工業製品の歩留まり検査データや気象の時系列データといった同一条件であれば同一の値を仮定する同質なデータを取り扱うことを前提としており、アンケートにおける異なる被験者のデータのような同一条件であっても同一の回答を想定することができない異質なデータでモデルを解析・構築する場合、得られるモデルで目的事象の挙動を表現することが困難となることである。社会現象に関するモデルの構築には、少ない回数の調査データで必要なサンプル数を確保するために、被験者毎といった質の異なるサンプルのデータを集計して利用すると、被験者によって説明事象と目的事象との間の関係に相違があるため、得られるモデルの精度が低くなってしまうためである。
本発明は以上の点に鑑みなされたもので、定期的なモニタリングが難しいアンケートなどのデータでも目的事象の挙動を精度良く表現できるモデルの構築を可能にする要因間に関係を持つ現象に関するモデルの構築方法、構築システム及び構築用プログラムを提供することを目的とする。
上記の目的を達成するため、第1の発明のモデルの構築方法は、複数の対象について、目的事象に関する第1の状態値と目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、状態値データセットを収集した複数の対象のそれぞれについて、第1の状態値を第2の状態値で表現するモデルの各パラメータの類似性から各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の対象の帰属を示す帰属情報を作成する帰属決定ステップと、クラスタ毎に、少なくともモデルを満足する代表パラメータを算出するパラメータ算出ステップと、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータとを出力する出力ステップと、を含むことを特徴とする。
また、上記の目的を達成するため、第2の発明のモデルの構築システムは、複数の対象について、目的事象に関する第1の状態値と目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、状態値データセットを収集した複数の対象のそれぞれについて、第1の状態値を第2の状態値で表現するモデルの各パラメータの類似性から各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の対象の帰属を示す帰属情報を作成する帰属決定手段と、クラスタ毎に、少なくともモデルを満足する代表パラメータを算出するパラメータ算出手段と、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータとを出力する出力手段と、を備えたことを特徴とする。
更に、上記の目的を達成するため、第3の発明のモデルの構築用プログラムは、複数の対象について、目的事象に関する第1の状態値と目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、状態値データセットを収集した複数の対象のそれぞれについて、第1の状態値を第2の状態値で表現するモデルの各パラメータの類似性から各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の対象の帰属を示す帰属情報を作成する帰属決定ステップと、クラスタ毎に、少なくともモデルを満足する代表パラメータを算出するパラメータ算出ステップと、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータとを出力する出力ステップとを、コンピュータにより実行させることを特徴とする。
本発明によれば、定期的なモニタリングが難しいアンケートなどのデータでも目的事象の挙動を精度良く表現するモデルの構築を可能にできる。
次に、本発明の実施形態について、図面を参照して詳細に説明する。
(第1の実施形態)
図1は、本発明になるモデルの構築システムの第1の実施形態のブロック図を示す。本実施形態のモデルの構築システム1は、基本的に電子機器内もしくはサーバと電子機器及びこれらを相互に接続するインターネット等の情報通信ネットワークからなるシステム内に、少なくとも、状態値データセット準備部10と、初期帰属決定部20と、クラスタデータベース30と、パラメータ算出部40と、収束判定部50と、帰属変更部60と、出力部70と、を含む。ただし、状態値データセット準備部10は、必ずしも上記システム内に含まれる必要は無く、紙などの媒体を利用してもよい。
状態値データセット準備部10は、データ取得手段(図示せず)により、人もしくは物といった複数の対象に関して、目的事象に関する状態値と説明事象に関する状態値とからなる状態値データセットを収集する。本明細書において、「目的事象に関する状態値」とは、分析・管理の目的とする現象の挙動を表現する変数を意味し、例えば回帰モデルにおける従属変数や目的変数などが考えられる。また、「説明事象に関する状態値」とは、目的事象と相関関係や因果関係を持つ現象の挙動を表現する変数を意味し、例えば回帰モデルにおける独立変数や説明変数などが考えられる。
上記データ取得手段としては、アンケートやセンサを用いたモニタリングなどのいずれか又はその併用が考えられる。また、上記状態値としては、目的事象と説明事象に関するアンケートへの回答やセンサなどによってモニタリングされたデータなどが相当する。状態値は、アンケートへの回答を利用する場合、順序尺度、間隔尺度、比例尺度などで回答された評点の他、名義尺度として回答された値である。更には、状態値を得るためには、自由記述などのテキストデータにおける任意の用語の使用頻度や用語間の共起度などを利用することも考えられる。また、説明事象は複数あってもよい。
初期帰属決定部20は、状態値データセット準備部10で状態値データセットを収集した対象のそれぞれについて、初期帰属設定ルールによって任意に設定したクラスタ数のクラスタへ各対象を帰属させ、クラスタ毎の対象の帰属を示す帰属情報を作成し、状態値データセットと共にクラスタデータベース30に送信する。上記の初期帰属設定ルールは任意に設定してよい。例えば、初期帰属設定ルールには、対象をランダムに分配する方法や、状態値データセット準備部10で収集した対象の状態値データセット間のミンコフスキー距離や相関などを非類似度としてk−means法などのクラスタリング手法を適用し各対象の状態値データセットの類似性によって分類を行う方法などが考えられる。また、クラスタ数も任意に設定してよい。ただし、クラスタ数は、各クラスタに帰属する対象の数が、目的事象の挙動を説明事象の挙動を用いて表現するモデルを満足する代表パラメータの算出に必要なサンプル数を超えるように設定する必要がある。
クラスタデータベース30は、初期帰属決定部20で算出された帰属情報と各対象の状態値データセット、及び後述する帰属変更部60で算出された帰属情報を収集し、更新して蓄積することで、最新の情報を参照可能にする。
パラメータ算出部40は、クラスタデータベース30に帰属情報が新規登録もしくは更新された場合、クラスタデータベース30から、最新の帰属情報及び状態値データセットを参照して、各クラスタに帰属する対象群の状態値データセット毎に目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータ及び代表パラメータの代表性を示す評価値を算出し、収束判定部50に送信する。上記のモデルとしては重回帰分析の回帰式や数量化I類の推算式などの線形モデルの他、決定木などの非線形モデルが考えられ、上記代表パラメータとしては重回帰係数やウエイト、決定木の構造情報などが考えられる。また、上記評価値としては決定係数や自由度修正済み決定係数、重回帰係数の変動幅や変動率、数量化I類のウエイトの変動幅や変動率などが考えられる。
収束判定部50は、パラメータ算出部40から送信された代表パラメータ及び評価値を受信した際に、評価値の変化率を算出し、評価値の収束条件と照らし合わせて収束を判定する。上記収束条件としては指標値と任意の閾値との比較や、指標値の変動率と任意の閾値との比較による方法などが考えられる。
帰属変更部60は、収束判定部50で未収束と判定された場合に、帰属変更ルールによって各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成し、更新するためにクラスタデータベース30に送信する。上記帰属変更ルールとしては、帰属を変更する対象をランダムに選択する方法や、残差を最小化する方法、遺伝的アルゴリズムを利用する方法などが考えられる。
出力部70は、収束判定部50で収束完了と判定された場合、各クラスタへの対象の帰属情報及び各クラスタの代表パラメータを出力する。
次に、図1のブロック図及び図2のシーケンス図を併せ参照して本発明の第1の実施形態の全体の動作について詳細に説明する。
状態値データセット準備部10は、アンケートやセンサによるモニタリングなどを用いて、分析・管理の目的とする目的事象及び目的事象に対して相関関係や因果関係を持つ説明事象に関する状態値からなる状態値データセットを複数の対象から収集する(ステップA1)。
初期帰属決定部20は、状態値データセット準備部10で収集した状態値データセットの対象のそれぞれについて、初期帰属設定ルールによって任意に設定したクラスタ数のクラスタへ各対象を帰属させ、クラスタ毎の対象の帰属関係を示す帰属情報を作成する(ステップA2)。更に初期帰属決定部20は、作成した上記の帰属情報を状態値データセットと共にクラスタデータベース30に新規登録するために送信する(ステップA3)。
クラスタデータベース30は、初回は初期帰属決定部20で算出された帰属情報と各対象の状態値データセットを新規登録し、2回目以降は登録している帰属情報を帰属変更部60で算出された帰属情報に更新して蓄積することで、最新の情報を参照可能にする(ステップA4)。
パラメータ算出部40は、クラスタデータベース30に帰属情報が新規登録もしくは更新された場合、クラスタデータベース30から、最新の帰属情報及び状態値データセットを参照して、各クラスタに帰属する対象群の状態値データセット毎に目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータ及び代表パラメータの代表性を示す評価値を算出する(ステップA5)。続いて、パラメータ算出部40は、算出した代表パラメータ及び評価値を収束判定部50に送信する(ステップA6)。
収束判定部50は、パラメータ算出部40から送信された代表パラメータ及び評価値を受信して、評価値の変化率を算出し、評価値の収束条件と照らし合わせて収束を判定する(ステップA7)。
帰属変更部60は、収束判定部50で未収束と判定された場合に、帰属変更ルールによって各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する(ステップA8)。続いて、帰属変更部60は、新たに作成した帰属情報をクラスタデータベース30に送信する(ステップA9)。帰属情報更新のためである。
ステップA7で収束判定部50が収束完了と判定するまで、ステップA4からステップA9までの動作が繰り返される。出力部70は、収束判定部50で収束完了と判定された場合、収束完了と判定された各クラスタへの対象の帰属情報及び各クラスタの代表パラメータを出力する(ステップA10)。
次に、本発明の第1の実施形態の実施例について詳細に説明する。
本実施例では、実際のオフィスにおける知的生産性を分析・管理の目的とし、知的生産性の関連要因の重要性や向上に向けて実施した複数の施策の活用性を説明事象として、施策の導入後に従業員に対して行ったアンケート結果、及び各従業員が専属的に使用しているパーソナルコンピュータ(以下、PC)端末から得られる各種操作履歴に基づき、各施策の活用性と最終的な知的生産性の向上との関係をモデル化し、従業員の特性に合わせて最も有効な施策を抽出することでオフィスの知的生産性を向上することを目的としている。また、本実施例において、アンケートにより商品への印象を抽出する装置が、インターネットを介して各従業員の持つPC端末と接続されている。この装置は、イントラネット上でアンケートの募集、情報の提示、アンケート質問の提示、回答の入力、集計などを実現するWebアンケートシステムWと、各従業員の持つPC端末の操作履歴を取得するログ収集システムPと、データの蓄積と解析を行うコンピュータSとを備えている。
状態値データセット準備部10は、WebアンケートシステムW内及びログ収集システムP内に含まれている。また、初期帰属決定部20と、クラスタデータベース30と、パラメータ算出部40と、収束判定部50と、帰属変更部60と、出力部70とはコンピュータS内に含まれている。この様な手段を備えたWebアンケートシステムW、ログ収集システムP、コンピュータSは以下のような動作をする。
WebアンケートシステムWは、施策の導入後にm人の従業員に対して、図3に示すような知的生産性、及び知的生産性に関連すると思われるp種類の生産性関連要因のそれぞれの重要度に関する質問項目群k(k1,k2,・・,kp)への尺度法アンケートを各従業員のPC端末を通じて提示し、回答の入力を受け付ける。質問項目群kは上記に加え、各従業員の年齢、性別、所属などの属性情報を含んでもよい。
更に、WebアンケートシステムWは、図3に示したアンケートにおいて水平方向の5箇所のチェック箇所(○をつける箇所)のうちチェックをつけた箇所が一番左の場合は「1」、左から二番目の場合は「2」、左から三番目の場合は「3」、左から四番目の場合は「4」、一番右の場合は「5」というように、図4に示すように、「1」〜「5」の整数でチェックをつけた箇所を数値化する。そして、WebアンケートシステムWは、上記の数値化した結果に基づいて、従業員毎にアンケートの回答を知的生産性評点データEと評点データセットX(x1、x2、・・・、xp)に変換し、従業員毎に割り振られた従業員IDとともに紐付けして集計し、コンピュータS内のデータベースに格納する。
ログ収集システムPは、施策の導入後にm人の従業員のそれぞれのPC端末の操作・動作ログから、知的生産性の向上のために導入した施策の利用状況として図5に示すようなq種類のモニタリング項目群l(l1、l2、・・・、lq)に対する施策活用の定量情報を施策評点データセットY(y1、y2、・・・、yq)としてモニタリングする。そして、ログ収集システムPは、それぞれのモニタリング項目群lに関する施策評点データセットYを従業員毎に割り振られた従業員IDとともに紐付けして集計し、コンピュータS内のデータベースに格納する。
コンピュータSは、WebアンケートシステムW及びログ収集システムPが知的生産性評点データE、評点データセットX及び施策評点データセットYを収集したm人の従業員のそれぞれについて、各従業員の知的生産性評点データE、評点データセットX及び施策評点データセットYを合わせたデータ列間のユークリッド距離を非類似度としてk−means法を適用し、データセットの類似性によって任意に設定したクラスタ数に各従業員を分類する。更に、コンピュータSは、分類結果として得られた各クラスタと従業員との帰属関係情報をコンピュータS内のデータベースに新規登録する。
図6は、クラスタリングのイメージとして評点データセットX及び施策評点データセットYの類似性で従業員をクラスタCt(t=a,b,c)の3つのクラスタに分類した結果を評点空間に表した概念図である。図6において、図形は各従業員の評点データセットに対応しており、点線の囲みはクラスタの境界を意味している。なお、図6ではイメージを掴みやすくするために各従業員の位置関係を平面上で表現しているが、実際には各従業員はp+q次元の空間に配置される。(1)式は、従業員IとIIの類似性指標の例を示す。
Figure 2010079325
更に、コンピュータSは、データベース内の帰属情報が新規登録もしくは更新された場合、データベースから、クラスタ別に帰属する全従業員の従業員IDと従業員IDに対応する知的生産性評点データE、評点データセットX及び施策評点データセットYを参照して、知的生産性を目的変数、質問項目群kとモニタリング項目群lを説明変数とする重回帰分析を実施することで、図7に示すように、クラスタCtの全てのクラスタ毎に代表重回帰係数データセットFt及び決定係数R2t(すなわち、R2a,R2b,R2c,・・・)を算出する。代表重回帰係数データセットFtは以下の(2)式のようなp+q個の代表重回帰係数データfからなるデータ構造となっている。
Ft=(ft,k1,ft,k2,・・・ft,kp,ft,l1,ft,l2,・・・ft,lq) (2)
この代表重回帰係数データセットFtは、目的事象の状態値を説明事象の状態値で表現するモデルを満足する代表パラメータである。また、決定係数R2tは、代表重回帰係数データセットFtの代表性を示すモデル評価値である。
図8は、クラスタリングのイメージとして重回帰係数空間において、評点データセットの類似性でクラスタリングされた各従業員の布置と、クラスタ数を3つにした場合での各クラスタの代表重回帰係数データセットFtの関係を示す。図8において、図形は各従業員の重回帰係数データセットに対応しており、点数の囲みはクラスタの境界を意味している。なお、図8でも図6と同様にイメージを掴みやすくするために各従業員の位置関係を平面上で表現しているが、実際には各従業員はp+q次元の空間に配置される。
原理的に従業員単位の重回帰係数データセットは算出できないため、図8は、各従業員の位置をイメージとして置いた想像値を点線で示しており、数値が得られる各クラスタCt(t=a,b,c)の代表重回帰係数データセットFtのみを実線で表示している。また、図6とは空間が異なるため各従業員の位置関係が変化し、必ずしも距離の近い各従業員同士が同一クラスタに含まれるわけではない。
次に、コンピュータSは、算出した全クラスタの決定係数R2tの平均値と閾値とを比較し、決定係数R2tの平均値が閾値以上になった場合は収束、閾値未満になった場合は未収束として、収束判定を行う。ここで、全クラスタの決定係数R2tの平均値の算出方法としては、各クラスタを対等とした単純平均でもよいし、各クラスタの人数比で重み付けした重み付け平均などを利用してもよい。
続いて、コンピュータSは、決定係数R2tの平均値が閾値未満で未収束と判定された場合に、各クラスタに帰属する従業員の一人をランダムに選択し、他のクラスタに帰属させる帰属変更手順によって各クラスタに帰属する従業員を入れ替え、新たなクラスタ毎の従業員の帰属を示す帰属情報を作成し、コンピュータS内のデータベースを更新する。
図9は、前記帰属変更手順の一例を示す。この図9は、図8の状態から、クラスタCaでランダムに選ばれた従業員a5をクラスタCbに、クラスタCbでランダムに選ばれた従業員b1をクラスタCaに、クラスタCcでランダムに選ばれた従業員c4をクラスタCbに入れ替えた状態のイメージを示す。
そして、コンピュータSは、上記の帰属変更手順によって更新された帰属情報に基づき代表重回帰係数データセットFt及び決定係数R2tを再計算し、決定係数R2tの平均値が閾値以上と判定されるまで、帰属情報の更新を繰り返す。
一方、コンピュータSは、決定係数R2tの平均値が閾値以上で収束と判定された場合は、その判定時の各クラスタへの従業員の帰属情報及び各クラスタの代表重回帰係数データセットFtを出力する。更に、コンピュータSは、その出力結果から、クラスタ毎の代表重回帰係数の相対的な値の比較を行い、クラスタ毎の知的生産性の向上に寄与する項目の抽出と施策の立案を行うことや、クラスタに帰属する従業員の属性との相関を分析し、属性毎の知的生産性向上施策の立案などを実施することが考えられる。
次に、本発明の第1の実施形態の効果について説明する。本実施形態では、対象をクラスタに分けてパラメータの類似する対象の組み合わせを抽出することで、異質でバラつきが大きい対象間のデータを集計したデータセットから、説明事象の挙動を用いて、目的事象の挙動を精度良く表現できるモデルの代表パラメータを抽出することができる。
また、本実施形態によれば、定期的なモニタリングが難しいアンケートなどのデータでも目的変数の挙動を表現するモデルの構築が可能になる。その理由は、分析・管理の対象とする目的事象に対して相関や因果の関係を持つ説明事象に関する状態値のデータセットを複数の対象に対して調査し、モデルの各パラメータの類似する対象の組み合わせを探索させて対象をクラスタリングすることによって、調査回数がパラメータ数より少なく個々の対象毎にパラメータを算出できないデータでも、対象の属するクラスタのパラメータという形で対象に対応するパラメータの算出を可能にしていることと、異質でバラつきが大きい対象間のデータを集計したデータセットから、説明事象の挙動を用いて、目的事象の挙動を精度良く表現できるモデルの代表パラメータを抽出することができるためである。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。図10は、本発明になるモデルの構築システムの第2の実施形態のブロック図を示す。同図中、図1と同一構成部分には同一符号を付し、その説明を省略する。図10に示す本発明の第2の実施形態のモデルの構築システム2は、第1の実施形態のモデルの構築システム1の帰属変更部60の替りに、変更対象選定部801と移行クラスタ決定部802とを含む帰属変更部80を設けたものである。
変更対象選定部801は、収束判定部50で未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択する。移行クラスタ決定部802は、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する。ここで、前記変更対象選定ルールとしては、各クラスタについて帰属する各対象の状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象や、評価値の上昇が最大となる対象、又は評価値が最大となる対象を、入れ替える対象として選択するルールなどが考えられる。また、前記移行クラスタ選定ルールとしては、各クラスタについて帰属する各対象の状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールなどが考えられる。
更に、前記移行クラスタ選定ルールとして、上記以外に、各クラスタについて変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、クラスタ内の被験者を除外した場合の代表パラメータとクラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタや、算出した上記評価値の上昇が最大となるクラスタ、又は上記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールなども考えられる。
なお、上記の評価値の上昇は、被験者が除外された時点(n人のクラスタ)と、他のクラスタからの被験者が帰属した時点(n+1人のクラスタ)との差に相当する。また、上記の評価値が最大となるクラスタとは、各クラスタに対して被験者の再帰属先の候補となる全クラスタでの比較の結果得られる複数の評価値(例えば、5つのクラスタがある場合は5つの評価値)のうち、最大の評価値のクラスタのことである。
次に、図10のブロック図及び図11のシーケンス図を併せ参照して本実施形態の全体の動作について説明する。図11中、図2と同一処理部分は同一符号を付し、その説明を省略する。本実施形態では、帰属変更部80が、収束判定部50で未収束と判定された場合に、変更対象選定部801により変更対象選定ルールに最も適合する対象を帰属を入れ替える対象として選択する(ステップB1)。続いて、帰属変更部80は、移行クラスタ決定部802により移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成する(ステップB2)。
その後、帰属変更部80は、作成した帰属情報をクラスタデータベース30に送信する(ステップA9)。そして、ステップA7で収束判定部50が収束完了と判定するまで、ステップA4〜A7の各動作とステップB1、B2、A9の各動作が繰り返される。
次に、本発明の第2の実施形態の実施例について詳細に説明する。本実施例では、第1の実施形態の実施例と比較して、コンピュータSが、決定係数R2tの平均値が閾値未満で未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成し、コンピュータS内のデータベースを更新する点が異なる。
変更対象選定ルール及び移行クラスタ選定ルールに従った手順の例を、クラスタ数を3つに設定(t=a,b,c)した図8、図12を利用して説明する。コンピュータSは図8のクラスタCaに帰属している従業員ai(a1、a2、a3、a4、a5)のうちから、図12に示すように従業員a1を除いたクラスタCa'1(帰属する従業員:a2、a3、a4、a5)について仮代表重回帰係数データセットFa'1を算出する。続いて、コンピュータSは、同様に図8のクラスタCaに帰属している従業員の中から1名(a2、a3、a4、又はa5)だけ除いたクラスタCa'2、Ca'3、Ca'4、Ca'5について仮代表重回帰係数データセットFa'2、Fa'3、Fa'4、Fa'5を算出する(図12には図示せず)。
次に、コンピュータSは、図12に示すように従業員a1をクラスタCaから除外することで、代表重回帰係数データセットFaがどのように移動するかを示す差分ベクトルΔFa'1を算出する。続いて、コンピュータSは、同様に差分ベクトルΔFa'2、ΔFa'3、ΔFa'4、ΔFa'5をそれぞれ算出する(図12には図示せず)。続いて、コンピュータSは、算出した差分ベクトルΔFa'1〜ΔFa'5のうち、大きさの絶対値が最大となる差分ベクトルに対応したクラスタで除外されている従業員を抽出し、除外する。例えば、差分ベクトルΔFa'1の絶対値の大きさが最も大きかった場合、差分ベクトルΔFa'1に対応したクラスタCa'1で除外されている従業員a1が除外される。一般化した差分ベクトルΔFt'iの算出式は(3)式で表される。
Figure 2010079325
次に、コンピュータSは、除外された従業員の新たな帰属クラスタを決定するために、差分ベクトルの符号を逆転させた逆差分ベクトルに調整係数αtiを掛けた値と、除外された従業員の除外前の代表重回帰係数データセットFaとの和によって、除外された従業員の仮想データセットを算出する。ここで、調整係数αtiはクラスタtにおける従業員iの有無が差分ベクトルの絶対値に与える影響力を補正する係数で、クラスタtに帰属する従業員数と正の相関を持つ関数などの利用が考えられる。除外された従業員がクラスタCa'1で除外されている従業員a1とすると、上記の逆差分ベクトルは、図12に−ΔFa'1で示され、上記の除外された従業員a1の仮想データセットは、図12にFa1で示される。
一般化した仮想データセットFt iの算出式は、(4)式で表される。
t i=Ft−αti・ΔFt 'i (4)
次に、コンピュータSは、除外された従業員の仮想データセットFt iと、各クラスタCtの代表重回帰係数データセットFtとのユークリッド距離をそれぞれ算出し、最も距離が近いクラスタに帰属させる。また、最も距離が近いクラスタが除外前のクラスタと同じ場合、コンピュータSは大きさの絶対値が2番目に大きな差分ベクトルに対応したクラスタで除外されている従業員を抽出して除外し、仮想データセットと最も距離が近いクラスタに再帰属させる。
同様に、コンピュータSは、上記の帰属変更ルールによる各従業員の帰属するクラスタの入れ替え手続きをクラスタCb、Ccといった他の全クラスタについて実施し、各従業員の帰属するクラスタの入れ替えを行う。
次に、本発明の第2の実施形態の効果について説明する。本実施形態では、第1の実施形態の効果に加え、パラメータの類似する対象の組み合わせを探索する際に、ステップB1、B2により相対的に異質な対象を抽出し、より同質なクラスタに帰属を変更することで、より高速かつ確実にパラメータの類似する対象の組み合わせの探索ができるという効果が得られる。
本発明は、マーケティングや生産性管理などの社会現象を扱う分野において、集団単位での因子間の関係を的確に把握することが可能になるため、集団単位で有効性の高い施策の抽出や、最適なシステムをカスタマイズするといった用途に適用できる。
本発明のモデルの構築システムの第1の実施形態のブロック図である。 本発明の第1の実施形態の動作説明用シーケンス図である。 知的生産性及び関連要因の重要度に関する尺度法アンケートの一例を示す図である。 尺度法アンケート結果を変換した知的生産性評点データEと評点データセットXの一例を示す図である。 モニタリングした施策活用の定量情報に基づく施策評点データセットYの一例を示す図である。 評点データセットX及び施策評点データセットYの類似性で従業員を3つのクラスタに分類した結果を評点空間に表した概念図である。 全てのクラスタ毎に代表重回帰係数データセットFt及び決定係数R2tを算出した例を示す図である。 各クラスタの代表重回帰係数データセットと各従業員の重回帰係数データセットの想像値を重回帰係数空間に布置した概念図である。 ランダムに従業員を入れ替える帰属変更手順で各クラスタの代表重回帰係数データセットを更新する例を示す概念図である。 本発明のモデルの構築システムの第2の実施形態のブロック図である。 本発明の第2の実施形態の動作説明用シーケンス図である。 変更対象選定ルール及び移行クラスタ選定ルールに従って各クラスタの代表重回帰係数データセットを更新する例を示す概念図である。
符号の説明
1、2 モデルの構築システム
10 状態値データセット準備部
20 初期帰属決定部
30 クラスタデータベース
40 パラメータ算出部
50 収束判定部
60、80 帰属変更部
70 出力部
801 変更対象選定部
802 移行クラスタ決定部

Claims (30)

  1. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、前記第1の状態値を前記第2の状態値で表現するモデルの各パラメータの類似性から前記各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の前記対象の帰属を示す帰属情報を作成する帰属決定ステップと、
    前記クラスタ毎に、少なくとも前記モデルを満足する代表パラメータを算出するパラメータ算出ステップと、
    前記各クラスタへの前記対象の帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと
    を含むことを特徴とするモデルの構築方法。
  2. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
    前記クラスタデータベースの前記帰属情報と前記状態値データセットとが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第1の状態値を前記第2の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
    前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
    前記収束判定ステップで未収束と判定された場合に、帰属変更ルールによって前記各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
    前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと
    を含むことを特徴とするモデルの構築方法。
  3. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
    前記クラスタデータベースの前記帰属情報又は前記状態値データセットが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第1の状態値を前記第2の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
    前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
    前記収束判定ステップで未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、かつ、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
    前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと
    を含むことを特徴とするモデルの構築方法。
  4. 前記収束判定ステップは、前記クラスタのすべての前記評価値の平均値と閾値とを比較し、前記平均値が前記閾値以上のときに収束と判定し、前記平均値が前記閾値未満のときに未収束と判定することを特徴とする請求項2又は3記載のモデルの構築方法。
  5. 前記帰属変更ルールは、帰属を変更する前記対象をランダムに選択する方法、残差を最小化する方法、及び遺伝的アルゴリズムを利用する方法のうち、いずれか一の方法を利用したルールであることを特徴とする請求項2記載のモデルの構築方法。
  6. 前記変更対象選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象、又は前記評価値の上昇が最大となる対象、又は前記評価値が最大となる対象を、入れ替える対象として選択するルールであることを特徴とする請求項3記載のモデルの構築方法。
  7. 前記移行クラスタ選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールであることを特徴とする請求項3記載のモデルの構築方法。
  8. 前記移行クラスタ選定ルールは、前記クラスタについて前記変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは前記他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、前記クラスタ内の被験者を除外した場合の代表パラメータと前記クラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタ、前記評価値の上昇が最大となるクラスタ、又は前記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールであることを特徴とする請求項3記載のモデルの構築方法。
  9. 前記モデルは、線形モデルであることを特徴とする請求項1乃至8のうちいずれか一項記載のモデルの構築方法。
  10. 前記線形モデルは、重回帰分析の回帰式又は数量化I類の推算式であることを特徴とする請求項9記載のモデルの構築方法。
  11. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、前記第1の状態値を前記第2の状態値で表現するモデルの各パラメータの類似性から前記各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の前記対象の帰属を示す帰属情報を作成する帰属決定手段と、
    前記クラスタ毎に、少なくとも前記モデルを満足する代表パラメータを算出するパラメータ算出手段と、
    前記各クラスタへの前記対象の帰属情報及び前記各クラスタの前記代表パラメータを出力する出力手段と、
    を備えたことを特徴とするモデルの構築システム。
  12. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成する初期帰属決定手段と、
    前記初期帰属決定手段で作成された前記帰属情報と前記状態値データセット準備手段で収集された前記状態値データセットとを初期値として蓄積するクラスタデータベースと、
    前記クラスタデータベースの前記帰属情報と前記状態値データセットとが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第1の状態値を前記第2の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出手段と、
    前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定手段と、
    前記収束判定手段で未収束と判定された場合に、帰属変更ルールによって前記各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更手段と、
    前記収束判定手段で収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力手段と、
    を備えたことを特徴とするモデルの構築システム。
  13. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備手段と、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成する初期帰属決定手段と、
    前記初期帰属決定手段で作成された前記帰属情報と前記状態値データセット準備手段で収集された前記状態値データセットとを初期値として蓄積するクラスタデータベースと、
    前記クラスタデータベースの前記帰属情報又は前記状態値データセットが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第1の状態値を前記第2の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出手段と、
    前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定手段と、
    前記収束判定手段で未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、かつ、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更手段と、
    前記収束判定手段で収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力手段と、
    を備えたことを特徴とするモデルの構築システム。
  14. 前記収束判定手段は、前記クラスタのすべての前記評価値の平均値と閾値とを比較し、前記平均値が前記閾値以上のときに収束と判定し、前記平均値が前記閾値未満のときに未収束と判定することを特徴とする請求項12又は13記載のモデルの構築システム。
  15. 前記帰属変更手段は、前記帰属変更ルールとして、帰属を変更する前記対象をランダムに選択する方法、残差を最小化する方法、及び遺伝的アルゴリズムを利用する方法のうち、いずれか一の方法を利用したルールを用いることを特徴とする請求項12記載のモデルの構築システム。
  16. 前記帰属変更手段は、前記変更対象選定ルールとして、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象、又は前記評価値の上昇が最大となる対象、又は前記評価値が最大となる対象を、入れ替える対象として選択するルールを用いることを特徴とする請求項13記載のモデルの構築システム。
  17. 前記帰属変更手段は、前記移行クラスタ選定ルールとして、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールを用いることを特徴とする請求項13記載のモデルの構築システム。
  18. 前記帰属変更手段は、前記移行クラスタ選定ルールとして、前記クラスタについて前記変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは前記他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、前記クラスタ内の被験者を除外した場合の代表パラメータと前記クラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタ、前記評価値の上昇が最大となるクラスタ、又は前記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールを用いることを特徴とする請求項13記載のモデルの構築システム。
  19. 前記モデルは、線形モデルであることを特徴とする請求項12乃至18のうちいずれか一項記載のモデルの構築システム。
  20. 前記線形モデルは、重回帰分析の回帰式又は数量化I類の推算式であることを特徴とする請求項19記載のモデルの構築システム。
  21. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、前記第1の状態値を前記第2の状態値で表現するモデルの各パラメータの類似性から前記各対象を複数のクラスタのいずれかに分類し、そのクラスタ毎の前記対象の帰属を示す帰属情報を作成する帰属決定ステップと、
    前記クラスタ毎に、少なくとも前記モデルを満足する代表パラメータを算出するパラメータ算出ステップと、
    前記各クラスタへの前記対象の帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと、
    をコンピュータにより実行させることを特徴とするモデルの構築用プログラム。
  22. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
    前記クラスタデータベースの前記帰属情報と前記状態値データセットとが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第1の状態値を前記第2の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
    前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
    前記収束判定ステップで未収束と判定された場合に、帰属変更ルールによって前記各クラスタに帰属する対象を入れ替え、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
    前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと、
    をコンピュータにより実行させることを特徴とするモデルの構築用プログラム。
  23. 複数の対象について、目的事象に関する第1の状態値と前記目的事象と関係を持つ説明事象に関する第2の状態値とからなる状態値データセットを収集する状態値データセット準備ステップと、
    前記状態値データセットを収集した前記複数の対象のそれぞれについて、初期帰属設定ルールによって任意に設定した数のクラスタへ各対象を帰属させ、前記クラスタ毎の対象の帰属を示す帰属情報を作成して、その帰属情報を前記状態値データセット準備ステップで収集された前記状態値データセットと共に初期値としてクラスタデータベースに蓄積する初期帰属決定ステップと、
    前記クラスタデータベースの前記帰属情報又は前記状態値データセットが更新された際に、更新後の前記帰属情報及び前記状態値データセットを参照して、前記クラスタ毎に前記第1の状態値を前記第2の状態値で表現するモデルの代表パラメータ及び評価値を算出するパラメータ算出ステップと、
    前記代表パラメータ及び前記評価値が算出された際に、前記評価値の変化率を算出し、前記評価値の収束条件と照らし合わせて収束を判定する収束判定ステップと、
    前記収束判定ステップで未収束と判定された場合に、変更対象選定ルールに最も適合する対象を、帰属を入れ替える対象として選択し、かつ、移行クラスタ選定ルールに最も適合するクラスタに対象の帰属を変更し、新たなクラスタ毎の対象の帰属を示す帰属情報を作成すると共に、前記データベースの帰属情報を、その作成した帰属情報に更新する帰属変更ステップと、
    前記収束判定ステップで収束完了と判定された場合、前記各クラスタへの対象の前記帰属情報及び前記各クラスタの前記代表パラメータを出力する出力ステップと、
    をコンピュータにより実行させることを特徴とするモデルの構築用プログラム。
  24. 前記収束判定ステップは、前記クラスタのすべての前記評価値の平均値と閾値とを比較し、前記平均値が前記閾値以上のときに収束と判定し、前記平均値が前記閾値未満のときに未収束と判定することを特徴とする請求項22又は23記載のモデルの構築用プログラム。
  25. 前記帰属変更ルールは、帰属を変更する前記対象をランダムに選択する方法、残差を最小化する方法、及び遺伝的アルゴリズムを利用する方法のうち、いずれか一の方法を利用したルールであることを特徴とする請求項22記載のモデルの構築用プログラム。
  26. 前記変更対象選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合のクラスタの代表パラメータもしくは評価値を算出し、除外した場合の代表パラメータと除外しない場合の代表パラメータとの差が最大となる対象、又は前記評価値の上昇が最大となる対象、又は前記評価値が最大となる対象を、入れ替える対象として選択するルールであることを特徴とする請求項23記載のモデルの構築用プログラム。
  27. 前記移行クラスタ選定ルールは、前記クラスタについて帰属する各対象の前記状態値データセットを除外した場合の代表パラメータと除外しない場合の代表パラメータの変化をベクトルと捉え、除外しない場合の代表パラメータに逆方向のベクトルを加えた仮想的パラメータと最も近い他のクラスタに移すルールであることを特徴とする請求項23記載のモデルの構築用プログラム。
  28. 前記移行クラスタ選定ルールは、前記クラスタについて前記変更対象選定ルールによって他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの代表パラメータ、若しくは前記他のクラスタから除外された対象の状態値データセットを加えた場合のクラスタの評価値を算出し、前記クラスタ内の被験者を除外した場合の代表パラメータと前記クラスタ内の被験者を除外しない場合の代表パラメータとの差が最大となるクラスタ、前記評価値の上昇が最大となるクラスタ、又は前記評価値が最大となるクラスタを、再帰属先のクラスタとして選択するルールであることを特徴とする請求項23記載のモデルの構築用プログラム。
  29. 前記モデルは、線形モデルであることを特徴とする請求項20乃至28のうちいずれか一項記載のモデルの構築用プログラム。
  30. 前記線形モデルは、重回帰分析の回帰式又は数量化I類の推算式であることを特徴とする請求項29記載のモデルの構築用プログラム。
JP2008243483A 2008-09-24 2008-09-24 モデルの構築方法、構築システム及び構築用プログラム Expired - Fee Related JP5401885B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008243483A JP5401885B2 (ja) 2008-09-24 2008-09-24 モデルの構築方法、構築システム及び構築用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008243483A JP5401885B2 (ja) 2008-09-24 2008-09-24 モデルの構築方法、構築システム及び構築用プログラム

Publications (2)

Publication Number Publication Date
JP2010079325A true JP2010079325A (ja) 2010-04-08
JP5401885B2 JP5401885B2 (ja) 2014-01-29

Family

ID=42209740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008243483A Expired - Fee Related JP5401885B2 (ja) 2008-09-24 2008-09-24 モデルの構築方法、構築システム及び構築用プログラム

Country Status (1)

Country Link
JP (1) JP5401885B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081750A (ja) * 2012-10-16 2014-05-08 Hitachi Ltd データ統合分析システム
JP2020126402A (ja) * 2019-02-04 2020-08-20 株式会社エクサウィザーズ 情報表示装置、情報表示方法およびプログラム
CN112508050A (zh) * 2020-11-06 2021-03-16 重庆恢恢信息技术有限公司 基于海量数据的建筑工程建设规划工作方法
JP2021144515A (ja) * 2020-03-12 2021-09-24 株式会社エイムソウル 異文化適応力評価システムおよび異文化適応力評価方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215737A (ja) * 2005-02-02 2006-08-17 Osaka Prefecture 新規クラスター分析方法
JP2008165714A (ja) * 2007-01-05 2008-07-17 Kddi Corp 情報検索方法、装置およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215737A (ja) * 2005-02-02 2006-08-17 Osaka Prefecture 新規クラスター分析方法
JP2008165714A (ja) * 2007-01-05 2008-07-17 Kddi Corp 情報検索方法、装置およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081750A (ja) * 2012-10-16 2014-05-08 Hitachi Ltd データ統合分析システム
JP2020126402A (ja) * 2019-02-04 2020-08-20 株式会社エクサウィザーズ 情報表示装置、情報表示方法およびプログラム
JP2021144515A (ja) * 2020-03-12 2021-09-24 株式会社エイムソウル 異文化適応力評価システムおよび異文化適応力評価方法
CN112508050A (zh) * 2020-11-06 2021-03-16 重庆恢恢信息技术有限公司 基于海量数据的建筑工程建设规划工作方法

Also Published As

Publication number Publication date
JP5401885B2 (ja) 2014-01-29

Similar Documents

Publication Publication Date Title
US20220391767A1 (en) System and method for relational time series learning with the aid of a digital computer
CN110503531B (zh) 时序感知的动态社交场景推荐方法
Li et al. Applying various algorithms for species distribution modelling
US20180121823A1 (en) Method, System and Computer Program Product for Automating Expertise Management Using Social and Enterprise Data
CN110196814B (zh) 一种软件质量评价方法
Wu et al. Modeling users’ preferences and social links in social networking services: a joint-evolving perspective
Hoe et al. Analyzing students records to identify patterns of students' performance
Sharara et al. Active surveying: A probabilistic approach for identifying key opinion leaders
JP6488753B2 (ja) 情報処理方法
Jain et al. Garment categorization using data mining techniques
JP5401885B2 (ja) モデルの構築方法、構築システム及び構築用プログラム
CN114219562A (zh) 模型的训练方法、企业信用评估方法和装置、设备、介质
Fong et al. Gesture recognition from data streams of human motion sensor using accelerated PSO swarm search feature selection algorithm
CN108459997A (zh) 基于深度学习和神经网络的高偏态数据价值概率预测方法
CN114238764A (zh) 基于循环神经网络的课程推荐方法、装置及设备
CN113361928B (zh) 一种基于异构图注意力网络的众包任务推荐方法
May et al. Queue length forecasting in complex manufacturing job shops
CN110457387B (zh) 一种应用于网络中用户标签确定的方法及相关装置
Ashcroft Bayesian networks in business analytics
CN116304518A (zh) 用于信息推荐的异质图卷积神经网络模型构建方法及系统
Ickin et al. On network performance indicators for network promoter score estimation
Arsirii et al. Models and methods of intellectual analysis for medical-sociological monitoring’s data based on the neural network with a competitive layer
JP2020091756A (ja) 学習方法、学習プログラムおよび学習装置
Zhang et al. Visualization aided engagement pattern validation for big longitudinal web behavior intervention data
Globa et al. Case studies on big data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130625

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131014

LAPS Cancellation because of no payment of annual fees