JP2004362066A

JP2004362066A - 行動データ分析方法および行動データ分析プログラム

Info

Publication number: JP2004362066A
Application number: JP2003157004A
Authority: JP
Inventors: Nobuhiro Yugami; 伸弘湯上; Yukiko Yoshida; 由起子吉田; Tadako Oota; 唯子太田; Kenichi Kobayashi; 健一小林
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2003-06-02
Filing date: 2003-06-02
Publication date: 2004-12-24

Abstract

【課題】本発明は、行動データをもとに作成したモデルの単純化を行う行動データ分析方法および行動データ分析プログラムに関し、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的とする。
【解決手段】入力された行動データから、指定された条件に合う行動を抽出してモデル（ａ−１）、当該モデル（ａ−１）の行動をまとめた単純化後のモデル（ａ−２）、入力された行動データの全体からモデル（ｂ−１）、および当該モデル（ｂ−１）の行動をまとめた単純化後のモデル（ｂ−２）を生成するステップと、モデル（ａ−１）とモデル（ｂ−１）との間の差の情報量Ｂ１、およびモデルの（ａ−２）とモデル（ｂ−２）との間の差の情報量Ｂ２を算出するステップと、情報量Ｂ１と情報Ｂ２との差の情報量Ｂ１２を算出するステップと、情報量Ｂ１２が最小となる、行動を組み合せた単純化したモデルを決定するステップとを有する。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は、行動データをもとに作成したモデルの単純化を行う行動データ分析方法および行動データ分析プログラムに関するものである。
【０００２】
【従来の技術】
従来、行動主体の行動の履歴をもとに行動間の出現確率を求め、行動をノード、ノード間をその出願確率のアークで結んで表現するいわゆるマルコフモデルがある。例えば分析者に指定された範囲の行動履歴データ中での行動の発生順序をマルコフモデルとしてモデル化する。そして、行動の取捨選択や、複数の行動をまとめることでモデルの単純化を行って理解しやすくしていた。
【０００３】
また、顧客動向に関する１以上の統計的推定量を決定する方法がある（特許文献１）。
【０００４】
【特許文献１】
特開２００２−１６３４３４号公報の〔０００７〕、〔０００８〕などを参照。
【０００５】
【発明が解決しようとする課題】
しかし、上述した前者では、例えば男性を分析範囲として与えた場合、男性のデータ中での行動のモデル化を行うが、その中に現れる特徴がかならずしも男性特有のものとは限らず、同じ特徴が女性にも見られる場合もあり、男性の行動を求めるという目的には沿わないという問題があった。それよりも、女性にはみられないけれども男性にだけみられる特徴を優先すべきで、上述した技術では指定された範囲のデータだけをみて分析を行っていた点に問題があり、これを解決することが望まれている。
【０００６】
また、上述した後者では、顧客動向に関する１以上の統計的推定量を決定できるのみで、本願の行動モデル中に現れる行動の数が非常に多いときに重要なものを残して簡略化する手法について記載されていない。
【０００７】
本発明は、これらの問題を解決するため、行動データから指定された条件に合う行動を抽出したモデル、全体の行動データのモデル、条件に合う行動および全体の行動データの行動をまとめて単純化後のそれぞれのモデルの情報量を算出してこれらの差の情報量をもとに最適な行動を組み合わせた単純化したモデルを生成し、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的としている。
【０００８】
【課題を解決するための手段】
図１を参照して課題を解決するための手段を説明する。
【０００９】
図１において、モデル生成手段１は、行動データ（条件に合う行動データ、全体の行動データ）をもとにモデル（例えばマルコフモデル）を生成したり、行動データのうちのＸとＹ（Ｘ，Ｙは任意の行動）をまとめたモデルを生成したりなどするものである。
【００１０】
情報量算出手段２は、モデルの情報量を算出するものである。
決定手段３は、モデルの情報量をもとに最適な行動の組合わせのモデルを決定するものである。
【００１１】
次に、動作を説明する。
モデル生成手段１が入力された行動データから、指定された条件に合う行動を抽出してモデル（ａ−１）、当該モデル（ａ−１）の行動をまとめた単純化後のモデル（ａ−２）、入力された行動データの全体からモデル（ｂ−１）、および当該モデル（ｂ−１）の行動をまとめた単純化後のモデル（ｂ−２）を生成し、情報量算出手段２がモデル（ａ−１）とモデル（ｂ−１）との間の差の情報量Ｂ１、およびモデルの（ａ−２）とモデル（ｂ−２）との間の差の情報量Ｂ２を算出した後、当該情報量Ｂ１と情報Ｂ２との差の情報量Ｂ１２を算出し、決定手段３が情報量Ｂ１２が最小となる、行動を組み合せた単純化したモデルを決定するようにしている。
【００１２】
この際、入力された行動データから、指定された条件に合う行動を抽出し当該各行動が独立に発生すると仮定したモデル（ｃ−１）、当該モデル（ｃ−１）の行動をまとめた単純化後のモデル（ｃ−２）を生成し、当該モデル（ａ−１）とモデル（ｃ−１）との間の差の情報量Ｃ１、およびモデル（ａ−２）とモデル（ｃ−２）との間の差の情報量Ｃ２を算出した後、情報量Ｃ１と情報Ｃ２との差の情報量Ｃ１２を算出し、更に、情報量Ｂ１２と情報量Ｃ１２の加重平均の情報量ＢＣを算出し、決定手段３が情報量ＢＣが最小となる、行動を組み合せた単純化したモデルを決定するようにしている。
【００１３】
また、差が最小となる、行動を組み合わた単純化したモデルの、行動数が一定数以下となったときに、単純化を終了してモデルを出力するようにしている。
【００１４】
従って、行動データから指定された条件に合う行動を抽出したモデル、全体の行動データのモデル、条件に合う行動および全体の行動データの行動をまとめて単純化後のそれぞれのモデルの情報量を算出してこれらの差の情報量をもとに最適な行動を組み合わせた単純化したモデルを生成することにより、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することが可能となる。
【００１５】
【発明の実施の形態】
次に、図１から図８を用いて本発明の実施の形態および動作を順次詳細に説明する。
【００１６】
ここで、本実施例では、単純化の評価用に３種類のモデルを使います（請求項１で使う記号も同じです）。
【００１７】
ａ：与えられた条件に合うデータ（入力された行動データから与えられた条件に合う行動を抽出した行動データ）から生成されるモデル（例えば図３の（ａ），（ｂ））
ｂ：全てのデータから生成されるモデル（例えば図６）
ｃ：与えられた条件に合うデータから、各行動が独立に発生すると仮定して生成されるモデル
また、単純化を評価（決定）するために、上記３つのモデルについてそれぞれ
・単純化前
・単純化後
について使用するので、単純化前のモデルをモデルａ−１，ｂ−１，ｃ−１，単純化後のモデルをモデルａ−２，ｂ−２，ｃ−２でそれぞれ表す。
【００１８】
また、情報量は本実施例では、以下の４種類の情報量を使います。
情報量Ｂ１：モデル（ａ−１）とモデル（ｂ−１）との間の差の情報量
情報量Ｂ２：モデル（ａ−２）とモデル（ｂ−２）との間の差の情報量
情報量Ｃ１：モデル（ａ−１）とモデル（ｃ−１）との間の差の情報量
情報量Ｃ２：モデル（ａ−２）とモデル（ｃ−２）との間の差の情報量
以下順次詳細に説明します。
【００１９】
図１は、本発明の動作説明フローチャートを示す。
図１において、Ｓ１は、データを取り込む。これは、例えば右側に記載したように、後述する図２のデータ（行動履歴データ）を取り込む。
【００２０】
Ｓ２は、条件の入力を行う。これは、分析しようとする条件（分析範囲）をオペレータが入力、例えば右側に記載した条件”男性”を入力する。
【００２１】
Ｓ３は、条件に合うデータを抽出する。これは、例えばＳ１で取り込んだ図２のデータから、Ｓ２で入力した条件”男性”に合致するデータを抽出（例えば図２のＩＤ＝１，３，５，７の行動データを抽出）する。
【００２２】
Ｓ４は、マルコフモデルを生成する。これは、Ｓ３で抽出した条件に合う行動データについて、例えば図３の（ａ）の各行動の出現確率および図３の（ｂ）の各行動間の遷移確率を算出してマルコフモデル（モデルａ−１）を生成する。尚、生成したマルコフモデルの行動数が一定数以下の場合には、単純化を行う必要がないので、このままマルコフモデルを出力する。生成したマルコフモデルの行動数が一定数以上のときに、単純化を行う必要があるので、Ｓ５以降の処理を行う。
【００２３】
Ｓ５は、各行動が独立に発生することを仮定したモデル（単純化前）における、遷移確率を算出する。これは、Ｓ４で生成したマルコフモデルの図３の（ｂ）の各行動間の遷移確率をもとに、後述する（式２）により、後述する図３の（ｃ）に示す各行動間の遷移確率をそれぞれ算出する。
【００２４】
Ｓ６は、ＸとＹをまとめたときのマルコフモデルを作る。これは、例えば後述する図３の（ａ）、（ｂ）のマルコフモデルについて、ＸとＹ（Ｘ，Ｙは任意の行動）をまとめて１つにした、例えばＡとＢとまとめて１つにしたマルコフモデル（モデルａ−２）を、後述する図４の（ａ），（ｂ）に示すように作成する。
【００２５】
Ｓ７は、各行動が独立に発生することを仮定したモデル（単純化後）における、遷移確率を算出する。これは、Ｓ６で作成したマルコフモデル、例えば図４の（ａ），（ｂ）をもとに、後述する（式２）により、後述する図４の（ｃ）に示す各行動間の遷移確率をそれぞれ算出する。
【００２６】
Ｓ８は、男性の単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。これは、後述する（式３）により、単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を、例えば図８の２列に示すように算出する。
【００２７】
Ｓ９は、男性の単純化前の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。これは、後述する（式３）により、単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。
【００２８】
Ｓ１０は、差を算出する。これは、Ｓ９で算出した男性の単純化前の情報量と、Ｓ８で算出した男性の単純化後の情報量との差を算出、例えば図８の３列に示すように算出する。
【００２９】
以上のＳ１からＳ１０によって、図２のデータから指定条件”男性”に合うデータを抽出して図３の（ａ），（ｂ）のマルコフモデルを作成し、マルコフモデルの図３の（ｂ）の行動間の遷移確率をもとに各行動間の遷移確率を図３の（ｃ）のように生成および単純化後と単純化前の遷移確率と独立性を仮定した遷移確率の期待値との差の情報量をそれぞれ求め、これらの差を図８の３列に示すように算出することが可能となる。
【００３０】
また、同様に、Ｓ２４は、全データのマルコフモデルを生成する。例えば図２のデータの全部から、後述する図６の（ａ）の全データの各行動の出現確率および（ｂ）の全データの各行動間の遷移確率からなるマルコフモデル（モデルｂ−１）を生成する。
【００３１】
Ｓ２６は、ＸとＹをまとめたときのマルコフモデルを作成する。Ｓ６と同様に、全データ中のＸとＹをまとめたときのマルコフモデル（ｂ−２）、例えば図７の（ａ），（ｂ）を作成する。
【００３２】
Ｓ２８は、全体の単純化後の遷移確率と、男性の単純化後の遷移確率との差の情報量を算出する。これは、後述する（式３）により、全体の単純化後の遷移確率と、男性の単純化後の遷移確率との差の情報量を、例えば図８の４列に示すように算出する。
【００３３】
Ｓ２９は、全体の単純化前の遷移確率と、男性の単純化前の遷移確率との差の情報量を算出する。これは、後述する（式３）により、全体の単純化前の遷移確率と、男性の単純化前の遷移確率との差の情報量を算出する。
【００３４】
Ｓ３０は、差を算出する。これは、Ｓ２９で算出した単純化前の情報量と、Ｓ２８で算出した単純化後の情報量との差を算出、例えば図８の５列に示すように算出する。
【００３５】
以上のＳ１、Ｓ２４、Ｓ２６からＳ３０によって、図２の全データの図６の（ａ），（ｂ）のマルコフモデルを作成し、全体の単純化後と単純化前の遷移確率と、男性の単純化後と単純化前の遷移確率との差の情報量をそれぞれ求め、これらの差を図８の５列に示すように算出することが可能となる。
【００３６】
Ｓ１１は、加重平均を算出する。これは、Ｓ１０で算出した情報量（情報量減少）と、Ｓ３０で算出した情報量（情報量減少）との加重平均を求めて図８の６列に示す情報量（評価値）を算出する。
【００３７】
Ｓ１２は、評価を最小とする行動の組をひとつの行動にまとめることで行動数を減らす。これは、Ｓ１１で算出した例えば図８の６列の評価値（情報量減少）について最小（行動を組合わせて行動数を削減した後の情報量の減少が最小）の組合わせ、例えば当該図８の６列の評価値が最小の”０．２０７”のＣとＤをまとめて１つの行動とし、行動数を減らす。
【００３８】
Ｓ１３は、行動数が一定数以下か判別する。ＹＥＳの場合には、単純化として指定された行動数が一定数以下となったので、単純化を終了し、Ｓ１４で単純化後のマルコフモデルを出力する。一方、ＮＯの場合には、更に、単純化を繰り返すために、Ｓ４、Ｓ２４以降の処理を繰り返す。
【００３９】
以上によって、例えば図２のデータから条件”男性”に合うデータを抽出して図３の（ａ），（ｂ）のマルコフモデルを生成し、単純化前後の遷移確率と独立性を仮定した遷移確率の期待値との差を求めて図８の３列の情報量減少を算出すると共に、全データから図６の（ａ），（ｂ）のマルコフモデルを生成し、これら全データの単純化前後の遷移確率と男性の単純化前後の遷移確率との差を求めて図８の５列の情報量減少を算出し、両者の情報量減少の加重平均を算出して図８の６列の評価値を算出し、評価値を最小とする行動の組をまとめてひとつの行動とし、これを行動の数が一定数以下となるまで繰り返すことで、与えられた条件を満足するデータの特徴を表すモデルを出力することが可能となる。以下順次詳細に説明する。
【００４０】
図２は、本発明の入力される行動履歴データの例を示す。ここでは、８個のデータが図示の下記の情報に対応づけて入力された例を示す。
【００４１】
・ＩＤ：
・性別：
・行動履歴：
・その他：
ここでは、ＩＤはデータに付与した一意の識別子である。性別はデータの性別（例えばデータを採取した人の性別）（男性、女性）である。行動履歴は、時刻と行動の履歴であって、例えば（１、Ａ）は時刻１のときに行動”Ａ”をしたというデータである。
【００４２】
図３は、本発明の説明図（男性）を示す。これは、図２の行動データから、条件”男性”に合う行動データを抽出し、当該抽出した行動データをもとに作成したものである。
【００４３】
図３の（ａ）は、各行動の出現確率の例を示す。これは、図２の行動データから条件”男性”に合う抽出した行動データ、ここでは、図２のＩＤ＝１，３，５，７の行動データについて、各行動の出現確率を算出したものである。例えば行動Ａの出現確率３／１４は、分子が当該行動Ａが出現した回数であり、分母の１４が行動の全出現回数である。
【００４４】
図３の（ｂ）は、各行動間の遷移確率の例を示す。これは、図２の行動データから条件”男性”に合う抽出した行動データ、ここでは、図２のＩＤ＝１，３，５，７の行動データについて、各行動間の遷移確率を算出したものである。例えば▲１▼の遷移確率２／１０は、左端の行動Ａから右上の行動Ｂへの遷移確率であって、分子の２が行動Ａから行動Ｂへの遷移の回数であり、分母の１０が行動から行動（自の行動、他の行動を含む）へ遷移する全体の回数である。
【００４５】
以上の図３の（ａ）の各行動の出現確率および図３の（ｂ）の各行動間の遷移確率で条件”男性”のマルコフモデルを表現するものである。
【００４６】
図３の（ｃ）は、各行動が独立に発生することを仮定したモデルにおける、分析範囲の各行動間の遷移確率の例を示す。これは、既述した図３の（ｂ）の各行動間の遷移確率をもとに、後述する（式２）によって算出した各行動間の遷移確率の例を示す。
【００４７】
図４は、本発明の説明図（男性、単純化）を示す。これは、図３の（ａ），（ｂ）で表されるマルコフモデルの行動Ａ，Ｂを１つの行動にまとめて単純化した例を示す。
【００４８】
図４の（ａ）は、各行動の出現確率の例を示す。これは、行動Ａ，Ｂを１つにまとめて単純化した後の各行動の出現確率を算出したものである。
【００４９】
図４の（ｂ）は、各行動間の遷移確率の例を示す。これは、行動Ａ，Ｂを１つにまとめて単純化した後の各行動間の遷移確率を算出したものである。
【００５０】
以上の図４の（ａ）の各行動の出現確率および図４の（ｂ）の各行動間の遷移確率で単純化後のマルコフモデルを表現するものである。
【００５１】
図４の（ｃ）は、各行動が独立に発生することを仮定したモデルにおける、分析範囲の各行動間の遷移確率の例を示す。これは、既述した図４の（ｂ）の各行動間の遷移確率をもとに、後述する（式２）によって算出した単純化後の各行動間の遷移確率の例を示す。
【００５２】
図５は、本発明の説明図（男性、単純化後のモデルの情報量（ＫＬ情報量）と、単純化前のモデルの情報量との差（評価値））の例を示す。ここで、ＫＬ情報量（男性の単純化後のモデルの情報量）、評価値（単純化後のモデルのＫＬ情報量と、単純化前のモデルの情報量との差）は、後述する図８の２行目のＫＬ情報量、３列の情報量減少にそれぞれ対応するものである。
【００５３】
図６は、本発明の説明図（全体）を示す。これは、図２の行動データの全部をもとに作成したものである。
【００５４】
図６の（ａ）は、各行動の出現確率の例を示す。これは、図２の全ての行動データについて、各行動の出現確率を算出したものである。例えば行動Ａの出現確率６／２８は、分子が当該行動Ａが出現した回数であり、分母の２８が行動の全出現回数である。
【００５５】
図６の（ｂ）は、各行動間の遷移確率の例を示す。これは、図２の全ての行動データについて、各行動間の遷移確率を算出したものである。例えば▲１▼’の遷移確率２／２０は、左端の行動Ａから右上の行動Ｂへの遷移確率であって、分子の２が行動Ａから行動Ｂへの遷移の回数であり、分母の２０が行動から行動（自の行動、他の行動を含む）へ遷移する全体の回数である。
【００５６】
以上の図６の（ａ）の各行動の出現確率および図６の（ｂ）の各行動間の遷移確率で全体のマルコフモデルを表現するものである。
【００５７】
図７は、本発明の説明図（全体、単純化）を示す。これは、図６の（ａ），（ｂ）で表される全体のマルコフモデルの行動Ａ，Ｂを１つの行動にまとめて単純化した例を示す。
【００５８】
図７の（ａ）は、各行動の出現確率の例を示す。これは、行動Ａ，Ｂを１つにまとめて単純化した後の各行動の出現確率を算出したものである。
【００５９】
図７の（ｂ）は、各行動間の遷移確率の例を示す。これは、行動Ａ，Ｂを１つにまとめて単純化した後の各行動間の遷移確率を算出したものである。
【００６０】
以上の図７の（ａ）の各行動の出現確率および図７の（ｂ）の各行動間の遷移確率で全体の単純化後のマルコフモデルを表現するものである。
【００６１】
図８は、本発明の説明図（２つの行動をまとめる単純化の評価値）を示す。
図８において、列１は、既述した図３の（ａ）の条件”男性”の各行動の出現確率および図３の（ｂ）の条件”男性”の各行動間の遷移確率で表されるマルコフモデル（男性）について、いずれの行動をまとめるかを記載したものである（例えば”ＡとＢ”は既述した図４の（ａ），（ｂ）に示すように、行動Ａと行動Ｂとを１つにまとめて単純化することを表す。
【００６２】
列２，３は、行動の独立性を仮定したモデルとの比較による評価の例であってここでは、ＫＬ情報量、情報量減少を算出したものである（後述する（式３）、図１のＳ６からＳ１０参照）。
【００６３】
列４，５は、全データから生成されるモデルとの比較による評価であって、ここでは、ＫＬ情報量、情報量減少を算出したものである（後述する（式３）、図１のＳ２６、Ｓ２８からＳ３０参照）。
【００６４】
列６は、評価値であって、列３の情報量減少と、列５の情報量減少との加重平均を算出したものである（図１のＳ１１）。
【００６５】
（１）図８の列２、３のＫＬ情報量、情報量減少の算出について詳細に説明する。
【００６６】
（１−１）分析範囲として条件”男性”が指定されると、与えられた既述した図２の行動データ中から条件”男性”に合致するＩＤ＝１，３，５，７の行動データを抽出し、これら行動データをもとに図３の（ａ）の各行動の出現確率および図３の（ｂ）の各行動間の遷移確率からなる条件”男性”のモデルａ−１（マルコフモデル）を生成する。
【００６７】
（１−２）生成したモデルａ−１の持つ情報量Ｉ_０を、ａ−１における行動間の遷移確率分布と、ここでは、４種類の行動が独立に発生すると仮定したモデルｃ−１における遷移確率分布との差として算出する。
分析範囲のデータから生成されたモデルＭＡ（ａ−１またはａ−２）を、各行動が独立であると仮定したモデルＭＣ（ｃ−１またはｃ−２）と比較した時のＫＬ（カルバッククライブラー）情報量は、前者のモデル中での行動ＸからＹへの遷移確率をＰ（Ｘ→Ｙ、ＭＡ）、後者のモデル中での遷移確率をＰ（Ｘ→Ｙ，ＭＣ）とすると、次の（式１）で算出される。

ここで、Ｐ（Ｘ→Ｙ，ＭＣ）は、Ｘから任意の行動への遷移確率Ｐ（Ｘ→ＡＬＬ，ＭＡ）と、任意の行動からＹへの遷移確率Ｐ（ＡＬＬ→Ｙ，ＭＡ）との積で算出できる。すなわち、
Ｐ（Ｘ→Ｙ、ＭＣ）＝Ｐ（Ｘ→ＡＬＬ，ＭＡ）×Ｐ（ＡＬＬ→Ｙ，ＭＡ）−−−（式２）
図３の（ｂ）は、単純化を行う前のモデルａ−１における遷移確率を表すから、ここから（式２）をつかってモデルｃ−１の遷移確率を算出した結果が図３の（ｃ）である。この２つの遷移確率から（式１）をつかって情報量Ｉ_０を算出すると１．３６６となる。
【００６８】
（１−３）次に、可能な全ての単純化について、単純化後のモデルａ−２の、各行動が独立におきることを仮定したモデルｃ−２との比較による情報量Ｉを計算し、段落〔００６７〕で算出したＩ_０からどれだけ減少したかを算出する。例えば初めに行動ＡとＢを一つにまとめる単純化に注目する。この単純化を行った後のモデルａ−２における各行動の出現確率および遷移確率は図４の（ａ）、（ｂ）のようになる。ここから（式２）をつかって、モデルｃ−２における遷移確率を計算すると、図４の（ｃ）が得られる。図４の（ｂ）と（ｃ）の遷移確率分布の差を（式１）を使って算出すると、１．０８８が得られる。すなわち、ＡとＢをまとめたときの、行動の独立性を仮定したモデルとの比較による情報量の減少は０．２７７となる。
同様に、他の行動の組み合せについても単純化後の情報量およびその
減少量を算出すると、図８の列２および列３に示す結果が得られる。
【００６９】
（２）図８の列４、５のＫＬ情報量、情報量減少の算出について説明する。
【００７０】
（２−１）次に全てのデータを使って生成したモデルｂ−１と比較した場合の、単純化前のモデルａ−１の情報量Ｊ_０を、各行動の出現確率分布と行動間の遷移確率分布の差として算出する。分析範囲のモデルＭＡ（ａ−１またはａ−２）中での行動Ｘの出現確率をＰ（Ｘ，ＭＡ）、ＸからＹへの遷移確率をＰ（Ｘ→Ｙ，ＭＡ）、全データを使って生成したモデルＭＢ（ｂ−１またはｂ−２）中の行動Ｘの出現確率をＰ（Ｘ，ＭＢ）、ＸからＹへの遷移確率をＰ（Ｘ→Ｙ，ＭＢ）とすると、パラメータβ（０≦β≦１）を用いて（式３）のように算出する。
【００７１】

図３の（ａ）、（ｂ）が単純化前の分析範囲のモデルａ−１における行動の出現確率および遷移確率であり、図６の（ａ）、（ｂ）が単純化前の全データのモデルにおける各行動の出現確率および遷移確率である。この例では各行動の出現確率が分析範囲と全データ中とで等しいので、（式３）の第２項は０となる。そのため、以下の説明ではβ＝１とする。このとき、（式３）を使うと、単純化を行う前の、全データから生成したモデルとの比較に基く情報量Ｊ_０は０．２７７となる。
【００７２】
（２−３）次に、可能な全ての単純化について、上の２種類の情報量がどれだけ減少するかを算出する。例えば行動Ａと行動Ｂを１つにまとめる単純化を行うと、分析範囲の単純化後のモデルａ−２における各行動の出現確率および行動間の遷移確率は図４の（ａ），（ｂ）、全データから生成した単純化後のモデルｂ−２は図７の（ａ）、（ｂ）になるから、（式３）を使って算出すると、情報量Ｊは０となり、単純化前の値Ｊ_０からの減少量は０．２７７となる。
同様に、他の行動の組み合せについても単純化後の情報量およびその減少量を算出すると、図８の列４および列５に示す結果が得られる。単純化の評価は，段落〔００６８〕で得られた結果と〔００７２〕の結果の２種類の情報量の減少量を、パラメータα（０≦α≦１）を用いて加重平均をとることで、次の（式４）のように算出できる。
【００７３】
α×（Ｉ_０−Ｉ）＋（Ｉ−α）×（Ｊ_０−Ｊ） −−−（式４）
α＝０．５としたときの各単純化を適用した場合の情報量とその変化およびそれらから算出される評価値を図８に示す（図８の列６）。評価値が小さいほうが情報量の減少が少なく、望ましい単純化であるので、図８の列６の評価値の最小の０．２０７のＣとＤ（行動Ｃと行動Ｄを１つにまとめる）の組合わせが選択（決定）され、単純化が行われる。
【００７４】
（２−４）ここで、ＣとＤは、それぞれ自分自身にのみ遷移しているので、ＣとＤをまとめて１つの行動とみなす単純化を行うと、Ｃへの遷移とＤへの遷移の区別ができなくなるが、ＣからＤへの遷移やその逆がないという性質がモデルから失われる。しかし、この性質は全データ中でも同様に観察される性質であり、分析範囲に限った場合の特徴ではないので、ＣとＤとまとめることで失われてしまう性質の方が重要性は低いと考えることができる。
【００７５】
そして、モデルが十分単純化（行動数が一定数以下に単純化）されるまで、繰り返す。単純化が終了したら、当該単純化したモデルを出力する。
【００７６】
【発明の効果】
以上説明したように、本発明によれば、行動データから指定された条件に合うデータから生成したモデル、全データから生成したモデル、および各行動が独立と仮定して生成したモデルとの間の差を表す情報量を算出して、それらをできるだけ減少させないように、複数の行動をまとめてひとつの行動とする単純化を行う構成を採用しているため、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的としているすることが可能となる。
【図面の簡単な説明】
【図１】本発明の動作説明フローチャートである。
【図２】本発明の入力される行動履歴データの例である。
【図３】本発明の説明図（男性）である。
【図４】本発明の説明図（男性、単純化）である。
【図５】本発明の説明図（男性、単純化後のモデルの情報量（ＫＬ情報量）、単純化前のモデルの情報量との差（評価値））である。
【図６】本発明の説明図（全体）である。
【図７】本発明の説明図（全体、単純化）である。
【図８】本発明の説明図（２つの行動をまとめる単純化の評価値）である。
【符号の説明】
１：モデル生成手段
２：情報量算出手段
３：決定手段

Claims

行動データをもとに作成したモデルの単純化を行う行動データ分析方法において、
入力された行動データから、指定された条件に合う行動を抽出してモデル（ａ−１）、当該モデル（ａ−１）の行動をまとめた単純化後のモデル（ａ−２）、入力された行動データの全体からモデル（ｂ−１）、および当該モデル（ｂ−１）の行動をまとめた単純化後のモデル（ｂ−２）を生成するステップと、
前記モデル（ａ−１）と前記モデル（ｂ−１）との間の差の情報量Ｂ１、および前記モデルの（ａ−２）と前記モデル（ｂ−２）との間の差の情報量Ｂ２を算出するステップと、
前記情報量Ｂ１と前記情報Ｂ２との差の情報量Ｂ１２を算出するステップと、
前記情報量Ｂ１２が最小となる、行動を組み合せた単純化したモデルを決定するステップと
を有する行動データ分析方法。
前記入力された行動データから、指定された条件に合う行動を抽出し当該各行動が独立に発生すると仮定したモデル（ｃ−１）、当該モデル（ｃ−１）の行動をまとめた単純化後のモデル（ｃ−２）を生成するステップと、
前記モデル（ａ−１）と前記モデル（ｃ−１）との間の差の情報量Ｃ１、および前記モデル（ａ−２）と前記モデル（ｃ−２）との間の差の情報量Ｃ２を算出するステップと、
前記情報量Ｃ１と前記情報Ｃ２との差の情報量Ｃ１２を算出するステップと、
前記情報量Ｂ１２と前記情報量Ｃ１２の加重平均の情報量ＢＣを算出するステップと、
前記情報量ＢＣが最小となる、行動を組み合せた単純化したモデルを決定するステップと
を有する請求項１記載の行動データ分析方法。
前記情報量Ｂ１２，ＢＣが最小となる、行動を組み合わた単純化したモデルの、行動数が一定数以下となったときに、単純化を終了して当該モデルを出力するステップを有する請求項１あるいは請求項２記載の行動データ分析方法。
行動データをもとに作成したモデルの単純化を行う行動データ分析プログラムにおいて、
コンピュータに、
入力された行動データから、指定された条件に合う行動を抽出してモデル（ａ−１）、当該モデル（ａ−１）の行動をまとめた単純化後のモデル（ａ−２）、入力された行動データの全体からモデル（ｂ−１）、および当該モデル（ｂ−１）の行動をまとめた単純化後のモデル（ｂ−２）を生成するステップと、
前記モデル（ａ−１）と前記モデル（ｂ−１）との間の差の情報量Ｂ１、および前記モデルの（ａ−２）と前記モデル（ｂ−２）との間の差の情報量Ｂ２を算出するステップと、
前記情報量Ｂ１と前記情報Ｂ２との差の情報量Ｂ１２を算出するステップと、
前記情報量Ｂ１２が最小となる、行動を組み合せた単純化したモデルを決定するステップと
して動作させる行動データ分析プログラム。
方法。