JP2004362066A - 行動データ分析方法および行動データ分析プログラム - Google Patents
行動データ分析方法および行動データ分析プログラム Download PDFInfo
- Publication number
- JP2004362066A JP2004362066A JP2003157004A JP2003157004A JP2004362066A JP 2004362066 A JP2004362066 A JP 2004362066A JP 2003157004 A JP2003157004 A JP 2003157004A JP 2003157004 A JP2003157004 A JP 2003157004A JP 2004362066 A JP2004362066 A JP 2004362066A
- Authority
- JP
- Japan
- Prior art keywords
- model
- information amount
- behavior
- information
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】本発明は、行動データをもとに作成したモデルの単純化を行う行動データ分析方法および行動データ分析プログラムに関し、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的とする。
【解決手段】入力された行動データから、指定された条件に合う行動を抽出してモデル(a−1)、当該モデル(a−1)の行動をまとめた単純化後のモデル(a−2)、入力された行動データの全体からモデル(b−1)、および当該モデル(b−1)の行動をまとめた単純化後のモデル(b−2)を生成するステップと、モデル(a−1)とモデル(b−1)との間の差の情報量B1、およびモデルの(a−2)とモデル(b−2)との間の差の情報量B2を算出するステップと、情報量B1と情報B2との差の情報量B12を算出するステップと、情報量B12が最小となる、行動を組み合せた単純化したモデルを決定するステップとを有する。
【選択図】 図1
【解決手段】入力された行動データから、指定された条件に合う行動を抽出してモデル(a−1)、当該モデル(a−1)の行動をまとめた単純化後のモデル(a−2)、入力された行動データの全体からモデル(b−1)、および当該モデル(b−1)の行動をまとめた単純化後のモデル(b−2)を生成するステップと、モデル(a−1)とモデル(b−1)との間の差の情報量B1、およびモデルの(a−2)とモデル(b−2)との間の差の情報量B2を算出するステップと、情報量B1と情報B2との差の情報量B12を算出するステップと、情報量B12が最小となる、行動を組み合せた単純化したモデルを決定するステップとを有する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、行動データをもとに作成したモデルの単純化を行う行動データ分析方法および行動データ分析プログラムに関するものである。
【0002】
【従来の技術】
従来、行動主体の行動の履歴をもとに行動間の出現確率を求め、行動をノード、ノード間をその出願確率のアークで結んで表現するいわゆるマルコフモデルがある。例えば分析者に指定された範囲の行動履歴データ中での行動の発生順序をマルコフモデルとしてモデル化する。そして、行動の取捨選択や、複数の行動をまとめることでモデルの単純化を行って理解しやすくしていた。
【0003】
また、顧客動向に関する1以上の統計的推定量を決定する方法がある(特許文献1)。
【0004】
【特許文献1】
特開2002−163434号公報の〔0007〕、〔0008〕などを参照。
【0005】
【発明が解決しようとする課題】
しかし、上述した前者では、例えば男性を分析範囲として与えた場合、男性のデータ中での行動のモデル化を行うが、その中に現れる特徴がかならずしも男性特有のものとは限らず、同じ特徴が女性にも見られる場合もあり、男性の行動を求めるという目的には沿わないという問題があった。それよりも、女性にはみられないけれども男性にだけみられる特徴を優先すべきで、上述した技術では指定された範囲のデータだけをみて分析を行っていた点に問題があり、これを解決することが望まれている。
【0006】
また、上述した後者では、顧客動向に関する1以上の統計的推定量を決定できるのみで、本願の行動モデル中に現れる行動の数が非常に多いときに重要なものを残して簡略化する手法について記載されていない。
【0007】
本発明は、これらの問題を解決するため、行動データから指定された条件に合う行動を抽出したモデル、全体の行動データのモデル、条件に合う行動および全体の行動データの行動をまとめて単純化後のそれぞれのモデルの情報量を算出してこれらの差の情報量をもとに最適な行動を組み合わせた単純化したモデルを生成し、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的としている。
【0008】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0009】
図1において、モデル生成手段1は、行動データ(条件に合う行動データ、全体の行動データ)をもとにモデル(例えばマルコフモデル)を生成したり、行動データのうちのXとY(X,Yは任意の行動)をまとめたモデルを生成したりなどするものである。
【0010】
情報量算出手段2は、モデルの情報量を算出するものである。
決定手段3は、モデルの情報量をもとに最適な行動の組合わせのモデルを決定するものである。
【0011】
次に、動作を説明する。
モデル生成手段1が入力された行動データから、指定された条件に合う行動を抽出してモデル(a−1)、当該モデル(a−1)の行動をまとめた単純化後のモデル(a−2)、入力された行動データの全体からモデル(b−1)、および当該モデル(b−1)の行動をまとめた単純化後のモデル(b−2)を生成し、情報量算出手段2がモデル(a−1)とモデル(b−1)との間の差の情報量B1、およびモデルの(a−2)とモデル(b−2)との間の差の情報量B2を算出した後、当該情報量B1と情報B2との差の情報量B12を算出し、決定手段3が情報量B12が最小となる、行動を組み合せた単純化したモデルを決定するようにしている。
【0012】
この際、入力された行動データから、指定された条件に合う行動を抽出し当該各行動が独立に発生すると仮定したモデル(c−1)、当該モデル(c−1)の行動をまとめた単純化後のモデル(c−2)を生成し、当該モデル(a−1)とモデル(c−1)との間の差の情報量C1、およびモデル(a−2)とモデル(c−2)との間の差の情報量C2を算出した後、情報量C1と情報C2との差の情報量C12を算出し、更に、情報量B12と情報量C12の加重平均の情報量BCを算出し、決定手段3が情報量BCが最小となる、行動を組み合せた単純化したモデルを決定するようにしている。
【0013】
また、差が最小となる、行動を組み合わた単純化したモデルの、行動数が一定数以下となったときに、単純化を終了してモデルを出力するようにしている。
【0014】
従って、行動データから指定された条件に合う行動を抽出したモデル、全体の行動データのモデル、条件に合う行動および全体の行動データの行動をまとめて単純化後のそれぞれのモデルの情報量を算出してこれらの差の情報量をもとに最適な行動を組み合わせた単純化したモデルを生成することにより、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することが可能となる。
【0015】
【発明の実施の形態】
次に、図1から図8を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0016】
ここで、本実施例では、単純化の評価用に3種類のモデルを使います(請求項1で使う記号も同じです)。
【0017】
a:与えられた条件に合うデータ(入力された行動データから与えられた条件に合う行動を抽出した行動データ)から生成されるモデル(例えば図3の(a),(b))
b:全てのデータから生成されるモデル(例えば図6)
c:与えられた条件に合うデータから、各行動が独立に発生すると仮定して生成されるモデル
また、単純化を評価(決定)するために、上記3つのモデルについてそれぞれ
・単純化前
・単純化後
について使用するので、単純化前のモデルをモデルa−1,b−1,c−1,単純化後のモデルをモデルa−2,b−2,c−2でそれぞれ表す。
【0018】
また、情報量は本実施例では、以下の4種類の情報量を使います。
情報量B1:モデル(a−1)とモデル(b−1)との間の差の情報量
情報量B2:モデル(a−2)とモデル(b−2)との間の差の情報量
情報量C1:モデル(a−1)とモデル(c−1)との間の差の情報量
情報量C2:モデル(a−2)とモデル(c−2)との間の差の情報量
以下順次詳細に説明します。
【0019】
図1は、本発明の動作説明フローチャートを示す。
図1において、S1は、データを取り込む。これは、例えば右側に記載したように、後述する図2のデータ(行動履歴データ)を取り込む。
【0020】
S2は、条件の入力を行う。これは、分析しようとする条件(分析範囲)をオペレータが入力、例えば右側に記載した条件”男性”を入力する。
【0021】
S3は、条件に合うデータを抽出する。これは、例えばS1で取り込んだ図2のデータから、S2で入力した条件”男性”に合致するデータを抽出(例えば図2のID=1,3,5,7の行動データを抽出)する。
【0022】
S4は、マルコフモデルを生成する。これは、S3で抽出した条件に合う行動データについて、例えば図3の(a)の各行動の出現確率および図3の(b)の各行動間の遷移確率を算出してマルコフモデル(モデルa−1)を生成する。尚、生成したマルコフモデルの行動数が一定数以下の場合には、単純化を行う必要がないので、このままマルコフモデルを出力する。生成したマルコフモデルの行動数が一定数以上のときに、単純化を行う必要があるので、S5以降の処理を行う。
【0023】
S5は、各行動が独立に発生することを仮定したモデル(単純化前)における、遷移確率を算出する。これは、S4で生成したマルコフモデルの図3の(b)の各行動間の遷移確率をもとに、後述する(式2)により、後述する図3の(c)に示す各行動間の遷移確率をそれぞれ算出する。
【0024】
S6は、XとYをまとめたときのマルコフモデルを作る。これは、例えば後述する図3の(a)、(b)のマルコフモデルについて、XとY(X,Yは任意の行動)をまとめて1つにした、例えばAとBとまとめて1つにしたマルコフモデル(モデルa−2)を、後述する図4の(a),(b)に示すように作成する。
【0025】
S7は、各行動が独立に発生することを仮定したモデル(単純化後)における、遷移確率を算出する。これは、S6で作成したマルコフモデル、例えば図4の(a),(b)をもとに、後述する(式2)により、後述する図4の(c)に示す各行動間の遷移確率をそれぞれ算出する。
【0026】
S8は、男性の単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。これは、後述する(式3)により、単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を、例えば図8の2列に示すように算出する。
【0027】
S9は、男性の単純化前の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。これは、後述する(式3)により、単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。
【0028】
S10は、差を算出する。これは、S9で算出した男性の単純化前の情報量と、S8で算出した男性の単純化後の情報量との差を算出、例えば図8の3列に示すように算出する。
【0029】
以上のS1からS10によって、図2のデータから指定条件”男性”に合うデータを抽出して図3の(a),(b)のマルコフモデルを作成し、マルコフモデルの図3の(b)の行動間の遷移確率をもとに各行動間の遷移確率を図3の(c)のように生成および単純化後と単純化前の遷移確率と独立性を仮定した遷移確率の期待値との差の情報量をそれぞれ求め、これらの差を図8の3列に示すように算出することが可能となる。
【0030】
また、同様に、S24は、全データのマルコフモデルを生成する。例えば図2のデータの全部から、後述する図6の(a)の全データの各行動の出現確率および(b)の全データの各行動間の遷移確率からなるマルコフモデル(モデルb−1)を生成する。
【0031】
S26は、XとYをまとめたときのマルコフモデルを作成する。S6と同様に、全データ中のXとYをまとめたときのマルコフモデル(b−2)、例えば図7の(a),(b)を作成する。
【0032】
S28は、全体の単純化後の遷移確率と、男性の単純化後の遷移確率との差の情報量を算出する。これは、後述する(式3)により、全体の単純化後の遷移確率と、男性の単純化後の遷移確率との差の情報量を、例えば図8の4列に示すように算出する。
【0033】
S29は、全体の単純化前の遷移確率と、男性の単純化前の遷移確率との差の情報量を算出する。これは、後述する(式3)により、全体の単純化前の遷移確率と、男性の単純化前の遷移確率との差の情報量を算出する。
【0034】
S30は、差を算出する。これは、S29で算出した単純化前の情報量と、S28で算出した単純化後の情報量との差を算出、例えば図8の5列に示すように算出する。
【0035】
以上のS1、S24、S26からS30によって、図2の全データの図6の(a),(b)のマルコフモデルを作成し、全体の単純化後と単純化前の遷移確率と、男性の単純化後と単純化前の遷移確率との差の情報量をそれぞれ求め、これらの差を図8の5列に示すように算出することが可能となる。
【0036】
S11は、加重平均を算出する。これは、S10で算出した情報量(情報量減少)と、S30で算出した情報量(情報量減少)との加重平均を求めて図8の6列に示す情報量(評価値)を算出する。
【0037】
S12は、評価を最小とする行動の組をひとつの行動にまとめることで行動数を減らす。これは、S11で算出した例えば図8の6列の評価値(情報量減少)について最小(行動を組合わせて行動数を削減した後の情報量の減少が最小)の組合わせ、例えば当該図8の6列の評価値が最小の”0.207”のCとDをまとめて1つの行動とし、行動数を減らす。
【0038】
S13は、行動数が一定数以下か判別する。YESの場合には、単純化として指定された行動数が一定数以下となったので、単純化を終了し、S14で単純化後のマルコフモデルを出力する。一方、NOの場合には、更に、単純化を繰り返すために、S4、S24以降の処理を繰り返す。
【0039】
以上によって、例えば図2のデータから条件”男性”に合うデータを抽出して図3の(a),(b)のマルコフモデルを生成し、単純化前後の遷移確率と独立性を仮定した遷移確率の期待値との差を求めて図8の3列の情報量減少を算出すると共に、全データから図6の(a),(b)のマルコフモデルを生成し、これら全データの単純化前後の遷移確率と男性の単純化前後の遷移確率との差を求めて図8の5列の情報量減少を算出し、両者の情報量減少の加重平均を算出して図8の6列の評価値を算出し、評価値を最小とする行動の組をまとめてひとつの行動とし、これを行動の数が一定数以下となるまで繰り返すことで、与えられた条件を満足するデータの特徴を表すモデルを出力することが可能となる。以下順次詳細に説明する。
【0040】
図2は、本発明の入力される行動履歴データの例を示す。ここでは、8個のデータが図示の下記の情報に対応づけて入力された例を示す。
【0041】
・ID:
・性別:
・行動履歴:
・その他:
ここでは、IDはデータに付与した一意の識別子である。性別はデータの性別(例えばデータを採取した人の性別)(男性、女性)である。行動履歴は、時刻と行動の履歴であって、例えば(1、A)は時刻1のときに行動”A”をしたというデータである。
【0042】
図3は、本発明の説明図(男性)を示す。これは、図2の行動データから、条件”男性”に合う行動データを抽出し、当該抽出した行動データをもとに作成したものである。
【0043】
図3の(a)は、各行動の出現確率の例を示す。これは、図2の行動データから条件”男性”に合う抽出した行動データ、ここでは、図2のID=1,3,5,7の行動データについて、各行動の出現確率を算出したものである。例えば行動Aの出現確率3/14は、分子が当該行動Aが出現した回数であり、分母の14が行動の全出現回数である。
【0044】
図3の(b)は、各行動間の遷移確率の例を示す。これは、図2の行動データから条件”男性”に合う抽出した行動データ、ここでは、図2のID=1,3,5,7の行動データについて、各行動間の遷移確率を算出したものである。例えば▲1▼の遷移確率2/10は、左端の行動Aから右上の行動Bへの遷移確率であって、分子の2が行動Aから行動Bへの遷移の回数であり、分母の10が行動から行動(自の行動、他の行動を含む)へ遷移する全体の回数である。
【0045】
以上の図3の(a)の各行動の出現確率および図3の(b)の各行動間の遷移確率で条件”男性”のマルコフモデルを表現するものである。
【0046】
図3の(c)は、各行動が独立に発生することを仮定したモデルにおける、分析範囲の各行動間の遷移確率の例を示す。これは、既述した図3の(b)の各行動間の遷移確率をもとに、後述する(式2)によって算出した各行動間の遷移確率の例を示す。
【0047】
図4は、本発明の説明図(男性、単純化)を示す。これは、図3の(a),(b)で表されるマルコフモデルの行動A,Bを1つの行動にまとめて単純化した例を示す。
【0048】
図4の(a)は、各行動の出現確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動の出現確率を算出したものである。
【0049】
図4の(b)は、各行動間の遷移確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動間の遷移確率を算出したものである。
【0050】
以上の図4の(a)の各行動の出現確率および図4の(b)の各行動間の遷移確率で単純化後のマルコフモデルを表現するものである。
【0051】
図4の(c)は、各行動が独立に発生することを仮定したモデルにおける、分析範囲の各行動間の遷移確率の例を示す。これは、既述した図4の(b)の各行動間の遷移確率をもとに、後述する(式2)によって算出した単純化後の各行動間の遷移確率の例を示す。
【0052】
図5は、本発明の説明図(男性、単純化後のモデルの情報量(KL情報量)と、単純化前のモデルの情報量との差(評価値))の例を示す。ここで、KL情報量(男性の単純化後のモデルの情報量)、評価値(単純化後のモデルのKL情報量と、単純化前のモデルの情報量との差)は、後述する図8の2行目のKL情報量、3列の情報量減少にそれぞれ対応するものである。
【0053】
図6は、本発明の説明図(全体)を示す。これは、図2の行動データの全部をもとに作成したものである。
【0054】
図6の(a)は、各行動の出現確率の例を示す。これは、図2の全ての行動データについて、各行動の出現確率を算出したものである。例えば行動Aの出現確率6/28は、分子が当該行動Aが出現した回数であり、分母の28が行動の全出現回数である。
【0055】
図6の(b)は、各行動間の遷移確率の例を示す。これは、図2の全ての行動データについて、各行動間の遷移確率を算出したものである。例えば▲1▼’の遷移確率2/20は、左端の行動Aから右上の行動Bへの遷移確率であって、分子の2が行動Aから行動Bへの遷移の回数であり、分母の20が行動から行動(自の行動、他の行動を含む)へ遷移する全体の回数である。
【0056】
以上の図6の(a)の各行動の出現確率および図6の(b)の各行動間の遷移確率で全体のマルコフモデルを表現するものである。
【0057】
図7は、本発明の説明図(全体、単純化)を示す。これは、図6の(a),(b)で表される全体のマルコフモデルの行動A,Bを1つの行動にまとめて単純化した例を示す。
【0058】
図7の(a)は、各行動の出現確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動の出現確率を算出したものである。
【0059】
図7の(b)は、各行動間の遷移確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動間の遷移確率を算出したものである。
【0060】
以上の図7の(a)の各行動の出現確率および図7の(b)の各行動間の遷移確率で全体の単純化後のマルコフモデルを表現するものである。
【0061】
図8は、本発明の説明図(2つの行動をまとめる単純化の評価値)を示す。
図8において、列1は、既述した図3の(a)の条件”男性”の各行動の出現確率および図3の(b)の条件”男性”の各行動間の遷移確率で表されるマルコフモデル(男性)について、いずれの行動をまとめるかを記載したものである(例えば”AとB”は既述した図4の(a),(b)に示すように、行動Aと行動Bとを1つにまとめて単純化することを表す。
【0062】
列2,3は、行動の独立性を仮定したモデルとの比較による評価の例であってここでは、KL情報量、情報量減少を算出したものである(後述する(式3)、図1のS6からS10参照)。
【0063】
列4,5は、全データから生成されるモデルとの比較による評価であって、ここでは、KL情報量、情報量減少を算出したものである(後述する(式3)、図1のS26、S28からS30参照)。
【0064】
列6は、評価値であって、列3の情報量減少と、列5の情報量減少との加重平均を算出したものである(図1のS11)。
【0065】
(1)図8の列2、3のKL情報量、情報量減少の算出について詳細に説明する。
【0066】
(1−1)分析範囲として条件”男性”が指定されると、与えられた既述した図2の行動データ中から条件”男性”に合致するID=1,3,5,7の行動データを抽出し、これら行動データをもとに図3の(a)の各行動の出現確率および図3の(b)の各行動間の遷移確率からなる条件”男性”のモデルa−1(マルコフモデル)を生成する。
【0067】
(1−2)生成したモデルa−1の持つ情報量I0を、a−1における行動間の遷移確率分布と、ここでは、4種類の行動が独立に発生すると仮定したモデルc−1における遷移確率分布との差として算出する。
分析範囲のデータから生成されたモデルMA(a−1またはa−2)を、各行動が独立であると仮定したモデルMC(c−1またはc−2)と比較した時のKL(カルバッククライブラー)情報量は、前者のモデル中での行動XからYへの遷移確率をP(X→Y、MA)、後者のモデル中での遷移確率をP(X→Y,MC)とすると、次の(式1)で算出される。
ここで、P(X→Y,MC)は、Xから任意の行動への遷移確率P(X→ALL,MA)と、任意の行動からYへの遷移確率P(ALL→Y,MA)との積で算出できる。すなわち、
P(X→Y、MC)=P(X→ALL,MA)×P(ALL→Y,MA)−−−(式2)
図3の(b)は、単純化を行う前のモデルa−1における遷移確率を表すから、ここから(式2)をつかってモデルc−1の遷移確率を算出した結果が図3の(c)である。この2つの遷移確率から(式1)をつかって情報量I0を算出すると1.366となる。
【0068】
(1−3)次に、可能な全ての単純化について、単純化後のモデルa−2の、各行動が独立におきることを仮定したモデルc−2との比較による情報量Iを計算し、段落〔0067〕で算出したI0からどれだけ減少したかを算出する。例えば初めに行動AとBを一つにまとめる単純化に注目する。この単純化を行った後のモデルa−2における各行動の出現確率および遷移確率は図4の(a)、(b)のようになる。ここから(式2)をつかって、モデルc−2における遷移確率を計算すると、図4の(c)が得られる。図4の(b)と(c)の遷移確率分布の差を(式1)を使って算出すると、1.088が得られる。すなわち、AとBをまとめたときの、行動の独立性を仮定したモデルとの比較による情報量の減少は0.277となる。
同様に、他の行動の組み合せについても単純化後の情報量およびその
減少量を算出すると、図8の列2および列3に示す結果が得られる。
【0069】
(2) 図8の列4、5のKL情報量、情報量減少の算出について説明する。
【0070】
(2−1)次に全てのデータを使って生成したモデルb−1と比較した場合の、単純化前のモデルa−1の情報量J0を、各行動の出現確率分布と行動間の遷移確率分布の差として算出する。分析範囲のモデルMA(a−1またはa−2)中での行動Xの出現確率をP(X,MA)、XからYへの遷移確率をP(X→Y,MA)、全データを使って生成したモデルMB(b−1またはb−2)中の行動Xの出現確率をP(X,MB)、XからYへの遷移確率をP(X→Y,MB)とすると、パラメータβ(0≦β≦1)を用いて(式3)のように算出する。
【0071】
図3の(a)、(b)が単純化前の分析範囲のモデルa−1における行動の出現確率および遷移確率であり、図6の(a)、(b)が単純化前の全データのモデルにおける各行動の出現確率および遷移確率である。この例では各行動の出現確率が分析範囲と全データ中とで等しいので、(式3)の第2項は0となる。そのため、以下の説明ではβ=1とする。このとき、(式3)を使うと、単純化を行う前の、全データから生成したモデルとの比較に基く情報量J0は0.277となる。
【0072】
(2−3)次に、可能な全ての単純化について、上の2種類の情報量がどれだけ減少するかを算出する。例えば行動Aと行動Bを1つにまとめる単純化を行うと、分析範囲の単純化後のモデルa−2における各行動の出現確率および行動間の遷移確率は図4の(a),(b)、全データから生成した単純化後のモデルb−2は図7の(a)、(b)になるから、(式3)を使って算出すると、情報量Jは0となり、単純化前の値J0からの減少量は0.277となる。
同様に、他の行動の組み合せについても単純化後の情報量およびその減少量を算出すると、図8の列4および列5に示す結果が得られる。単純化の評価は,段落〔0068〕で得られた結果と〔0072〕の結果の2種類の情報量の減少量を、パラメータα(0≦α≦1)を用いて加重平均をとることで、次の(式4)のように算出できる。
【0073】
α×(I0−I)+(I−α)×(J0−J) −−−(式4)
α=0.5としたときの各単純化を適用した場合の情報量とその変化およびそれらから算出される評価値を図8に示す(図8の列6)。評価値が小さいほうが情報量の減少が少なく、望ましい単純化であるので、図8の列6の評価値の最小の0.207のCとD(行動Cと行動Dを1つにまとめる)の組合わせが選択(決定)され、単純化が行われる。
【0074】
(2−4)ここで、CとDは、それぞれ自分自身にのみ遷移しているので、CとDをまとめて1つの行動とみなす単純化を行うと、Cへの遷移とDへの遷移の区別ができなくなるが、CからDへの遷移やその逆がないという性質がモデルから失われる。しかし、この性質は全データ中でも同様に観察される性質であり、分析範囲に限った場合の特徴ではないので、CとDとまとめることで失われてしまう性質の方が重要性は低いと考えることができる。
【0075】
そして、モデルが十分単純化(行動数が一定数以下に単純化)されるまで、繰り返す。単純化が終了したら、当該単純化したモデルを出力する。
【0076】
【発明の効果】
以上説明したように、本発明によれば、行動データから指定された条件に合うデータから生成したモデル、全データから生成したモデル、および各行動が独立と仮定して生成したモデルとの間の差を表す情報量を算出して、それらをできるだけ減少させないように、複数の行動をまとめてひとつの行動とする単純化を行う構成を採用しているため、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的としているすることが可能となる。
【図面の簡単な説明】
【図1】本発明の動作説明フローチャートである。
【図2】本発明の入力される行動履歴データの例である。
【図3】本発明の説明図(男性)である。
【図4】本発明の説明図(男性、単純化)である。
【図5】本発明の説明図(男性、単純化後のモデルの情報量(KL情報量)、単純化前のモデルの情報量との差(評価値))である。
【図6】本発明の説明図(全体)である。
【図7】本発明の説明図(全体、単純化)である。
【図8】本発明の説明図(2つの行動をまとめる単純化の評価値)である。
【符号の説明】
1:モデル生成手段
2:情報量算出手段
3:決定手段
【発明の属する技術分野】
本発明は、行動データをもとに作成したモデルの単純化を行う行動データ分析方法および行動データ分析プログラムに関するものである。
【0002】
【従来の技術】
従来、行動主体の行動の履歴をもとに行動間の出現確率を求め、行動をノード、ノード間をその出願確率のアークで結んで表現するいわゆるマルコフモデルがある。例えば分析者に指定された範囲の行動履歴データ中での行動の発生順序をマルコフモデルとしてモデル化する。そして、行動の取捨選択や、複数の行動をまとめることでモデルの単純化を行って理解しやすくしていた。
【0003】
また、顧客動向に関する1以上の統計的推定量を決定する方法がある(特許文献1)。
【0004】
【特許文献1】
特開2002−163434号公報の〔0007〕、〔0008〕などを参照。
【0005】
【発明が解決しようとする課題】
しかし、上述した前者では、例えば男性を分析範囲として与えた場合、男性のデータ中での行動のモデル化を行うが、その中に現れる特徴がかならずしも男性特有のものとは限らず、同じ特徴が女性にも見られる場合もあり、男性の行動を求めるという目的には沿わないという問題があった。それよりも、女性にはみられないけれども男性にだけみられる特徴を優先すべきで、上述した技術では指定された範囲のデータだけをみて分析を行っていた点に問題があり、これを解決することが望まれている。
【0006】
また、上述した後者では、顧客動向に関する1以上の統計的推定量を決定できるのみで、本願の行動モデル中に現れる行動の数が非常に多いときに重要なものを残して簡略化する手法について記載されていない。
【0007】
本発明は、これらの問題を解決するため、行動データから指定された条件に合う行動を抽出したモデル、全体の行動データのモデル、条件に合う行動および全体の行動データの行動をまとめて単純化後のそれぞれのモデルの情報量を算出してこれらの差の情報量をもとに最適な行動を組み合わせた単純化したモデルを生成し、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的としている。
【0008】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0009】
図1において、モデル生成手段1は、行動データ(条件に合う行動データ、全体の行動データ)をもとにモデル(例えばマルコフモデル)を生成したり、行動データのうちのXとY(X,Yは任意の行動)をまとめたモデルを生成したりなどするものである。
【0010】
情報量算出手段2は、モデルの情報量を算出するものである。
決定手段3は、モデルの情報量をもとに最適な行動の組合わせのモデルを決定するものである。
【0011】
次に、動作を説明する。
モデル生成手段1が入力された行動データから、指定された条件に合う行動を抽出してモデル(a−1)、当該モデル(a−1)の行動をまとめた単純化後のモデル(a−2)、入力された行動データの全体からモデル(b−1)、および当該モデル(b−1)の行動をまとめた単純化後のモデル(b−2)を生成し、情報量算出手段2がモデル(a−1)とモデル(b−1)との間の差の情報量B1、およびモデルの(a−2)とモデル(b−2)との間の差の情報量B2を算出した後、当該情報量B1と情報B2との差の情報量B12を算出し、決定手段3が情報量B12が最小となる、行動を組み合せた単純化したモデルを決定するようにしている。
【0012】
この際、入力された行動データから、指定された条件に合う行動を抽出し当該各行動が独立に発生すると仮定したモデル(c−1)、当該モデル(c−1)の行動をまとめた単純化後のモデル(c−2)を生成し、当該モデル(a−1)とモデル(c−1)との間の差の情報量C1、およびモデル(a−2)とモデル(c−2)との間の差の情報量C2を算出した後、情報量C1と情報C2との差の情報量C12を算出し、更に、情報量B12と情報量C12の加重平均の情報量BCを算出し、決定手段3が情報量BCが最小となる、行動を組み合せた単純化したモデルを決定するようにしている。
【0013】
また、差が最小となる、行動を組み合わた単純化したモデルの、行動数が一定数以下となったときに、単純化を終了してモデルを出力するようにしている。
【0014】
従って、行動データから指定された条件に合う行動を抽出したモデル、全体の行動データのモデル、条件に合う行動および全体の行動データの行動をまとめて単純化後のそれぞれのモデルの情報量を算出してこれらの差の情報量をもとに最適な行動を組み合わせた単純化したモデルを生成することにより、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することが可能となる。
【0015】
【発明の実施の形態】
次に、図1から図8を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0016】
ここで、本実施例では、単純化の評価用に3種類のモデルを使います(請求項1で使う記号も同じです)。
【0017】
a:与えられた条件に合うデータ(入力された行動データから与えられた条件に合う行動を抽出した行動データ)から生成されるモデル(例えば図3の(a),(b))
b:全てのデータから生成されるモデル(例えば図6)
c:与えられた条件に合うデータから、各行動が独立に発生すると仮定して生成されるモデル
また、単純化を評価(決定)するために、上記3つのモデルについてそれぞれ
・単純化前
・単純化後
について使用するので、単純化前のモデルをモデルa−1,b−1,c−1,単純化後のモデルをモデルa−2,b−2,c−2でそれぞれ表す。
【0018】
また、情報量は本実施例では、以下の4種類の情報量を使います。
情報量B1:モデル(a−1)とモデル(b−1)との間の差の情報量
情報量B2:モデル(a−2)とモデル(b−2)との間の差の情報量
情報量C1:モデル(a−1)とモデル(c−1)との間の差の情報量
情報量C2:モデル(a−2)とモデル(c−2)との間の差の情報量
以下順次詳細に説明します。
【0019】
図1は、本発明の動作説明フローチャートを示す。
図1において、S1は、データを取り込む。これは、例えば右側に記載したように、後述する図2のデータ(行動履歴データ)を取り込む。
【0020】
S2は、条件の入力を行う。これは、分析しようとする条件(分析範囲)をオペレータが入力、例えば右側に記載した条件”男性”を入力する。
【0021】
S3は、条件に合うデータを抽出する。これは、例えばS1で取り込んだ図2のデータから、S2で入力した条件”男性”に合致するデータを抽出(例えば図2のID=1,3,5,7の行動データを抽出)する。
【0022】
S4は、マルコフモデルを生成する。これは、S3で抽出した条件に合う行動データについて、例えば図3の(a)の各行動の出現確率および図3の(b)の各行動間の遷移確率を算出してマルコフモデル(モデルa−1)を生成する。尚、生成したマルコフモデルの行動数が一定数以下の場合には、単純化を行う必要がないので、このままマルコフモデルを出力する。生成したマルコフモデルの行動数が一定数以上のときに、単純化を行う必要があるので、S5以降の処理を行う。
【0023】
S5は、各行動が独立に発生することを仮定したモデル(単純化前)における、遷移確率を算出する。これは、S4で生成したマルコフモデルの図3の(b)の各行動間の遷移確率をもとに、後述する(式2)により、後述する図3の(c)に示す各行動間の遷移確率をそれぞれ算出する。
【0024】
S6は、XとYをまとめたときのマルコフモデルを作る。これは、例えば後述する図3の(a)、(b)のマルコフモデルについて、XとY(X,Yは任意の行動)をまとめて1つにした、例えばAとBとまとめて1つにしたマルコフモデル(モデルa−2)を、後述する図4の(a),(b)に示すように作成する。
【0025】
S7は、各行動が独立に発生することを仮定したモデル(単純化後)における、遷移確率を算出する。これは、S6で作成したマルコフモデル、例えば図4の(a),(b)をもとに、後述する(式2)により、後述する図4の(c)に示す各行動間の遷移確率をそれぞれ算出する。
【0026】
S8は、男性の単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。これは、後述する(式3)により、単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を、例えば図8の2列に示すように算出する。
【0027】
S9は、男性の単純化前の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。これは、後述する(式3)により、単純化後の遷移確率と、独立性を仮定した遷移確率の期待値との差の情報量を算出する。
【0028】
S10は、差を算出する。これは、S9で算出した男性の単純化前の情報量と、S8で算出した男性の単純化後の情報量との差を算出、例えば図8の3列に示すように算出する。
【0029】
以上のS1からS10によって、図2のデータから指定条件”男性”に合うデータを抽出して図3の(a),(b)のマルコフモデルを作成し、マルコフモデルの図3の(b)の行動間の遷移確率をもとに各行動間の遷移確率を図3の(c)のように生成および単純化後と単純化前の遷移確率と独立性を仮定した遷移確率の期待値との差の情報量をそれぞれ求め、これらの差を図8の3列に示すように算出することが可能となる。
【0030】
また、同様に、S24は、全データのマルコフモデルを生成する。例えば図2のデータの全部から、後述する図6の(a)の全データの各行動の出現確率および(b)の全データの各行動間の遷移確率からなるマルコフモデル(モデルb−1)を生成する。
【0031】
S26は、XとYをまとめたときのマルコフモデルを作成する。S6と同様に、全データ中のXとYをまとめたときのマルコフモデル(b−2)、例えば図7の(a),(b)を作成する。
【0032】
S28は、全体の単純化後の遷移確率と、男性の単純化後の遷移確率との差の情報量を算出する。これは、後述する(式3)により、全体の単純化後の遷移確率と、男性の単純化後の遷移確率との差の情報量を、例えば図8の4列に示すように算出する。
【0033】
S29は、全体の単純化前の遷移確率と、男性の単純化前の遷移確率との差の情報量を算出する。これは、後述する(式3)により、全体の単純化前の遷移確率と、男性の単純化前の遷移確率との差の情報量を算出する。
【0034】
S30は、差を算出する。これは、S29で算出した単純化前の情報量と、S28で算出した単純化後の情報量との差を算出、例えば図8の5列に示すように算出する。
【0035】
以上のS1、S24、S26からS30によって、図2の全データの図6の(a),(b)のマルコフモデルを作成し、全体の単純化後と単純化前の遷移確率と、男性の単純化後と単純化前の遷移確率との差の情報量をそれぞれ求め、これらの差を図8の5列に示すように算出することが可能となる。
【0036】
S11は、加重平均を算出する。これは、S10で算出した情報量(情報量減少)と、S30で算出した情報量(情報量減少)との加重平均を求めて図8の6列に示す情報量(評価値)を算出する。
【0037】
S12は、評価を最小とする行動の組をひとつの行動にまとめることで行動数を減らす。これは、S11で算出した例えば図8の6列の評価値(情報量減少)について最小(行動を組合わせて行動数を削減した後の情報量の減少が最小)の組合わせ、例えば当該図8の6列の評価値が最小の”0.207”のCとDをまとめて1つの行動とし、行動数を減らす。
【0038】
S13は、行動数が一定数以下か判別する。YESの場合には、単純化として指定された行動数が一定数以下となったので、単純化を終了し、S14で単純化後のマルコフモデルを出力する。一方、NOの場合には、更に、単純化を繰り返すために、S4、S24以降の処理を繰り返す。
【0039】
以上によって、例えば図2のデータから条件”男性”に合うデータを抽出して図3の(a),(b)のマルコフモデルを生成し、単純化前後の遷移確率と独立性を仮定した遷移確率の期待値との差を求めて図8の3列の情報量減少を算出すると共に、全データから図6の(a),(b)のマルコフモデルを生成し、これら全データの単純化前後の遷移確率と男性の単純化前後の遷移確率との差を求めて図8の5列の情報量減少を算出し、両者の情報量減少の加重平均を算出して図8の6列の評価値を算出し、評価値を最小とする行動の組をまとめてひとつの行動とし、これを行動の数が一定数以下となるまで繰り返すことで、与えられた条件を満足するデータの特徴を表すモデルを出力することが可能となる。以下順次詳細に説明する。
【0040】
図2は、本発明の入力される行動履歴データの例を示す。ここでは、8個のデータが図示の下記の情報に対応づけて入力された例を示す。
【0041】
・ID:
・性別:
・行動履歴:
・その他:
ここでは、IDはデータに付与した一意の識別子である。性別はデータの性別(例えばデータを採取した人の性別)(男性、女性)である。行動履歴は、時刻と行動の履歴であって、例えば(1、A)は時刻1のときに行動”A”をしたというデータである。
【0042】
図3は、本発明の説明図(男性)を示す。これは、図2の行動データから、条件”男性”に合う行動データを抽出し、当該抽出した行動データをもとに作成したものである。
【0043】
図3の(a)は、各行動の出現確率の例を示す。これは、図2の行動データから条件”男性”に合う抽出した行動データ、ここでは、図2のID=1,3,5,7の行動データについて、各行動の出現確率を算出したものである。例えば行動Aの出現確率3/14は、分子が当該行動Aが出現した回数であり、分母の14が行動の全出現回数である。
【0044】
図3の(b)は、各行動間の遷移確率の例を示す。これは、図2の行動データから条件”男性”に合う抽出した行動データ、ここでは、図2のID=1,3,5,7の行動データについて、各行動間の遷移確率を算出したものである。例えば▲1▼の遷移確率2/10は、左端の行動Aから右上の行動Bへの遷移確率であって、分子の2が行動Aから行動Bへの遷移の回数であり、分母の10が行動から行動(自の行動、他の行動を含む)へ遷移する全体の回数である。
【0045】
以上の図3の(a)の各行動の出現確率および図3の(b)の各行動間の遷移確率で条件”男性”のマルコフモデルを表現するものである。
【0046】
図3の(c)は、各行動が独立に発生することを仮定したモデルにおける、分析範囲の各行動間の遷移確率の例を示す。これは、既述した図3の(b)の各行動間の遷移確率をもとに、後述する(式2)によって算出した各行動間の遷移確率の例を示す。
【0047】
図4は、本発明の説明図(男性、単純化)を示す。これは、図3の(a),(b)で表されるマルコフモデルの行動A,Bを1つの行動にまとめて単純化した例を示す。
【0048】
図4の(a)は、各行動の出現確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動の出現確率を算出したものである。
【0049】
図4の(b)は、各行動間の遷移確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動間の遷移確率を算出したものである。
【0050】
以上の図4の(a)の各行動の出現確率および図4の(b)の各行動間の遷移確率で単純化後のマルコフモデルを表現するものである。
【0051】
図4の(c)は、各行動が独立に発生することを仮定したモデルにおける、分析範囲の各行動間の遷移確率の例を示す。これは、既述した図4の(b)の各行動間の遷移確率をもとに、後述する(式2)によって算出した単純化後の各行動間の遷移確率の例を示す。
【0052】
図5は、本発明の説明図(男性、単純化後のモデルの情報量(KL情報量)と、単純化前のモデルの情報量との差(評価値))の例を示す。ここで、KL情報量(男性の単純化後のモデルの情報量)、評価値(単純化後のモデルのKL情報量と、単純化前のモデルの情報量との差)は、後述する図8の2行目のKL情報量、3列の情報量減少にそれぞれ対応するものである。
【0053】
図6は、本発明の説明図(全体)を示す。これは、図2の行動データの全部をもとに作成したものである。
【0054】
図6の(a)は、各行動の出現確率の例を示す。これは、図2の全ての行動データについて、各行動の出現確率を算出したものである。例えば行動Aの出現確率6/28は、分子が当該行動Aが出現した回数であり、分母の28が行動の全出現回数である。
【0055】
図6の(b)は、各行動間の遷移確率の例を示す。これは、図2の全ての行動データについて、各行動間の遷移確率を算出したものである。例えば▲1▼’の遷移確率2/20は、左端の行動Aから右上の行動Bへの遷移確率であって、分子の2が行動Aから行動Bへの遷移の回数であり、分母の20が行動から行動(自の行動、他の行動を含む)へ遷移する全体の回数である。
【0056】
以上の図6の(a)の各行動の出現確率および図6の(b)の各行動間の遷移確率で全体のマルコフモデルを表現するものである。
【0057】
図7は、本発明の説明図(全体、単純化)を示す。これは、図6の(a),(b)で表される全体のマルコフモデルの行動A,Bを1つの行動にまとめて単純化した例を示す。
【0058】
図7の(a)は、各行動の出現確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動の出現確率を算出したものである。
【0059】
図7の(b)は、各行動間の遷移確率の例を示す。これは、行動A,Bを1つにまとめて単純化した後の各行動間の遷移確率を算出したものである。
【0060】
以上の図7の(a)の各行動の出現確率および図7の(b)の各行動間の遷移確率で全体の単純化後のマルコフモデルを表現するものである。
【0061】
図8は、本発明の説明図(2つの行動をまとめる単純化の評価値)を示す。
図8において、列1は、既述した図3の(a)の条件”男性”の各行動の出現確率および図3の(b)の条件”男性”の各行動間の遷移確率で表されるマルコフモデル(男性)について、いずれの行動をまとめるかを記載したものである(例えば”AとB”は既述した図4の(a),(b)に示すように、行動Aと行動Bとを1つにまとめて単純化することを表す。
【0062】
列2,3は、行動の独立性を仮定したモデルとの比較による評価の例であってここでは、KL情報量、情報量減少を算出したものである(後述する(式3)、図1のS6からS10参照)。
【0063】
列4,5は、全データから生成されるモデルとの比較による評価であって、ここでは、KL情報量、情報量減少を算出したものである(後述する(式3)、図1のS26、S28からS30参照)。
【0064】
列6は、評価値であって、列3の情報量減少と、列5の情報量減少との加重平均を算出したものである(図1のS11)。
【0065】
(1)図8の列2、3のKL情報量、情報量減少の算出について詳細に説明する。
【0066】
(1−1)分析範囲として条件”男性”が指定されると、与えられた既述した図2の行動データ中から条件”男性”に合致するID=1,3,5,7の行動データを抽出し、これら行動データをもとに図3の(a)の各行動の出現確率および図3の(b)の各行動間の遷移確率からなる条件”男性”のモデルa−1(マルコフモデル)を生成する。
【0067】
(1−2)生成したモデルa−1の持つ情報量I0を、a−1における行動間の遷移確率分布と、ここでは、4種類の行動が独立に発生すると仮定したモデルc−1における遷移確率分布との差として算出する。
分析範囲のデータから生成されたモデルMA(a−1またはa−2)を、各行動が独立であると仮定したモデルMC(c−1またはc−2)と比較した時のKL(カルバッククライブラー)情報量は、前者のモデル中での行動XからYへの遷移確率をP(X→Y、MA)、後者のモデル中での遷移確率をP(X→Y,MC)とすると、次の(式1)で算出される。
ここで、P(X→Y,MC)は、Xから任意の行動への遷移確率P(X→ALL,MA)と、任意の行動からYへの遷移確率P(ALL→Y,MA)との積で算出できる。すなわち、
P(X→Y、MC)=P(X→ALL,MA)×P(ALL→Y,MA)−−−(式2)
図3の(b)は、単純化を行う前のモデルa−1における遷移確率を表すから、ここから(式2)をつかってモデルc−1の遷移確率を算出した結果が図3の(c)である。この2つの遷移確率から(式1)をつかって情報量I0を算出すると1.366となる。
【0068】
(1−3)次に、可能な全ての単純化について、単純化後のモデルa−2の、各行動が独立におきることを仮定したモデルc−2との比較による情報量Iを計算し、段落〔0067〕で算出したI0からどれだけ減少したかを算出する。例えば初めに行動AとBを一つにまとめる単純化に注目する。この単純化を行った後のモデルa−2における各行動の出現確率および遷移確率は図4の(a)、(b)のようになる。ここから(式2)をつかって、モデルc−2における遷移確率を計算すると、図4の(c)が得られる。図4の(b)と(c)の遷移確率分布の差を(式1)を使って算出すると、1.088が得られる。すなわち、AとBをまとめたときの、行動の独立性を仮定したモデルとの比較による情報量の減少は0.277となる。
同様に、他の行動の組み合せについても単純化後の情報量およびその
減少量を算出すると、図8の列2および列3に示す結果が得られる。
【0069】
(2) 図8の列4、5のKL情報量、情報量減少の算出について説明する。
【0070】
(2−1)次に全てのデータを使って生成したモデルb−1と比較した場合の、単純化前のモデルa−1の情報量J0を、各行動の出現確率分布と行動間の遷移確率分布の差として算出する。分析範囲のモデルMA(a−1またはa−2)中での行動Xの出現確率をP(X,MA)、XからYへの遷移確率をP(X→Y,MA)、全データを使って生成したモデルMB(b−1またはb−2)中の行動Xの出現確率をP(X,MB)、XからYへの遷移確率をP(X→Y,MB)とすると、パラメータβ(0≦β≦1)を用いて(式3)のように算出する。
【0071】
図3の(a)、(b)が単純化前の分析範囲のモデルa−1における行動の出現確率および遷移確率であり、図6の(a)、(b)が単純化前の全データのモデルにおける各行動の出現確率および遷移確率である。この例では各行動の出現確率が分析範囲と全データ中とで等しいので、(式3)の第2項は0となる。そのため、以下の説明ではβ=1とする。このとき、(式3)を使うと、単純化を行う前の、全データから生成したモデルとの比較に基く情報量J0は0.277となる。
【0072】
(2−3)次に、可能な全ての単純化について、上の2種類の情報量がどれだけ減少するかを算出する。例えば行動Aと行動Bを1つにまとめる単純化を行うと、分析範囲の単純化後のモデルa−2における各行動の出現確率および行動間の遷移確率は図4の(a),(b)、全データから生成した単純化後のモデルb−2は図7の(a)、(b)になるから、(式3)を使って算出すると、情報量Jは0となり、単純化前の値J0からの減少量は0.277となる。
同様に、他の行動の組み合せについても単純化後の情報量およびその減少量を算出すると、図8の列4および列5に示す結果が得られる。単純化の評価は,段落〔0068〕で得られた結果と〔0072〕の結果の2種類の情報量の減少量を、パラメータα(0≦α≦1)を用いて加重平均をとることで、次の(式4)のように算出できる。
【0073】
α×(I0−I)+(I−α)×(J0−J) −−−(式4)
α=0.5としたときの各単純化を適用した場合の情報量とその変化およびそれらから算出される評価値を図8に示す(図8の列6)。評価値が小さいほうが情報量の減少が少なく、望ましい単純化であるので、図8の列6の評価値の最小の0.207のCとD(行動Cと行動Dを1つにまとめる)の組合わせが選択(決定)され、単純化が行われる。
【0074】
(2−4)ここで、CとDは、それぞれ自分自身にのみ遷移しているので、CとDをまとめて1つの行動とみなす単純化を行うと、Cへの遷移とDへの遷移の区別ができなくなるが、CからDへの遷移やその逆がないという性質がモデルから失われる。しかし、この性質は全データ中でも同様に観察される性質であり、分析範囲に限った場合の特徴ではないので、CとDとまとめることで失われてしまう性質の方が重要性は低いと考えることができる。
【0075】
そして、モデルが十分単純化(行動数が一定数以下に単純化)されるまで、繰り返す。単純化が終了したら、当該単純化したモデルを出力する。
【0076】
【発明の効果】
以上説明したように、本発明によれば、行動データから指定された条件に合うデータから生成したモデル、全データから生成したモデル、および各行動が独立と仮定して生成したモデルとの間の差を表す情報量を算出して、それらをできるだけ減少させないように、複数の行動をまとめてひとつの行動とする単純化を行う構成を採用しているため、指定された分析範囲に特徴的な性質を保持した上で単純で理解し易い行動モデルを生成することを目的としているすることが可能となる。
【図面の簡単な説明】
【図1】本発明の動作説明フローチャートである。
【図2】本発明の入力される行動履歴データの例である。
【図3】本発明の説明図(男性)である。
【図4】本発明の説明図(男性、単純化)である。
【図5】本発明の説明図(男性、単純化後のモデルの情報量(KL情報量)、単純化前のモデルの情報量との差(評価値))である。
【図6】本発明の説明図(全体)である。
【図7】本発明の説明図(全体、単純化)である。
【図8】本発明の説明図(2つの行動をまとめる単純化の評価値)である。
【符号の説明】
1:モデル生成手段
2:情報量算出手段
3:決定手段
Claims (4)
- 行動データをもとに作成したモデルの単純化を行う行動データ分析方法において、
入力された行動データから、指定された条件に合う行動を抽出してモデル(a−1)、当該モデル(a−1)の行動をまとめた単純化後のモデル(a−2)、入力された行動データの全体からモデル(b−1)、および当該モデル(b−1)の行動をまとめた単純化後のモデル(b−2)を生成するステップと、
前記モデル(a−1)と前記モデル(b−1)との間の差の情報量B1、および前記モデルの(a−2)と前記モデル(b−2)との間の差の情報量B2を算出するステップと、
前記情報量B1と前記情報B2との差の情報量B12を算出するステップと、
前記情報量B12が最小となる、行動を組み合せた単純化したモデルを決定するステップと
を有する行動データ分析方法。 - 前記入力された行動データから、指定された条件に合う行動を抽出し当該各行動が独立に発生すると仮定したモデル(c−1)、当該モデル(c−1)の行動をまとめた単純化後のモデル(c−2)を生成するステップと、
前記モデル(a−1)と前記モデル(c−1)との間の差の情報量C1、および前記モデル(a−2)と前記モデル(c−2)との間の差の情報量C2を算出するステップと、
前記情報量C1と前記情報C2との差の情報量C12を算出するステップと、
前記情報量B12と前記情報量C12の加重平均の情報量BCを算出するステップと、
前記情報量BCが最小となる、行動を組み合せた単純化したモデルを決定するステップと
を有する請求項1記載の行動データ分析方法。 - 前記情報量B12,BCが最小となる、行動を組み合わた単純化したモデルの、行動数が一定数以下となったときに、単純化を終了して当該モデルを出力するステップを有する請求項1あるいは請求項2記載の行動データ分析方法。
- 行動データをもとに作成したモデルの単純化を行う行動データ分析プログラムにおいて、
コンピュータに、
入力された行動データから、指定された条件に合う行動を抽出してモデル(a−1)、当該モデル(a−1)の行動をまとめた単純化後のモデル(a−2)、入力された行動データの全体からモデル(b−1)、および当該モデル(b−1)の行動をまとめた単純化後のモデル(b−2)を生成するステップと、
前記モデル(a−1)と前記モデル(b−1)との間の差の情報量B1、および前記モデルの(a−2)と前記モデル(b−2)との間の差の情報量B2を算出するステップと、
前記情報量B1と前記情報B2との差の情報量B12を算出するステップと、
前記情報量B12が最小となる、行動を組み合せた単純化したモデルを決定するステップと
して動作させる行動データ分析プログラム。
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003157004A JP2004362066A (ja) | 2003-06-02 | 2003-06-02 | 行動データ分析方法および行動データ分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003157004A JP2004362066A (ja) | 2003-06-02 | 2003-06-02 | 行動データ分析方法および行動データ分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004362066A true JP2004362066A (ja) | 2004-12-24 |
Family
ID=34050905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003157004A Withdrawn JP2004362066A (ja) | 2003-06-02 | 2003-06-02 | 行動データ分析方法および行動データ分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004362066A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012042814A1 (ja) * | 2010-10-01 | 2012-04-05 | パナソニック株式会社 | 分類装置及び分類方法 |
JP2016224512A (ja) * | 2015-05-27 | 2016-12-28 | 株式会社日立製作所 | 意思決定支援システム及び意思決定支援方法 |
-
2003
- 2003-06-02 JP JP2003157004A patent/JP2004362066A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012042814A1 (ja) * | 2010-10-01 | 2012-04-05 | パナソニック株式会社 | 分類装置及び分類方法 |
US8793204B2 (en) | 2010-10-01 | 2014-07-29 | Panasonic Corporation | Classification device and classification method |
JP5784585B2 (ja) * | 2010-10-01 | 2015-09-24 | パナソニック株式会社 | 分類装置及び分類方法 |
JP2016224512A (ja) * | 2015-05-27 | 2016-12-28 | 株式会社日立製作所 | 意思決定支援システム及び意思決定支援方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Anderson-Bergman | icenReg: regression models for interval censored data in R | |
Drummond et al. | Estimating mutation parameters, population history and genealogy simultaneously from temporally spaced sequence data | |
Farcomeni | Quantile regression for longitudinal data based on latent Markov subject-specific parameters | |
Xiang et al. | Multi-source learning with block-wise missing data for alzheimer's disease prediction | |
JP6045706B2 (ja) | データ処理システム、データ処理方法およびデータ処理装置 | |
CN110175168B (zh) | 一种基于生成对抗网络的时间序列数据填补方法及系统 | |
JP2015212972A (ja) | ベクトルフィールドを用いるデータ処理 | |
WO2018188533A1 (zh) | 用于健康评估的健康模型构建方法、终端及存储介质 | |
JP2012529716A (ja) | テストデータの生成方法 | |
JP2019061577A (ja) | 異常判定方法及びプログラム | |
JP6813693B2 (ja) | システムアーキテクチャを表す重み付きプロパティグラフデータモデル | |
EP3040900B1 (en) | Data securing device, data securing program, and data securing method | |
CN107656978B (zh) | 一种基于函数依赖的多样性数据修复方法 | |
US8786602B2 (en) | System and method for hierarchically decomposing process model | |
Fu et al. | Dynamic programming driven memetic search for the steiner tree problem with revenues, budget, and hop constraints | |
US20100005203A1 (en) | Method of Merging and Incremantal Construction of Minimal Finite State Machines | |
JP2010061450A (ja) | 情報処理装置、情報処理方法及びプログラム | |
Wang et al. | A Bayesian approach for analyzing case 2 interval-censored data under the semiparametric proportional odds model | |
Papaluca et al. | Pretrained knowledge base embeddings for improved sentential relation extraction | |
JP2004362066A (ja) | 行動データ分析方法および行動データ分析プログラム | |
CN112148942B (zh) | 基于数据聚类的业务指标数据分类方法及装置 | |
Takahashi et al. | Multiple imputation of missing values in economic surveys: Comparison of competing algorithms | |
Matilla-Garcia | Nonlinear dynamics in energy futures | |
JP2009157837A (ja) | 行動変容促進装置、方法、及びプログラム | |
Kuba et al. | Two-color balanced affine urn models with multiple drawings II: large-index and triangular urns |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060905 |