JP4962782B2 - 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム - Google Patents

利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム Download PDF

Info

Publication number
JP4962782B2
JP4962782B2 JP2007210927A JP2007210927A JP4962782B2 JP 4962782 B2 JP4962782 B2 JP 4962782B2 JP 2007210927 A JP2007210927 A JP 2007210927A JP 2007210927 A JP2007210927 A JP 2007210927A JP 4962782 B2 JP4962782 B2 JP 4962782B2
Authority
JP
Japan
Prior art keywords
user
state
behavior
unit
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007210927A
Other languages
English (en)
Other versions
JP2009048227A (ja
Inventor
政志 宇山
充 織田
安英 松本
理 渡辺
昌朋 矢崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007210927A priority Critical patent/JP4962782B2/ja
Priority to US12/190,150 priority patent/US8341102B2/en
Publication of JP2009048227A publication Critical patent/JP2009048227A/ja
Application granted granted Critical
Publication of JP4962782B2 publication Critical patent/JP4962782B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Description

サーバにアクセスした複数の利用者のアクセス履歴を示すデータから、利用者の状態を推定する利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラムに関する。
例えば、Webサイト利用者のWebサイト内における行動は、利用者個々人により異なる。しかし、共通の特性を持つ利用者同士をグループにまとめると、そのグループ内の利用者の行動には共通のパターンが見られることがある。例えば、利用者の特性として「サイトに対する関心度合い」を測ることができれば、関心度合いの大きいグループは、Webサイト滞在時間が長く、関心度合いの小さいグループは、サイト滞在時間が短いといった傾向を見出すことができる。
例えば、商品販売サービスを提供するWebサイトの利用者個々人の特性がわかれば、サイトの運用者は、利用者の特性に応じて表示するページを変更する等の施策を実行することが可能である。これにより、利用者が購買に至る確率を高めたり、利用者の満足度を高めたりすることができる。また、利用者個人の特性が特定できない場合でも、利用者集団全体で、ある特性を持つ人々の割合が推定できる場合には、サイトの運用者は、表示広告を変える等の施策を実行し、利用者の購買確率や満足度を高めることができる。
上記の商品販売サービスを提供するWebサイトを、店舗での対面の小売販売と比較すると、Webサイト利用者個人の特性を推定することは、店舗において優秀な店員がお客様個人との対話の中で、お客様の嗜好や目的を把握し、適切に誘導することに対応する。Webサイト利用者集団の特性を推定することは、店員と多数のお客様との対話から、販売商品の弱みや強み、比較されやすい競合商品、ブームの翳りや兆し等を把握することに対応する。これにより、商品の生産販売計画に適切にフィードバックすることが可能になる。
例えば、Webサイト上で特定商品のキャンペーン等を行う場合には、商品に対する利用者の関心の高さや、理解の高さ、購入意向といった特性を知ることが、キャンペーンの施策を決定する上で重要である。利用者の理解および関心がともに低い場合は、広告を強化して知名度をあげるための施策が有効となる。一方、利用者の商品理解は高いが関心が低い場合には、値引き等の施策が有効となる。
このような、利用者の関心および理解の度合い等の特性は、アンケートによる調査を実施することで、推定することが可能である(例えば、非特許文献1参照)。非特許文献1は、ハワード・シェス・モデルが紹介されている。このモデルでは、消費者が購買に至る中間的な段階として「注目」「ブランド理解」「態度」「購入意向」等の状態を遷移し、これらの消費者の状態は、「アンケート調査などによる消費者サーベイを通じて測定可能」とされている。しかし、アンケート等の実施コストは高く、回収結果を得るのに時間がかかる。
近年では、Webサイト利用者に嗜好や関心といった特性を捉えて、利用者の特性に応じた広告を配信するための技術として、行動ターゲティング広告(Behavioral Targeting Advertisement: 略称BTA)という技術が存在する(例えば、非特許文献2、3参照)。非特許文献2では、行動ターゲティング広告は、「WEBサイト上での行動履歴情報をもとにユーザーをセグメント化し、そのセグメントに応じて最適な広告を配信する新しいマーケティング手法」と定義されている。
また、非特許文献3には、行動ターゲティング広告の例として、次のようなBTAサーバが開示されている。すなわち、BTAサーバは、Webサイト利用者のユーザIDと、その利用者が閲覧したURLの情報を利用して、自動車や化粧品といった特定分野のWebページのURLを頻繁に閲覧しているユーザIDに対して、その特定分野のセグメントIDを割り当てる。BTAサーバは、各ユーザIDにどのようなセグメントIDが割り当てられているかを管理するデータベースを備える。これにより、セグメントIDに対応する広告を各ユーザIDの利用者に配信することが可能になる。
また、利用者の行動を把握することで可能になる施策は広告配信だけではないので、本明細書では、広告用途に限定せず、利用者の行動履歴情報をもとに利用者をセグメント化する技術一般を、行動ターゲティング技術と呼ぶことにする。行動ターゲティング技術として、例えば、特許文献1には、特定ホームページの訪問回数等の利用者行動および利用者の年齢等の利用者基本情報を用いて、利用者に適した情報、商品及びサービスを提供するシステムが開示されている。
しかし、上記方法では、情報の閲覧行為により、利用者の特性がどう変化するかを読み取れないという課題がある。利用者の特性は、Webサイトの情報の閲覧やインタラクションによって変わりうる。
利用者の特性変化を示す一例として、銀行のWebサイトで、外貨預金契約の手数料割引キャンペーンを行う場合を考えてみる。外貨預金のようにリスク性の商品は、たとえ割引キャンペーンによる割引があるといっても利用者が気軽に購入できるものではなく、購入に際してある程度の意思決定が必要である。こういった商品のキャンペーンの場合、Webサイトには商品の特性やリスクについて説明する複数の説明ページが存在し、意思決定に際して説明ページを丁寧に閲覧する利用者は多いと考えられる。
説明ページを丁寧に閲覧した結果、キャンペーン商品に対する利用者の関心や購買意欲といった特性は変化する。例えば、説明ページを閲覧した結果、商品に対する理解が深まり、購買意欲が高まる利用者が存在する一方、商品を理解した結果、興味を失う利用者も存在するはずである。
上記非特許文献2、3のBTAや特許文献1では、例えば、ある特定分野のWebページを頻繁に閲覧した利用者は一律に関心の高い利用者としてセグメント化され、その特定分野の広告ターゲットとなってしまう。しかし、その特定分野のWebページを頻繁に閲覧した結果、その特定分野の商品を購入する価値がないと判断した利用者もいるはずである。上記非特許文献2、3のBTAや特許文献1では、頻繁に閲覧した利用者の特性がどのように変化するかを把握することが難しい。
特開2003−122982号公報 片平秀貴、「マーケティング・サイエンス」、東京大学出版会、1987年初版発行、p.24 デジタル・アドバタイジング・コンソーシアム株式会社、株式会社アイメディアドライブ、"行動ターゲティング広告(BTA)の広告効果を本格的に検証"、[online]、平成19年1月26日、[平成19年6月18日検索]、インターネット、<URL:http://www.dac.co.jp/dacfiles/200701%20BTA_tyousa.pdf> 株式会社日経BP、"行動ターゲティング広告を本格化 媒体社、広告主、読者にメリット"、[online]、平成18年8月9日、[平成19年6月18日検索]、インターネット、<URL:http://www.nikkeibp.co.jp/style/biz/net/keyperson/060809_dac/>
すなわち、上記従来の行動ターゲティング技術では、利用者が参照したWebページに基づいて利用者の嗜好や関心等の特性を特定するための仕組みはあるが、利用者の特性が、Webサイトの閲覧等の利用者自身の行動によりどのように変化するかを追跡するための仕組みは存在しない。そのため、利用者の特性の変化が、どのように商品の購入行動に関連するのかを把握することが困難であった。
そこで、本発明は、利用者自身の情報参照行動によって動的に変化する状態を捉えることができ、さらに、そのような状態の変化と目的行動との関係も捉えることができる利用者状態推定システム、利用者状態推定方法、および利用者状態推定プログラムを提供することを目的とする。
本発明にかかる利用者状態推定システムは、ネットワークを介して複数の利用者にサービスを提供するサーバに対してアクセスした複数の利用者それぞれが予め定義された複数の状態のうち、どの状態に属しているかを示す状態データを記録するカテゴリ記録部と、利用者がある状態から他の状態に遷移するための条件となる利用者の行動パターンを示す遷移条件データを、前記複数の状態のうち少なくとも2つの状態間の遷移について記録する遷移モデル記録部と、前記サーバにアクセスした複数の利用者それぞれを識別するデータと、前記複数の利用者それぞれが参照した情報および参照時間を示すデータとを含むアクセスログを読み込むログ入力部と、前記ログ入力部が読み込んだ前記アクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者が一連のアクセスにおいて参照した情報を特定するデータを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出するログ抽出部と、前記ログ抽出部が抽出した前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報に基づいて、各利用者の一連のアクセスにおける行動を、予め定義された複数の行動パターンのうちいずれかに決定する行動分類部と、前記行動分類部により決定された各利用者の行動パターンと、前記遷移モデル記録部に記録された遷移条件データが示す状態間の遷移の条件となる行動パターンと照合することによって、前記カテゴリ記録部に記録された前記状態データで示される各利用者の状態がどのように遷移するかを決定し、当該決定に基づいて前記状態データを更新するカテゴリ推定部と、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を記録する遷移確率記録部と、前記状態データを参照することにより、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を、一定期間ごとに計算して前記遷移確率記録部に記録する遷移確率計算部と、前記ログ抽出部が抽出した前記アクセス履歴データから、各利用者が一連のアクセスにおいて、前記サーバが提供するサービスにおいて目的とされている所定の目的行動を行ったか否かを判定する目的行動判定部と、各状態における利用者のうちで目的行動を行った利用者の割合を記録する目的行動確率記録部と、前記目的行動判定部による前記判定の結果と、前記状態データに基づいて、各状態における利用者のうちで目的行動を行った利用者の割合を、前記一定期間ごとに計算し前記目的行動確率記録部に記録する目的行動確率計算部とを備える。
ログ抽出部が抽出するアクセス履歴データには、各利用者が一連のアクセスにおいて参照した情報が含まれる。これにより、行動分類部は、利用者が一連のアクセスにおいて、どのような情報を参照したかを基にして、一連のアクセスにおける利用者の行動パターンを決定する。カテゴリ推定部は、行動分類部が決定した利用者の行動パターンと、利用者の状態が他の状態へ遷移する条件となる行動パターンとを照合することにより、状態データで示される利用者の状態がどのように遷移するかを決定する。このようにして、行動分類部が、利用者の一連のアクセスにおける情報の参照行動パターンを分析し、カテゴリ推定部が、この分析に基づいて利用者の一連のアクセスによる状態の遷移を推定することができる。推定された利用者の状態の遷移は、カテゴリ記録部の状態データに反映される。遷移確率計算部は、各利用者の一連のアクセスによる状態の遷移が反映された状態データを参照することにより、利用者がある状態から他の状態へ遷移する遷移確率を一定期間ごとに計算して遷移確率記録部に記録することができる。また、目的行動確率計算部は、一定期間ごとに、目的行動を行った利用者の割合を各状態について計算して、前記遷移確率記録部に記録する。このようにして、遷移確率記録部には、一定期間ごとの、各状態における利用者が他の状態へ遷移する確率と、各状態における利用者が目的行動を行う割合とが記録される。そのため、時間とともに、アクセス時の利用者自身の行動によってどのような状態に遷移しやすいのか、そして、各状態においてどの程度の割合で利用者が目的行動に至るのかを示す情報が得られることになる。これにより、例えば、利用者の理解度や関心の高さ等の心理的な状態のように、情報を参照する等利用者自身の行動によって動的に変化する状態を捉えることができる。そしてさらに、そのような状態の変化と目的行動との関係も捉えることが可能になる。
本発明にかかる利用者状態推定システムは、初期条件として、前記複数の状態それぞれに属する利用者の最初の人数を、操作者から入力された指示に基づいて設定し、前記遷移確率記録部に記録された、一定期間ごとの前記遷移確率と、各状態における目的行動をとった利用者の割合とを用いて、前記初期条件で設定された各状態の利用者の人数が、時間経過とともに変化する様子と、各状態において目的行動をとる利用者の人数が時間経過とともに変化する様子とをシミュレートするシミュレーション部をさらに備える態様とすることができる。
シミュレーション部は、前記遷移確率記録部に記録された、一定期間ごとの前記遷移確率と、各状態における目的行動をとった利用者の割合とを用いることにより、各状態の利用者人数の一定期間経過するごと変化、および各状態の利用者のうち目的行動をとる利用者の人数を計算することができる。これにより、各状態の利用者の人数と目的行動をとる人数を予測することができる。すなわち、利用者自身のサーバへのアクセス時の行動によって動的に変化する状態を予測することができ、さらに、目的行動に至るまでの状態の遷移を適切に予測することが可能になる。
本発明にかかる利用者状態推定システムにおいて、前記ログ抽出部は、前記アクセス履歴データとして、前記サーバが提供するサービスにおいて利用者が参照可能な情報単位の集合のうち、利用者が一連のアクセスにおいて参照した情報単位を示すデータを含むデータを、前記アクセスログから抽出し、前記行動分類部は、前記利用者が参照可能な情報単位の集合を項目反応理論における各項目とし、前記各項目に対応する情報単位を参照する確率それぞれを、項目母数を用いて、各利用者の特性値θの関数で表したIRTモデルにおいて、項目母数の推定値を、前記アクセス履歴データが示す各利用者が一連のアクセスにおいて参照した情報単位を基にして各項目に対する反応を示す反応パターンベクトルを生成することにより計算し、当該項目母数の推定値に基づいて計算した特性値θに基づいて各利用者の行動パターンを決定する態様とすることができる。
サーバが提供するサービスにおいて利用者が参照可能な情報単位の集合の中には、例えば、関心の高い利用者のみから参照される情報単位と、大多数の利用者から参照される情報単位があるように、利用者の特性を推定する上での各情報単位の重要度(重み)が異なる傾向がある。行動分類部は、上記のように、IRT(Item Response Theory)モデルを用いて、各利用者の一連のアクセスにおける特性値θを計算することにより、情報単位ごとの重みの違いを加味して、各利用者の一連のアクセスにおける特性値θを計算することができる。そのため、行動分類部は、情報単位ごとの重みの違いを加味して、利用者の一連のアクセスにおける行動パターンを決定することができる。
なお、利用者が参照可能な情報単位とは、利用者がサーバにアクセスすることにより情報を参照する際に、アクセスの単位となるひとまとまりのデータである。情報単位には、例えば、Webサイトの1Webのページ、1つのファイル等が含まれるが、情報単位のデータ形式は特に限定されず、利用者がアクセスしたか否かを客観的に判断できる単位であればよい。
本発明にかかる利用者状態推定システムにおいて、前記ログ抽出部は、前記アクセス履歴データとして、各利用者が一連のアクセスにおいて参照した情報を特定するデータに加えて、各利用者が当該情報を参照した時間を示すデータを含むデータを、前記アクセスログから抽出し、前記行動分類部は、前記ログ抽出部が抽出した前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報および当該情報を参照した時間に基づいて、各利用者の一連のアクセスにおけるサービスに対する関心度合いを示す値を計算し、計算した値に基づいて、前記行動パターンを決定する態様とすることができる。
上記構成により、行動分類部は、各利用者が一連のアクセスにおいてどのような情報を、どのくらいの時間参照したかを示す情報に基づいて、利用者のサービスに対する関心度合いを示す値を計算することができる。そのため、行動分類部は、利用者の一連のアクセスにおけるサービスへの関心度合いに応じた行動パターンを決定することができる。
本発明にかかる利用者状態推定方法は、ネットワークを介して複数の利用者にサービスを提供するサーバに対してアクセスした複数の利用者それぞれが予め定義された複数の状態のうち、どの状態に属しているかを示す状態データを記録するカテゴリ記録部と、利用者がある状態から他の状態に遷移するための条件となる利用者の行動パターンを示す遷移条件データを、前記複数の状態のうち少なくとも2つの状態間の遷移について記録する遷移モデル記録部とを備えるコンピュータが実行する利用者状態推定方法である。この利用者状態推定方法は、前記コンピュータが備えるログ入力部が、前記サーバにアクセスした複数の利用者それぞれを識別するデータと、前記複数の利用者それぞれが参照した情報および参照時間を示すデータとを含むアクセスログを読み込む工程と、前記コンピュータが備えるログ抽出部が、前記アクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者が一連のアクセスにおいて参照した情報を特定するデータを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出する工程と、前記コンピュータが備える行動分類部が、前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報に基づいて、各利用者の一連のアクセスにおける行動を、予め定義された複数の行動パターンのうちいずれかに決定する工程と、前記コンピュータが備えるカテゴリ推定部が、前記行動分類部により決定された各利用者の行動パターンと、前記遷移モデル記録部に記録された遷移条件データが示す状態間の遷移の条件となる行動パターンと照合することによって、前記カテゴリ記録部に記録された前記状態データで示される各利用者の状態がどのように遷移するかを決定し、当該決定に基づいて前記状態データを更新する工程と、前記コンピュータが備える遷移確率計算部が、前記状態データを参照することにより、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を、一定期間ごとに計算して前記コンピュータが備える遷移確率記録部に記録する工程と、前記コンピュータが備える目的行動判定部が、前記アクセス履歴データから、各利用者が一連のアクセスにおいて、前記サーバが提供するサービスにおいて目的とされている所定の目的行動を行ったか否かを判定する工程と、前記コンピュータが備える目的行動確率計算部が、前記目的行動判定部による前記判定の結果と、前記状態データに基づいて、各状態における利用者のうちで目的行動を行った利用者の割合を、前記一定期間ごとに計算し、前記コンピュータが備える目的行動確率記録部に記録する工程とを含む。
本発明にかかる利用者状態推定プログラムは、ネットワークを介して複数の利用者にサービスを提供するサーバに対してアクセスした複数の利用者それぞれが予め定義された複数の状態のうち、どの状態に属しているかを示す状態データを記録するカテゴリ記録部と、利用者がある状態から他の状態に遷移するための条件となる利用者の行動パターンを示す遷移条件データを、前記複数の状態のうち少なくとも2つの状態間の遷移について記録する遷移モデル記録部とを備えるコンピュータに処理を実行させる利用者状態推定プログラムである。この利用者状態推定プログラムは、前記サーバにアクセスした複数の利用者それぞれを識別するデータと、前記複数の利用者それぞれが参照した情報および参照時間を示すデータとを含むアクセスログを読み込むログ入力処理と、前記ログ入力処理で読み込まれた前記アクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者が一連のアクセスにおいて参照した情報を特定するデータを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出するログ抽出処理と、前記ログ抽出処理で抽出された前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報に基づいて、各利用者の一連のアクセスにおける行動を、予め定義された複数の行動パターンのうちいずれかに決定する行動分類処理と、前記行動分類処理により決定された各利用者の行動パターンと、前記遷移モデル記録部に記録された遷移条件データが示す状態間の遷移の条件となる行動パターンと照合することによって、前記カテゴリ記録部に記録された前記状態データで示される各利用者の状態がどのように遷移するかを決定し、当該決定に基づいて前記状態データを更新するカテゴリ推定処理と、前記状態データを参照することにより、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を、一定期間ごとに計算して前記コンピュータが備える遷移確率記録部に記録する遷移確率計算処理と、前記ログ抽出処理で抽出された前記アクセス履歴データから、各利用者が一連のアクセスにおいて、前記サーバが提供するサービスにおいて目的とされている所定の目的行動を行ったか否かを判定する目的行動判定処理と、前記目的行動判定処理による前記判定の結果と、前記状態データに基づいて、各状態における利用者のうちで目的行動を行った利用者の割合を、前記一定期間ごとに計算し前記コンピュータが備える目的行動確率記録部に記録する目的行動確率計算処理とをコンピュータに実行させる。
本発明によれば、利用者自身の情報参照行動によって動的に変化する状態を捉えることができ、さらに、そのような状態の変化と目的行動との関係も捉えることができる。
(第1の実施形態)
図1は、本実施形態にかかる利用者状態推定システム1の構成を示す機能ブロック図である。図1に示す利用者状態推定システム1は、Webサーバ21へ接続されている。Webサーバ21は、インターネット41に接続されており、インターネット41には、複数の利用者の利用者端末31a、31bが接続されている。利用者端末31a、31bには、例えば、Webブラウザがインストールされており、複数の利用者は、利用者端末31a、31bのWebブラウザを使って、インターネット41を介してWebサーバ21が提供するWebサイトにアクセスすることができる。本実施形態では、一例として、利用者端末31a、31bとWebサーバ21との通信が、主にHTTPを用いて行われる場合について説明する。また、Webサイトは、複数のWebページで構成されている。そのため、1つのWebページが利用者の参照可能な情報単位となる。
Webサーバ21は、Webサイトを通じて、複数の利用者に商品販売等のサービスを提供する。また、Webサーバ21は、利用者によるWebサイトへのアクセス履歴を示すアクセスログを記録するWebアクセスログ記録部22を備える。
利用者状態推定システム1は、Webアクセスログ記録部22からアクセスログを読み込み、読み込んだアクセスログを用いて、Webサイトのサービスの利用者が、予め定義された状態間をどのように遷移するかを解析し、あわせて、Webサイトのサービスにおいて目的とされる利用者の目的行動(例えば、商品の購入等)と利用者の状態遷移との関わりを解析するシステムである。
そのため、利用者状態推定システム1は、ログ入力部2、ログ抽出部3、行動分類部4、カテゴリ推定部5、遷移確率計算部6、目的行動判定部7、目的行動確率計算部8、遷移モデル記録部11、アクセス履歴データ記録部12、目的URL記録部13、目的行動確率記録部14、遷移確率記録部15およびカテゴリ記録部16を備える。
(利用者の状態のカテゴリ分類)
利用者状態推定システム1では、Webサイト利用者が目的行動に至るまでにとり得る複数の状態と、状態間の遷移ルールを示す遷移条件データが予め定義され遷移モデル記録部11に記録される。この複数の状態と状態間の遷移ルールは、Webサイトで提供されるサービスの内容に応じて決定されることが好ましい。ここで、遷移モデル記録部11に予め記録する遷移条件データを決める方法の例を説明する。
ここでは、一例として、Webサイトで提供されるサービスが、商品の販売であって、その商品の購入に際してある程度の意思決定が必要であり、かつ、その商品のリピート購入が少ない場合について説明する。この場合、利用者の目的行動は、商品の購入となる。また、商品の購入を促進する目的で、割引や景品などのインセンティブを伴う期間限定のキャンペーンをWebサイト上で実施する際の、利用者の状態の遷移を利用者状態推定システム1において解析する場合について説明する。
サービス事業主が、Webサイト上でキャンペーンを計画する場合に、Webサイトにアクセスした利用者が目的とする商品を購入(以下、成約と称する)する割合を、いかに高くするかを考える必要がある。このような割合を示す指標として、コンバージョン率と呼ばれる指標がある。コンバージョン率の算定は、様々な公知のWebログ解析ツールで実現されている。しかし、過去に実施したキャンペーンにおいて算定されたコンバージョン率を用いて、将来の効果を予測することは困難である。全く同じ条件でキャンペーンを行ったとしても、前回キャンペーン時に比べて、キャンペーン対象商品に対する利用者の関心や理解が変わっており、同じ効果は期待できないからである。利用者ごとに、商品に対するニーズは異なるはずであり、また商品に関する知識も異なる。
そこで、本実施形態における利用者状態推定システム1では、個々の利用者の関心や理解度等の状態を推定し、どんな状態を持つ利用者が成約に至るかを解析する。これにより、サービス事業主が、過去のキャンペーン事例から将来の効果をより正確に予測できるようになる。このような解析を可能にするために、例えば、利用者が成約に至るまでにとり得る状態を、以下のように複数のカテゴリに分類することができる。
本実施形態では、コンバージョン率にかかわる利用者の特性として、利用者の関心の度合いおよび理解の度合いの二つの特性を用いる。例えば、外貨預金のようにリスク性の商品は、たとえキャンペーン割引だといっても気軽に成約できるものではなく、利用者は、成約に際してある程度の意思決定が必要である。利用者は、単に外貨預金に関心が高いだけでは成約にいたらず、商品知識が少なければ、丁寧にWebサイトの情報頁を参照して商品理解につとめるはずである。情報ページを閲覧した結果、商品に対する理解が深まり、成約意欲が高まる利用者が存在する一方、商品特性を理解した結果、興味を失う利用者も存在するはずである。そこで、関心の度合いと理解の度合いという二つ特性の観点から、利用者が成約までにとり得る状態を、例えば、下記のような4つのカテゴリ(無関心層、興味層、保留層、躊躇層)に分類することができる。
・無関心層 商品に対する理解が低く、関心も低い
・興味層 商品に対する理解は低いが、関心は高い
・保留層 商品に対する理解は高く、関心も高いが購入まで至らない
・躊躇層 商品に対する理解は高いが、関心は低い
本実施形態では、利用者状態推定システム1での解析をより容易にするために、上記の分類に対して、「未訪問層」を導入し、「興味層」を割愛し、さらに、「無関心層」を「低関心層」に変更し、下記のように5つのカテゴリ(未訪問層、低関心層、保留層、躊躇層、成約層)を定義している。すなわち、本実施形態におけるカテゴリ集合Sは、下記の5つのカテゴリを含む。
・未訪問層 キャンペーン商品の関連Webページにまだアクセスしていない状態
・低関心層 関連Webページを素通りしてアクセス終了した状態
・保留層 関連Webページを丁寧に見たものの成約には至らなかった状態
・躊躇層 保留層で、次のアクセス時にもまだ購入に至らない状態
・成約層 キャンペーン商品を購入した状態
上記「未訪問層」は、次のような理由により導入されている。アクセスログのページ参照関係だけからカテゴリを推定する場合、一度も来訪してない(Webページにアクセスしていない)利用者については、アクセスログが残っていないため、理解度の情報も関心度のも得られない。このため、Webページにまだアクセスしていない状態の利用者を表す「未訪問者層」がカテゴリ導入されることにより、このような利用者状態を扱うことができる。
本実施形態における利用者状態推定システム1は、Webサイトのアクセスログから、例えば、利用者がWebサイトに初めてアクセスしてから成約に至るまで、上記のような5つのカテゴリに分類された状態間をどのように遷移するかを解析する。そ
図2は、上記5つのカテゴリそれぞれの状態と、各状態間の遷移ルール(あるカテゴリの状態から他のカテゴリの状態へ遷移するための条件)とを概念的に示す状態遷移図である。図2において、例えば、「未訪問層」に属する利用者が、関連Webページにアクセスした場合、関連Webページを丁寧に見ると、関心も理解も高まったと判断されて「保留層」に、素通りすると、関心も理解も低いと判断されて「低関心層」に、成約すると「成約層」にそれぞれ状態遷移する。
同様に、「低関心層」に属する利用者が、関連Webページにアクセスした場合、関連Webページを丁寧に見ると「保留層」に、成約すると「成約層」にそれぞれ状態遷移し、素通りすると「低関心層」のままとなる。
また、「保留層」に属する利用者が、関連Webページにアクセスした場合、関連Webページを素通りすると「躊躇層」に、成約すると「成約層」にそれぞれ状態遷移し、丁寧に見ると「保留層」のままとなる。
また、「躊躇層」に属する利用者が、関連Webページにアクセスした場合、関連Webページを丁寧に見ると「保留層」に、成約すると「成約層」にそれぞれ状態遷移し、素通りすると「躊躇層」のままとなる。なお、関連するWebページを丁寧に見たか素通りしたかは、後述するように、行動分類部4により利用者の一連のアクセス(本実施形態では、一例としてセッション)ごとに判断される。
上記のような複数のカテゴリに分類された状態および状態間の遷移ルールを示す遷移条件データは、予め、遷移モデル記録部11に記録される。利用者状態推定システム1は、遷移モデル記録部11に記録された遷移条件データを用いて、利用者が属するカテゴリが、成約に至るまでにどのように遷移するかを解析する。これにより、サービス事業者(以下、サイトの運用者と称する)は、成約に至るまでどの状態に留まっている利用者が多いか等の情報を得ることができる。サイトの運用者は、例えば、低関心層が多ければ、広告を強化してまず商品の知名度をあげる施策が必要であると判断できる。一方、躊躇層が多い場合には、サイトの運用者は値引き等の対策が有効と判断できる。
なお、利用者の状態のカテゴリ分類と遷移ルールは、上記の例に限られない。例えば、キャンペーンの対象となる商品がリピート購入の多い商品の場合は、例えば、初回購入者層、リピート購入者層のようなカテゴリを含むように分類することもできる。また、状態のカテゴリ分類の基準となる利用者特性も上記のように関心度合いおよび理解度に限られず、例えば、利用者の保守性の度合い等等を基準としてカテゴリ分類することができる。このように、利用者の状態のカテゴリ分類と遷移ルールは、利用者の目的行動に応じて決定することができる。
(利用者状態推定システム1の各機能部の説明)
次に、利用者状態推定システム1が備える各機能部について図1を参照しながら説明する。まず、ログ入力部2は、Webアクセスログ記録部22に記録されたWebサイトへのアクセス履歴を示すアクセスログを読み込む。
アクセスログには、Webサーバ21が提供するWebサイトにアクセスした利用者を識別するデータと、各利用者が参照した情報および参照時刻を示すデータとが含まれている。例えば、Webサーバ21は、利用者端末31a、31bから送信されたHTTPリクエストに基づいて、利用者のユーザID、利用者が参照したWebページのURLおよび参照時刻を対応付けて、アクセスログに記録することができる。
Webサーバ21は、例えば、利用者端末31a、31bからWebページへアクセスがあった場合に、利用者端末31a、31bのブラウザのCookie情報に記録されているユーザIDを受信することにより、ユーザIDを取得することができる。また、Webサーバ21は、例えば、BASIC認証の機能を用いて、各利用者のアクセスを長期的に追跡することもできる。なお、アクセスログは必ずしもWebサーバ21が生成する必要はなく、他のサーバが、Webサーバ21への利用者端末31a、31bからのアクセス履歴を示すデータを収集し、アクセスログを生成してもよい。
ログ抽出部3は、ログ入力部2が読み込んだアクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者がそれぞれの一連のアクセスにおいて参照したURLを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出する。ここで、利用者の一連のアクセスとは、利用者がサーバにアクセスして何らかのサービスを利用する際の、利用開始から終了までの一連の行動として認識されるアクセスである。
このように、利用者の一連の行動を示す一連のアクセスを認識する方法として、例えば、Webサーバが、Webサイトにおける同一利用者によるアクセスを、1つのセッションとして認識する技術が存在する。
本実施形態では、一例として、ログ抽出部3が、セッションの開始と終了を抽出する場合について説明する。ログ抽出部3は、例えば、閾値t(例えば、t=30分)として、同一利用者による連続する2回のアクセスの時間間隔がt以内の場合は前記2回のアクセスは同一のセッションに含まれると判断し、連続する2回のアクセスの時間間隔が閾値tを超えた場合は、2回目のアクセスは1回目のアクセスとは別の新たなセッションの開始であると判断することができる。また、この判断に加えて、ログ抽出部3は、アクセスログにおける利用者から明示的なログインの履歴によりセッション開始を検出し、ログアウトの履歴からセッションの終了を検出してもよい。この場合、アクセスログには、利用者のログインおよびログアウトの履歴を示すデータが含まれている必要がある。
なお、セッションの開始および終了の検出方法は上記方法に限られない。例えば、セッションを識別するセッションIDがアクセスログに含まれている場合は、ログ抽出部3は、セッションIDによってセッションの開始および終了を検出することができる。
ログ抽出部3は、このようして検出したセッションごとに、例えば、利用者が参照したURLおよび参照時刻の2つを要素とする組のリストで表されたデータをアクセス履歴データとして抽出する。図3は、1つのセッションついて抽出されたアクセス履歴データの例を示す図である。図3に示す例では、セッションを識別するセッション番号、利用者を識別するユーザID、セッションにおいて利用者が参照した参照URLと参照時刻の2つを要素とする組のリスト、目的行動フラグ(後述)、および行動分類(後述)が、1つのセッションのアクセス履歴データとしてログ抽出部3によって抽出される。このアクセス履歴データは、アクセス履歴データ記録部12に記録される。
目的行動判定部7は、予め目的URL記録部13に記録された目的URLが、各セッションのアクセス履歴データ中の参照URLに含まれるか否かを判定する。これにより、各セッションにおいて、利用者が目的行動を行ったか否かを判定することができる。目的行動判定部7は、利用者が目的行動を行ったと判定した場合、対応するアクセス履歴データの目的行動フラグを(0)から(1)に更新する。
なお、目的URL記録部13には、目的URLとして、利用者が目的行動を行う際に参照するWebページのURLが記録される。例えば、本実施形態では、Webサイトのキャンペーンにおいて目的とする成約をする際に、利用者がアクセスするWebページのURLが目的URLとして記録される。目的行動には、例えば、その他、商品の購入や会員の新規登録等が含まれる。
行動分類部4は、ログ抽出部3が抽出したアクセス履歴データが示す各セッション中の参照URLおよび目的行動フラグに基づいて、各セッションにおける利用者の行動を、予め定義された行動パターン集合Aのうちいずれかに分類する。行動パターン集合Aの一例を以下に示す。
パターン1(丁寧に見た&成約せず) 商品の説明ページを丁寧に見たが、成約に至らない
パターン2(素通り&成約せず) 商品の説明ページを余り見ずに素通り、成約に至らない
パターン3(成約) 成約した
各セッションの利用者の行動を、上記例のようにパターン1〜3に分類するため、行動分類部4は、まず、アクセス履歴データにおける目的行動フラグから、各セッションにおける利用者の目的行動(成約)の有無を取得する。行動分類部4は、目的行動フラグが成約したことを示すセッションについては、利用者の行動パターンを上記パターン3(成約)に分類する。
利用者が成約していないセッションについては、行動分類部4は、さらに、アクセス履歴データで示される各セッションにおける利用者の行動パターンを、キャンペーンに関連するWebページ群を「丁寧に見た」か、それとも「素通り」したかの2つのうちいずれかに分類する。この分類の結果、例えば、「丁寧に見た」と判断された場合は「1」、「素通り」と判断された場合は「0」が、図3に示すアクセス履歴データの「行動分類」に記録される。
この分類は、例えば、項目反応理論を用いた計算により可能である。項目反応理論を適用した前記分類の方法の一例については後述する。なお、行動分類部4は、項目反応理論を用いて分類する方法の他、例えば、各セッションにおける参照Webページ数および各Webページの滞在時間により、各セッションにおける利用者の行動パターンを分類することができる。
参照Webページ数を用いて分類する場合には、例えば、1ページの参照を「一見行動」、2以上6ページ未満の参照を「中行動」、6ページ以上の参照を「長行動」に分類することが考えられる。また、Webページの滞在時間を用いて分類する場合には、例えば、5分未満のセッションを「即離脱行動」、5分以上20分未満のセッションを「標準行動」、20分以上のセッションを「過滞在行動」のように分類することが考えられる。
上記の「丁寧に見た」と「素通り」の行動パターン分類結果により、パターン3以外の各セッション利用者の行動パターンが、パターン1とパターン2に分類される。これにより、行動分類部4は、各セッションの利用者の行動パターンを、上記パターン1〜3のいずれかに分類することができる。
なお、上記パターン1〜3の行動パターン分類は一例であり、行動パターン集合Aに含まれる行動パターンは、これに限られない。行動分類部4は、例えば、アクセス履歴データを基に、各セッションにおける利用者の行動パターンを初心者パターンと熟練者パターンに分類することもできる。
カテゴリ推定部5は、行動分類部4が、分類した行動パターンを基に、各セッションにおける利用者の状態遷移を推定する。各利用者の状態を示す状態データは、カテゴリ記録部16に記録されている。カテゴリ推定部5は、カテゴリ記録部16に記録された状態データと、行動分類部4により分類された各セッションにおける利用者の行動パターンとを用いて、各セッションにおいて利用者の状態がどのように遷移するかを決定する。その際、カテゴリ推定部5は、遷移モデル記録部11に記録されている遷移条件データが示す状態間の遷移ルールと、各セッションにおける利用者の行動パターンとを照合することにより、利用者の状態がどのように遷移するかを決定する。カテゴリ推定部5は、決定した利用者の状態遷移に基づいて、カテゴリ記録部16の状態データを更新する。
図4は、カテゴリ記録部16に記録される状態データの内容の一例を示す図である。図4に示す状態データには、カテゴリ集合S中の未訪問層を除く4つのカテゴリ(低関心層、保留層、躊躇層、成約層)に対して、各カテゴリに属する利用者の人数と、利用者のユーザIDおよび最終アクセス時刻が記録されている。未訪問層のカテゴリについては、未訪問層に属する見込みの人数が記録されている。
例えば、Webサイトによるキャンペーン開始時のように、アクセスログが得られる前の初期段階では、図4に示す状態データにおいては、未訪問層の見込み人数の概算値のみが記録された状態となる。そして、キャンペーン開始とともに、ログ入力部2がアクセスログの読み込みを開始すると、上記のログ抽出部3、行動分類部4、目的行動判定部7により各セッションにおける利用者の行動パターンが計算される。そうすると、カテゴリ推定部5は、行動分類部4による各セッションにおける利用者の行動パターンと、遷移モデル記録部11の遷移条件データとに基づいて、各セッションにおける利用者がどのカテゴリに属するかを決めて状態データに記録する。これにより、状態データには、各カテゴリに属する利用者のユーザIDが記録されていく。また、状態データにおいて、低関心層や保留層や躊躇層や成約層それぞれで記録されたユーザIDの総数は、それぞれのカテゴリの人数として記録される。
ここで、遷移モデル記録部11には、例えば、図2に示した状態遷移図における5つの状態のカテゴリと、各状態間の遷移ルールとを示す遷移条件データが予め記録される。この遷移条件データにより、カテゴリs(s∈カテゴリ集合S)の状態の利用者が、行動パターンa(a∈行動パターン集合A)のセッションを行った後、どのカテゴリに遷移するかを示す遷移ルールの集合が定義される。下記表1は、図2に示した遷移状態図に対応する遷移条件データの内容の一例を示す表である。
Figure 0004962782
上記表1に示す遷移条件データでは、前カテゴリ、セッション内行動パターンおよび後カテゴリが対応付けられて1つの遷移ルールとして記録される。なお、上記表1における「説明」欄は、遷移条件データの内容をわかりやすくするために記載されたものであり、「説明」欄の内容は、遷移条件データとして記録される必要はない。上記表1では、セッション開始前に「前カテゴリ」に属していた利用者が、セッションにおいて、「セッション内行動パターン」の行動をとった場合に、「後カテゴリ」に遷移することを示している。
例えば、上記表1の第1行目では、「未訪問層」の利用者が、初めてWebサイトにアクセスしたときのセッションにおいて、パターン1(丁寧に見た&成約せず)の行動をとった場合は、「保留層」へ遷移するということが定義されている。
すなわち、「前カテゴリ」から「後カテゴリ」へ遷移するための条件となる「セッション内行動パターン」が、遷移ルールとして、様々な「前カテゴリ」と「後カテゴリ」の組み合わせ(遷移元と遷移先の組み合わせ)について記録されている。遷移ルールは、遷移が予想されるカテゴリの組み合わせを網羅するように記録されることが好ましい。なお、遷移条件データの内容は、上記表1に限られない。
ここで、カテゴリ推定部5が、ある1つのセッションにおける利用者の状態の遷移を、上記遷移条件データを用いて推定する場合について説明する。カテゴリ推定部5は、まず、そのセッション開始前の利用者が属していたカテゴリを、カテゴリ記録部16の状態データから取得する。次に、カテゴリ推定部5は、遷移条件データを参照して、取得したカテゴリに一致する「前カテゴリ」の「セッション内行動パターン」と、行動分類部4が分類した当該セッションにおける利用者の行動パターンとを照合する。カテゴリ推定部5は、両者が一致する遷移ルールの「後カテゴリ」を取得し、これをセッション後の利用者が属するカテゴリとして、状態データを更新する。
このようにして、カテゴリ推定部5は、各セッションにおいて、該当利用者がどのカテゴリからどのカテゴリに遷移したかを推定し、カテゴリ記録部16の状態データの情報を更新することができる。これにより、カテゴリ推定部5は、利用者のセッション前後での状態の遷移を推定することができる。そのため、例えば、ログ入力部2が定期的にアクセスログを入力して、ログ抽出部3、行動分類部4、目的行動判定部7およびカテゴリ推定部5が、定期的に動作することで、カテゴリ記録部16の各利用者がどのカテゴリに属しているかを示す状態データがアクセスログに基づいて定期的に更新される。
上記の行動分類部4およびカテゴリ推定部5により、セッション内での利用者の情報閲覧行動を分析、評価する仕組みが提供される。すなわち、行動分類部4およびカテゴリ推定部5は、利用者によるWebサイトの情報の参照行為により、利用者の特性がどう変化するかをアクセスログから読み取り状態データに反映することができる。これにより、例えば、CM、メンバー登録等の何らかのイベントによって変化する利用者特性だけでなく、利用者によるWebページ情報の参照行為等のような利用者自身の能動的な行動によって変化する利用特性が捉えられ、状態データに反映される。
遷移確率計算部6は、状態データを参照することにより、利用者がカテゴリ間で遷移する遷移確率を、一定期間ごとに計算して遷移確率記録部15に記録する。すなわち、遷移確率計算部6は、カテゴリ記録部16に記録されている状態データから、一定期間(単位時間)ごとに、各カテゴリの利用者がWebサイトにアクセスした際のセッションにおいて次のカテゴリに遷移する割合を算出し、記録する。
遷移確率記録部15は、例えば、1日ごとに、各カテゴリの利用者のうち、セッションを開始した利用者の割合を計算する。遷移確率記録部15は、さらに、1日ごとに、セッションを開始した利用者が、セッション前のカテゴリから他のカテゴリに遷移する確率を、遷移前のカテゴリと遷移先カテゴリの各組み合わせについて計算する。これらの計算された1日ごと各カテゴリのセッション開始利用者の割合と、各カテゴリ間の遷移確率は、遷移確率記録部15に記録される。
なお、遷移確率計算部6の遷移確率計算方法は、上記例に限られない。例えば、カテゴリ推定部5は、各セッションについて利用者の状態の遷移を推定する際に、参照した遷移ルールの履歴を示すデータを記録しておき、遷移確率計算部6がそのデータと状態データとを用いて遷移確率を計算してもよい。
図5は、遷移確率記録部15に記録される遷移確率データの内容の一例を示す図である。図5に示す例では、Webサイトのキャンペーンを開始した日(第一日)から、第三日までの日ごとに、各カテゴリについて、事前人数、来訪者数、残数、行動確率、並びに、各遷移先カテゴリの遷移人数および遷移確率が記録されている。事前人数は、その日が始まる時の各カテゴリに属する利用者の人数である。来訪者数は、その日に各カテゴリでセッションを開始した利用者の人数である。残数は、残数=事前人数−来訪者数で計算される。行動確率=来訪者数/事前人数である。遷移人数は、遷移先カテゴリごとの遷移人数であり、遷移確率=各遷移先カテゴリの遷移人数/来訪者数で計算される。
目的行動確率計算部8は、カテゴリ記録部16の状態データを参照して、一定期間(単位時間)ごとに、各カテゴリの利用者がWebサイトのキャンペーンの目的である成約を行う割合を算出し、目的行動確率記録部14に記録する。例えば、目的行動確率計算部8は、状態データから、1日ごとの成約カテゴリへの遷移した利用者の数をカテゴリごとに取得して、各日の各カテゴリについての目的行動確率=成約数/来訪者数を計算することができる。
また、上記例とは別の方法として、目的行動確率計算部8は、目的行動判定部7から、セッションにおいて成約を行った利用者のユーザIDの通知を受け、そのセッション前における利用者の属するカテゴリを状態データから取得することで、各日の各カテゴリにおける目的行動をとった利用者の人数を数え、目的行動確率を計算することができる。
図6は、目的行動確率記録部14に記録されるデータの内容の一例を示す図である。図6に示す例では、Webサイトのキャンペーンを開始した日(第一日)から第三日までの日ごとに、各カテゴリについて、事前人数、来訪者数、行動確率、目的行動人数、目的行動確率が記録されている。事前人数、来訪者数および行動確率は、図5に示す遷移確率データと同じである。目的行動人数は、各カテゴリにおいて、その日に目的行動(成約)を行った利用者の数である。目的行動確率=目的行動人数/来訪者数である。なお、目的行動確率の計算方法はこれに限られず、例えば、目的行動確率=目的行動人数/事前人数であってもよい。
図6に示す例の場合、未訪問層の初期人数が与えられていないので、未訪問層の人数は「未知」として保存する。なお、本実施形態における遷移ルールの場合には、目的行動確率は成約層への遷移確率に一致する。しかし、カテゴリ遷移ルールの定義が異なれば、両者は一致しないこともあり得る。
以上述べたように、カテゴリ推定部5によって、各セッション前後での利用者の状態の遷移が推定されて、状態データに反映される。その状態データに基づいて、遷移確率計算部6および目的行動確率計算部8により、一定期間ごとの利用者の各カテゴリ間における遷移確率、および、各カテゴリの一定期間ごとの目的行動確率が計算され、遷移確率記録部15および、目的行動確率記録部14に記録される。
この構成により、利用者のセッションの繰り返しを継続して観察することが可能になり、利用者の関心度合いのように、セッションの前後で変わりうる状態の変化を示すデータを保存することができる。
例えば、あるWebページの情報を参照した結果、関心をなくした利用者は、次回のセッションでは、さっと素通りするだけであり、継続して関心を維持している利用者は、次回のセッションにも丹念にページを読むはずである。このような複数のセッションに渡る利用者の行動を追跡すれば、例えば、一回目のセッションでWebサイトの情報を丁寧に見た利用者の80%が、次のセッションでも引き続き丁寧に情報を読み、20%が素通りするといった確率が遷移確率記録部6に記録される。
このような確率が一旦算出されると、サイトの運用者は、例えば、利用者の1回目のセッションでの行動パターンを観察することで、その利用者が関心度の高い利用者である確率を推定することができる。
さらに、各カテゴリにおける目的行動確率が記録されるので、サイトの運用者は、各カテゴリにおいて、どの程度の利用者がWebサイト上で目的行動をとるかを把握することができる。すなわち、サイトの運用者は、カテゴリ推定部5で推定される利用者のカテゴリ間遷移と、目的行動との関連を把握でき、目的行動を促すための適切な施策を行うことができる。
以上、図1に示す利用者状態推定システム1の各機能部について説明した。利用者状態推定システム1は、サーバマシン、パーソナルコンピュータ、ワークステーションなどのコンピュータ上に構築される。利用者状態推定システム1を構成する上記各機能部は、1台のコンピュータ上に構成されてもよいし、複数のコンピュータに分散して構成されてもよい。また、ログ入力部2、ログ抽出部3、行動分類部4、カテゴリ推定部5、遷移確率計算部6、目的行動判定部7および目的行動確率計算部8のそれぞれ機能は、コンピュータのCPUが所定のプログラムを実行することによって実現される。したがって、上記各機能を実行するためのプログラムおよびプログラムを記録した記録媒体も、本発明の一実施形態である。また、遷移モデル記録部11、アクセス履歴データ記録部12、目的URL記録部13、目的行動確率記録部14、遷移確率記録部15およびカテゴリ記録部16は、コンピュータが備えるメモリ、ハードディスク等の記録媒体により具現化される。
(利用者状態推定システム1の動作例)
次に、利用者状態推定システム1の動作例について説明する。図7は、利用者状態推定システム1の動作例を示すフローチャートである。以下、図7に示す各ステップについて詳細に説明する。ここでは、一例として、サイトの運用者がWebサイトのキャンペーンの分析を行う際の、利用者状態推定システム1の動作例を説明する。
まず、サイトの運用者により、遷移モデル記録部11の遷移条件データ、目的行動URL記録部13の目的URL、状態データの各カテゴリに含まれる利用者が、事前に設定される(Op1)。遷移条件データは、ここでは、図2および表1で示した遷移条件データが事前に記録される場合について説明する。目的URLとして、例えば、Webサイトのキャンペーンにおいて目的とする成約をする際に、利用者がアクセスするWebページのURLが記録される。状態データとして、Webサイトのキャンペーンの分析を行う前に、すでに確定している、あるいは、推定可能な各カテゴリの利用者が記録される。本例では、図4に示す状態データのうち、新しいキャンペーンを初めて行う場合を想定し、未訪問層の見込み人数のみが設定されるものとする。
事前設定がされ、Webサイトでのキャンペーンが開始されると、ログ入力部2は、Webサイトのアクセスログの読み込みを開始する。アクセスログの読み込みは、一日または一時間等の単位時間ごとに行われる。ここでは、一例として、ログ入力部2は、一日ごとにアクセスログを読み込むものとする。ログ抽出部3は、ログ入力部2が読み込んだアクセスログから、セッションを抽出する(Op2)。ログ抽出部3は、抽出したセッションそれぞれにセッション番号を付与し、図3に示すようなアクセス履歴データを生成して、アクセス履歴データ記録部12に記録する。このとき、アクセス履歴データの目的行動フラグは(0)で記録される。以下のOp3〜Op7の処理は、ログ抽出部3が抽出したセッションそれぞれについて行われる処理である。
目的行動判定部7は、各セッションにおいて利用者が目的行動を行ったか否かを判断する(Op3)。具体的には、目的行動判定部7は、各セッションのアクセス履歴データが示す参照URLの中に、Op1で予め記録された目的URLが含まれるか否かを検査し、含まれる場合は目的行動フラグを(0)から(1)に更新する。また、この場合、目的行動判定部7は、目的行動フラグを(1)に更新したアクセス履歴データのユーザIDの利用者が属するカテゴリを、状態データを参照して特定する。そして、目的行動判定部7は、そのカテゴリに属する目的行動人数を1増やすように、目的行動確率記録部14のデータを更新する。
行動分類部4は、対象セッションにおいて、利用者がキャンペーンのWebサイトを丁寧に見たか素通りしたかを判定する(Op4)。例えば、行動分類部4は、ログ抽出部3が抽出した全てのセッションのアクセス履歴データを、項目反応理論を用いて分析し、各セッションが情報ページを丁寧に見たかどうかを判定することができる。
<項目反応理論を適用して行動パターンを分類する方法の一例>
ここで、行動分類部4が、項目反応理論を適用して、各セッションの利用者の行動パターンを決定する方法について説明する。ここでは、キャンペーンに関連するWebサイト中で利用者が参照可能なWebページの数をm個とする。行動分類部4は、利用者が参照可能なm個のWebページ群それぞれを項目反応理論における各項目とする。以下、m個の項目のうちi番目の項目すなわちi番目のWebページをW(i=1、2、・・・m)と表す。項目WのWebページを参照する確率Pは、2母数ロジスティックモデルにおいて、下記(数1)で示す特性値θの関数で表される。なお、ここでは、行動分類部4が2母数ロジスティックモデルを用いる場合について説明するが、例えば、3母数ロジスティックモデル等のその他IRTモデルが用いられてもよい。
Figure 0004962782
ここで、特性値θは、セッションにおける利用者の関心度合いを示す値とする。aは、項目Wの項目識別力であり、bは、項目Wの項目困難度である。2母数ロジスティックモデルでは、これらのa、bが項目母数となる。
行動分類部4は、項目母数a、bの推定値を、例えば、ベイズ推定法または周辺最尤推定法等を用いて計算する。このとき、行動分類部4は、アクセス履歴データで表される各セッションにおける参照URLを用いて、後述するように、反応パターンベクトルを生成し、項目母数a、bの推定値の計算に用いる。
行動分類部4は、項目母数a、bの推定値を用いて、さらに、各セッションにおける利用者の特性値θを計算し、この特性値θに基づいて、利用者のセッションにおける行動パターンを、「丁寧に見た」および「素通り」のいずれかに分類する。
以下、行動分類部4の具体的な動作例について、図8を用いて説明する。図8に示す例では、行動分類部4は、まず、アクセス履歴データを基に反応パターンベクトルを生成する。図8においてOp11〜Op18が、反応パターンベクトルを生成する処理である。
ここで、アクセス履歴データで表されるセッションの数をnとし、nセッションのうちj番目のセッションをS(j=1、2、3、・・・n)とする。行動分類部4は、m個の項目W〜W(m個のWebページ)に対する、セッションSにおける利用者の反応パターンベクトルU=(uj1、uj2、・・・ujm)を次にようにして生成する。
まず、行動分類部4は、変数jおよびiを、1に初期化する(Op11)。そして、行動分類部4は、項目WのWebページのURLが、セッションSにおいて利用者に参照されたか否かを判断し(Op12)、反応パターンベクトルUの要素ujiを決定する。具体例として、行動分類部4は、項目WのWebページのURLが、セッションSのアクセス履歴データの参照URLのいずれかに該当する場合は、Op12でYesと判断し、反応パターンベクトルUの要素ujiを「1」とする(Op13)。一方、行動分類部4は、項目WのWebページのURLが、セッションSのアクセス履歴データの参照URLのいずれかにも該当しない場合は、Op12でNoと判断し、uji=「0」とする(Op14)。
行動分類部4は、変数iをインクリメントしながら(Op15)、i=m(Op16でYes)になるまで、この処理を繰り返す。これにより、項目W〜Wそれぞれについて反応値、すなわち反応パターンベクトルUの各要素uj1、uj2、・・・ujmが計算される。また、行動分類部4は、Op12〜Op16の処理を、j=1〜nまで繰り返すことにより(Op17、Op18)、すべてのセッションS〜Sについての反応パターンベクトルU〜Uを計算する。
なお、反応パターンベクトルの計算方法は、上記例に限られず、例えば、Op12において、行動分類部4は、各要素の値を決定する際に、セッションSにおいて、所定回数以上(または所定時間以上)参照されたWebページの項目の要素を「1」、セッションSにおける参照回数が前記所定回数に満たない場合(また、参照時間が所定時間に満たない場合)は「0」とすることもできる。また、要素は必ずしも「1」「0」のように2値である必要はない。
行動分類部4は、このようにして求めた反応パターンベクトルU〜Uを用いて、上記(数1)で示される3母数ロジスティックモデルの式における項目母数a〜a、b〜bの推定値の計算し(Op19)、これらの推定値からセッションS〜Sそれぞれの利用者の特性値θ〜θを計算する(Op20)。これにより、各セッションSの利用者の関心度合いを示す特性値θが求められる。Op19およびOp20における項目母数および特性値の計算には、公知の、ベイズ推定法または周辺最尤推定法等を用いて計算する方法を用いることができる。
行動分類部4は、次に、各セッションS〜Sについて、特性値θに基づいて、セッョンSにおいて利用者が丁寧に見たか、素通りしたかを判断する(Op21)。例えば、行動分類部4は、特性値θが設定された閾値(スレショルド)より大きいか場合に、セッションSの利用者の行動分類を「丁寧に見た」と、それ以外の場合は、「素通り」したと決めることができる。また、判断基準となる閾値は、セッションS〜Sそれぞれの利用者の特性値θ〜θの中間値、平均値、または最頻値(並み数)等のように、特性値θ〜θから求められる値であってもよい。
このように、項目反応理論を用いて各セッションにおける利用者の行動を分類することで、Webページごとに重要度を考慮した重みづけをして、利用者が参照したWebページにより、利用者の行動を分類することができる。例えば、キャンペーンに関するWebサイトには、大多数の利用者が読むWebページと、かなり関心の高い人のみが読むWebページがある。項目反応理論を用いることで、このようなWebページの重要度を考慮した重みづけが可能になる。
なお、項目反応理論は、例えば、下記参考文献1で等で紹介されている既存技術であり、テストの受験者の評価等に用いられている理論である。また、項目反応理論をWebサイトのアクセス分析に応用した事例は、例えば、下記参考文献2に記載されている。参考文献2では、項目反応理論を応用し、大学が運営するWebサイトへの来訪者が受験生かどうか推定する方法について述べている。本実施形態における利用者状態推定システム1は、項目反応理論を用いてセッションを分析した結果を使って、さらに、利用者のセッション間の状態遷移を推定するものである。
(参考文献1)豊田秀樹著「項目反応理論(入門編)」朝倉書店、2002
(参考文献2)「IRTによる情報提供型Webサイトのアクセス分析」(橋間智博、FIT2006(第5回情報科学技術フォーラム)、pp.423-425、情報処理学会(IPSJ)と電子情報通信学会・システムソサイエティ(ISS)及びヒューマンコミュニケーショングループ(HCG)合同主催、2006.9.5.
以上、図7におけるOp4の処理の具体例を説明した。行動分類部4は、各セッションにおいて、利用者がWebページの情報を「丁寧に見た」と判断した場合は、そのセッションのアクセス履歴データの行動分類を「1」とし、「素通り」したと判断した場合は「0」に更新する。
次に、行動分類部4は、Op3の目的行動の判定結果およびOp4の分類結果に基づいて、各セッションの利用者の行動パターンを上記の行動パターン集合Aに含まれるパターン1〜3のいずれかに分類する(Op5)。行動分類部4は、アクセス履歴データに記録された行動分類と目的行動フラグに基づいて、各セッションにおける行動パターンを分類することができる。
例えば、行動分類部4は、セッションSのアクセス履歴データにおいて、目的行動フラグが「1」であれば、セッションSの利用者の行動パターンはパターン3(成約)と判断する。さらに行動分類部4は、目的行動フラグが「0」かつ行動分類が「1」(丁寧に見た)であればパターン1に、目的フラグが「0」かつ行動分類が「0」(素通り)であれば、パターン2と判断することができる。
次に、カテゴリ推定部5は、Op5で行動分類部4の分類結果(パターン1〜3)および、遷移モデル記録部11の遷移条件データとを照合することによって、各セッションにおいて、利用者がどのカテゴリに遷移したかを推定する。カテゴリ記録部16に記録された各カテゴリの人数とユーザIDを更新する。
例えば、カテゴリ推定部5が、キャンペーン開始後の第二日目に、ある1つセッションSについてカテゴリの遷移先を推定する場合、まず、そのセッションSのアクセス履歴データからユーザID(例えば、「UID2344」とする)を取得する。そのユーザID「UID2344」を図4に示す状態データ中に検索して、ユーザID「UID2344」の利用者が属しているカテゴリ「低関心層」を取得する。例えば、Op5でのセッションSの利用者行動の分類結果がパターン1(丁寧に見た&成約せず)であった場合、カテゴリ推定部5は、上記表1に示す遷移条件データにおいて、前カテゴリ=「低関心層」であり、かつ、セッション行動内パターン=「パターン1」であるデータの後カテゴリ「保留層」を取得する。取得した後カテゴリのデータ「保留層」が、セッションSにおける利用者の状態の遷移先となる。
このようにして、各セッションにおける利用者の状態の遷移先が決まると、カテゴリ推定部5は、状態データおよび遷移確率データにおける各カテゴリの人数およびユーザID等を更新する(Op7)。例えば、上記例のようにセッションSのユーザID「UID2344」の利用者が「低関心層」から「保留層」へ遷移したと推定された場合、カテゴリ推定部5は、状態データ中のユーザID「UID2344」を示すデータをカテゴリ「保留層」に追加し、状態データ中のカテゴリ「低関心層」におけるユーザID「UID2344」のデータを削除する。カテゴリ推定部5は、さらに、状態データの「低関心層」の人数を1減らし、「保留層」の人数を1増やすように更新する。
また、カテゴリ推定部5は、図5に示す遷移確率データにおける「低関心層」の来訪者数を1増やし、「低関心層」における「保留層」への遷移人数を1増やすように更新してもよい。このような更新は、セッションS〜S全てについて行われる。これにより、図5に示す遷移確率データには、第二日目のセッションS〜Sにおいて、推定された利用者のカテゴリ間の状態遷移が全て反映されることになる。
これにより、各カテゴリ「未訪問層」「低関心層」「保留層」「躊躇層」「成約層」の人数が現在何人いるかが推定され、状態データおよび遷移確率データに反映される。サイトの運用者は、状態データを見て、各カテゴリの人数に応じた施策を実行することができる。例えば、躊躇層が多ければ、サイトの運用者は、さらに割引率を高めてキャンペーンの魅力を高めるといった施策を行う判断ができる。
Op7においてセッションS〜Sにおける利用者の状態遷移が状態データおよび遷移確率データに反映されると、遷移確率計算部6は、各カテゴリの行動確率=来訪者数/事前人数および、他のカテゴリそれぞれへの遷移確率=他のカテゴリそれぞれへの遷移人数/来訪者数を計算し、それぞれ記録する(Op8)。
図5に示に示す遷移確率データの「第二日」の「低関心層」の場合、遷移確率計算部6は、行動確率=来訪者数/事前人数=602/1505=0.4と計算して記録する。また、遷移先が「低関心層」の場合の遷移確率は、「低関心層」への遷移人数/来訪者数=390/602=0.647841となる。同様に、遷移先が「保留層」の場合の遷移確率は、「保留層」への遷移人数/来訪者数=110/602=0.182724、遷移先が「成約層」の場合の遷移確率は、「成約層」への遷移人数/来訪者数=102/602=0.169435となる。
目的行動確率計算部8は、単位時間内に、各カテゴリの利用者のうち目的行動を行った利用者の割合を計算し、目的行動確率記録部14に記録する(Op9)。図6は、目的行動確率記録部14に記録されるデータの内容の一例である。図6に示すデータの「第二日」の「低関心層」の場合、目的行動確率計算部8は、目的行動確率=目的行動人数/来訪者数=102/602=0.169435216と計算して記録する。
上記のOp2〜Op9は、例えば、ログ入力部2がアクセスログを読み込む度に繰り返される。本実施形態では、1日ごとにアクセスログが読み込まれるので、1日1回、Op2〜Op9の処理が実行されることになる。そのため、図5、6に示すように、遷移確率や目的行動確率は一日ごとに計算され、記録されることになる。なお、ログ入力部2がアクセスログを読み込む周期と、遷移確率計算部6および目的行動確率計算部8が遷移確率および目的行動確率を計算する周期とは必ずしも同じである必要はない。
そして、例えば、キャンペーン実施期間の終了等のタイミングで、サイトの運用者から、処理の終了を指示する入力があった場合(Op10でYes)には、利用者状態推定システム1は動作を終了する。以上、利用者状態推定システム1の動作例について説明したが、本発明にかかる利用者状態推定システムの動作は図7に示す上記例に限られない。
図7に示す処理によって、目的行動確率記録部14には、キャンペーンの実施期間中の各日において、各カテゴリの利用者のうち目的とする成約をした人数の割合が記録される。また、遷移確率記録部15には、各日において、各カテゴリにおいてどの程度の割合の人がWebサイトに来訪してセッションを実行し、その後どのカテゴリに遷移するかを示すデータが記録される。そのため、これらのデータは、サイトの運用者にとっては、キャンペーンにおいて、利用者が目的行動に至るまで状態遷移、または、目的行動にまで至らない利用者の状態遷移の様子を知るために有用なデータとなる。また、これらのデータを使って、例えば、後述するように、今後の時間経過の中で、どのようにアクセスが起きて、そのうち何人が成約するかをシミュレーションし、予測することができる。
(第2の実施形態)
図9は、本実施形態にかかる利用者状態推定システムの構成を示す機能ブロック図である。図9において、図1に示す機能部と同じ機能部には同じ番号を付す。図9に示す利用者状態推定システム10は、図1に示す利用者状態推定システム1に、シミュレーション部17、シミュレーションデータ記録部18および初期設定部19が追加された構成である。
すなわち、図9に示す利用者状態推定システム10は、目的行動確率記録部14および遷移確率記録部15のデータを基にして、例えば、未来の利用者のアクセス状況や目的行動確率等をシミュレーションにより予測する機能をさらに備えたものである。
シミュレーションデータ記録部18には、例えば、シミュレーションの初期条件を示すデータ、シミュレーションで用いるデータ、およびシミュレーション結果を示すデータ等が記録される。本実施形態では、各カテゴリの人数遷移をシミュレーションに関連する遷移シミュレーションデータと、各カテゴリの目的行動人数をシミュレーションに関連する目的行動シミュレーションデータとが、シミュレーションデータ記録部18に記録される。
図10は、シミュレーションデータ記録部18に記録される遷移シミュレーションデータの内容の一例を示す図である。図10に示す例では、シミュレーション予測対象となる日(ここでは第一日から第三日まで)の日ごとに、各カテゴリについて、事前人数、行動確率、来訪者数、残数、各遷移先カテゴリの遷移確率および遷移人数が記録されている。これらのうち、第一日の各カテゴリの事前人数は、予め初期条件として設定されるデータである。また、各日の行動確率および遷移確率は、遷移確率記録部15のデータを基に予め設定され、シミュレーションで用いられるデータである。そして、各日の来訪者数と遷移人数が、シミュレーション結果として計算され、記録されるデータである。
図11は、シミュレーションデータ記録部18に記録される目的行動シミュレーションデータの内容の一例を示す図である。図11に示す例では、シミュレーション予測対象となる日(ここでは第一日から第三日まで)の日ごとに、各カテゴリについて、事前人数、行動確率、来訪者数、目的行動確率、目的行動人数が記録されている。これらのうち、第一日の各カテゴリの事前人数は、予め初期条件として設定されるデータである。また、各日の行動確率および目的行動確率は、目的行動確率記録部14のデータを基に予め設定され、シミュレーションで用いられるデータである。そして、各日の来訪者数と目的行動人数が、シミュレーション結果として計算されるデータである。
初期設定部19は、例えば、サイトの運用者等からの入力を受け付け、その入力に基づくシミュレーションの初期条件をシミュレーションデータ記録部18に記録する。初期条件として、例えば、シミュレーション開始時における各カテゴリの人数等が設定される。
シミュレーション部17は、今後、各カテゴリにおいて単位時間あたりにどれだけのアクセスがあり、その結果各カテゴリの人数がどのように変化するか、また、単位時間あたりに何人が目的行動をするか(成約するか)をシミュレーションする。シミュレーション部17は、シミュレーションの際に、シミュレーションデータ記録部18を参照して、各カテゴリの人数と、遷移確率記録部15のデータを基に記録された単位時間あたりの各カテゴリ間の遷移確率と、目的行動確率記録部14のデータを基に記録された単位時間あたりの各カテゴリの目的行動確率とを取得してシミュレーションに用いる。また、シミュレーション結果も、シミュレーションデータ記録部18に記録される。
次に、本実施形態における利用者状態推定システム10の動作例について説明する。図12は、利用者状態推定システム10におけるシミュレーションの流れを示すフローチャートである。図12では、一例として、上記第1の実施の形態において計算された、図5に示す遷移確率および図6に示す目的行動確率を用いてシミュレーションする処理について説明する。すなわち、第1の実施形態でのWebサイトのキャンペーン実施中のアクセスログに基づいて記録された遷移確率および目的行動確率を用いてシミュレーションを行う場合について説明する。
まず、初期設定部19は、シミュレーションの初期条件として、シミュレーション開始時の各カテゴリの人数を設定する(Op31)。図10および図11に示す例では、第一日の事前人数として、未訪問層に3000人、保留層に100人が設定されている。これらの設定値は、例えば、シミュレーションを行うサイトの運用者により決定され、入力される。
このように、サイトの運用者は、例えば、1回キャンペーンを行った後、次のキャンペーンの来訪者を予測する場合には、事前に、既に確定しているあるいは推定可能な各カテゴリの利用者の人数を初期条件として遷移シミュレーションデータに記録しておくことができる。また、全く新しいキャンペーンを初めて行う場合には、全ての利用者は未訪問層となるので、サイトの運用者は、例えば、未訪問層の推定人数のみ定義しておく。図10に示す例は、サイトの運用者が、前回キャンペーン後に保留層が100人残っていて、さらに未訪問層3000人を見込んでいる場合の例である。
また、初期設定部19は、上記キャンペーンにおいて、目的行動確率記録部14および遷移確率記録部15に記録されたデータの中で、行動確率、遷移確率、または目的行動確率に未知の数値があれば、補充するように修正しておく(Op32)。
図5に示す例では、未訪問層の事前人数が未知であるので、初期設定部19は、未訪問層の事前人数を、第一日〜第三日の3日間における未訪問層の来訪者数の合計(2015+1020+510=3545)で代替して、各日の行動確率=来訪者数/事前人数を計算し、図10に示す遷移シミュレーションデータに記録しておく。例えば、第一日の行動確率=2505/3545=0.5684となる。同様に、初期設定部19は、図11に示す目的行動シミュレーションデータの第一日の行動確率および目的行動確率も、図6に示す目的行動確率記録部14のデータを基に計算して、記録しておく。
さらに、図6に示す遷移確率データには、初日の保留者の行動確率は存在しないので、初期設定部19は、例えば、遷移確率データの第二日と第三日の行動確率の平均値を、第一日の行動確率と推定して、遷移シミュレーションデータに記録することができる。
また、初期設定部19は、図6に示す遷移確率データの未知でない行動確率および遷移確率(すなわち第二日と第三日の各カテゴリの行動確率および遷移確率)を、図10の遷移シミュレーションデータの第二日と第三日の各カテゴリの行動確率および遷移確率として、それぞれ設定する。また、初期設定部19は、図5に示すデータの未知でない行動確率および遷移確率を、目的行動シミュレーションデータの第二日と第三日の各カテゴリの行動確率および目的行動確率として、それぞれ設定する。
さらに、図5に示す遷移確率データでは、第一日の低関心層、保留層および躊躇層並びに第二日目の躊躇層の行動確率も未定である。このような場合、初期設定部19は、実績値のある日の平均値を行動確率として採用する。低関心層の場合、二日目、三日目のデータがあるので、これらの平均値((602/1505)+(812/2067))/2=約0.396を低関心層の行動確率としてシミュレーションに用いる。保留層の場合、二日目、三日目のデータがあるので、平均値((398/411)+(402/419))/2=約0.9638を、保留層の行動確率としてシミュレーションに用いる。躊躇層の場合三日目の行動確率のみのデータがあるので、このデータ(0.3)をそのまま一日目〜三日目の行動確率としてシミュレーションに用いる。
また、初期設定部19は、図5に示す遷移確率データの未知でない遷移確率の平均値を
求め、図10の遷移シミュレーションデータの遷移確率として、それぞれ設定する。例えば、未訪問者層から低関心層への遷移確率は、図5の例では3日間ほぼ一定であり、平均をとると((1505/2015)+(774/1020)+(365/510))/3=0.74である。この値をシミュレーションのための未訪問者層から低関心層への遷移確率として用いる。他の遷移パターンの場合も、初期設定部19は、同様に図5に示す遷移確率の平均値を求めて、図10に示すシミュレーションのための遷移確率とする。
また、初期設定部19は、図11に示す目的行動シミュレーションのための行動確率および目的行動確率を、図6に示す各カテゴリの目的行動確率および行動確率から計算することができる。 Op31、Op32の処理が終わると、シミュレーション部17は、変数dをd=1に初期化し(Op33)、シミュレーションの対象とする日数D_MAX(ここでは、一例としてD_MAX=3)を設定する(Op34)。
そして、シミュレーション部17は、シミュレーションデータ記録部18の遷移シミュレーションデータに記録された第d日の各カテゴリの人数と行動確率とを用いて、第d日の各カテゴリの来訪者数を計算する(Op35)。例えば、d=1の場合、図10に示す例において、第一日の未訪問層の来訪者数が、3000×0.568406=1795.219と計算される。
次に、シミュレーション部17は、各カテゴリにおいて、来訪者数と各遷移先カテゴリの遷移確率とを用いて、各遷移先カテゴリの遷移人数を計算する(Op36)。例えば、d=1の場合、図10に示す例において、第一日の未訪問層において、低関心層の遷移人数は1705.219×0.740469=1262.662と、保留層の遷移人数は1705.219×0.213742=364.4763と、成約層の遷移人数は1705.219×0.045789=78.08015と計算される。
さらに、シミュレーション部17は、各カテゴリにおいて、来訪者数と目的行動確率とを用いて、各カテゴリの目的行動人数を計算する(Op37)。例えば、d=1の場合、図11に示す例において、第一日の未訪問層の目的行動人数は1705.219×0.045789=78.08015、低関心層の遷移人数は0×0.39642=0と、保留層の遷移人数は96.38985×0.470137=45.31641と、成約層の遷移人数は0×0.3=0と計算される。
Op35〜Op37の処理は、d=D_MAXになるまで(Op39でYes)、dが1ずつインクリメントされながら(Op38)、繰り返される。本実施形態では、D_MAX=3なので、d=3になるまで、Op35〜Op37の処理が繰り返される。その結果、第一日から第三日までの各日における、各カテゴリの来訪者数、カテゴリごとの遷移人数、および目的行動人数が算出される。
以上、図12に示した処理により、前回キャンペーンから抽出された遷移確率、目的行動確率を利用して、新しくキャンペーンを行う場合の各カテゴリの遷移人数および目的行動人数をシミュレーションし、予測することができる。例えば、過去のキャンペーンと同じキャンペーンを行う場合でも、キャンペーン開始時の各カテゴリの人数が異なれば、その後のカテゴリ人数の変化も異なる可能性がある。本実施形態のように、初期条件として、各カテゴリの人数が前回キャンペーン時とどう変わっているかを推定した情報を予め入力しておけば、前回キャンペーン後の各カテゴリの人数を考慮した、現実に即したシミュレーション結果が得られる。また、本実施形態のシミュレーションでは、カテゴリの人数と単位時間あたりの行動確率および遷移確率とを用いて実行されるので、ユーザID等を用いた個々の利用者の追跡をしなくても、利用者の動向を予測することができる。
なお、本発明にかかるシミュレーションの形態は、本実施形態に限られない。例えば、シミュレーション結果として、各カテゴリの遷移人数および目的行動人数の他に、単位時間あたりの各カテゴリの遷移人数および目的行動人数の変化量を計算することもできる。
本発明は、サーバがネットワークを介して提供するサービスの利用者の動的な状態を、自動的かつ定量的に把握することを可能にする、利用者状態推定システムとして有用である。
第1の実施形態にかかる利用者状態推定システムの構成を示す機能ブロック図 カテゴリの状態と、各状態間の遷移ルールとを概念的に示す状態遷移図 1つのセッションついて抽出されたアクセス履歴データの例を示す図 カテゴリ記録部に記録される状態データの内容の一例を示す図 遷移確率記録部に記録される遷移確率データの内容の一例を示す図 目的行動確率記録部に記録されるデータの内容の一例を示す図 利用者状態推定システムの動作例を示すフローチャート 行動分類部の具体的な動作例を示すフローチャート 第2の実施形態にかかる利用者状態推定システムの構成を示す機能ブロック図 遷移シミュレーションデータの内容の一例を示す図 目的行動シミュレーションデータの内容の一例を示す図 第2の実施形態におけるシミュレーションの流れを示すフローチャート
符号の説明
1、10 利用者状態推定システム
2 ログ入力部
3 ログ抽出部
4 行動分類部
5 カテゴリ推定部
6 遷移確率計算部
7 目的行動判定部
8 目的行動確率計算部
11 遷移モデル記録部
12 アクセス履歴データ記録部
13 記録部
14 目的行動確率記録部
15 遷移確率記録部
16 カテゴリ記録部
17 シミュレーション部
18 シミュレーションデータ記録部
19 初期設定部
21 サーバ
22 アクセスログ記録部
31a、31b 利用者端末
41 インターネット

Claims (6)

  1. ネットワークを介して複数の利用者にサービスを提供するサーバに対してアクセスした複数の利用者それぞれが予め定義された複数の状態のうち、どの状態に属しているかを示す状態データを記録するカテゴリ記録部と、
    利用者がある状態から他の状態に遷移するための条件となる利用者の行動パターンを示す遷移条件データを、前記複数の状態のうち少なくとも2つの状態間の遷移について記録する遷移モデル記録部と、
    前記サーバにアクセスした複数の利用者それぞれを識別するデータと、前記複数の利用者それぞれが参照した情報および参照時間を示すデータとを含むアクセスログを読み込むログ入力部と、
    前記ログ入力部が読み込んだ前記アクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者が一連のアクセスにおいて参照した情報を特定するデータを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出するログ抽出部と、
    前記ログ抽出部が抽出した前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報に基づいて、各利用者の一連のアクセスにおける行動を、予め定義された複数の行動パターンのうちいずれかに決定する行動分類部と、
    前記行動分類部により決定された各利用者の行動パターンと、前記遷移モデル記録部に記録された遷移条件データが示す状態間の遷移の条件となる行動パターンと照合することによって、前記カテゴリ記録部に記録された前記状態データで示される各利用者の状態がどのように遷移するかを決定し、当該決定に基づいて前記状態データを更新するカテゴリ推定部と、
    前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を記録する遷移確率記録部と、
    前記状態データを参照することにより、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を、一定期間ごとに計算して前記遷移確率記録部に記録する遷移確率計算部と、
    前記ログ抽出部が抽出した前記アクセス履歴データから、各利用者が一連のアクセスにおいて、前記サーバが提供するサービスにおいて目的とされている所定の目的行動を行ったか否かを判定する目的行動判定部と、
    各状態における利用者のうちで目的行動を行った利用者の割合を記録する目的行動確率記録部と、
    前記目的行動判定部による前記判定の結果と、前記状態データに基づいて、各状態における利用者のうちで目的行動を行った利用者の割合を、前記一定期間ごとに計算し前記目的行動確率記録部に記録する目的行動確率計算部とを備える、利用者状態推定システム。
  2. 初期条件として、前記複数の状態それぞれに属する利用者の最初の人数を、操作者から入力された指示に基づいて設定し、前記遷移確率記録部に記録された、一定期間ごとの前記遷移確率と、各状態における目的行動をとった利用者の割合とを用いて、前記初期条件で設定された各状態の利用者の人数が、時間経過とともに変化する様子と、各状態において目的行動をとる利用者の人数が時間経過とともに変化する様子とをシミュレートするシミュレーション部をさらに備える、請求項1の利用者状態推定システム。
  3. 前記ログ抽出部は、前記アクセス履歴データとして、前記サーバが提供するサービスにおいて利用者が参照可能な情報単位の集合のうち、利用者が一連のアクセスにおいて参照した情報単位を示すデータを含むデータを、前記アクセスログから抽出し、
    前記行動分類部は、前記利用者が参照可能な情報単位の集合を項目反応理論における各項目とし、前記各項目に対応する情報単位を参照する確率それぞれを、項目母数を用いて、各利用者の特性値θの関数で表したIRTモデルにおいて、項目母数の推定値を、前記アクセス履歴データが示す各利用者が一連のアクセスにおいて参照した情報単位を基にして各項目に対する反応を示す反応パターンベクトルを生成することにより計算し、当該項目母数の推定値に基づいて計算した特性値θに基づいて各利用者の行動パターンを決定する、請求項1に記載の利用者状態推定システム。
  4. 前記ログ抽出部は、前記アクセス履歴データとして、各利用者が一連のアクセスにおいて参照した情報を特定するデータに加えて、各利用者が当該情報を参照した時間を示すデータを含むデータを、前記アクセスログから抽出し、
    前記行動分類部は、前記ログ抽出部が抽出した前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報および当該情報を参照した時間に基づいて、各利用者の一連のアクセスにおけるサービスに対する関心度合いを示す値を計算し、計算した値に基づいて、前記行動パターンを決定する、請求項1に記載の利用者状態推定システム。
  5. ネットワークを介して複数の利用者にサービスを提供するサーバに対してアクセスした複数の利用者それぞれが予め定義された複数の状態のうち、どの状態に属しているかを示す状態データを記録するカテゴリ記録部と、
    利用者がある状態から他の状態に遷移するための条件となる利用者の行動パターンを示す遷移条件データを、前記複数の状態のうち少なくとも2つの状態間の遷移について記録する遷移モデル記録部とを備えるコンピュータが実行する利用者状態推定方法であって、
    前記コンピュータが備えるログ入力部が、前記サーバにアクセスした複数の利用者それぞれを識別するデータと、前記複数の利用者それぞれが参照した情報および参照時間を示すデータとを含むアクセスログを読み込む工程と、
    前記コンピュータが備えるログ抽出部が、前記アクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者が一連のアクセスにおいて参照した情報を特定するデータを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出する工程と、
    前記コンピュータが備える行動分類部が、前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報に基づいて、各利用者の一連のアクセスにおける行動を、予め定義された複数の行動パターンのうちいずれかに決定する工程と、
    前記コンピュータが備えるカテゴリ推定部が、前記行動分類部により決定された各利用者の行動パターンと、前記遷移モデル記録部に記録された遷移条件データが示す状態間の遷移の条件となる行動パターンと照合することによって、前記カテゴリ記録部に記録された前記状態データで示される各利用者の状態がどのように遷移するかを決定し、当該決定に基づいて前記状態データを更新する工程と、
    前記コンピュータが備える遷移確率計算部が、前記状態データを参照することにより、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を、一定期間ごとに計算して前記コンピュータが備える遷移確率記録部に記録する工程と、
    前記コンピュータが備える目的行動判定部が、前記アクセス履歴データから、各利用者が一連のアクセスにおいて、前記サーバが提供するサービスにおいて目的とされている所定の目的行動を行ったか否かを判定する工程と、
    前記コンピュータが備える目的行動確率計算部が、前記目的行動判定部による前記判定の結果と、前記状態データに基づいて、各状態における利用者のうちで目的行動を行った利用者の割合を、前記一定期間ごとに計算し、前記コンピュータが備える目的行動確率記録部に記録する工程とを含む、利用者状態推定方法。
  6. ネットワークを介して複数の利用者にサービスを提供するサーバに対してアクセスした複数の利用者それぞれが予め定義された複数の状態のうち、どの状態に属しているかを示す状態データを記録するカテゴリ記録部と、
    利用者がある状態から他の状態に遷移するための条件となる利用者の行動パターンを示す遷移条件データを、前記複数の状態のうち少なくとも2つの状態間の遷移について記録する遷移モデル記録部とを備えるコンピュータに処理を実行させる利用者状態推定プログラムであって、
    前記サーバにアクセスした複数の利用者それぞれを識別するデータと、前記複数の利用者それぞれが参照した情報および参照時間を示すデータとを含むアクセスログを読み込むログ入力処理と、
    前記ログ入力処理で読み込まれた前記アクセスログから、各利用者による一連のアクセスの開始と終了を検出し、各利用者が一連のアクセスにおいて参照した情報を特定するデータを含むアクセス履歴データを各利用者の一連のアクセスごとに抽出するログ抽出処理と、
    前記ログ抽出処理で抽出された前記アクセス履歴データが示す、各利用者が一連のアクセスにおいて参照した情報に基づいて、各利用者の一連のアクセスにおける行動を、予め定義された複数の行動パターンのうちいずれかに決定する行動分類処理と、
    前記行動分類処理により決定された各利用者の行動パターンと、前記遷移モデル記録部に記録された遷移条件データが示す状態間の遷移の条件となる行動パターンと照合することによって、前記カテゴリ記録部に記録された前記状態データで示される各利用者の状態がどのように遷移するかを決定し、当該決定に基づいて前記状態データを更新するカテゴリ推定処理と、
    前記状態データを参照することにより、前記複数の状態のうち少なくとも2つの状態間の利用者の遷移確率を、一定期間ごとに計算して前記コンピュータが備える遷移確率記録部に記録する遷移確率計算処理と、
    前記ログ抽出処理で抽出された前記アクセス履歴データから、各利用者が一連のアクセスにおいて、前記サーバが提供するサービスにおいて目的とされている所定の目的行動を行ったか否かを判定する目的行動判定処理と、
    前記目的行動判定処理による前記判定の結果と、前記状態データに基づいて、各状態における利用者のうちで目的行動を行った利用者の割合を、前記一定期間ごとに計算し前記コンピュータが備える目的行動確率記録部に記録する目的行動確率計算処理とをコンピュータに実行させる、利用者状態推定プログラム。
JP2007210927A 2007-08-13 2007-08-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム Expired - Fee Related JP4962782B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007210927A JP4962782B2 (ja) 2007-08-13 2007-08-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム
US12/190,150 US8341102B2 (en) 2007-08-13 2008-08-12 User state presumption system, user state presumption method, and recording media storing user state presumption program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007210927A JP4962782B2 (ja) 2007-08-13 2007-08-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム

Publications (2)

Publication Number Publication Date
JP2009048227A JP2009048227A (ja) 2009-03-05
JP4962782B2 true JP4962782B2 (ja) 2012-06-27

Family

ID=40455631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007210927A Expired - Fee Related JP4962782B2 (ja) 2007-08-13 2007-08-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム

Country Status (2)

Country Link
US (1) US8341102B2 (ja)
JP (1) JP4962782B2 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271507B2 (en) * 2004-01-30 2012-09-18 Adgiants, Llc Web-based marketing management system
JP5540879B2 (ja) * 2010-05-17 2014-07-02 トヨタ自動車株式会社 シナリオ生成支援装置およびシナリオ生成装置
JP5508941B2 (ja) * 2010-06-01 2014-06-04 日本電信電話株式会社 滞在目的推定装置、方法及びプログラム
US8429280B2 (en) * 2011-04-28 2013-04-23 Time Warner Cable Inc. Systems and methods for maintaining a measure of session time on a networked device
BR112013030777A2 (pt) * 2011-06-03 2016-12-06 Uc Group Ltd sistemas e métodos para registro, validação e monitoramento de usuários em múltiplos websites
JP5525501B2 (ja) * 2011-09-29 2014-06-18 日本電信電話株式会社 顧客生存率推定システム、顧客生存率推定方法、顧客生存率推定処理サーバおよび顧客生存率推定処理サーバ用プログラム
US9462004B1 (en) * 2011-11-04 2016-10-04 Google Inc. Automatic group assignment of users in a social network
JP2014106661A (ja) * 2012-11-27 2014-06-09 Nippon Telegr & Teleph Corp <Ntt> ユーザ状態予測装置及び方法及びプログラム
JP6025574B2 (ja) * 2013-01-08 2016-11-16 株式会社日立製作所 モニタリングシステム、及び計算機
CN104184601B (zh) * 2013-05-22 2018-09-18 腾讯科技(深圳)有限公司 用户在线时长的获取方法及装置
JP5805169B2 (ja) * 2013-11-25 2015-11-04 ヤフー株式会社 行動パターン分析装置および行動パターン分析方法
US9965521B1 (en) * 2014-02-05 2018-05-08 Google Llc Determining a transition probability from one or more past activity indications to one or more subsequent activity indications
JP6078014B2 (ja) * 2014-02-27 2017-02-08 日本電信電話株式会社 購買意欲学習装置、購買予測装置、方法、及びプログラム
JP6295769B2 (ja) * 2014-03-26 2018-03-20 株式会社豊田中央研究所 人物動態計算装置、人物動態計算システム、及びプログラム
JP5984147B2 (ja) * 2014-03-27 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及び、プログラム
US10530790B2 (en) * 2014-09-25 2020-01-07 Oracle International Corporation Privileged session analytics
US10482404B2 (en) 2014-09-25 2019-11-19 Oracle International Corporation Delegated privileged access grants
JP6608662B2 (ja) * 2015-10-01 2019-11-20 東芝テック株式会社 情報提供装置、および情報提供プログラム
CN106611346A (zh) * 2015-10-22 2017-05-03 北京国双科技有限公司 访客筛选方法和装置
CN106611348A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 异常流量的检测方法和装置
CN106708883B (zh) * 2015-11-17 2020-09-29 阿里巴巴集团控股有限公司 推荐方法及装置
JP6753265B2 (ja) * 2016-10-19 2020-09-09 富士通株式会社 表示制御プログラム、装置、及び方法
JP6680945B2 (ja) * 2017-03-03 2020-04-15 日本電信電話株式会社 ログ分析装置、ログ分析方法およびログ分析プログラム
JP6957275B2 (ja) * 2017-09-05 2021-11-02 株式会社電通 ユーザ施策システム
US10719521B2 (en) * 2017-09-18 2020-07-21 Google Llc Evaluating models that rely on aggregate historical data
JP2020013523A (ja) * 2018-05-16 2020-01-23 オムロン株式会社 情報処理装置、情報処理方法、および情報処理プログラム
CN111126103B (zh) * 2018-10-30 2023-09-26 百度在线网络技术(北京)有限公司 用户人生阶段状态的判断方法和装置
CN111506643B (zh) * 2019-01-31 2023-09-29 北京沃东天骏信息技术有限公司 用于生成信息的方法、装置和系统
WO2020234961A1 (ja) * 2019-05-20 2020-11-26 三菱電機株式会社 状態推定装置および状態推定方法
CN110674434B (zh) * 2019-09-26 2022-03-29 秒针信息技术有限公司 一种浏览资源的投放方法及装置
US20230252500A1 (en) * 2020-07-09 2023-08-10 Nec Corporation Information analysis method
CN113300935B (zh) * 2020-09-15 2023-05-26 阿里巴巴集团控股有限公司 群组处理方法、终端设备、服务端设备及存储介质
CN112882907B (zh) * 2021-04-28 2021-07-20 北京芯盾时代科技有限公司 一种基于日志数据的用户状态确定方法及装置
KR20230135920A (ko) * 2022-03-17 2023-09-26 주식회사 카카오게임즈 게임 런칭 전 사전예약 접속 규모를 예측하는 방법 및 장치

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154767A (en) * 1998-01-15 2000-11-28 Microsoft Corporation Methods and apparatus for using attribute transition probability models for pre-fetching resources
US6839680B1 (en) * 1999-09-30 2005-01-04 Fujitsu Limited Internet profiling
US7610289B2 (en) * 2000-10-04 2009-10-27 Google Inc. System and method for monitoring and analyzing internet traffic
JP2002091852A (ja) * 2000-09-18 2002-03-29 Seino Information Service Co Ltd 閲覧履歴取得方法及び情報提供方法
JP2002197257A (ja) 2000-12-27 2002-07-12 Honda Motor Co Ltd 営業支援システム
JP2003030403A (ja) 2001-07-12 2003-01-31 Sumisho Computer Systems Corp プロファイル収集装置および方法、販売促進支援システム、プログラム、記録媒体
JP2003122982A (ja) 2001-10-10 2003-04-25 Iran Kagi Kofun Yugenkoshi 利用者行動によるネットワーク.マーケティングシステム及びその方法
US8095589B2 (en) * 2002-03-07 2012-01-10 Compete, Inc. Clickstream analysis methods and systems
JP2004303070A (ja) * 2003-03-31 2004-10-28 Fujitsu Ltd 行動モデル簡略化方法
JP2005234689A (ja) * 2004-02-17 2005-09-02 Hitachi Ltd コミュニティ評価支援方法および装置
US7941383B2 (en) * 2007-12-21 2011-05-10 Yahoo! Inc. Maintaining state transition data for a plurality of users, modeling, detecting, and predicting user states and behavior

Also Published As

Publication number Publication date
US8341102B2 (en) 2012-12-25
US20090076995A1 (en) 2009-03-19
JP2009048227A (ja) 2009-03-05

Similar Documents

Publication Publication Date Title
JP4962782B2 (ja) 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム
Bucklin et al. Click here for Internet insight: Advances in clickstream data analysis in marketing
Delafrooz et al. Students’ online shopping behavior: An empirical study
Lambrecht et al. When does retargeting work? Information specificity in online advertising
Seetharaman et al. Investigating household state dependence effects across categories
Bose et al. Quantitative models for direct marketing: A review from systems perspective
Tsiotsou The role of perceived product quality and overall satisfaction on purchase intentions
Bhatnagar et al. Online information search termination patterns across product categories and consumer demographics
Bucklin et al. A model of web site browsing behavior estimated on clickstream data
Rossi et al. The value of purchase history data in target marketing
Allenby et al. Using extremes to design products and segment markets
US20110231246A1 (en) Online and offline advertising campaign optimization
Chang et al. Assessing users' product-specific knowledge for personalization in electronic commerce
US20170270544A1 (en) Techniques for generating a psychographic profile
Fu et al. Effects of membership tier on user content generation behaviors: Evidence from online reviews
KR20160065429A (ko) 하이브리드 개인화 상품추천 방법
JP5170537B2 (ja) 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム
US10672035B1 (en) Systems and methods for optimizing advertising spending using a user influenced advertisement policy
KR102537601B1 (ko) 광고 전략을 생성하기 위한 광고 방법 및 장치
Sonnier The market value for product attribute improvements under price personalization
JP5277996B2 (ja) 解析装置、解析方法及び解析方法のプログラム
JP2021089485A (ja) 広告通知システム、広告通知方法、および情報処理装置
KR102065399B1 (ko) 인공지능 학습 모델을 이용하여 사용자의 행동 데이터를 분석한 결과에 기초하여 사용자의 행동을 유도하는 방법 및 장치
Li et al. Competitive analytics of Multi-channel Advertising and consumer inertia
Abitha Kumari J et al. Impact of consumer behavior pertaining to personalization of price in an e-commerce context

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120301

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120314

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees