JP5170537B2 - 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム - Google Patents

利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム Download PDF

Info

Publication number
JP5170537B2
JP5170537B2 JP2008064670A JP2008064670A JP5170537B2 JP 5170537 B2 JP5170537 B2 JP 5170537B2 JP 2008064670 A JP2008064670 A JP 2008064670A JP 2008064670 A JP2008064670 A JP 2008064670A JP 5170537 B2 JP5170537 B2 JP 5170537B2
Authority
JP
Japan
Prior art keywords
data
user
series
communications
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008064670A
Other languages
English (en)
Other versions
JP2009223423A (ja
Inventor
政志 宇山
陽治 神田
充 織田
理 渡辺
康隆 谷内
高洋 小林
猛 荒兼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008064670A priority Critical patent/JP5170537B2/ja
Publication of JP2009223423A publication Critical patent/JP2009223423A/ja
Application granted granted Critical
Publication of JP5170537B2 publication Critical patent/JP5170537B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

サーバにアクセスした複数の利用者のアクセス履歴を示すデータから、利用者の状態を推定する利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラムに関する。
利用者から要求を示すデータを受信し、その要求に応じたデータ要素を利用者へ送信するシステム(以下、サービスシステムを称する)においては、利用者の要求の内容を基に利用者の特性を分析するための技術が求められている。
例えば、Webサイトにアクセスしている利用者個々人の特性がわかれば、特性に応じて表示するWebページを変更する等の施策を実行することができる。これにより、利用者が購買に至る確率を高めたり、利用者の満足度を高めたりすることができる。店舗での接客のアナロジで考えれば、Webサイト利用者の特性を推定することは、優秀な店員がお客様個人との対話の中で、お客様の嗜好や目的を把握し、適切に誘導することに対応する。
利用者のプロファイル(年齢、性別、職業、居住地等の個人属性)が予め入手できれば、プロファイルに即したセグメンテーションを行い、各セグメントの利用者にそれぞれ異なる広告を提示する等の施策が可能になる。セグメントごとに施策を変えることで、利用者が例えば、商品の購買や資料請求、利用者登録といった、Webサイトが目的とする行動に至る確率を高めることができる。しかし、このような利用者の個人属性を入手するには利用者から事前の承諾を得る必要があり、その使途も予め限定される傾向にある。そのため、利用者の個人属性を利用した施策は困難になってきている。
さらに、Webサイト上で特定商品のキャンペーン等のイベントを行う場合には、年齢や性別といったデモグラフィック(人口統計学的)情報とは別に、商品に対する関心の高さや、理解の高さ、購入意向といった特性を知ることも、重要である。例えば、利用者の商品に対する理解および関心がともに低ければ、広告を強化して商品の知名度をあげる必要がある。一方、利用者の商品理解は高いが関心が低い場合は、商品の値引き等の訴求策を考える必要がある。
従来、利用者の商品理解度や関心度を推定することは、アンケート等の手段で、費用をかけて利用者調査を実施することで可能であった(例えば、非特許文献1の24頁 で紹介されているハワード・シェス・モデル参照)。しかし、アンケート等の実施コストは高い上に、回収結果を得るのに時間がかかる。さらに、利用者の関心の高さや、購入意向は、動的に変わりうる特性である。このため、アンケートで費用と時間をかけて入手した情報が、時間の経過とともに実際の利用者集団の特性と合わなくなることがある。
以上述べたように、利用者プロファイルやアンケート情報は、その用途に制約があり、収集に費用がかかり、かつ利用者の変化に追随できないといった問題があった。このため、近年では、利用者のWeb上の行動そのものから、利用者の嗜好や関心といった特性を捉えてセグメンテーションを行う行動ターゲティング広告という技術分野が注目されている。(例えば、非特許文献2参照)。この非特許文献2において、行動ターゲティング広告 (Behavioral Targeting AD: 略称BTA)は、「WEBサイト上での行動履歴情報をもとにユーザをセグメント化し、そのセグメントに応じて最適な広告を配信する新しいマーケティング手法」とされている。なお、行動を把握することで可能になる施策は広告配信に限られない(例えば、非特許文献3参照)。本明細書では、広告用途に限定せず、行動履歴情報をもとにユーザをセグメント化する技術一般を、行動ターゲティング技術と呼ぶことにする。
例えば、行動ターゲティング技術として、利用者個人を識別するユーザIDごとのURL閲覧履歴を一括管理し、自動車や化粧品といった特定分野のWeb頁を頻繁に閲覧しているユーザIDに対して、特定分野ごとのセグメントIDを割り当てる技術が提案されている(例えば、非特許文献4参照)。このように、同一の利用者を、セッションを越えて長期的に追跡出来ることを前提として、利用者の属性や今までの購買履歴に基づいて、利用者の関心度や理解度の変化を推定する技術は、他にも開示されている(例えば、非特許文献5)。
特開2003−122982号公報 片平秀貴、「マーケティング・サイエンス」、東京大学出版会、1987年初版発行、p.24 デジタル・アドバタイジング・コンソーシアム株式会社、株式会社アイメディアドライブ、"行動ターゲティング広告(BTA)の広告効果を本格的に検証"、[online]、平成19年1月26日、[平成19年6月18日検索]、インターネット、<URL:http://www.dac.co.jp/dacfiles/200701%20BTA_tyousa.pdf> 株式会社ブレインパッド、"アクセスログ解析を利用したレコメンデーションシステム「Rtoaster」"、[online]、[平成20年2月18日検索]、インターネット、<URL:http://www.rtoaster.jp/> 株式会社日経BP、"行動ターゲティング広告を本格化 媒体社、広告主、読者にメリット"、[online]、平成18年8月9日、[平成19年6月18日検索]、インターネット、<URL: http://www.nikkeibp.co.jp/style/biz/net/keyperson/060809_dac/> A.Labbi and C.Berrospi, "Optimizing marketing planning and budgeting using Markov decision prosesses: An airline case study," IBM Journal of Research and Development, Vol.51, No.3/4, 2007, pp.421-432.
しかし、上記のような、ユーザIDがセッションを越えて追跡できることを前提にした技術は、新規顧客を増やすためにキャンペーンを行うような局面では有効ではない。広告等により初めて来訪した利用者の場合には、利用者の属性や過去の購買履歴を使用することができないからである。
そこで、本発明は、利用者の属性や、過去の同一利用者の履歴が利用できるかどうかに関わらず、利用者の目的行動への意思の度合いを、一連の通信における行動のみを基に、より正確に効率よく推定することができる推定システムを提供することを目的とする。
本発明にかかる推定システムは、利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する推定システムであって、前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力部と、一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成部と、前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定部と、前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析部と、前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを記録する分析結果記録部と備える。
上記構成において、マトリクス作成部は、ログデータを用いてマトリクスデータを生成する。マトリクスデータは、各一連の通信において各データ要素が要求されたか否かを示すデータが、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録されたデータである。このため、選定部は、このマトリクスデータを用いて、前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算することができる。さらに、選定部は、この相関を用いることにより、特定のデータ要素と相関を持つデータ群、すなわち目
的行動に関連のある関連データ要素群を選定することができる。そのため、目的行動に関連のある関連データ要素群のデータのみを残した選定マトリクスデータの作成が可能になる。分析部は、選定部で選定された関連データ要素群を項目反応理論における各項目とし、選定マトリクスデータのデータを反応パターンとして用いて、項目反応関数における各一連の通信ごとの特性値θおよびデータ要素ごとの項目母数を計算する。その結果、利用者の目的行動への意思の度合いを示す特性値θおよび各データ要素の難易度および識別力などを示す項目母数が計算される。特性値θは、各一連の通信において利用者から要求されたデータ要素を示すデータに対応付けられて記録される。
これにより、利用者が一連の通信で要求したデータ要素と、利用者の目的行動への意思の度合いを示す特性値θとの対応が明らかになる。そのため、利用者の目的行動への意思の度合いを、一連に通信における利用者の行動により推定することが可能になる。その結果、利用者の個人属性や、同じ利用者の過去の履歴に関する情報が利用できるか否かに関わらず、一連の通信における利用者の目的行動への意思の度合いを推定することが可能になる。
なお、このように項目反応関数を用いて一連の通信ごとの特性値θを計算することにより、実際に特定のデータ要素を要求した利用者ほど高い目的行動への意思を示す特性値θが計算される。また、一連の通信において特定のデータ要素が要求されないパターンについても特性値θが計算され、利用者の目的行動への意思の度合いが得られる。さらに、特性値θを得るために、事前にデータ要素群を内容に応じて分類するなど等のデータ要素の内容を知った人による作業は不要である。そのため、データ要素群の構成に変更が生じても、人による作業を発生させずに、利用者の目的行動への意思の度合いを計算することも可能になる。
さらに、上記構成では、選定部が項目反応理論の各項目として用いるデータ要素を適切に選定した上で、分割部が利用者の目的行動の意思度合いを示す特性値θを計算する。これにより、例えば、項目反応理論の各項目として用いられるデータ要素が不適切であるために、分析部が目的行動の意思の度合いとは全く違う特性を計算してしまうという事態を避けることができる。すなわち、利用者の目的行動への意思の度合いをより正確に効率良く計算することができる。
なお、データ要素は、例えば、サービスシステムが利用者に対して提供するWebサイト中の各Webページのように、利用者からの要求に応じて送信されるデータの単位となる情報を持つデータ単位である。
本明細書に開示された推定システムによれば、利用者の属性や、過去の同一利用者の履歴が利用できるかどうかに関わらず、利用者の目的行動への意思の度合いを、一連の通信における行動のみを基に、より正確に効率よく推定することが可能になる。
本実施形態において、推定システムは、前記分析部で計算された項目母数の標準誤差が所定範囲外である項目を除外項目候補として抽出し、当該除外項目候補を除いた項目について、前記分析部で計算された特性値θの評価値を、所定のテスト情報関数I(θ)を用いて計算し、当該評価値を用いて、前記除外項目候補を除外するか否かを判断する除外判断部をさらに備え、前記分析部は、前記除外判断部が前記除外項目を除外すると判断した場合、前記選定マトリクスデータから前記除外項目を前記のデータ要素のデータを削除して、前記項目母数および前記特性値θを再度算出する態様とすることができる。
除外判断部は、項目母数の標準誤差が所定範囲内の項目を除外項目候補とすることで、あてはめ精度の悪い項目を除外項目候補とすることができる。また、テスト情報関数I(θ)を用いた評価値により、除外項目候補を除外した場合に、項目数が減ることによる精度悪化の有無を判断することができる。その結果、分析部は、項目反応理論の各項目として不適切なデータ要素が除外された選定マトリクスデータを用いて、項目母数および特性値θを算出することができる。
本実施形態において、推定システムは、前記ログデータで示される前記一連の通信の1回目からN回目までに利用者により要求されたデータ要素と、前記分析結果記録部の対応データが示す各一連の通信で利用者が要求したデータ要素とを照合することにより、ログデータで示される一連の通信で利用者がN回データ要素を要求した段階における当該利用者の特性値θNを決定する途中特性推定部をさらに備えてもよい。
途中特性推定部は、ログデータで示される一連の通信における1回目からN回目までに要求されたデータ要素と、分析結果記録部の対応データで示される一連の通信において要求されたデータ要素とを照合する。これにより、前記1回目からN回目までのデータ要素の要求パターンに対応する、対応データ中のデータ要素の要求パターンの特性値θを取得することができる。すなわち、ログデータで示される一連の通信でN回目にデータ要求をした段階における利用者の特性値θNを決定することができる。その結果、ログデータの示す一連の通信で、利用者がN回目のデータ要素を要求した段階おける利用者の目的行動への意思の度合いを示す特性値θNを決定することが可能になる。
本実施形態において、推定システムは、前記途中特性推定部によって計算された各一連の通信における特性値θNとその後の特性値の遷移を示す遷移データを、各一連の通信が行われた時を示す時間データとともに記録する遷移データ記録部と、遷移度データを、所定のイベントが行われたイベント期間の一連の通信と、イベント期間でない通常期間の一連の通信とに、前記時間データを基に分類し、特性値θNが一連の通信においてθAFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて複数通りの特性値θNとその後の特性値θAFTの組み合わせについて計算して、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成し、前記組み合わせそれぞれに前記差異データを対応付けてイベント効果パターンデータとしてイベント効果記録部に記録するイベント効果分析部とをさらに備えてもよい。
これにより、イベント効果記録部には、通常期間とイベント期間とで、利用者の特性値の遷移確率がどの程度異なるかを示す差異データが記録されることになる。そのため、イベントによって利用者の特性値の遷移確率が影響を受ける度合いを示す情報が提供されることになる。すなわち、差異データにより、利用者の目的行動への意思の遷移が、イベントによりどの程度影響を受けるかを示す情報が提供される。
本実施形態において、推定システムは、前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θcを決定する途中意思推定部と、前記途中意思推定部が決定した特性値θcを用いて、予めルール記録部に記録された、利用者の目的行動への意思の度合いに関する情報と対応付けられた利用者への施策の情報を含む施策データから前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えてもよい。
途中意思推定部により、現在ログデータで示される一連の通信の途中における利用者の目的行動への意思の度合いを示す特性値θcが決定される。施策決定部は、特性値θcが示す利用者の目的行動への意思の度合いに対応する施策を示すデータを、ルール記録部の施策データから抽出することができる。そのため、利用者の目的行動への意思の度合いに応じた適切な施策を示すデータをサービスシステムへ出力することができる。
本実施形態において、推定システムは、前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θcを決定する途中意思推定部と、前記イベント効果記録部に記録されたイベント効果パターンデータから、前記途中意思推定部で決定された特性値θcに対応する特性値θNの差異データを抽出し、当該差異データを用いてイベントにより前記特性値θcがどの程度上昇しうるかを示す判断値を生成するイベント効果判定部と、前記判断値を用いて、予めルール記録部に記録された、種々の判断値に対応する利用者への施策を示す情報を含む施策データから、前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えてもよい。
イベント効果判定部は、このイベント効果記録部を参照することで、途中意思推定部が決定した一連の通信の途中における特性値θcに対応する特性値θNについて、遷移確率のイベント期間と通常期間との差異を示す差異データを得ることができる。この差異データにより、イベント効果判定部は、イベントにより通信中の利用者の特性値θの上昇がどの程度見込まれるかを示す判断値を生成できる。施策決定部は、この判断値と特性値θに応じた適切な施策を示すデータをルール記録部から抽出することができ、適切な施策を示すデータをサービスシステムに出力することができる。
コンピュータを上記推定システムとして機能させるためのプログラムおよびそのようなプログラムを記録した記録媒体も本発明の実施形態の一つである。
(第1の実施形態)
[システム全体の概要]
図1は、本実施形態にかかる推定システム1をシステム全体の構成を示す機能ブロック図である。図1に示す推定システム1は、複数の利用者を対象としたWebサイトを提供するサービスシステム2へ接続されている。サービスシステム2は、インターネットに接続されたWebサーバの機能を持つ。インターネットには、複数の利用者の利用者端末3a〜3cが接続されている。利用者端末3a〜3cには、例えば、Webブラウザがインストールされており、複数の利用者は、利用者端末3a〜3cそれぞれのWebブラウザを使って、インターネットを介してサービスシステム2が提供するWebサイトにアクセスすることができる。本実施形態では、一例として、利用者端末3a〜3cとサービスシステム2との通信が、主にHTTPを用いて行われる場合について説明する。
また、Webサイトは、複数のWebページで構成されている。本実施形態では、一例として、この1つのWebページが利用者の要求により利用者に対して送信される1つのデータ要素となる場合について説明する。利用者は、利用者端末3a〜3cのWebブラウザを使ってURLを指定することで、サービスシステム2に対して、当該URLで特定されるWebページを要求することができる。サービスシステム2は、指定されたURLのWebページのデータおよびこれに付随する種々のデータを利用者に対して返信する。
なお、本実施形態では、一例として、1つのURLで特定されるWebページを1つのデータ要素として扱う場合について説明するが、どのようなデータ単位をデータ要素にするかはこれに限定されない。データ要素は、例えば、利用者とサービスシステム間の通信で採用されるプロトコルや、後述する目的行動の種類等に応じて適宜決めることができる。
サービスシステム2は、Webサイトを通じて、例えば、複数の利用者に商品販売等のサービスを提供することができる。本実施形態では、一例として、サービスシステム2によりECサイト(electronic commerce(電子商取引)サイト)が提供される場合について説明する。
なお、サービスシステム2により実現されるサービスの形態は、Webサイトを介したサービス提供に限定されない。例えば、ネットワークを介したASPやその他のクライアントサーバシステムを用いたサービス形態もサービスシステム2により実現されうる。また、サービスシステム2が利用者に送信するデータの内容および形式も特に限定されない。
サービスシステム2は、利用者によるWebサイトへのアクセス履歴を示すログデータをログ記録部4aに記録する。特に、現在アクセス中の利用者のアクセス履歴を示す現在ログデータは、現在ログ記録部4bに記録される。なお、ログ記録部4aおよび現在ログ記録部4bは1つの記録部で構成されてもよい。
推定システム1は、ログ記録部4aまたは現在ログ記録部4bから、Webサイトへの利用者のアクセス履歴を示すログデータを読み込んで、利用者の意思を推定するシステムである。推定システム1は、読み込んだログデータを用いて、利用者の、特定のWebページを参照(要求)する行動(以下、目的行動と称し、前記特定のWebページを目的ページと称する)に対する意思の度合いを分析する。また、推定システム1はこの分析結果を利用して、利用者のイベントによる反応を解析したり、現在アクセス中の利用者の目的行動への意思の度合いを推定して、適切な施策を決定したりする機能も備える。
なお、目的ページは、サイトの目的とするページであり、例えば、サービスシステム2の運用者により、Webサイトの目的に応じて適宜設定される。目的ページの例として、Webサイトにおける購買完了時に「ありがとうございました」と表示するサンキューページ、資料請求のページ、会員登録完了のページなどが挙げられる。なお、目的ページはコンバージョンページと呼ばれることもある。
そのため、推定システム1は、概略的な機能ブロックとして、ログ入力部5、ユーザインタフェース部9、項目反応理論分析部6、イベント効果算出部7および施策指示部8を備える。項目反応理論分析部6にはマトリクス記録部10および分析結果記録部11が、イベント効果算出部7には遷移データ記録部12およびイベント効果記録部13が、施策指示部8にはルール記録部14が含まれる。
ログ入力部5は、ログ記録部4aに記録されたログデータを読み込んで、項目反応理論分析部6およびイベント効果算出部7が利用可能な状態にする。ログデータには、例えば、サービスシステム2と利用者との間の一連の通信(例えば、セッション)における、利用者の参照したURL(要求したデータ要素)、参照した日時(要求した日時)等を示す情報が含まれる。
ここで、一連の通信とは、利用者がサービスシステムにアクセスして何らかのサービスを利用する際に、利用開始から終了までの一連の行動として認識される通信である。このように、利用者の一連の行動を示す一連の通信を認識する方法として、例えば、Webサーバが、Webサイトにおける同一利用者によるアクセスを、1つのセッションとして認識する技術が存在する。なお、どのような通信単位を一連の通信をするかは、サービスシステム2および推定システム1の通信環境や目的に応じて、適宜決定することができる。
項目反応理論分析部6は、ログデータを基にして、項目反応理論を用いて各セッションの利用者の目的行動への意思の度合いを示す特性値θを計算し、分析結果記録部11に記録する。具体的には、ログデータを基に、解析対象のWebサイトに含まれるURL集合(初期集合)の各URLが各セッションで参照されたか否かを示すマトリクスデータが生成され、マトリクス記録部10に記録される。そして、マトリクスデータが項目反応理論を用いて分析され、セッションごとの利用者の目的行動への意思の度合いを示す特性値θ等が計算される。また、項目反応理論分析部6は、分析の対象となるURL集合を適切に選定する機能を備える。これにより、特性値θが利用者の意思度合いをより正確に反映したものとなる。
イベント効果算出部7は、ログデータを読み込み、分析結果記録部11の分析結果を用いて、ログデータで示される各セッションにおける特性値θの遷移状況を示す遷移データを生成し、遷移データ記録部12に記録する。また、遷移データを用いて、キャンペーン等のイベントの実施期間(イベント期間)と通常期間との特性値の遷移の違いから、イベントと特性値の遷移との関係を示すイベント効果パターンデータを生成する。イベント効果パターンデータはイベント効果記録部13に記録される。
施策指示部8は、現在ログ記録部4bから現在ログデータを読み込んで、現在サービスシステム2にアクセス中の利用者の特性値を計算する。そして、施策指示部8は、計算された特性値と、イベント効果記録部13のデータとを用いて、ルール記録部14から利用者の特性値に適した施策を示すデータを抽出し、サービスシステム2へ出力する。すなわち、施策指示部8は、現在Webサイトに来訪中の利用者の途中までの行動から、目的行動への意思の度合いを推定し、その利用者に対して実行すべき適切な施策を選定する。
また、分析結果記録部11、遷移データ記録部およびイベント効果記録部13に記録されたデータは、可視化処理されて、ユーザインタフェース部9で表示されてもよい。これにより、例えば、サービスシステム2の運用者は、推定システム1により計算された利用者の目的行動への意思の度合いを知ることができる。
推定システム1は、サーバマシン、パーソナルコンピュータ、ワークステーションなどのコンピュータ上に構築される。推定システム1を構成する上記各機能部は、1台のコンピュータ上に構成されてもよいし、複数のコンピュータに分散して構成されてもよい。また、サービスシステム2も同様にコンピュータ上に構築される。推定システム1、サービスシステム2、ログ記録部4aおよび現在ログ記録部4bは、1台のコンピュータで構成されてもよいし、複数のコンピュータに機能を分散させて構成されてもよい。
推定システム1のログ入力部5、ユーザインタフェース部9、項目反応理論分析部6、イベント効果算出部7および施策指示部8のそれぞれ機能は、コンピュータのCPUが所定のプログラムを実行することによって実現される。したがって、上記各機能を実行するためのプログラムおよびプログラムを記録した記録媒体も、本発明の一実施形態である。また、分析結果記録部11、遷移データ記録部12、イベント効果記録部13およびルール記録部14は、コンピュータが備えるメモリ、ハードディスク等の記録媒体により具現化される。
[推定システム1の構成]
図2は、図1に示した推定システム1の詳細な構成を示す機能ブロック図である。以下、項目反応理論分析部6、イベント効果算出部7および施策指示部8の構成をそれぞれ順に説明する。
<項目反応理論分析部6の構成>
図2に示すように、項目反応理論分析部6は、マトリクス作成部15、選定部16、分析部17、除外判断部18、マトリクス記録部10および分析結果記録部11を備える。
マトリクス作成部15は、ログ入力部5が読み込んだログデータから、各セッションにおいて利用者が参照した参照URLを検出する。これにより、マトリクス作成部15は、解析対象のWebサイトのURL集合(初期集合)に含まれる各URLが、セッションにおいて参照されたか否かを示すマトリクスデータを生成する。
前記初期集合は、予めマトリクス記録部10に記録される。例えば、サービスシステム2で提供されるWebサイトの各WebページのURLのうち参照頻度が他より多いURLを初期集合とすることができる。初期集合は、例えば、サービスシステム2から取得したWebサイトに含まれるURLを示すデータを基に、マトリクス作成部15が生成してもよい。
生成されたマトリクスデータはマトリクス記録部10に記録される。マトリクスデータは、例えば、各行の要素が各セッションを、各列の要素が各URLを示す行列のデータとすることができる。この場合、各要素の値が、参照したか否かを示す値となる。
選定部16は、マトリクスデータにおける目的ページのURLの列と、他のURLの列との相関係数を計算する。この目的ページは、例えば、運用者がユーザインタフェース部9を介して入力した情報に基づいて決められる。選定部16は、各相関係数に基づいて、初期集合に含まれるURLのうち、目的ページに関連のあるWebページのURLを選択する。選定部16は、マトリクスデータから、前記選択されたURLの列と目的ページの列だけの残し、他の列の要素を除外することにより、選定マトリクスを生成する。これにより、選定部16は、目的ページと相関が弱いWebページのURLを、分析部17の対象から外すことになる。なお、選定マトリクスもマトリクス記録部10に記録される。
分析部17は、選定部16により生成された選定マトリクスを入力とし、各セッションの目的行動への意思の度合いを示す特性値θ、各URLの困難度パラメタ・識別力パラメタの推定値、およびURL参照パターンと特性値θとの対応関係を示す対応データを出力し、分析結果記録部11に記録する。
除外判断部18は、分析部17の計算結果を評価することにより、分析部17で計算される特性値θが利用者の目的行動への意思の度合いをより正確に反映するために、選定マトリクスデータにおけるURL集合の修正が必要か否かを判断する。
具体的には、除外判断部18は、分析部17が計算した各URLの困難度パラメタの推定値の標準誤差を算出し、予め指定したスレショルドTを超える標準誤差を持つURLを、除去すべき削除候補URLとして抽出する。また、除外判断部18は、フィッシャー情報量の算出式を用いてテスト情報関数I(θ)および、テスト情報関数I(θ)の平方根の逆数を算出する。上記抽出した削除候補URLが存在し、かつテスト情報関数の平方根の逆数が予め指定した閾値K(θ)以下である場合に、除外判断部18は、URLを削除する余地があると判断する。
URLを削除する余地ありと判断した場合、除外判断部18は、例えば、標準誤差の最も大きいURLを削除して選定マトリクスデータを再構成する。そして、分析部17は、再構築された選定マトリクスデータを用いて、各セッションの特性値θ、各URLの困難度パラメタ・識別力パラメタの推定値、および対応データを再度計算する。
分析結果記録部11に記録された各セッションの特性値θ、各URLの困難度パラメタ・識別力パラメタの推定値、および対応データは、例えば、グラフ等のような形式で可視化されて、ユーザインタフェース部9を介して、運用者に提示されてもよい。また、対応データは、イベント効果算出部7および施策指示部8の処理で用いられる。
<イベント効果算出部7の構成>
イベント効果算出部7は、途中特性推定部19、イベント効果分析部20、遷移データ記録部12およびイベント効果記録部13を備える。途中特性推定部19は、ログデータが示す各セッションの途中の段階における利用者の特性値を、分析結果記録部11の対応データを参照することにより決定する。
具体的には、ログ入力部5が入力したログデータを参照して、各セッションで利用者が参照した初めのNページのURL参照パターンを抽出する。そして、途中特性推定部19は、抽出したURL参照パターンと、分析結果記録部11の対応データが示す各セッションのURL参照パターンとを照合し、対応する特性値θを取得する。これにより、途中特性推定部19は、ログデータで示される各セッションで、利用者が初めのNページを参照した段階での利用者の特性値θNを決定する。このように計算された各セッションの途中の段階における利用者の特性値θNとその後の遷移を示す遷移データが、セッションごとに遷移データ記録部12に記録される。特性値θNのその後の遷移を示すデータは、例えば、N+X(Xは自然数)ページが参照された段階の特性値またはその変化量でもよいし、セッション終了時の特性値またはその変化量でもよい。
なお、Nの値は、例えば、ユーザインタフェース部9を介した運用者からの入力により、予め設定しておくことができる。例えば、N=4、6、8とNの値を複数段階設定することで、各セッションにおける4ページ目参照、6ページ目参照、および8ページ目参照のそれぞれの段階での利用者の特性値が求められる。
イベント効果分析部20は、遷移データ記録部12の遷移度データを、所定のイベントが行われたイベント期間のセッション集合のデータと、イベント期間でない通常期間のセッション集合のデータとに分割する。そして、イベント効果分析部20は、Nページを参照した利用者の特性値θNがその後セッションにおいて特性値θAFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて計算する。これらの遷移確率は、イベント期間および通常期間それぞれにおいて、複数通りの特性値θNおよび特性値θAFTの組み合わせについて計算される。イベント効果分析部20は、前記組み合わせごとに、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成する。この差異データは、前記組み合わせそれぞれに対応付けられてイベント効果パターンデータとしてイベント効果記録部13に記録される。
具体的には、イベント効果分析部20は、ログデータに記述されている各セッションの日付を用いて、ログデータが示すセッション集合を、通常期間に起きたセッション集合と、イベント期間に起きたセッション集合とに分割する。なお、イベント期間および通常期間は、例えば、ユーザインタフェース部9を介して利用者から、または、サービスシステム2から予め取得して記録しておくことができる。
イベント効果分析部20は、分割された各セッション集合における、途中の特性値θNおよびその後の特性値θAFTそれぞれが、L個に等分割された区間K1〜KLまでのうちいずれに属するかを決定する。そして、セッションの途中でNページ参照した段階で区間Kiに属していた特性値が、その後に区間Kjに遷移する遷移確率を計算する(i、j=1,2,・・・,L)。この遷移確率は、イベント期間のセッション集合および通常期間のセッション集合それぞれについて計算される。また、この遷移確率は、複数通りのN、区間Kiおよび区間Kjの組について計算される。遷移確率は、例えば、「イベントフラグ、区間Ki、区間Kj、遷移確率」を一組のレコードとして記録される。
イベント効果分析部20は、N、区間Kiおよび区間Kjの組それぞれに対して、通常期間の遷移確率とイベント期間の遷移確率との差異(例えば、差分)を計算する。そして、通常期間の遷移確率に対するイベント期間の遷移確率の上昇率(差分)が大きい組から順にソートして、上昇率とともに、イベント効果パターンデータとしてイベント効果記録部13に記録する。イベント効果パターンデータは、例えば、「通常期間の遷移確率(区間Ki、区間Kj、遷移確率)、イベント期間の遷移確率(区間Ki、区間Kj、遷移確率)、上昇率」を一組のレコードとして記録される。
遷移データ記録部12およびイベント効果記録部13に記録されたデータは、例えば、グラフ等のような形式で可視化されて、ユーザインタフェース部9を介して、運用者に提示されてもよい。また、イベント効果記録部13のイベント効果パターンデータは、施策指示部8の処理で用いられる。
<施策指示部8の構成>
施策指示部8は、現在ログ入力部21、途中意思推定部22、イベント効果判定部23、施策決定部24およびルール記録部14を備える。現在ログ入力部21は、サービスシステム2にアクセス中の利用者のセッションの履歴を示す現在ログデータを入力する。すなわち、現在ログ入力部21は、サービスシステム2と利用者端末3a〜3cとの間で現在進行中のセッションの履歴を示すデータをリアルタイムで読み込み、途中意思推定部22で利用可能な状態にする。
途中意思推定部22は、現在ログデータが示す現在進行中のセッションの現段階における利用者の特性値θcを、分析結果記録部11の対応データを参照することにより決定する。具体的には、上記の途中特性推定部19と同様にして、特性値θcを決定することができる。
イベント効果判定部23は、イベント効果記録部13に記録されたイベント効果パターンデータ中の特性値θcに対応するデータを参照し、特性値θcがイベントにより上昇するパターンか否かを判定する。例えば、イベントにより特性値θcがどの程度上昇しうるかを示す判断値が生成される。
施策決定部24は、前記判断値を用いて、ルール記録部14に記録された施策データが示す施策の中から、前記特性値θおよび前記判断値に対応する施策を示すデータを抽出する。抽出された施策を示すデータは、サービスシステム2へ通知される。これにより、サービスシステム2は、利用者の目的行動への意思を向上させるために適切な施策を実行することができる。
なお、ルール記録部14に記録される施策データには、例えば、特性値θおよび判断値の様々な組み合わせにそれぞれ対応する利用者への施策を示すデータが含まれる。
[推定システム1の動作例]
次に、項目反応理論分析部6、イベント効果算出部7および施策指示部8それぞれの動作例を順に説明する。
[項目反応理論分析部6の動作例]
<ログ入力部5、マトリクス作成部15および選定部16の動作例>
図3は、項目反応理論分析部6におけるログ入力部5、マトリクス作成部15および選定部16の動作例を示すフローチャートである。図3において、まず、ログ入力部5がログデータを読み込む(Op1)。図4は、ログデータの内容の一例を示す図である。図3に示すログデータでは、セッションを一意に識別するセッションIDごとに、ホストID、参照日、参照時刻および参照URLが対応付けられている。ホストIDは、利用者端末の識別子である。
セッションIDで特性されるセッションを特定する方法は存在するが、例えば、同一ホストIDの利用者端末からの所定時間以内のアクセスは同一セッションのアクセスとすることができる。この場合、例えば、所定時間t(例えば、t=30分)として、同一利用者による連続する2回のアクセスの時間間隔がt以内の場合は前記2回のアクセスは同一のセッションに含まれると判断され、連続する2回のアクセスの時間間隔が閾値tを超えた場合は、2回目のアクセスは1回目のアクセスとは別の新たなセッションの開始であると判断される。また、この判断に加えて、利用者から明示的なログインの要求によりセッション開始を検出し、ログアウトの要求からセッションの終了を検出することもできる。
次に、マトリクス作成部15は、ログデータに含まれるURL集合のうち、参照頻度が他より高いURLを抽出し、初期集合とする(Op2)。例えば、マトリクス作成部15は、ログデータから、調査対象期間の各URLの参照回数を日ごとに算出し、参照回数が多い順に所定個数のURLを各日ごとに抽出し上位集合とする。マトリクス作成部15は、各日の上位集合をORで結合した和集合を、初期集合とする。このように、各日の参照回数が上位のURLの和集合を初期集合とすることにより、調査対象期間の途中で削除されたURLや新しく追加されたURLも初期集合に含まれるようになる。
マトリクス作成部15は、Op2で抽出された初期集合に含まれる各URLが、各セッションにおいて利用者に参照されたか否かを示すマトリクスデータを生成する(Op3)。図5は、マトリクス作成部15により作成されるマトリクスデータの内容の一例を示す図である。図5に示す例では、マトリクスの各行の要素がそれぞれセッションIDに対応し、各列の要素はそれぞれURLに対応する。そのため、N×n0マトリクスの行数Nは、セッション数であり、列数n0は、初期集合のURL数となっている。マトリクスの各要素は、要素の行に該当するセッションが、列に該当するURLを参照したかどうかを“1”または“0”のフラグで表している。例えば、1行2列目の要素“1”は、セッションID=“SID1”のセッションにおいて、“URL2”が参照されたことを示している。
なお、マトリクス作成部15は、例えば、1つのセッションにおいて所定回数以上(または所定時間以上)参照されたWebページのURLの要素を“1”、セッションにおける参照回数が前記所定回数に満たないURL(また、参照時間が所定時間に満たないURL)の要素を“0”とすることもできる。また、マトリクスの要素は、上記“1”および“0”のフラグの代わりに論理値(TRUE、FALSE)であってもよいし、要素は必ずしも“1”“0”のように2値である必要はない。
選定部16は、Op3で生成されたマトリクスデータにおける目的ページのURLを表す列と、他のページのURLを示す列との相関を算出する(Op4)。例えば、ピアソンの積率相関係数を用いて前記相関を算出することができる。
例えば、商品を販売するためのWebサイトにおいて、目的行動である商品購入の最終確認した後に表示されるサンキューページが目的ページである場合、商品を選択した場合に表示されるページ(商品をカートに入れたことを示すページ)やログインページなどは、目的ページに関連が深いといえる。これに比べて、Webサイトのトップページのように、商品購入意思の有無に関わらず多くの利用者が参照するページは、サンキューページとの関連は浅いといえる。このような各Webページの目的ページに対する関連度合いが、選定部16の前記相関の計算により得られる。
選定部16は、Op4で算出された各列ごとの目的ページURLの列との相関を用いて、目的ページに関連のあるWebページのURLを選定する(Op5)。例えば、選定部16は、相関係数がゼロであるとする帰無仮説を棄却でき、かつ相関係数が負でないURLのみを初期集合から選択する。これにより、目的ページと関連の薄いWebページは、初期集合から除外される。なお、相関の計算方法および相関に基づくURLの選定方法は、上記例に限られない。
選定部16は、Op5で選定されたURLの列以外の列をマトリクスから除外し、選定マトリクスデータを生成する。選定マトリクスデータには、Op5で選定されたURLの列だけが残っている。なお、選定部16は、マトリクスデータを更新して選定マトリクスデータとしてもよい。
上述のように、選定部16が、目的行動と相関のあるURL集合を選択して選定マトリクスデータを生成することで、分析部17による項目反応理論の項目(試験項目)として用いるURL集合を適切に選定することできる。その結果、項目反応理論を用いた目的行動への意思の度合いのより正確な推定が可能になる。また、分析部17の分析対象となるURL集合(項目)が自動抽出されるので、運用者にWebサイトに対する知識がない場合、またはWebサイト構成が期間途中での変更があった場合等でも、利用者の目的行動への意思の度合いの推定が可能になる。
<分析部17および除外判断部18の動作例>
図6は、分析部17および除外判断部18の動作例を示すフローチャートである。図6に示す処理は、図3に示した処理の後に実行される処理の例である。まず、分析部17は、選定部16が生成した選定マトリクスデータに対して、項目反応理論を適用して分析を行う(Op7)。分析部17は、マトリクス記録部10から選定マトリクスデータを読み込んで、各セッションの目的行動の意思の度合いを示す特性値θの推定値、各URLの困難度パラメタおよび識別力パラメタの推定値、並びにURL参照パターンと特性値θとの対応を示す対応データを出力し、分析結果記録部11に記録する。ここで、項目反応理論について説明する。
項目反応理論(Item Response Theory: IRT) は、潜在特性分析の一種であり、試験問題の分析や作成に利用される理論である(参考文献[1][2])。
(参考文献[1])豊田秀樹著「項目反応理論(入門編)」朝倉書店、2002
(参考文献[2])豊田秀樹著「項目反応理論(入門編)」朝倉書店、2002
項目反応理論では、各項目の正答確率が、測定したい特性値を変数とする関数で表される。この関数は項目特性関数と呼ばれる。項目特性関数にいくつかのパラメタを組み込んで、パラメタを計算により推定することにより、測定したい特性値を計算することができる。項目反応理論を用いた複数の項目を含むテストの受験者の特性値(能力)の算定は、例えば、次にようにして行われる。受験者の能力が高いほど項目の正答率が高いという前提に基づき、各項目の難易度をS字曲線でモデル化する。このS字曲線の関数が項目特性関数の一例であり、例えばロジスティック関数が用いられる。そして、S字曲線と各受験者の正答パターン(反応パターン)から、受験者の能力および項目の難易度を同時に推定する。
例えば、各項目の正答率は、能力が低い受験者では0%に近く、能力が高いほど正答率が上昇し、ある程度の能力を超えるとほぼ100%正答すると考えられる。項目反応理論の考え方に従えば、各項目の難易度は、能力θ(未知数)に対するS字曲線でモデル化することができる。例えば、テストの項目の正答確率を受験者の能力θで表した項目反応関数p(θ)は下記式(1)で表される。
Figure 0005170537
上記式(1)は、3パラメタ・ロジスティックモデルの関数である。上記式(1)において、パラメタb は、問題の難しさを決める困難度パラメタである。パラメタ a は、曲線のなだらかさを表すパラメタであり、すなわち、問題が能力の高低を明確に判定する程度を表す識別力パラメタである。パラメタcは、あて推量でも正答する確率で、あて推量パラメタと呼ばれる。これらのパラメタは、項目母数の一例である。
受験者 i の n個の問題に対する反応(正答を1、誤答を0とする)を ui = [ ui 1, ui 2, ... ui j ... ui n] と表記すると、N人の被験者の反応パターン行列U が観察される確率(尤度)は、例えば、下記式(2)で表される。
Figure 0005170537
この尤度を、最大化するパラメタ θ, a, b, c が試験結果Uを用いて推定される。推定には、同時最尤推定法や、周辺最尤推定法等が用いられる。このような項目反応理論による分析を実現するパッケージソフトとして、例えば、オープンソースソフトウエアもしくは市販のライブラリを用いることもできる(例えば、参考文献[3]参照)。
(参考文献[3]) Dimitris Rizopoulos, "ltm: An R package for Latent Variable Modelling and Item Response Theory Analyses," Journal of Statistical Software , Volume 17, 2006, Issue 5, American Statistical Association, (Online Journal http://www.jstatsoft.org/ )
項目反応理論をWebサイト分析に応用する場合、例えば、利用者が各URLを「参照した・しない」の情報をテストの各項目の正答・誤答とみなすことができる。そして、各セッションで利用者が参照したURLを示すデータ(参照URLパターン)を項目反応理論に基づいて分析し、潜在的な目的行動の意思の度合いを示す値θを計算することができる。
分析部17による項目反応理論を用いた計算の例を説明する。ここでは、利用者の目的行動への意思の度合いを示す特性値をθとする。そして、特性値θの利用者がセッションにおいてある1つのURLを参照する確率が、上記式(1)で示した項目反応関数p(θ)で表されるとみなして計算が行われる。さらに、分析部17においては、選定部16で選定された各URLが上記各項目に対応し、各セッションが上記各受験者に対応するように計算がなされる。
具体的には、分析部17は、上記の選定マトリクスデータの行列を、上記式(2)における反応パターン行列Uとして、パラメタθ、a、b、cの推定値を計算する。例えば、選定マトリクスデータの行列が、N行×n列の場合、すなわち、分析対象のURLの数がn、セッション数がNの場合について説明する。この場合、セッションi(i=1、2、・・・、N)におけるURLj(j=1、2、・・・n)に対する利用者の反応(参照の場合“1”、非参照の場合“0”とする)を、ui = [ ui 1, ui 2, ... ui j ... ui n]と表すことができる。さらに、セッションiの利用者の特性値をθi、URLjの項目反応関数p(θ)(上記式(1))における各パラメタをaj、bj、cjとして、分析部17は、上記式(2)におけるθi、aj、bj、cjの推定値を計算する。これにより、i=1、2、・・・Nそれぞれのθiおよびj=1、2、・・・nそれぞれのaj、bj、cjが計算される。
本実施形態では、宛て推量パラメタcjは常にゼロと仮定し、困難度パラメタbjと識別力パラメタajの推定値を計算する場合について以下説明する。
分析部17により、セッションごとの利用者の特性値θiおよびURLごとの困難度パラメタbj、識別力のパラメタajが計算されると、除外判断部18は、上記ロジスティック曲線(項目反応関数p(θ))パラメタaj、bjのあてはめ精度が、予め指定された範囲から外れていないかを判断する(図6のOp8)。
例えば、分析部17は、上記困難度パラメタbjの推定値に加えて標準誤差もさらに出力することができる。図7は、分析部17が出力するaj、bjの推定値およびbjの標準誤差の一例を示す表である。除外判断部18は、各URL(各項目)の困難度パラメタbjについて、標準誤差がスレショルド(例えば、1とする)を超える項目を、削除候補URLのリストに追加する。図7に示す例では、URL5(j=5)の標準誤差“32.6131”がスレショルド“1”を超えているので“URL5”が削除候補URLリストに追加される。このように、標準誤差が大きくなるURLは、θに対する正答率がきれいなS時曲線に該当しないうことであり、当該URLの参照と目的行動の意思との関連に疑いの余地があると考えられる。
なお、削除候補URLの判断は、上記例に限られない。例えば、除外判断部18は、識別力のパラメタajが負の項目(逆転項目)を、削除候補URLとしてもよい。例えば、図7に示す例では、URL3(j=3)の識別力のパラメタa3“−0.189”が負であるので“URL3”が削除候補URLリストに追加される。
また、除外判断部18は、テスト情報関数(統計分野ではフィッシャー情報量と呼ばれる)を計算する(図6のOp9)。テスト情報関数は、あるセッションiの特性値がθiと計算されたときに、θiが実際の特性値θrealとどの程度ずれる可能性があるかを表す関数である(例えば、上記参考文献[1]参照)。
テスト情報量は、テスト情報関数によりθ値ごとに算出される値であり、各項目の項目情報量の和で表すことができる。項目j(URLj)のθiにおける項目情報量Ij(θi)は、例えば、下記式(3)で算出できる。
Figure 0005170537
Dは定数1.7である。ajはURLjに対して算出された識別力パラメタである。pj(θi)は、θiの目的行動への意思を持つ利用者が、URLjを参照する確率をロジスティック曲線モデルから算出したものである。qj(θi)は、逆に、θiの購買意思を持つ利用者が、URLjを参照しない確率である。テスト情報関数I(θi)は、例えば、下記式(4)に示すように、項目情報量Ij(θi)の各項目(j=1〜nまでの)和で表される。
Figure 0005170537
テスト情報量の平方根の逆数 1/√(I(θ))は、θ推定値の標準誤差すなわち(θ推定値の分布の標準偏差)になる。θでの標準誤差が大きい場合には、その領域で目的行動への意思が正確に推定できないことを意味する。例えば、θが中〜低の領域(本実施形態の例ではθ=0.25〜2.0)で大きなずれ(標準誤差)を生じる場合は、あと一押しで目的行動に至る利用者と、全く関心のない利用者との区別が難しくなる。そのため、θの各領域で満遍なく、ずれ(標準誤差)が少ないことが好ましい。
あてはめ精度の悪いURL(すなわち、Op8で抽出された削除候補URL)は、分析部17による項目反応理論の計算からはずすことが好ましいが、一方で、URL集合の要素の数(項目数)が減ると、一般に、テストの測定精度は悪化する。上記のテスト情報量は、このテストの測定精度を示す値である。そこで、除外判断部18は、上記Op8でパラメタのあてはめ精度が悪いと判断されたURLを、分析対象の項目から除外した場合の、テスト情報量の悪化の有無を判断する(Op10)。
例えば、Op8で抽出された削除候補URLが存在し、かつ、Op9で計算されたテスト情報量の標準誤差1/√(I(θ))が予め設定された閾値K(θ)以下の場合に、除外判断部18が、前記削除候補URLの削減余地あり(Op9でNO)と判断する。一例として、所定範囲のθ(例えば、1.0<θ)において、閾値K(θ)=0.5とすることができる。図8は、縦軸に標準誤差1/√(I(θ))、横軸にθとして、除外判断部18によって計算される標準誤差をプロットしたグラフの一例である。図8に示す例では、―0.25<θの範囲で、標準誤差が1以下であり、1.0<θの範囲で、標準誤差が1.0以下になっている。なお、テストの測定精度を判断する方法は、上記のテスト情報関数を用いる方法に限られない。
除外判断部18は、Op9でNOと判断した場合、Op8で抽出された削除候補URLの列を選定マトリクスデータから削除する(Op12)。なお、ここで、削除候補URLのうちの一部(例えば、あてはめ精度が最も悪いURL)が削除されてもよい。そして、前記削除後の選定マトリクスデータに対して、項目反応理論を適用した分析から分析結果の判断まで(Op7〜Op10)の処理が繰り返される。
除外判断部18が、Op9でYesと判断した場合は、削除候補URLの削除せず、Op7で計算された結果を、分析結果記録部11に記録する(Op11)。
分析結果には、例えば、各セッションの目的行動への意思の度合いの推定値、各URLの困難度パラメタおよび識別力パラメタの推定値、URL参照パターンと目的行動への意思の度合いのとの対応データが含まれる。各セッションの目的行動への意思の度合いの推定値は、「セッションID、特性値θ」の組で表すことができる。
各URLの困難度パラメタおよび識別力パラメタの推定値は、例えば、「URL,困難度、識別力」の組で表される。例えば、図7に示したデータ内容から、URL3およびURL6が除かれた内容が困難度パラメタおよび識別力パラメタの推定値として記録される。
URL集合を参照したか否かを示す選定マトリクスの列数(=URL数)をnとすると、対応データは、例えば、「n個の“0”または“1”の要素を持つベクトル、特性値θ」の組で表される。同じ参照パターンを持つ利用者は同じ購買意思推定値を持つことになる。
図9は、対応データの内容の一例を示す図である。図9に示す例では、URL参照パターンを識別するパターンIDと、参照したURLを“1”、参照してないURLを“0”としてURL参照パターンを示すデータと、URL参照パターンに対応する特性値θとが対応付けられて記録されている。パターンIDは、例えば、各セッションに割り振られる。この場合、重複するURL参照パターンには同じパターンIDが割り振られてもよい。
図9に示す対応データにより、セッションにおけるURL参照パターンごとに、特性値θが対応付けられる。例えば、パターンID“P001”で示されるULR参照パターンの利用者、すなわちセッションにおいてURL2およびURL5〜7、・・・のWebページをたどった利用者の目的行動への意思の度合いは、“−0.19827”であることがわかる。
また、対応データに含まれるURL参照パターンには、目的ページを参照していなパターンも含まれる。そのため、セッションにおいて目的行動に至らなかったパターンどうしについても、利用者の目的意思の度合いを比較することができる。
<分析結果の表示例>
ここで、図10および図11に、分析結果の表示例を示す。図10は、各セッションの目的行動への意思の度合いの分布を示すヒストグラムの表示例である。図10に示すヒストグラムは、縦軸がセッション数、横軸が特性値θを示す。図10に示すヒストグラム中で、黒色で示した部分Mは、利用者が目的行動に至った(目的ページを参照した)セッションを示す。すなわち、実際に目的行動を行った利用者ほど、目的行動への意思の度合いを示す特性値θが高いことが示されている。また、各特性値θには、上記対応データによりURL参照パターンが対応付けられている。目的行動が全く起きなかった行動パターン(図10の領域S)においても、目的行動への意思の度合いの高低を比較できる。
図11は、項目特性曲線(ICC:Item Characteristic Curvesとも呼ばれる)のグラフの表示例である。URLiの項目特性曲線は、例えば、上記式(1)に示すロジスティック関数に、識別力パラメタaj、困難度パラメタbjを代入した式で示される曲線(S時カーブ)である。グラフの縦軸は確率を、横軸は特性値θを示す。グラフにおける曲線gは、目的ページのURLの項目特性曲線である。このグラフを運用者が見た場合には、例えば、実際に目的ページに相当するURLを参照する利用者よりも、目的行動への意思の度合いが低い利用者が、どのようなURLを参照する可能性が高いかを把握することができる。
<項目反応理論分析部6による効果>
以上の図3、図6に示した項目反応理論分析部6における処理により、購買行動と相関のある適切なURL集合を用いて、項目反応理論に基づく分析が行われるので、実際に購買行動を行った利用者ほど高い「購買意思」を示すことになる。目的ページURLを示す情報が予め設定されるだけで、Webサイトの利用者の目的行動への意思の度合いを示す情報が得られる。そのため、運用者は、目的ページURL以外のサイト構成に関する知識は一切持っていなくても、意思を推定できる。また、テスト情報関数を用いてテスト精度を検証しているので、直接目的行動が起きないような行動パターン(URL参照パターン)についても、利用者の目的行動への意思を相対的に評価することが可能になる。
また、分析部17は、上記のように、IRT(Item Response Theory)モデルを用いて、各セッションにおける利用者の特性値θを計算することにより、URLごとの重みの違いを加味して、セッションにおける利用者の目的行動の意思度合いを示す特性値θを計算することができる。
また、項目反応理論では、受験者が正答した問題を示すデータ(正答パターン)の集合を用いて、能力の高い受験者の集団から能力の低い受験者の集団まで、能力の連続的な指標で評価できる特長がある。上述のように、テストの項目に相当するURL集合を適切に選定した上で、Webサイト利用者の「目的行動(例えば、購買)への意思」の分析に項目反応理論を用いれば、目的行動に至らない参照URLパターンについても意思の高低を判定することができる。例えば、購買促進の観点から見て、あと一押しすれば購買に至る利用者の層と、全く購買する気のない利用者の層とを区別することが可能になる。
また、項目反応理論には、「複数のテスト間の結果の比較が容易」という特長がある。WebサイトのURL構成が途中で変化する場合、テストの問題の項目集合が変化する場合に対応する。そのため、テストの問題の項目集合に相当するURL集合を適切に選定した上で、Webサイト利用者の「目的行動意思」の分析に項目反応理論を用いれば、サイトのURL構成が途中で変化したとしても、前記変化で削除された過去の該当URLと新規に現れた該当URLとの関係を、変化の前後で共通に存在するURLと該当URLとの関係から算定することができる。このため、期間途中でのサイト構成変更により過去に作成したモデルが有効でなくなる、といった問題の解決が見込まれる。
上記算定には、例えば、上記参考文献[1]の7.2節に記載されている共通項目法を用いることができる。URL構成を変更する前のログをログ1、変更後のログをログ2とする。本実施形態において項目反応理論を用いてログ1を分析して得られるパラメタを θi, aj, bj 、ログ2を分析して得られるパラメタを θ*i, a*j, b*j とする。iはセッションの番号、jはURLの番号である。また、このとき、ログ1とログ2に共通して存在する項目に関しては、
θ*i = K θi + L ――――(5)
a*j = (1/K) aj ――――(6)
aj = K bj + L ――――(7)
が成り立つ。上記式(5)〜(7)における未知パラメタ K, L の推定値 K´, L´は次の式(8)(9)で得ることができる。そのために、項目反応理論分析部6で分析されるURL集合のうち、ログ1とログ2に共通に存在するm個のURLに関して、b*j の平均と標準偏差、bjの平均と標準偏差を求めておく必要がある。
K´ = (b*jの標準偏差)/(bjの標準偏差) ――――(8)
L´= (b*j の平均) − K´ (bj の平均) ――――(9)
これにより、K,Lの推定値、K´, L´が求まる。これらのパラメタを、例えば上記式(5)〜(7)にあてはめることで、ログ2で新たに増えたURLの困難度、識別力や、セッションのθ値と、ログ1のURLの分析結果との関係が明らかになる。そのため、ログ2で新たに増えたURLの困難度、識別力や、セッションのθ値についても、ログ1の分析結果上に変換して比較することができる。
[イベント効果算出部7の動作例]
イベント効果算出部7は、セッション途中までのURL参照パターンを解析し、URL参照パターンを基に、キャンペーン等のイベントを実施した場合の効果を分析する。なお、イベントは、限定された期間に利用者に対して実施される施策である。イベントは、サービスシステム2を介して利用者にサービスまたは情報を提供することにより実施される場合も、サービスシステム2を介さずに行われる場合もある。イベントの例として、商品値引きキャンペーン、入会無料キャンペーン、バーゲン等が挙げられる。
本動作例においては、イベント効果算出部7は、入力データとして、項目反応理論分析部6が出力したURL参照パターンと特性値θの対応データと、ログ入力部5が入力するログデータを用いる。その他、入力パラメタとして、目的行動の意思をセッションの何ページ参照した時点で計算するかを示すNの値、特性値θの区間を示す情報、および通常期間とイベント実施期間(以下、イベント期間と称する)を示すデータが使用される。特性値θの区間を示す情報は、例えば、特性値θのとり得る範囲を、いくつかのセグメントに分割するための分割方針を示す情報である。上記入力パラメタは、例えば、ユーザインタフェース部9を介して、運用者から入力されてもよい。
以下に示す例は、N=4,6,8であり、θの区間の分割については−1≦θ≦4の範囲が20の区間に分割される場合の例を説明する。この場合1区間の幅は0.25になる。
図12は、イベント効果算出部7における途中特性推定部19およびイベント効果分析部20の動作例を示すフローチャートである。図12に示すように、まず、途中特性推定部19は、ログデータから、各セッションの初期Nページまでの参照URLを抽出し、Nページ参照した段階での利用者の特性値θNを決定する(Op21)。
Op21において、途中特性推定部19は、ログデータから抽出した各セッションの初期Nページまでの参照URLパターンと、分析結果記録部11に記録された対応データの参照URLパターンとを照合する。Nページまでの参照URLパターンと一致する参照URLパターンに対応する特性値θがθNとなる。すなわち、途中特性推定部19は、ログデータが示すセッションにおけるNページまでの利用者の行動(参照URLパターン)に対応する特性値θを、対応データから取り出し、θNとして当該セッションに割り当てる。
各セッションのθNは、遷移データ記録部12にセッションごとに遷移データとして記録される。遷移データとして、各セッションのθNの他に、セッションが行われた時を示すデータ、Nページ参照より後の特性値θAFT、並びにθNおよびθAFTぞれぞれの属する区間が記録される。
図13は、遷移データの内容の一例を示す図である。図13に示す例では、セッションID、日時、参照URL数、θEND、目的行動、θ4、θ6、θ8それぞれの区間(s1、s2、s3)、およびθENDの区間sTが、セッションごとに記録されている。θENDは、セッション終了時の最終的な利用者の特性値である。“NA”は、該当URL回数に到達する前にセッションが終了したことを示す。例えば、1行目のセッションID=“SID1”のデータが示すセッションは、利用者が6ページ目のURLを参照した後、8ページ目のURLを参照する前に終了している。
日付は、セッションが行われた時の日付であり、ログデータから取得可能なデータである。参照URL数は、セッションにおいて利用者が参照したURLの数である。目的行動の列のデータは、目的ページを参照したか否かを“0”または“1”の2値で示すデータである。s1、s2、s3およびsTの例においては、θの区間がK1〜K20で表される。−1≦θ≦4の範囲を20等分してできる各区間を値の小さい方から順にK1、K2、K3、・・・、K20としたものである。例えば、K1は−1≦θ<−0.75の区間、K2は−0.75≦θ<−0.5の区間をそれぞれ表す。
遷移データが記録されると、イベント効果分析部20は、遷移データで示されるセッション集合を、通常期間のセッションと、イベント期間のセッションに分類する(図12のOp23Op)。例えば、遷移データに含まれる各セッションの日付が、イベント期間内のものか否かを判断することにより上記分類が可能である。
イベント効果分析部20は、特性値θNがその後に特性値θAFTに遷移する遷移確率を、イベント期間と、通常期間それぞれについて計算する。(Op23)。例えば、イベント効果分析部20は、セッションにおいてNページを参照した段階で区間Kiに属していた特性値が、次の段階で区間Kjに遷移する遷移確率を計算する。この遷移確率は、イベント期間のセッション集合および通常期間のセッション集合それぞれについて計算される。また、この遷移確率は、複数通りの「N、区間Ki、区間Kj」の組について計算される。例えば、K1からK20までのそれぞれの区間から、K1〜K20の各区間への遷移確率が算定される。算出結果は、例えば、「イベントフラグ、区間Ki、区間Kj、遷移確率」を一組のレコードとして記録される。イベントフラグはイベント期間と通常期間の区別を示す。
例えば、N回目のURL参照段階での特性値θ8の区間がK5である場合に、その後の遷移確率を計算するには、図13に示す遷移データのうち、s8がK5であるセッション(SID5、SID9)の次の段階の区間sTの値(K5、K6)が用いられる。
次に、イベント効果分析部20は、「区間Ki、区間Kj」の組み合わせそれぞれについて、通常期間とイベント期間との遷移確率の差分を計算する(Op24)。そして、イベント期間の遷移確率の通常期間に対する上昇度(差分)が大きい組から順にソートする。そして、上昇度の降順にソートされた「通常期間(区間i, 区間j,確率)、イベント期間(区間Ki,区間j,確率)、上昇率」の組のリストをイベント効果パターンデータとして生成し、イベント効果記録部13に記録する(Op25)。
図14は、イベント効果パターンデータの内容の一例を示す図である。図14に示す例では、イベント種類、イベント期間、(通常期間s8、通常期間sT、遷移確率)、(イベント期間s8、イベント期間sT、遷移確率)および上昇率が、s8とsTの組み合わせごとに記録されている。なお、図14に示す例では、s8の区間と最終の区間との間の遷移確率に関するデータのみであるが、例えば、s6の区間と最終の区間との間や、s4の区間とs6の区間との間等のように他の区間の組み合わせに関するデータも記録されてもよい。
このようなイベント効果パターンデータでは、セッションにおける特性値θの遷移パターンのイベントの有無による違いが上昇率で示されている。また、様々な遷移パターンについての上昇率が記録される。そのため、イベント効果パターンデータにより、特性値θ(すなわち、利用者の目的行動への意思の度合い)の遷移パターンと、イベントによる効果との対応関係が明らかになる。
<イベント効果パターンデータの表示例>
図15は、イベント効果パターンデータをグラフにして表示する場合の表示例を示す図である。図15の左側のグラフは、最初の8ページを参照した段階(N=8)での、通常期間の「Ki,Kj, 確率」をグラフに表したものである。図15の右側のグラフは、10%割引イベント期間の「Ki,Kj,確率」をグラフに示したものである。これらのグラフは、縦軸に8ページ参照段階での特性値θ8の区間K1〜K20、横軸に最終的な特性値θENDの区間K1〜K20をとり、遷移確率を2次元平面上に表したものである。図15に示す例では、ハッチングが細かさにより遷移確率が示されている。例えば、ハッチングが細かい程(色が濃いほど)遷移確率が高いことを意味している。
これらのグラフに示される例では、θ8が0.25以下の利用者は、割引イベントの有無に関わらずθの伸びは少ない。この層の利用者は、割引イベントを実施しても目的行動に至る可能性は低いと判断できる。
一方、θ8が1以上の利用者は割引イベントの有無に関わらず、最終的なθENDは高い。この層の利用者は、割引イベントを実施しなくても目的行動に至る可能性は高いと判断できる。
10%割引イベントの有無で、最も目的行動の意思の度合いθの上昇が大きいのは0.25<θ8≦1(区間K6〜K8)である。すなわち、8ページ参照段階で、この区間K6〜K8の特性値を持つ利用者は、通常期間には、最終的な目的行動意思の特性値θENDが1.25以上になる確率は17%である。これに対して、割引イベント期間には、最終的な目的行動意思の特性値θENDが1.25以上になる確率が29%にのぼっている。このことは、図15の下段のグラフにおける破線で囲まれた領域Yにも表れている。
このように、イベント効果パターンデータを示すグラフがユーザインタフェース部9を介して、運用者に提示されることで、運用者は、例えば、セッションにおいて、どのような行動をする利用者にイベントを実施すれば効果があるかを判断することができる。
<遷移データの表示例>
遷移データ記録部12の遷移データも、ユーザインタフェース部9を介して運用者に提示することができる。図16は、遷移データの表示例を示す図である。図16には、2、4、6および8ページぞれぞれの参照段階における利用者の特性値の分布を示すヒストグラムの例を示す。これらのヒストグラムにおいて、縦軸はセッション数、横軸は特性値を示す。
このようなヒストグラムが表示されることにより、運用者は、全利用者の目的行動への意思の度合いがどのように遷移するかを捉えることができる。例えば、図16に示す例では、参照URL数が増えるにしたがって、ヒストグラムの高さは全体的に低くなっている。これにより、例えば、参照URL数が増えるにしたがって終了するセッションが多くなることがわかる。また、参照URL数が増えるにしたがって、高い特性値を持つ利用者の割合が増えているので、特性値は参照URL数に従って単調増加していることがわかる。
[施策指示部8の動作例]
本動作例で、施策指示部8は、現在ログ記録部4bの現在ログデータ、およびイベント効果記録部13のイベント効果パターンデータを入力し、実施施策を表す施策コードをサービスシステム2に対して出力する。
図17は、施策指示部8の動作例を示すフローチャートである。まず、現在ログ入力部21がサービスシステム2から出力される現在ログデータをリアルタイムで入力し、途中意思推定部22へ渡す(Op31)。例えば、利用者端末3a〜3cからサービスシステム2へURL参照の要求が送信される度に、そのURL参照に関するログデータが新たに生成される。ログデータが新たに生成される度に、現在ログ入力部21は、現在ログ記録部4bを介して受け取り、途中意思推定部22へ渡す。なお、現在ログ入力部21は、現在ログ記録部4bを介さずにサービスシステム2から直接現在ログデータを受信してもよい。
途中意思推定部22は、現在ログデータで示される各セッションで、Nページ目のURLが参照されたか否かを判断する(Op32)。ここで、Nの値は、例えば、上記のイベント効果算出部7の動作例での値(N=4、6、8)と同じ値が用いられる。この場合、途中意思推定部22は、現在ログデータで示されるセッションにおいて利用者が4ページ目、6ページ目または8ページ目を参照したことを検出する。
Op32でNOの場合は、現在ログ入力(Op31)が繰り返される。Op32でYESの場合、途中意思推定部22は、現在ログデータから検出されたNページ目までのURLの参照パターンと、分析結果記録部11の対応データのURL参照パターンとを照合し、Nページ目のURL参照段階の利用者の特性値θcを決定する(Op33)。すなわち、現在ログデータが示す現在サービスシステム2へアクセス中の利用者の、セッションの途中(Nページ目参照段階)までの行動から、対応データに基づき、現時点での特性値θNCを算出する。
Op33で、イベント効果判定部23は、Op32で決定された特性値θNCにと、イベント効果記録部13に記録されたイベント効果パターンデータを用いて、目的行動への意思の度合いを示すθNCが、イベントによりどの程度上昇するか判定する(Op34)。例えば、θNCがイベントにより目的行動への意思が上昇するパターンか否かが判定される。
具体的には、イベント効果判定部23は、イベント効果パターンデータで示される特性値θの遷移パターンのうち、N番目のURL参照段階からの遷移パターンであって、θNCの属する区間からそれより上の区間へ遷移する遷移パターンのデータを参照する。そのような遷移パターンそれぞれの上昇率に基づいて、イベントによりどの程度上昇しうるかを示す判断値を生成する。例えば、上昇率が所定の閾値を超える遷移パターンが一定割合異常占める場合は、イベント効果有りを示すフラグを判断値とすることができる。なお、判断値は上記例のフラグに限られない。例えば、上昇率の平均値や、最高上昇率等を判断値としてもよい。
イベント効果判定部23は、ルール記録部14に記録された施策データを参照し、この判断値その他、利用者の目的意思の度合いθNCに関する情報にマッチする施策を示す情報を抽出する(Op35)。ルール記録部14の施策データは、例えば、判断値およびθNCに関する条件を示すデータと、それぞれの条件を満たす場合の施策を示すデータとが対応付けられて記録されたデータである。
下記表1は、施策データの内容の一例を示す表です。下記表1では、条件、施策および施策コードが、条件と施策の組み合わせごとに、対応付けられて記録されている。
Figure 0005170537
施策決定部24は、例えば、判断値およびθNCが、施策データの条件に合致する場合の対応する施策の施策コードを取得し、サービスシステム2へ出力する(Op36)。なお、施策決定部24は、例えば、Op33で計算されたθNCのセッションのセッションIDを、施策コードとともに出力してもよい。これにより、サービスシステム2では、現在セッションの途中の特性値θNCを持つ利用者に対して、適切な施策を施すことができる。
例えば、セッションの途中までの行動に基づいてこのセッションの利用者は10%割引イベントにより目的行動への意思が増大すると判断された場合に、追加の割引10%を利用者に提示するといった施策が可能になる。このような施策は、例えば、上記表1の1行目に示す「割引イベント効果あり AND 上昇率>20% ならば 10%追加割引提示」といった施策データを記録しておくことで可能になる。
また、利用者のθNCと判断値に基づいて計算資源の前記利用者への優先度を変更する施策を行うこともできる。例えば、冷やかしと思われる利用者に対しては、前記利用者からの要求に対するサービスシステム2の処理のスピードを遅くするといった施策も考えられる。この場合、例えば、上記表1の3行目に示すような「N>4 AND θN<−1 AND 全てのイベント効果なし ならば 計算処理優先度10%減」といった施策データを記録しておくことで可能になる。
なお、施策データに記録される条件の内容は特に限定されない。上記判断値、θNC、イベント効果パターンデータに記録された遷移確率や上昇率等のデータに基づいて、利用者の目的行動への意思の度合いに応じた施策を決定できる条件が適宜設定される。
ここで、上記のOp31〜Op36の処理の具体例を、図14および表1を参照しながら説明する。例えば、現在ログデータが示すセッションS1のURL参照履歴が、URLA→B→A→C→A→C→B→Dと、8ページ(N=8)の参照パターンを示している場合であって、Op33で、θ8C=“0.28”と算出された場合について説明する。
イベント効果判定部23は、図14のイベント効果パターンデータにおいて、θ8(N=8)の段階における特性値の区間(s8)が“0.28”の属する区間=“K6”である遷移パターンのデータを参照する。図14に示す例では、1段目のデータが、N=8の段階の区間s8が “K6”であり、これが最終段階(sT)で “K10”へ遷移する遷移パターンのデータである。このデータは、8ページ参照した段階s8で区間K6の利用者が、セッション終了した段階sTで区間K10に遷移する遷移確率は、10%割引イベントにより0.19(19%)分上昇することを示している。このように上昇率が0より大きい場合に、イベント効果判定部23は、10%割引イベントによる効果ありを示すフラグを判断値として生成することができる。
施策決定部24は、この「10%割引イベントによる効果ありを示す判断値、θ8C=“0.28”、上昇率=“0.19”」の組み合わせが施策データに記録された条件を満たすか否かを判断する。上記表1の施策データの例では、上記組み合わせがマッチする条件はない。このような場合、施策決定部24は、サービスシステム2に施策コードを出力しない。そして、Op31の現在ログデータの入力処理が繰り返される。
また、別の例として、現在ログデータが示すセッションS1のURL参照履歴が、8ページ(N=8)のURL参照パターンを示している場合であって、Op33で、θ8C=“0.52”と算出された場合について説明する。N=8であり、かつ“0.52”は区間“K7”に属するので、施策決定部24は、図14に示すイベント効果パターンデータのうち、s8が“K7”である2〜4行目のデータを参照する。2、3、4行目のデータは、それぞれK6からK11、K10、K12に遷移する遷移パターンを示している。これらの3つの遷移パターンは、いずれも上昇率が0より大きいので、イベント効果判定部23は、10%割引イベント効果ありを示す判断値を遷移パターンごとに生成する。
図14に示す例では、N=8における特性値が区間“K6”から“K11”へ遷移する遷移パターンにおいて、イベント期間の遷移確率が“0.34”、上昇率は“0.14”である。さらに、この遷移パターンの判断値は「10%割引イベント効果あり」を示す。そのため、この遷移パターンは、上記表1の2行目の条件「割引イベント効果あり AND イベント期間の遷移確率>20% AND 上昇率>5%」にマッチする。そのため、施策決定部24は、「10%追加割引提示」の施策コード“01”を、ルール記録部14から取得して、サービスシステム2へ送信する。
なお、施策データで示される施策は、サービスシステム2により実行可能な施策に限られない。例えば、購買意思(目的行動意思)の低い利用者からの問い合わせメールに対しては、サポート要員からの返答を後回しにするといった人的資源の優先度を変更する施策も有り得る。このような場合、例えば、「N>4 AND θN<−1 AND 全てのイベント効果なし ならば 問い合わせ応答優先度ランク低」といった条件および施策を示す施策データがルール記録部14に記録される。
上記のような施策指示部8の動作例によれば、各セッションのアクセス中の利用者の目的行動意思が推定でき、イベントにより目的行動意思の上昇度合いが高いURL参照パターンのリストが得られる。そして、セッション途中での利用者の行動から、その利用者が、イベントによる目的行動意思の増加が見込める層か、イベントに反応しない層か、または、イベントの有無に関わらず目的行動意思が高い層かを推定することができる。この推定を基に、追加のプロモーションを提示したり、サーバの処理の優先度を変えたりといった適切な施策を選定し、実行することが可能になる。
上述した項目反応理論分析部6で算出される特性値θについては、テスト情報関数を用いてテスト精度が検証され、適切な項目について分析が行われているので、目的行動が起きない特性値θが低いURL参照パターンについても、利用者の目的行動意思を相対的に比較することができる。このように、様々なURL参照パターンに対応する特性値θが、項目反応理論分析部6で精度良く算出されるので、イベント効果算出部7で、イベント期間で目的行動意思が上昇する、特性値の遷移パターンを発見することが容易になる。これにより、例えば、あと一押しで目的行動意思が高くなる可能性が高い利用者層と、何をやっても目的行動意思が高くならない利用者層とを区別することができる。その結果、利用者の特性に応じた適切な施策が可能になる。
[本実施形態による効果、その他]
従来のWebログ分析の分野では、利用者のWebページ参照と、目的行動の関連を表す指標として、コンバージョン率が利用される場合がある。コンバージョン率は特定のWebページ(もしくは最初に参照したWebページ、あるいはサイトに誘導したバナー広告)を参照した利用者が、最終的にサイトの目的とする目的ページに至る確率を示す。例えば、一連のページの利用者による参照履歴と、購買行動の関係をとらえるのに、コンバージョン率を用いることができる。しかし、コンバージョン率では、購買に至らないURL参照パターンは一律にゼロと算定される。そのため、あと一押しすれば購買に至る利用者の層と、全く買う気のない層とを区別できない。そのため、販売促進の観点から言えば、コンバージョン率を使った分析では不十分である。これに対して、上述の推定システム1では、目的行動に至らない参照URLパターンについても意思の高低を判定することができるので、上記区別が可能である。
マーケティング分野では、購買行動につながる利用者の行動を知るために、決定木モデルが使われることがある(例えば、下記参考文献 [5]参照)。しかし、決定木分析は購買行動につながる顕著な特徴を抽出するため、全く購買に至らない行動パターン同士の差異を比較ができない。そのため、決定木分析も、前記コンバージョン率の場合と同様に、利用者行動と購買意思の関連を分析する手段としては不十分である。
(参考文献[4])守口剛、「プロモーション効果分析」、朝倉書店、2002年12月
類似の行動をとるセッションをクラスタリングして、クラスタごとの購買確率を求める方法もある。例えば、下記参考文献[5]に記載の方法は、ページ間の遷移回数の類似度によりセッションをクラスタに分類し、各クラスタに対してCBMG(Customer Behavior Modelling Graph)と呼ばれる状態遷移グラフを作成して、クラスタごとの購買確率を求める方法である。また、参考文献[6]では、来訪中のセッションがどのクラスタに近いかをリアルタイムに算定し、購買確率の低いクラスタに属するセッションならば、サーバの処理速度を下げることを提案している。
(参考文献[5])Daniel A. Menasce, Virgilio A.F. Almeida, Rodrigo Fonseca, Marco A. Mendes, "A methodology for Workload Characterization of E-commerce Sites," ACM E-COMMERCE 99, 1999, Denver, pp.119-128.
(参考文献[6])Daniel A. Menasce, Virgilio A.F. Almeida, Rodrigo Fonseca, Marco A. Mendes, "Business-oriented resource policies for e-commerce servers," Performance Evaluation, Vol.42, 2000, pp.223-229, Elsevier
上記参考文献[5]および[6]の手法では、最初にWebページの分類を行うステップがあるため、そのサイトのページ構成に関する知識を持つ人が逐次分類を行う必要がある。また、クラスタを遷移確率でモデル化しているため、セッションの初期行動を見ただけでは、そのセッションがどのクラスタに属するかは必ずしも特定できない。また、期間の途中でページ構成に変更があれば、過去に作成したCBMGモデルが利用できなくなるという問題もある。本実施形態の推定システム1は、上述のように、これらの問題を解決することができる。
利用者のWeb参照行動から、利用者特性を抽出し、Webサイトの販売促進に用いる方法としては、表示したページのテクストに含まれるキイワードを利用して、利用者のプロファイルを作成する方法もある(例えば、特開2005-216289号公報参照)。この方法では、利用者がアクセス中のWebサイトの商品の購買に関して、利用者がどれくらい購買の意思があるかの度合いを推定できず、動的な割引の提示などの施策を行う判断ができない。本実施形態の推定システム1では、このような判断も可能である。
各セッションのURL参照パターンを項目反応理論に基づいて分析することは、例えば、参考文献[7]において報告がある。しかし、この報告では、購買意思を測るために、適切なURL集合を選ぶ仕組みが記載されていない。URL集合の選び方次第では、項目反応理論を用いても購買意思とは全く違う潜在特性を推定してしまう可能性がある。上記推定システム1では、目的行動に関連するURL集合を適切に選定した上で分析を行うので、このような可能性が低くなる。すなわち、本実施形態の推定システム1は、サービスシステムの利用者の目的行動の意思を、項目反応理論を用いてより詳細にかつ効率よく推定するのに適した構成を有している。
(参考文献[7])橋間智博、「IRTによる情報提供型Webサイトのアクセス分析」、FIT2006(第5回情報科学技術フォーラム)、pp.423-425、情報処理学会(IPSJ)と電子情報通信学会・システムソサイエティ(ISS)およびヒューマンコミュニケーショングループ(HCG)合同主催、2006年9月5日.
以上、本発明の実施形態と効果について説明したが、本発明は、上記実施形態に限られず、必ずしも上記の全ての効果を奏する構成に限られない。上記効果の一部のみを得られる構成の推定システムも、本発明に含まれる。他の実施形態としては、例えば、複数のWebサーバからWeb利用ログをネットワーク経由で受信し、施策コードをネットワーク経由で、該当Webサーバに返信するASP型の推定システムが考えられる。もしくは、Webサーバの1モジュールとして上記推定システムが実装されてもよい。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
利用者から要求を受信し、記録媒体に予め記録されたデータ要素群のうち、前記利用者の要求に応じたデータ要素を前記利用者へ送信するサービスシステムにおける前記利用者が、特定のデータ要素を要求する行動である目的行動を行う意思の度合いを推定する推定システムであって、
前記利用者と前記サービスシステムとの間の一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを読み込むログ入力部と、
一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成部と、
前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定部と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析部と、
前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを記録する分析結果記録部と備える推定システム。
(付記2)
前記分析部で計算された項目母数の標準誤差が所定範囲外である項目を除外項目候補として抽出し、当該除外項目候補を除いた項目について、前記分析部で計算された特性値θの評価値を、所定のテスト情報関数I(θ)を用いて計算し、当該評価値を用いて、前記除外項目候補を除外するか否かを判断する除外判断部をさらに備え、
前記分析部は、前記除外判断部が前記除外項目を除外すると判断した場合、前記選定マトリクスデータから前記除外項目を前記のデータ要素のデータを削除して、前記項目母数および前記特性値θを再度算出する、付記1に記載の推定システム。
(付記3)
前記ログデータで示される前記一連の通信の1回目からN回目までに利用者により要求されたデータ要素と、前記分析結果記録部の対応データが示す各一連の通信で利用者が要求したデータ要素とを照合することにより、ログデータで示される一連の通信で利用者がN回データ要素を要求した段階における当該利用者の特性値θNを決定する途中特性推定部をさらに備える、付記1または2に記載の推定システム。
(付記4)
前記途中特性推定部によって計算された各一連の通信における特性値θNとその後の特性値の遷移を示す遷移データを、各一連の通信が行われた時を示す時間データとともに記録する遷移データ記録部と、
遷移度データを、所定のイベントが行われたイベント期間の一連の通信と、イベント期間でない通常期間の一連の通信とに、前記時間データを基に分類し、特性値θNが一連の通信においてθAFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて複数通りの特性値θNとその後の特性値θAFTの組み合わせについて計算して、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成し、前記組み合わせそれぞれに前記差異データを対応付けてイベント効果パターンデータとしてイベント効果記録部に記録するイベント効果分析部とをさらに備える、付記3に記載の推定システム。
(付記5)
前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θcを決定する途中意思推定部と、
前記途中意思推定部が決定した特性値θcを用いて、予めルール記録部に記録された、利用者の目的行動への意思の度合いに関する情報と対応付けられた利用者への施策の情報を含む施策データから前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えた、付記1〜4のいずれか1項に記載の推定システム。
(付記6)
前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θcを決定する途中意思推定部と、
前記イベント効果記録部に記録されたイベント効果パターンデータから、前記途中意思推定部で決定された特性値θcに対応する特性値θNの差異データを抽出し、当該差異データを用いてイベントにより前記特性値θcがどの程度上昇しうるかを示す判断値を生成するイベント効果判定部と、
前記判断値を用いて、予めルール記録部に記録された、種々の判断値に対応する利用者への施策を示す情報を含む施策データから、前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えた、付記4に記載の推定システム。
(付記7)
利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いをコンピュータにより推定する推定方法であって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力工程と、
前記コンピュータが、一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成工程と、
前記コンピュータが、前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定工程と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて、前記コンピュータが算出する分析工程と、
前記コンピュータが、前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する工程と含む推定方法。
(付記8)
利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する処理をコンピュータに実行させる推定プログラムであって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力処理と、
一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成処理と、
前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定処理と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析処理と、
前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する処理とコンピュータに実行させる推定プログラム。
本発明は、コンピュータシステムの利用者の目的行動への意思の度合いを、自動的かつ定量的に算出することを可能にする、推定システムとして有用である。
本実施形態にかかる推定システムをシステム全体の構成を示す機能ブロック図 本実施形態にかかる推定システムの詳細な構成を示す機能ブロック図 項目反応理論分析部におけるログ入力部、マトリクス作成部および選定部の動作例を示すフローチャート ログデータの内容の一例を示す図 マトリクス作成部により作成されるマトリクスデータの内容の一例を示す図 分析部および除外判断部の動作例を示すフローチャート 分析部が出力するaj、bjの推定値およびbjの標準誤差の一例を示す表 除外判断部によって計算される標準誤差をプロットしたグラフ 対応データの内容の一例を示す図 各セッションの目的行動への意思の度合いの分布を示すヒストグラムの表示例 項目特性曲線のグラフの表示例 途中特性推定部およびイベント効果分析部の動作例を示すフローチャート 遷移データの内容の一例を示す図 イベント効果パターンデータの内容の一例を示す図 イベント効果パターンデータをグラフにして表示する場合の表示例 遷移データの表示例 施策指示部の動作例を示すフローチャート
符号の説明
1 推定システム
2 サービスシステム
3a〜3c 利用者端末
4 現在ログ記録部
4a ログ記録部
4b 現在ログ記録部
5 ログ入力部
6 項目反応理論分析部
7 イベント効果算出部
8 施策指示部
9 ユーザインタフェース部
10 マトリクス記録部
11 分析結果記録部
12 遷移データ記録部
13 イベント効果記録部
14 ルール記録部
15 マトリクス作成部
16 選定部
17 分析部
18 除外判断部
19 途中特性推定部
20 イベント効果分析部
21 現在ログ入力部
22 途中意思推定部
23 イベント効果判定部
24 施策決定部

Claims (7)

  1. 利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する推定システムであって、
    前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力部と、
    前記一連の通信それぞれにおいて前記データ要素群の各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成部と、
    前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定部と、
    前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析部と、
    前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを記録する分析結果記録部と備える推定システム。
  2. 前記分析部で計算された項目母数の標準誤差が所定範囲外である項目を除外項目候補として抽出し、当該除外項目候補を除いた項目について、前記分析部で計算された特性値θの評価値を、所定のテスト情報関数I(θ)を用いて計算し、当該評価値を用いて、前記除外項目候補を除外するか否かを判断する除外判断部をさらに備え、
    前記分析部は、前記除外判断部が前記除外項目を除外すると判断した場合、前記選定マトリクスデータから前記除外項目を前記のデータ要素のデータを削除して、前記項目母数および前記特性値θを再度算出する、請求項1に記載の推定システム。
  3. 前記ログデータで示される前記一連の通信の1回目からN回目までに利用者により要求されたデータ要素と、前記分析結果記録部の対応データが示す各一連の通信で利用者が要求したデータ要素とを照合することにより、ログデータで示される一連の通信で利用者がN回データ要素を要求した段階における当該利用者の特性値θNを決定する途中特性推定部をさらに備える、請求項1または2に記載の推定システム。
  4. 前記途中特性推定部によって計算された各一連の通信における特性値θNとその後の特性値の遷移を示す遷移データを、各一連の通信が行われた時を示す時間データとともに記録する遷移データ記録部と、
    遷移度データを、所定のイベントが行われたイベント期間の一連の通信と、イベント期間でない通常期間の一連の通信とに、前記時間データを基に分類し、特性値θNが一連の通信においてθAFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて複数通りの特性値θNとその後の特性値θAFTの組み合わせについて計算して、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成し、前記組み合わせそれぞれに前記差異データを対応付けてイベント効果パターンデータとしてイベント効果記録部に記録するイベント効果分析部とをさらに備える、請求項3に記載の推定システム。
  5. 前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
    前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θcを決定する途中意思推定部と、
    前記イベント効果記録部に記録されたイベント効果パターンデータから、前記途中意思推定部で決定された特性値θcに対応する特性値θNの差異データを抽出し、当該差異データを用いてイベントにより前記特性値θcがどの程度上昇しうるかを示す判断値を生成するイベント効果判定部と、
    前記判断値を用いて、予めルール記録部に記録された、種々の判断値に対応する利用者への施策を示す情報を含む施策データから、前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えた、請求項4に記載の推定システム。
  6. 利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いをコンピュータにより推定する推定方法であって、
    前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力工程と、
    前記コンピュータが、一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成工程と、
    前記コンピュータが、前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定工程と、
    前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて、前記コンピュータが算出する分析工程と、
    前記コンピュータが、前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する工程と含む推定方法。
  7. 利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する処理をコンピュータに実行させる推定プログラムであって、
    前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力処理と、
    一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成処理と、
    前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定処理と、
    前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析処理と、
    前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する処理とコンピュータに実行させる推定プログラム。
JP2008064670A 2008-03-13 2008-03-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム Expired - Fee Related JP5170537B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008064670A JP5170537B2 (ja) 2008-03-13 2008-03-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008064670A JP5170537B2 (ja) 2008-03-13 2008-03-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム

Publications (2)

Publication Number Publication Date
JP2009223423A JP2009223423A (ja) 2009-10-01
JP5170537B2 true JP5170537B2 (ja) 2013-03-27

Family

ID=41240166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008064670A Expired - Fee Related JP5170537B2 (ja) 2008-03-13 2008-03-13 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム

Country Status (1)

Country Link
JP (1) JP5170537B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120310778A1 (en) * 2011-06-03 2012-12-06 Uc Group Limited Systems and methods for clearing and settling transaction activity
JP6072078B2 (ja) 2012-12-25 2017-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 分析装置、分析プログラム、分析方法、推定装置、推定プログラム、及び、推定方法。
JP6155354B2 (ja) * 2016-03-11 2017-06-28 デジタル・アドバタイジング・コンソーシアム株式会社 情報処理装置、情報処理方法及びプログラム
JP6957275B2 (ja) * 2017-09-05 2021-11-02 株式会社電通 ユーザ施策システム
JP6663945B2 (ja) * 2018-03-01 2020-03-13 Kddi株式会社 コンテンツに対するユーザの共感能力を推定するプログラム、装置及び方法
JP2020087480A (ja) * 2020-01-08 2020-06-04 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2023054783A1 (ko) * 2021-09-29 2023-04-06 주식회사 프렌트립 파라미터 간의 연관도를 기반으로 레저 활동 레슨에 대한 파라미터를 예측하는 전자 장치의 제어 방법
KR102419274B1 (ko) * 2021-09-29 2022-07-11 주식회사 프렌트립 이벤트의 영향 정도를 기반으로 레저 활동 레슨에 대한 파라미터를 예측하는 전자 장치의 제어 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366838A (ja) * 2001-06-06 2002-12-20 Toshiba Corp リコメンデーション方法及びサーバ・システム並びにプログラム
JP4284026B2 (ja) * 2002-01-30 2009-06-24 株式会社東芝 データ分析方法およびデータ分析装置およびプログラム
JP4273300B2 (ja) * 2002-11-01 2009-06-03 国立大学法人東京工業大学 Webアクセスログ解析方法

Also Published As

Publication number Publication date
JP2009223423A (ja) 2009-10-01

Similar Documents

Publication Publication Date Title
JP5170537B2 (ja) 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム
US9576251B2 (en) Method and system for processing web activity data
US8069075B2 (en) Method and system for evaluating performance of a website using a customer segment agent to interact with the website according to a behavior model
US8341102B2 (en) User state presumption system, user state presumption method, and recording media storing user state presumption program
KR101525262B1 (ko) 크로스 채널 최적화 시스템 및 방법
JP4529058B2 (ja) 配信システム
US8341101B1 (en) Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics
US9256692B2 (en) Clickstreams and website classification
KR102451099B1 (ko) 인공지능 기반의 사용자 니즈 추론을 통한 구매 유도 시스템 및 방법
US20120173338A1 (en) Method and apparatus for data traffic analysis and clustering
JP7271529B2 (ja) 自動化されたアトリビューションモデリングおよび測定
TW200912789A (en) Granular data for behavioral targeting
KR20160065429A (ko) 하이브리드 개인화 상품추천 방법
JP5061999B2 (ja) 解析装置、解析方法及び解析プログラム
US20130262355A1 (en) Tools and methods for determining semantic relationship indexes
CN116861076A (zh) 基于用户流行度偏好的序列推荐方法及装置
JP5277996B2 (ja) 解析装置、解析方法及び解析方法のプログラム
Gao et al. Graph-theoretic approach to detecting real-time intents within purchase conversion funnel using clickstream data
WO2013073206A1 (ja) 情報収集システム、情報収集方法、およびプログラム
JP6320353B2 (ja) デジタルマーケティングシステム
JP2002123739A (ja) 情報処理装置および方法、並びに記録媒体
JP4538934B2 (ja) 配信システム
CN112508074B (zh) 可视化展示方法、系统及可读存储介质
Song et al. Uncovering Characteristic Paths to Purchase of Consumers
WO2013119762A1 (en) Tools and methods for determining semantic relationship indexes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121219

LAPS Cancellation because of no payment of annual fees