JP5170537B2

JP5170537B2 - 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム

Info

Publication number: JP5170537B2
Application number: JP2008064670A
Authority: JP
Inventors: 政志宇山; 陽治神田; 充織田; 理渡辺; 康隆谷内; 高洋小林; 猛荒兼
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2008-03-13
Filing date: 2008-03-13
Publication date: 2013-03-27
Anticipated expiration: 2028-03-13
Also published as: JP2009223423A

Description

サーバにアクセスした複数の利用者のアクセス履歴を示すデータから、利用者の状態を推定する利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラムに関する。

利用者から要求を示すデータを受信し、その要求に応じたデータ要素を利用者へ送信するシステム（以下、サービスシステムを称する）においては、利用者の要求の内容を基に利用者の特性を分析するための技術が求められている。

例えば、Ｗｅｂサイトにアクセスしている利用者個々人の特性がわかれば、特性に応じて表示するＷｅｂページを変更する等の施策を実行することができる。これにより、利用者が購買に至る確率を高めたり、利用者の満足度を高めたりすることができる。店舗での接客のアナロジで考えれば、Ｗｅｂサイト利用者の特性を推定することは、優秀な店員がお客様個人との対話の中で、お客様の嗜好や目的を把握し、適切に誘導することに対応する。

利用者のプロファイル（年齢、性別、職業、居住地等の個人属性）が予め入手できれば、プロファイルに即したセグメンテーションを行い、各セグメントの利用者にそれぞれ異なる広告を提示する等の施策が可能になる。セグメントごとに施策を変えることで、利用者が例えば、商品の購買や資料請求、利用者登録といった、Ｗｅｂサイトが目的とする行動に至る確率を高めることができる。しかし、このような利用者の個人属性を入手するには利用者から事前の承諾を得る必要があり、その使途も予め限定される傾向にある。そのため、利用者の個人属性を利用した施策は困難になってきている。

さらに、Ｗｅｂサイト上で特定商品のキャンペーン等のイベントを行う場合には、年齢や性別といったデモグラフィック（人口統計学的）情報とは別に、商品に対する関心の高さや、理解の高さ、購入意向といった特性を知ることも、重要である。例えば、利用者の商品に対する理解および関心がともに低ければ、広告を強化して商品の知名度をあげる必要がある。一方、利用者の商品理解は高いが関心が低い場合は、商品の値引き等の訴求策を考える必要がある。

従来、利用者の商品理解度や関心度を推定することは、アンケート等の手段で、費用をかけて利用者調査を実施することで可能であった（例えば、非特許文献１の２４頁で紹介されているハワード・シェス・モデル参照）。しかし、アンケート等の実施コストは高い上に、回収結果を得るのに時間がかかる。さらに、利用者の関心の高さや、購入意向は、動的に変わりうる特性である。このため、アンケートで費用と時間をかけて入手した情報が、時間の経過とともに実際の利用者集団の特性と合わなくなることがある。

以上述べたように、利用者プロファイルやアンケート情報は、その用途に制約があり、収集に費用がかかり、かつ利用者の変化に追随できないといった問題があった。このため、近年では、利用者のＷｅｂ上の行動そのものから、利用者の嗜好や関心といった特性を捉えてセグメンテーションを行う行動ターゲティング広告という技術分野が注目されている。（例えば、非特許文献２参照）。この非特許文献２において、行動ターゲティング広告 (Behavioral Targeting AD: 略称BTA)は、「WEBサイト上での行動履歴情報をもとにユーザをセグメント化し、そのセグメントに応じて最適な広告を配信する新しいマーケティング手法」とされている。なお、行動を把握することで可能になる施策は広告配信に限られない（例えば、非特許文献３参照）。本明細書では、広告用途に限定せず、行動履歴情報をもとにユーザをセグメント化する技術一般を、行動ターゲティング技術と呼ぶことにする。

例えば、行動ターゲティング技術として、利用者個人を識別するユーザＩＤごとのURL閲覧履歴を一括管理し、自動車や化粧品といった特定分野のWeb頁を頻繁に閲覧しているユーザＩＤに対して、特定分野ごとのセグメントＩＤを割り当てる技術が提案されている（例えば、非特許文献４参照）。このように、同一の利用者を、セッションを越えて長期的に追跡出来ることを前提として、利用者の属性や今までの購買履歴に基づいて、利用者の関心度や理解度の変化を推定する技術は、他にも開示されている（例えば、非特許文献５）。
特開２００３−１２２９８２号公報片平秀貴、「マーケティング・サイエンス」、東京大学出版会、１９８７年初版発行、ｐ．２４デジタル・アドバタイジング・コンソーシアム株式会社、株式会社アイメディアドライブ、"行動ターゲティング広告（ＢＴＡ）の広告効果を本格的に検証"、［ｏｎｌｉｎｅ］、平成１９年１月２６日、［平成１９年６月１８日検索］、インターネット、＜ＵＲＬ：http://www.dac.co.jp/dacfiles/200701%20BTA_tyousa.pdf＞株式会社ブレインパッド、"アクセスログ解析を利用したレコメンデーションシステム「Ｒｔｏａｓｔｅｒ」"、［ｏｎｌｉｎｅ］、［平成２０年２月１８日検索］、インターネット、＜ＵＲＬ：http://www.rtoaster.jp/＞株式会社日経ＢＰ、"行動ターゲティング広告を本格化媒体社、広告主、読者にメリット"、［ｏｎｌｉｎｅ］、平成１８年８月９日、［平成１９年６月１８日検索］、インターネット、＜ＵＲＬ： http://www.nikkeibp.co.jp/style/biz/net/keyperson/060809_dac/＞ A.Labbi and C.Berrospi, "Optimizing marketing planning and budgeting using Markov decision prosesses: An airline case study," IBM Journal of Research and Development, Vol.51, No.3/4, 2007, pp.421-432.

しかし、上記のような、ユーザＩＤがセッションを越えて追跡できることを前提にした技術は、新規顧客を増やすためにキャンペーンを行うような局面では有効ではない。広告等により初めて来訪した利用者の場合には、利用者の属性や過去の購買履歴を使用することができないからである。

そこで、本発明は、利用者の属性や、過去の同一利用者の履歴が利用できるかどうかに関わらず、利用者の目的行動への意思の度合いを、一連の通信における行動のみを基に、より正確に効率よく推定することができる推定システムを提供することを目的とする。

本発明にかかる推定システムは、利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する推定システムであって、前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力部と、一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成部と、前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定部と、前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析部と、前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを記録する分析結果記録部と備える。

上記構成において、マトリクス作成部は、ログデータを用いてマトリクスデータを生成する。マトリクスデータは、各一連の通信において各データ要素が要求されたか否かを示すデータが、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録されたデータである。このため、選定部は、このマトリクスデータを用いて、前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算することができる。さらに、選定部は、この相関を用いることにより、特定のデータ要素と相関を持つデータ群、すなわち目
的行動に関連のある関連データ要素群を選定することができる。そのため、目的行動に関連のある関連データ要素群のデータのみを残した選定マトリクスデータの作成が可能になる。分析部は、選定部で選定された関連データ要素群を項目反応理論における各項目とし、選定マトリクスデータのデータを反応パターンとして用いて、項目反応関数における各一連の通信ごとの特性値θおよびデータ要素ごとの項目母数を計算する。その結果、利用者の目的行動への意思の度合いを示す特性値θおよび各データ要素の難易度および識別力などを示す項目母数が計算される。特性値θは、各一連の通信において利用者から要求されたデータ要素を示すデータに対応付けられて記録される。

これにより、利用者が一連の通信で要求したデータ要素と、利用者の目的行動への意思の度合いを示す特性値θとの対応が明らかになる。そのため、利用者の目的行動への意思の度合いを、一連に通信における利用者の行動により推定することが可能になる。その結果、利用者の個人属性や、同じ利用者の過去の履歴に関する情報が利用できるか否かに関わらず、一連の通信における利用者の目的行動への意思の度合いを推定することが可能になる。

なお、このように項目反応関数を用いて一連の通信ごとの特性値θを計算することにより、実際に特定のデータ要素を要求した利用者ほど高い目的行動への意思を示す特性値θが計算される。また、一連の通信において特定のデータ要素が要求されないパターンについても特性値θが計算され、利用者の目的行動への意思の度合いが得られる。さらに、特性値θを得るために、事前にデータ要素群を内容に応じて分類するなど等のデータ要素の内容を知った人による作業は不要である。そのため、データ要素群の構成に変更が生じても、人による作業を発生させずに、利用者の目的行動への意思の度合いを計算することも可能になる。

さらに、上記構成では、選定部が項目反応理論の各項目として用いるデータ要素を適切に選定した上で、分割部が利用者の目的行動の意思度合いを示す特性値θを計算する。これにより、例えば、項目反応理論の各項目として用いられるデータ要素が不適切であるために、分析部が目的行動の意思の度合いとは全く違う特性を計算してしまうという事態を避けることができる。すなわち、利用者の目的行動への意思の度合いをより正確に効率良く計算することができる。

なお、データ要素は、例えば、サービスシステムが利用者に対して提供するＷｅｂサイト中の各Ｗｅｂページのように、利用者からの要求に応じて送信されるデータの単位となる情報を持つデータ単位である。

本明細書に開示された推定システムによれば、利用者の属性や、過去の同一利用者の履歴が利用できるかどうかに関わらず、利用者の目的行動への意思の度合いを、一連の通信における行動のみを基に、より正確に効率よく推定することが可能になる。

本実施形態において、推定システムは、前記分析部で計算された項目母数の標準誤差が所定範囲外である項目を除外項目候補として抽出し、当該除外項目候補を除いた項目について、前記分析部で計算された特性値θの評価値を、所定のテスト情報関数Ｉ（θ）を用いて計算し、当該評価値を用いて、前記除外項目候補を除外するか否かを判断する除外判断部をさらに備え、前記分析部は、前記除外判断部が前記除外項目を除外すると判断した場合、前記選定マトリクスデータから前記除外項目を前記のデータ要素のデータを削除して、前記項目母数および前記特性値θを再度算出する態様とすることができる。

除外判断部は、項目母数の標準誤差が所定範囲内の項目を除外項目候補とすることで、あてはめ精度の悪い項目を除外項目候補とすることができる。また、テスト情報関数Ｉ（θ）を用いた評価値により、除外項目候補を除外した場合に、項目数が減ることによる精度悪化の有無を判断することができる。その結果、分析部は、項目反応理論の各項目として不適切なデータ要素が除外された選定マトリクスデータを用いて、項目母数および特性値θを算出することができる。

本実施形態において、推定システムは、前記ログデータで示される前記一連の通信の１回目からＮ回目までに利用者により要求されたデータ要素と、前記分析結果記録部の対応データが示す各一連の通信で利用者が要求したデータ要素とを照合することにより、ログデータで示される一連の通信で利用者がＮ回データ要素を要求した段階における当該利用者の特性値θ_Nを決定する途中特性推定部をさらに備えてもよい。

途中特性推定部は、ログデータで示される一連の通信における１回目からＮ回目までに要求されたデータ要素と、分析結果記録部の対応データで示される一連の通信において要求されたデータ要素とを照合する。これにより、前記１回目からＮ回目までのデータ要素の要求パターンに対応する、対応データ中のデータ要素の要求パターンの特性値θを取得することができる。すなわち、ログデータで示される一連の通信でＮ回目にデータ要求をした段階における利用者の特性値θ_Nを決定することができる。その結果、ログデータの示す一連の通信で、利用者がＮ回目のデータ要素を要求した段階おける利用者の目的行動への意思の度合いを示す特性値θ_Nを決定することが可能になる。

本実施形態において、推定システムは、前記途中特性推定部によって計算された各一連の通信における特性値θ_Nとその後の特性値の遷移を示す遷移データを、各一連の通信が行われた時を示す時間データとともに記録する遷移データ記録部と、遷移度データを、所定のイベントが行われたイベント期間の一連の通信と、イベント期間でない通常期間の一連の通信とに、前記時間データを基に分類し、特性値θ_Nが一連の通信においてθ_AFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて複数通りの特性値θ_Nとその後の特性値θ_AFTの組み合わせについて計算して、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成し、前記組み合わせそれぞれに前記差異データを対応付けてイベント効果パターンデータとしてイベント効果記録部に記録するイベント効果分析部とをさらに備えてもよい。

これにより、イベント効果記録部には、通常期間とイベント期間とで、利用者の特性値の遷移確率がどの程度異なるかを示す差異データが記録されることになる。そのため、イベントによって利用者の特性値の遷移確率が影響を受ける度合いを示す情報が提供されることになる。すなわち、差異データにより、利用者の目的行動への意思の遷移が、イベントによりどの程度影響を受けるかを示す情報が提供される。

本実施形態において、推定システムは、前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θｃを決定する途中意思推定部と、前記途中意思推定部が決定した特性値θｃを用いて、予めルール記録部に記録された、利用者の目的行動への意思の度合いに関する情報と対応付けられた利用者への施策の情報を含む施策データから前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えてもよい。

途中意思推定部により、現在ログデータで示される一連の通信の途中における利用者の目的行動への意思の度合いを示す特性値θｃが決定される。施策決定部は、特性値θｃが示す利用者の目的行動への意思の度合いに対応する施策を示すデータを、ルール記録部の施策データから抽出することができる。そのため、利用者の目的行動への意思の度合いに応じた適切な施策を示すデータをサービスシステムへ出力することができる。

本実施形態において、推定システムは、前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θｃを決定する途中意思推定部と、前記イベント効果記録部に記録されたイベント効果パターンデータから、前記途中意思推定部で決定された特性値θｃに対応する特性値θ_Nの差異データを抽出し、当該差異データを用いてイベントにより前記特性値θｃがどの程度上昇しうるかを示す判断値を生成するイベント効果判定部と、前記判断値を用いて、予めルール記録部に記録された、種々の判断値に対応する利用者への施策を示す情報を含む施策データから、前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えてもよい。

イベント効果判定部は、このイベント効果記録部を参照することで、途中意思推定部が決定した一連の通信の途中における特性値θｃに対応する特性値θ_Nについて、遷移確率のイベント期間と通常期間との差異を示す差異データを得ることができる。この差異データにより、イベント効果判定部は、イベントにより通信中の利用者の特性値θの上昇がどの程度見込まれるかを示す判断値を生成できる。施策決定部は、この判断値と特性値θに応じた適切な施策を示すデータをルール記録部から抽出することができ、適切な施策を示すデータをサービスシステムに出力することができる。

コンピュータを上記推定システムとして機能させるためのプログラムおよびそのようなプログラムを記録した記録媒体も本発明の実施形態の一つである。

（第１の実施形態）
［システム全体の概要］
図１は、本実施形態にかかる推定システム１をシステム全体の構成を示す機能ブロック図である。図１に示す推定システム１は、複数の利用者を対象としたＷｅｂサイトを提供するサービスシステム２へ接続されている。サービスシステム２は、インターネットに接続されたＷｅｂサーバの機能を持つ。インターネットには、複数の利用者の利用者端末３ａ〜３ｃが接続されている。利用者端末３ａ〜３ｃには、例えば、Ｗｅｂブラウザがインストールされており、複数の利用者は、利用者端末３ａ〜３ｃそれぞれのＷｅｂブラウザを使って、インターネットを介してサービスシステム２が提供するＷｅｂサイトにアクセスすることができる。本実施形態では、一例として、利用者端末３ａ〜３ｃとサービスシステム２との通信が、主にＨＴＴＰを用いて行われる場合について説明する。

また、Ｗｅｂサイトは、複数のＷｅｂページで構成されている。本実施形態では、一例として、この１つのＷｅｂページが利用者の要求により利用者に対して送信される１つのデータ要素となる場合について説明する。利用者は、利用者端末３ａ〜３ｃのＷｅｂブラウザを使ってＵＲＬを指定することで、サービスシステム２に対して、当該ＵＲＬで特定されるＷｅｂページを要求することができる。サービスシステム２は、指定されたＵＲＬのＷｅｂページのデータおよびこれに付随する種々のデータを利用者に対して返信する。

なお、本実施形態では、一例として、１つのＵＲＬで特定されるＷｅｂページを１つのデータ要素として扱う場合について説明するが、どのようなデータ単位をデータ要素にするかはこれに限定されない。データ要素は、例えば、利用者とサービスシステム間の通信で採用されるプロトコルや、後述する目的行動の種類等に応じて適宜決めることができる。

サービスシステム２は、Ｗｅｂサイトを通じて、例えば、複数の利用者に商品販売等のサービスを提供することができる。本実施形態では、一例として、サービスシステム２によりＥＣサイト（ｅｌｅｃｔｒｏｎｉｃｃｏｍｍｅｒｃｅ（電子商取引）サイト）が提供される場合について説明する。

なお、サービスシステム２により実現されるサービスの形態は、Ｗｅｂサイトを介したサービス提供に限定されない。例えば、ネットワークを介したＡＳＰやその他のクライアントサーバシステムを用いたサービス形態もサービスシステム２により実現されうる。また、サービスシステム２が利用者に送信するデータの内容および形式も特に限定されない。

サービスシステム２は、利用者によるＷｅｂサイトへのアクセス履歴を示すログデータをログ記録部４ａに記録する。特に、現在アクセス中の利用者のアクセス履歴を示す現在ログデータは、現在ログ記録部４ｂに記録される。なお、ログ記録部４ａおよび現在ログ記録部４ｂは１つの記録部で構成されてもよい。

推定システム１は、ログ記録部４ａまたは現在ログ記録部４ｂから、Ｗｅｂサイトへの利用者のアクセス履歴を示すログデータを読み込んで、利用者の意思を推定するシステムである。推定システム１は、読み込んだログデータを用いて、利用者の、特定のＷｅｂページを参照（要求）する行動（以下、目的行動と称し、前記特定のＷｅｂページを目的ページと称する）に対する意思の度合いを分析する。また、推定システム１はこの分析結果を利用して、利用者のイベントによる反応を解析したり、現在アクセス中の利用者の目的行動への意思の度合いを推定して、適切な施策を決定したりする機能も備える。

なお、目的ページは、サイトの目的とするページであり、例えば、サービスシステム２の運用者により、Ｗｅｂサイトの目的に応じて適宜設定される。目的ページの例として、Ｗｅｂサイトにおける購買完了時に「ありがとうございました」と表示するサンキューページ、資料請求のページ、会員登録完了のページなどが挙げられる。なお、目的ページはコンバージョンページと呼ばれることもある。

そのため、推定システム１は、概略的な機能ブロックとして、ログ入力部５、ユーザインタフェース部９、項目反応理論分析部６、イベント効果算出部７および施策指示部８を備える。項目反応理論分析部６にはマトリクス記録部１０および分析結果記録部１１が、イベント効果算出部７には遷移データ記録部１２およびイベント効果記録部１３が、施策指示部８にはルール記録部１４が含まれる。

ログ入力部５は、ログ記録部４ａに記録されたログデータを読み込んで、項目反応理論分析部６およびイベント効果算出部７が利用可能な状態にする。ログデータには、例えば、サービスシステム２と利用者との間の一連の通信（例えば、セッション）における、利用者の参照したＵＲＬ（要求したデータ要素）、参照した日時（要求した日時）等を示す情報が含まれる。

ここで、一連の通信とは、利用者がサービスシステムにアクセスして何らかのサービスを利用する際に、利用開始から終了までの一連の行動として認識される通信である。このように、利用者の一連の行動を示す一連の通信を認識する方法として、例えば、Ｗｅｂサーバが、Ｗｅｂサイトにおける同一利用者によるアクセスを、１つのセッションとして認識する技術が存在する。なお、どのような通信単位を一連の通信をするかは、サービスシステム２および推定システム１の通信環境や目的に応じて、適宜決定することができる。

項目反応理論分析部６は、ログデータを基にして、項目反応理論を用いて各セッションの利用者の目的行動への意思の度合いを示す特性値θを計算し、分析結果記録部１１に記録する。具体的には、ログデータを基に、解析対象のＷｅｂサイトに含まれるＵＲＬ集合（初期集合）の各ＵＲＬが各セッションで参照されたか否かを示すマトリクスデータが生成され、マトリクス記録部１０に記録される。そして、マトリクスデータが項目反応理論を用いて分析され、セッションごとの利用者の目的行動への意思の度合いを示す特性値θ等が計算される。また、項目反応理論分析部６は、分析の対象となるＵＲＬ集合を適切に選定する機能を備える。これにより、特性値θが利用者の意思度合いをより正確に反映したものとなる。

イベント効果算出部７は、ログデータを読み込み、分析結果記録部１１の分析結果を用いて、ログデータで示される各セッションにおける特性値θの遷移状況を示す遷移データを生成し、遷移データ記録部１２に記録する。また、遷移データを用いて、キャンペーン等のイベントの実施期間（イベント期間）と通常期間との特性値の遷移の違いから、イベントと特性値の遷移との関係を示すイベント効果パターンデータを生成する。イベント効果パターンデータはイベント効果記録部１３に記録される。

施策指示部８は、現在ログ記録部４ｂから現在ログデータを読み込んで、現在サービスシステム２にアクセス中の利用者の特性値を計算する。そして、施策指示部８は、計算された特性値と、イベント効果記録部１３のデータとを用いて、ルール記録部１４から利用者の特性値に適した施策を示すデータを抽出し、サービスシステム２へ出力する。すなわち、施策指示部８は、現在Ｗｅｂサイトに来訪中の利用者の途中までの行動から、目的行動への意思の度合いを推定し、その利用者に対して実行すべき適切な施策を選定する。

また、分析結果記録部１１、遷移データ記録部およびイベント効果記録部１３に記録されたデータは、可視化処理されて、ユーザインタフェース部９で表示されてもよい。これにより、例えば、サービスシステム２の運用者は、推定システム１により計算された利用者の目的行動への意思の度合いを知ることができる。

推定システム１は、サーバマシン、パーソナルコンピュータ、ワークステーションなどのコンピュータ上に構築される。推定システム１を構成する上記各機能部は、１台のコンピュータ上に構成されてもよいし、複数のコンピュータに分散して構成されてもよい。また、サービスシステム２も同様にコンピュータ上に構築される。推定システム１、サービスシステム２、ログ記録部４ａおよび現在ログ記録部４ｂは、１台のコンピュータで構成されてもよいし、複数のコンピュータに機能を分散させて構成されてもよい。

推定システム１のログ入力部５、ユーザインタフェース部９、項目反応理論分析部６、イベント効果算出部７および施策指示部８のそれぞれ機能は、コンピュータのＣＰＵが所定のプログラムを実行することによって実現される。したがって、上記各機能を実行するためのプログラムおよびプログラムを記録した記録媒体も、本発明の一実施形態である。また、分析結果記録部１１、遷移データ記録部１２、イベント効果記録部１３およびルール記録部１４は、コンピュータが備えるメモリ、ハードディスク等の記録媒体により具現化される。

［推定システム１の構成］
図２は、図１に示した推定システム１の詳細な構成を示す機能ブロック図である。以下、項目反応理論分析部６、イベント効果算出部７および施策指示部８の構成をそれぞれ順に説明する。

＜項目反応理論分析部６の構成＞
図２に示すように、項目反応理論分析部６は、マトリクス作成部１５、選定部１６、分析部１７、除外判断部１８、マトリクス記録部１０および分析結果記録部１１を備える。

マトリクス作成部１５は、ログ入力部５が読み込んだログデータから、各セッションにおいて利用者が参照した参照ＵＲＬを検出する。これにより、マトリクス作成部１５は、解析対象のＷｅｂサイトのＵＲＬ集合（初期集合）に含まれる各ＵＲＬが、セッションにおいて参照されたか否かを示すマトリクスデータを生成する。

前記初期集合は、予めマトリクス記録部１０に記録される。例えば、サービスシステム２で提供されるＷｅｂサイトの各ＷｅｂページのＵＲＬのうち参照頻度が他より多いＵＲＬを初期集合とすることができる。初期集合は、例えば、サービスシステム２から取得したＷｅｂサイトに含まれるＵＲＬを示すデータを基に、マトリクス作成部１５が生成してもよい。

生成されたマトリクスデータはマトリクス記録部１０に記録される。マトリクスデータは、例えば、各行の要素が各セッションを、各列の要素が各ＵＲＬを示す行列のデータとすることができる。この場合、各要素の値が、参照したか否かを示す値となる。

選定部１６は、マトリクスデータにおける目的ページのＵＲＬの列と、他のＵＲＬの列との相関係数を計算する。この目的ページは、例えば、運用者がユーザインタフェース部９を介して入力した情報に基づいて決められる。選定部１６は、各相関係数に基づいて、初期集合に含まれるＵＲＬのうち、目的ページに関連のあるＷｅｂページのＵＲＬを選択する。選定部１６は、マトリクスデータから、前記選択されたＵＲＬの列と目的ページの列だけの残し、他の列の要素を除外することにより、選定マトリクスを生成する。これにより、選定部１６は、目的ページと相関が弱いＷｅｂページのＵＲＬを、分析部１７の対象から外すことになる。なお、選定マトリクスもマトリクス記録部１０に記録される。

分析部１７は、選定部１６により生成された選定マトリクスを入力とし、各セッションの目的行動への意思の度合いを示す特性値θ、各ＵＲＬの困難度パラメタ・識別力パラメタの推定値、およびＵＲＬ参照パターンと特性値θとの対応関係を示す対応データを出力し、分析結果記録部１１に記録する。

除外判断部１８は、分析部１７の計算結果を評価することにより、分析部１７で計算される特性値θが利用者の目的行動への意思の度合いをより正確に反映するために、選定マトリクスデータにおけるＵＲＬ集合の修正が必要か否かを判断する。

具体的には、除外判断部１８は、分析部１７が計算した各ＵＲＬの困難度パラメタの推定値の標準誤差を算出し、予め指定したスレショルドＴを超える標準誤差を持つＵＲＬを、除去すべき削除候補ＵＲＬとして抽出する。また、除外判断部１８は、フィッシャー情報量の算出式を用いてテスト情報関数Ｉ（θ）および、テスト情報関数Ｉ（θ）の平方根の逆数を算出する。上記抽出した削除候補ＵＲＬが存在し、かつテスト情報関数の平方根の逆数が予め指定した閾値Ｋ（θ）以下である場合に、除外判断部１８は、ＵＲＬを削除する余地があると判断する。

ＵＲＬを削除する余地ありと判断した場合、除外判断部１８は、例えば、標準誤差の最も大きいＵＲＬを削除して選定マトリクスデータを再構成する。そして、分析部１７は、再構築された選定マトリクスデータを用いて、各セッションの特性値θ、各ＵＲＬの困難度パラメタ・識別力パラメタの推定値、および対応データを再度計算する。

分析結果記録部１１に記録された各セッションの特性値θ、各ＵＲＬの困難度パラメタ・識別力パラメタの推定値、および対応データは、例えば、グラフ等のような形式で可視化されて、ユーザインタフェース部９を介して、運用者に提示されてもよい。また、対応データは、イベント効果算出部７および施策指示部８の処理で用いられる。

＜イベント効果算出部７の構成＞
イベント効果算出部７は、途中特性推定部１９、イベント効果分析部２０、遷移データ記録部１２およびイベント効果記録部１３を備える。途中特性推定部１９は、ログデータが示す各セッションの途中の段階における利用者の特性値を、分析結果記録部１１の対応データを参照することにより決定する。

具体的には、ログ入力部５が入力したログデータを参照して、各セッションで利用者が参照した初めのＮページのＵＲＬ参照パターンを抽出する。そして、途中特性推定部１９は、抽出したＵＲＬ参照パターンと、分析結果記録部１１の対応データが示す各セッションのＵＲＬ参照パターンとを照合し、対応する特性値θを取得する。これにより、途中特性推定部１９は、ログデータで示される各セッションで、利用者が初めのＮページを参照した段階での利用者の特性値θ_Nを決定する。このように計算された各セッションの途中の段階における利用者の特性値θ_Nとその後の遷移を示す遷移データが、セッションごとに遷移データ記録部１２に記録される。特性値θ_Nのその後の遷移を示すデータは、例えば、Ｎ＋Ｘ（Ｘは自然数）ページが参照された段階の特性値またはその変化量でもよいし、セッション終了時の特性値またはその変化量でもよい。

なお、Ｎの値は、例えば、ユーザインタフェース部９を介した運用者からの入力により、予め設定しておくことができる。例えば、Ｎ＝４、６、８とＮの値を複数段階設定することで、各セッションにおける４ページ目参照、６ページ目参照、および８ページ目参照のそれぞれの段階での利用者の特性値が求められる。

イベント効果分析部２０は、遷移データ記録部１２の遷移度データを、所定のイベントが行われたイベント期間のセッション集合のデータと、イベント期間でない通常期間のセッション集合のデータとに分割する。そして、イベント効果分析部２０は、Ｎページを参照した利用者の特性値θ_Nがその後セッションにおいて特性値θ_AFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて計算する。これらの遷移確率は、イベント期間および通常期間それぞれにおいて、複数通りの特性値θ_Nおよび特性値θ_AFTの組み合わせについて計算される。イベント効果分析部２０は、前記組み合わせごとに、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成する。この差異データは、前記組み合わせそれぞれに対応付けられてイベント効果パターンデータとしてイベント効果記録部１３に記録される。

具体的には、イベント効果分析部２０は、ログデータに記述されている各セッションの日付を用いて、ログデータが示すセッション集合を、通常期間に起きたセッション集合と、イベント期間に起きたセッション集合とに分割する。なお、イベント期間および通常期間は、例えば、ユーザインタフェース部９を介して利用者から、または、サービスシステム２から予め取得して記録しておくことができる。

イベント効果分析部２０は、分割された各セッション集合における、途中の特性値θ_Nおよびその後の特性値θ_AFTそれぞれが、Ｌ個に等分割された区間Ｋ₁〜Ｋ_Lまでのうちいずれに属するかを決定する。そして、セッションの途中でＮページ参照した段階で区間Ｋ_iに属していた特性値が、その後に区間Ｋ_jに遷移する遷移確率を計算する（ｉ、ｊ＝１，２，・・・，Ｌ）。この遷移確率は、イベント期間のセッション集合および通常期間のセッション集合それぞれについて計算される。また、この遷移確率は、複数通りのＮ、区間Ｋ_iおよび区間Ｋ_jの組について計算される。遷移確率は、例えば、「イベントフラグ、区間Ｋ_i、区間Ｋ_j、遷移確率」を一組のレコードとして記録される。

イベント効果分析部２０は、Ｎ、区間Ｋ_iおよび区間Ｋ_jの組それぞれに対して、通常期間の遷移確率とイベント期間の遷移確率との差異（例えば、差分）を計算する。そして、通常期間の遷移確率に対するイベント期間の遷移確率の上昇率（差分）が大きい組から順にソートして、上昇率とともに、イベント効果パターンデータとしてイベント効果記録部１３に記録する。イベント効果パターンデータは、例えば、「通常期間の遷移確率（区間Ｋ_i、区間Ｋ_j、遷移確率）、イベント期間の遷移確率（区間Ｋ_i、区間Ｋ_j、遷移確率）、上昇率」を一組のレコードとして記録される。

遷移データ記録部１２およびイベント効果記録部１３に記録されたデータは、例えば、グラフ等のような形式で可視化されて、ユーザインタフェース部９を介して、運用者に提示されてもよい。また、イベント効果記録部１３のイベント効果パターンデータは、施策指示部８の処理で用いられる。

＜施策指示部８の構成＞
施策指示部８は、現在ログ入力部２１、途中意思推定部２２、イベント効果判定部２３、施策決定部２４およびルール記録部１４を備える。現在ログ入力部２１は、サービスシステム２にアクセス中の利用者のセッションの履歴を示す現在ログデータを入力する。すなわち、現在ログ入力部２１は、サービスシステム２と利用者端末３ａ〜３ｃとの間で現在進行中のセッションの履歴を示すデータをリアルタイムで読み込み、途中意思推定部２２で利用可能な状態にする。

途中意思推定部２２は、現在ログデータが示す現在進行中のセッションの現段階における利用者の特性値θｃを、分析結果記録部１１の対応データを参照することにより決定する。具体的には、上記の途中特性推定部１９と同様にして、特性値θｃを決定することができる。

イベント効果判定部２３は、イベント効果記録部１３に記録されたイベント効果パターンデータ中の特性値θｃに対応するデータを参照し、特性値θｃがイベントにより上昇するパターンか否かを判定する。例えば、イベントにより特性値θｃがどの程度上昇しうるかを示す判断値が生成される。

施策決定部２４は、前記判断値を用いて、ルール記録部１４に記録された施策データが示す施策の中から、前記特性値θおよび前記判断値に対応する施策を示すデータを抽出する。抽出された施策を示すデータは、サービスシステム２へ通知される。これにより、サービスシステム２は、利用者の目的行動への意思を向上させるために適切な施策を実行することができる。

なお、ルール記録部１４に記録される施策データには、例えば、特性値θおよび判断値の様々な組み合わせにそれぞれ対応する利用者への施策を示すデータが含まれる。

［推定システム１の動作例］
次に、項目反応理論分析部６、イベント効果算出部７および施策指示部８それぞれの動作例を順に説明する。

［項目反応理論分析部６の動作例］
＜ログ入力部５、マトリクス作成部１５および選定部１６の動作例＞
図３は、項目反応理論分析部６におけるログ入力部５、マトリクス作成部１５および選定部１６の動作例を示すフローチャートである。図３において、まず、ログ入力部５がログデータを読み込む（Ｏｐ１）。図４は、ログデータの内容の一例を示す図である。図３に示すログデータでは、セッションを一意に識別するセッションＩＤごとに、ホストＩＤ、参照日、参照時刻および参照ＵＲＬが対応付けられている。ホストＩＤは、利用者端末の識別子である。

セッションＩＤで特性されるセッションを特定する方法は存在するが、例えば、同一ホストＩＤの利用者端末からの所定時間以内のアクセスは同一セッションのアクセスとすることができる。この場合、例えば、所定時間ｔ（例えば、ｔ＝３０分）として、同一利用者による連続する２回のアクセスの時間間隔がｔ以内の場合は前記２回のアクセスは同一のセッションに含まれると判断され、連続する２回のアクセスの時間間隔が閾値ｔを超えた場合は、２回目のアクセスは１回目のアクセスとは別の新たなセッションの開始であると判断される。また、この判断に加えて、利用者から明示的なログインの要求によりセッション開始を検出し、ログアウトの要求からセッションの終了を検出することもできる。

次に、マトリクス作成部１５は、ログデータに含まれるＵＲＬ集合のうち、参照頻度が他より高いＵＲＬを抽出し、初期集合とする（Ｏｐ２）。例えば、マトリクス作成部１５は、ログデータから、調査対象期間の各ＵＲＬの参照回数を日ごとに算出し、参照回数が多い順に所定個数のＵＲＬを各日ごとに抽出し上位集合とする。マトリクス作成部１５は、各日の上位集合をＯＲで結合した和集合を、初期集合とする。このように、各日の参照回数が上位のＵＲＬの和集合を初期集合とすることにより、調査対象期間の途中で削除されたＵＲＬや新しく追加されたＵＲＬも初期集合に含まれるようになる。

マトリクス作成部１５は、Ｏｐ２で抽出された初期集合に含まれる各ＵＲＬが、各セッションにおいて利用者に参照されたか否かを示すマトリクスデータを生成する（Ｏｐ３）。図５は、マトリクス作成部１５により作成されるマトリクスデータの内容の一例を示す図である。図５に示す例では、マトリクスの各行の要素がそれぞれセッションＩＤに対応し、各列の要素はそれぞれＵＲＬに対応する。そのため、Ｎ×ｎ₀マトリクスの行数Ｎは、セッション数であり、列数ｎ₀は、初期集合のＵＲＬ数となっている。マトリクスの各要素は、要素の行に該当するセッションが、列に該当するＵＲＬを参照したかどうかを“１”または“０”のフラグで表している。例えば、１行２列目の要素“１”は、セッションＩＤ＝“ＳＩＤ１”のセッションにおいて、“ＵＲＬ２”が参照されたことを示している。

なお、マトリクス作成部１５は、例えば、１つのセッションにおいて所定回数以上（または所定時間以上）参照されたＷｅｂページのＵＲＬの要素を“１”、セッションにおける参照回数が前記所定回数に満たないＵＲＬ（また、参照時間が所定時間に満たないＵＲＬ）の要素を“０”とすることもできる。また、マトリクスの要素は、上記“１”および“０”のフラグの代わりに論理値（ＴＲＵＥ、ＦＡＬＳＥ）であってもよいし、要素は必ずしも“１”“０”のように２値である必要はない。

選定部１６は、Ｏｐ３で生成されたマトリクスデータにおける目的ページのＵＲＬを表す列と、他のページのＵＲＬを示す列との相関を算出する（Ｏｐ４）。例えば、ピアソンの積率相関係数を用いて前記相関を算出することができる。

例えば、商品を販売するためのＷｅｂサイトにおいて、目的行動である商品購入の最終確認した後に表示されるサンキューページが目的ページである場合、商品を選択した場合に表示されるページ（商品をカートに入れたことを示すページ）やログインページなどは、目的ページに関連が深いといえる。これに比べて、Ｗｅｂサイトのトップページのように、商品購入意思の有無に関わらず多くの利用者が参照するページは、サンキューページとの関連は浅いといえる。このような各Ｗｅｂページの目的ページに対する関連度合いが、選定部１６の前記相関の計算により得られる。

選定部１６は、Ｏｐ４で算出された各列ごとの目的ページＵＲＬの列との相関を用いて、目的ページに関連のあるＷｅｂページのＵＲＬを選定する（Ｏｐ５）。例えば、選定部１６は、相関係数がゼロであるとする帰無仮説を棄却でき、かつ相関係数が負でないＵＲＬのみを初期集合から選択する。これにより、目的ページと関連の薄いＷｅｂページは、初期集合から除外される。なお、相関の計算方法および相関に基づくＵＲＬの選定方法は、上記例に限られない。

選定部１６は、Ｏｐ５で選定されたＵＲＬの列以外の列をマトリクスから除外し、選定マトリクスデータを生成する。選定マトリクスデータには、Ｏｐ５で選定されたＵＲＬの列だけが残っている。なお、選定部１６は、マトリクスデータを更新して選定マトリクスデータとしてもよい。

上述のように、選定部１６が、目的行動と相関のあるＵＲＬ集合を選択して選定マトリクスデータを生成することで、分析部１７による項目反応理論の項目（試験項目）として用いるＵＲＬ集合を適切に選定することできる。その結果、項目反応理論を用いた目的行動への意思の度合いのより正確な推定が可能になる。また、分析部１７の分析対象となるＵＲＬ集合（項目）が自動抽出されるので、運用者にＷｅｂサイトに対する知識がない場合、またはＷｅｂサイト構成が期間途中での変更があった場合等でも、利用者の目的行動への意思の度合いの推定が可能になる。

＜分析部１７および除外判断部１８の動作例＞
図６は、分析部１７および除外判断部１８の動作例を示すフローチャートである。図６に示す処理は、図３に示した処理の後に実行される処理の例である。まず、分析部１７は、選定部１６が生成した選定マトリクスデータに対して、項目反応理論を適用して分析を行う（Ｏｐ７）。分析部１７は、マトリクス記録部１０から選定マトリクスデータを読み込んで、各セッションの目的行動の意思の度合いを示す特性値θの推定値、各ＵＲＬの困難度パラメタおよび識別力パラメタの推定値、並びにＵＲＬ参照パターンと特性値θとの対応を示す対応データを出力し、分析結果記録部１１に記録する。ここで、項目反応理論について説明する。

項目反応理論(Item Response Theory: IRT) は、潜在特性分析の一種であり、試験問題の分析や作成に利用される理論である（参考文献[1][2]）。

（参考文献[1]）豊田秀樹著「項目反応理論（入門編）」朝倉書店、２００２
（参考文献[2]）豊田秀樹著「項目反応理論（入門編）」朝倉書店、２００２
項目反応理論では、各項目の正答確率が、測定したい特性値を変数とする関数で表される。この関数は項目特性関数と呼ばれる。項目特性関数にいくつかのパラメタを組み込んで、パラメタを計算により推定することにより、測定したい特性値を計算することができる。項目反応理論を用いた複数の項目を含むテストの受験者の特性値（能力）の算定は、例えば、次にようにして行われる。受験者の能力が高いほど項目の正答率が高いという前提に基づき、各項目の難易度をＳ字曲線でモデル化する。このＳ字曲線の関数が項目特性関数の一例であり、例えばロジスティック関数が用いられる。そして、Ｓ字曲線と各受験者の正答パターン（反応パターン）から、受験者の能力および項目の難易度を同時に推定する。

例えば、各項目の正答率は、能力が低い受験者では０％に近く、能力が高いほど正答率が上昇し、ある程度の能力を超えるとほぼ１００％正答すると考えられる。項目反応理論の考え方に従えば、各項目の難易度は、能力θ（未知数）に対するＳ字曲線でモデル化することができる。例えば、テストの項目の正答確率を受験者の能力θで表した項目反応関数ｐ（θ）は下記式（１）で表される。

上記式（１）は、３パラメタ・ロジスティックモデルの関数である。上記式（１）において、パラメタb は、問題の難しさを決める困難度パラメタである。パラメタ a は、曲線のなだらかさを表すパラメタであり、すなわち、問題が能力の高低を明確に判定する程度を表す識別力パラメタである。パラメタｃは、あて推量でも正答する確率で、あて推量パラメタと呼ばれる。これらのパラメタは、項目母数の一例である。

受験者 i の n個の問題に対する反応（正答を１、誤答を０とする）を u_i = [ u_i 1, u_i 2, ... u_i j ... u_i n] と表記すると、Ｎ人の被験者の反応パターン行列Ｕが観察される確率（尤度）は、例えば、下記式（２）で表される。

この尤度を、最大化するパラメタ θ, a, b, c が試験結果Ｕを用いて推定される。推定には、同時最尤推定法や、周辺最尤推定法等が用いられる。このような項目反応理論による分析を実現するパッケージソフトとして、例えば、オープンソースソフトウエアもしくは市販のライブラリを用いることもできる（例えば、参考文献[3]参照）。

（参考文献[3]） Dimitris Rizopoulos, "ltm: An R package for Latent Variable Modelling and Item Response Theory Analyses," Journal of Statistical Software , Volume 17, 2006, Issue 5, American Statistical Association, (Online Journal http://www.jstatsoft.org/ )
項目反応理論をＷｅｂサイト分析に応用する場合、例えば、利用者が各ＵＲＬを「参照した・しない」の情報をテストの各項目の正答・誤答とみなすことができる。そして、各セッションで利用者が参照したＵＲＬを示すデータ（参照ＵＲＬパターン）を項目反応理論に基づいて分析し、潜在的な目的行動の意思の度合いを示す値θを計算することができる。

分析部１７による項目反応理論を用いた計算の例を説明する。ここでは、利用者の目的行動への意思の度合いを示す特性値をθとする。そして、特性値θの利用者がセッションにおいてある１つのＵＲＬを参照する確率が、上記式（１）で示した項目反応関数ｐ（θ）で表されるとみなして計算が行われる。さらに、分析部１７においては、選定部１６で選定された各ＵＲＬが上記各項目に対応し、各セッションが上記各受験者に対応するように計算がなされる。

具体的には、分析部１７は、上記の選定マトリクスデータの行列を、上記式（２）における反応パターン行列Ｕとして、パラメタθ、ａ、ｂ、ｃの推定値を計算する。例えば、選定マトリクスデータの行列が、Ｎ行×ｎ列の場合、すなわち、分析対象のＵＲＬの数がｎ、セッション数がＮの場合について説明する。この場合、セッションｉ（ｉ＝１、２、・・・、Ｎ）におけるＵＲＬｊ（ｊ＝１、２、・・・ｎ）に対する利用者の反応（参照の場合“１”、非参照の場合“０”とする）を、u_i = [ u_i 1, u_i 2, ... u_i j ... u_i n]と表すことができる。さらに、セッションｉの利用者の特性値をθｉ、ＵＲＬｊの項目反応関数ｐ（θ）（上記式（１））における各パラメタをａ_j、ｂ_j、ｃ_jとして、分析部１７は、上記式（２）におけるθｉ、ａ_j、ｂ_j、ｃ_jの推定値を計算する。これにより、ｉ＝１、２、・・・Ｎそれぞれのθｉおよびｊ＝１、２、・・・ｎそれぞれのａ_j、ｂ_j、ｃ_jが計算される。

本実施形態では、宛て推量パラメタｃ_jは常にゼロと仮定し、困難度パラメタｂ_jと識別力パラメタａ_jの推定値を計算する場合について以下説明する。

分析部１７により、セッションごとの利用者の特性値θｉおよびＵＲＬごとの困難度パラメタｂ_j、識別力のパラメタａ_jが計算されると、除外判断部１８は、上記ロジスティック曲線（項目反応関数ｐ（θ））パラメタａ_j、ｂ_jのあてはめ精度が、予め指定された範囲から外れていないかを判断する（図６のＯｐ８）。

例えば、分析部１７は、上記困難度パラメタｂ_jの推定値に加えて標準誤差もさらに出力することができる。図７は、分析部１７が出力するａ_j、ｂ_jの推定値およびｂ_jの標準誤差の一例を示す表である。除外判断部１８は、各ＵＲＬ（各項目）の困難度パラメタｂ_jについて、標準誤差がスレショルド（例えば、１とする）を超える項目を、削除候補ＵＲＬのリストに追加する。図７に示す例では、ＵＲＬ５（ｊ＝５）の標準誤差“３２．６１３１”がスレショルド“１”を超えているので“ＵＲＬ５”が削除候補ＵＲＬリストに追加される。このように、標準誤差が大きくなるＵＲＬは、θに対する正答率がきれいなＳ時曲線に該当しないうことであり、当該ＵＲＬの参照と目的行動の意思との関連に疑いの余地があると考えられる。

なお、削除候補ＵＲＬの判断は、上記例に限られない。例えば、除外判断部１８は、識別力のパラメタａ_jが負の項目（逆転項目）を、削除候補ＵＲＬとしてもよい。例えば、図７に示す例では、ＵＲＬ３（ｊ＝３）の識別力のパラメタａ₃“−０．１８９”が負であるので“ＵＲＬ３”が削除候補ＵＲＬリストに追加される。

また、除外判断部１８は、テスト情報関数（統計分野ではフィッシャー情報量と呼ばれる）を計算する（図６のＯｐ９）。テスト情報関数は、あるセッションｉの特性値がθｉと計算されたときに、θｉが実際の特性値θ_realとどの程度ずれる可能性があるかを表す関数である（例えば、上記参考文献[1]参照）。

テスト情報量は、テスト情報関数によりθ値ごとに算出される値であり、各項目の項目情報量の和で表すことができる。項目ｊ（ＵＲＬj）のθiにおける項目情報量Ｉｊ（θｉ）は、例えば、下記式（３）で算出できる。

Ｄは定数１．７である。ａjはＵＲＬｊに対して算出された識別力パラメタである。ｐj(θi)は、θｉの目的行動への意思を持つ利用者が、ＵＲＬｊを参照する確率をロジスティック曲線モデルから算出したものである。ｑj(θi)は、逆に、θｉの購買意思を持つ利用者が、ＵＲＬｊを参照しない確率である。テスト情報関数Ｉ（θi）は、例えば、下記式（４）に示すように、項目情報量Ｉｊ（θｉ）の各項目（ｊ＝１〜ｎまでの）和で表される。

テスト情報量の平方根の逆数１／√（Ｉ（θ））は、θ推定値の標準誤差すなわち（θ推定値の分布の標準偏差）になる。θでの標準誤差が大きい場合には、その領域で目的行動への意思が正確に推定できないことを意味する。例えば、θが中〜低の領域（本実施形態の例ではθ＝０．２５〜２．０）で大きなずれ（標準誤差）を生じる場合は、あと一押しで目的行動に至る利用者と、全く関心のない利用者との区別が難しくなる。そのため、θの各領域で満遍なく、ずれ（標準誤差）が少ないことが好ましい。

あてはめ精度の悪いＵＲＬ（すなわち、Ｏｐ８で抽出された削除候補ＵＲＬ）は、分析部１７による項目反応理論の計算からはずすことが好ましいが、一方で、ＵＲＬ集合の要素の数（項目数）が減ると、一般に、テストの測定精度は悪化する。上記のテスト情報量は、このテストの測定精度を示す値である。そこで、除外判断部１８は、上記Ｏｐ８でパラメタのあてはめ精度が悪いと判断されたＵＲＬを、分析対象の項目から除外した場合の、テスト情報量の悪化の有無を判断する（Ｏｐ１０）。

例えば、Ｏｐ８で抽出された削除候補ＵＲＬが存在し、かつ、Ｏｐ９で計算されたテスト情報量の標準誤差１／√（Ｉ（θ））が予め設定された閾値Ｋ（θ）以下の場合に、除外判断部１８が、前記削除候補ＵＲＬの削減余地あり（Ｏｐ９でＮＯ）と判断する。一例として、所定範囲のθ（例えば、１．０＜θ）において、閾値Ｋ（θ）＝０．５とすることができる。図８は、縦軸に標準誤差１／√（Ｉ（θ））、横軸にθとして、除外判断部１８によって計算される標準誤差をプロットしたグラフの一例である。図８に示す例では、―０．２５＜θの範囲で、標準誤差が１以下であり、１．０＜θの範囲で、標準誤差が１．０以下になっている。なお、テストの測定精度を判断する方法は、上記のテスト情報関数を用いる方法に限られない。

除外判断部１８は、Ｏｐ９でＮＯと判断した場合、Ｏｐ８で抽出された削除候補ＵＲＬの列を選定マトリクスデータから削除する（Ｏｐ１２）。なお、ここで、削除候補ＵＲＬのうちの一部（例えば、あてはめ精度が最も悪いＵＲＬ）が削除されてもよい。そして、前記削除後の選定マトリクスデータに対して、項目反応理論を適用した分析から分析結果の判断まで（Ｏｐ７〜Ｏｐ１０）の処理が繰り返される。

除外判断部１８が、Ｏｐ９でＹｅｓと判断した場合は、削除候補ＵＲＬの削除せず、Ｏｐ７で計算された結果を、分析結果記録部１１に記録する（Ｏｐ１１）。

分析結果には、例えば、各セッションの目的行動への意思の度合いの推定値、各ＵＲＬの困難度パラメタおよび識別力パラメタの推定値、ＵＲＬ参照パターンと目的行動への意思の度合いのとの対応データが含まれる。各セッションの目的行動への意思の度合いの推定値は、「セッションＩＤ、特性値θ」の組で表すことができる。

各ＵＲＬの困難度パラメタおよび識別力パラメタの推定値は、例えば、「ＵＲＬ，困難度、識別力」の組で表される。例えば、図７に示したデータ内容から、ＵＲＬ３およびＵＲＬ６が除かれた内容が困難度パラメタおよび識別力パラメタの推定値として記録される。

ＵＲＬ集合を参照したか否かを示す選定マトリクスの列数（＝ＵＲＬ数）をｎとすると、対応データは、例えば、「ｎ個の“０”または“１”の要素を持つベクトル、特性値θ」の組で表される。同じ参照パターンを持つ利用者は同じ購買意思推定値を持つことになる。

図９は、対応データの内容の一例を示す図である。図９に示す例では、ＵＲＬ参照パターンを識別するパターンＩＤと、参照したＵＲＬを“１”、参照してないＵＲＬを“０”としてＵＲＬ参照パターンを示すデータと、ＵＲＬ参照パターンに対応する特性値θとが対応付けられて記録されている。パターンＩＤは、例えば、各セッションに割り振られる。この場合、重複するＵＲＬ参照パターンには同じパターンＩＤが割り振られてもよい。

図９に示す対応データにより、セッションにおけるＵＲＬ参照パターンごとに、特性値θが対応付けられる。例えば、パターンＩＤ“Ｐ００１”で示されるＵＬＲ参照パターンの利用者、すなわちセッションにおいてＵＲＬ２およびＵＲＬ５〜７、・・・のＷｅｂページをたどった利用者の目的行動への意思の度合いは、“−０．１９８２７”であることがわかる。

また、対応データに含まれるＵＲＬ参照パターンには、目的ページを参照していなパターンも含まれる。そのため、セッションにおいて目的行動に至らなかったパターンどうしについても、利用者の目的意思の度合いを比較することができる。

＜分析結果の表示例＞
ここで、図１０および図１１に、分析結果の表示例を示す。図１０は、各セッションの目的行動への意思の度合いの分布を示すヒストグラムの表示例である。図１０に示すヒストグラムは、縦軸がセッション数、横軸が特性値θを示す。図１０に示すヒストグラム中で、黒色で示した部分Ｍは、利用者が目的行動に至った（目的ページを参照した）セッションを示す。すなわち、実際に目的行動を行った利用者ほど、目的行動への意思の度合いを示す特性値θが高いことが示されている。また、各特性値θには、上記対応データによりＵＲＬ参照パターンが対応付けられている。目的行動が全く起きなかった行動パターン（図１０の領域Ｓ）においても、目的行動への意思の度合いの高低を比較できる。

図１１は、項目特性曲線（ＩＣＣ：ＩｔｅｍＣｈａｒａｃｔｅｒｉｓｔｉｃＣｕｒｖｅｓとも呼ばれる）のグラフの表示例である。ＵＲＬｉの項目特性曲線は、例えば、上記式（１）に示すロジスティック関数に、識別力パラメタａ_j、困難度パラメタｂ_jを代入した式で示される曲線（Ｓ時カーブ）である。グラフの縦軸は確率を、横軸は特性値θを示す。グラフにおける曲線ｇは、目的ページのＵＲＬの項目特性曲線である。このグラフを運用者が見た場合には、例えば、実際に目的ページに相当するＵＲＬを参照する利用者よりも、目的行動への意思の度合いが低い利用者が、どのようなＵＲＬを参照する可能性が高いかを把握することができる。

＜項目反応理論分析部６による効果＞
以上の図３、図６に示した項目反応理論分析部６における処理により、購買行動と相関のある適切なＵＲＬ集合を用いて、項目反応理論に基づく分析が行われるので、実際に購買行動を行った利用者ほど高い「購買意思」を示すことになる。目的ページＵＲＬを示す情報が予め設定されるだけで、Ｗｅｂサイトの利用者の目的行動への意思の度合いを示す情報が得られる。そのため、運用者は、目的ページＵＲＬ以外のサイト構成に関する知識は一切持っていなくても、意思を推定できる。また、テスト情報関数を用いてテスト精度を検証しているので、直接目的行動が起きないような行動パターン（ＵＲＬ参照パターン）についても、利用者の目的行動への意思を相対的に評価することが可能になる。

また、分析部１７は、上記のように、ＩＲＴ（Item Response Theory）モデルを用いて、各セッションにおける利用者の特性値θを計算することにより、ＵＲＬごとの重みの違いを加味して、セッションにおける利用者の目的行動の意思度合いを示す特性値θを計算することができる。

また、項目反応理論では、受験者が正答した問題を示すデータ（正答パターン）の集合を用いて、能力の高い受験者の集団から能力の低い受験者の集団まで、能力の連続的な指標で評価できる特長がある。上述のように、テストの項目に相当するＵＲＬ集合を適切に選定した上で、Ｗｅｂサイト利用者の「目的行動（例えば、購買）への意思」の分析に項目反応理論を用いれば、目的行動に至らない参照ＵＲＬパターンについても意思の高低を判定することができる。例えば、購買促進の観点から見て、あと一押しすれば購買に至る利用者の層と、全く購買する気のない利用者の層とを区別することが可能になる。

また、項目反応理論には、「複数のテスト間の結果の比較が容易」という特長がある。ＷｅｂサイトのＵＲＬ構成が途中で変化する場合、テストの問題の項目集合が変化する場合に対応する。そのため、テストの問題の項目集合に相当するＵＲＬ集合を適切に選定した上で、Ｗｅｂサイト利用者の「目的行動意思」の分析に項目反応理論を用いれば、サイトのＵＲＬ構成が途中で変化したとしても、前記変化で削除された過去の該当ＵＲＬと新規に現れた該当ＵＲＬとの関係を、変化の前後で共通に存在するＵＲＬと該当ＵＲＬとの関係から算定することができる。このため、期間途中でのサイト構成変更により過去に作成したモデルが有効でなくなる、といった問題の解決が見込まれる。

上記算定には、例えば、上記参考文献[1]の7.2節に記載されている共通項目法を用いることができる。ＵＲＬ構成を変更する前のログをログ１、変更後のログをログ２とする。本実施形態において項目反応理論を用いてログ１を分析して得られるパラメタを θi, aj, bj 、ログ２を分析して得られるパラメタを θ^*i, a^*j, b^*j とする。ｉはセッションの番号、ｊはＵＲＬの番号である。また、このとき、ログ１とログ２に共通して存在する項目に関しては、
θ^*i = Ｋ θi + Ｌ ――――（５）
a^*j = (1/Ｋ) aj ――――（６）
aj = Ｋ bj + Ｌ ――――（７）
が成り立つ。上記式（５）〜（７）における未知パラメタＫ, Ｌの推定値Ｋ´, Ｌ´は次の式（８）（９）で得ることができる。そのために、項目反応理論分析部６で分析されるＵＲＬ集合のうち、ログ１とログ２に共通に存在するｍ個のＵＲＬに関して、b^*j の平均と標準偏差、bjの平均と標準偏差を求めておく必要がある。

Ｋ´ = (b*jの標準偏差)/(bjの標準偏差) ――――（８）
Ｌ´= (b*j の平均) − Ｋ´ (bj の平均) ――――（９）
これにより、Ｋ,Ｌの推定値、Ｋ´, Ｌ´が求まる。これらのパラメタを、例えば上記式（５）〜（７）にあてはめることで、ログ２で新たに増えたＵＲＬの困難度、識別力や、セッションのθ値と、ログ１のＵＲＬの分析結果との関係が明らかになる。そのため、ログ２で新たに増えたＵＲＬの困難度、識別力や、セッションのθ値についても、ログ１の分析結果上に変換して比較することができる。

［イベント効果算出部７の動作例］
イベント効果算出部７は、セッション途中までのＵＲＬ参照パターンを解析し、ＵＲＬ参照パターンを基に、キャンペーン等のイベントを実施した場合の効果を分析する。なお、イベントは、限定された期間に利用者に対して実施される施策である。イベントは、サービスシステム２を介して利用者にサービスまたは情報を提供することにより実施される場合も、サービスシステム２を介さずに行われる場合もある。イベントの例として、商品値引きキャンペーン、入会無料キャンペーン、バーゲン等が挙げられる。

本動作例においては、イベント効果算出部７は、入力データとして、項目反応理論分析部６が出力したＵＲＬ参照パターンと特性値θの対応データと、ログ入力部５が入力するログデータを用いる。その他、入力パラメタとして、目的行動の意思をセッションの何ページ参照した時点で計算するかを示すＮの値、特性値θの区間を示す情報、および通常期間とイベント実施期間（以下、イベント期間と称する）を示すデータが使用される。特性値θの区間を示す情報は、例えば、特性値θのとり得る範囲を、いくつかのセグメントに分割するための分割方針を示す情報である。上記入力パラメタは、例えば、ユーザインタフェース部９を介して、運用者から入力されてもよい。

以下に示す例は、Ｎ＝４，６，８であり、θの区間の分割については−１≦θ≦４の範囲が２０の区間に分割される場合の例を説明する。この場合１区間の幅は０．２５になる。

図１２は、イベント効果算出部７における途中特性推定部１９およびイベント効果分析部２０の動作例を示すフローチャートである。図１２に示すように、まず、途中特性推定部１９は、ログデータから、各セッションの初期Ｎページまでの参照ＵＲＬを抽出し、Ｎページ参照した段階での利用者の特性値θ_Nを決定する（Ｏｐ２１）。

Ｏｐ２１において、途中特性推定部１９は、ログデータから抽出した各セッションの初期Ｎページまでの参照ＵＲＬパターンと、分析結果記録部１１に記録された対応データの参照ＵＲＬパターンとを照合する。Ｎページまでの参照ＵＲＬパターンと一致する参照ＵＲＬパターンに対応する特性値θがθ_Nとなる。すなわち、途中特性推定部１９は、ログデータが示すセッションにおけるＮページまでの利用者の行動（参照ＵＲＬパターン）に対応する特性値θを、対応データから取り出し、θ_Nとして当該セッションに割り当てる。

各セッションのθ_Nは、遷移データ記録部１２にセッションごとに遷移データとして記録される。遷移データとして、各セッションのθ_Nの他に、セッションが行われた時を示すデータ、Ｎページ参照より後の特性値θ_AFT、並びにθ_Nおよびθ_AFTぞれぞれの属する区間が記録される。

図１３は、遷移データの内容の一例を示す図である。図１３に示す例では、セッションＩＤ、日時、参照ＵＲＬ数、θ_END、目的行動、θ₄、θ₆、θ₈それぞれの区間（ｓ１、ｓ２、ｓ３）、およびθ_ENDの区間ｓＴが、セッションごとに記録されている。θ_ENDは、セッション終了時の最終的な利用者の特性値である。“ＮＡ”は、該当ＵＲＬ回数に到達する前にセッションが終了したことを示す。例えば、１行目のセッションＩＤ＝“ＳＩＤ１”のデータが示すセッションは、利用者が６ページ目のＵＲＬを参照した後、８ページ目のＵＲＬを参照する前に終了している。

日付は、セッションが行われた時の日付であり、ログデータから取得可能なデータである。参照ＵＲＬ数は、セッションにおいて利用者が参照したＵＲＬの数である。目的行動の列のデータは、目的ページを参照したか否かを“０”または“１”の２値で示すデータである。ｓ１、ｓ２、ｓ３およびｓＴの例においては、θの区間がＫ１〜Ｋ２０で表される。−１≦θ≦４の範囲を２０等分してできる各区間を値の小さい方から順にＫ１、Ｋ２、Ｋ３、・・・、Ｋ２０としたものである。例えば、Ｋ１は−１≦θ＜−０．７５の区間、Ｋ２は−０．７５≦θ＜−０．５の区間をそれぞれ表す。

遷移データが記録されると、イベント効果分析部２０は、遷移データで示されるセッション集合を、通常期間のセッションと、イベント期間のセッションに分類する（図１２のＯｐ２３Ｏｐ）。例えば、遷移データに含まれる各セッションの日付が、イベント期間内のものか否かを判断することにより上記分類が可能である。

イベント効果分析部２０は、特性値θ_Nがその後に特性値θ_AFTに遷移する遷移確率を、イベント期間と、通常期間それぞれについて計算する。（Ｏｐ２３）。例えば、イベント効果分析部２０は、セッションにおいてＮページを参照した段階で区間Ｋｉに属していた特性値が、次の段階で区間Ｋｊに遷移する遷移確率を計算する。この遷移確率は、イベント期間のセッション集合および通常期間のセッション集合それぞれについて計算される。また、この遷移確率は、複数通りの「Ｎ、区間Ｋｉ、区間Ｋｊ」の組について計算される。例えば、Ｋ１からＫ２０までのそれぞれの区間から、Ｋ１〜Ｋ２０の各区間への遷移確率が算定される。算出結果は、例えば、「イベントフラグ、区間Ｋｉ、区間Ｋｊ、遷移確率」を一組のレコードとして記録される。イベントフラグはイベント期間と通常期間の区別を示す。

例えば、Ｎ回目のＵＲＬ参照段階での特性値θ₈の区間がＫ５である場合に、その後の遷移確率を計算するには、図１３に示す遷移データのうち、ｓ８がＫ５であるセッション（ＳＩＤ５、ＳＩＤ９）の次の段階の区間ｓＴの値（Ｋ５、Ｋ６）が用いられる。

次に、イベント効果分析部２０は、「区間Ｋｉ、区間Ｋｊ」の組み合わせそれぞれについて、通常期間とイベント期間との遷移確率の差分を計算する（Ｏｐ２４）。そして、イベント期間の遷移確率の通常期間に対する上昇度（差分）が大きい組から順にソートする。そして、上昇度の降順にソートされた「通常期間（区間ｉ，区間ｊ，確率）、イベント期間（区間Ｋｉ，区間ｊ，確率）、上昇率」の組のリストをイベント効果パターンデータとして生成し、イベント効果記録部１３に記録する（Ｏｐ２５）。

図１４は、イベント効果パターンデータの内容の一例を示す図である。図１４に示す例では、イベント種類、イベント期間、（通常期間ｓ８、通常期間ｓＴ、遷移確率）、（イベント期間ｓ８、イベント期間ｓＴ、遷移確率）および上昇率が、ｓ８とｓＴの組み合わせごとに記録されている。なお、図１４に示す例では、ｓ８の区間と最終の区間との間の遷移確率に関するデータのみであるが、例えば、ｓ６の区間と最終の区間との間や、ｓ４の区間とｓ６の区間との間等のように他の区間の組み合わせに関するデータも記録されてもよい。

このようなイベント効果パターンデータでは、セッションにおける特性値θの遷移パターンのイベントの有無による違いが上昇率で示されている。また、様々な遷移パターンについての上昇率が記録される。そのため、イベント効果パターンデータにより、特性値θ（すなわち、利用者の目的行動への意思の度合い）の遷移パターンと、イベントによる効果との対応関係が明らかになる。

＜イベント効果パターンデータの表示例＞
図１５は、イベント効果パターンデータをグラフにして表示する場合の表示例を示す図である。図１５の左側のグラフは、最初の８ページを参照した段階（Ｎ＝８）での、通常期間の「Ｋｉ，Ｋｊ，確率」をグラフに表したものである。図１５の右側のグラフは、１０％割引イベント期間の「Ｋｉ，Ｋｊ，確率」をグラフに示したものである。これらのグラフは、縦軸に８ページ参照段階での特性値θ₈の区間Ｋ１〜Ｋ２０、横軸に最終的な特性値θ_ENDの区間Ｋ１〜Ｋ２０をとり、遷移確率を2次元平面上に表したものである。図１５に示す例では、ハッチングが細かさにより遷移確率が示されている。例えば、ハッチングが細かい程（色が濃いほど）遷移確率が高いことを意味している。

これらのグラフに示される例では、θ₈が０．２５以下の利用者は、割引イベントの有無に関わらずθの伸びは少ない。この層の利用者は、割引イベントを実施しても目的行動に至る可能性は低いと判断できる。

一方、θ₈が１以上の利用者は割引イベントの有無に関わらず、最終的なθ_ENDは高い。この層の利用者は、割引イベントを実施しなくても目的行動に至る可能性は高いと判断できる。

１０％割引イベントの有無で、最も目的行動の意思の度合いθの上昇が大きいのは０．２５＜θ₈≦１（区間Ｋ６〜Ｋ８）である。すなわち、８ページ参照段階で、この区間Ｋ６〜Ｋ８の特性値を持つ利用者は、通常期間には、最終的な目的行動意思の特性値θ_ENDが１．２５以上になる確率は１７％である。これに対して、割引イベント期間には、最終的な目的行動意思の特性値θ_ENDが１．２５以上になる確率が２９％にのぼっている。このことは、図１５の下段のグラフにおける破線で囲まれた領域Ｙにも表れている。

このように、イベント効果パターンデータを示すグラフがユーザインタフェース部９を介して、運用者に提示されることで、運用者は、例えば、セッションにおいて、どのような行動をする利用者にイベントを実施すれば効果があるかを判断することができる。

＜遷移データの表示例＞
遷移データ記録部１２の遷移データも、ユーザインタフェース部９を介して運用者に提示することができる。図１６は、遷移データの表示例を示す図である。図１６には、２、４、６および８ページぞれぞれの参照段階における利用者の特性値の分布を示すヒストグラムの例を示す。これらのヒストグラムにおいて、縦軸はセッション数、横軸は特性値を示す。

このようなヒストグラムが表示されることにより、運用者は、全利用者の目的行動への意思の度合いがどのように遷移するかを捉えることができる。例えば、図１６に示す例では、参照ＵＲＬ数が増えるにしたがって、ヒストグラムの高さは全体的に低くなっている。これにより、例えば、参照ＵＲＬ数が増えるにしたがって終了するセッションが多くなることがわかる。また、参照ＵＲＬ数が増えるにしたがって、高い特性値を持つ利用者の割合が増えているので、特性値は参照ＵＲＬ数に従って単調増加していることがわかる。

［施策指示部８の動作例］
本動作例で、施策指示部８は、現在ログ記録部４ｂの現在ログデータ、およびイベント効果記録部１３のイベント効果パターンデータを入力し、実施施策を表す施策コードをサービスシステム２に対して出力する。

図１７は、施策指示部８の動作例を示すフローチャートである。まず、現在ログ入力部２１がサービスシステム２から出力される現在ログデータをリアルタイムで入力し、途中意思推定部２２へ渡す（Ｏｐ３１）。例えば、利用者端末３ａ〜３ｃからサービスシステム２へＵＲＬ参照の要求が送信される度に、そのＵＲＬ参照に関するログデータが新たに生成される。ログデータが新たに生成される度に、現在ログ入力部２１は、現在ログ記録部４ｂを介して受け取り、途中意思推定部２２へ渡す。なお、現在ログ入力部２１は、現在ログ記録部４ｂを介さずにサービスシステム２から直接現在ログデータを受信してもよい。

途中意思推定部２２は、現在ログデータで示される各セッションで、Ｎページ目のＵＲＬが参照されたか否かを判断する（Ｏｐ３２）。ここで、Ｎの値は、例えば、上記のイベント効果算出部７の動作例での値（Ｎ＝４、６、８）と同じ値が用いられる。この場合、途中意思推定部２２は、現在ログデータで示されるセッションにおいて利用者が４ページ目、６ページ目または８ページ目を参照したことを検出する。

Ｏｐ３２でＮＯの場合は、現在ログ入力（Ｏｐ３１）が繰り返される。Ｏｐ３２でＹＥＳの場合、途中意思推定部２２は、現在ログデータから検出されたＮページ目までのＵＲＬの参照パターンと、分析結果記録部１１の対応データのＵＲＬ参照パターンとを照合し、Ｎページ目のＵＲＬ参照段階の利用者の特性値θｃを決定する（Ｏｐ３３）。すなわち、現在ログデータが示す現在サービスシステム２へアクセス中の利用者の、セッションの途中（Ｎページ目参照段階）までの行動から、対応データに基づき、現時点での特性値θ_NCを算出する。

Ｏｐ３３で、イベント効果判定部２３は、Ｏｐ３２で決定された特性値θ_NCにと、イベント効果記録部１３に記録されたイベント効果パターンデータを用いて、目的行動への意思の度合いを示すθ_NCが、イベントによりどの程度上昇するか判定する（Ｏｐ３４）。例えば、θ_NCがイベントにより目的行動への意思が上昇するパターンか否かが判定される。

具体的には、イベント効果判定部２３は、イベント効果パターンデータで示される特性値θの遷移パターンのうち、Ｎ番目のＵＲＬ参照段階からの遷移パターンであって、θ_NCの属する区間からそれより上の区間へ遷移する遷移パターンのデータを参照する。そのような遷移パターンそれぞれの上昇率に基づいて、イベントによりどの程度上昇しうるかを示す判断値を生成する。例えば、上昇率が所定の閾値を超える遷移パターンが一定割合異常占める場合は、イベント効果有りを示すフラグを判断値とすることができる。なお、判断値は上記例のフラグに限られない。例えば、上昇率の平均値や、最高上昇率等を判断値としてもよい。

イベント効果判定部２３は、ルール記録部１４に記録された施策データを参照し、この判断値その他、利用者の目的意思の度合いθ_NCに関する情報にマッチする施策を示す情報を抽出する（Ｏｐ３５）。ルール記録部１４の施策データは、例えば、判断値およびθ_NCに関する条件を示すデータと、それぞれの条件を満たす場合の施策を示すデータとが対応付けられて記録されたデータである。

下記表１は、施策データの内容の一例を示す表です。下記表１では、条件、施策および施策コードが、条件と施策の組み合わせごとに、対応付けられて記録されている。

施策決定部２４は、例えば、判断値およびθ_NCが、施策データの条件に合致する場合の対応する施策の施策コードを取得し、サービスシステム２へ出力する（Ｏｐ３６）。なお、施策決定部２４は、例えば、Ｏｐ３３で計算されたθ_NCのセッションのセッションＩＤを、施策コードとともに出力してもよい。これにより、サービスシステム２では、現在セッションの途中の特性値θ_NCを持つ利用者に対して、適切な施策を施すことができる。

例えば、セッションの途中までの行動に基づいてこのセッションの利用者は１０％割引イベントにより目的行動への意思が増大すると判断された場合に、追加の割引１０％を利用者に提示するといった施策が可能になる。このような施策は、例えば、上記表１の１行目に示す「割引イベント効果ありＡＮＤ上昇率＞２０％ならば１０％追加割引提示」といった施策データを記録しておくことで可能になる。

また、利用者のθ_NCと判断値に基づいて計算資源の前記利用者への優先度を変更する施策を行うこともできる。例えば、冷やかしと思われる利用者に対しては、前記利用者からの要求に対するサービスシステム２の処理のスピードを遅くするといった施策も考えられる。この場合、例えば、上記表１の３行目に示すような「Ｎ＞４ＡＮＤ θ_N＜−１ＡＮＤ全てのイベント効果なしならば計算処理優先度１０％減」といった施策データを記録しておくことで可能になる。

なお、施策データに記録される条件の内容は特に限定されない。上記判断値、θ_NC、イベント効果パターンデータに記録された遷移確率や上昇率等のデータに基づいて、利用者の目的行動への意思の度合いに応じた施策を決定できる条件が適宜設定される。

ここで、上記のＯｐ３１〜Ｏｐ３６の処理の具体例を、図１４および表１を参照しながら説明する。例えば、現在ログデータが示すセッションＳ１のＵＲＬ参照履歴が、ＵＲＬＡ→Ｂ→Ａ→Ｃ→Ａ→Ｃ→Ｂ→Ｄと、８ページ（Ｎ＝８）の参照パターンを示している場合であって、Ｏｐ３３で、θ_8C＝“０．２８”と算出された場合について説明する。

イベント効果判定部２３は、図１４のイベント効果パターンデータにおいて、θ₈（Ｎ＝８）の段階における特性値の区間（ｓ８）が“０．２８”の属する区間＝“Ｋ６”である遷移パターンのデータを参照する。図１４に示す例では、１段目のデータが、Ｎ＝８の段階の区間ｓ８が “Ｋ６”であり、これが最終段階（ｓＴ）で “Ｋ１０”へ遷移する遷移パターンのデータである。このデータは、８ページ参照した段階ｓ８で区間Ｋ６の利用者が、セッション終了した段階ｓＴで区間Ｋ１０に遷移する遷移確率は、１０％割引イベントにより０．１９（１９％）分上昇することを示している。このように上昇率が０より大きい場合に、イベント効果判定部２３は、１０％割引イベントによる効果ありを示すフラグを判断値として生成することができる。

施策決定部２４は、この「１０％割引イベントによる効果ありを示す判断値、θ_8C＝“０．２８”、上昇率＝“０．１９”」の組み合わせが施策データに記録された条件を満たすか否かを判断する。上記表１の施策データの例では、上記組み合わせがマッチする条件はない。このような場合、施策決定部２４は、サービスシステム２に施策コードを出力しない。そして、Ｏｐ３１の現在ログデータの入力処理が繰り返される。

また、別の例として、現在ログデータが示すセッションＳ１のＵＲＬ参照履歴が、８ページ（Ｎ＝８）のＵＲＬ参照パターンを示している場合であって、Ｏｐ３３で、θ_8C＝“０．５２”と算出された場合について説明する。Ｎ＝８であり、かつ“０．５２”は区間“Ｋ７”に属するので、施策決定部２４は、図１４に示すイベント効果パターンデータのうち、ｓ８が“Ｋ７”である２〜４行目のデータを参照する。２、３、４行目のデータは、それぞれＫ６からＫ１１、Ｋ１０、Ｋ１２に遷移する遷移パターンを示している。これらの３つの遷移パターンは、いずれも上昇率が０より大きいので、イベント効果判定部２３は、１０％割引イベント効果ありを示す判断値を遷移パターンごとに生成する。

図１４に示す例では、Ｎ＝８における特性値が区間“Ｋ６”から“Ｋ１１”へ遷移する遷移パターンにおいて、イベント期間の遷移確率が“０．３４”、上昇率は“０．１４”である。さらに、この遷移パターンの判断値は「１０％割引イベント効果あり」を示す。そのため、この遷移パターンは、上記表１の２行目の条件「割引イベント効果ありＡＮＤイベント期間の遷移確率＞２０％ＡＮＤ上昇率＞５％」にマッチする。そのため、施策決定部２４は、「１０％追加割引提示」の施策コード“０１”を、ルール記録部１４から取得して、サービスシステム２へ送信する。

なお、施策データで示される施策は、サービスシステム２により実行可能な施策に限られない。例えば、購買意思（目的行動意思）の低い利用者からの問い合わせメールに対しては、サポート要員からの返答を後回しにするといった人的資源の優先度を変更する施策も有り得る。このような場合、例えば、「Ｎ＞４ＡＮＤ θ_N＜−１ＡＮＤ全てのイベント効果なしならば問い合わせ応答優先度ランク低」といった条件および施策を示す施策データがルール記録部１４に記録される。

上記のような施策指示部８の動作例によれば、各セッションのアクセス中の利用者の目的行動意思が推定でき、イベントにより目的行動意思の上昇度合いが高いＵＲＬ参照パターンのリストが得られる。そして、セッション途中での利用者の行動から、その利用者が、イベントによる目的行動意思の増加が見込める層か、イベントに反応しない層か、または、イベントの有無に関わらず目的行動意思が高い層かを推定することができる。この推定を基に、追加のプロモーションを提示したり、サーバの処理の優先度を変えたりといった適切な施策を選定し、実行することが可能になる。

上述した項目反応理論分析部６で算出される特性値θについては、テスト情報関数を用いてテスト精度が検証され、適切な項目について分析が行われているので、目的行動が起きない特性値θが低いＵＲＬ参照パターンについても、利用者の目的行動意思を相対的に比較することができる。このように、様々なＵＲＬ参照パターンに対応する特性値θが、項目反応理論分析部６で精度良く算出されるので、イベント効果算出部７で、イベント期間で目的行動意思が上昇する、特性値の遷移パターンを発見することが容易になる。これにより、例えば、あと一押しで目的行動意思が高くなる可能性が高い利用者層と、何をやっても目的行動意思が高くならない利用者層とを区別することができる。その結果、利用者の特性に応じた適切な施策が可能になる。

［本実施形態による効果、その他］
従来のＷｅｂログ分析の分野では、利用者のＷｅｂページ参照と、目的行動の関連を表す指標として、コンバージョン率が利用される場合がある。コンバージョン率は特定のＷｅｂページ（もしくは最初に参照したＷｅｂページ、あるいはサイトに誘導したバナー広告）を参照した利用者が、最終的にサイトの目的とする目的ページに至る確率を示す。例えば、一連のページの利用者による参照履歴と、購買行動の関係をとらえるのに、コンバージョン率を用いることができる。しかし、コンバージョン率では、購買に至らないＵＲＬ参照パターンは一律にゼロと算定される。そのため、あと一押しすれば購買に至る利用者の層と、全く買う気のない層とを区別できない。そのため、販売促進の観点から言えば、コンバージョン率を使った分析では不十分である。これに対して、上述の推定システム１では、目的行動に至らない参照ＵＲＬパターンについても意思の高低を判定することができるので、上記区別が可能である。

マーケティング分野では、購買行動につながる利用者の行動を知るために、決定木モデルが使われることがある（例えば、下記参考文献 [5]参照）。しかし、決定木分析は購買行動につながる顕著な特徴を抽出するため、全く購買に至らない行動パターン同士の差異を比較ができない。そのため、決定木分析も、前記コンバージョン率の場合と同様に、利用者行動と購買意思の関連を分析する手段としては不十分である。

（参考文献[4]）守口剛、「プロモーション効果分析」、朝倉書店、２００２年１２月
類似の行動をとるセッションをクラスタリングして、クラスタごとの購買確率を求める方法もある。例えば、下記参考文献[5]に記載の方法は、ページ間の遷移回数の類似度によりセッションをクラスタに分類し、各クラスタに対してＣＢＭＧ（Customer Behavior Modelling Graph）と呼ばれる状態遷移グラフを作成して、クラスタごとの購買確率を求める方法である。また、参考文献[6]では、来訪中のセッションがどのクラスタに近いかをリアルタイムに算定し、購買確率の低いクラスタに属するセッションならば、サーバの処理速度を下げることを提案している。

（参考文献[5]）Daniel A. Menasce, Virgilio A.F. Almeida, Rodrigo Fonseca, Marco A. Mendes, "A methodology for Workload Characterization of E-commerce Sites," ACM E-COMMERCE 99, 1999, Denver, pp.119-128.
（参考文献[6]）Daniel A. Menasce, Virgilio A.F. Almeida, Rodrigo Fonseca, Marco A. Mendes, "Business-oriented resource policies for e-commerce servers," Performance Evaluation, Vol.42, 2000, pp.223-229, Elsevier
上記参考文献[5]および[6]の手法では、最初にＷｅｂページの分類を行うステップがあるため、そのサイトのページ構成に関する知識を持つ人が逐次分類を行う必要がある。また、クラスタを遷移確率でモデル化しているため、セッションの初期行動を見ただけでは、そのセッションがどのクラスタに属するかは必ずしも特定できない。また、期間の途中でページ構成に変更があれば、過去に作成したＣＢＭＧモデルが利用できなくなるという問題もある。本実施形態の推定システム１は、上述のように、これらの問題を解決することができる。

利用者のＷｅｂ参照行動から、利用者特性を抽出し、Ｗｅｂサイトの販売促進に用いる方法としては、表示したページのテクストに含まれるキイワードを利用して、利用者のプロファイルを作成する方法もある（例えば、特開2005-216289号公報参照）。この方法では、利用者がアクセス中のＷｅｂサイトの商品の購買に関して、利用者がどれくらい購買の意思があるかの度合いを推定できず、動的な割引の提示などの施策を行う判断ができない。本実施形態の推定システム１では、このような判断も可能である。

各セッションのＵＲＬ参照パターンを項目反応理論に基づいて分析することは、例えば、参考文献[7]において報告がある。しかし、この報告では、購買意思を測るために、適切なＵＲＬ集合を選ぶ仕組みが記載されていない。ＵＲＬ集合の選び方次第では、項目反応理論を用いても購買意思とは全く違う潜在特性を推定してしまう可能性がある。上記推定システム１では、目的行動に関連するＵＲＬ集合を適切に選定した上で分析を行うので、このような可能性が低くなる。すなわち、本実施形態の推定システム１は、サービスシステムの利用者の目的行動の意思を、項目反応理論を用いてより詳細にかつ効率よく推定するのに適した構成を有している。
（参考文献[7]）橋間智博、「IRTによる情報提供型Webサイトのアクセス分析」、FIT2006(第５回情報科学技術フォーラム)、pp.423-425、情報処理学会（IPSJ）と電子情報通信学会・システムソサイエティ（ISS）およびヒューマンコミュニケーショングループ（HCG）合同主催、2006年9月5日.
以上、本発明の実施形態と効果について説明したが、本発明は、上記実施形態に限られず、必ずしも上記の全ての効果を奏する構成に限られない。上記効果の一部のみを得られる構成の推定システムも、本発明に含まれる。他の実施形態としては、例えば、複数のＷｅｂサーバからＷｅｂ利用ログをネットワーク経由で受信し、施策コードをネットワーク経由で、該当Ｗｅｂサーバに返信するＡＳＰ型の推定システムが考えられる。もしくは、Ｗｅｂサーバの１モジュールとして上記推定システムが実装されてもよい。

以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）
利用者から要求を受信し、記録媒体に予め記録されたデータ要素群のうち、前記利用者の要求に応じたデータ要素を前記利用者へ送信するサービスシステムにおける前記利用者が、特定のデータ要素を要求する行動である目的行動を行う意思の度合いを推定する推定システムであって、
前記利用者と前記サービスシステムとの間の一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを読み込むログ入力部と、
一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成部と、
前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定部と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析部と、
前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを記録する分析結果記録部と備える推定システム。

（付記２）
前記分析部で計算された項目母数の標準誤差が所定範囲外である項目を除外項目候補として抽出し、当該除外項目候補を除いた項目について、前記分析部で計算された特性値θの評価値を、所定のテスト情報関数Ｉ（θ）を用いて計算し、当該評価値を用いて、前記除外項目候補を除外するか否かを判断する除外判断部をさらに備え、
前記分析部は、前記除外判断部が前記除外項目を除外すると判断した場合、前記選定マトリクスデータから前記除外項目を前記のデータ要素のデータを削除して、前記項目母数および前記特性値θを再度算出する、付記１に記載の推定システム。

（付記３）
前記ログデータで示される前記一連の通信の１回目からＮ回目までに利用者により要求されたデータ要素と、前記分析結果記録部の対応データが示す各一連の通信で利用者が要求したデータ要素とを照合することにより、ログデータで示される一連の通信で利用者がＮ回データ要素を要求した段階における当該利用者の特性値θ_Nを決定する途中特性推定部をさらに備える、付記１または２に記載の推定システム。

（付記４）
前記途中特性推定部によって計算された各一連の通信における特性値θ_Nとその後の特性値の遷移を示す遷移データを、各一連の通信が行われた時を示す時間データとともに記録する遷移データ記録部と、
遷移度データを、所定のイベントが行われたイベント期間の一連の通信と、イベント期間でない通常期間の一連の通信とに、前記時間データを基に分類し、特性値θ_Nが一連の通信においてθ_AFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて複数通りの特性値θ_Nとその後の特性値θ_AFTの組み合わせについて計算して、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成し、前記組み合わせそれぞれに前記差異データを対応付けてイベント効果パターンデータとしてイベント効果記録部に記録するイベント効果分析部とをさらに備える、付記３に記載の推定システム。

（付記５）
前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θｃを決定する途中意思推定部と、
前記途中意思推定部が決定した特性値θｃを用いて、予めルール記録部に記録された、利用者の目的行動への意思の度合いに関する情報と対応付けられた利用者への施策の情報を含む施策データから前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えた、付記１〜４のいずれか１項に記載の推定システム。

（付記６）
前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θｃを決定する途中意思推定部と、
前記イベント効果記録部に記録されたイベント効果パターンデータから、前記途中意思推定部で決定された特性値θｃに対応する特性値θ_Nの差異データを抽出し、当該差異データを用いてイベントにより前記特性値θｃがどの程度上昇しうるかを示す判断値を生成するイベント効果判定部と、
前記判断値を用いて、予めルール記録部に記録された、種々の判断値に対応する利用者への施策を示す情報を含む施策データから、前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えた、付記４に記載の推定システム。

（付記７）
利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いをコンピュータにより推定する推定方法であって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力工程と、
前記コンピュータが、一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成工程と、
前記コンピュータが、前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定工程と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて、前記コンピュータが算出する分析工程と、
前記コンピュータが、前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する工程と含む推定方法。

（付記８）
利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する処理をコンピュータに実行させる推定プログラムであって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力処理と、
一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成処理と、
前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定処理と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析処理と、
前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する処理とコンピュータに実行させる推定プログラム。

本発明は、コンピュータシステムの利用者の目的行動への意思の度合いを、自動的かつ定量的に算出することを可能にする、推定システムとして有用である。

本実施形態にかかる推定システムをシステム全体の構成を示す機能ブロック図本実施形態にかかる推定システムの詳細な構成を示す機能ブロック図項目反応理論分析部におけるログ入力部、マトリクス作成部および選定部の動作例を示すフローチャートログデータの内容の一例を示す図マトリクス作成部により作成されるマトリクスデータの内容の一例を示す図分析部および除外判断部の動作例を示すフローチャート分析部が出力するａ_j、ｂ_jの推定値およびｂ_jの標準誤差の一例を示す表除外判断部によって計算される標準誤差をプロットしたグラフ対応データの内容の一例を示す図各セッションの目的行動への意思の度合いの分布を示すヒストグラムの表示例項目特性曲線のグラフの表示例途中特性推定部およびイベント効果分析部の動作例を示すフローチャート遷移データの内容の一例を示す図イベント効果パターンデータの内容の一例を示す図イベント効果パターンデータをグラフにして表示する場合の表示例遷移データの表示例施策指示部の動作例を示すフローチャート

符号の説明

１推定システム
２サービスシステム
３ａ〜３ｃ利用者端末
４現在ログ記録部
４ａログ記録部
４ｂ現在ログ記録部
５ログ入力部
６項目反応理論分析部
７イベント効果算出部
８施策指示部
９ユーザインタフェース部
１０マトリクス記録部
１１分析結果記録部
１２遷移データ記録部
１３イベント効果記録部
１４ルール記録部
１５マトリクス作成部
１６選定部
１７分析部
１８除外判断部
１９途中特性推定部
２０イベント効果分析部
２１現在ログ入力部
２２途中意思推定部
２３イベント効果判定部
２４施策決定部

Claims

利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する推定システムであって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力部と、
前記一連の通信それぞれにおいて前記データ要素群の各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成部と、
前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定部と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析部と、
前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを記録する分析結果記録部と備える推定システム。
前記分析部で計算された項目母数の標準誤差が所定範囲外である項目を除外項目候補として抽出し、当該除外項目候補を除いた項目について、前記分析部で計算された特性値θの評価値を、所定のテスト情報関数Ｉ（θ）を用いて計算し、当該評価値を用いて、前記除外項目候補を除外するか否かを判断する除外判断部をさらに備え、
前記分析部は、前記除外判断部が前記除外項目を除外すると判断した場合、前記選定マトリクスデータから前記除外項目を前記のデータ要素のデータを削除して、前記項目母数および前記特性値θを再度算出する、請求項１に記載の推定システム。
前記ログデータで示される前記一連の通信の１回目からＮ回目までに利用者により要求されたデータ要素と、前記分析結果記録部の対応データが示す各一連の通信で利用者が要求したデータ要素とを照合することにより、ログデータで示される一連の通信で利用者がＮ回データ要素を要求した段階における当該利用者の特性値θ_Nを決定する途中特性推定部をさらに備える、請求項１または２に記載の推定システム。
前記途中特性推定部によって計算された各一連の通信における特性値θ_Nとその後の特性値の遷移を示す遷移データを、各一連の通信が行われた時を示す時間データとともに記録する遷移データ記録部と、
遷移度データを、所定のイベントが行われたイベント期間の一連の通信と、イベント期間でない通常期間の一連の通信とに、前記時間データを基に分類し、特性値θ_Nが一連の通信においてθ_AFTに遷移する遷移確率を、イベント期間の一連の通信と、通常期間の一連の通信それぞれにおいて複数通りの特性値θ_Nとその後の特性値θ_AFTの組み合わせについて計算して、イベント期間の遷移確率と通常期間との遷移確率の差異を示す差異データを生成し、前記組み合わせそれぞれに前記差異データを対応付けてイベント効果パターンデータとしてイベント効果記録部に記録するイベント効果分析部とをさらに備える、請求項３に記載の推定システム。
前記サービスシステムと前記利用者との間の一連の通信の途中で、前記一連の通信の開始から途中までの前記利用者が要求したデータ要素の履歴を示す現在ログデータを前記サービスシステムから取得する現在ログ入力部と、
前記現在ログデータで示される前記一連の通信の途中までに利用者が要求したデータ要素と、前記結果記録部の各一連の通信で利用者の要求に応じて送信されたデータ要素を示すデータとを照合することにより、前記一連の通信の途中における利用者の特性値θｃを決定する途中意思推定部と、
前記イベント効果記録部に記録されたイベント効果パターンデータから、前記途中意思推定部で決定された特性値θｃに対応する特性値θ_Nの差異データを抽出し、当該差異データを用いてイベントにより前記特性値θｃがどの程度上昇しうるかを示す判断値を生成するイベント効果判定部と、
前記判断値を用いて、予めルール記録部に記録された、種々の判断値に対応する利用者への施策を示す情報を含む施策データから、前記一連の通信の途中の利用者に施すべき施策を示すデータを抽出し、前記サービスシステムに対して出力する施策決定部とをさらに備えた、請求項４に記載の推定システム。
利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いをコンピュータにより推定する推定方法であって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力工程と、
前記コンピュータが、一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成工程と、
前記コンピュータが、前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定工程と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて、前記コンピュータが算出する分析工程と、
前記コンピュータが、前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する工程と含む推定方法。
利用者が、所定のデータ要素群のうち特定のデータ要素を要求する目的行動を実行する意思の度合いを推定する処理をコンピュータに実行させる推定プログラムであって、
前記利用者の利用者端末と一連の通信を行うことによって、前記利用者端末から利用者の要求を示すデータを受信し、前記データ要素群のうち利用者の要求するデータ要素を前記利用者端末へ送信するサービスシステムから、前記一連の通信ごとの、前記利用者が要求したデータ要素の履歴を示すログデータを取得するログ入力処理と、
一連の通信それぞれにおいて各データ要素が要求されたか否かを示すデータを、一連の通信ごとに区別可能かつデータ要素ごとに区別可能に記録したマトリクスデータを生成してマトリクス記録部に格納するマトリクス作成処理と、
前記マトリクスデータにおける前記特定のデータ要素のデータと、他のデータ要素のデータとの相関を計算し、当該相関に基づいて、前記目的行動に関連のある関連データ要素群を選定し、前記マトリクスデータのうち前記関連データ要素群のデータのみを残した選定マトリクスデータを作成して前記マトリクス記録部に記録する選定処理と、
前記関連データ要素群の各データ要素を項目反応理論における各項目とし、前記各項目のデータ要素が一連の通信において利用者に要求される確率を利用者の特性値θの関数で表した項目反応関数における、項目ごとの項目母数および一連の通信ごとの特性値θを、前記選定マトリクスデータにおける一連の通信ごとのデータをそれぞれ各項目に対する反応を示す反応パターンとして用いて算出する分析処理と、
前記各一連の通信ごとの特性値θと、各一連の通信で利用者が要求したデータ要素を示すデータとの対応を示す対応データを分析結果記録部に記録する処理とコンピュータに実行させる推定プログラム。