JP2010176342A - 解析装置、解析方法及び解析方法のプログラム - Google Patents

解析装置、解析方法及び解析方法のプログラム Download PDF

Info

Publication number
JP2010176342A
JP2010176342A JP2009017443A JP2009017443A JP2010176342A JP 2010176342 A JP2010176342 A JP 2010176342A JP 2009017443 A JP2009017443 A JP 2009017443A JP 2009017443 A JP2009017443 A JP 2009017443A JP 2010176342 A JP2010176342 A JP 2010176342A
Authority
JP
Japan
Prior art keywords
day
history information
access
access history
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009017443A
Other languages
English (en)
Other versions
JP5277996B2 (ja
Inventor
Masashi Uyama
政志 宇山
Osamu Watanabe
理 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009017443A priority Critical patent/JP5277996B2/ja
Publication of JP2010176342A publication Critical patent/JP2010176342A/ja
Application granted granted Critical
Publication of JP5277996B2 publication Critical patent/JP5277996B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】イベント実施による一時的な需要変動と、時間要因やイベント実施に基づくレベルシフトなどのベース変動とを区別することができ、適切な予測修正を行うことが可能な解析装置及び解析方法を提供する。
【解決手段】アクセス履歴情報から異常日のアクセス履歴情報を除去し、利用者の特徴的な日内行動パターンを主成分分析を用いて抽出し、日内行動パターンと1または複数の時間的要因とを関係付けた利用者行動モデルを生成し、利用者行動モデルを用いてアクセス数の長期変動予測情報を生成し、新たに読み込んだ1日分のアクセス履歴情報と予測対象日の変動予測情報との乖離が所定の基準値以上である場合には、新たに読み込んだ1日分のアクセス履歴情報を主成分に分解し、乖離が所定の基準値以上である日が所定日数以上継続する場合にその主成分について利用者行動モデルの修正を行う。
【選択図】図2

Description

本発明は、ネットワーク上のウェブサイトにおける需要予測を行うとともに、実績情報に伴う予測補正を行うシステムに関する。
オンライン書店などのネットワーク上で商品の販売を行う電子商店、オンラインバンキング、その他多数のサービスがインターネット上で提供されている。このようなインターネット上で提供されるサービスにおける利用拡大を図るために、サービス提供者により割引キャンペーン、新サービスの発表、テレビCMや新聞広告などに代表されるメディアへの宣伝広告などの「イベント」が企画される。
「イベント」とは、該当するウェブサイトへの突発的なアクセス増につながるものを総称することとし、ウェブサイトのワークロードに通常時とは異なる影響を与える全ての事象を「イベント」として取り扱うものとする。
ここで、ワークロードとは、システムに対する外部からのリクエストの系列であって、該当するウェブサイトへの来訪者数の変動に左右されるものである。
「イベント」のうち、新規顧客獲得や売り上げ増を目的として、価格を割引したり、景品を付けたりする、インセンティブを伴うような企画をキャンペーンと呼ぶ場合があるが、ここでは、特に、利用者に特定の行動を取らせることを目的に一定期間インセンティブを提供するようなイベントを実行することをキャンペーンと呼ぶこととする。
キャンペーンを実施する際には、ウェブサイトの運用管理者は、急激な需要増によるサーバダウンや応答遅延が起きないように、イベントによる需要変動を予測して適切な量のリソースを準備する必要がある。
たとえば、特許文献1(特開2006-268529号公報)に記載されている需要予測システムは、イベントに起因するITリソース利用の時間的変動をモデル化し、将来のITリソースの需要を予測している。
また、ウェブサイトにおいてキャンペーンなどのイベントを実施すると、イベント期間中にウェブサイトを訪問する来訪者が増加するだけではなく、イベント期間中のウェブサイトへの来訪者がイベント期間終了後においても習慣的に同じウェブサイトに来訪して、アクセス数の増大が期待できる。特許文献1に記載された需要予測システムは、利用者をいくつかのクラスに分類し、利用者のクラス毎にイベント前後においてどのような人数遷移が起こるかをモデル化することによって、イベント前後のレベルシフトの予測を行うように構成されている。ここで、レベルシフトとは、ある時点を境に平均的なアクセス量が階段状に上昇、または下降することを指す。
ウェブサイト上でキャンペーンを実行する際には、キャンペーンの主催者は、投資対効果が最大となるように、キャンペーンにおけるインセンティブの種類やその量、出稿する広告の量、期間の長さを最適に設定する必要がある。キャンペーンの主催者が予め設定した計画に基づいてキャンペーンが実行されたとしても、当初予想したような効果が上がらない場合もある。また、以前に実施したキャンペーンと全く同じ条件で再度キャンペーンを行っても、時間経過とともに利用者の関心や嗜好が変動している可能性があり、以前に実施したキャンペーンと同じ効果がえられるとは限らない。このため、キャンペーン期間中であっても、その効果が当初予定していた目標に近づくように、ウェブサイトへの来訪者の反応を見ながら計画を動的に変更していくことが必要となる。
一方、ウェブサイトの運用管理者は、ウェブサイト上で実行されるイベントによりどのようなビジネス効果が得られるかを予測し、予測通りの効果が上がらない場合には、ウェブサイトの運用における施策を変更するなどの対処が必要となる。ウェブサイトの運用管理者は、ウェブサイトのITリソースの最適化を行い、最適なキャンペーン効果を上げるための施策を行う必要があり、予測と実績を監視しこれらの乖離の原因を究明して、適切な施策を実施することが重要である。
特許文献1に記載された需要予測システムは、需要の実績値と複数のイベント特徴モデルとの照合を行い、予測値を修正する構成を備えている。また、特許文献2(特開2007-122358号公報)に記載された想定外需要検出システムでは、イベントが実行された時の数時間の短期的な需要変化予測と、需要実績とを比較して、想定外の需要の発生を判定するように構成されている。このように、イベントによる需要変動を予測するだけではなく、予測と実績との比較を行って、予測と実績の乖離を検出し分析するシステムが存在する。
ウェブサイトにおける需要変動の要因として、前述したようなキャンペーンを含むイベントによる変動が考えられるが、これらイベントによる変動だけではなく、季節変動や週間変動、祝日、商業的慣習に基づいて決済日として集中する傾向にある日(五十日)などの周期的な要因による変動が考えられる。このような周期的な要因に基づいて、変動を予測するようにしたシステムとして特許文献3(特開2008-102601号公報)に記載された時間種特性生成システムが存在する。特許文献3に記載のシステムでは、変動をもたらす要因のうちの時間的要因を時間種と呼び、時間種による変動をモデル化し、変動の予測を行っている。
ウェブサイトにおける需要変動の要因として、特許文献3に記載されているような季節変動やその他の周期変動を含む時間的要因の他に、利用者の傾向変動などのイベントに起因しない要因や、イベント前後のレベルシフトなどが含まれる可能性がある。このようなイベントに起因しない要因やイベント前後のレベルシフトを含む需要変動の要因をベース変動と称することとする。イベントの効果を予測する際には、イベントの実施により想定される需要変動の他に、前述したようなベース変動による利用者変化が需要変動に与える影響を考慮する必要がある。たとえば、利用者が週平均1千人である時点と、利用者が週平均1万人である時点では、利用者の傾向変動が生じている可能性が高く、同じように10%引きキャンペーンを行っても同様の効果を得られるとは限らない。
このような点を考慮して、イベントを実施する際の需要変動の予測は、ベース変動の予測と、イベント実施による直接的な変動の予測とを合成して行われる。特許文献1に記載のシステムでは、イベントに起因する変動を除く定常的なITリソースの利用状況の変動を算出する通常変動算出部を備えており、この通常変動算出部で算出されたベース変動と、イベントの影響による変動を予測するイベント影響算出部で算出された時間的変動の予測とを合成して、負荷変動を生成するように構成している。イベントの影響による変動とベース変動との合成演算は、単純な加算により演算することができ、また相対的な乗算を行うように構成することができる。
ベース変動を予測する方法としては、特許文献3に記載されたシステムのように、時間種特性による回帰モデルを利用する方法の他、ARIMA(Autoregressive moving average model:自己回帰移動平均モデル)などの時系列分析に基づく方法、両者の組み合わせによる方法などが利用可能である。特許文献4では、需要のベース変動を、季節・イベント性の変動モデルで補正して予測し、ベース変動の予測と実績が異なる場合には、モデルを修正し予測をシフトさせる機能を備えている。
前述したように、季節変動、周期変動、傾向変動、イベント前後のレベルシフトからなるベース変動を予測し、イベントの実施による変動予測と合成して、予測と実績の比較までを行う公知例が存在する。特に、特許文献4に記載されたシステムでは、需要のベース変動を、季節・イベント性の変動モデルで補正して予測し、ベース変動の予測と実績が異なる場合に、モデルを修正し、予測をシフトさせる機能を有している。しかしながら、このような従来のシステムは、単純に実績値からイベントによる変化を差し引いたデータから、ベース変動の予測を生成しているため、変動が突発的なイベントによる変化であるのか、ベース変動が大きく変化したものであるのかを特定することができない。したがって、予測と実績の間に大きな乖離が存在する場合に、イベントによる変動が予測と異なるケースであるのか、ベース変動が予測と異なるケースであるのかを特定できない。このため、これ以降の予測を適切に修正することができないという問題がある。
前述したような公知例では、月単位の需要変動を対象としていることから、1時間単位、10分単位というような短時間で変動するウェブサイトへのアクセス数変動に対して、ベース変動自体の変化とイベント実施による想定外の変動とを区別することはできない。
本発明では、イベント実施による一時的な需要変動と、時間要因やイベント実施に基づくレベルシフトなどのベース変動とを区別することができ、適切な予測修正を行うことが可能な解析方法のプログラム、解析装置及び解析方法を提供する。
本発明に係る解析方法のプログラムは、ネットワーク上のアクセス先に対するアクセスを解析する解析方法のプログラムであって、1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去するステップと、前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出するステップと、前記主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成するステップと、前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成するステップと、前記1日分のアクセス履歴情報を新たに読み込むステップと、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解するステップと、前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値以上である日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行うステップとを備える。
また、本発明に係る解析装置は、ネットワーク上のアクセス先に対するアクセスを解析する解析装置であって、1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去し、前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出し、前記日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成する平常行動分析部と、前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成する平常需要予測部と、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解し、前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値以上である日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行う需要予測補正部とを備える。
さらに、本発明に係る解析方法は、ネットワーク上のアクセス先に対するアクセスを解析する解析方法であって、1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去するステップと、前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出するステップと、前記主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成するステップと、前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成するステップと、前記1日分のアクセス履歴情報を新たに読み込むステップと、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解するステップと、前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値以上である日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行うステップとを備える。
本発明では、過去の平常時におけるアクセス履歴情報に基づいて、アクセス分布の主成分を抽出し、新しいアクセスデータが過去のアクセス履歴情報から抽出された主成分で分解できる場合には、ベース変動に基づくアクセス数変動と推測し、利用者行動モデルを修正することによって、その後の予測を適切に修正することができる。
第1実施形態のハードウェア構成を示すブロック図。 第1実施形態の機能ブロック図。 アクセス履歴情報の一例を示す説明図。 項目集合設定処理を示すフローチャート。 履歴情報のマトリクスの一例を示す説明図。 項目反応理論分析処理を示すフローチャート。 各セッションの購買意思推定値を表すヒストグラム。 平常行動分析処理のフローチャート。 平常需要予測処理のフローチャート。 アクセス履歴情報に対して、主成分分析を行った結果の一例を示す説明図。 需要予測補正処理のフローチャート。 第1〜第3主成分毎の予測と実績とを示す説明図。 イベント特徴モデル生成処理のフローチャート。 主成分の主成分基底及び主成分得点の一例を示すグラフ。 購買意思主成分表の一例を示す説明図。 イベント種構成比表の一例を示す説明図。 イベント特徴表の一例を示す説明図。 需要予測生成処理のフローチャート。 キャンペーン選択画面の一例を示す説明図。 第2実施形態の機能ブロック図。
本発明の詳細を添付した図面に基づいて詳細に説明する。本発明の解析方法について、コンピュータを用いた解析装置において実現する形態を説明する。以降の説明において、インターネットなどのネットワークを介して提供するウェブサイトの運営又は運営の委託を行い、商品の販売、資料の提供、顧客の登録をした会の運営管理者などのサービスを提供する側を提供者と呼ぶ。また、パーソナルコンピュータなどのコンピュータを用いて提供者が提供するウェブサイトにアクセスし、商品の購入、資料の請求、会員登録などのサービスを受ける者を利用者と呼ぶ。
本発明の解析方法は、ネットワークを介して提供されるウェブサイトに対するアクセスの解析に適用される。ウェブサイトとは、たとえば複数のアクセス先を含むウェブページの集合を示す。アクセス先とは、例えばネットワーク上のファイル、プログラムなどのリソースの位置を指示するURL(Uniform Resource Locator)である。また、複数のアクセス先のうちの1つが目的行動ページとして予め設定されているものとする。目的行動ページとは、例えば、購入完了時に「有り難う御座いました」と表示するウェブページ、資料請求完了のウェブページ、会員登録完了のウェブページなどのウェブサイト毎に設定されたウェブページのURLである。ウェブサイトの提供者側は、利用者が目的行動ページにアクセスするように誘導し、商品の購買や資料請求、会員登録などにつながることを目的としている。
また、本発明の解析装置は、イベントの実施に対する効果に関する解析を行うものである。イベントとは、提供者または提供者からの依頼により実施される新規顧客獲得、売り上げ増を図ることを目的として行われる割引や景品などのインセンティブを伴う販売、各種メディアを通じた広告などのキャンペーンなどを指す。
〔第1実施形態〕
<ハードウェア構成>
図1は、本発明にかかる解析装置のハードウェア構成を示すブロック図である。
解析装置10は、パーソナルコンピュータなどのコンピュータにより構成されており、CPU11、ROM12、RAM13、補助記録ドライブ14、入力部15、出力部16、通信部17などを備えている。CPU11は、装置全体を制御するプロセッサで構成されている。ROM12は、BIOSや各種パラメータを格納している。RAM13は、CPU11が処理を行う際の演算途中の変数の値や各種パラメータを一時的に格納する。補助記録ドライブ14は、アプリケーションソフトウェアやソフトウェアで生成されたデータファイル、その他各種情報を格納するハードディスクドライブ、CD-ROMやその他の可搬型の記録媒体が装着されて情報の読取・書込を実行するためのディスクドライブを含む。
入力部15は、キーボード、マウスなどの入力手段で構成され、利用者に操作に基づいて入力される指示を受け付ける。
出力部16は、モニタやプリンタなどの出力手段で構成される。
通信部17は、LAN(Local Area Network)、インターネットなどのネットワークに接続するための通信ポートを備える通信手段で構成される。
CPU11は、補助記録ドライブ14から本発明に係る解析方法のプログラムを読み出して、このプログラムを実行することにより、コンピュータを本発明の解析装置10として動作させる。
<機能ブロック>
図2は、本発明の一実施形態の解析装置10の機能ブロック図である。
この実施形態では、項目反応理論に基づいてウェブサイト利用者の行動から潜在特性を導き出すことを行っている。項目反応理論とは、評価項目群への応答に基づいて被験者の特性や評価項目の難易度・識別力を測定するための試験理論であり、個人の能力値、項目の難易度といったパラメータを、評価項目への離散的な結果から確率論的に求めるものである。
この解析装置10は、項目集合設定部201、項目反応理論分析部202、平常行動分析部203、イベント特徴モデル生成部204、需要予測補正部205、平常需要予測部206、モデルベースの需要予測生成部207などを備えている。また、解析装置10は、ウェブページに対するアクセス履歴情報であるウェブログを格納するデータベースとしてのウェブログ保存部211、利用者行動モデルのデータベースを格納する利用者行動モデル保存部212、過去に実施されたイベントに関する履歴情報のデータベースであるイベント実施情報保存部213、イベント特徴モデルのデータベースを格納するイベント特徴モデル保存部214、現在のアクセス履歴情報をリアルタイムに格納している現在ログ保存部215、分析結果である購買意思予測のデータベースを格納する購買意思分布予測保存部216などを備えている。なお、ウェブログ保存部211、利用者行動モデル保存部212、イベント実施情報保存部213、イベント特徴モデル保存部214、現在ログ保存部215及び購買意思分布予測保存部216は、解析装置10に内蔵する記録装置に格納することもでき、外部記憶装置に格納される構成とすることも可能であり、さらにネットワークで接続されたデータサーバなど他の端末に格納される構成とすることも可能である。
項目集合設定部201は、ウェブログに基づいて、アクセス先となるURL集合を初期集合として設定し、セッション毎にURL集合に含まれるURLを参照した否かを示す履歴情報のマトリクスを生成する。
項目反応理論分析部202は、項目集合設定部201で生成された履歴情報のマトリクスに項目反応理論を用いて分析し、セッションの潜在特性θを推定する。潜在特性とは、たとえば提供者が利用者に対して誘導することを期待するウェブページを目的行動ページとして予め設定し、この目的行動ページに対するアクセスへの潜在的な可能性を示すものである。項目反応理論分析部202では、このような潜在特性θが利用者の購買意思を反映するようにURL集合の修正を繰り返し行うことにより、URL集合の最適なマトリクスを構築する。
平常行動分析部203は、ウェブログに基づいて利用者の平常時における行動パターンを分析し、利用者行動モデル保存部212に平常時の行動パターンとして蓄積する。
イベント特徴モデル生成部204は、過去に実施されたキャンペーンにおける潜在特性θの分布からキャンペーンが購買意思に及ぼす影響をモデル化し、イベント特徴モデル保存部214に格納する。
平常需要予測部206は、ベース変動のモデルである利用者行動モデル保存部212に保存された利用者行動モデルを用いてベース変動の予測を生成する。
需要予測補正部205は、現在ログ保存部215から一日分の新たなアクセス履歴情報を読み出して、平常需要予測部206により予測した予測対象日のアクセス数予測と、実際のアクセス数実績との乖離に基づいて、ベース変動のモデルを補正する。
モデルベースの需要予測生成部207は、平常需要予測部206により予測されたベース変動の予測と、イベント特徴モデル保存部214に保存されたイベント特徴モデルとを利用して、将来のキャンペーン実施時の購買意思分布を予測する。
<項目集合設定>
図3は、ウェブログ保存部211に保存されるアクセス履歴情報の一例を示す説明図である。
ウェブログ保存部211の保存されているアクセス履歴情報は、図3に示すように、セッションID、ホストID、参照日、参照時刻、参照URLなどの項目を有するレコード単位のデータで構成される。セッションIDは、提供者が提供しているウェブページに対するアクセスに係るセッションを特定するための識別情報である。ホストIDは、アクセス元のホストを特定するための識別情報である。参照日は、アクセスを受けた日を示している。参照時刻は、アクセスを受けた時刻を示している。参照URLは、アクセス先となったウェブページのURLを示している。セッションIDを一意に特定する方法は複数存在するが、ここでは、例えばホストIDを用いて同一のホストからの30分以内のアクセスは同一セッションのアクセスであると決定する。
図4は、項目集合設定部201による項目集合設定処理を示すフローチャートである。
項目集合設定部201は、ステップS41において、ウェブログ保存211に保存されているウェブログから、対象期間の各日のURL毎の参照頻度を算出し、参照頻度の多い代表的なURLを抽出して、日毎の上位集合をORで結合した和集合を生成する。ここで、代表的なURLの和集合を生成していることから、期間の途中でサイト構成が変更されて存在しなくなったURLや新しく追加されたURLも集合に含まれるURLの候補となる。
ステップS42において、項目集合設定部201は、各セッションがURL集合に含まれる各URLを参照した否かを「1」または「0」のフラグで表す履歴情報のマトリクスを生成する。
ステップS43において、項目集合設定部201は、履歴情報のマトリクスを用いて、予め設定された目的行動ページと、URL集合に含まれるURLとの相関係数を算出する。相関係数としては、ピアソンの相関係数を用いることができる。
ステップS44において、項目集合設定部201は、URL集合に含まれるURLの中から、予め設定された目的行動ページとの相関がゼロであるという帰無仮説(Null hypothesis)を棄却でき、かつ相関係数が負でないURLを選択してこれらをURL集合として選定する。
ステップS45において、項目集合設定部201は、選定したURL集合に基づいて、履歴情報のマトリクスを再構築する。
図5は、項目集合設定部201により出力される履歴情報のマトリクスの一例を示す説明図である。
図5に示す履歴情報のマトリクスでは、セッションID「SID1」、「SID2」・・・の各セッションが、URL集合中の「URL1」、「URL2」・・・の各URLを参照した場合にはフラグ「1」を設定し、参照していない場合にはフラグ「0」を設定している。
<項目反応理論分析>
図6は、項目反応理論分析部202による項目反応理論分析処理を示すフローチャートである。
項目反応理論分析部202は、項目集合設定部201により生成された履歴情報のマトリクスを入力として、各セッションの購買意思推定値、各URLの困難度パラメータ・識別力パラメータの推定値、URL参照パターンと購買意思推定値の対応表の3種類のデータを出力する。
ステップS61において、項目反応理論分析部202は、項目集合設定部201が出力した履歴情報のマトリクスに対して、項目反応理論を適用して分析を行う。
項目反応理論は、試験問題の作成・運用に用いられている数理モデルであり、テスト項目への回答結果(正誤)パターンから受験者の能力を算定するように構成される。各テスト項目の正答率は、能力が低い受験者では0%に近くなり、能力が高いほど正答率が上昇して、ある程度の能力を超えるとほぼ100%の正答率になると考えられる。項目反応理論の考え方は、各項目の難易度を、能力θに対するS字カーブ(ロジスティック曲線)でモデル化することである。
3パラメータロジスティックモデルにおける正答確率は、
p(θ)=c+(1−c)/(1+exp(−Da(θ−b))
で表される。ここで、パラメータaはその項目における受験者の能力の高低を明確に識別する程度を表す識別力パラメータ、パラメータbは問題の難しさを決める困難度パラメータ、パラメータcはあて推量でも正答する確率であるあて推量パラメータ、Dは定数値である。
受験者iのn個の問題に対する反応(正答を1とし、誤答を0とする)をui={ui1,ui2・・・uij・・・uin}と表記する場合、N人の受験者の反応パターン行列Uが観察される確率は、
Figure 2010176342

で表される。
この尤度を最大化するパラメータθ,a,b,cを試験結果Uから推定する。推定には、同時最尤推定法や、周辺最尤推定法などを用いることができる。
ここでは、各セッションを受験者、各URLを問題とみなして、目的行動ページに到達した場合に正答であり、そうでない場合を誤答とみなす。
ステップS62において、項目反応理論分析部202は、ロジスティック曲線パラメータのあてはめ精度が、予め指定したスレショルド値を超えていないかをチェックする。各URLに対する推定において、標準誤差が大きくなるURLは、θに対する正答率がきれいなS字カーブに該当しないということであり、当該URLの参照と購買意思との関連に疑いの余地がある。この実施例では、スレショルド値を1に設定し、各URLの困難度パラメータについて、標準誤差がスレショルド値1を超えたものを除去すべきURLの候補リストとする。
ステップS63では、項目反応理論分析部202は、テスト情報関数(フィッシャー情報量)を算出する。テスト情報関数は、あるセッションの能力パラメータをθと判定した場合に、実際のθとどの程度ずれる可能性があるかを表すものである。URL集合に含まれるURLjのテスト情報関数Ijは、各セッションの能力パラメータθi毎に算出されるものであって、
Ij(θi)=D2aj2pj(θi)qj(θi)
で表すことができる。ここで、Dは定数1.7であり、ajはURLjに対して算出された識別力パラメータ、pj(θi)はθiの購買意思を持つ利用者がURLjを参照する確率をロジスティック曲線モデルから算出したもの、qj(θi)はθiの購買意思を持つ利用者がURLjを参照しない確率をロジスティック曲線モデルから算出したものであり、テスト情報関数I(θi)は、
I(θi)=ΣIj(θi)
の数式により項目情報量の和として算出できる。
テスト情報量の平方根の逆数1/√(I(θ))は、θ推定値の標準誤差、すなわちθ推定値の分布の標準偏差になる。このθ推定値の標準誤差が大きくなると、その領域における購買意思が正確に推定できないこととなる。たとえば、θ推定値が、中〜低の領域で大きなずれを生じる場合には、あと一押しで購買に至る利用者と、全く関心のない利用者との区別が困難になる。このため、θの各領域でそれぞれずれが少ないことが好ましい。このようなあてはめ精度の悪いURLは、項目反応理論の計算から外す必要がある。
ステップS64では、項目反応理論分析部202は、分析結果が妥当であるか否かを判定する。ここでは、項目反応理論分析部202は、標準誤差が大きいURL集合が存在し、かつテスト情報関数の標準誤差が1/√(I(θ))が0.5以下であると判断した場合に、URL集合の削減余地ありとして、分析結果が妥当ではないと判断してステップS65に移行し、そうでない場合には、分析結果が妥当であると判断してステップS66に移行する。
ステップS65では、項目反応理論分析部202は、あてはめ精度の最も悪いURLを削除し、ステップS61以下の項目反応理論処理を繰り返す。
ステップS66では、項目反応理論分析部202は、URL集合に対しての項目反応理論分析結果を生成し、最終分析結果として出力する。
このような計算プロセスにより、目的行動ページのURL以外のサイト構成に関する情報が全くなくても、目的行動ページに到達する確率を算出することができ、購買意思を算定することが可能となる。また、テスト情報関数を用いてテスト精度を検出しているため、直接購買行動が起きないようなθの値が低い行動パターンであっても、利用者の購買意思を相互比較可能になる。
項目反応理論分析部202の出力は、各セッションの購買意思推定値、各URLの困難度パラメータ・識別力パラメータの推定値、URL参照パターンと購買意思推定値の対応表の3種類である。各セッションの購買意思推定値は、セッションID及びθ推定値の組で表すことができる。
図7は、各セッションの購買意思推定値を表すヒストグラムである。図7において、右側の色が濃くなっている部分が実際に購買行動を行った利用者に関するものである。このような実際の購買行動を含む行動パターンは、購買意思θが高くなっていることがわかる。
また、実際に購買行動に至らなかった行動パターンであっても、購買意思の大小を比較することが可能となる。たとえば、図7の例では、U,V,Rというウェブページを移行する行動パターン71における購買意思θの値が0.88と算出でき、X,Y,Zというウェブページを移行する行動パターン72における購買意思θが1.17と算出でき、これら実際の購買行動に至らなかった行動パターンについても購買意思の大小を比較することが可能となる。
項目反応理論分析部202で算出された各セッションの購買意思推定値、各URLの困難度・識別力パラメータ、URL参照パターンと購買意思推定値の対応表は、利用者行動モデル保存部212に格納される。
<平常行動分析>
図8は、平常行動分析部203による平常行動分析処理のフローチャートである。
ステップS81において、平常行動分析部203は、1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報を読み込む。ここでは、ウェブログ保存部211に保存されているウェブログに基づいて、アクセス先毎の日毎のアクセス数を読み込む。ここで、各アクセス先のアクセス数は、1日24時間をN個の所定時間単位で分離されたN×日数分のアクセス数を含んでおり、これらアクセス数を集計することにより日毎のアクセス数データとして処理することができる。1日のアクセス数を分離するNは、たとえば144個に設定することができ、この場合は1日のアクセス数データが10分間隔で144個に分離されたデータとして表現することができる。
ステップS82において、平常行動分析部203は、アクセス先毎の日毎のアクセス数データに基づいて、所定の基準値を超えるアクセス数である日を異常日として分離する。たとえば、平常行動分析部203は、日毎のアクセス数の平均±標準偏差の範囲外のアクセス数である日を異常日として特定し、この異常日のアクセス履歴情報をアクセス履歴情報から削除する。
ステップS83において、平常行動分析部203は、異常日のアクセス履歴情報が除去されたアクセス履歴情報に対して、主成分分析を利用して利用者の特徴的な日内行動パターンを抽出する。日内行動パターンは、3〜5程度の少数の典型的な行動パターンとして抽出するものであり、1日をN個に分解した所定時間単位での日内行動パターンを抽出する。
ステップS84において、平常行動分析部203は、主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成する。時間的要因は、季節、週間、曜日、祝日、その他の周期的な時間種と呼ばれる時間的変動要因である。このような時間的要因と日内行動パターンとを関係付けた利用者行動モデルを抽出し、これを利用者行動モデル保存部212に格納する。
<平常需要予測>
図9は、平常需要予測部206による平常需要予測処理のフローチャートである。
ステップS91では、平常需要予測部206は、予測対象日の時間種情報を読み込む。ここで、時間種情報は、前述したように、季節、週間、曜日、祝日、その他の周期的な時間的変動要因である。
ステップS92では、平常需要予測部206は、平常行動分析部203において抽出され利用者行動モデル保存部212に保存された利用者行動モデルに基づいて、読み込んだ時間種に対する主成分の重みを算出する。
ステップS93では、平常需要予測部206は、時間種に対して算出した主成分の重みに基づいて、各主成分及び平均的なアクセス変動を加算して、日内のベース変動の予測を生成する。
たとえば、1日のアクセス数をN=144個に分割したアクセス履歴情報に対して、主成分分析を行った結果、3つの特徴的な行動パターンに分解したしたものを、図10に示す。
図10に示される行動パターンでは、時間帯によるアクセス数の分布により3つの行動パターンに特徴付けられている。
これら行動パターンのそれぞれに対して、時間的要因(時間種)による回帰分析を行い、時間的要因の重み付けにより各パターンと時間的要因の関係を算出する。たとえば、第1パターンに対して、春分は+11998、冬は+7860、祝日は-4119、第2パターンに対して、火曜+水曜+木曜は+873、平日は+559、土曜は-4163、大雪+冬至は-1625、第3パターンに対して、平日+土曜は+2413、大夏+立秋は-2473などの重み付けを行う。
<需要予測補正>
図11は、需要予測補正部205による需要予測補正処理のフローチャートである。
ステップS111において、需要予測補正部205は、現在ログ保存部215から1日分のアクセス履歴情報を新たに読み込む。
ステップS112において、需要予測補正部205は、新たに読み込んだ1日分のアクセス履歴情報(実績)と平常需要予測部206で算出された長期変動予測情報に含まれる予測対象日のアクセス数の変動予測(予測)とを比較する。ここで、需要予測補正部205は、新たに読み込んだ1日分のアクセス履歴情報とアクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離を、平均説明率指標を用いて比較する。
ステップS113において、需要予測補正部205は、予測と実績との乖離が所定の基準値以上であると判断した場合にはステップS114に移行し、そうでない場合にはステップS111に移行する。需要予測補正部205は、平均説明率指標が0.8以下である場合に、予測と実績との乖離が所定の基準値以上であると判断して、ステップS114に移行するように構成できる。ここで、平均説明率指標は、予測値をYt、実績値をXtとしたときに、1−Σ|Yt−Xt|/ΣXtで得られる指標である。
ステップS114において、需要予測補正部205は、新たに読み込んだ1日分のアクセス履歴情報に対して、平常行動分析部203で分析した主成分に、回帰分析を用いて分解する。
ステップS115において、需要予測補正部205は、新たに読み込んだ1日分のアクセス履歴情報の回帰分析により分解された主成分毎に、予測と実績が所定の基準以下であるか否かを判定する。ここでは、需要予測補正部205は、主成分毎のR自乗値を算出して、0.8を下回る場合には予測と実績との乖離が所定の基準値を超えると判断してステップS116に移行し、そうでない場合にはステップS111に移行する。
ステップS116において、需要予測補正部205は、同一主成分の増減が予め指定された日数以上続く場合か否かを判断する。需要予測補正部205は、同一主成分のR自乗値が0.8を下回る日が、たとえば3日以上続く場合には、主成分の補正が必要であると判断してステップS117に移行し、そうでない場合にはステップS111に移行する。
図12は、第1〜第3主成分毎の予測と実績とを示す説明図である。図12において、各種成分の予測を線で示し、実績を点で示している。たとえば、第1主成分において、50日目付近の予測と実績との乖離が大きく、これが3日以上連続していると判断した場合には、この主成分に対する補正が必要と判定する。
ステップS117において、需要予測補正部205は、利用者行動モデルにおける主成分を補正し、補正された主成分を含む利用者行動モデルを用いて需要予測を新たに生成する。
<イベント特徴モデル>
イベント特徴モデル生成部204は、キャンペーン実施時の利用者の行動の変化をモデル化したイベント特徴モデルを生成するものである。このイベント特徴モデル生成部204は、イベント実施情報保存部213に保存されたイベント実施情報に基づいて、イベント特徴表、イベント種構成比表、購買意思主成分表の3つの表でモデル化したイベント特徴モデルを生成しイベント特徴モデル保存部214に格納する。
図13は、イベント特徴モデル生成部204によるイベント特徴モデル生成処理のフローチャートである。
ステップS131において、イベント特徴モデル生成部204は、利用者行動モデル保存部212に保存された各セッションの購買意思推定値に基づいて、購買意思θの日毎の分布を算出し、日数×購買意思θのマトリクスを生成する。
ステップS132において、イベント特徴モデル生成部204は、日数×購買意思θのマトリクスに対して多変量解析手法の1つである主成分分析を適用し、購買意思分布の変動を形成する主要な成分を抽出する。イベント特徴モデル生成部204は、抽出された主成分のうちの最も特徴的である判断されるM個の成分を選択し、各主成分の基底を購買意思主成分表に保存する。選択される主成分の数は、たとえば、M=3として、最も寄与率の高いものから順に3つの主成分を選択するように構成することができる。
図14は、主成分の主成分基底及び主成分得点の一例を示すグラフである。図14(a)〜(b)は、抽出された主成分のうち、寄与率が高い順に第1主成分〜第3主成分の基底を示すグラフであり、横軸を購買意思θ、縦軸を各主成分の得点として、その関係を示している。
また、図14(d)〜(f)は、各主成分の得点の経時変化を示すグラフであって、横軸を日、縦軸を各主成分の得点として、その関係を示している。
図15は、イベント特徴モデル生成部204が生成する購買意思主成分表の一例を示す説明図である。図15に示す購買意思主成分表は、選択された上位の主成分である第1主成分〜第3主成分の基底を構成するθ1〜θ20の購買意思の含有量を表形式で示している。図15に示す購買意思主成分表は、図14に示した各主成分の基底を構成する購買意思の分布を表形式に展開したものである。イベント特徴モデル生成部204は、生成した購買意思主成分表をイベント特徴モデル保存部214に格納する。
ステップS133において、イベント特徴モデル生成部204は、M×日数の主成分得点マトリクスを、絶対値が1になるように正規化し、正規化に用いた除数を規模係数として、これら正規化した主成分得点マトリクスと規模係数を出力する。
ステップS134において、イベント特徴モデル生成部204は、K-means法などのクラスタリング手法を用いて、日毎の主成分得点マトリクスをクラスタリングする。イベント特徴モデル生成部204は、クラスタリングを行った結果、各クラスをイベント種として、イベント種構成比表に保存する。
図16は、イベント特徴モデル生成部204により生成されるイベント種構成比表の一例を示す説明図である。図17では、クラスタリングした結果のイベント種に、各主成分の構成比を表形式で示している、各主成分の構成比として示している値は、各クラスについて、各主成分の平均値を算出し、各主成分の代表値として示したものである。イベント特徴モデル生成部204により生成されたイベント種構成比は、イベント特徴モデル保存部214に格納される。
ステップS135において、イベント特徴モデル生成部204は、日毎に算出されたイベント種、規模係数の組をイベント特徴表に保存する。
図17は、イベント特徴モデル生成部204により生成されるイベント特徴表の一例を示す説明図である。図17では、分析対象日毎に、クラス種類、規模係数、及び各主成分の正規化した得点を表形式で示すものである。ここでクラス種類は、分類したクラスに対応するイベント種の名称である。
<モデルベースの需要予測生成>
図18は、モデルベースの需要予測生成部207による需要予測生成処理のフローチャートである。
ステップS181において、需要予測生成部207は、キャンペーンの選択画面を生成して、これをディスプレイ上に表示してキャンペーン主催者に実施予定のキャンペーン種類と期間を選択させる。たとえば、需要予測生成部207は、図19に示すようなキャンペーン選択画面1901を提示し、実施期間選択部1902においてキャンペーン実施期間を選択させ、キャンペーン種類選択部1903においてキャンペーン種類を選択させる。キャンペーン実施期間については、カレンダ表示部1904により表示されたカレンダから実施期間を選択することができるように構成できる。また、図示した例では、キャンペーン種類として、送料オフ、10%オフ、バナー広告のうちからチェックボタンを操作することで選択できるように構成しているが、これらキャンペーン種類については図示したものに限定されない。
ステップS182において、需要予測生成部207は、選択された情報をイベント種特徴表と照合して、過去の同種のイベントを参照し、キャンペーン期間中のイベント種、規模係数を予測する。
ステップS183では、需要予測生成部207は、平常需要予測部206が生成する過去のイベント実施時におけるベース変動と、将来のイベント実施時におけるベース変動の比を算出し、規模係数を補正する。
ステップS184では、需要予測生成部207は、補正した規模係数、イベント効果型に基づいて、イベント種構成比表、購買意思主成分表を参照して、イベント実施時の購買意思分布を予測する。需要予測生成部207により生成された購買意思分布予測は、購買意思分布予測保存部216に格納される。
この第1実施形態では、新たな1日分のアクセス履歴情報を読み込んだ際に、需要予測補正部205が、平常時の日内変動の主成分を利用して予測との乖離が大きいか否かを判別し、一日分の変動が主成分の組み合わせに分解できるかどうかを検査することで、イベント実施による一時的な増減と、季節変動やイベント実施の結果によるレベルシフトなどのベース変動との区別を行うことが可能となる。また、モデルベースの需要予測生成部207が、修正されたベース変動に基づいて、イベント実施時の購買意思分布を予測していることから、購買意思θの予測を適切に修正することができる。
〔第2実施形態〕
図20は本発明の第2実施形態に係る解析装置の機能ブロック図である。
図21に示す解析装置は、ウェブログ保存部211、平常行動分析部203、需要予測補正部205の構成は、第1実施形態と同様であり、平常行動分析部203および需要予測補正部205の分析結果を用いて想定外需要を検出する想定外需要検出システム2001をさらに備えている。
想定外需要検出システム2001は、供給データ記録部2011、コスト情報記録部2015、想定外モデル生成部2014、モデル記録部2018、入力部2021、判定部2022、追加情報生成部2023、コスト算出部2024、出力部2025などを備えている。
モデル記録部2018には、需要モデル2019および想定外モデル2020が記録されている。需要モデル2019は、平常行動分析部203によって生成されてモデル記録部2018に記録され、需要予測補正部205によって補正される。また、想定外モデル2020は、想定外モデル生成部2014によって生成され、モデル記録部2018に記録される。
想定外モデル生成部2014は、供給データ記録部2011に記録されたデータに基づいて、想定外モデル2020を生成する。想定外モデル2020は、需要モデル2019で表されるITリソースの量と時間遷移とは異なる想定外の時間遷移を表すデータである。想定外の時間遷移は、所定期間内の時間を示すデータと、その時間において必要とされるITリソースの量を示すデータとで表される。
供給データ記録部2011には、IT資源提供ログ2012、運用ポリシー2013が記録されている。IT資源提供ログ2012は、ITリソースが提供された実績を示すログデータである。運用ポリシー2013は、提供されるITリソース毎に記録される。
入力部2021は、たとえば、想定外需要検出システム2001が接続されているITリソースから観測データ2002を入力する。観測データ2002は、たとえば、ITリソースのサーバにおいて観測された実際の需要を表すデータである。たとえば、サーバへのウェブアクセス数、ログイン数、セッション数、サーバのCPU使用率またはサーバへの転送量などを表すデータ転送量などが含まれている。
判定部2022は、入力部2021が入力した観測データ2002、モデル記録2018に記録された需要モデル2019、想定外モデル2020を比較することにより、想定外モデル2020で表される想定外の需要が発生するか否かを判定する。
追加情報生成部2023は、判定部が想定外の需要が発生すると判定した場合に、想定外モデル2020に基づいて、想定外の需要に対応するために追加するべきITリソースの量と、追加するべき時期とを表す追加ITリソース情報を生成する。追加ITリソース情報は、コスト算出部2024に送出される。
コスト算出部2024は、追加情報生成部2023が生成した追加ITリソース情報で表されるITリソースを追加するためのコストを、コスト情報記録部2015に記録されたデータを用いて算出する。コスト情報記録部2015には、たとえば、IT資源価格情報2016及び運用作業情報2017が記録されている。IT資源価格情報2016は、共有のITリソースの貸出価格を含むものである。この貸出価格は、過去ログに基づいて設定された固定価格であってもよく、需要バランスに応じて変動するものであってもよい。運用作業情報2017は、ITリソースとしてサーバが人手により追加される場合に、その追加作業に必要となる人数や作業時間を表すデータを挙げることができる。
コスト算出部2024で算出されたコストは、追加ITリソース情報とともに、出力部2025に送出される。出力部2025は、コスト算出部2024が算出したコストと、追加ITリソース情報とを表示装置に表示するなどして出力する。
この想定外需要検出システム2001は、解析装置と同一のパーソナルコンピュータ、サーバなどのコンピュータ上に構築することができ、判定部2022、追加情報生成部2023、コスト算出部2024、出力部2025、想定外モデル生成部2014、入力部2021の各機能は、コンピュータのCPUが所定のプログラムを実行することによって実現される。モデル記録部2018、コスト情報記録部2015、供給データ記録部2011は、コンピュータに内蔵されているハードディスク、RAM、フレキシブルディスク、メモリカードなどの記録媒体や、ネットワークを介して接続可能な記録装置を用いることができる。
この第2実施形態において、平常行動分析部203は、第1実施形態と同様にして、ウェブログ保存部211に格納されているアクセス履歴情報から平常時における利用者行動モデルを生成し、これをモデル記録部1718の需要モデル2019として保存する。
需要予測補正部205は、第1実施形態と同様にして、図11のフローチャートで示すような需要予測補正処理を実行する。ここで、需要予測補正部205は、ベース変動日として記録された日の予測が存在する場合、その主成分の増減分を用いて修正した予測モデルを生成し、元の予測モデルにより長期予測に対して、修正予測モデルによる長期予測を生成し、モデル記録部2018の想定外モデル2020に追加する。
想定外需要検出システム2001では、当初の需要モデルに基づく予測と、想定外の需要モデルに基づく予測とを用いて、所定の時間単位(たとえば、10分、1時間などの時間単位)で実績値との照合を行って、より実績値に近い方を選択する。
平常行動分析部203は、選択された需要モデル2019をベース変動のモデルとして置き換える。
前述の第1実施形態では、ベース変動を予測に反映するまでに所定の日数分のタイムラグが必要であるが、この第2実施形態においては、リアルタイムにベース変動の変化を予測に反映することが可能となる。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
ネットワーク上のアクセス先に対するアクセスを解析する解析方法のプログラムであって、
1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去するステップと、
前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出するステップと、
前記主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成するステップと、
前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成するステップと、
前記1日分のアクセス履歴情報を新たに読み込むステップと、
前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解するステップと、
前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行うステップと、
を備える解析方法のプログラム。
(付記2)
前記アクセス履歴情報の日毎のアクセス数をそれぞれ所定の時間単位で分割し日毎のアクセス数変動データとする、付記1に記載の解析方法のプログラム。
(付記3)
前記アクセス履歴情報に含まれる日毎のアクセス数の平均±標準偏差の範囲外のアクセス数である日を異常日と特定する、付記1に記載の解析方法のプログラム。
(付記4)
前記日内行動パターンを対応する時間的要因により重み付けして合計することにより長期変動予測情報を生成する、付記1に記載の解析方法のプログラム。
(付記5)
前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離は、平均説明率指標を用いて比較する、付記1に記載の解析方法のプログラム。
(付記6)
回帰分析を行った後の新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離は、R自乗値が所定の基準値以下であるか否かで判定する、付記1に記載の解析方法のプログラム。
(付記7)
回帰分析を行った後の新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える場合には、特異日として記録する、付記1に記載の解析方法のプログラム。
(付記8)
ネットワーク上のアクセス先に対するアクセスを解析する解析装置であって、
1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去し、前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出し、前記日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成する平常行動分析部と、
前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成する平常需要予測部と、
前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解し、前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行う需要予測補正部と、
を備える解析装置。
(付記9)
ネットワーク上のアクセス先に対するアクセスを解析する解析方法であって、
1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去するステップと、
前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出するステップと、
前記主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成するステップと、
前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成するステップと、
前記1日分のアクセス履歴情報を新たに読み込むステップと、
前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解するステップと、
前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える日をベース変動として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行うステップと、
を備える解析方法。
本発明は、ネットワーク上のウェブサイトにおける需要予測を行うとともに、実績情報に伴う予測補正を行うシステムに利用でき、イベント実施による急激な需要変動と、ベース変動による需要変動とを区別することで、適切な予測の修正を行うことが可能となる。
特開2006-268529号公報 特開2007-122358号公報 特開2008-102601号公報 特開2003-346070号公報

Claims (7)

  1. ネットワーク上のアクセス先に対するアクセスを解析する解析方法のプログラムであって、
    1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去するステップと、
    前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出するステップと、
    前記主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成するステップと、
    前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成するステップと、
    前記1日分のアクセス履歴情報を新たに読み込むステップと、
    前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解するステップと、
    前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行うステップと、
    を備える解析方法のプログラム。
  2. 前記アクセス履歴情報の日毎のアクセス数をそれぞれ所定の時間単位で分割し日毎のアクセス数変動データとする、請求項1に記載の解析方法のプログラム。
  3. 前記日内行動パターンを対応する時間的要因により重み付けして合計することにより長期変動予測情報を生成する、請求項1に記載の解析方法のプログラム。
  4. 前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離は、平均説明率指標を用いて比較する、請求項1に記載の解析方法のプログラム。
  5. 回帰分析を行った後の新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える場合には、特異日として記録する、請求項1に記載の解析方法のプログラム。
  6. ネットワーク上のアクセス先に対するアクセスを解析する解析装置であって、
    1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去し、前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出し、前記日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成する平常行動分析部と、
    前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成する平常需要予測部と、
    前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解し、前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える日をベース変動日として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行う需要予測補正部と、
    を備える解析装置。
  7. ネットワーク上のアクセス先に対するアクセスを解析する解析方法であって、
    1または複数のアクセス先に対するアクセス数を含むアクセス履歴情報に基づいて、前記アクセス先毎の日毎のアクセス数が所定の基準値を超える異常日を特定し、前記異常日のアクセス履歴情報を除去するステップと、
    前記異常日のアクセス履歴情報が除去されたアクセス履歴情報に基づいて、利用者の特徴的な日内行動パターンを、主成分分析を用いて抽出するステップと、
    前記主成分分析により抽出された日内行動パターンと1または複数の時間的要因とを回帰分析を適用して関係付けた利用者行動モデルを生成するステップと、
    前記利用者行動モデルを用いて、アクセス数の長期変動予測情報を生成するステップと、
    前記1日分のアクセス履歴情報を新たに読み込むステップと、
    前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセス数の変動予測情報との乖離が所定の基準値以上である場合には、前記新たに読み込んだ1日分のアクセス履歴情報を前記日内行動パターンの抽出に用いた主成分に回帰分析を用いて分解するステップと、
    前記新たに読み込んだ1日分のアクセス履歴情報の回帰分析を行った結果、前記新たに読み込んだ1日分のアクセス履歴情報と前記アクセス数の長期変動予測情報に含まれる予測対象日のアクセスの変動予測情報との乖離が所定の基準値を超える日をベース変動として記録し、前記ベース変動日が所定日数以上継続する場合にその主成分について前記利用者行動モデルの修正を行うステップと、
    を備える解析方法。
JP2009017443A 2009-01-29 2009-01-29 解析装置、解析方法及び解析方法のプログラム Expired - Fee Related JP5277996B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009017443A JP5277996B2 (ja) 2009-01-29 2009-01-29 解析装置、解析方法及び解析方法のプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009017443A JP5277996B2 (ja) 2009-01-29 2009-01-29 解析装置、解析方法及び解析方法のプログラム

Publications (2)

Publication Number Publication Date
JP2010176342A true JP2010176342A (ja) 2010-08-12
JP5277996B2 JP5277996B2 (ja) 2013-08-28

Family

ID=42707265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009017443A Expired - Fee Related JP5277996B2 (ja) 2009-01-29 2009-01-29 解析装置、解析方法及び解析方法のプログラム

Country Status (1)

Country Link
JP (1) JP5277996B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014044598A (ja) * 2012-08-27 2014-03-13 Canon Marketing Japan Inc 情報処理装置、情報処理方法、プログラム
JP2014522072A (ja) * 2011-08-16 2014-08-28 アリババ・グループ・ホールディング・リミテッド ユーザ行動に基づく内容情報推薦
JP2019164543A (ja) * 2018-03-19 2019-09-26 株式会社リコー 情報処理システム、情報処理装置及びプログラム
WO2020261449A1 (ja) * 2019-06-26 2020-12-30 日本電信電話株式会社 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム
JP2022014415A (ja) * 2020-07-06 2022-01-19 クーパン コーポレイション 商品販売管理情報を提供する電子装置およびその方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNG200800839010; 渡辺 理: '各現場における統計モデルの構成要素の融通により社会システムのモデリングを促進するグループウェアの構築' 情報処理学会研究報告 Vol.2008 No.91 第2008巻, 20080918, 第53-58ページ, 社団法人情報処理学会 *
CSNG200800839013; 宇山 政志: '需要・購買行動を監視する予実監理ダッシュボード' 情報処理学会研究報告 Vol.2008 No.91 第2008巻, 20080918, 第71-75ページ, 社団法人情報処理学会 *
CSNG200900242077; 渡辺 理: 'Eコマースサイトの利用者行動の解明:日種因子による主成分回帰分析' マルチメディア,分散,協調とモバイル(DICOMO)シンポジウム論文集 1997年〜2006年版 V 第2006巻, 20060831, 第309-312ページ, 社団法人情報処理学会 *
JPN6013005173; 宇山 政志: '需要・購買行動を監視する予実監理ダッシュボード' 情報処理学会研究報告 Vol.2008 No.91 第2008巻, 20080918, 第71-75ページ, 社団法人情報処理学会 *
JPN6013005175; 渡辺 理: '各現場における統計モデルの構成要素の融通により社会システムのモデリングを促進するグループウェアの構築' 情報処理学会研究報告 Vol.2008 No.91 第2008巻, 20080918, 第53-58ページ, 社団法人情報処理学会 *
JPN6013005178; 渡辺 理: 'Eコマースサイトの利用者行動の解明:日種因子による主成分回帰分析' マルチメディア,分散,協調とモバイル(DICOMO)シンポジウム論文集 1997年〜2006年版 V 第2006巻, 20060831, 第309-312ページ, 社団法人情報処理学会 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014522072A (ja) * 2011-08-16 2014-08-28 アリババ・グループ・ホールディング・リミテッド ユーザ行動に基づく内容情報推薦
JP2014044598A (ja) * 2012-08-27 2014-03-13 Canon Marketing Japan Inc 情報処理装置、情報処理方法、プログラム
JP2019164543A (ja) * 2018-03-19 2019-09-26 株式会社リコー 情報処理システム、情報処理装置及びプログラム
JP7010096B2 (ja) 2018-03-19 2022-01-26 株式会社リコー 情報処理システム、情報処理装置及びプログラム
WO2020261449A1 (ja) * 2019-06-26 2020-12-30 日本電信電話株式会社 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム
JPWO2020261449A1 (ja) * 2019-06-26 2020-12-30
JP7294421B2 (ja) 2019-06-26 2023-06-20 日本電信電話株式会社 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム
JP2022014415A (ja) * 2020-07-06 2022-01-19 クーパン コーポレイション 商品販売管理情報を提供する電子装置およびその方法
US11392972B2 (en) 2020-07-06 2022-07-19 Coupang Corp. Electronic device for providing product sale managing information and method thereof

Also Published As

Publication number Publication date
JP5277996B2 (ja) 2013-08-28

Similar Documents

Publication Publication Date Title
Mild et al. An improved collaborative filtering approach for predicting cross-category purchases based on binary market basket data
JP4529058B2 (ja) 配信システム
Gubela et al. Conversion uplift in e-commerce: A systematic benchmark of modeling strategies
Luo et al. Recovering hidden buyer–seller relationship states to measure the return on marketing investment in business-to-business markets
Currim Predictive testing of consumer choice models not subject to independence of irrelevant alternatives
US8260921B2 (en) Demand forecasting system for data center, demand forecasting method and recording medium with a demand forecasting program recorded thereon
US6631360B1 (en) Computer-implementable Internet prediction method
US20040093261A1 (en) Automatic validation of survey results
CN109583966B (zh) 一种高价值客户识别方法、系统、设备及存储介质
WO2010057195A2 (en) System, method and computer program product for predicting customer behavior
WO2010138512A1 (en) Measuring impact of online advertising campaigns
JP7271529B2 (ja) 自動化されたアトリビューションモデリングおよび測定
Maaß et al. Improving short-term demand forecasting for short-lifecycle consumer products with data mining techniques
US11295328B2 (en) Intelligent prospect assessment
CN102156932A (zh) 一种客户再次购买意向预测方法及装置
JP2017016485A (ja) 算出装置、算出方法及び算出プログラム
JP5277996B2 (ja) 解析装置、解析方法及び解析方法のプログラム
US20220180379A1 (en) Transaction-based information processing system, method, and article
US8219673B2 (en) Analysis apparatus, analysis method and recording medium for recording analysis program
Keane et al. Evaluating consumers’ choices of Medicare Part D plans: A study in behavioral welfare economics
JP2009223423A (ja) 利用者状態推定システム、利用者状態推定方法および利用者状態推定プログラム
US20220188876A1 (en) Advertising method and apparatus for generating advertising strategy
Lei et al. New product life cycle curve modeling and forecasting with product attributes and promotion: A Bayesian functional approach
EP3418916A1 (en) Method and apparatus for determining peak sale and one year sale prediction for hardcover first releases
JP6320353B2 (ja) デジタルマーケティングシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130506

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees