JP2012069151A - ユーザ行動分析方法及びユーザ行動分析システム - Google Patents

ユーザ行動分析方法及びユーザ行動分析システム Download PDF

Info

Publication number
JP2012069151A
JP2012069151A JP2011263893A JP2011263893A JP2012069151A JP 2012069151 A JP2012069151 A JP 2012069151A JP 2011263893 A JP2011263893 A JP 2011263893A JP 2011263893 A JP2011263893 A JP 2011263893A JP 2012069151 A JP2012069151 A JP 2012069151A
Authority
JP
Japan
Prior art keywords
user
flow field
log
user behavior
field set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011263893A
Other languages
English (en)
Other versions
JP5264981B2 (ja
Inventor
Joo-Won Jung
周 原 鄭
Handol Park
ハンドル 朴
June Ha Park
俊 河 朴
Dong Wook Kim
東 旭 金
Yon Iru Cho
イル チョ、ヨン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of JP2012069151A publication Critical patent/JP2012069151A/ja
Application granted granted Critical
Publication of JP5264981B2 publication Critical patent/JP5264981B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】ユーザ行動分析方法およびシステムを提供する。
【解決手段】ユーザ行動分析方法は、ログ収集サーバを介してユーザログを収集するステップと、ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成するステップと、流動フィールド集合に対する処理命令の入力によって流動フィールド集合を処理するステップとを含む。このとき、流動フィールドフォーマットは、流動フィールドの所定のフォーマットであると言え、流動フィールドは、フィールド名および複数の属性で構成される。
【選択図】 図4

Description

本発明は、ユーザ行動分析方法及びユーザ行動分析システムに関する。
オンラインビジネスにおいて、ユーザの行動を理解することは極めて重要である。有用性の観点において、ユーザの行動に対する分析は、オンラインサービスのユーザフィードバックに対する重要な根源である。また、マーケティングの観点においても、ユーザトレンド、すなわち、上述したユーザ行動分析は、ユーザの必要と要求を理解する尺度となる。さらに、ユーザ行動分析は、システム管理の側面においても、資源の割り当て問題などの解決に対する基盤となる。
従来の技術では、このようなユーザの行動を分析するための方法として、多様な性能指標を用いていた。すなわち、ページビューの数、ユニークビジター数、又はクエリ数などのような性能指標によってユーザの行動を分析していた。このような性能指標の大部分は、ウェブ上のそれぞれのページで発生するユーザの行動に対するカウント処理によって得ることができる。
図1は、従来技術のユーザの行動を分析する方法を説明するための一例である。すなわち、従来技術では、ユーザ101のログイン、ゲーム、購買、又はイベント参加などのようなウェブサイト上におけるユーザの活動102が発生する度に発生回数をカウントしてゲーム指数、売上指数、ウェブ利用指数などの各種指数103を測定することができ、このような指数103を上述した性能指標としてユーザ101の行動を分析するのに用いることができる。
しかしながら、従来技術のユーザ行動分析方法は、性能指標の原因となるユーザのウェブサイト上における詳細活動に対する理解が困難であるという問題点がある。例えば、上述したゲーム指数、売上指数、ウェブ利用指数などの指数だけでは、ゲームサイトでユーザがゲームマネーをすべて使った後の行動パターンにどのような変化があるのか、または特定の購買経路上で売上変化が発生するのかなどのように、ユーザの詳細活動に対する理解が困難である。このようなユーザの詳細活動に対する理解の困難性、すなわち、ユーザ行動分析の難しさは、性能指標等を用いてウェブサイトのサービスを改善するのに困難を来たす問題点に繋がる。
本発明は、前記のような問題点を解決するために案出されたものであって、ユーザ行動分析方法及びユーザ行動分析システムに関する新しい技術を提案する。
そこで、本発明は、ユーザログを介してユーザの行動をユーザ別又は時間順に整列することで、ユーザの行動に対する時系列的分析を容易かつ簡便に行うことができるユーザ行動分析方法及びユーザ行動分析システムを提供することを目的とする。
また、本発明は、ユーザの行動を時系列的に分析することで、購買経路、特定の事件に対する会員行動パターンのように既存の技術では把握し難かったウェブサイトの利用現況に対する原因を分析することが可能であるユーザ行動分析方法及びユーザ行動分析システムを提供することを目的とする。
また、本発明は、ウェブサイトの利用現況に対する原因を分析することでユーザの行動を理解し、これによってウェブサイトのサービスを改善することができるユーザ行動分析方法及びユーザ行動分析システムを提供することを目的とする。
さらに、本発明は、ログ分析サーバに含まれる複数の収集サーバを用いることでトラフィック増加の問題を解決し、複数のコンピュータクラスタを用いた分散処理によってユーザの行動に対する分析時間を短縮することができるユーザ行動分析方法及びユーザ行動分析システムを提供することを目的とする。
前記の目的を達成し、上述した従来技術の問題点を解決するために、本発明の一実施形態に係るユーザ行動分析方法は、ログ収集サーバLCS(Log Collection Server)を介してユーザログを収集するステップと、前記ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成するステップと、前記流動フィールド集合に対する処理命令の入力に応じて前記流動フィールド集合を処理するステップとを含む。このとき、前記流動フィールドフォーマットは、流動フィールドの所定のフォーマットであり、前記流動フィールドは、ユーザを識別するためのユーザ識別フィールドおよび前記ユーザまたはシステムの行動を記録する行動記録フィールドに分類され、前記属性は、前記属性を分類する属性名及びユーザの行動を定義する属性値で構成される。
本発明の一側によれば、ログ収集サーバを介してユーザログを収集する前記ステップは、ウェブサーバで提供するウェブページを介して前記ユーザログを受信するステップと、前記ユーザログが含むURLをSTDB(Service Tree Data Base)を用いてST名称(Service Tree name)に変更するステップとを含む。このとき、ウェブサーバで提供するウェブページを介して前記ユーザログを受信する前記ステップは、ユーザのウェブブラウザおよびジャバスクリプトタグを用いて前記ユーザログを受信したり、クライアントの場合には前記ログ収集サーバで直接前記ユーザログを受信するステップである。
本発明の他の側面によれば、前記ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成する前記ステップは、前記ユーザログそれぞれを前記流動フィールドフォーマットに変換してそれぞれの流動フィールドを生成するステップと、前記流動フィールドをユーザ別に時間順に整列して前記流動フィールド集合を生成するステップとを含むことができる。
本発明のさらに他の側面によれば、前記処理命令は、(1)入力された時間範囲の流動フィールドを抽出するドロー(draw)演算子と、(2)入力されたパターンに適合する流動フィールドを抽出するフィルタ演算子および入力された属性によって前記属性の総合または数を測定する集合演算子とを含むことができ、前記流動フィールド集合に対する処理命令の入力によって前記流動フィールド集合を処理する前記ステップは、(1)前記ドロー演算子または前記フィルタ演算子によって該当する流動フィールドを抽出したり、(2)前記流動フィールド集合や前記抽出された流動フィールドのうちで前記集合演算子に該当する属性の総合または数を測定するステップである。
本発明の他の実施形態において、ユーザ行動分析システムは、ユーザログを収集するログ収集サーバと、前記ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成する流動フィールド集合生成部と、前記流動フィールド集合に対する処理命令の入力によって前記流動フィールド集合を処理する流動フィールド集合処理部とを備える。
本発明によれば、ユーザログを介してユーザの行動をユーザ別又は時間順に整列することで、ユーザの行動に対する時系列的分析を容易かつ簡便に行うことができる。
また、本発明によれば、ユーザの行動を時系列的に分析することで、購買経路、特定事件に対する会員行動パターンのように既存の技術では把握し難かったウェブサイトの利用現況に対する原因を分析することが可能となる。
また、本発明によれば、ウェブサイトの利用現況に対する原因を分析することでユーザの行動を理解し、これによってウェブサイトのサービスを改善することができる。
さらに、本発明によれば、ログ分析サーバが含むことができる複数の収集サーバを用いることでトラフィック増加の問題を解決し、複数のコンピュータクラスタを用いた分散処理によってユーザの行動に対する分析時間を短縮することができる。
従来技術において、ユーザ行動パターンを測定する方法を説明するための一例である。 本発明に係るユーザ行動分析方法を概括的に説明するための一例である。 本発明に係るユーザ行動分析方法を概括的に説明するための他の例である。 本発明の一実施形態において、ユーザ行動分析方法を示したフローチャートである。 本発明に係るユーザログ収集方法を説明するための一例である。 本発明の一実施形態において、流動フィールド集合を生成する方法を示したフローチャートである。 本発明に係る流動フィールド集合および流動フィールドを説明するための一例である。 本発明に係る流動フィールド集合の一例である。 本発明に係る流動フィールド集合間の分割および併合を説明するための一例である。 本発明に係る流動フィールド集合を処理する一例である。 本発明に係る処理命令を説明するための一例である。 本発明の他の実施形態において、ユーザ行動分析システムの内部構成を説明するためのブロック図である。 本発明に係るデータの分散処理方法を説明するための一例である。
以下、添付の図面を参照しながら、本発明に係る多様な実施形態について詳しく説明する。
ウェブサービスにおいて、ユーザ行動のパターン、より詳しくはユーザの行動を羅列したシーケンスは、多くの部分で有用に用いることができる。例えば、ユーザの行動によって、訪問者がサイトで与えられたページにどのように接続したのか、ユーザがページに接続するために最も頻繁に用いる経路は何であるか、ユーザが商品「A」を購買した後に購買した商品は何であるかなどの時系列的情報を得ることができる。
このような統計的資料は、それぞれのユーザの行動を追跡して取得されるため、単にそれぞれのページに入場した訪問者数を測定するなどの上述の従来技術における性能指標とは異なる。このような統計的資料は、ユーザログ、すなわちウェブログを介して収集することができる。
図2は、本発明に係るユーザ行動分析方法を概括的に説明するための一例である。
ここで、図2は、ゲームを提供するウェブサーバでログイン、ゲーム、オールイン、購買、ログアウトのように分析目的とシナリオによって定義されたユーザ行動201と、ユーザ「A」202およびユーザ「B」203に対するそれぞれのユーザの行動を示している。図2を詳しく見れば、ユーザ「A」202は、ログイン後にゲームを進行し、ゲームマネーのオールイン後にログアウトしたことを知ることができ、ユーザ「B」203は、ユーザ「A」202と同じ行動をし、ゲームマネーのオールイン後にゲームマネーを購買して再びゲームをし、その後の時点にログアウトしたことを知ることができる。
すなわち、このようにユーザログを用いてユーザ別又は時間別(時間順)にユーザの行為を知ることができれば、ユーザの行為を理解することができる。言い換えれば、単にユーザのログイン回数、購買回数、及び購買金額だけではユーザの詳細行動を理解し難いが、ゲーム指数、売上指数などのような各種成果指標204だけでなくユーザ行動の順序まで知ることができれば、ユーザの詳細行動を容易に分析及び理解することができる。
このために、ユーザのユーザ行動とユーザ行動当時の属性を知る必要があり、このような情報を、ユーザログを介して取得することができる。
図3は、本発明に係るユーザ行動分析方法を概括的に説明するための一例である。
310は、4人のユーザがゲームマネーを購買した時点をそれぞれ示している。しかしながら、310では、単にゲームマネーを購買した時点のみが示されているだけで、購買という行動の前後の行動に対しては全く知ることができない。このため、単にそれぞれのユーザに対する売上金額、すなわち、結果中心のデータのみが得られることになる。
一方、320は、4人のユーザに対してそれぞれの時点で実行した行動、すなわち、ユーザ行動の時系列的情報を得ることができるため、購買の前後行動、例えば、「オールイン」後に「購買」そして再び「ゲーム」という状況別のユーザ行動パターンを得ることができ、これを分析することによってユーザ行動と属性間の変化を把握することが可能となる。
このように、ユーザの行動をユーザ別又は時間順に確認が可能となる場合にはユーザの行動に対する原因把握が可能となり、これによって従来の性能指標だけでは把握し難かった購買経路分析、特定の事件(イベント)発生後のユーザ行動パターン分析などが可能となる。このような方法及びシステムについては、図4から図13を参照しながらより詳しく説明する。
図4は、本発明の一実施形態におけるユーザ行動分析方法を示したフローチャートである。
ステップS410で、ユーザ行動分析システムは、ログ収集サーバを介してユーザログを収集する。ここで、ユーザログは、ユーザからのマウスクリック、キーボード入力などのようなイベントによって発生するゲームマネーの購買、ゲーム入場などの行動や、ゲームマネーのオールインによってウェブサーバで発生するシステムの行動などをすべて含むことができる。すなわち、ユーザ行動分析システムは、ログ収集サーバを介してユーザに別途の行動を要求せずに(ユーザが意識することなく)ユーザログを収集することができる。
このとき、ユーザログは、ウェブサーバが生成するウェブサーバログを含むことができ、ログ収集サーバを介してユーザログを収集するステップは、ログ収集サーバに含まれるウェブサーバがウェブサーバログを生成するステップとして構成される。すなわち、ユーザ行動分析システムは、ウェブサーバを含むことができ、ウェブサーバが生成したウェブサーバログをユーザログとして用いることができる。
また、ユーザ行動分析システムは、ログ収集サーバによりユーザのブラウザを介してユーザログを収集するように構成することもできる。この場合に、図4に示すように、ユーザ行動分析システムは、ユーザログを収集するために、ステップS411〜ステップS413を含んで実行することができる。
ステップS411で、ユーザ行動分析システムは、STMS(Service Tree Management System)でSTDBを管理及び維持する。ここで、STDBは、URLと該URLに対応するST名称とが互いに関連付けられて保存される。すなわち、STDBは、ユーザがウェブサーバを介してアクセスすることで、ユーザに提供されたウェブサイトと関連した各種URLを含み、URLと関連したST名称をURLと関連して保存している。
ステップS412で、ユーザ行動分析システムは、ウェブサーバで提供するウェブページを介してユーザログを受信する。すなわち、ユーザ行動分析システムは、ユーザ又はウェブサーバを介してウェブサーバにアクセスし、意味ある行動、すなわちログイン、ログアウト、ゲームマネーの購買、又はオールイン処理手順などのように分析目的とシナリオによって定義されたユーザ行動が発生する場合に、生成されるユーザログを受信することができる。このとき、ユーザ行動分析システムは、ユーザのウェブブラウザ及びジャバスクリプト(JavaScript)タグを用いてユーザログを受信したり、クライアントの場合にはログ収集サーバで直接ユーザログを受信することができる。
ステップS413で、ユーザ行動分析システムは、ユーザログが含むURLをSTDBを用いてST名称に変更する。これは、URLを介してユーザ行動が発生する経路を容易に把握するためのものであって、URLから不必要な要素を除去するためである。また、分析者がURLを介してはURLと関連したウェブページを容易に把握することができないため、分析者がユーザ行動分析システムの結果を容易に把握できるように、URLをST名称に変更することもできる。
ステップS420で、ユーザ行動分析システムは、ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成する。このとき、流動フィールドフォーマットは、流動フィールドの所定のフォーマットであり、流動フィールドは、フィールド名および複数の属性で構成される。
また、流動フィールドは、ユーザを識別するためのユーザ識別フィールド及びユーザまたはシステムの行動を記録する行動記録フィールドに分類される。また、ユーザ識別フィールドは、フィールド名によって、(1)ログイン名で分類されたユーザを示すログインフィールドと、(2)ブラウザ毎に割り当てられた永久クッキー別に分類されたユーザを示す永久クッキーフィールドとに分類される。また、行動記録フィールドは、(1)ユーザの特定ページ訪問を示すページビューフィールドと、(2)ユーザの特定リンクに対するクリックを示すクリックフィールドと、(3)ユーザに対するシステムの行動を示す行動フィールドとに分類される。このとき、ユーザ識別フィールド及び行動記録フィールドは、必要に応じてより詳細的なフィールドに分類されるように構成することも可能である。
また、属性は、属性を分類する属性名及びユーザの行動を定義する属性値で構成される。
なお、流動フィールドは、ユーザログが含むユーザ行動の発生時刻を属性として含むことができる。すなわち、すべての流動フィールドは、流動フィールドと関連したユーザ行動の発生時刻を含むことができる。
このような流動フィールド集合を生成するステップS420については、図6のフローチャートと図7及び図8の例を参照しながらより詳しく説明する。
ステップS430で、ユーザ行動分析システムは、流動フィールド集合に対する処理命令の入力によって流動フィールド集合を処理する。流動フィールド集合は、必要に応じて分割及び併合が可能であり、これについては図9を参照しながらより詳しく説明する。また、処理命令は、(1)典型的な分析質疑(分析クエリ)と、(2)所定の演算子又は分析スクリプトとを含むことができる。
処理命令が典型的な分析質疑である場合、流動フィールド集合を処理するステップS430において、ユーザ行動分析システムは、分析質疑が含む時間範囲、パターン、統計関数、又は集団区分基準に基づいて該当する流動フィールドを抽出したり、流動フィールドが含む属性に対する処理結果を提供することができる。
処理命令が所定の演算子、すなわち(1)入力された時間範囲の流動フィールドを抽出するドロー演算子と、(2)入力されたパターンに適合する流動フィールドを抽出するフィルタ演算子及び入力された属性に基づく当該属性の総合又は数を測定する集合演算子とを含む場合、ステップS430においてユーザ行動分析システムは、(1)ドロー演算子又はフィルタ演算子に基づいて該当する流動フィールドを抽出したり、(2)流動フィールド集合や抽出された流動フィールドのうちで集合演算子に該当する属性の総合または数を測定することができる。
最後に、処理命令が分析スクリプトである場合、ステップS430においてユーザ行動分析システムは、入力された分析スクリプトによる時間範囲、パターン、又は属性処理命令に従って、(1)該当する流動フィールドを抽出したり、(2)流動フィールド集合や抽出された流動フィールドが含む属性のうちで処理命令に該当する属性の合計または数を測定することができる。
このように、流動フィールド集合を処理する方法については、図10の一例を参照しながらより詳しく説明する。
図5は、本発明に係るユーザログ収集方法を説明するための一例である。
ユーザは、ブラウザ501を介してウェブサーバ502にウェブページを要請することができ、ウェブサーバ502は、ジャバスクリプトタグを含むウェブページブラウザ501に送信することができる。すなわち、ウェブサーバ502は、ジャバスクリプトタグを介してブラウザ501にログイン永久クッキーを設定することができ、ログイン永久クッキーが含むログ収集サーバ503のURLを介してユーザ行動分析システムが、ユーザログを受信(収集)する。
この後、ウェブページを介してユーザ行為(ユーザアクション)が発生する場合、ログ収集サーバ503は、ジャバスクリプトタグでログイン永久クッキーが含むURLを用いて、ブラウザ501を介して送信されたユーザログを受信することができる。このとき、ログ収集サーバ503は、ユーザがログインしない場合に、ブラウザ501を識別する方法によってユーザを識別することができ、このためにブラウザ501に永久クッキー(persistent cookie)を設定することができる。すなわち、永久クッキーは、ログインしないユーザを、ブラウザ501を介して識別するために用いることができる。
図6は、本発明の一実施形態において、流動フィールド集合を生成する方法を示したフローチャートである。図6に示すように、ステップS601及びステップS602は、上記図4を参照しながら説明したステップS420に含まれて実行されるようになる。
ステップS601で、ユーザ行動分析システムは、ユーザログそれぞれを流動フィールドフォーマットに変換してそれぞれの流動フィールドを生成する。すなわち、ユーザログはユーザの行動を含み、ユーザ行動分析システムは、このようなユーザログをユーザ行動分析システムが用いることができる流動フィールドフォーマットに変換することができる。上述したように、流動フィールドフォーマットは、流動フィールドの所定のフォーマットであるため、ユーザログを流動フィールドフォーマットに変換する場合に、ユーザログは流動フィールドとして変換する。すなわち、流動フィールドを生成できるようになる。
ステップS602で、ユーザ行動分析システムは、流動フィールドをユーザ別に時間順に整列して流動フィールド集合を生成する。このようなそれぞれの流動フィールドは、流動フィールド自体としては大きい意味がないため、流動フィールドが含むユーザ行動の発生時刻とユーザを基準で整列して流動フィールド集合を生成する。このような流動フィールド集合及び流動フィールドについては、図7および図8を参照しながらより詳しく説明する。
図7は、本発明に係る流動フィールド集合及び流動フィールドを説明するための一例である。図7は、ユーザ701別又はユーザ行動の発生時間702の順序に整列された複数の流動フィールドを示している。このとき、流動フィールドは、フィールドの種類を示すフィールド名及びユーザの行動に基づく属性で構成される。また、属性は、属性名及び属性値で構成され、複数の属性名及び属性値の集合で構成してもよい。
すなわち、図7の例において、流動フィールド703が含むフィールド名「L」704はログイン名であり、ユーザを分類するためのフィールドであって、ブラウザを介してユーザがウェブサイトにログインする場合に、生成されるユーザログを通じて生成される。また、属性「id=xxxxxx ts=1163168755」705は、属性名「ts」706及び属性値「1163168755」707で構成される。図7の例では、2つの属性を有する流動フィールド703を示している。このとき、1番目の属性は、ユーザのログインIDが「xxxxxx」であることを意味することができ、2番目の属性はログインの発生時期が「1163168755」であることを意味することができる。
このとき、流動フィールド集合の1つの行は、1人のユーザに対するユーザの行動を時間順(時系列順)によって整列したものであるため、行の1番目の要素、すなわち1番目の属性は、ユーザを識別するための属性となる。
図8は、本発明に係る流動フィールド集合の一例である。ここで、符号800は、複数の属性を有する複数の流動フィールドを示している。すなわち、図8の例では、ログインID「xxxxxx」を有するユーザがゲームサーバにログインする瞬間(ログインした時点)からログアウトする瞬間(ログアウトする時点)までのユーザの行動を含んでいる。
図9は、本発明に係る流動フィールド集合間の分割及び併合を説明するための一例である。
上述したように、流動フィールド集合は、ユーザ別又は時間順に整列された該当する一連の情報であるユーザ行動の羅列である。このような流動フィールド集合を分析しようとするとき、あるユーザの1週間のユーザ行動パターンを分析したり、1ヶ月以上の期間に対して分析しようとする場合がある。このような場合に、ユーザに対して1ヶ月以上の期間に対して流動フィールド集合を生成して集めておかなければならないが、保管上または技術的な理由により、このような全体を1つの流動集合として生成しておくよりは、任意の期間に対する流動フィールド集合を動的に生成することが好ましい。
すなわち、ユーザに対して短時間単位で複数の流動フィールド集合を生成し、必要に応じてジョイン(join)演算子又はユニオン(union)演算子などを用いて流動フィールド集合を結合することで、所望する時間単位内のユーザの行動に対する流動フィールド集合を得ることができる。例えば、流動フィールド集合901および902において、ジョイン演算子を介して併合して流動フィールド集合903を生成したり、流動フィールド集合901および903をユニオン演算子を介して併合し、流動フィールド集合905を生成することができる。すなわち、流動フィールド集合901、902、904間の併合によって併合された流動フィールド集合903及び905を生成することができる。
また、これとは反対に、大きい単位の流動フィールド集合を小さい単位の流動フィールド集合に分離(分割)することも可能である。
ユーザ行動分析システムは、(1)典型的な分析質疑の形態で入力された処理命令と、(2)典型的な分析質疑を容易に処理するために所定の演算子を含む処理命令と、(3)所定の演算子を内包しつつ、典型的な分析質疑の形態で表現可能な分析スクリプトを用いた処理命令とを分析することで、流動フィールド集合を処理することができる。このような典型的な分析質疑、所定の演算子、及び分析スクリプトの関係については、図11を参照しながらより詳しく説明する。
図10は、本発明に係る流動フィールド集合を処理する一例である。
まず、ユーザ行動分析システムで上述した所定の演算子、すなわちドロー演算子、フィルタ演算子、および集合演算子を含む処理命令を介して流動フィールド集合を処理する方法の一例を説明する。
まず、ドロー演算子1001が入力される場合に、ドロー演算子1001が含む所定の時間範囲内のユーザの行動に対する記録、すなわち、所定の時間範囲に該当する流動フィールドを流動フィールド集合1002から抽出することができる。また、フィルタ演算子1003が入力される場合に、抽出された流動フィールドからフィルタ演算子1003が含むパターンに該当する流動フィールドを抽出することができる。最後に、集合演算子1004に対して、ユーザ行動分析システムは、フィルタ演算子1003によって抽出された流動フィールドで集合演算子が含む属性に該当する属性の総合又は数などを測定する分析者に提供することができる。
このとき、図10に示すように、入力される演算子によって、例えば、ドロー演算子1001とフィルタ演算子1003だけが入力された場合には、フィルタ演算子1003を実行した後に抽出された流動フィールドを分析者に提供することも可能である。これだけでなく、互いに異なる条件の同じ演算子を連続で実行したり、同じ条件の同じ演算子を繰り返し実行することも可能である。すなわち、図10は、流動フィールド集合を処理する1つの例であって、分析者から入力される演算子の順序および演算子が含む時間範囲またはパターンなどの値によって多様な修正が可能である。
図11は、本発明に係る処理命令を説明するための一例である。
上述したように、ユーザ行動分析システムは、(1)典型的な分析質疑の形態で入力された処理命令と、(2)典型的な分析質疑を容易に処理するために所定の演算子を含む処理命令と、(3)所定の演算子する典型的な分析質疑の形態で表現可能な分析スクリプトを用いた処理命令のうちのいずれか1つによって流動フィールド集合を処理することが可能である。
図11の1110は、典型的な分析質疑の一例である。このような典型的な分析質疑は、上述した所定の演算子を介して、すなわち「draw」で表現されるドロー演算子を介して時間範囲に対する処理が、「regex」で表現されるフィルタ演算子を介してパターンに対する処理が、又は「aggr」で表現される集合演算子を介して、統計関数または集団区分基準に対する処理が、それぞれ可能である。
図11の1120は、典型的な分析質疑をドロー演算子1121、フィルタ演算子1122、及び集合演算子1123を用いて処理する一例を示している。このとき、1124〜1126は、ドロー演算子1121、フィルタ演算子1122、及び集合演算子1123による処理結果をそれぞれ示している。
図11の1130は、典型的な分析質疑を上述した分析スクリプトで表現した一例である。分析スクリプトは、典型的な分析質疑を容易に処理するために生成された所定の演算子を内包しながらも、所定の演算子の機械的な枠を外れて典型的な分析質疑の形態で表現したものであって、人間が容易に認識できるように生成されたスクリプトである。
すなわち、ユーザ行動分析システムは、上述した典型的な分析質疑、所定の演算子、または分析スクリプトのうちのいずれか1つを含む処理命令によって流動フィールド集合を処理することができる。
このように、本発明に係るユーザ行動分析方法を用いれば、ユーザログを介してユーザの行動をユーザ別または時間順に整列することでユーザの行動に対する時系列的分析を容易かつ簡便に行うことができる上に、ユーザの行動を時系列的に分析することで購買経路、特定の事件に対する会員行動パターンのように既存に把握し難かったウェブサイトの利用現況に対する原因を分析することが可能となる。
また、ウェブサイトの利用現況に対する原因を分析することでユーザの行動を理解し、これによってウェブサイトのサービスを改善することができ、ログ分析サーバに含まれる複数の収集サーバを用いることでトラフィック増加の問題を解決し、複数のコンピュータクラスタを用いた分散処理によってユーザの行動に対する分析時間を短縮することができる。
図12は、本発明の実施形態におけるユーザ行動分析システムの内部構成を説明するためのブロック図である。図12に示すように、ユーザ行動分析システム1200は、ログ収集サーバ1210と、流動フィールド集合生成部1220と、流動フィールド集合処理部1230とを備えることができる。
ログ収集サーバ1210は、ユーザログを収集する。ここで、ユーザログは、ユーザからのクリック、キーボード入力などのようなイベントによって発生するゲームマネーの購買、ゲーム入場などの行動や、ゲームマネーのオールインによってウェブサーバで発生するシステムの行動などをすべて含むことができる。すなわち、ログ収集サーバ1210は、ユーザに別途の行動を要求せずにユーザログを収集することができる。このとき、図12に示すように、ログ収集サーバ1210は、ユーザログを収集するために、ユーザログ受信部1211と、URL変更部1212と、STDB1213と、STMS1214とを備えることができる。
ユーザログ受信部1211は、ウェブサーバで提供するウェブページを介してユーザログを受信する。すなわち、ユーザログ受信部1211は、ユーザまたはウェブサーバを介してウェブサーバにアクセス(接続)し、ユーザの意味のある行動、すなわち、ログイン、ログアウト、ゲームマネーの購買、またはオールイン処理手順などのように分析目的とシナリオによって定義されたユーザ行動が発生する場合に、生成されるユーザログを受信することができる。このとき、ユーザログ受信部1211は、ユーザのウェブブラウザ及びジャバスクリプトタグを用いてユーザログを受信したり、クライアントの場合にはログ収集サーバで直接ユーザログを受信することができる。言い換えれば、ユーザログは、ウェブブラウザ及びジャバスクリプトタグが,定義されたユーザ行動にマッチンするユーザ行動を検出して対応するユーザログを生成し、ユーザログ受信部1211に生成したユーザログを送信する。
URL変更部1212は、ユーザログが含むURLを、STDB1213を用いてST名称に変更する。つまり、STDB1213に格納されているST名称と関連付けられたURLを参照し、ユーザログに含まれるURLに対応するST名称を抽出する。これは、URLを介してユーザ行動が発生する経路を容易に把握するためのものであって、URLから不必要な要素を除去するためである。また、分析者がURLを介してはURLと関連したウェブページを容易に把握することができないため、分析者がユーザ行動分析システムの結果を容易に把握できるようにURLをST名称に変更することもできる。
STMS1214は、STDB1213を管理及び維持する。ここで、STMS1214には、URLとこのURLに対応するST名称が互いに関連して保存されている。すなわち、STDB1213は、ユーザがウェブサーバを介してアクセスすることで、ユーザに提供されたウェブサイトと関連した各種URLを含み、URLと関連したST名称をURLと関連して保存している。
流動フィールド集合生成部1220は、ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成する。このとき、流動フィールドフォーマットは、流動フィールドの所定のフォーマットであり、流動フィールドはフィールド名及び複数の属性で構成される。
また、流動フィールドは、ユーザを識別するためのユーザ識別フィールド及びユーザまたはシステムの行動を記録する行動記録フィールドに分類される。また、ユーザ識別フィールドは、フィールド名によって、(1)ログイン名で分類されたユーザを示すログインフィールドと、(2)ブラウザ毎に割り当てられた永久クッキー別に分類されたユーザを示す永久クッキーフィールドとに分類される。また、行動記録フィールドは、(1)ユーザの特定ページ訪問を示すページビューフィールドと、(2)ユーザの特定リンクに対するクリックを示すクリックフィールドと、(3)ユーザに対するシステムの行動を示す行動フィールドとに分類される。
また、属性は、属性を分類する属性名およびユーザの行動を定義する属性値で構成されるようになる。
なお、流動フィールドは、ユーザログが含むユーザ行動の発生時刻を属性として含むことができる。すなわち、すべての流動フィールドは、流動フィールドと関連したユーザ行動の発生時刻を含むことができる。
このような流動フィールド集合生成部1220は、図12に示すように、流動フィールド生成部1221及び整列部1222を備えることができる。
流動フィールド生成部1221は、取得したユーザログそれぞれを流動フィールドフォーマットに変換してそれぞれの流動フィールドを生成する。すなわち、ユーザログはユーザの行動を含み、ユーザ行動分析システムは、このようなユーザログをユーザ行動分析システムが用いることができる流動フィールドフォーマットに変換する。上述したように、流動フィールドフォーマットは、流動フィールドの所定のフォーマットであり、ユーザログを流動フィールドフォーマットに変換する場合、ユーザログは、流動フィールドに変換されることになる。すなわち、ユーザログから流動フィールドを生成する。
整列部1222は、流動フィールドをユーザ別に時間順に整列して流動フィールド集合を生成する。このようなそれぞれの流動フィールドは、流動フィールド自体としては大きい意味がないため、流動フィールドが含むユーザ行動の発生時刻とユーザを基準に整列されて流動フィールド集合を生成する。
流動フィールド集合処理部1230は、流動フィールド集合に対する処理命令の入力によって流動フィールド集合を処理する。流動フィールド集合は、必要によって分割及び併合(統合)が可能であり、処理命令は、(1)典型的な分析質疑と、(2)所定の演算子または分析スクリプトとを含むことができる。
第1に、処理命令が典型的な分析質疑である場合に、流動フィールド集合を処理する流動フィールド集合処理部1230は、分析質疑が含む時間範囲、パターン、統計関数、または集団区分基準によって該当する流動フィールドを抽出したり、流動フィールドが含む属性に対する処理結果を提供することができる。
第2に、処理命令が所定の演算子、すなわち(1)入力された所定の時間範囲内の流動フィールドを抽出するドロー演算子と、(2)入力されたパターンに適合する流動フィールドを抽出するフィルタ演算子と、(3)入力された属性によって属性の総合または数を測定する集合演算子とを含む場合に、流動フィールド集合処理部1230は、(1)ドロー演算子またはフィルタ演算子によって該当する流動フィールドを抽出したり、(2)流動フィールド集合や抽出された流動フィールドのうちで集合演算子に該当する属性の総合または数を測定することができる。
最後に、処理命令が分析スクリプトである場合に、流動フィールド集合処理部1230は、入力された分析スクリプトによって時間範囲、パターン、または属性処理命令によって、(1)該当する流動フィールドを抽出したり、(2)流動フィールド集合や抽出された流動フィールドが含む属性のうちで処理命令に該当する属性の合計または数を測定することができる。
また、ユーザ行動分析システム1200において、データの分散処理のために、ログ収集サーバを複数の収集サーバで構成することができ、ユーザログは複数の収集サーバに分散収集されるように構成することができる。この場合に、流動フィールド集合処理部1230は、流動フィールド集合を処理する複数のコンピュータクラスタ(図示せず)を含むことができる。
すなわち、同じユーザに対する流動フィールドは、複数のコンピュータクラスタのうちで指定された同じコンピュータクラスタで処理命令に従って処理されることができ、流動フィールド集合処理部1230は、複数のコンピュータクラスタで処理命令に従って分散処理された結果を統合するコマンダ(commander)をさらに含むことができる。このような分散処理については、図13を参照しながらより詳しく説明する。
図13は、本発明に係るデータの分散処理方法を説明するための一例である。
単位時間あたりの使用量が多くなるトラフィック(traffic)の増加は、単位時間内に極めて多くのユーザログが入力される場合に、ログ収集サーバにオーバーロード(overload)を発生させたり、一部ユーザログの消失を引き起こす恐れがあるという問題点があり、記録及び分析しなければならないデータが多くなるデータ増加は、ユーザ行動分析の時間の増加に繋がるという問題点がある。
したがって、ユーザの行動を時間内に処理するために、図13の一例のような構造を用いることができる。
図13は、トラフィック増加及びデータ増加による問題点を、ログ収集サーバ(LCS)及びコンピュータユニット(computing unit;comp.unit)、すなわちコンピュータクラスタの数を増やすことでユーザログ及びデータの分散処理を実現し、解決できることを示している。例えば、午前0時のような特定の時間あるいは特定のイベント期間にだけユーザログが約10倍急増するものの、1日全体のユーザログ量には特別な差(変化)がなければ、コンピュータクラスタの数字はそのままにし、ログ収集サーバの数字だけを増やしてトラフィック増加に対する問題点を解決することができる。
すなわち、ログ収集サーバは、複数の収集サーバで構成され、ユーザログは、複数の収集サーバに分散収集される。また、流動フィールド集合は、ユーザログを介して生成されてユーザ別に分類される少なくとも1つの流動フィールドを含むため、同じユーザに対する流動フィールドを、流動フィールド集合を処理する複数のコンピュータクラスタのうちで指定された同じコンピュータクラスタで処理命令に従って処理することで、このような問題点を解決することができる。
より詳しく説明すれば、ユーザ行動分析システムは、ユーザログをそれぞれがログ収集サーバと同じように動作する複数の収集サーバに分散記録し、ハッシュ関数のような均一な分散(uniform distribution)を生成する関数を介してユーザ別にコンピュータクラスタを指定することで、あるユーザに対するユーザ行動が1つのコンピュータクラスタを介して処理されるようにできる。このように、1人のユーザに対するすべてのデータは1つのコンピュータクラスタで処理されるため外部ホストとの通信が不必要であり、複数のコンピュータクラスタで流動フィールド集合を処理するため流動フィールド集合を処理する時間が短縮される。また、複数の収集サーバを用いることで、トラフィック問題を解決することができる。
単純回数やユーザ数を数える演算においては、各コンピュータクラスタ別に数字を数え、その数字を該当するグループ別に合計すれば全体数字が計算されるようになるが、これは数字を数える演算(count)および合算演算(sum)が交換法則と結合法則を守るという性質に起因する。すなわち、既存の方式でユニーク・ビジター数(unique visitor)を求める場合には、同じユーザを数えたかを確認するためにユーザ全体を構成員とする集合を維持しなければならなかったが、初めからユーザ別に各コンピュータクラスタに保存することで該当の集合を維持する必要がないという効果がある。
また、上述したドロー演算子、フィルタ演算子、および集合演算子による演算は、すべてコンピュータクラスタで実行されるようになる。このとき、各コンピュータクラスタの結果を併合するために、図13に示すコマンダを用いて集合演算子による演算をもう1度実行することもできる。
このように、本発明に係るユーザ行動分析システムを用いれば、ユーザログを介してユーザの行動をユーザ別または時間順に整列することでユーザの行動に対する時系列的分析を容易かつ簡便に行うことができ、ユーザの行動を時系列的に分析することで購買経路、特定事件に対する会員行動パターンのように既存に把握し難かったウェブサイトの利用現況に対する原因を分析することが可能となる。
また、ウェブサイトの利用現況に対する原因を分析することでユーザの行動を理解し、これによってウェブサイトのサービスを改善することができる上に、ログ分析サーバが含むことができる複数の収集サーバを用いることでトラフィック増加の問題を解決し、複数のコンピュータクラスタを用いた分散処理によってユーザの行動に対する分析時間を短縮することができる。
なお、本発明の実施形態に係るユーザ行動分析方法は、コンピュータに実行可能なプログラムとして提供されることも可能である。具体的には、コンピュータの記憶部(不図示)に上記PPP方法の各ステップを実行するプログラムを格納し、CPU等の制御部により各プログラムが実行されることにより該PPC方法の各ステップが実現される。なお、プログラムは、各ステップを全て含む1つのプログラム、又は各ステップ毎の複数のプログラムで構成され、該プログムラを実行するコンピュータも1台又は複数台のコンピュータで構成することが可能である。
また、本発明は、ユーザ行動分析方法をコンピュータに実現させる上記プログラムを記憶したコンピュータ読取可能な記録媒体として提供することもできる。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるもののような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成することができ、その逆もできる。
上述したように、本発明を好ましい実施形態に則して説明したが、本発明の属する技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の技術的思想およびその領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
1200:ユーザ行動分析システム
1210:ログ収集サーバ
1211:ユーザログ受信部
1212:URL変更部
1213:STDB
1214:STMS
1220:流動フィールド集合生成部
1221:流動フィールド生成部
1222:整列部
1230:流動フィールド集合処理部

Claims (15)

  1. ユーザ行動分析方法であって、ウェブページを介したユーザ行動に関連したログ情報を収集するログ収集サーバから提供される、少なくとも前記ユーザを識別する情報及び前記ユーザ行動の発生時刻を含むユーザログを用いてユーザ行動分析処理を遂行するコンピュータによって実行されるステップが、
    前記ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成するステップと、
    前記流動フィールド集合に対する前記ユーザ行動に関連した分析処理命令の入力があった場合に、前記流動フィールド集合を処理するステップと、を含み、
    前記流動フィールドフォーマットは、フィールド名及び複数の属性で構成される流動フィールドの所定のフォーマットであり、前記流動フィールドは、ユーザを識別するためのユーザ識別フィールド及び前記ユーザ又はシステムの行動を記録する行動記録フィールドを含み、
    前記属性は、前記属性を分類する属性名及びユーザの行動を定義する属性値で構成され、前記属性として前記ユーザログが含む前記ユーザ行動の発生時刻を含み、
    前記ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成する前記ステップは、
    前記各ユーザ行動の発生に対して前記ログ収集サーバから個別に提供されるユーザログそれぞれを前記流動フィールドフォーマットに変換してそれぞれの流動フィールドを生成するステップと、
    前記流動フィールドをユーザ別に時間順に整列して前記流動フィールド集合を生成するステップと、を含み、
    前記流動フィールド集合に対する前記ユーザ行動に関連した分析処理命令の入力があった場合に、前記流動フィールド集合を処理するステップは、
    前記流動フィールド集合から前記分析処理命令に該当する流動フィールドを抽出したり、流動フィールドが含む属性の合計または数を測定し、
    前記ログ収集サーバは、複数の収集サーバで構成され、
    前記ユーザログは、前記複数の収集サーバで分散収集されることを特徴とするユーザ行動分析方法。
  2. 前記ユーザ行動に関連する分析処理命令は、分析質疑を含み、
    前記流動フィールド集合に対する前記ユーザ行動に関連する分析処理命令の入力があった場合に、前記流動フィールド集合を処理する前記ステップは、
    前記分析質疑が含む時間範囲、パターン、統計関数、または集合区分基準に基づいて該当する流動フィールドを抽出したり、前記流動フィールドが含む属性の合計または数を測定することを特徴とする請求項1に記載のユーザ行動分析方法。
  3. 前記ユーザ行動に関連する分析処理命令は、
    (1)入力された時間範囲の流動フィールドを抽出するドロー演算子と、
    (2)入力されたパターンに適合する流動フィールドを抽出するフィルタ演算子及び入力された属性に基づいて前記属性の合計又は数を測定する集合演算子と、を含み、
    前記流動フィールド集合に対する前記ユーザ行動に関連する分析処理命令の入力があった場合に、前記流動フィールド集合を処理する前記ステップは、
    (1)前記ドロー演算子又は前記フィルタ演算子に基づいて該当する流動フィールドを抽出したり、
    (2)前記流動フィールド集合や前記抽出された流動フィールドのうちで前記集合演算子に該当する属性の合計または数を測定することを特徴とする請求項2に記載のユーザ行動分析方法。
  4. 前記ユーザ行動に関連する分析処理命令は、時間範囲、パターン、または属性処理命令で構成された分析スクリプトを含み、
    前記流動フィールド集合に対する前記ユーザ行動に関連する分析処理命令の入力があった場合に、前記流動フィールド集合を処理する前記ステップは、
    入力された前記分析スクリプトに基づく前記時間範囲、前記パターン、又は前記属性処理命令に基づいて、
    (1)該当する流動フィールドを抽出したり、
    (2)前記流動フィールド集合や前記抽出された流動フィールドが含む属性のうちで前記処理命令に該当する属性の合計または数を測定することを特徴とする請求項1から3のいずれか1つに記載のユーザ行動分析方法。
  5. 前記ログ収集サーバがウェブサーバで提供するウェブページを介して前記ユーザログを受信するステップと、
    前記ログ収集サーバが、前記ユーザログが含むURLを、前記URLに対応する所定の名称を保存するデータベースを参照して前記所定の名称に変更するステップと、
    を含むことを特徴とする請求項1から4のいずれか1つに記載のユーザ行動分析方法。
  6. 前記ログ収集サーバがウェブサーバで提供するウェブページを介して前記ユーザログを受信する前記ステップは、
    前記ログ収集サーバがユーザのウェブブラウザ及びジャバスクリプトタグを用いて前記ユーザログを受信したり、前記ユーザのクライアント端末から直接前記ユーザログを受信することを特徴とする請求項5に記載のユーザ行動分析方法。
  7. 前記ログ収集サーバは、前記URLと当該URLに対応する前記所定の名称を互いに関連付けて管理しかつ前記データベースを維持するサービスツリーマネージメントシステム、をさらに含むことを特徴とする請求項5に記載のユーザ行動分析方法。
  8. 前記ユーザログは、ウェブサーバが生成するウェブサーバログを含み、
    前記ログ収集サーバは、前記ウェブサーバで生成された前記ウェブサーバログを収集することを特徴とする請求項1から7のいずれか1つに記載のユーザ行動分析方法。
  9. 前記流動フィールド集合は、前記ユーザログを介して生成されてユーザ別に分類される少なくとも1つの流動フィールドを含むとともに、前記コンピュータは、前記流動フィールド集合に対する前記ユーザ行動に関連した分析処理命令の入力があった場合に、流動フィールド集合を処理するステップを遂行する複数のコンピュータクラスタを含み、
    前記複数のコンピュータクラスタのうちで指定された同じコンピュータクラスタが、同じユーザに対する前記ユーザ行動の分析処理命令に該当する流動フィールドを抽出したり、流動フィールドが含む属性の合計または数を測定することを特徴とする請求項1から8のいずれか1つに記載のユーザ行動分析方法。
  10. コンピュータに、請求項1ないし4のうちのいずれか一項に記載のユーザ行動分析方法の各ステップを実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
  11. ユーザ行動分析システムであって、
    ウェブページを介したユーザ行動に関連したログ情報であって少なくとも前記ユーザを識別する情報及び前記ユーザ行動の発生時刻を含むユーザログを収集するログ収集サーバと、
    前記ユーザログを流動フィールドフォーマットに変換して流動フィールド集合を生成する流動フィールド集合生成部と、
    前記流動フィールド集合に対する前記ユーザ行動に関連した分析処理命令の入力があった場合に、前記流動フィールド集合を処理する流動フィールド集合処理部と、を有し、
    前記流動フィールドフォーマットは、フィールド名および複数の属性で構成される流動フィールドの所定のフォーマットであり、ユーザを識別するためのユーザ識別フィールドおよび前記ユーザまたはシステムの行動を記録する行動記録フィールドを含み、
    前記属性は、前記属性を分類する属性名及びユーザの行動を定義する属性値で構成され、前記属性として前記ユーザログが含む前記ユーザ行動の発生時刻を含み、
    前記流動フィールド集合生成部は、
    前記各ユーザ行動の発生に対して前記ログ収集サーバから個別に提供されるユーザログそれぞれを前記流動フィールドフォーマットに変換してそれぞれの流動フィールドを生成する流動フィールド生成部と、
    前記流動フィールドをユーザ別に時間順に整列して前記流動フィールド集合を生成する流動フィールド整列部と、を有し、
    前記流動フィールド集合処理部は、
    前記流動フィールド集合から前記分析処理命令に該当する流動フィールドを抽出したり、流動フィールドが含む属性の合計または数を測定し、
    前記ログ収集サーバは、複数の収集サーバで構成され、
    前記ユーザログは、前記複数の収集サーバに分散収集されることを特徴とするユーザ行動分析システム。
  12. 前記ログ収集サーバは、
    ウェブサーバで提供するウェブページを介して前記ユーザログを受信するユーザログ受信部と、
    前記ユーザログが含むURLを、前記URLに対応する所定の名称を保存するデータベースを参照して前記所定の名称に変更するURL変更部と、
    を備えることを特徴とする請求項11に記載のユーザ行動分析システム。
  13. 前記ログ収集サーバは、
    前記URLと当該URLに対応する前記所定の名称を互いに関連付けて管理しかつ前記データベースを維持するサービスツリーマネージメントシステム、をさらに含むことを特徴とする請求項12に記載のユーザ行動分析システム。
  14. 前記流動フィールド集合は、前記ユーザログを介して生成されてユーザ別に分類される少なくとも1つの流動フィールドを含み、
    前記流動フィールド集合処理部は、前記流動フィールド集合を処理する複数のコンピュータクラスタを含むことを特徴とする請求項11に記載のユーザ行動分析システム。
  15. 前記複数のコンピュータクラスタのうちで指定された同じコンピュータクラスタが、同じユーザに対する前記ユーザ行動に関連する分析処理命令に該当する流動フィールドを抽出したり、流動フィールドが含む属性の合計または数を測定し、
    前記流動フィールド集合処理部は、
    前記複数のコンピュータクラスタで分散処理された結果を統合するコマンダ、
    をさらに含むことを特徴とする請求項14に記載のユーザ行動分析システム。
JP2011263893A 2007-05-17 2011-12-01 ユーザ行動分析方法及びユーザ行動分析システム Active JP5264981B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070047895A KR100912177B1 (ko) 2007-05-17 2007-05-17 사용자 행동 분석 방법 및 시스템
KR10-2007-0047895 2007-05-17

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008127801A Division JP4938725B2 (ja) 2007-05-17 2008-05-15 ユーザ行動分析方法及びユーザ行動分析システム

Publications (2)

Publication Number Publication Date
JP2012069151A true JP2012069151A (ja) 2012-04-05
JP5264981B2 JP5264981B2 (ja) 2013-08-14

Family

ID=40147340

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008127801A Active JP4938725B2 (ja) 2007-05-17 2008-05-15 ユーザ行動分析方法及びユーザ行動分析システム
JP2011263893A Active JP5264981B2 (ja) 2007-05-17 2011-12-01 ユーザ行動分析方法及びユーザ行動分析システム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008127801A Active JP4938725B2 (ja) 2007-05-17 2008-05-15 ユーザ行動分析方法及びユーザ行動分析システム

Country Status (2)

Country Link
JP (2) JP4938725B2 (ja)
KR (1) KR100912177B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020245966A1 (ja) * 2019-06-06 2020-12-10

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010129555A2 (en) 2009-05-04 2010-11-11 Visa International Service Association Frequency-based transaction prediction and processing
CN106502103B (zh) * 2015-09-06 2019-03-01 深圳会当科技有限公司 一种用户行为的分析方法
JP2017220099A (ja) * 2016-06-09 2017-12-14 株式会社Jsol Webページにおけるユーザの閲覧行動情報をネットワークを介して取得するシステム
JP7011070B2 (ja) * 2018-01-30 2022-01-26 セロニス エスイー 分散型itインフラストラクチャにおいてプロセスプロトコルを生成するための方法
CN111339387B (zh) * 2018-12-18 2023-06-09 阿里巴巴集团控股有限公司 基于信息模板的点击反馈获取方法、装置及电子设备
CN110109814B (zh) * 2019-05-15 2023-07-21 恒生电子股份有限公司 用户行为数据修正方法及装置
KR102198789B1 (ko) 2020-03-31 2021-01-06 쿠팡 주식회사 통합 사용 로그 데이터를 생성하는 서버 및 그 동작 방법

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10293704A (ja) * 1997-04-18 1998-11-04 Hitachi Ltd ログデータの収集と管理をする情報処理装置
JP2001306947A (ja) * 2000-04-20 2001-11-02 Ntt Data Corp アクセス分析システム、アクセス分析方法および記録媒体
JP2001350875A (ja) * 2000-06-07 2001-12-21 Nippon Telegr & Teleph Corp <Ntt> 流行アイテム予測方法及びシステム装置
JP2002041456A (ja) * 2000-07-25 2002-02-08 Nri & Ncc Co Ltd ジャーナル管理サーバ、ログ収集方法および記録媒体
JP2002230417A (ja) * 2000-11-20 2002-08-16 Nippon Telegr & Teleph Corp <Ntt> お薦めアイテム紹介方法、お薦めアイテム紹介装置およびお薦めアイテム紹介プログラムを記録した記録媒体
JP2002342211A (ja) * 2001-05-17 2002-11-29 Accent:Kk アクセス行動分析システム
JP2002366838A (ja) * 2001-06-06 2002-12-20 Toshiba Corp リコメンデーション方法及びサーバ・システム並びにプログラム
JP2003030403A (ja) * 2001-07-12 2003-01-31 Sumisho Computer Systems Corp プロファイル収集装置および方法、販売促進支援システム、プログラム、記録媒体
JP2003058395A (ja) * 2001-06-04 2003-02-28 Sony Computer Entertainment Inc ログ収集解析システム、ログ収集方法、コンピュータに実行させるためのログ収集プログラム、ログ解析方法、コンピュータに実行させるためのログ解析プログラム、ログ収集装置、ログ解析装置、ログ収集端末、ログサーバ
JP2004295303A (ja) * 2003-03-26 2004-10-21 Nri & Ncc Co Ltd ログ収集管理システム、ログ収集管理方法およびコンピュータプログラム
JP2005234689A (ja) * 2004-02-17 2005-09-02 Hitachi Ltd コミュニティ評価支援方法および装置
JP2006295232A (ja) * 2005-04-05 2006-10-26 Lac Co Ltd セキュリティ監視装置、セキュリティ監視方法、及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010097408A (ko) * 2000-04-22 2001-11-08 이태균 사용자 행동 분석 방법 및 장치
JP2006323629A (ja) * 2005-05-19 2006-11-30 Kan:Kk ウェブサーバのページ更新のための情報を解析するサーバ、ウェブサーバ及びページ更新方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10293704A (ja) * 1997-04-18 1998-11-04 Hitachi Ltd ログデータの収集と管理をする情報処理装置
JP2001306947A (ja) * 2000-04-20 2001-11-02 Ntt Data Corp アクセス分析システム、アクセス分析方法および記録媒体
JP2001350875A (ja) * 2000-06-07 2001-12-21 Nippon Telegr & Teleph Corp <Ntt> 流行アイテム予測方法及びシステム装置
JP2002041456A (ja) * 2000-07-25 2002-02-08 Nri & Ncc Co Ltd ジャーナル管理サーバ、ログ収集方法および記録媒体
JP2002230417A (ja) * 2000-11-20 2002-08-16 Nippon Telegr & Teleph Corp <Ntt> お薦めアイテム紹介方法、お薦めアイテム紹介装置およびお薦めアイテム紹介プログラムを記録した記録媒体
JP2002342211A (ja) * 2001-05-17 2002-11-29 Accent:Kk アクセス行動分析システム
JP2003058395A (ja) * 2001-06-04 2003-02-28 Sony Computer Entertainment Inc ログ収集解析システム、ログ収集方法、コンピュータに実行させるためのログ収集プログラム、ログ解析方法、コンピュータに実行させるためのログ解析プログラム、ログ収集装置、ログ解析装置、ログ収集端末、ログサーバ
JP2002366838A (ja) * 2001-06-06 2002-12-20 Toshiba Corp リコメンデーション方法及びサーバ・システム並びにプログラム
JP2003030403A (ja) * 2001-07-12 2003-01-31 Sumisho Computer Systems Corp プロファイル収集装置および方法、販売促進支援システム、プログラム、記録媒体
JP2004295303A (ja) * 2003-03-26 2004-10-21 Nri & Ncc Co Ltd ログ収集管理システム、ログ収集管理方法およびコンピュータプログラム
JP2005234689A (ja) * 2004-02-17 2005-09-02 Hitachi Ltd コミュニティ評価支援方法および装置
JP2006295232A (ja) * 2005-04-05 2006-10-26 Lac Co Ltd セキュリティ監視装置、セキュリティ監視方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020245966A1 (ja) * 2019-06-06 2020-12-10
WO2020245966A1 (ja) * 2019-06-06 2020-12-10 日本電信電話株式会社 Ipアドレス割当装置、ipアドレス割当方法及びプログラム

Also Published As

Publication number Publication date
KR100912177B1 (ko) 2009-08-14
KR20090001751A (ko) 2009-01-09
JP4938725B2 (ja) 2012-05-23
JP2008287720A (ja) 2008-11-27
JP5264981B2 (ja) 2013-08-14

Similar Documents

Publication Publication Date Title
JP5264981B2 (ja) ユーザ行動分析方法及びユーザ行動分析システム
USRE48681E1 (en) System and method for tracking web interactions with real time analytics
US8554602B1 (en) System and method for behavioral segment optimization based on data exchange
Crook et al. Seven pitfalls to avoid when running controlled experiments on the web
EP2088711B1 (en) A log analyzing method and system based on distributed compute network
Raja et al. Defining and evaluating a measure of open source project survivability
US20070282876A1 (en) Method for service offering comparitive it management activity complexity benchmarking
US20130121580A1 (en) Analysis of service delivery processes based on interrogation of work assisted devices
US20180046956A1 (en) Warning About Steps That Lead to an Unsuccessful Execution of a Business Process
CN102915269B (zh) 一种b/s软件系统的通用日志分析方法
US20170109639A1 (en) General Model for Linking Between Nonconsecutively Performed Steps in Business Processes
Chen et al. From tpc-c to big data benchmarks: A functional workload model
CN107800591A (zh) 一种统一日志数据的分析方法
US10411969B2 (en) Backend resource costs for online service offerings
KR20120007889A (ko) 광고효과를 검증하는 방법, 시스템 및 그 기록매체
CN110675069B (zh) 地产行业客户签约风险预警方法、服务器及存储介质
El-Gharib et al. Process mining for cloud-based applications: A systematic literature review
US20100153261A1 (en) System and method for providing transaction classification
US20170109637A1 (en) Crowd-Based Model for Identifying Nonconsecutive Executions of a Business Process
CN112734227A (zh) 一种大数据决策系统及方法
KR20000058778A (ko) 인터넷 컨텐츠 특성별 사용자 성향 및 만족 지수를 이용한실시간 벤치마킹 형태의 로그 파일 분석과 서비스 방법
Rong et al. Locating anomaly clues for atypical anomalous services: An industrial exploration
Sammaneh Requirements Elicitation with the Existence of Similar Applications: A Conceptual Framework
Li et al. Automating User Task Performance: Introducing Task Experience Score (TES) for Complex Cloud Platforms
KR101845208B1 (ko) 데이터베이스와 애플리케이션을 위한 웹기반 성능개선 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130430

R150 Certificate of patent or registration of utility model

Ref document number: 5264981

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250