JP5001682B2 - マイニングシステム及びマイニング方法 - Google Patents

マイニングシステム及びマイニング方法 Download PDF

Info

Publication number
JP5001682B2
JP5001682B2 JP2007061925A JP2007061925A JP5001682B2 JP 5001682 B2 JP5001682 B2 JP 5001682B2 JP 2007061925 A JP2007061925 A JP 2007061925A JP 2007061925 A JP2007061925 A JP 2007061925A JP 5001682 B2 JP5001682 B2 JP 5001682B2
Authority
JP
Japan
Prior art keywords
evaluation
log
client
server
evaluation result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007061925A
Other languages
English (en)
Other versions
JP2008225758A (ja
Inventor
逸郎 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRAWLER RESEARCH INSTITUTE, INC.
Original Assignee
CRAWLER RESEARCH INSTITUTE, INC.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRAWLER RESEARCH INSTITUTE, INC. filed Critical CRAWLER RESEARCH INSTITUTE, INC.
Priority to JP2007061925A priority Critical patent/JP5001682B2/ja
Publication of JP2008225758A publication Critical patent/JP2008225758A/ja
Application granted granted Critical
Publication of JP5001682B2 publication Critical patent/JP5001682B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数のサービスを提供するウェブサイトを評価するシステム及び方法に関する。
近年、インターネットを介して多様なサービスが提供されており、既存のWEBサイトに加えて、SNS(Social Networking Service)等の個人対個人あるいは個人対集団のコミュニティ型のWEBサイトも発達している。この種のWEBサイトの収入としては、WEBページに表示するバナー広告やメールなどに加える広告などの広告収入が主なものとなっている。WEBサイトの運営者は、自らが運営するWEBサイトの来訪者を増やすことなどで、WEBサイトの人気を高めてより多くの広告を得ることができる。
ここで、運営者などが広告主に対して自WEBサイトの人気の度合いを提示する際には、閲覧数や閲覧(来訪者)人数、あるいはリピート率(同一の閲覧者が再度閲覧する頻度)などの閲覧者の動向を提示することが知られている。
WEBサイトの動向を把握する手法としては、閲覧者のアクセス履歴に基づいてWEBページの遷移履歴を解析するもの(例えば、特許文献1)や、WEBサイトへのログイン時に入力したパスワードから閲覧者の動向を解析するもの(例えば、特許文献2)が知られている。
特開2002−123516号公報 特開2005−284884号
しかしながら、上記従来例では、WEBサイトのアクセス履歴に基づいて閲覧者の動向を解析するため、日次や月次など、所定の集計期間で解析を行うことしかできないため、今現在のWEBサイトの動向をリアルタイムで把握することができない、という問題があった。
また、上記SNSなどのWEBサイトでは、閲覧者や利用者の趣向や興味は時々刻々と変化するため、今現在の閲覧者等の動向をリアルタイムで把握しなければ、閲覧者のニーズに応えるWEBサイトを提供するのは難しい。上記従来例では、閲覧者の動向を解析する対象を変更するためには、プログラムやスクリプトなどを変更する必要があり、容易かつ迅速に行うことができない、という問題があった。
特に、上記SNSなどのWEBサイトでは、ユーザの趣向や興味は時々刻々と変化するため、集計する対象も閲覧数だけではなく検索キーワードの傾向や、利用しているサービスの種類など、閲覧者の動向の指標も時々刻々と変化する。上記従来例では、閲覧人数やWEBページの遷移履歴といった、固定的な項目のみを解析するため、任意の項目について閲覧者の動向を評価することは難しいという問題があった。
そこで本発明は、上記問題点に鑑みてなされたもので、WEBサイトの閲覧者の動向をリアルタイムで把握することを目的とし、また、任意の項目について閲覧者の動向を把握することを目的とする。
本発明は、クライアントにサービスを提供し、前記クライアントからのアクセスがあったときにログを生成する第1のサーバと、前記ログに基づいて、前記クライアントのアクセスに関する評価を行う第2のサーバとを備えたマイニングシステムであって、前記第1のサーバは、前記生成したログを前記第2のサーバへ送信し、前記第2のサーバは、前記第1のサーバから受信したログを格納する格納部を所定数備えて、前記格納部へ繰り返してログを順次格納するバッファと、第2のクライアントから受信した評価指令に基づいて、前記バッファのログを評価するエージェントを生成し、当該エージェントを起動するエージェント管理部と、を備え、前記第1のサーバは、複数のコミュニティを備えるサービスを提供し、第1のクライアントへ広告を提供し、前記第1のクライアントから広告の送信要求があったときには、当該広告を送信し、送信した広告の識別子と閲覧した前記第1のクライアントの識別子を含むログを生成し、前記エージェント管理部は、前記評価指令に含まれる、前記広告の識別子を含む評価条件と前記コミュニティ毎の前記広告の閲覧数を含む評価項目とを、前記生成するエージェントに設定し、前記評価指令の数に応じて複数のエージェントを生成し、これらのエージェントを起動させ、前記エージェントは、前記評価指令に含まれる前記評価条件に一致する情報を含むログを抽出するログ抽出部と、前記評価指令に含まれる前記評価項目について前記抽出したログの評価を行い、評価結果を生成する評価実行部と、前記評価結果を出力する出力部と、を有する。
また、前記評価実行部は、前記広告の識別子を含むログを前記バッファから抽出し、前記抽出したログから前記クライアントの識別子を抽出し、前記第1のクライアントの識別子をコミュニティの識別子毎に集計した情報を評価結果として生成し、前記出力部は、前記抽出したログの位置に前記評価結果を加え、前記第2のクライアントへ前記評価結果を送信することを特徴とする
したがって、本発明によれば、所定数まで格納可能なバッファに第1のクライアントがアクセスしたログを順次格納し、バッファ上のログ、特に、コミュニティ毎の広告の閲覧数を評価することで、第1のサーバにアクセスした第1のクライアントがアクセスした広告に関する動向をリアルタイムで把握することが可能となる。また、第2のクライアントは、前記従来例のようにスクリプトやプログラムを変更することなく、任意の項目について第1のクライアントの動向を把握することが可能となって、時々刻々と変化するクライアントの趣向の変化をリアルタイムで把握することが可能となる。
以下、本発明の一実施形態を添付図面に基づいて説明する。
図1は、第1の実施形態を示し、本発明を適用する計算機システムの一例を示すブロック図である。
図1において、インターネットなどのネットワーク13に接続されたゲートウェイ装置1は、ロードバランサやファイアーウォールを含んで構成される。そして、ゲートウェイ装置1には、ネットワーク13からのアクセスに対して所定のサービスを提供する複数のアプリケーションサーバ2を筆頭とするサーバ計算機群が接続される。これらサーバ計算機群により、所定のサービスを提供するWEBサイトが構成される。なお、図示はしないが各計算機(サーバ)は、CPUとメモリ及びストレージ装置を備える。以下の説明では、WEBサイトで複数のコミュニティ(情報の交換を行うユーザのグループ)から構成されるSNSを提供する例を示し、SNSでは、メッセージの送受信、掲示板の入出力、画像データやテキストデータの公開などのサービスを含む。
ネットワーク13には、WEBサイトにアクセスを行うWEBクライアント11と、WEBクライアント12が接続される。WEBクライアント11は、上記WEBサイトのSNSを利用する一般利用者(ユーザ)が操作する計算機であり、ブラウザなどを備えている。WEBクライアント12は、SNS(Social Networking Service)のコミュニティの管理者(コミュニティオーナー)やWEBサイトの管理者など特殊なユーザが操作する計算機で一般利用者(会員または来訪者)とは異なるアクセス権限を持つ特殊ユーザである。
ゲートウェイ装置1に接続される複数のアプリケーションサーバ2は、例えば、メッセージの送受信、掲示板の入出力、画像データやテキストデータの公開などのサービスを含み、複数のアプリケーションサーバ2でSNSを提供する。なお、アプリケーションサーバ2は、HTTPにてWEBクライアント11、12と通信を行うWEBサーバを含んで構成される。なお、WEBサイトが提供するサービスは、SNSに限定されるものではなく、WEBページや動画データや音楽データの提供などを含むことができる。
複数のアプリケーションサーバ2はWEBサイトの内部ネットワーク8にそれぞれ接続される。この内部メットワーク8には、各種サーバ計算機アプリケーションサーバ2が提供するサービスで使用するデータをアプリケーション用データベース30に格納するデータベースサーバ3と、アプリケーションサーバ2が生成したログをユーザ操作ログデータベース40に格納するログサーバ4と、ログに基づいて後述する評価を行う逐次マイニングサーバ6と、逐次マイニングサーバ6が生成した評価結果をバリュエーションデータベース70に格納する評価結果サーバ7と、WEBサイト内の各サーバ計算機の時刻を同期させる時刻同期サーバ5がそれぞれ接続される。なお、逐次マイニングサーバ6が行う評価とは、ログに含まれるクライアント11の操作情報(操作イベント)を集計または解析することを含む。
次に、図2は、各サーバ計算機の要部とデータの流れを示すブロック図である。アプリケーションサーバ2は、WEBクライアント11からのアクセスを受け付けると、所定のサービスを実行し、WEBクライアント11のアクセス内容を示すログ生成部21を備える。ログ生成部21が生成するログは、例えば、WEBクライアント11の識別子と、実行したサービス名と、アクセスしたURL等の情報を含み、WEBクライアント11のユーザが行った操作の履歴をログとして生成する。なお、WEBクライアント11の識別子は、例えば、IPアドレスや会員制のSNSの場合ではユーザIDなど、アクセスしたWEBクライアント11またはユーザを一意に特定可能なWEBクライアント11の識別子であればよい。
次に、ログ生成部21で生成されたログには、タイムスタンプ付与部22で現在時刻のタイムスタンプが付与される。タイムスタンプを付与されたログは、キュー23へ投入されユーザ操作ログサーバ4へログを順次書き込んでいく。
以上により、複数のアプリケーションサーバ2は、WEBクライアント11からのアクセスに応答し、アクセス内容に基づくユーザの操作内容をログに記録し、このログにタイムスタンプを付加してユーザ操作ログサーバ4へ格納していく。
ユーザ操作ログサーバ4は、各アプリケーションサーバ2から受信したログを、ユーザ操作ログデータベース40へ書き込み、このログを逐次マイニングサーバ6へイベントとして送信する。すなわち、ユーザ操作ログサーバ4は、ユーザ操作ログデータベース40への書き込みが発生したとき、この書き込みをトリガとして逐次マイニングサーバ6にログを送信する。なお、ユーザ操作ログサーバ4では、タイムスタンプを元に格納したログをソートすることでユーザ操作の履歴を適切な順序で読み出すことができる。
逐次マイニングサーバ6はイベントモニタサーバとして機能し、ユーザ操作ログサーバ4からのログをユーザの操作イベントとして取り扱う。なお、逐次マイニングサーバ6は複数備えるようにしても良い。この場合、ユーザ操作ログサーバ4は全ての逐次マイニングサーバ6へログを送信する。
逐次マイニングサーバ6は、ユーザ操作ログサーバ4から受信したログについて予め設定した評価を行う。逐次マイニングサーバ6は、WEBクライアント12のコミュニティオーナーから受信した評価指令を受け付けてマイニングエージェント63を生成するエージェント管理部61と、ユーザ操作ログサーバ4から受信したログを格納するブラックボード62と、ブラックボード62へ投入されたログ(操作イベント)を抽出し、所定の評価を行うマイニングエージェント63とから構成される。なお、ブラックボード62は、経時変化を反映するように構成されており、具体的にはファーストインファーストアウト(FIFO)型のリングバッファとして実現される。
エージェント管理部61は、WEBクライアント12のコミュニティオーナーなど所定の権限を有する特殊ユーザから、ログに含まれるユーザの操作イベントに対して評価を行う項目(評価項目)と、この項目についてどのような条件で解析をするかという評価条件とを含む評価指令を受け付ける。そして、エージェント管理部61は、ログに含まれるユーザの操作イベントを評価項目及び評価条件に基づいて評価するためのマイニングエージェント63を生成し、このマイニングエージェント63を起動する。エージェント管理部61はマイニングエージェント63を複数生成して、並列的に起動することが可能であり、例えば、ひとつのWEBクライアント12から複数の評価指令を受け付けて、複数のマイニングエージェント63を生成したり、複数のWEBクライアント12から複数の評価指令を受け付けて、複数のマイニングエージェント63を生成することができる。実行するマイニングエージェント63の数が多くなる場合には、図2のように、複数の逐次マイニングサーバ6を設ければよい。
WEBクライアント12から設定される評価項目としては、閲覧数や閲覧(来訪者)人数、あるいはリピート率、コミュニティ内の人口(会員数)、ユーザまたは来訪者の滞在時間、コミュニティへのデータ量、広告の閲覧数、閲覧した広告のURL、利用するサービスの種類などがある。また、評価条件としては、評価項目を監視する時点または期間(現在、過去1日間など)、URL、IPアドレス、ユーザID等である。例えば、現在のあるコミュニティの閲覧者数を評価する場合、評価項目には閲覧者数が設定され、評価条件にはURLと時刻が設定される。この評価項目と評価条件からなる評価指令は、エージェント管理部61が所定のインタフェースを提供して、WEBクライアント12からの入力に基づいて評価指令を生成しても良いし、あるいは、WEBクライアント12が所定のフォーマットの評価指令を送信し、エージェント管理部61がこの評価指令を受信するようにしても良い。
エージェント管理部61は、WEBクライアント12から評価指令を受け付けると、予め設定されたテンプレートなどに評価項目と評価条件を設定してマイニングエージェント63を生成する。例えば、マイニングエージェント63をXMLを用いたスクリプトで生成する場合には、テンプレートの所定の位置に評価項目と評価条件を設定したものをマイニングエージェント63として生成する。この場合、逐次マイニングサーバ6の記憶装置(メモリ)上では、ブラックボード62を監視するマイニングエージェント63と、マイニングエージェント63を実行するミドルウェアが実行される。なお、マイニングエージェント63はスクリプトに限定されるものではなく、ブラックボード62を監視して所定の評価を実行するオブジェクトとして生成されればよい。
ブラックボード62は、逐次マイニングサーバ6のメモリ上などに、複数のスロットで区分けされたリングバッファで構成されて、ユーザ操作ログサーバ4から受信したログを順次スロットに格納する。リングバッファは、バッファがフル(オーバーフロー状態)になると最も古いログを破棄して、最新のログを上書きしていくことになる。つまり、ブラックボード62には常時、最新のログのみが格納されることになる。
マイニングエージェント63は、予め設定された評価項目と評価条件に基づいて、ブラックボード62上のログを解析する。そして、マイニングエージェント63は、ひとつのログ(図中イベント)について評価が完了すると、評価結果を生成する。マイニングエージェント63は生成した評価結果を評価結果サーバ7へ格納し、また、この評価結果をブラックボード62上のログに付加する。つまり、ログに評価結果を付加することで、ひとつのマイニングエージェント63がある評価項目について実施した評価結果について、他のマイニングエージェント63が評価を行うことができる。また、マイニングエージェント63は、このマイニングエージェント63を設定したコミュニティオーナーに生成した評価結果を送信する。エージェント管理部61は、評価司令の内容をマイニングエージェント63に設定すると共に、コミュニティオーナーのIPアドレスやメールアドレスを設定することで、マイニングエージェント63から評価結果をコミュニティオーナーへリアルタイムで送信することができる。
ブラックボード62は、複数のマイニングエージェント63で共有可能な記憶領域として設定される。ブラックボード62は、例えば、図3で示すように構成され、n個のスロット備えた記憶領域として設定される。各スロットには、ログを格納する領域と、複数の評価結果を格納する領域と、逐次マイニングサーバ6が受信した時刻(タイムスタンプ)を格納する領域とを備える。
図4は、マイニングエージェント63で行われる処理の一例を示すフローチャートである。
マイニングエージェント63は、まず、S1で、ブラックボード62を検索して最も古い未処理のログを取得する。S2では、取得したログに評価対象(評価項目、評価条件)の情報が含まれるか否かを判定する。ログに評価対象の情報が含まれていれば、S3へ進み、含まれていなければS5へ進む。
S3では、取得したログの情報に基づいて、評価項目に関する評価を行い、評価結果を生成する。S4では、生成した評価結果を、取得したログと同一のスロットに書き込む。このとき、評価結果を評価結果サーバ7に送信し、バリュエーションデータベース70に格納する。そして、S5では、マイニングエージェント63が評価を行ったスロットの位置を処理済みとして記憶し、ログの受信時刻も記憶する。ブラックボード62のスロットの位置は、メモリアドレスやシリアル番号など、ブラックボード62上で一意に格納位置を特定できる値を用いればよい。
なお、マイニングエージェント63は任意にスロットの内容を破棄することができる。これは情報のふるいをかけるようなフィルタ操作の実現に有効である。
以上の処理を繰り返して実行することにより、マイニングエージェント63は、ブラックボード62上の全てのログ(操作イベント)について逐次評価処理をリアルタイムで実行し、現時点の評価結果を生成する。WEBクライアント12のユーザ(コミュニティオーナーやWEBサイトの管理者)は、この評価結果を参照することで、現時点のWEBサイトの閲覧者の動向をリアルタイムで知ることができる。
マイニングエージェント63は、リングバッファで構成されたブラックボード62のどのスロットまでを処理したかを各自で記憶することで、スロットに書き込む情報を抑制することができる。
また、ブラックボード62は、新たに多数のログを受信した場合では、リングバッファの特性上、未処理のログを処理済であると判定したり、処理するログの順序が逆転してしまう場合が想定される。このため、逐次マイニングサーバ6は、ログを受信すると、十分に細密な精度による受信時刻を各ログに付加する。
そして、マイニングエージェント63は処理済であると記憶しているログ(スロット)の受信時刻と、同一のスロットに打刻されている受信時刻とを比較し、受信時刻が異なればブラックボード62がオーバーフローしたことを判定できる。
以上の処理により、マイニングエージェント63は、ユーザ操作ログサーバ4から受信したログを順次評価して、評価結果を出力することができる。
WEBクライアント12では、コミュニティオーナー(特殊ユーザ)が、評価結果を評価結果サーバ7から適宜読み込んで、評価結果を利用することができる。なお、複数のマイニングエージェント63が生成する評価結果には、どの特殊ユーザの指示によって評価を実行したかを識別するため、コミュニティオーナー毎に付与したオーナ属性を含む。このオーナー属性を参照することにより、各コミュニティオーナーは自らが指令した評価結果であるか否かを識別することができる。
例えば、コミュニティオーナーが現時点のコミュニティ内の訪問者数を分析する場合、WEBクライアント12から、評価するコミュニティのURLと、現在という条件を逐次マイニングサーバ6に送信する。
逐次マイニングサーバ6は、評価項目にコミュニティ内の訪問者数を設定し、評価条件に現在を示す値と、指定されたURLを設定する。逐次マイニングサーバ6は、上記図4で示したように、ブラックボード62上の全てのログを解析し、評価対象の情報を含むログからIPアドレスまたユーザIDをカウントし、重複する値を排除したものを現時点のコミュニティ内の訪問者数として評価結果を生成し、評価結果サーバ7に送信する。なお、マイニングエージェント63は各スロットの評価結果には、集計中の値を設定することができる。
逐次マイニングサーバ6のマイニングエージェント63は、評価結果を生成した後、このマイニングエージェント63を設定したコミュニティオーナーのWEBクライアント12へ評価結果を送信する
また、WEBクライアント12のコミュニティオーナーは、評価結果サーバ7にアクセスすることにより、マイニングエージェント63の評価結果をリアルタイムで取得してもよい。
また、評価対象の期間が過去にわたる場合、ブラックボード62上に存在しないログについてはマイニングエージェント63が、評価対象のログをログサーバ4から取得し、評価を実施することができる。例えば、ブラックボード62のサイズが、数時間程度の場合は、評価条件が1日などに設定されていると、不足した期間のログをユーザ操作ログサーバ4へ要求することができる。なお、ブラックボード62のサイズは、WEBサイトの規模やトラフィックによって適宜設定すればよい。また、ブラックボード62のサイズ(容量)が極めて大きい場合に現時点のコミュニティ内の評価を行う際には、評価条件として現在時刻から過去数分などの条件を加えることで、評価結果の精度を確保することができる。
また、図4に示した処理は、逐次マイニングサーバ6では複数のマイニングエージェント63を並列的に実行できるので、あるマイニングエージェント63がWEBサイト全体の人口(アクセス数)を評価し、他のマイニングエージェント63がWEBサイト内の広告を閲覧した数を評価し、複数の評価を同時に行い、複数の事象についてリアルタイムで評価を行うことが可能となる。
また、エージェント管理部61は、単一または複数のコミュニティオーナーからの指令に応じて複数のマイニングエージェント63を生成して起動することができる。このため、WEBサイトの管理者や所有者に加えてSNSのコミュニティオーナーがそれぞれ所望の評価対象を任意に設定することが可能となる。
また、逐次マイニングサーバ6で所定の広告の閲覧数を評価する場合には、次のようになる。アプリケーションサーバ2は、WEBクライアント11がWEBサイト内の広告を要求したときは、当該広告を送信し、送信した広告の識別子(URL)と、WEBクライアント11の識別子(IPアドレス)とを含むログを生成する。そして、WEBクライアント12から、前記広告の閲覧数を評価指令と受け付けたエージェント管理部61は、評価条件に広告の識別子を設定し、評価項目に広告の閲覧数を設定したマイニングエージェント63を生成し、このマイニングエージェント63を起動する。
マイニングエージェント63は、ブラックボード62上のログを検索して広告の識別子を含むログからWEBクライアント11の識別子を抽出し、WEBクライアント11の識別子の数を加算したもの(または広告の識別子を含むログの数)を広告の閲覧数として出力する。なお、広告の閲覧人数を評価する場合には、前記広告の閲覧数からWEBクライアント11の識別子が重複した数を差し引いたものを、広告の閲覧人数として出力すればよい。
また、SNSを提供する各コミュニティの所定の広告の閲覧数を評価する場合、WEBクライアント12は、評価する広告の識別子を評価条件とし、各コミュニティ毎の広告の閲覧数を評価項目とした評価指令を逐次マイニングサーバ6へ送信する。WEBクライアント12から、各コミュニティ毎の広告の閲覧数を評価指令と受け付けたエージェント管理部61は、評価条件に広告の識別子を設定し、評価項目にコミュニティ毎の広告の閲覧数を設定したマイニングエージェント63を生成し、起動する。
マイニングエージェント63は、ブラックボード62上のログを検索して広告の識別子を含むログからWEBクライアント11の識別子を抽出し、WEBクライアント11の識別子の数を加算したものを広告の閲覧数として集計する。そして、WEBクライアント11の識別子に基づいてコミュニティ毎の広告の閲覧数を評価結果として出力する。なお、WEBクライアント11の識別子と各コミュニティの関連付けは、コミュニティの識別子毎に、所属するWEBクライアント11の識別子を格納したテーブルを予め設定し、このテーブルを参照すればよい。これにより、WEBクライアント12は逐次マイニングサーバ6からの評価結果または評価結果サーバ7を参照することで、ほぼリアルタイムで、現在ある広告を閲覧したWEBクライアント11の数をコミュニティ毎に評価することが可能となる。
以上のように、本発明の第1の実施形態によれば、リングバッファで構成されたブラックボード62上のログ(操作イベント)を評価することで、WEBサイトの閲覧者の動向をリアルタイムで把握することが可能となる。また、本発明により、WEBクライアント12は、スクリプトやプログラムを変更することなく、任意の項目について閲覧者の動向を把握することが可能となって、時々刻々と変化する閲覧者やSNSの会員の趣向に応じてコミュニティやWEBページの構成を迅速に行うことが可能となる。さらに、マイニングエージェント63は、評価結果をブラックボード62のスロットへ書き加えることにより、複数のマイニングエージェント63が起動している場合には、他のマイニングエージェント63がブラックボード62上の評価結果を演算することで、さらに高度な評価を行うことが可能となる。
前記従来例においては、WEBサイトの運営者などが過去のアクセス履歴に基づいて閲覧者の動向を解析し、運営者自身でWEBサイトの閲覧者の動向を利用したり、広告主に閲覧者の動向を提示するのが一般的であった。
一方、SNSなどのコミュニティ型のサービスでは、WEBサイト内に複数のコミュニティを設けており、各コミュニティはコミュニティオーナーが主体となって情報の提供などが行われている。コミュニティオーナーは、自らが立ち上げたコミュニティの閲覧者または利用者(会員)の動向を把握することで、コミュニティの価値(人気)を高めることができる。
このため、WEBクライアント12をコミュニティオーナーが利用することで、コミュニティオーナーが立ち上げたコミュニティに関する評価情報やWEBサイト全体の評価情報をリアルタイムで把握することができる。つまり、コミュニティオーナーは、エージェント管理部61に対して所望の評価指令を与えることで、コミュニティオーナーが管理する閲覧者の動向をリアルタイムで把握することが可能となるのである。
<第2実施形態>
図5は、第2の実施形態を示し、前記第1実施形態に示した複数の逐次マイニングサーバ6を直列的に接続した例を示す。その他の構成は前記第1実施形態と同様である。
図5において、逐次マイニングサーバ6Aは、前記第1実施形態の図3に示した逐次マイニングサーバ6と同様に、ユーザ操作ログサーバ4から受信したログをイベントとしてブラックボード62へ格納し、マイニングエージェント63により評価結果を出力する。
逐次マイニングサーバ6Aは、演算した評価結果を次段に接続した逐次マイニングサーバ6Bに送信する。逐次マイニングサーバ6Bは、受信した評価結果をイベントとしてブラックボード62へ格納し、マイニングエージェント63により所定の評価を行う。マイニングエージェント63は演算した第2の評価結果をWEBクライアント12あるいは評価結果サーバ7のバリュエーションデータベース70に送信する。
この場合、逐次マイニングサーバ6Aで求めた評価結果について、逐次マイニングサーバ6Bはさらに加工や分析を行うことが可能となる。そして、評価結果に基づく分析(または加工)は、ブラックボード62上で行われるので、リアルタイムで第2の評価結果を求めることが可能となる。
例えば、逐次マイニングサーバ6Aでは、SNSに加入したユーザの数をリアルタイムで求め、評価結果(集計結果)を逐次マイニングサーバ6Bへ送信する。逐次マイニングサーバ6Bでは、受信した評価結果(加入ユーザ数)から単位時間当たりの増減速度(人/分)を演算して出力する。
このように、評価処理を複数の逐次マイニングサーバ6A、6Bで分散して行うことで、各サーバの負荷が過大になるのを防ぎながらも高度な評価結果を得ることが可能となる。
<第3実施形態>
次に、上記第1実施形態または第2実施形態のWEBサイトを基盤として複数のSNSを提供し、当該WEBサイト内で提供する広告の収入をそれぞれのSNSに配分する手法を以下に示す。
まず、図1に示した複数のアプリケーションサーバ2では、Webページの提供、メッセージの交換、アドレス帳機能提供、メンバー(ユーザ)に他のメンバーを紹介する機能、メンバー間で共有する掲示板機能などを実行し、WEBサイト全体でSNSを提供する。
ここで、複数のアプリケーションサーバ2及びサーバ計算機群で構成されるWEBサイトには、複数の独立したSNSを提供する。各SNS内では、上記逐次マイニングサーバ6のマイニングエージェント63によって、メンバーのアクセス頻度などのパラメータ(評価項目)をリアルタイムで集計し、評価結果として出力する。そして、以下ではこの評価結果を各SNSの価値とする。以下では、前記第1実施形態の逐次マイニングサーバ6で各SNSの価値を評価する例を示す。
ここで、WEBサイトにSNS−A〜SNS−Nの複数のSNSが存在する場合、各SNSの価値をV(i)とする(ただし、i=A〜N)。そして、次式により価値V(i)を算出する。
V(i)=(a×(SNS−iのメンバー数/すべてのSNSの総メンバー数)+
b×(SNS−iのアクティブメンバー数/すべてのSNSの総アクティブメンバー数)+
c×(SNS−iの総アクセス数/すべてのSNSの総アクセス数)+
d×(SNS−iのメンバーの総滞在時間/すべてのSNSのメンバー滞在時間))
/(a+b+c+d) ………(1)
ここでa、b、c、dはマーケットの状況から予め設定した重み付け計数である。また、アクティブメンバーとは、少なくとも週に一回は当該WEBサイトのSNS−iを利用するメンバーを示す。
上記(1)式の価値V(i)は0から1の間の値となり、
V(A)+V(B)+V(C)+V(D)+…=1
となる。
前記第1実施形態で示したように、逐次マイニングサーバ6はログに基づいて評価結果を求めるため、アプリケーションサーバ2に負荷をかけることがない。このため、WEBサイトのメンバーのアクセスにストレスを与えないデータマイニングを実現できる。
次に、各SNS−iで提供するサイトの広告収入や有料告知等の収入Rとする。そして、この収入Rを、WEBサイトの運営者と、各SNS−iの管理者(コミュニティオーナー)で分配する。この分配の比率は、例えば、60%:40%とする。各SNS−iへ分配する収入R1は、上記(1)式で求めた価値V(i)に所定の分配比率=40%を乗じた値となる。すなわち、
R1=V(i)×0.4
である。
前記従来例のSNSのモデルは、無料でメンバーを集め、広告・有料告知収入はすべてサービス提供者(WEBサイトの運営者)が取得していた。これに対して、本実施形態のSNSでは、広告及び有料告知収入を全てのSNS−iのコミュニティオーナーに分配することで、各コミュニティオーナーにサイトの人口増、アクセス増への努力を誘導することが可能となる。また、各SNS−iのコミュニティオーナーは、WEBクライアント12を用いて逐次マイニングサーバ6から価値V(i)を取得することで、ある時点での自分のSNS−iのアクセス状況や、分配に繋がる価値V(i)を実時間で知ることができる。さらに、SNS−iのコミュニティオーナーは、逐次マイニングサーバ6から他のSNS−iの価値V(i)を取得することで、他のSNS−iの状況を知ることができ、競争状態を把握できる。
この結果、WEBサイトの活性化が期待でき、さらにこの活性化により広告主への価値向上となる。
なお、ログサーバ4にユーザ(メンバー)の操作ログを常に確保していることから、特定の画面(広告の出ている画面)へのアクセス数や、滞在時間を任意に集計することができる。さらに、逐次マイニングサーバ6への評価指令に、広告のリンクへのクリック数をリアルタイムでカウントすることができる。このため、価値V(i)を評価する項目を随時変更することが可能となる。
なお、価値V(i)を決定するためのパラメータは、上記のメンバー数やアクセス数などに限定されるものではなく、SNS−iの態様に応じて適宜変更することができる。
また、上記SNS−iは、複数のアプリケーションサーバ2が、単一のプラットフォームを構成し、前記プラットフォーム上で、複数のコミュニティを備えたサービスを提供する集合体(SNSなど)を複数提供するものである。なお、プラットフォームは、WEBサイトを提供するための計算機資源を示す。
なお、上記各実施形態では、ブラックボード62をリングバッファで構成した例を示したが、最新のデータを所定量だけ保持する記憶領域を備えるものであればよく、リングバッファに限定されるものではない。
また、上記各実施形態では、逐次マイニングサーバ6は、ユーザ操作ログサーバ4からログを受信する構成を示したが、逐次マイニングサーバ6はアプリケーションサーバ2のログを取得できればよいので、逐次マイニングサーバ6が直接アプリケーションサーバ2からログを受信しても良いし、あるいは、逐次マイニングサーバ6にユーザ操作ログデータベース40を設けても良い。
以上のように、本発明は、WEBサイトの評価をリアルタイムで行う計算機システムに適用することができる。
本発明の実施形態を示す計算機システムのブロック図。 同じく計算機システムの要部におけるデータの流れを示すブロック図。 同じくブラックボードの構成を示すブロック図。 同じくマイニングエージェントの処理を示すフローチャート。 第2の実施形態を示し、逐次マイニングサーバにおけるデータの流れを示すブロック図。
符号の説明
2 アプリケーションサーバ
4 ログサーバ
6 逐次マイニングサーバ
7 評価結果サーバ
61 エージェント管理部
62 ブラックボード
63 マイニングエージェント
70 バリュエーションデータベース

Claims (12)

  1. クライアントにサービスを提供し、前記クライアントからのアクセスがあったときにログを生成する第1のサーバと、
    前記ログに基づいて、前記クライアントのアクセスに関する評価を行う第2のサーバとを備えたマイニングシステムであって、
    前記第1のサーバは、前記生成したログを前記第2のサーバへ送信し、
    前記第2のサーバは、
    前記第1のサーバから受信したログを格納する格納部を所定数備えて、前記格納部へ繰り返してログを順次格納するバッファと、
    第2のクライアントから受信した評価指令に基づいて、前記バッファのログを評価するエージェントを生成し、当該エージェントを起動するエージェント管理部と、を備え、
    前記第1のサーバは、複数のコミュニティを備えるサービスを提供し、第1のクライアントへ広告を提供し、前記第1のクライアントから広告の送信要求があったときには、当該広告を送信し、送信した広告の識別子と閲覧した前記第1のクライアントの識別子を含むログを生成し、
    前記エージェント管理部は、
    前記評価指令に含まれる、前記広告の識別子を含む評価条件と前記コミュニティ毎の前記広告の閲覧数を含む評価項目とを、前記生成するエージェントに設定し、
    前記評価指令の数に応じて複数のエージェントを生成し、これらのエージェントを起動させ、
    前記エージェントは、
    前記評価指令に含まれる前記評価条件に一致する情報を含むログを抽出するログ抽出部と、
    前記評価指令に含まれる前記評価項目について前記抽出したログの評価を行い、評価結果を生成する評価実行部と、
    前記評価結果を出力する出力部と、を有し、
    前記評価実行部は、前記広告の識別子を含むログを前記バッファから抽出し、前記抽出したログから前記クライアントの識別子を抽出し、前記第1のクライアントの識別子をコミュニティの識別子毎に集計した情報を評価結果として生成し、
    前記出力部は、前記抽出したログの位置に前記評価結果を加え、前記第2のクライアントへ前記評価結果を送信することを特徴とするマイニングシステム。
  2. 前記バッファは、前記複数のエージェントで共有可能なリングバッファで構成されたことを特徴とする請求項1に記載のマイニングシステム。
  3. 前記複数のエージェントは、
    前記バッファのログから第1の評価結果を生成し、前記生成した評価結果を前記バッファ上で抽出したログの位置に加える第1のエージェントと。
    前記バッファの第1の評価結果から第2の評価結果を生成し、前記第2のクライアントへ送信する第2のエージェントと、を含むことを特徴とする請求項1に記載のマイニングシステム。
  4. 前記第1のクライアントは前記サービスを利用するユーザが操作する第1の計算機であり、前記第2のクライアントは、前記サービスを管理する管理者が操作する第2の計算機であることを特徴とする請求項1から3のいずれか一つに記載のマイニングシステム。
  5. クライアントにサービスを提供する第1のサーバが前記クライアントからのアクセスがあったときにログを生成し、前記第1のサーバからログを受信した第2のサーバで前記クライアントのアクセスに関する評価を行うマイニング方法であって、
    前記第1のサーバは、複数のコミュニティを備えるサービスを提供し、第1のクライアントへ広告を提供し、前記第1のクライアントから広告の送信要求があったときには、当該広告を送信し、
    前記第1のサーバからログを受信する手順と、
    前記受信したログを格納する格納部を所定数備えたバッファに、前記格納部へ繰り返してログを順次格納する手順と、
    第2のクライアントから、前記広告の識別子を含む評価条件と前記コミュニティ毎の前記広告の閲覧数を含む評価項目とを含む評価指令を受信する手順と、
    前記評価指令に基づいて、前記バッファのログを評価するエージェントを生成し、前記評価指令に含まれる前記広告の識別子を含む評価条件と前記コミュニティ毎の前記広告の閲覧数を含む評価項目とを、前記生成するエージェントに設定し、前記評価の指令の数に応じて複数のエージェントを生成する手順と、
    前記生成したエージェントを起動する手順と、
    前記広告の識別子を含むログを前記バッファから抽出し、前記抽出したログから前記クライアントの識別子を抽出し、前記クライアントの識別子をコミュニティの識別子毎に集計した情報を評価結果として生成する手順と、
    前記生成した評価結果を前記バッファ上で抽出したログの位置に加える手順と、
    前記第2のクライアントへ前記評価結果を送信する手順と、
    を含むことを特徴とするマイニング方法。
  6. 前記バッファは、前記複数のエージェントで共有可能なリングバッファで構成されたことを特徴とする請求項5に記載のマイニング方法。
  7. 前記第1のサーバは、複数のコミュニティを備えるサービスを含む集合体を複数提供し、
    前記評価指令には、前記集合体毎の所定の価値を評価する評価条件及び評価項目を含み、
    前記評価結果を生成する手順は、
    前記集合体毎の価値を求める手順と、
    前記第1のサーバの運営者と、前記集合体の間で広告に起因する収入を配分する手順と、
    前記集合体に配分された前記収入を、前記集合体毎の価値に基づいて各集合体毎に配分する手順と、
    を含むことを特徴とする請求項5に記載のマイニング方法。
  8. 前記複数のエージェントは、
    前記バッファのログから第1の評価結果を生成し、前記生成した評価結果を前記バッファ上で抽出したログの位置に加える第1のエージェントと、
    前記バッファの第1の評価結果から第2の評価結果を生成し、前記第2のクライアントへ送信する第2のエージェントと、を含むことを特徴とする請求項5に記載のマイニング方法。
  9. 前記リングバッファは、前記複数のエージェントで共有され、前記各エージェントは前記格納部のログをそれぞれ読み込むことを特徴とする請求項6に記載のマイニング方法。
  10. 前記リングバッファは、前記複数のエージェントで共有され、
    前記ログを抽出する手順は、
    前記各エージェントが前記格納部のログをそれぞれ読み込むことを特徴とする請求項6に記載のマイニング方法。
  11. 前記第1のサーバは、
    前記複数のサーバを備えて単一のプラットフォームを構成し、
    前記プラットフォーム上で、複数のコミュニティを備えたサービスを提供する集合体を複数提供することを特徴とする請求項5に記載のマイニング方法。
  12. 前記第1のクライアントは前記サービスを利用するユーザが操作する第1の計算機であり、前記第2のクライアントは、前記サービスを管理する管理者が操作する第2の計算機であることを特徴とする請求項5から10のいずれか一つに記載のマイニング方法。
JP2007061925A 2007-03-12 2007-03-12 マイニングシステム及びマイニング方法 Expired - Fee Related JP5001682B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007061925A JP5001682B2 (ja) 2007-03-12 2007-03-12 マイニングシステム及びマイニング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007061925A JP5001682B2 (ja) 2007-03-12 2007-03-12 マイニングシステム及びマイニング方法

Publications (2)

Publication Number Publication Date
JP2008225758A JP2008225758A (ja) 2008-09-25
JP5001682B2 true JP5001682B2 (ja) 2012-08-15

Family

ID=39844320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007061925A Expired - Fee Related JP5001682B2 (ja) 2007-03-12 2007-03-12 マイニングシステム及びマイニング方法

Country Status (1)

Country Link
JP (1) JP5001682B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504671B (zh) * 2009-03-05 2012-10-03 阿里巴巴集团控股有限公司 用户访问网页行为的可视化处理方法、装置及系统
JP2010271931A (ja) * 2009-05-21 2010-12-02 Hitachi Ltd データ処理システム、データ処理方法、およびデータ処理プログラム
US20120078713A1 (en) * 2010-09-23 2012-03-29 Sony Corporation System and method for effectively providing targeted information to a user community
US9282158B2 (en) * 2011-06-06 2016-03-08 Google Inc. Reducing redirects
JP6609501B2 (ja) * 2016-03-29 2019-11-20 株式会社Nttドコモ 情報処理装置、情報処理方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3778652B2 (ja) * 1997-04-18 2006-05-24 株式会社日立製作所 ログデータ収集管理方法及びその装置
JP2004288110A (ja) * 2003-03-25 2004-10-14 Hitachi Information Systems Ltd ネットワークアクセスログ情報の収集解析システム
JP2005174094A (ja) * 2003-12-12 2005-06-30 Ntt Docomo Inc 利用履歴サーバ装置、サービス検索サーバ装置、通信端末、サービス推薦方法
JP2005234689A (ja) * 2004-02-17 2005-09-02 Hitachi Ltd コミュニティ評価支援方法および装置
JP2005251102A (ja) * 2004-03-08 2005-09-15 Hitachi Information Systems Ltd アクセス監視・制限システム

Also Published As

Publication number Publication date
JP2008225758A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
US8682904B1 (en) System of intuitive sorting of a table based on a column containing fractions
US8560504B2 (en) Web service performance index
US7979501B1 (en) Enhanced message display
US6898597B1 (en) Event log
US20080183664A1 (en) Presenting web site analytics associated with search results
JP2004206517A (ja) ホットキーワード提示方法及びホットサイト提示方法
KR20060121923A (ko) 인터넷 상의 웹사이트들의 동작을 분석하기 위한 방법 및툴
CA2682053A1 (en) Method and system for ranking information items for display
JP2007172174A (ja) 広告提示方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP4833305B2 (ja) ホットサイト提示システム
JP5001682B2 (ja) マイニングシステム及びマイニング方法
JP2002091852A (ja) 閲覧履歴取得方法及び情報提供方法
JP2002207669A (ja) 情報配信装置及び記録媒体
JP2002117206A (ja) Web視聴者分析方法、Web視聴者分析プログラム、記録媒体、Web視聴者分析システム
JP2008009582A (ja) 広告配信サーバ、広告配信プログラム、広告配信方法、及び広告配信システム
JP3315954B2 (ja) ネットワークシステム、インセンティブ提供方法、サーバ装置及び記録媒体
Zhao et al. Which factors affect the duration of hot topics on social media platforms?
JP4767873B2 (ja) 情報検索システム、情報検索装置、情報検索結果出力方法およびプログラム
KR20040019073A (ko) 배너광고전송서버 및 배너광고전송프로그램
JP6648566B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP4936523B2 (ja) 利用人数算出システム、利用人数算出方法および利用人数算出用プログラム
JP4469061B2 (ja) 通信システム
US6704783B1 (en) Reference state output system, reference state output method, and computer readable medium on which reference state output program is recorded
US8171038B2 (en) System and method for managing legislative information
JP4138342B2 (ja) アンケート方法及びプログラム並びに装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120518

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees