JP2018018523A - ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体 - Google Patents

ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体 Download PDF

Info

Publication number
JP2018018523A
JP2018018523A JP2017141441A JP2017141441A JP2018018523A JP 2018018523 A JP2018018523 A JP 2018018523A JP 2017141441 A JP2017141441 A JP 2017141441A JP 2017141441 A JP2017141441 A JP 2017141441A JP 2018018523 A JP2018018523 A JP 2018018523A
Authority
JP
Japan
Prior art keywords
user
cookie
user access
identification value
cookie identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017141441A
Other languages
English (en)
Other versions
JP6481721B2 (ja
Inventor
ヨンウェイ ジャン
Yongwei Yang
ヨンウェイ ジャン
ドーン ビン
Dawn Bing
ドーン ビン
ジィチョアヌ ジォン
Jichuan Zheng
ジィチョアヌ ジォン
トーン イーシュエン
Yixuan Tong
トーン イーシュエン
レイ ディーン
Lei Dean
レイ ディーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2018018523A publication Critical patent/JP2018018523A/ja
Application granted granted Critical
Publication of JP6481721B2 publication Critical patent/JP6481721B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/146Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5064Customer relationship management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】本発明は、ユーザアクセスログの関連付け方法、装置及びシステムを提供する。【解決手段】ユーザアクセスログの関連付け方法は、少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得するステップと、ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築するステップであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、ステップと、該対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップと、同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップと、を含む。【選択図】図1

Description

本発明は、インターネットの分野に関し、特に、ユーザアクセスログの関連付け方法、装置およびシステムに関する。
ユーザがウェブサイトにアクセスした際にアクセスログが生成され、これらのアクセスログを分析することによりユーザの関連行動を知ることができ、それによってユーザの基本情報及び興味や好み等を推測し、さらに、ユーザがウェブサイトにアクセスした際にユーザの好みに合った内容を推薦することができる。しかし、単一のウェブサイトのアクセスログを分析しただけでは一定の限定性が有り、ユーザが複数のウェブサイトへアクセスしたログを分析すれば、分析結果の精確性を大幅に高めることができる。よって、一つのユーザが異なるウェブサイトへアクセスしたログを関連付けることは、とても必要なことである。
従来技術において、ユーザが異なるウェブサイトへアクセスしたログを関連付ける際、先ず、流量コントロール装置またはユーザ請求傍受装置を用いて、ユーザアクセスログを傍受し、その後、ADSL(Asymmetric Digital Subscriber Line:非対称デジタル加入者線)アカウントや、IP(インターネットプロトコル)アドレスや、User Agent(ユーザエージェント)により、ユーザの違いを識別し、それによって、同一ユーザが異なるウェブサイトへアクセスしたログを関連付けている。
しかし、ADSLアカウントやIPアドレスやUser Agentによりユーザの違いを識別する際、複数のユーザが一つのADSLアカウントやIPアドレスやUser Agentを共有している可能性や、一つのユーザが複数のADSLアカウントやIPアドレスやUser Agentを使用している可能性が有るので、従来技術では、異なるユーザのアクセスログを同一ユーザに関連付けることがあり、関連付け結果の精確性が比較的低かった。
本発明が解決しようとする課題は、ユーザが異なるウェブサイトへアクセスしたログを関連付けることにより、関連付け結果の精確率を保証する、ユーザアクセスログの関連付け方法、装置およびシステムを提供することである。
上記課題を解決するために、本発明の実施例は、以下の技術案を提供する。
一つの態様では、少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得するステップと、ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定するとともに、ユーザエージェントとCookie識別値の対応関係を構築するステップであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、ステップと、前記対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップと、同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップと、を含むユーザアクセスログの関連付け方法を提供する。
さらに、前記ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定するステップは、複数のウェブサイトの登録ユーザを識別するために用いられるCookie識別フィールドを決定することと、決定されたCookie識別フィールドに基づいてユーザアクセスログのCookie情報を検索し、Cookie情報中にCookie識別フィールドが存在するか否かを判断し、存在する場合、Cookie情報中のCookie識別フィールドの値を、登録ユーザを識別するCookie識別値として記録することと、を含む。
さらに、前記ユーザアクセスログはアクセス時間をさらに含み、前記ユーザエージェントとCookie識別値の対応関係を構築するステップは、有効なCookie識別値を含む複数のユーザアクセスログを選別し、選別された複数のユーザアクセスログを複数の集合に区分し、各集合のユーザアクセスログは、同じユーザエージェントとCookie識別値を含むことと、各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第一評価スコアを得ることと、選別された複数のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得ることと、各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別されたユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得ることと、前記第一評価スコア、前記第二評価スコア及び前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連付けスコアに対して計算を行い、一つのユーザエージェントとの関連付けスコアが最高のCookie識別値を前記ユーザエージェントと対応するCookie識別値とすることと、を含む。
さらに、前記対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップは、前記対応関係に基づいて同一のユーザに属する少なくとも一つのユーザエージェントを判断して、同一のユーザに属する少なくとも一つのユーザエージェントが対応するCookie識別値が同一のユーザに属すると決定すること、を含む。
さらに、前記対応関係に基づいて同一のユーザに属する少なくとも一つのユーザエージェントを判断することは、第一ユーザエージェントと第一Cookie識別値が対応し、第二ユーザエージェントと第一Cookie識別値が対応する場合、第一ユーザエージェントと第二ユーザエージェントが同一のユーザのユーザエージェントに属すると判断することと、第二ユーザエージェントと第二Cookie識別値が対応し、第三ユーザエージェントと第二Cookie識別値が対応する場合、第一ユーザエージェントと第二ユーザエージェントと第三ユーザエージェントが同一のユーザのユーザエージェントに属すると判断することと、を含む。
さらに、前記同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップは、ステップa:各ユーザアクセスログがCookie情報を含むか否か判断し、含まない場合にステップbへ移り、含む場合にステップcへ移ることと、ステップb:前記Cookie情報を含まないユーザアクセスログを、前記複数のユーザアクセスログ中の一つのCookie情報を含むユーザアクセスログにマッピングし、ステップdへ移ることと、ステップc:Cookie情報が有効であるか否か判断し、有効である場合にステップdへ移り、無効である場合に終了することと、ステップd:ユーザアクセスログのCookie識別値及び同一のユーザに属するCookie識別値に基づいて、同一のユーザのCookie識別値を含む少なくとも一つのユーザアクセスログを同一のユーザに関連づけることと、を含む。
本発明の実施例は、少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得する取得モジュールと、ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築する第一処理モジュールであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、第一処理モジュールと、前記対応関係に基づいて同一のユーザに属するCookie識別値を決定する第二処理モジュールと、同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるための関連付けモジュールと、を含むユーザアクセスログの関連付け装置をさらに提供する。
さらに、前記第一処理モジュールは、複数のウェブサイトの登録ユーザを識別するために用いられるCookie識別フィールドを決定する分析ユニットと、決定されたCookie識別フィールドに基づいてユーザアクセスログのCookie情報を検索し、Cookie情報中にCookie識別フィールドが存在するか否かを判断し、存在する場合、Cookie情報中のCookie識別フィールドの値を、登録ユーザを識別するCookie識別値として記録するCookie識別値決定ユニットと、を含む。
さらに、前記ユーザアクセスログはアクセス時間をさらに含み、前記第一処理モジュールは、有効なCookie識別値を含む複数のユーザアクセスログを選別し、選別された複数のユーザアクセスログを複数の集合に区分し、各集合のユーザアクセスログは、同じユーザエージェントとCookie識別値を含む、選別ユニットと、各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第一評価スコアを得る第一評価ユニットと、各集合中のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得る第二評価ユニットと、各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別されたユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得る第三評価ユニットと、前記第一評価スコア、前記第二評価スコア及び前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連付けスコアに対して計算を行い、一つのユーザエージェントとの関連付けスコアが最高のCookie識別値を前記ユーザエージェントと対応するCookie識別値とする関連付けスコア計算ユニットと、を含む。
本発明の実施例は、以上に記載のユーザアクセスログの関連付け装置を含み、ユーザアクセスログを傍受し、傍受されたユーザアクセスログを前記取得モジュールへ提供する流量分析装置をさらに含むユーザアクセスログの関連付けシステムをさらに提供する。
本発明の実施例は、以下の有益な効果を具備する。
上記実施例においては、複数のユーザアクセスログを取得し、ユーザアクセスログの内容に基づいてユーザエージェントとCookie識別値の対応関係を構築し、さらに、同一ユーザに属するCookie識別値を決定し、同一ユーザに属するCookie識別値に基づいて、複数のユーザアクセスログ中の同一ユーザに属するユーザアクセスログを関連付ける。本発明の実施例は、Cookie識別値によってユーザを識別しており、一般的な状況下で、複数のユーザが一つの登録アカウントを共有して使用することはないので、Cookie識別値は唯一のユーザを表すことができるので、同一ユーザの複数のCookie識別値に基づき、同一ユーザの異なるウェブサイトでのCookie識別値を関連付けることにより、関連付け結果の精確率を確保することができる。
本発明の実施例の、ユーザアクセスログの関連付け方法のプロセスを示した概略図である。 本発明の実施例の、ユーザアクセスログの関連付け装置の構造ブロック図である。 本発明の別の実施例の、ユーザアクセスログの関連付け方法のプロセスを示した概略図である。 本発明の実施例の、同一ユーザに属するUser Agentを決定する概略図である。 本発明の実施例の、複数のユーザアクセスログ中の同一ユーザに属するユーザアクセスログを関連づけるプロセスを示した概略図である。 本発明の実施例の、ユーザアクセスログを関連付けるシステムのハードウェアの構造概略図である。
本発明の実施例が解決しようとする課題や技術案やメリットをさらに明瞭にするために、以下、図面及び具体的実施例を組み合わせて詳細に説明する。
本発明の実施例は、従来技術における、異なるユーザアクセスログを同一ユーザに関連付けることがあり関連付け結果の精確性が比較的低くなる問題に対し、ユーザアクセスログの関連付け方法、装置及びシステムを提供し、ユーザが異なるウェブサイトへアクセスしたログを関連付けることができるとともに、関連結果の精確率を保証することができる。
<実施例1>
本発明は、ユーザアクセスログの関連付け方法を提供しており、図1に示すように、以下のステップを含む。
ステップ101:少なくともユーザエージェントとCookie情報をそれぞれ含む複数のユーザアクセスログを取得する。
ステップ102:ユーザアクセスログのCookie情報中の登録ユーザの識別に用いられるCookie識別値を決定するとともに、ユーザエージェントとCookie識別値の対応関係を構築し、ユーザエージェントと対応するCookie識別値とが同じユーザに属する。
ステップ103:前記対応関係に基づいて同一ユーザに属するCookie識別値を決定する。
ステップ104:同一ユーザに属するCookie識別値に基づいて、同一ユーザに属するユーザアクセスログを関連付ける。
本実施例において、複数のユーザアクセスログを取得し、ユーザアクセスログの内容に基づいてユーザエージェントとCookie識別値の対応関係を構築し、それによって、同一ユーザに属するCookie識別値を決定し、同一ユーザに属するCookie識別値に基づいて、複数のユーザアクセスログ中の同一ユーザに属するユーザアクセスログを関連付ける。本発明の実施例は、Cookie識別値によってユーザを識別しており、一般的な状況下で、複数のユーザが一つの登録アカウントを共有して使用することはできないので、Cookie識別値は唯一のユーザを表すことができるので、同一ユーザの複数のCookie識別値に基づき、同一ユーザの異なるウェブサイトでのCookie識別値を関連付けることにより、関連付け結果の精確率を確保することができる。
さらに、前記ユーザアクセスログのCookie情報中の登録ユーザの識別に用いられるCookie識別値を決定することは、複数のウェブサイトの登録ユーザの識別に用いられるCookie識別フィールドを決定することと、決定したCookie識別フィールドに基づいてユーザアクセスログのCookie情報を検索し、Cookie情報中にCookie識別フィールドが存在するかどうかを判断し、存在する場合、Cookie情報中のCookie識別フィールドの値を、登録ユーザを識別するCookie識別値として記録することと、を含む。
さらに、前記ユーザアクセスログがアクセス時間をさらに含み、前記ユーザエージェントとCookie識別値の対応関係を構築することは、有効Cookie識別値を含む複数のユーザアクセスログを選別し、選別した複数のユーザアクセスログを複数の集合に区分し、各集合のユーザアクセスログが、同じなユーザエージェントとCookie識別値をそれぞれ含むことと、各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の間の関連付け関係に対して評価を行い、第一評価スコアを得ることと、選別した複数のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得ることと、各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別したユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得ることと、前記第一評価スコアと、前記第二評価スコアと、前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連付けスコアに対して計算を行い、一つのユーザエージェントとの関連付けスコアが最高のCookie識別値を前記ユーザエージェントと対応するCookie識別値とすることと、を含む。
さらに、前記各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の間の関連付け関係に対して評価を行い、第一評価スコアを得ることは、以下の公式を用いてユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第一評価スコアS1を得ることを含む。
Figure 2018018523
ここで、Tnは第n集合中のユーザアクセスログの全体時間スパンであり、Tmaxは選別した所有ユーザアクセスログの全体時間スパンである。
さらに、前記選別した複数のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得ることは、以下の公式を用いてユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアS2を得ることを含む。
Figure 2018018523
ここで、λ1は同一ユーザエージェント下のユーザ登録の回数と選別した所有ユーザアクセスログの全体登録回数の比であり、0<λ1<1であり、λ2は同一ユーザエージェント化のユーザ登録の持続時間の平均値と選別した所有ユーザアクセスログの全体時間スパンの比であり、0<λ2<1であり、W1は所定の第一重みである。
さらに、前記各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別したユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得ることは、以下の公式を用いてユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアS3を得ることを含む。
Figure 2018018523
ここで、Nnは第n集合のユーザアクセスログの個数であり、kは集合の個数である。
さらに、前記の前記第一評価スコアと、前記第二評価スコアと、前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連に対して計算を行うことは、以下の公式を用いて各ユーザエージェントと異なるCookie識別値との関連付けスコアS0を計算することを含む。
Figure 2018018523
ここで、S1は第一評価スコアであり、S2は第二評価スコアであり、S3は第三評価スコアであり、W2は所定の第二重みである。
さらに、前記の前記対応関係に基づいて同一ユーザに属するCookie識別値を決定することは、前記対応関係に基づいて同一ユーザに属する少なくとも一つのユーザエージェントを判断することによって、同一ユーザに属する少なくとも一つのユーザエージェントが対応するCookie識別値が同一ユーザに属すると決定すること、を含む。
さらに、前記の前記対応関係に基づいて同一ユーザに属する少なくとも一つのユーザエージェントを判断することは、第一ユーザエージェントと第一Cookie識別値が対応し、第二ユーザエージェントと第二Cookie識別値が対応する際、第一ユーザエージェントと第二ユーザエージェントが同一ユーザに属するユーザエージェントであると判断することと、第二ユーザエージェントと第二Cookie識別値が対応し、第三ユーザエージェントと第三Cookie識別値が対応する際、第一ユーザエージェントと第二ユーザエージェントと第三ユーザエージェントが同一ユーザに属するユーザエージェントであると判断することと、を含む。
さらに、前記同一ユーザに属するCookie識別値に基づいて、同一ユーザに属するユーザアクセスログを関連付けるステップは、以下のステップを含む。
ステップa:各ユーザアクセスログがCookie情報を含むかどうか判断し、含まない場合ステップbへ移り、含む場合ステップcへ移る。
ステップb:前記Cookie情報を含まないユーザアクセスログを、前記複数のユーザアクセスログ中の一つのCookie情報を含むユーザアクセスログに反映し、ステップdへ移る。
ステップc:Cookie情報が有効かどうか判断し、有効であればステップdへ移り、無効であれば終了する。
ステップd:ユーザアクセスログのCookie識別値及び同一ユーザに属するCookie識別値に基づいて、同一ユーザのCookie識別値を含む少なくとも一つのユーザアクセスログを同一ユーザに関連づける。
<実施例2>
本実施例は、ユーザアクセスログの関連付け装置を提供しており、図2に示すように、以下のモジュールを含む。
取得モジュール21は、少なくともユーザエージェントとCookie情報をそれぞれ含む複数のユーザアクセスログを取得する。
第一処理モジュール22は、ユーザアクセスログのCookie情報中の登録ユーザの識別に用いられるCookie識別値を決定するとともに、ユーザエージェントとCookie識別値の対応関係を構築し、ユーザエージェントと対応するCookie識別値とが同じユーザに属する。
第二処理モジュール23は、前記対応関係に基づいて同一ユーザに属するCookie識別値を決定する。
関連付けモジュール24は、同一ユーザに属するCookie識別値に基づいて、同一ユーザに属するユーザアクセスログを関連付ける。
本実施例において、複数のユーザアクセスログを取得し、ユーザアクセスログの内容に基づいてユーザエージェントとCookie識別値の対応関係を構築し、それによって、同一ユーザに属するCookie識別値を決定し、同一ユーザに属するCookie識別値に基づいて、複数のユーザアクセスログ中の同一ユーザに属するユーザアクセスログを関連付ける。本発明の実施例は、Cookie識別値によってユーザを識別しており、一般的な状況下で、複数のユーザが一つの登録アカウントを共有して使用することはできないので、Cookie識別値は唯一のユーザを表すことができるので、同一ユーザの複数のCookie識別値に基づき、同一ユーザの異なるウェブサイトでのCookie識別値を関連付けることにより、関連付け結果の精確率を確保することができる。
さらに、図2に示すように、ユーザアクセスログの関連付け装置は、以下のモジュールをさらに含む。
入力モジュール20は、取得モジュール21へ向けて複数のユーザアクセスログを提供する。
出力モジュール25は、関連付けモジュール24の分析結果を出力する。
さらに、前記第一処理モジュールは、以下のユニットを含む。
分析ユニットは、複数のウェブサイトの登録ユーザの識別に用いられるCookie識別フィールドを決定する。
Cookie識別値決定ユニットは、決定したCookie識別フィールドに基づいてユーザアクセスログのCookie情報を検索し、Cookie情報中にCookie識別フィールドが存在するかどうかを判断し、存在する場合、Cookie情報中のCookie識別フィールドの値を、登録ユーザを識別するCookie識別値として記録する。
さらに、前記ユーザアクセスログがアクセス時間をさらに含み、前記第一処理モジュールは、以下のユニットを含む。
選別ユニットは、有効Cookie識別値を含む複数のユーザアクセスログを選別し、選別した複数のユーザアクセスログを複数の集合に区分し、各集合のユーザアクセスログが、同じなユーザエージェントとCookie識別値をそれぞれ含む。
第一評価ユニットは、各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の間の関連付け関係に対して評価を行い、第一評価スコアを得る。
第二評価ユニットは、選別した複数のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得る。
第三評価ユニットは、各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別したユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得る。
スコア計算ユニットは、前記第一評価スコアと、前記第二評価スコアと、前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連付けスコアに対して計算を行い、一つのユーザエージェントとの関連付けスコアが最高のCookie識別値を前記ユーザエージェントと対応するCookie識別値とする。
さらに、前記第二処理モジュールは具体的に、前記対応関係に基づいて同一ユーザに属する少なくとも一つのユーザエージェントを判断するためのものであり、それによって、同一ユーザに属する少なくとも一つのユーザエージェントが対応するCookie識別値が同一ユーザに属すると決定する。
さらに、前記関連付けモジュールは具体的に、各ユーザアクセスログがCookie情報を含むかどうか判断し、含まない場合、前記Cookie情報を含まないユーザアクセスログを、前記複数のユーザアクセスログ中の一つのCookie情報を含むユーザアクセスログにマッピングし、含む場合、Cookie情報が有効かどうか判断し、有効であれば、ユーザアクセスログのCookie識別値及び同一ユーザに属するCookie識別値に基づいて、同一ユーザのCookie識別値を含む少なくとも一つのユーザアクセスログを同一ユーザに関連づける。
ユーザアクセスログのCookie識別値及び同一ユーザに属するCookie識別値に基づいて、同一ユーザのCookie識別値を含む少なくとも一つのユーザアクセスログを同一ユーザに関連付ける。
<実施例3>
本実施例は、ユーザアクセスログの関連付けシステムを提供しており、該システムは、以上に記載のユーザアクセスログの関連付け装置を含み、ユーザアクセスログを傍受するとともに、傍受したユーザアクセスログを前記取得モジュールへ提供するための流量分析装置を更に含む。
本実施例のユーザアクセスログの関連付けシステムは、コンピュータシステムによって実現可能であり、図6に示すように、ユーザアクセスログの関連付けシステムがコンピュータを利用して実現する際、ユーザアクセスログを関連付ける装置は、CPU10と、RAM11と、ROM12と、ハードディスク13とを含む。そのうち、CPU10が、少なくともユーザエージェントとCookie情報を含むユーザアクセスログを取得し、ユーザアクセスログのCookie情報中の登録ユーザの識別に用いられるCookie識別値を決定するとともに、ユーザエージェントとCookie識別値の対応関係を構築し、前記対応関係に基づいて同一ユーザに属するCookie識別値を決定し、同一ユーザに属するCookie識別値に基づいて、同一ユーザに属するユーザアクセスログを関連付ける。計算プロセスにおける中間結果は、RAM11とROM12に記録可能であり、最終的に得た関連付け結果はハードディスク13に記録可能である。本実施例のユーザアクセスログの関連付けシステムの入力は、複数のユーザアクセスログであり、出力は、各ユーザCookie識別値及び対応するユーザアクセスログである。
また、本実施例は、ユーザアクセスログの関連付けプログラム、及び該ユーザアクセスログの関連付けプログラムを記録した記録媒体を提供する。該ユーザアクセスログの関連付けプログラムは、コンピュータに、少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得するステップと、ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築するステップであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、ステップと、該対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップと、同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップと、を実行させる。
<実施例4>
図3に示すように、本発明のユーザアクセスログの関連付け方法は、具体的に以下のステップを含む。
ステップ301:ユーザアクセスログを収集する。
具体的に、サービスプロバイダで流量分析装置によりローカル(例えば北京市)のある時間(たとえば30日)内に有ったユーザアクセスログを取得可能であるとともに、取得したユーザアクセスログを保存可能であり、分析効率を高めるために、ウェブサイトに照らしてユーザアクセスログをグループ分けして保存することが可能であり、異なるウェブサイトのユーザアクセスログを保存し、ユーザアクセスログは、ADSLアカウント、IPアドレス、User Agent、Cookie情報、domain(ドメイン)、アクセス時間、URL(統一資源位置指定子)等を含むことが可能であり、ユーザが登録状態であるならば、Cookie情報中には一般的に登録ユーザを唯一識別するためのCookie IDフィールドが含まれており、User Agentは異なる設備、ブラウザ、ユーザ端末などのグループ分けに用いることが可能である。
ステップ302:複数のウェブサイトの登録ユーザを識別するためのCookie ID(識別情報)フィールドを分析する。
具体的に、複数の人気ウェブサイトのCookieを分析することが可能であり、ウェブサイトのCookie中の登録ユーザを唯一識別するためのCookie IDフィールドを取得し、表1のようなウェブサイトのCookie IDフィールド対照表を生成する。なお、表1にはウェブサイトと、ウェブサイトと対応するCookie IDフィールドが含まれる。効率を高めるために、ランキングf以前の人気ウェブサイトに対してだけ分析を行うことができる。
Figure 2018018523
ステップ303:各ウェブサイトのユーザアクセスログをグループごとに分析して、各User Agentと対応するCookie ID値を取得する。
具体的に、以下のステップs1〜s5によって各ウェブサイト下のユーザアクセスログを分析し、ステップs1〜s5を繰り返すことにより、複数のウェブサイトの分析結果を得ることができ、複数のウェブサイトの分析結果を総合して、各User Agentと対応するCookie ID値を得ることができる。
s1、まず、有効Cookie ID値を含むユーザアクセスログを選別し、選別した複数のユーザアクセスログを複数の集合に区分することが可能で、各集合中のユーザアクセスログは、同一のUser AgentとCookie識別値を含んでおり、各集合中のユーザアクセスログの全体時間スパン及びユーザアクセスログの個数を記録する。
s2、各集合中のユーザアクセスログの全体時間スパンに基づいてUser AgentとCookie ID値の関連付け関係に対して相対評価を行い、第一評価スコアS1を得る。
Figure 2018018523
ここで、Tnは第n集合中のユーザアクセスログの全体時間スパンであり、Tmaxは選別した所有ユーザアクセスログの全体時間スパンであり、評価範囲は0〜10である。
一つの具体的実施例において、複数の集合に基づいてm個のUser Agentとg個のCookie ID値の関連付け関係に対して評価をして得られる第一評価スコアの結果は表2に示す通りである。
Figure 2018018523
s3、選別した複数のユーザアクセスログの時間軸上での分布安定度に基づいて、User AgentとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアS2を得る。
同一のCookie ID値の所定の長さの時間内の連続登録をユーザの1回の登録と見なし、同一のCookie ID値の異なる時間内の登録をユーザの複数回の登録と見なし、同一User Agent下のユーザ登録の回数と選別した所有ユーザアクセスログの全体登録回数に基づいて、User AgentとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアS2を得る。
Figure 2018018523
ここで、λ1は同一User Agent下のユーザ登録の回数と選別した所有ユーザアクセスログの全体登録回数の比であり、0<λ1<1であり、λ2は同一ユーザエージェント化のユーザ登録の持続時間の平均値と選別したすべてのユーザアクセスログの全体時間スパンの比であり、0<λ2<1であり、W1は所定の第一重みであり、実際のニーズに基づいてW1の値を調整可能である。
一つの具体的実施例において、複数の集合に基づいてm個のUser Agentとg個のCookie ID値の関連付け関係に対して評価をして得られる第二評価スコアの結果は表3に示す通りである。
Figure 2018018523
s4、各集合中のユーザアクセスログの個数と選別したユーザアクセスログの総数の比に基づいて、User AgentとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアS3を得る。
Figure 2018018523
ここで、Nnは第n集合のユーザアクセスログの個数であり、kは集合の個数である。
一つの具体的実施例において、複数の集合に基づいてm個のUser Agentとg個のCookie ID値の関連付け関係に対して評価をして得られる第三評価スコアの結果は表4に示す通りである。
Figure 2018018523
s5、ステップs2、s3、s4の評価スコアに基づいて、各User Agentと異なるCookie識別値との関連に対して計算を行う。
Figure 2018018523
ここで、W2は所定の第二重みであり、実際のニーズに基づいてW2の値を調整可能である。
ステップs1〜s5を繰り返して複数のウェブサイトの分析を得た後、各User Agentと異なるCookie識別値との関連付けスコアS0を得て、User Agentとの関連付けスコアが最高のCookie識別値を該User Agentと対応するCookie識別値とすることができる。
一つの具体的実施例おいて、複数のウェブサイトのユーザアクセスログに基づいてm個のUser Agentとg個のCookie ID値との関連付けスコアに対して計算をして得られる結果は表5に示す通りである。
Figure 2018018523
表5の内容から、User AgentとCookie識別値の対応関係は、表6に示す通りであることが分かる。
Figure 2018018523
ステップ304、User AgentとCookie識別値の対応関係に基づき、同一ユーザに属するCookie識別値を決定する。
まず、各ウェブサイトの分析結果に基づいて、同一ユーザに属するUser Agentを判断し、同一ユーザに属するUser Agentリストを得る。具体的には、異なるUser Agentが同一のCookie ID値と対応するならば、前記異なるUser Agentは同一ユーザに属すると判断できる。図4に示すように、User Agent1とCookie ID値1とが対応し、User Agent2とCookie ID値1とが対応するなら、User Agent1とCookie ID値1が同一ユーザに関連付けられ、User Agent2とCookie ID値1とが同一ユーザに関連付けられると説明できるので、User Agent1とUser Agent2が同じユーザに属すると判断でき、さらに、User Agent2とCookie ID値2とが対応し、User Agent3とCookie ID値2とが対応するなら、User Agent2とCookie ID値2とが同じユーザに関連付けられ、User Agent3とCookie ID値2とが同じユーザに関連付けられると説明できるので、User Agent2とUser Agent3とが同じユーザに属すると判断できるので、User Agent1とUser Agent2とUser Agent3とは全て同じユーザに属する。
ユーザのUser Agentリストを決定した後、同一ユーザに属するUser Agentが対応するCookie識別値も同一ユーザに属すると決定でき、ユーザのCookie識別値リストを得ることができる。
一つの具体的実施例において得られる、q個のユーザのf個のウェブサイト中でのCookie識別値リストは表7に示す通りである。
Figure 2018018523
ステップ305、同一ユーザに属するCookie識別値に基づいて、収集した複数のユーザアクセスログ中の同一ユーザに属するユーザアクセスログを関連付ける。
具体的に、図5に示すように、収集した複数のユーザアクセスログ中の同一ユーザに属するユーザアクセスログを関連付けることは、以下のステップを含む。
ステップ3051、ユーザアクセスログを分析する。
ステップ3052、各ユーザアクセスログがCookie情報を含むかどうか判断し、含まない場合ステップ3053へ移り、含む場合ステップ3054へ移る。
ユーザアクセスログを関連付ける際、決して採集した各ユーザアクセスログ中の全てがCookie情報を含むことではなく、ユーザアクセスログ中にCookie情報を含まない可能性もあるので、まず、ユーザアクセスログに対して判断を実行し、ユーザアクセスログ中にCookie情報が含まれるかどうかを判断する必要がある。
ステップ3053、Cookie情報を含まないユーザアクセスログを、一つのCookie情報を含むユーザアクセスログに反映し、ステップ3055へ移る。
Cookie情報を含まないユーザアクセスログに対し、該ユーザアクセスログ中のUser AgentとURL携帯の情報に基づいてCookie情報を含むユーザアクセスログとのマッピングを行うことができ、Cookie情報を含まないユーザアクセスログとCookie情報を含むユーザアクセスログとのマッピングが成功した場合、この二つのユーザアクセスログが同一ユーザに属するユーザアクセスログであると説明でき、Cookie情報を含むユーザアクセスログのCookie ID値を、このCookie情報を含まないユーザアクセスログに関連付けることができ、マッピングしたユーザアクセスログ中のCookie ID値を、該Cookie情報を含まないユーザアクセスログのCookie ID値とすることができる。なお、マッピングの方法は従来技術に属し、ここでは贅言しない。
ステップ3054、Cookie情報が有効かどうか判断し、有効であればステップ3055へ移り、無効であれば終了する。
Cookie情報を含むユーザアクセスログに対して、まず、それが含むCookie情報が有効かどうかを判断して、唯一のユーザを識別するためのCookie ID値が解析可能かどうかを判断する。解析できればCookie情報は有効であり、その後、該Cookie情報中のCookie ID値に基づいてユーザアクセスログに対して関連付けを行うことが可能である。Cookie情報から唯一のユーザを識別するためのCookie ID値を解析できない場合、Cookie情報は無効である。
ステップ3055、ユーザアクセスログのCookie ID値及び同一ユーザに属するCookie ID値に基づいて、同一ユーザのCookie ID値を含む少なくとも一つのユーザアクセスログを同一ユーザに関連づける。
複数の異なるユーザアクセスログが同じCookie ID値を含む場合、該複数のユーザアクセスログを同一ユーザに関連付けることができる。或いは、複数の異なるユーザアクセスログが異なるCookie ID値を含むが、これらの異なるCookie ID値が全て同一ユーザに属する場合、該複数のユーザアクセスログを同一ユーザに関連付けることができる。
ユーザの複数の異なるウェブサイトでのユーザアクセスログを関連付けた後、関連付け結果に基づいてユーザの行動を分析し、ユーザの興味を予測可能であり、それによってユーザがウェブサイトを閲覧する際に、ユーザの好みに合った内容を推薦することができ、推薦内容の成功率を高めることができる。
この明細書で記載した沢山の機能部材は全てモジュールと称したが、これは特に、それが実現する方式の独立性をさらに強調するためのである。
本発明の実施例において、モジュールはソフトウェアで実現し、各種類型の処理器に実行させることができる。例を挙げると、標記する実行可能コードモジュールは、コンピュータ指令の一つあるいは複数の物理的、あるいはロジック的集積を含むことができ、例を挙げると、それは対象、プロセス、或いは関数に構築することができる。それでも、モジュールを標記する実行可能コードは、物理的に同じ場所に位置する必要はなく、様々な場所に保存した様々な指令を含み、これらの指令がロジック的に同じ場所に結合した時に、それはモジュールを構成し、また、当該モジュールの規定目的を実現することができる。
実際、実行可能コードモジュールは単数指令でも複数指令でもよく、ひいては複数の異なるコード段上に分布しても、異なるプログラムに分布しても、複数の記憶装置を跨いで分布しても良い。同様に、操作データはモジュール内で識別されたことができ、且つ何らかの適切な形式で実現可能で且つ何らかの適切な種類のデータ構造内で組成されることが可能である。前記操作データは単一のデータ集合として収集可能であるし、あるいは異なる位置に分布する(異なる記憶装置に分布することを含む)、且つ、少なくとも一部は電子信号としてシステム又はネットワークに存在するだけでも良い。
モジュールがソフトウェアを利用して実現できる時は、現有のハードウェア技術水準を考慮すると、ソフトウェアで実現するモジュールでよく、コストを考慮しない場合、当業者は皆、対応するハードウェア電気回路を構築して対応する機能を実現することができ、前記ハードウェア電気回路には、慣例的超大規模集積回路(VLSI)あるいはゲートアレイ、ならびに例えばロジックチップ、トランジスターの類の現有半導体、あるいはその他の分立したエレメントを含む。モジュールは、プログラミング可能ハードウェア設備を用いて、例えば現場プログラミング可能ゲートアレイ、プログラミング可能アレイロジック、プログラミング可能ロジックデバイス等を実現することもできる。
本発明の各方法の実施例において、前記各ステップの順番は各ステップの前後順序を限定するものではなく、当業者が創造的な作業をしない前提で、各ステップの前後を変えることも、本発明の保護範囲内である。
上記は、本発明の好ましい実施方式であり、なお、当業者にとって、本発明に記載の原理を逸脱しない前提下で、若干の改良や変形を行うことも可能であり、このような改良や変形も本発明の保護範囲であると見なさなければならない、ということである。

Claims (12)

  1. 少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得するステップと、
    ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築するステップであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、ステップと、
    前記対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップと、
    同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップと、を含むことを特徴とするユーザアクセスログの関連付け方法。
  2. 前記ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定するステップは、
    複数のウェブサイトの登録ユーザを識別するために用いられるCookie識別フィールドを決定することと、
    決定されたCookie識別フィールドに基づいてユーザアクセスログのCookie情報を検索し、Cookie情報中にCookie識別フィールドが存在するか否かを判断し、存在する場合、Cookie情報中のCookie識別フィールドの値を、登録ユーザを識別するCookie識別値として記録することと、を含むことを特徴とする請求項1に記載のユーザアクセスログの関連付け方法。
  3. 前記ユーザアクセスログはアクセス時間をさらに含み、
    前記ユーザエージェントとCookie識別値の対応関係を構築するステップは、
    有効なCookie識別値を含む複数のユーザアクセスログを選別し、選別された複数のユーザアクセスログを複数の集合に区分し、各集合のユーザアクセスログは、同じユーザエージェントとCookie識別値を含むことと、
    各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第一評価スコアを得ることと、
    選別された複数のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得ることと、
    各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別されたユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得ることと、
    前記第一評価スコア、前記第二評価スコア及び前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連付けスコアに対して計算を行い、一つのユーザエージェントとの関連付けスコアが最高のCookie識別値を前記ユーザエージェントと対応するCookie識別値とすることと、を含むことを特徴とする請求項1に記載のユーザアクセスログの関連付け方法。
  4. 前記対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップは、
    前記対応関係に基づいて同一のユーザに属する少なくとも一つのユーザエージェントを判断して、同一のユーザに属する少なくとも一つのユーザエージェントが対応するCookie識別値が同一のユーザに属すると決定すること、を含むことを特徴とする請求項1に記載のユーザアクセスログの関連付け方法。
  5. 前記対応関係に基づいて同一のユーザに属する少なくとも一つのユーザエージェントを判断することは、
    第一ユーザエージェントと第一Cookie識別値が対応し、第二ユーザエージェントと第一Cookie識別値が対応する場合、第一ユーザエージェントと第二ユーザエージェントが同一のユーザのユーザエージェントに属すると判断することと、
    第二ユーザエージェントと第二Cookie識別値が対応し、第三ユーザエージェントと第二Cookie識別値が対応する場合、第一ユーザエージェントと第二ユーザエージェントと第三ユーザエージェントが同一のユーザのユーザエージェントに属すると判断することと、を含むことを特徴とする請求項4に記載のユーザアクセスログの関連付け方法。
  6. 前記同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップは、
    ステップa:各ユーザアクセスログがCookie情報を含むか否か判断し、含まない場合にステップbへ移り、含む場合にステップcへ移ることと、
    ステップb:前記Cookie情報を含まないユーザアクセスログを、前記複数のユーザアクセスログ中の一つのCookie情報を含むユーザアクセスログにマッピングし、ステップdへ移ることと、
    ステップc:Cookie情報が有効であるか否か判断し、有効である場合にステップdへ移り、無効である場合に終了することと、
    ステップd:ユーザアクセスログのCookie識別値及び同一のユーザに属するCookie識別値に基づいて、同一のユーザのCookie識別値を含む少なくとも一つのユーザアクセスログを同一のユーザに関連づけることと、を含むことを特徴とする請求項1に記載のユーザアクセスログの関連付け方法。
  7. 少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得する取得モジュールと、
    ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築する第一処理モジュールであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、第一処理モジュールと、
    前記対応関係に基づいて同一のユーザに属するCookie識別値を決定する第二処理モジュールと、
    同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるための関連付けモジュールと、を含むことを特徴とするユーザアクセスログの関連付け装置。
  8. 前記第一処理モジュールは、
    複数のウェブサイトの登録ユーザを識別するために用いられるCookie識別フィールドを決定する分析ユニットと、
    決定されたCookie識別フィールドに基づいてユーザアクセスログのCookie情報を検索し、Cookie情報中にCookie識別フィールドが存在するか否かを判断し、存在する場合、Cookie情報中のCookie識別フィールドの値を、登録ユーザを識別するCookie識別値として記録するCookie識別値決定ユニットと、を含むことを特徴とする請求項7に記載のユーザアクセスログの関連付け装置。
  9. 前記ユーザアクセスログはアクセス時間をさらに含み、
    前記第一処理モジュールは、
    有効なCookie識別値を含む複数のユーザアクセスログを選別し、選別された複数のユーザアクセスログを複数の集合に区分し、各集合のユーザアクセスログは、同じユーザエージェントとCookie識別値を含む、選別ユニットと、
    各集合中のユーザアクセスログの全体時間スパンを決定し、各集合中のユーザアクセスログの全体時間スパンに基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第一評価スコアを得る第一評価ユニットと、
    各集合中のユーザアクセスログの時間軸上での分布安定度に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第二評価スコアを得る第二評価ユニットと、
    各集合中のユーザアクセスログの個数を決定し、各集合中のユーザアクセスログの個数と選別されたユーザアクセスログの総数の比に基づいて、ユーザエージェントとCookie識別値の関連付け関係に対して評価を行い、第三評価スコアを得る第三評価ユニットと、
    前記第一評価スコア、前記第二評価スコア及び前記第三評価スコアに基づいて、各ユーザエージェントと異なるCookie識別値との関連付けスコアに対して計算を行い、一つのユーザエージェントとの関連付けスコアが最高のCookie識別値を前記ユーザエージェントと対応するCookie識別値とする関連付けスコア計算ユニットと、を含むことを特徴とする請求項7に記載のユーザアクセスログの関連付け装置。
  10. 請求項7乃至9のいずれか一項に記載のユーザアクセスログの関連付け装置を含み、
    ユーザアクセスログを傍受し、傍受されたユーザアクセスログを前記取得モジュールへ提供する流量分析装置をさらに含むことを特徴とするユーザアクセスログの関連付けシステム。
  11. 少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得するステップと、
    ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築するステップであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、ステップと、
    前記対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップと、
    同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップと、をコンピュータに実行させるためのユーザアクセスログの関連付けプログラム。
  12. 少なくともユーザエージェントとCookie情報を含む複数のユーザアクセスログを取得するステップと、
    ユーザアクセスログのCookie情報中の登録ユーザを識別するために用いられるCookie識別値を決定し、ユーザエージェントとCookie識別値の対応関係を構築するステップであって、ユーザエージェントと対応するCookie識別値とは同一のユーザに属する、ステップと、
    前記対応関係に基づいて同一のユーザに属するCookie識別値を決定するステップと、
    同一のユーザに属するCookie識別値に基づいて、同一のユーザに属するユーザアクセスログを関連付けるステップと、をコンピュータに実行させるためのユーザアクセスログの関連付けプログラムを記録した記録媒体。
JP2017141441A 2016-07-26 2017-07-21 ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体 Active JP6481721B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610599678.5 2016-07-26
CN201610599678.5A CN107659602B (zh) 2016-07-26 2016-07-26 关联用户访问记录的方法、装置及系统

Publications (2)

Publication Number Publication Date
JP2018018523A true JP2018018523A (ja) 2018-02-01
JP6481721B2 JP6481721B2 (ja) 2019-03-13

Family

ID=61076329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017141441A Active JP6481721B2 (ja) 2016-07-26 2017-07-21 ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP6481721B2 (ja)
CN (1) CN107659602B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019017474A1 (ja) 2017-07-20 2019-01-24 旭化成株式会社 印刷版用感光性樹脂構成体、及びその製造方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109361574B (zh) * 2018-12-17 2021-02-26 广州天懋信息系统股份有限公司 基于JavaScript脚本的NAT检测方法、系统、介质和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012073878A (ja) * 2010-09-29 2012-04-12 Mitsubishi Space Software Kk アクセス解析装置及びアクセス解析方法及びアクセス解析プログラム
CN103237094A (zh) * 2013-04-17 2013-08-07 北京亿赞普网络技术有限公司 一种识别用户的方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
CN102333092B (zh) * 2011-09-30 2014-05-28 北京亿赞普网络技术有限公司 一种网络用户识别的方法及其应用服务器
CN103970843B (zh) * 2014-04-28 2017-09-19 东华大学 一种Web日志预处理中基于UUID的会话合并方法
CN105025115B (zh) * 2014-04-29 2018-06-15 北京秒针信息咨询有限公司 一种生成集体宿舍ip库的方法和装置
CN103995907B (zh) * 2014-06-13 2017-04-12 北京奇艺世纪科技有限公司 一种访问用户的确定方法
CN104951499B (zh) * 2015-04-23 2018-03-02 中国科学院信息工程研究所 一种跨域用户关联方法及信息推送方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012073878A (ja) * 2010-09-29 2012-04-12 Mitsubishi Space Software Kk アクセス解析装置及びアクセス解析方法及びアクセス解析プログラム
CN103237094A (zh) * 2013-04-17 2013-08-07 北京亿赞普网络技术有限公司 一种识别用户的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019017474A1 (ja) 2017-07-20 2019-01-24 旭化成株式会社 印刷版用感光性樹脂構成体、及びその製造方法

Also Published As

Publication number Publication date
CN107659602B (zh) 2020-12-29
CN107659602A (zh) 2018-02-02
JP6481721B2 (ja) 2019-03-13

Similar Documents

Publication Publication Date Title
CN106934627B (zh) 一种电商行业作弊行为的检测方法及装置
CN108304410A (zh) 一种异常访问页面的检测方法、装置及数据分析方法
WO2016107523A1 (zh) 网站的访问路径的分析方法和装置
CN103218431B (zh) 一种能识别网页信息自动采集的系统
CN107342913B (zh) 一种cdn节点的探测方法和装置
CN110830445B (zh) 一种异常访问对象的识别方法及设备
CN104486461A (zh) 域名分类方法和装置、域名识别方法和系统
US9864855B2 (en) Verification data processing method and device and storage medium
CN109309596B (zh) 一种压力测试方法、装置及服务器
CN107861981A (zh) 一种数据处理方法及装置
CN108366012B (zh) 一种社交关系建立方法、装置及电子设备
WO2017080454A1 (zh) 网站访问路径的聚合方法和装置
CN112954089B (zh) 一种解析数据的方法、装置、设备以及存储介质
CN107766234A (zh) 一种基于移动设备的网页健康度的测评方法、装置及系统
CN104933069A (zh) 一种桌面终端上网浏览统计的分析方法和系统
CN104219230A (zh) 识别恶意网站的方法及装置
CN104951499A (zh) 一种跨域用户关联方法及信息推送方法
JP6481721B2 (ja) ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体
Sujatha Improved user navigation pattern prediction technique from web log data
CN114448849B (zh) 网站IPv6网络支持模式检测方法及电子设备
CN108121741B (zh) 网站质量评估方法及装置
CN102841922B (zh) 数据采集方法及装置
CN111209325A (zh) 业务系统接口识别方法、装置及存储介质
CN107092650B (zh) 一种网络日志分析方法及装置
CN103399968A (zh) 一种微博信息采集方法及系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190128

R151 Written notification of patent or utility model registration

Ref document number: 6481721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151