CN103067198A - 一种关联用户CookieID的方法及系统 - Google Patents

一种关联用户CookieID的方法及系统 Download PDF

Info

Publication number
CN103067198A
CN103067198A CN2012105442945A CN201210544294A CN103067198A CN 103067198 A CN103067198 A CN 103067198A CN 2012105442945 A CN2012105442945 A CN 2012105442945A CN 201210544294 A CN201210544294 A CN 201210544294A CN 103067198 A CN103067198 A CN 103067198A
Authority
CN
China
Prior art keywords
cookie
user
access logs
described flow
user access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105442945A
Other languages
English (en)
Inventor
刘国清
李春华
赵杰
郑重
于锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd filed Critical BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Priority to CN2012105442945A priority Critical patent/CN103067198A/zh
Publication of CN103067198A publication Critical patent/CN103067198A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种关联用户Cookie ID的方法,包括以下步骤:S1,流量识别设备采集用户访问日志并将所述用户访问日志发送到流量分析设备;S2,所述流量分析设备对所述用户访问日志进行分析并将分析后的所述用户访问日志存储在所述存储模块;本发明还提供了一种关联用户Cookie ID的系统,包括用于获取用户访问日志的流量识别设备;用于解析所述用户访问日志的流量分析设备;所述流量识别设备和流量分析设备通信连接。本发明通过在电信机房部署专门的流量识别设备和流量分析设备,解决了不同网站的访问日志无法关联出一个用户完整访问路径的问题,能够为用户行为分析、网站优化提供依据,为网站跟踪用户访问记录提供方便。

Description

一种关联用户CookieID的方法及系统
技术领域
本发明涉及互联网技术领域,尤其涉及一种关联用户Cookie ID的方法及系统。 
背景技术
网站为了跟踪用户,会在用户访问网站时在用户浏览器的Cookie中保存用户访问网站的编号(Cookie ID),当用户下一次访问该网站时,浏览器会把该Cookie ID上传给网站,这样网站就可以识别该用户在这个网站的访问轨迹。 
为了满足分析需求,很多网站会把用户的访问记录保存为标准的用户访问日志,日志包含访问的IP、URL、时间、Cookie等信息。专业分析系统根据用户访问日志进行计算,分析用户访问的规律。 
但现有技术中的分析系统只能分析一个网站的数据,而无法同时分析多个网站的日志,原因是采用Cookie标识用户身份时,不同的网站有不同的Cookie ID,但一个用户在不同网站的Cookie编号无法关联起来,这样就无法形成一个用户在不同网站的完整的访问记录。 
发明内容
本发明的目的在于设计一种新型的关联用户Cookie ID的方法及系统,将同一用户访问不同网站的Cookie ID进行关联,解决网站不能同时分析同一用户访问多个网站日志的问题。 
为了实现上述目的,本发明采用的技术方案如下: 
一种关联用户Cookie ID的系统,包括: 
用于获取用户访问日志的流量识别设备; 
用于解析所述用户访问日志的流量分析设备; 
所述流量识别设备和流量分析设备通信连接。 
优选的,所述流量识别设备还包括: 
数据采集模块,用于采集所述用户访问日志; 
数据发送模块,用于将所述用户访问日志发送到所述流量分析设备。 
优选的,所述流量识别设备还包括:安全模块,用于对用户帐号进行加密。 
优选的,所述流量分析设备还包括: 
数据接收模块,用于接收所述用户访问日志; 
数据分析模块,用于分析所述用户访问日志; 
存储模块,用于存储分析后的所述用户访问日志。 
本发明还提供了一种关联用户Cookie ID的方法的技术方案,包括以下步骤: 
S1,所述流量识别设备采集用户访问日志并将所述用户访问日志发送到所述流量分析设备; 
S2,所述流量分析设备对所述用户访问日志进行分析; 
S3,将分析后的所述用户访问日志中的Cookie ID和用户帐号进行关联并将关联信息存储在所述存储模块。 
优选的,步骤S1之前还包括客户端向所述流量识别设备发送认证信息。 
优选的,步骤S1还包括为用户帐号加密。 
优选的,步骤S2所述流量分析设备对所述用户访问日志进行分析,具体为: 
S21,所述流量分析设备设置每个网站Cookie ID的提取规则并保存在配置文件; 
S22,所述流量分析设备分析用户帐号对应的Cookie ID列表。 
优选的,步骤S3将分析后的所述用户访问日志中的Cookie ID和用户帐号进行关联,具体为: 
S31,所述流量分析设备根据HOST字段确定解析Cookie ID的规则; 
S32,根据解析Cookie ID的规则从Cookie中解析出Cookie ID; 
S33,获取同一用户帐号下所有的Cookie ID。 
从以上技术方案可以看出,本发明的有益效果可以总结如下: 
本发明通过在电信机房部署专门的流量识别设备和流量分析设备,解决了不同网站的访问日志无法关联出一个用户完整访问路径的问题,能够为用户行为分析、网站优化提供依据,为网站跟踪用户访问记录提供方便。 
附图说明
图1是本发明的方法流程结构示意图。 
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。 
本发明提供了一种关联用户Cookie ID的系统,用于将同一用户访问不同网站的Cookie ID进行关联,解决网站不能同时分析同一用户访问多个网站日志的问题。 
请参阅图1,本发明实施例中的关联用户Cookie ID的系统,包括:用于获取用户访问日志的流量识别设备;用于解析所述用户访问日志的流量分析设备;所述流量识别设备和流量分析设备通信连接。 
本系统中,所述流量识别设备设置在电信机房,所述流量识别设备能够解析HTTP协议、Radius协议和GTP-C协议,通过解析HTTP协议能够获取网站IP、HOST和Cookie,通过解析Radius协议和GTP-C协议能够获取网站IP和用户账号的对应关系。 
其中,所述流量识别设备还包括: 
数据采集模块,用于采集所述用户访问日志; 
数据发送模块,用于将所述用户访问日志发送到所述流量分析设备。 
其中,所述流量识别设备还包括安全模块,用于所述流量识别设备通过解析Radius协议和GTP-C协议能够获取用户账号之后为用户账号进行MD5加密,加密后的结果作为该用户的唯一标识。 
所述流量识别设备把解析后的HTTP获取的信息和用户账号按网站IP进行关联,并把数据保存在存储设备中,数据中的每条记录都至少包含加密后的用户账号、HOST和Cookie。 
本系统中,所述流量分析设备也设置在电信机房内,所述流量分析设备能够根据所述流量识别设备上报的用户访问日志,分析每个用户账号对应的Cookie ID列表。不同的网站保存用户Cookie ID的格式各不相同,所述流量分析设备按照用户Cookie ID的格式提前配置好每个网站Cookie ID的提取规则,并保存在配置文件中。进行用户访问日志处理时,每次读取一条访问日志,所述流量分析设备根据HOST字段来确定解析Cookie ID的规则,并根据该规则从Cookie中解析出Cookie ID,从而得到用户账号和每条Cookie ID的对应关系,最后经过去重操作得到同一个用户账号下所有的Cookie ID,并保存到数据库中。 
其中,所述流量分析设备还包括: 
数据接收模块,用于接收用户访问日志; 
数据分析模块,用于分析所述用户访问日志; 
存储模块,用于存储分析后的用户访问日志。 
本发明通过在电信机房部署专门的流量识别设备和流量分析设备,解决了不同网站的访问日志无法关联出一个用户完整访问路径的问题,能够为用户行为分析、网站优化提供依据,为网站跟踪用户访问记录提供方便。 
本发明还提供了一种关联用户Cookie ID的方法,用于将同一用户访问不同网站的Cookie ID进行关联,解决网站不能同时分析同一用户访问多个网站日志的问题。 
请参阅图1,本发明实施例中的关联用户Cookie ID的方法,包括以下步骤: 
S1,所述流量识别设备采集用户访问日志并将所述用户访问日志发送到所述流量分析设备; 
本步骤中,所述流量识别设备设置在电信机房,所述流量识别设备能够解析HTTP协议、Radius协议和GTP-C协议,通过解析HTTP协议能够获取网站IP、HOST和Cookie,通过解析Radius协议和GTP-C协议能够获取网站IP和用户账号的对应关系。 
所述流量识别设备还需要用户帐号加密。 
步骤S1之前还包括客户端向所述流量识别设备发送认证信息。 
S2,所述流量分析设备对所述用户访问日志进行分析。 
本步骤具体还包括以下步骤: 
S21,所述流量分析设备设置每个网站Cookie ID的提取规则并保存在配置文件; 
S22,所述流量分析设备分析用户帐号对应的Cookie ID列表。 
S3,将分析后的所述用户访问日志中的Cookie ID和用户帐号进行关联并将关联信息存储在所述存储模块。 
本步骤具体还包括以下步骤: 
S31,所述流量分析设备根据HOST字段确定解析Cookie ID的规则; 
S32,根据解析Cookie ID的规则从Cookie中解析出Cookie ID; 
S33,获取同一用户帐号下所有的Cookie ID。 
本发明通过在电信机房部署专门的流量识别设备和流量分析设备,解决了不同网站的访问日志无法关联出一个用户完整访问路径的问题,能够为用户行为分析、网站优化提供依据,为网站跟踪用户访问记录提供方便。 
以上通过具体的和优选的实施例详细的描述了本发明,但本领域技术人员应该明白,本发明并不局限于以上所述实施例,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。 

Claims (9)

1.一种关联用户Cookie ID的系统,其特征在于,包括:
用于获取用户访问日志的流量识别设备;
用于解析所述用户访问日志的流量分析设备;
所述流量识别设备和流量分析设备通信连接。
2.根据权利要求1所述的关联用户Cookie ID的系统,其特征在于,所述流量识别设备还包括:
数据采集模块,用于采集所述用户访问日志;
数据发送模块,用于将所述用户访问日志发送到所述流量分析设备。
3.根据权利要求1或2所述的关联用户Cookie ID的系统,其特征在于,所述流量识别设备还包括:
安全模块,用于对用户帐号进行加密。
4.根据权利要求1所述的关联用户Cookie ID的系统,其特征在于,所述流量分析设备还包括:
数据接收模块,用于接收所述用户访问日志;
数据分析模块,用于分析所述用户访问日志;
存储模块,用于存储分析后的所述用户访问日志。
5.一种关联用户Cookie ID的方法,其特征在于,包括以下步骤:
S1,所述流量识别设备采集用户访问日志并将所述用户访问日志发送到所述流量分析设备;
S2,所述流量分析设备对所述用户访问日志进行分析;
S3,所述流量分析设备将分析后的所述用户访问日志中的Cookie ID和用户帐号进行关联并将关联信息存储在所述存储模块。
6.根据权利要求5所述的关联用户Cookie ID的方法,其特征在于,步骤S1之前还包括客户端向所述流量识别设备发送认证信息。
7.根据权利要求5所述的关联用户Cookie ID的方法,其特征在于,步骤S1还包括为用户帐号加密。
8.根据权利要求5所述的关联用户Cookie ID的方法,其特征在于,步骤S2所述流量分析设备对所述用户访问日志进行分析,具体为:
S21,所述流量分析设备设置每个网站Cookie ID的提取规则并保存在配置文件;
S22,所述流量分析设备分析用户帐号对应的Cookie ID列表。
9.根据权利要求8所述的关联用户Cookie ID的方法,其特征在于,步骤S3将分析后的所述用户访问日志中的Cookie ID和用户帐号进行关联,具体为:
S31,所述流量分析设备根据HOST字段确定解析Cookie ID的规则;
S32,根据解析Cookie ID的规则从Cookie中解析出Cookie ID;
S33,获取同一用户帐号下所有的Cookie ID。
CN2012105442945A 2012-12-14 2012-12-14 一种关联用户CookieID的方法及系统 Pending CN103067198A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012105442945A CN103067198A (zh) 2012-12-14 2012-12-14 一种关联用户CookieID的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012105442945A CN103067198A (zh) 2012-12-14 2012-12-14 一种关联用户CookieID的方法及系统

Publications (1)

Publication Number Publication Date
CN103067198A true CN103067198A (zh) 2013-04-24

Family

ID=48109668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105442945A Pending CN103067198A (zh) 2012-12-14 2012-12-14 一种关联用户CookieID的方法及系统

Country Status (1)

Country Link
CN (1) CN103067198A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533530A (zh) * 2013-09-26 2014-01-22 林毅 一种跨设备的用户对应及用户追踪方法、系统
CN104639387A (zh) * 2014-12-09 2015-05-20 北京京东尚科信息技术有限公司 一种用户网络行为跟踪方法及设备
CN104717079A (zh) * 2013-12-12 2015-06-17 华为技术有限公司 网络流量的数据处理方法及装置
CN105447148A (zh) * 2015-11-26 2016-03-30 上海晶赞科技发展有限公司 一种Cookie标识关联方法及装置
WO2017032244A1 (zh) * 2015-08-27 2017-03-02 阿里巴巴集团控股有限公司 一种行为记录的存储方法和设备
CN106657184A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 日志信息的解析方法及装置
WO2017117912A1 (zh) * 2016-01-04 2017-07-13 百度在线网络技术(北京)有限公司 一种数据获取方法、装置、设备及计算机存储介质
CN107547310A (zh) * 2017-08-24 2018-01-05 杭州安恒信息技术有限公司 一种基于旁路审计设备的用户行为关联分析方法及系统
CN108108495A (zh) * 2018-01-19 2018-06-01 厦门欣旅通科技有限公司 一种识别用户访问轨迹的方法及装置
CN109657431A (zh) * 2018-12-07 2019-04-19 杭州启博科技有限公司 用于识别用户身份的方法
CN113542239A (zh) * 2021-06-29 2021-10-22 武汉思普崚技术有限公司 一种基于Web监听的认证方法、系统、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN102289447A (zh) * 2011-06-16 2011-12-21 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价系统
CN102349088A (zh) * 2009-03-12 2012-02-08 株式会社Log 整合多个访问统计服务器运营的系统及其方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN102349088A (zh) * 2009-03-12 2012-02-08 株式会社Log 整合多个访问统计服务器运营的系统及其方法
CN102289447A (zh) * 2011-06-16 2011-12-21 北京亿赞普网络技术有限公司 一种基于通讯网络报文的网站网页评价系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533530A (zh) * 2013-09-26 2014-01-22 林毅 一种跨设备的用户对应及用户追踪方法、系统
CN104717079A (zh) * 2013-12-12 2015-06-17 华为技术有限公司 网络流量的数据处理方法及装置
CN104639387A (zh) * 2014-12-09 2015-05-20 北京京东尚科信息技术有限公司 一种用户网络行为跟踪方法及设备
WO2017032244A1 (zh) * 2015-08-27 2017-03-02 阿里巴巴集团控股有限公司 一种行为记录的存储方法和设备
CN106657184B (zh) * 2015-10-30 2019-09-24 北京国双科技有限公司 日志信息的解析方法及装置
CN106657184A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 日志信息的解析方法及装置
CN105447148B (zh) * 2015-11-26 2018-12-21 上海晶赞科技发展有限公司 一种Cookie标识关联方法及装置
CN105447148A (zh) * 2015-11-26 2016-03-30 上海晶赞科技发展有限公司 一种Cookie标识关联方法及装置
WO2017117912A1 (zh) * 2016-01-04 2017-07-13 百度在线网络技术(北京)有限公司 一种数据获取方法、装置、设备及计算机存储介质
CN107547310A (zh) * 2017-08-24 2018-01-05 杭州安恒信息技术有限公司 一种基于旁路审计设备的用户行为关联分析方法及系统
CN107547310B (zh) * 2017-08-24 2020-04-10 杭州安恒信息技术股份有限公司 一种基于旁路审计设备的用户行为关联分析方法及系统
CN108108495A (zh) * 2018-01-19 2018-06-01 厦门欣旅通科技有限公司 一种识别用户访问轨迹的方法及装置
CN109657431A (zh) * 2018-12-07 2019-04-19 杭州启博科技有限公司 用于识别用户身份的方法
CN113542239A (zh) * 2021-06-29 2021-10-22 武汉思普崚技术有限公司 一种基于Web监听的认证方法、系统、装置及存储介质
CN113542239B (zh) * 2021-06-29 2022-11-01 武汉思普崚技术有限公司 一种基于Web监听的认证方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
CN103067198A (zh) 一种关联用户CookieID的方法及系统
CN101605074B (zh) 基于网络通讯行为特征监测木马的方法与系统
CN102761573B (zh) 一种媒体信息的用户浏览行为数据的监测方法
US8955143B1 (en) Use of decoy data in a data store
CN101582887A (zh) 安全防护方法、网关设备及安全防护系统
CN102984161B (zh) 一种可信网站的识别方法和装置
CN102752288A (zh) 网络访问行为识别方法和装置
CN103346972A (zh) 基于用户终端的流量控制装置和方法
CN102664935A (zh) 一种web类用户行为和用户信息的关联输出方法及系统
CN102065147A (zh) 一种基于企业应用系统获取用户登录信息的方法及装置
CN106817353A (zh) 用于mac采集和网络安全审计的无线ap和方法
CN103297469A (zh) 一种网站数据的采集方法及装置
CN106446113A (zh) 移动大数据解析方法及装置
CN104468790A (zh) cookie数据的处理方法与客户端
CN105989149A (zh) 一种用户设备指纹的提取和识别方法及系统
CN104639387B (zh) 一种用户网络行为跟踪方法及设备
CN102868909A (zh) Mp4在线视频缓存方法及装置
CN103984719A (zh) 一种爬虫模拟登陆采集的方法
CN105530137A (zh) 流量数据分析方法及流量数据分析系统
CN102984162A (zh) 可信网站的识别方法和收集系统
CN105429865A (zh) 一种基于浏览器的微信公众号数据采集方法及装置
CN102724068A (zh) 一种在IPv6混合网络中进行审计日志资产识别的方法
CN102918527B (zh) Web应用托管的调查方法和系统
CN104486157A (zh) 一种基于深度包解析的信息系统性能检测方法
CN103218422B (zh) 一种用于半封闭数据环境下的数据搜索的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130424