CN108306818A - 网络用户追踪方法及系统 - Google Patents

网络用户追踪方法及系统 Download PDF

Info

Publication number
CN108306818A
CN108306818A CN201810085961.5A CN201810085961A CN108306818A CN 108306818 A CN108306818 A CN 108306818A CN 201810085961 A CN201810085961 A CN 201810085961A CN 108306818 A CN108306818 A CN 108306818A
Authority
CN
China
Prior art keywords
information
visitor
identity
mail
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810085961.5A
Other languages
English (en)
Inventor
江磊
郭亮
胡强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Star Valley Mdt Infotech Ltd
Original Assignee
Shanghai Star Valley Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Star Valley Mdt Infotech Ltd filed Critical Shanghai Star Valley Mdt Infotech Ltd
Priority to CN201810085961.5A priority Critical patent/CN108306818A/zh
Publication of CN108306818A publication Critical patent/CN108306818A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/42Mailbox-related aspects, e.g. synchronisation of mailboxes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Abstract

本发明提供了一种网络用户追踪方法及系统,包括:采集模块:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;特征库模块:根据采集到的信息对每一访客进行身份信息建档,每一访客具有唯一的身份标识;分析处理模块:根据采集到的信息与所述特征库模块内的身份信息进行对比;更新模块:当对比的结果为新访客时,在所述特征库模块生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。本发明解决了传统ip,cookies跟踪用户方法的局限性;解决了用户不同设备,不同浏览器中间的用户识别问题;解决了用户本地网络环境产生变化后的再识别问题。

Description

网络用户追踪方法及系统
技术领域
本发明涉及互联网技术领域,具体地,涉及网络用户追踪方法及系统。
背景技术
网页用户识别和追踪是一种使用特殊标识识别网页浏览用的身份的追踪方法,是当下互联网数据采集层面非常重要的基础技术手段之一。随着互联网大数据应用和方法的越来越普及和深入,特别是这几年互联网大数据应用的爆发,越来越多的企业开始关注用户识别的精确性和完整性。
目前,大部分的网页应用平台在识别客户和追踪客户的时候采用的方式是IP数据和cookies数据,由于网络用户的数据和cookies数据并非固定不变的,一般网络终端使用的IP采用动态获取,同时cookies的数据也可以随时被清除,这个给后端标识用户的准确度和完整性产生了巨大的困扰。
此外由于越来越多的浏览器支付对于cookies的自动清理和浏览器加速技术的使用,会对网页用户识别准确度产生巨大的影响。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种网络用户追踪方法及系统。
根据本发明提供的一种网络用户追踪系统,包括:
采集模块:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;
特征库模块:根据采集到的信息对每一访客进行身份信息建档,每一访客具有唯一的身份标识;
分析处理模块:根据采集到的信息与所述特征库模块内的身份信息进行对比;
更新模块:当对比的结果为新访客时,在所述特征库模块生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。
较佳的,所述采集模块包括:
网络环境信息采集子模块:采集访客的ip和cookie信息;
硬件信息采集子模块:采集访客的计算机设置的信息,包括时区、屏幕大小、插件以及屏幕分辨率;
数据整合子模块:将采集到的计算机的设置信息生成唯一的id;
邮件内信息采集子模块:发送邮件给对应的访客,获取访客的ip和cookie信息;
位置接口子模块,采集访客的地理位置信息。
较佳的,所述分析处理模块包括:
数据筛选子模块:过滤重复或者是无代表特征的信息;
身份验证子模块:将访客携带的私有信息进行验证,若没有私有信息,则验证cookie和ip信息来确定访客的身份;
邮件内身份验证子模块:将访客的硬件信息,ip及cookie信息记录追加到已经用邮件验证过的访客身份上。
较佳的,所述特征库模块包括数据查询接口:提供二次访问查询调用或数据分析的接口。
根据本发明提供的一种网络用户追踪方法,包括:
采集步骤:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;
特征库建立步骤:根据采集到的信息对每一访客进行身份信息建档形成特征库,每一访客具有唯一的身份标识;
分析处理步骤:根据采集到的信息与所述特征库内的身份信息进行对比;
更新步骤:当对比的结果为新访客时,在所述特征库生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。
较佳的,所述采集步骤包括:
网络环境信息采集子步骤:采集访客的ip和cookie信息;
硬件信息采集子步骤:采集访客的计算机设置的信息,包括时区、屏幕大小、插件以及屏幕分辨率;
数据整合子步骤:将采集到的计算机的设置信息生成唯一的id;
邮件内信息采集子步骤:发送邮件给对应的访客,获取访客的ip和cookie信息;
位置接口子步骤,采集访客的地理位置信息。
较佳的,所述分析处理步骤包括:
数据筛选子步骤:过滤重复或者是无代表特征的信息;
身份验证子步骤:将访客携带的私有信息进行验证,若没有私有信息,则验证cookie和ip信息来确定访客的身份;
邮件内身份验证子步骤:将访客的硬件信息,ip及cookie信息记录追加到已经用邮件验证过的访客身份上。
较佳的,所述特征库包括数据查询接口:提供二次访问查询调用或数据分析的接口。
与现有技术相比,本发明具有如下的有益效果:
增加唯一标志的维度不限于ip和cookies,且同时解决了以下三个问题:
1)解决了传统ip,cookies跟踪用户方法的局限性;
2)解决了用户不同设备,不同浏览器中间的用户识别问题;
3)解决了用户本地网络环境产生变化后的再识别问题。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的逻辑图;
图2为本发明的工作流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
如图1和图2所示,本发明提供的一种网络用户追踪方法,包括:
采集步骤:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;
特征库建立步骤:根据采集到的信息对每一访客进行身份信息建档形成特征库,每一访客具有唯一的身份标识;
分析处理步骤:根据采集到的信息与所述特征库内的身份信息进行对比;
更新步骤:当对比的结果为新访客时,在所述特征库生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。
采集步骤包括:
网络环境信息采集子步骤:采集访客的ip和cookie信息;
硬件信息采集子步骤:采集访客的计算机设置的信息,包括时区、屏幕大小、插件以及屏幕分辨率等信息;
数据整合子步骤:将采集到的计算机的设置信息生成唯一的id;
邮件内信息采集子步骤:发送邮件给对应的访客,获取访客的ip和cookie信息;
位置接口子步骤,采集访客的地理位置信息。
分析处理步骤包括:
数据筛选子步骤:过滤重复或者是无代表特征的信息(例如自身系统的信息);
身份验证子步骤:将访客携带的私有信息进行验证,若没有私有信息,则验证cookie和ip信息来确定访客的身份;
邮件内身份验证子步骤:将访客的硬件信息,ip及cookie信息记录追加到已经用邮件验证过的访客身份上。
特征库包括数据查询接口:提供二次访问查询调用或数据分析的接口。
以下给出三种情况进行说明:
1、当用户访问采用本发明的网站后,用户清除了cookies信息,第二次在访问时,如果他的IP数据没有产生变化依然可以识别到是同一用户;
2、当用户访问采用本发明的网站后,用户清除了cookies信息,更新了本地IP信息,系统采用设备特征标识依然能识别未同一个用户;
3、当用户访问采用本发明的网站后,在其他设备上有一次邮件沟通,之后当用户在第二台设备上访问网站,系统通过邮件采集数据能识别到为统一用户,并且此用户在系统中有俩个用户识别ID。
根据本发明提供的一种网络用户追踪系统,包括:
采集模块:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;
特征库模块:根据采集到的信息对每一访客进行身份信息建档,每一访客具有唯一的身份标识;
分析处理模块:根据采集到的信息与所述特征库模块内的身份信息进行对比;
更新模块:当对比的结果为新访客时,在所述特征库模块生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。
采集模块包括:
网络环境信息采集子模块:采集访客的ip和cookie信息;
硬件信息采集子模块:采集访客的计算机设置的信息,包括时区、屏幕大小、插件以及屏幕分辨率;
数据整合子模块:将采集到的计算机的设置信息生成唯一的id;
邮件内信息采集子模块:发送邮件给对应的访客,获取访客的ip和cookie信息;
位置接口子模块,采集访客的地理位置信息。
分析处理模块包括:
数据筛选子模块:过滤重复或者是无代表特征的信息;
身份验证子模块:将访客携带的私有信息进行验证,若没有私有信息,则验证cookie和ip信息来确定访客的身份;
邮件内身份验证子模块:将访客的硬件信息,ip及cookie信息记录追加到已经用邮件验证过的访客身份上。
特征库模块包括数据查询接口:提供二次访问查询调用或数据分析的接口。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (8)

1.一种网络用户追踪系统,其特征在于,包括:
采集模块:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;
特征库模块:根据采集到的信息对每一访客进行身份信息建档,每一访客具有唯一的身份标识;
分析处理模块:根据采集到的信息与所述特征库模块内的身份信息进行对比;
更新模块:当对比的结果为新访客时,在所述特征库模块生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。
2.根据权利要求1所述的网络用户追踪系统,其特征在于,所述采集模块包括:
网络环境信息采集子模块:采集访客的ip和cookie信息;
硬件信息采集子模块:采集访客的计算机设置的信息,包括时区、屏幕大小、插件以及屏幕分辨率;
数据整合子模块:将采集到的计算机的设置信息生成唯一的id;
邮件内信息采集子模块:发送邮件给对应的访客,获取访客的ip和cookie信息;
位置接口子模块,采集访客的地理位置信息。
3.根据权利要求2所述的网络用户追踪系统,其特征在于,所述分析处理模块包括:
数据筛选子模块:过滤重复或者是无代表特征的信息;
身份验证子模块:将访客携带的私有信息进行验证,若没有私有信息,则验证cookie和ip信息来确定访客的身份;
邮件内身份验证子模块:将访客的硬件信息,ip及cookie信息记录追加到已经用邮件验证过的访客身份上。
4.根据权利要求2所述的网络用户追踪系统,其特征在于,所述特征库模块包括数据查询接口:提供二次访问查询调用或数据分析的接口。
5.一种网络用户追踪方法,其特征在于,包括:
采集步骤:采集访客的网络环境信息、硬件信息以及邮件内信息在内的至少三种信息;
特征库建立步骤:根据采集到的信息对每一访客进行身份信息建档形成特征库,每一访客具有唯一的身份标识;
分析处理步骤:根据采集到的信息与所述特征库内的身份信息进行对比;
更新步骤:当对比的结果为新访客时,在所述特征库生成新的身份标识和身份信息,当对比结果为已建档的访客时,将本次采集到的新的信息更新至对应的身份信息中。
6.根据权利要求1所述的网络用户追踪方法,其特征在于,所述采集步骤包括:
网络环境信息采集子步骤:采集访客的ip和cookie信息;
硬件信息采集子步骤:采集访客的计算机设置的信息,包括时区、屏幕大小、插件以及屏幕分辨率;
数据整合子步骤:将采集到的计算机的设置信息生成唯一的id;
邮件内信息采集子步骤:发送邮件给对应的访客,获取访客的ip和cookie信息;
位置接口子步骤,采集访客的地理位置信息。
7.根据权利要求6所述的网络用户追踪方法,其特征在于,所述分析处理步骤包括:
数据筛选子步骤:过滤重复或者是无代表特征的信息;
身份验证子步骤:将访客携带的私有信息进行验证,若没有私有信息,则验证cookie和ip信息来确定访客的身份;
邮件内身份验证子步骤:将访客的硬件信息,ip及cookie信息记录追加到已经用邮件验证过的访客身份上。
8.根据权利要求6所述的网络用户追踪方法,其特征在于,所述特征库包括数据查询接口:提供二次访问查询调用或数据分析的接口。
CN201810085961.5A 2018-01-29 2018-01-29 网络用户追踪方法及系统 Pending CN108306818A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810085961.5A CN108306818A (zh) 2018-01-29 2018-01-29 网络用户追踪方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810085961.5A CN108306818A (zh) 2018-01-29 2018-01-29 网络用户追踪方法及系统

Publications (1)

Publication Number Publication Date
CN108306818A true CN108306818A (zh) 2018-07-20

Family

ID=62867070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810085961.5A Pending CN108306818A (zh) 2018-01-29 2018-01-29 网络用户追踪方法及系统

Country Status (1)

Country Link
CN (1) CN108306818A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050027806A1 (en) * 2003-07-28 2005-02-03 Schunemann Alan J. Network asset tracker for identifying users of networked computers
CN103944722A (zh) * 2014-04-17 2014-07-23 华北科技学院 一种互联网环境下用户可信行为的识别方法
CN104639387A (zh) * 2014-12-09 2015-05-20 北京京东尚科信息技术有限公司 一种用户网络行为跟踪方法及设备
CN105224606A (zh) * 2015-09-02 2016-01-06 新浪网技术(中国)有限公司 一种用户标识的处理方法及装置
CN105847422A (zh) * 2016-05-16 2016-08-10 乐视控股(北京)有限公司 一种用户跟踪方法和服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050027806A1 (en) * 2003-07-28 2005-02-03 Schunemann Alan J. Network asset tracker for identifying users of networked computers
CN103944722A (zh) * 2014-04-17 2014-07-23 华北科技学院 一种互联网环境下用户可信行为的识别方法
CN104639387A (zh) * 2014-12-09 2015-05-20 北京京东尚科信息技术有限公司 一种用户网络行为跟踪方法及设备
CN105224606A (zh) * 2015-09-02 2016-01-06 新浪网技术(中国)有限公司 一种用户标识的处理方法及装置
CN105847422A (zh) * 2016-05-16 2016-08-10 乐视控股(北京)有限公司 一种用户跟踪方法和服务器

Similar Documents

Publication Publication Date Title
KR100598666B1 (ko) 로봇 방지 웹 사이트 구현 시스템 및 방법
US20170242934A1 (en) Methods for integrating semantic search, query, and analysis and devices thereof
CN109063138B (zh) 用于在区块链即服务平台搜索数据的方法、设备及存储介质
CN103888490A (zh) 一种全自动的web客户端人机识别的方法
CN102394885A (zh) 基于数据流的信息分类防护自动化核查方法
CN109101607B (zh) 用于搜索区块链数据的方法、装置及存储介质
US10735370B1 (en) Name based internet of things (IoT) data discovery
CN106790593B (zh) 一种页面处理方法和装置
CN106161406B (zh) 获取用户账号的方法和装置
CN106161396A (zh) 一种实现虚拟机网络访问控制的方法及装置
CN112287326A (zh) 安全认证的方法及装置、电子设备、存储介质
CN108737589B (zh) 基于地理信息对域名进行画像的方法
US20130124687A1 (en) Apparatus and method for detecting modified uniform resource locator
EP3789890A1 (en) Fully qualified domain name (fqdn) determination
CN109829821A (zh) 一种数字资产地址转移异常的处理方法、装置及系统
CN112804226A (zh) Ip数据处理方法、装置、设备及介质
CN108306818A (zh) 网络用户追踪方法及系统
CN109492655B (zh) 一种特征提取方法、装置及终端
CN106067881B (zh) 基于os/400的数据安全访问控制方法、装置及系统
US20090248673A1 (en) Method of sorting web pages, search terminal and client terminal
CN106097403B (zh) 一种基于图像曲线推算的网络受保护指数数据的获取方法
CN105447067A (zh) 一种社交媒体中热点微博数据的自适应取样方法
US7441044B2 (en) Countrytagging
KR101304452B1 (ko) 위치 기반 문서 관리 클라우드 시스템
CN111865977A (zh) 一种信息处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180720