CN106708878A - 终端识别方法及装置 - Google Patents
终端识别方法及装置 Download PDFInfo
- Publication number
- CN106708878A CN106708878A CN201510786163.1A CN201510786163A CN106708878A CN 106708878 A CN106708878 A CN 106708878A CN 201510786163 A CN201510786163 A CN 201510786163A CN 106708878 A CN106708878 A CN 106708878A
- Authority
- CN
- China
- Prior art keywords
- cookie
- target data
- packet
- server
- monitored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/4061—Push-to services, e.g. push-to-talk or push-to-video
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明提供了一种终端识别方法及装置。其中,该方法包括:获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组;根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。通过本发明,解决了相关技术中无法准确识别出同一个终端的访问行为的问题,进而达到了在众多访问行为中准确识别出属于同一个终端的访问行为的效果。
Description
技术领域
本发明涉及通信领域,具体而言,涉及一种终端识别方法及装置。
背景技术
现在互联网上有成千上万个网站、系统,通常每个网站和系统对每个用户终端都有唯一的cookie字符串,然而,由于用户终端上的客户端的安全因素,cookie数据往往会被手动或自动清除。这样必然将造成用户访问同一个网站时会被分配多个cookie,进一步,嵌入在cookie所指示的页面中的链接对应的第三方cookie也可能将被配置多个。在实际运用中如何利用所分配的多个cookie准确识别出同一个用户终端的访问行为就成为了众多企业关注的问题。
发明内容
本发明实施例提供了一种终端识别方法及装置,以至少解决相关技术中无法准确识别出同一个终端的访问行为的问题。
根据本发明实施例的一个方面,提供了一种终端识别方法,包括:获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,上述目标数据包括具有关联关系的第一cookie和第二cookie;根据上述第一cookie对与上述各个待监测服务器分别对应的上述目标数据进行分组;根据上述第二cookie合并上述分组中对应的上述目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。
可选地,获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据包括:获取上述各个待监测服务器通过图片链接请求发送的上述第一cookie;获取响应上述图片链接请求为上述终端配置的上述第二cookie。
可选地,在根据上述第一cookie对与上述各个待监测服务器分别对应的上述目标数据进行分组之前,还包括:对上述目标数据进行去重。
可选地,根据上述第一cookie对与上述各个待监测服务器分别对应的上述目标数据进行分组包括:比对与上述各个待监测服务器分别对应的上述目标数据中的上述第一cookie;将上述第一cookie相同的上述目标数据中的上述第二cookie分为一组。
可选地,根据上述第二cookie合并上述分组中对应的上述目标数据包括:获取上述分组中第一分组中的上述第二cookie;重复执行以下步骤,直至各个分组内的上述第二cookie相互独立,其中,当前分组的初始值为上述第一分组;获取上述当前分组之后的下一分组中的第二cookie;判断上述当前分组和上述下一分组中是否存在相同的第二cookie;若上述当前分组和上述下一分组中存在相同的第二cookie,则将上述当前分组和上述下一分组中的上述第一cookie和上述第二cookie分别合并,并将合并后的分组作为上述当前分组。
根据本发明实施例的另一方面,提供了一种终端识别装置,包括:获取单元,用于获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,上述目标数据包括具有关联关系的第一cookie和第二cookie;分组单元,用于根据上述第一cookie对与上述各个待监测服务器分别对应的上述目标数据进行分组;识别单元,用于根据上述第二cookie合并上述分组中对应的上述目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。
可选地,上述获取单元包括:第一获取模块,用于获取上述各个待监测服务器通过图片链接请求发送的上述第一cookie;第二获取模块,用于获取响应上述图片链接请求为上述终端配置的上述第二cookie。
可选地,上述装置还包括:去重单元,用于在根据上述第一cookie对与上述各个待监测服务器分别对应的上述目标数据进行分组之前,对上述目标数据进行去重。
可选地,上述分组单元包括:比对模块,用于比对与上述各个待监测服务器分别对应的上述目标数据中的上述第一cookie;分组模块,用于将上述第一cookie相同的上述目标数据中的上述第二cookie分为一组。
可选地,上述识别单元包括:第三获取模块,用于获取上述分组中第一分组中的上述第二cookie;处理模块,用于重复执行以下步骤,直至各个分组内的上述第二cookie相互独立,其中,当前分组的初始值为上述第一分组;获取上述当前分组之后的下一分组中的第二cookie;判断上述当前分组和上述下一分组中是否存在相同的第二cookie;若上述当前分组和上述下一分组中存在相同的第二cookie,则将上述当前分组和上述下一分组中的上述第一cookie和上述第二cookie分别合并,并将合并后的分组作为上述当前分组。
通过本发明实施例,通过获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组;根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。从而克服相关技术中无法准确识别出同一个终端的访问行为的问题,进一步,通过准确识别出同一个终端的访问行为,以便于对用户进行进一步的行为习惯分析,进而实现为用户推送更加符合用户习惯及喜好的信息。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的终端识别方法的流程图;
图2是根据本发明实施例的一种可选的终端识别方法的应用场景示意图;以及
图3是根据本发明实施例的一种可选的终端识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种终端识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,提供了一种终端识别方法,如图1所示,该方法包括:
S102,获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;
S104,根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组;
S106,根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。
可选地,在本实施例中,上述终端识别方法可以但不限于应用于对用户访问行为的跟踪过程中,具体而言,如图2所示,监测服务器202通过各个待监测服务器204中的监测代码监测用于标识终端206访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie,在对上述各个待监测服务器204的目标数据进行比对后,根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组。根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端206的访问行为的第一cookie集合。从而克服相关技术中无法准确识别出同一个终端的访问行为的问题,进一步,通过准确识别出同一个终端的访问行为,以便于对用户进行进一步的行为习惯分析,例如,根据用户访问的购物页面识别出用户的消费习惯、根据用户的浏览记录识别出用户的浏览习惯,进而实现为用户推送更加符合用户习惯及喜好的信息。上述仅是一种示例,本实施例对此不做任何限定。
需要说明的是,由于第一cookie与第二cookie具有关联关系,因而,在监测服务器获取到不同待监测服务器监测到的cookie对(具有关联关系的第一cookie和第二cookie)后,就可以利用cookie对之间的关系识别出属于同一个终端的访问行为,以便于对同一个终端访问的页面进行分析,进而实现对用户访问行为的准确分析。此外,上述第一cookie和第二cookie是为了区分不同服务器配置的cookie,即,第一cookie是由待监测服务器为访问终端配置的,第二cookie是监测服务器为访问终端配置的。第一cookie不限于一个cookie,即,上述第一cookie不用于限定cookie的数量。换言之,第一cookie中可以包括多个cookie。
可选地,在本实施例中,上述第一cookie与第二cookie的关联关系可以包括但不限于:与第二cookie对应的链接嵌入在第一cookie所指示的页面中。
需要说明的是,上述第一cookie与第二cookie都由某个域存放,且只能被对应的域访问。比如,访问www.a.com这个网站,这个网站设置了一个cookie,这个cookie只能被www.a.com这个域下的网页读取,这就是第一cookie。如果还是访问www.a.com这个网站,网页里有用到www.b.com网站的一张图片,浏览器在www.b.com请求图片的时候,www.b.com设置了一个cookie,那这个cookie只能被www.b.com这个域访问,反而不能被www.a.com这个域访问,因为在访问www.a.com这个网站被设置了一个www.b.com这个域下的cookie,就是第二cookie。
可选地,在本实施例中,在获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据之前,还包括:S1,在各个待监测服务器中设置与第二cookie对应的监测代码;S2,通过监测代码监测终端访问待监测服务器的访问行为。
可选地,在本实施例中,上述与第二cookie对应的监测代码可以但不限于将监测到的第一cookie嵌入到访问第二cookie对应的监测服务器的访问请求中。
例如,监测代码监测到终端访问网页service.com.cn的访问行为,以及网页service.com.cn中的第一cookie,例如,第一cookie为0001,则可以将上述内容嵌入到一个图片路径中,例如,图片路径为“tracker.com.cn/t.png?第一方cookie=0001&action=….”,进一步,将该图片路径对应的图片嵌入到上述网页service.com.cn的页面中。当终端加载上述图片时,就可以向监测服务器发起链接请求,从而使监测服务器记录当前终端访问网页service.com.cn的访问行为。
可选地,在本实施例中,上述监测代码可以但不限于将用户访问待监测服务器的访问行为转换为访问监测服务器的链接请求,从而实现在终端访问待监测服务器时,可以触发对监测服务器的访问,以使监测服务器可以及时监测到用户访问待监测服务器的访问行为。
可选地,在本实施例中,在根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合之后,还包括:S1,向终端推送与终端的访问行为匹配的信息。
可选地,在本实施例中,在识别出同一个终端的访问行为后,可以对其访问过的待监测服务器中的内容进行分析,从而得出该终端的喜好和习惯,以便于向该终端推送与其访问行为匹配的信息。
具体结合表1所示进行说明,表1示出了各个待监测服务器监测到的用于标识终端访问行为的目标数据,其中,包括具有关联关系的第一cookie和第二cookie。
表1
序号 | 第一cookie | 第二cookie |
1 | 0001 | 000A |
2 | 0002 | 000A |
3 | 0002 | 000B |
4 | 0002 | 000B |
5 | 0003 | 000B |
进一步,对上述各个待监测服务器进行去重,分组及合并处理后,将得到表2所示的数据,其中表2所示的第一cookie用于标识同一个终端的访问行为。
表2
第一cookie | 第二cookie |
0001,0002,0003 | 000A,000B |
通过本申请提供的实施例,通过获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组;根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。从而克服相关技术中无法准确识别出同一个终端的访问行为的问题,进一步,通过准确识别出同一个终端的访问行为,以便于对用户进行进一步的行为习惯分析,进而实现为用户推送更加符合用户习惯及喜好的信息。
作为一种可选的方案,获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据包括:
S1,获取各个待监测服务器通过图片链接请求发送的第一cookie;
S2,获取响应图片链接请求为终端配置的第二cookie。
可选地,在本实施例中,上述第一cookie可以但不限于嵌入到图片路径中,进一步,将该图片路径所指示的图片再嵌入到网页的页面中,通过加载图片的方式,实现向监测服务器发送请求,进而达到获取第一cookie和第二cookie的目的。
通过本申请提供的实施例,通过图片链接请求的形式获取第一cookie,进一步,再获取响应图片链接请求为终端配置的第二cookie,从而实现快速准确地获取具有关联关系的第一cookie和第二cookie。
作为一种可选的方案,在根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组之前,还包括:
S1,对目标数据进行去重。
具体结合以下示例进行说明,获取如表1所示的目标数据,其中,序号3与序号4中的目标数据完全相同,如第一cookie均为0002,第二cookie均为000B,则可以对表1中的目标数据先进行去重处理,例如,去除序号为4的目标数据,以得到如下所示的表3。
表3
序号 | 第一cookie | 第二cookie |
1 | 0001 | 000A |
2 | 0002 | 000A |
3 | 0002 | 000B |
5 | 0003 | 000B |
通过本申请提供的实施例,通过对目标数据进行去重处理后,以避免对相同的cookie重复分组,从而根据第一cookie集合识别出属于同一个终端的访问行为。
作为一种可选的方案,根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组包括:
S1,比对与各个待监测服务器分别对应的目标数据中的第一cookie;
S2,将第一cookie相同的目标数据中的第二cookie分为一组。
具体结合以下示例进行说明,对去重后的表3所示的数据进行比对分组,将第一cookie相同的目标数据中的第二cookie分为一组,由表3所示的目标数据可知,序号为2和序号为3的目标数据中的第一cookie相同,因而,将其中的第二cookie分为一组,如表4所示。
表4
序号 | 第一cookie | 第二cookie |
1 | 0001 | 000A |
2 | 0002 | 000A,000B |
5 | 0003 | 000B |
需要说明的是,服务器为每个终端只分配一个cookie,在客户端浏览器清除缓存之前,可以使用相同的cookie访问同一个待监测服务器,然而当缓存被清除后,若终端再次访问同一个待监测服务器,则需再次为该终端分配cookie,这里,再次分配的cookie与前一次的cookie不同。由表4可知,目标数据中第一cookie相同,即,是同一个终端访问了待监测服务器,然而,第二cookie不同可能是客户端浏览器删除了第二cookie造成,因而,可以将这两个目标数据分为一组,标识同一个终端。
通过本申请提供的实施例,通过根据第一cookie对目标数据集合中的目标数据中的第二cookie进行分组,也就是说,通过利用cookie本身的缓存特性,实现对终端访问行为的准确识别。
作为一种可选的方案,根据第二cookie合并分组中对应的目标数据包括:
S1,获取分组中第一分组中的第二cookie;
S2,重复执行以下步骤,直至各个分组内的第二cookie相互独立,其中,当前分组的初始值为第一分组;
S22,获取当前分组之后的下一分组中的第二cookie;
S24,判断当前分组和下一分组中是否存在相同的第二cookie;
S26,若当前分组和下一分组中存在相同的第二cookie,则将当前分组和下一分组中的第一cookie和第二cookie分别合并,并将合并后的分组作为当前分组。
具体结合以下示例进行说明,依次比对当前分组和下一分组的第二cookie,如表4所示,序号为1的目标数据中的第二cookie中包括000A,序号为2的目标数据中的第二cookie中包括000A和000B,即,具有相同的000A,则可以将上述序号为1的目标数据和序号为2的目标数据的两个分组合并作为当前分组,进一步,将新的分组与下一分组(即序号为5的目标数据)进行比对,其中,第二cookie具有相同的000B,则可以将第一cookie和第二cookie分别合并,得到如下的表5。
表5
第一cookie | 第二cookie |
0001,0002,0003 | 000A,000B |
需要说明的是,同对第一cookie的说明,具有相同的第二cookie的终端被识别为同一终端的访问行为。
通过本申请提供的实施例,通过根据第二cookie对分组后的目标数据进行合并,以得到第一cookie集合。通过利用cookie本身的缓存特性,实现对终端访问行为的准确识别。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例2
在本实施例中还提供了一种终端识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
根据本发明实施例,还提供了一种用于实施上述终端识别方法的终端识别装置,如图3所示,该装置包括:
1)获取单元302,用于获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;
2)分组单元304,用于根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组;
3)识别单元306,用于根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。
可选地,在本实施例中,上述终端识别装置可以但不限于应用于对用户访问行为的跟踪过程中,具体而言,如图2所示,监测服务器202通过各个待监测服务器204中的监测代码监测用于标识终端206访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie,在对上述各个待监测服务器204的目标数据进行比对后,根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组。根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端206的访问行为的第一cookie集合。从而克服相关技术中无法准确识别出同一个终端的访问行为的问题,进一步,通过准确识别出同一个终端的访问行为,以便于对用户进行进一步的行为习惯分析,例如,根据用户访问的购物页面识别出用户的消费习惯、根据用户的浏览记录识别出用户的浏览习惯,进而实现为用户推送更加符合用户习惯及喜好的信息。上述仅是一种示例,本实施例对此不做任何限定。
需要说明的是,由于第一cookie与第二cookie具有关联关系,因而,在监测服务器获取到不同待监测服务器监测到的cookie对(具有关联关系的第一cookie和第二cookie)后,就可以利用cookie对之间的关系识别出属于同一个终端的访问行为,以便于对同一个终端访问的页面进行分析,进而实现对用户访问行为的准确分析。此外,上述第一cookie和第二cookie是为了区分不同服务器配置的cookie,即,第一cookie是由待监测服务器为访问终端配置的,第二cookie是监测服务器为访问终端配置的。第一cookie不限于一个cookie,即,上述第一cookie不用于限定cookie的数量。换言之,第一cookie中可以包括多个cookie。
可选地,在本实施例中,上述第一cookie与第二cookie的关联关系可以包括但不限于:与第二cookie对应的链接嵌入在第一cookie所指示的页面中。
需要说明的是,上述第一cookie与第二cookie都由某个域存放,且只能被对应的域访问。比如,访问www.a.com这个网站,这个网站设置了一个cookie,这个cookie只能被www.a.com这个域下的网页读取,这就是第一cookie。如果还是访问www.a.com这个网站,网页里有用到www.b.com网站的一张图片,浏览器在www.b.com请求图片的时候,www.b.com设置了一个cookie,那这个cookie只能被www.b.com这个域访问,反而不能被www.a.com这个域访问,因为在访问www.a.com这个网站被设置了一个www.b.com这个域下的cookie,就是第二cookie。
可选地,在本实施例中,在获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据之前,还包括:S1,在各个待监测服务器中设置与第二cookie对应的监测代码;S2,通过监测代码监测终端访问待监测服务器的访问行为。
可选地,在本实施例中,上述与第二cookie对应的监测代码可以但不限于将监测到的第一cookie嵌入到访问第二cookie对应的监测服务器的访问请求中。
例如,监测代码监测到终端访问网页service.com.cn的访问行为,以及网页service.com.cn中的第一cookie,例如,第一cookie为0001,则可以将上述内容嵌入到一个图片路径中,例如,图片路径为“tracker.com.cn/t.png?第一方cookie=0001&action=….”,进一步,将该图片路径对应的图片嵌入到上述网页service.com.cn的页面中。当终端加载上述图片时,就可以向监测服务器发起链接请求,从而使监测服务器记录当前终端访问网页service.com.cn的访问行为。
可选地,在本实施例中,上述监测代码可以但不限于将用户访问待监测服务器的访问行为转换为访问监测服务器的链接请求,从而实现在终端访问待监测服务器时,可以触发对监测服务器的访问,以使监测服务器可以及时监测到用户访问待监测服务器的访问行为。
可选地,在本实施例中,在根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合之后,还包括:S1,向终端推送与终端的访问行为匹配的信息。
可选地,在本实施例中,在识别出同一个终端的访问行为后,可以对其访问过的待监测服务器中的内容进行分析,从而得出该终端的喜好和习惯,以便于向该终端推送与其访问行为匹配的信息。
具体结合表6所示进行说明,表6示出了各个待监测服务器监测到的用于标识终端访问行为的目标数据,其中,包括具有关联关系的第一cookie和第二cookie。
表6
序号 | 第一cookie | 第二cookie |
1 | 0001 | 000A |
2 | 0002 | 000A |
3 | 0002 | 000B |
4 | 0002 | 000B |
5 | 0003 | 000B |
进一步,对上述各个待监测服务器进行去重,分组及合并处理后,将得到表7所示的数据,其中表7所示的第一cookie用于标识同一个终端的访问行为。
表7
第一cookie | 第二cookie |
0001,0002,0003 | 000A,000B |
通过本申请提供的实施例,通过获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组;根据第二cookie合并分组中对应的目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。从而克服相关技术中无法准确识别出同一个终端的访问行为的问题,进一步,通过准确识别出同一个终端的访问行为,以便于对用户进行进一步的行为习惯分析,进而实现为用户推送更加符合用户习惯及喜好的信息。
作为一种可选的方案,获取单元306包括:
1)第一获取模块,用于获取各个待监测服务器通过图片链接请求发送的第一cookie;
2)第二获取模块,用于获取响应图片链接请求为终端配置的第二cookie。
可选地,在本实施例中,上述第一cookie可以但不限于嵌入到图片路径中,进一步,将该图片路径所指示的图片再嵌入到网页的页面中,通过加载图片的方式,实现向监测服务器发送请求,进而达到获取第一cookie和第二cookie的目的。
通过本申请提供的实施例,通过图片链接请求的形式获取第一cookie,进一步,再获取响应图片链接请求为终端配置的第二cookie,从而实现快速准确地获取具有关联关系的第一cookie和第二cookie。
作为一种可选的方案,还包括:
1)去重单元,用于在根据第一cookie对与各个待监测服务器分别对应的目标数据进行分组之前,对目标数据进行去重。
具体结合以下示例进行说明,获取如表6所示的目标数据,其中,序号3与序号4中的目标数据完全相同,如第一cookie均为0002,第二cookie均为000B,则可以对表6中的目标数据先进行去重处理,例如,去除序号为4的目标数据,以得到如下所示的表8。
表8
序号 | 第一cookie | 第二cookie |
1 | 0001 | 000A |
2 | 0002 | 000A |
3 | 0002 | 000B |
5 | 0003 | 000B |
通过本申请提供的实施例,通过对目标数据进行去重,以避免对相同的cookie重复分组,从而根据第一cookie集合识别出属于同一个终端的访问行为。
作为一种可选的方案,分组单元包括:
1)比对模块,用于比对与各个待监测服务器分别对应的目标数据中的第一cookie;
2)分组模块,用于将第一cookie相同的目标数据中的第二cookie分为一组。
具体结合以下示例进行说明,,对去重后的表3所示的数据进行比对分组,将第一cookie相同的目标数据中的第二cookie分为一组,由表8所示的目标数据可知,序号为2和序号为3的目标数据中的第一cookie相同,因而,将其中的第二cookie分为一组,如表9所示。
表9
序号 | 第一cookie | 第二cookie |
1 | 0001 | 000A |
2 | 0002 | 000A,000B |
5 | 0003 | 000B |
需要说明的是,服务器为每个终端只分配一个cookie,在客户端浏览器清除缓存之前,可以使用相同的cookie访问同一个待监测服务器,然而当缓存被清除后,若终端再次访问同一个待监测服务器,则需再次为该终端分配cookie,这里,再次分配的cookie与前一次的cookie不同。由表9可知,目标数据中第一cookie相同,即,是同一个终端访问了待监测服务器,然而,第二cookie不同可能是客户端浏览器删除了第二cookie造成,因而,可以将这两个目标数据分为一组,标识同一个终端。
通过本申请提供的实施例,通过根据第一cookie对目标数据集合中的目标数据中的第二cookie进行分组,也就是说,通过利用cookie本身的缓存特性,实现对终端访问行为的准确识别。
作为一种可选的方案,识别单元306包括:
1)第三获取模块,用于获取分组中第一分组中的第二cookie;
2)处理模块,用于重复执行以下步骤,直至各个分组内的第二cookie相互独立,其中,当前分组的初始值为第一分组;获取当前分组之后的下一分组中的第二cookie;判断当前分组和下一分组中是否存在相同的第二cookie;若当前分组和下一分组中存在相同的第二cookie,则将当前分组和下一分组中的第一cookie和第二cookie分别合并,并将合并后的分组作为当前分组。
具体结合以下示例进行说明,依次比对当前分组和下一分组的第二cookie,如表9所示,序号为1的目标数据中的第二cookie中包括000A,序号为2的目标数据中的第二cookie中包括000A和000B,即,具有相同的000A,则可以将上述序号为1的目标数据和序号为2的目标数据的两个分组合并作为当前分组,进一步,将新的分组与下一分组(即序号为5的目标数据)进行比对,其中,第二cookie具有相同的000B,则可以将第一cookie和第二cookie分别合并,得到如下的表10。
表10
第一cookie | 第二cookie |
0001,0002,0003 | 000A,000B |
需要说明的是,同对第一cookie的说明,具有相同的第二cookie的终端被识别为同一终端的访问行为。
通过本申请提供的实施例,通过根据第二cookie对分组后的目标数据进行合并,以得到第一cookie集合。通过利用cookie本身的缓存特性,实现对终端访问行为的准确识别。
所述终端识别装置包括处理器和存储器,上述获取单元、比对单元、识别单元、设置单元和监测单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核实现终端识别。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取设置有监测代码的各个待监测服务器监测到的用于标识终端访问行为的目标数据,其中,目标数据包括具有关联关系的第一cookie和第二cookie;对各个待监测服务器的目标数据进行比对;根据比对的比对结果识别同一个终端的访问行为。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种终端识别方法,其特征在于,包括:
获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,所述目标数据包括具有关联关系的第一cookie和第二cookie;
根据所述第一cookie对与所述各个待监测服务器分别对应的所述目标数据进行分组;
根据所述第二cookie合并所述分组中对应的所述目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。
2.根据权利要求1所述的方法,其特征在于,获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据包括:
获取所述各个待监测服务器通过图片链接请求发送的所述第一cookie;
获取响应所述图片链接请求为所述终端配置的所述第二cookie。
3.根据权利要求1所述的方法,其特征在于,在根据所述第一cookie对与所述各个待监测服务器分别对应的所述目标数据进行分组之前,还包括:
对所述目标数据进行去重。
4.根据权利要求1所述的方法,其特征在于,根据所述第一cookie对与所述各个待监测服务器分别对应的所述目标数据进行分组包括:
比对与所述各个待监测服务器分别对应的所述目标数据中的所述第一cookie;
将所述第一cookie相同的所述目标数据中的所述第二cookie分为一组。
5.根据权利要求4所述的方法,其特征在于,根据所述第二cookie合并所述分组中对应的所述目标数据包括:
获取所述分组中第一分组中的所述第二cookie;
重复执行以下步骤,直至各个分组内的所述第二cookie相互独立,其中,当前分组的初始值为所述第一分组;
获取所述当前分组之后的下一分组中的第二cookie;
判断所述当前分组和所述下一分组中是否存在相同的第二cookie;
若所述当前分组和所述下一分组中存在相同的第二cookie,则将所述当前分组和所述下一分组中的所述第一cookie和所述第二cookie分别合并,并将合并后的分组作为所述当前分组。
6.一种终端识别装置,其特征在于,包括:
获取单元,用于获取由设置有监测代码的各个待监测服务器得到的用于标识终端访问行为的目标数据,其中,所述目标数据包括具有关联关系的第一cookie和第二cookie;
分组单元,用于根据所述第一cookie对与所述各个待监测服务器分别对应的所述目标数据进行分组;
识别单元,用于根据所述第二cookie合并所述分组中对应的所述目标数据,以识别出用于标识同一个终端的访问行为的第一cookie集合。
7.根据权利要求6所述的装置,其特征在于,所述获取单元包括:
第一获取模块,用于获取所述各个待监测服务器通过图片链接请求发送的所述第一cookie;
第二获取模块,用于获取响应所述图片链接请求为所述终端配置的所述第二cookie。
8.根据权利要求6所述的装置,其特征在于,还包括:
去重单元,用于在根据所述第一cookie对与所述各个待监测服务器分别对应的所述目标数据进行分组之前,对所述目标数据进行去重。
9.根据权利要求6所述的装置,其特征在于,所述分组单元包括:
比对模块,用于比对与所述各个待监测服务器分别对应的所述目标数据中的所述第一cookie;
分组模块,用于将所述第一cookie相同的所述目标数据中的所述第二cookie分为一组。
10.根据权利要求9所述的装置,其特征在于,所述识别单元包括:
第三获取模块,用于获取所述分组中第一分组中的所述第二cookie;
处理模块,用于重复执行以下步骤,直至各个分组内的所述第二cookie相互独立,其中,当前分组的初始值为所述第一分组;获取所述当前分组之后的下一分组中的第二cookie;判断所述当前分组和所述下一分组中是否存在相同的第二cookie;若所述当前分组和所述下一分组中存在相同的第二cookie,则将所述当前分组和所述下一分组中的所述第一cookie和所述第二cookie分别合并,并将合并后的分组作为所述当前分组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510786163.1A CN106708878B (zh) | 2015-11-16 | 2015-11-16 | 终端识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510786163.1A CN106708878B (zh) | 2015-11-16 | 2015-11-16 | 终端识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106708878A true CN106708878A (zh) | 2017-05-24 |
CN106708878B CN106708878B (zh) | 2020-06-16 |
Family
ID=58932021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510786163.1A Active CN106708878B (zh) | 2015-11-16 | 2015-11-16 | 终端识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106708878B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765162A (zh) * | 2019-09-06 | 2020-02-07 | 上海陆家嘴国际金融资产交易市场股份有限公司 | 数据比对方法、装置、计算机设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771676A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种跨域授权的设置、鉴权方法、相关装置及系统 |
CN101902495A (zh) * | 2009-12-17 | 2010-12-01 | 亿赞普(北京)科技有限公司 | 一种穿透私网、网关、proxy的页面推送方法 |
US20120179543A1 (en) * | 2011-01-07 | 2012-07-12 | Huitao Luo | Targeted advertisement |
CN102682009A (zh) * | 2011-03-11 | 2012-09-19 | 腾讯科技(北京)有限公司 | 一种用户登录网页的方法及系统 |
CN103618696A (zh) * | 2013-11-07 | 2014-03-05 | 北京奇虎科技有限公司 | 对cookie信息进行处理的方法和服务器 |
CN104199848A (zh) * | 2014-08-08 | 2014-12-10 | 亿赞普(北京)科技有限公司 | 一种不同域下用户数据的关联方法和装置 |
CN104486458A (zh) * | 2014-12-15 | 2015-04-01 | 北京国双科技有限公司 | 跨域会话的数据处理方法和装置 |
CN104951499A (zh) * | 2015-04-23 | 2015-09-30 | 中国科学院信息工程研究所 | 一种跨域用户关联方法及信息推送方法 |
-
2015
- 2015-11-16 CN CN201510786163.1A patent/CN106708878B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771676A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种跨域授权的设置、鉴权方法、相关装置及系统 |
CN101902495A (zh) * | 2009-12-17 | 2010-12-01 | 亿赞普(北京)科技有限公司 | 一种穿透私网、网关、proxy的页面推送方法 |
US20120179543A1 (en) * | 2011-01-07 | 2012-07-12 | Huitao Luo | Targeted advertisement |
CN102682009A (zh) * | 2011-03-11 | 2012-09-19 | 腾讯科技(北京)有限公司 | 一种用户登录网页的方法及系统 |
CN103618696A (zh) * | 2013-11-07 | 2014-03-05 | 北京奇虎科技有限公司 | 对cookie信息进行处理的方法和服务器 |
CN104199848A (zh) * | 2014-08-08 | 2014-12-10 | 亿赞普(北京)科技有限公司 | 一种不同域下用户数据的关联方法和装置 |
CN104486458A (zh) * | 2014-12-15 | 2015-04-01 | 北京国双科技有限公司 | 跨域会话的数据处理方法和装置 |
CN104951499A (zh) * | 2015-04-23 | 2015-09-30 | 中国科学院信息工程研究所 | 一种跨域用户关联方法及信息推送方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765162A (zh) * | 2019-09-06 | 2020-02-07 | 上海陆家嘴国际金融资产交易市场股份有限公司 | 数据比对方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106708878B (zh) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106708841B (zh) | 网站访问路径的聚合方法和装置 | |
CN101582887B (zh) | 安全防护方法、网关设备及安全防护系统 | |
CN110300084B (zh) | 基于ip地址的画像方法和装置,电子设备,可读介质 | |
CN102870118B (zh) | 用户行为的获取方法、设备及系统 | |
CN105550175A (zh) | 恶意账户识别方法及装置 | |
CN107103062A (zh) | 一种网页推荐方法及系统 | |
CN107908666A (zh) | 一种识别设备标识的方法和装置 | |
CN106874273A (zh) | 渠道信息统计方法、装置和系统 | |
CN106779803B (zh) | 一种将金融机构流水与运营商数据匹配的方法 | |
US10460373B2 (en) | Recommendation method and apparatus | |
CN112053176A (zh) | 一种信息投放数据的分析方法、装置、设备及存储介质 | |
CN108154024A (zh) | 一种数据检索方法、装置及电子设备 | |
CN108270753A (zh) | 注销用户账号的方法及装置 | |
CN112989158A (zh) | 一种识别网页爬虫行为的方法、装置及存储介质 | |
CN105872082B (zh) | 基于容器集群负载均衡算法的细粒度资源响应系统 | |
CN108132948A (zh) | 处理爬取网页的方法和装置 | |
CN107294905A (zh) | 一种识别用户的方法及装置 | |
US9525744B2 (en) | Determining a uniform user identifier for a visiting user | |
CN106708878A (zh) | 终端识别方法及装置 | |
CN103312785B (zh) | 一种访问关系的确定方法及装置 | |
CN105959361A (zh) | 一种任务分发方法、装置和系统 | |
CN106549914B (zh) | 一种独立访问者的识别方法及装置 | |
CN104484357A (zh) | 数据处理方法及装置和访问频次信息处理方法及装置 | |
CN104902464B (zh) | 一种用户行为识别方法和装置 | |
CN104579793B (zh) | 网络资源的调度方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |