CN108134760A - 网站监测数据获取方法及装置 - Google Patents
网站监测数据获取方法及装置 Download PDFInfo
- Publication number
- CN108134760A CN108134760A CN201611089463.5A CN201611089463A CN108134760A CN 108134760 A CN108134760 A CN 108134760A CN 201611089463 A CN201611089463 A CN 201611089463A CN 108134760 A CN108134760 A CN 108134760A
- Authority
- CN
- China
- Prior art keywords
- user
- website
- monitored
- cookie
- platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 42
- 235000014510 cooky Nutrition 0.000 claims abstract description 118
- 238000013507 mapping Methods 0.000 claims abstract description 43
- 241001269238 Data Species 0.000 claims abstract description 22
- 238000012512 characterization method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 241000270322 Lepidosauria Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
- H04L63/302—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information gathering intelligence information for situation awareness or reconnaissance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种网站监测数据获取方法及装置,当用户通过网络社交平台访问待监测网站时,获取此次访问产生的cookie数据,以及该用户在该网络社交平台上的唯一身份标识;然后,建立该cookie数据与该用户的唯一身份标识之间的映射关系。根据该映射关系,能够找到同一个唯一身份标识所对应的cookie数据,从而找到属于同一用户的不同cookie数据。通过不同的cookie数据能够推测用户的兴趣爱好,以及,对哪种类型的内容感兴趣,从而丰富用户的属性画像,为下一步进行精准推送提供数据支持。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种网站监测数据获取方法及装置。
背景技术
网站监测主要是监测用户访问预设网站的访问行为,监测访客的访问行为可以根据用户的访问数据推测出用户对哪些网页内容感兴趣,然后,向用户推送用户感兴趣的信息,从而达到精准推送的目的。
但是,目前网站监测都是获取用户访问网站的cookie数据,而且,cookie数据的生命周期很短暂,同一个人在不同时间访问同一页面所产生的cookie数据可能不相同,同一个用户可能对应很多cookie数据。但是,cookie数据中不包含用户的唯一身份标识,因此,无法将属于某一用户的cookie数据全部搜集起来综合分析该用户感兴趣的信息,建立用户的属性画像。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网站监测数据获取方法及装置,技术方案如下:
第一方面,本申请提供一种网站监测数据获取方法,包括:
获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识;
建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
可选地,若所述网络社交平台为微博,则所述获取用户通过网络社交平台访问待监测网站的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识,包括:
在所述网络社交平台发布携带所述待监测网站的统一资源定位符URL的信息;
获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源URL;
从所述访问来源URL中提取所述用户在所述网络社交平台注册的唯一身份标识。
可选地,所述从所述访问来源URL中提取所述用户在所述网络社交平台上的唯一身份标识,包括:
利用正则表达式判断所述访问来源URL中是否包含“/home/”字符;
当所述访问来源URL中包含“/home/”字符时,从所述访问来源URL中提取出唯一身份标识信息,并确定为当前访问所述待监测网站的用户的唯一身份标识信息。
可选地,若所述网络社交平台为所述待监测网站的微信公众号,则所述获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识,包括:
在所述待监测网络的微信公众号上发布携带所述待监测网站的URL的信息;
获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源信息;
从所述访问来源信息中获取所述用户的openid,所述openid用于表征微信帐号针对微信公众号的唯一身份标识。
可选地,若所述唯一身份标识是微信用户的openid,则所述方法还包括:
获取用户访问所述待监测网站产生的当前cookie数据;
利用所述当前cookie数据生成所述待监测网站对应的微信公众号的唯一标识;
当检测到所述用户通过所述唯一标识关注所述微信公众号的关注事件时,从所述关注事件中获取所述唯一标识所携带的cookie数据及所述用户的openid;
建立所述cookie数据与所述openid之间的映射关系。
可选地,所述方法还包括:
利用所述用户的唯一身份标识,获取所述用户的用户信息;
根据所述用户对应的不同cookie数据及所述用户信息,创建所述用户的属性画像。
第二方面,本申请还提供一种网站监测数据获取装置,包括:
第一获取模块,用于获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识;
第一映射关系建立模块,用于建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
可选地,若所述网络社交平台为微博,则所述第一获取模块,包括:
第一发布子模块,用于在所述网络社交平台发布携带所述待监测网站的统一资源定位符URL的信息;
第一获取子模块,用于获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源URL;
提取子模块,用于从所述访问来源URL中提取所述用户在所述网络社交平台注册的唯一身份标识。
可选地,所述网络社交平台为所述待监测网站的微信公众号,则所述第一获取模块包括:
第二发布子模块,用于在所述网络社交平台上发布携带所述待监测网站的URL的信息;
第二获取子模块,用于获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源信息;
第三获取子模块,用于从所述访问来源信息中获取所述用户的openid,所述openid用于表征微信帐号针对微信公众号的唯一身份标识。
可选地,若所述唯一身份标识是微信用户的openid,则所述装置还包括:
第二获取模块,用于获取用户访问所述待监测网站产生的当前cookie数据;
标识生成模块,用于利用所述当前cookie数据生成所述待监测网站对应的微信公众号的唯一标识;
第二获取模块,用于当检测到所述用户通过所述唯一标识关注所述微信公众号的关注事件时,从所述关注事件中获取所述唯一标识所携带的cookie数据及所述用户的openid;
第二映射关系建立模块,用于建立所述cookie数据与所述openid之间的映射关系。
借由上述技术方案,本发明提供的网站监测数据获取方法,当用户通过网络社交平台访问待监测网站时,获取此次访问产生的cookie数据,以及该用户在所述网络社交平台上的唯一身份标识;然后,建立该cookie数据与该用户的唯一身份标识之间的映射关系。根据该映射关系,能够找到同一个唯一身份标识所对应的cookie数据,从而找到属于同一用户的不同cookie数据。通过不同的cookie数据能够推测用户的兴趣爱好,以及,对哪种类型的内容感兴趣,从而丰富用户的属性画像,为下一步进行精准推送提供数据支持。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例一种网站监测数据获取方法的流程图;
图2示出了本发明实施例另一种网站监测数据获取方法的流程图;
图3示出了本发明实施例又一种网站监测数据获取方法的流程图;
图4示出了本发明实施例再一种网站监测数据获取方法的流程图;
图5示出了本发明实施例一种网站监测数据获取装置的框图;
图6示出了本发明实施例一种第一获取模块的框图;
图7示出了本发明实施例另一种第一获取模块的框图;
图8示出了本发明实施例另一种网站监测数据获取装置的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参见图1,示出了本发明实施例一种网站监测数据获取方法的流程图,该方法应用于网站监测方中,网站监测方在待监测网站上部署监测软件,当有用户访问该待监测网站时,监测软件能够获得此次访问产生的cookie数据。
如图1所示,该方法可以包括:
S110,获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在该网络社交平台上的唯一身份标识。
Cookie是客户端技术,程序把每个用户的数据以cookie的形式写给用户各自的浏览器。当用户使用浏览器再去访问服务器中的web资源时,就会带着各自的数据去。
当用户访问待监测网站时,会产生相应的cookie数据,网站监测方通过待监测网站上部署的监测软件能够获得该cookie数据。
如果用户是某网络社交平台的注册用户,且该网络社交平台上发布有包含待监测网站URL的信息,用户通过信息中的URL访问待监测网站时,监测软件能够获取此次访问所产生的cookie数据及访问来源信息(例如,访问来源URL),从访问来源信息获得该用户在该网络社交平台上的唯一身份标识。
例如,微博用户的个人微博页面上显示一条广告信息,且该广告信息中包含商品的URL,该微博用户点击该URL后,从当前页面跳转到URL所指示的页面;如果该URL所指示的网站部署有监测软件,则监测软件能够获取此次访问产生的cookie数据,以及,该用户的微博帐号(即,该用户在微博平台上的唯一身份标识)。
S120,建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
获得用户当前访问对应的cookie数据及该用户在网络社交平台上的唯一身份标识后,建立该cookie数据与该唯一身份标识之间的映射关系,这样,用户通过网络社交平台访问待监测网站所产生的不同cookie数据都能与具体的用户对应上。从而,确定出同一用户在不同时间段访问该网站时产生的cookie数据,使不同cookie数据互联。
本发明提供的网站监测数据获取方法,当用户通过网络社交平台访问待监测网站时,获取此时访问产生的cookie数据,以及该用户在该网络社交平台上的唯一身份标识;然后,建立该cookie数据与该用户的唯一身份标识之间的映射关系。根据该映射关系,能够找到同一个唯一身份标识所对应的cookie数据,从而找到属于同一用户的不同cookie数据。通过不同的cookie数据能够推测用户的兴趣爱好,以及,对哪种类型的内容感兴趣,从而丰富用户的属性画像,为下一步进行精准推送提供数据支持。
请参见图2,示出了本发明实施例另一种网站监测数据获取方法的流程图,本实施例以网络社交平台是微博为例进行说明。
如图2所示,网站A为待监测网站,网站监测方在网站A上部署有监测软件,通过该监测软件获取访客访问网站A的访问行为;网络社交平台为微博网站,用户C为微博用户。
如图2所示,该方法包括以下步骤:
S210,网站A在微博上发布一条广告信息,该广告信息中携带网站A的链接。
例如,网站A在其官网微博上发布了一条广告信息(例如,商品、服务等广告),关注网站A的官网微博的微博用户能够看到该广告信息;或者,网站A向微博用户推送了一条广告信息,被推送该广告信息的微博用户都能够看到该广告信息。
S220,用户C在自己的微博页面上点击网站A发布的链接,从微博页面跳转到网站A的页面。
S230,网站监测方通过网站A上的监测软件,获取用户C访问网站A时产生的cookie_A数据和访问来源URL。
网站监测方在网站A上部署有监测软件,因此,网站监测方能够获取用户C访问网站A的cookie_A和访问来源URL。
S240,网站监测方从访问来源URL中提取获得用户C的weiboid_C。
由于用户C是从微博页面跳转到网站A,因此,该访问来源URL是用户C在微博页面时的URL,该URL中包含用户C的weiboid,即用户C的微博帐号。
需要说明的是,如果用户C在好友的微博页面上点击了网站A的链接,则访问来源URL里包含的weiboid不是用户C的,此时就不能提取访问来源URL中的weiboid作为用户C的weiboid。为了识别访问来源URL中的weiboid是否是当前访问用户的,利用微博URL的特性,如果访问来源URL中带有“/home/”字符,则该weiboid就是当前访问网站A的用户对应的weiboid,而不是其他人的weiboid。
S250,网站监测方建立cookie_A与weiboid_C之间的映射关系。
S260,过一段时间后,当用户C再次通过微博页面上的链接访问网站A时,产生cookie_B数据。
Cookie数据的生命周期很短暂,当用户C上一次访问网站A产生的cookie_A数据生命周期结束时,该cookie_A数据失效。用户C本次再访问网站A时,会产生新的cookie_B数据。
S270,网站监测方获取用户C访问网站A产生的cookie_B数据,以及用户C的weiboid_C。
S280,网站监测方建立cookie_B与weiboid_C之间的映射关系,并确定cookie_A与cookie_B是同一个用户的访问数据。
S290,网站监测方根据weiboid_C利用爬虫爬取用户C的微博数据。
微博数据主要包括该用户在微博社交平台上公开的个人信息,例如,性别、年龄、学校、兴趣爱好等信息。
S2100,网站监测方根据用户C的cookie数据及微博数据,建立用户C的属性画像。
本实施例提供的网站监测数据获取方法,待监测网站在微博上发布包含网站链接的信息,当微博用户点击该链接跳转到待监测网站时,网站数据监测方就能够获得当前访问的cookie数据及用户C的weiboid,建立该cookie数据与weiboid之间的映射关系。利用weiboid的唯一标识特性,能够找到同一用户通过微博网站访问待监测网站时产生的不同cookie数据。而且,获得用户的weiboid后,还可以利用爬虫爬取到用户更多的微博数据,以便获得更多的用户信息完善用户的兴趣图像,为下一步精准推送提供数据支持。
请参见图3,示出了本发明实施例又一种网站监测数据获取方法的流程图,本实施例以网络社交平台是微信为例进行说明。
网站A为待监测网站,网站监测方在网站A上部署有监测软件,网站监测方通过该监测软件能够监测到访客访问网站A的访问行为。网络社交平台为网站A的微信公众号,用户C为微信用户。
如果用户C已经关注网站A的微信公众号,则该方法包括以下步骤:
S310,网站A在其微信公众号页面发布了一条广告信息,该广告信息中携带网站A的链接。
S320,用户C在该微信公众号页面点击该广告信息中的链接,从微信页面跳转到网站A的页面。
S330,网站监测方通过网站A上部署的监测软件,获取用户C访问网站A的cookie_A数据和用户微信帐号的openid。
Openeid是微信帐号针对每个微信公众号的唯一标识。
S340,网站监测方建立该cookie_A与openid的映射关系。
S350,过一段时间后,用户C再次通过该微信公众号上的链接访问网站A时,产生cookie_B数据。
S360,网站监测方获取cookie_B数据及用户C的openid,并建立cookie_B与openid之间的映射关系。
S370,网站监测方确定cookie_A与cookie_B是同一用户的访问数据。
S380,网站A得到获取用户C微信公开信息的权限后,获取用户C的微信公开信息。
微信公开信息包括用户在微信平台上公开的昵称、头像、个人信息等信息。
当微信用户通过微信页面访问某个网站时,该网站会请求获取该微信用户公开信息的权限,如果用户授权,则该网站能够通过该微信用户的openid从微信服务器上获取该用户的微信公开信息。
S390,网站监测方根据用户C的cookie数据及微信公开信息,建立用户C的属性画像。
以上步骤只针对已经关注网站A的微信公众号的用户,通过该微信公众号访问网站A的场景。
本实施例提供的网站监测数据获得方法,当微信用户通过待监测网站的微信公众号上的链接访问待监测网站时,获取微信用户的访问cookie及该微信用户的openid。然后,建立cookie与openid之间的映射关系。利用该方法能够找到属于同一用户的不同cookie数据。。通过不同的cookie数据能够推测用户的不同属性,例如,性别、年龄、兴趣爱好,对哪种类型的内容感兴趣等,从而丰富用户的属性画像,为下一步进行精准推送提供数据支持。
在另一应用场景下,用户C没有关注网站A的微信公众号,并直接访问网站A,可以通过以下方法获取用户C的openid,并建立该openid与当前访问产生的cookie数据之间的映射关系。
请参见图4,示出了本发明实施例再一种网站监测数据获取方法的流程图,本实施例应用于用户C没有关注网站A的微信公众号,并直接访问网站A场景中。网站监测方在网站A上部署监测软件,同时,网站监测方利用微信第三方开发者公众号托管技术接管网站A的微信公众号,即网站监测方能够同时监测网站A及网站A的微信公众号。
如图4所示,该方法可以包括以下步骤:
S410,网站A获取用户C直接访问网站A时所产生的cookie_A数据。
S420,网站A利用该cookie_A数据生成网站A的微信公众号对应的唯一标识并展示,该唯一标识携带cookie_A数据。
当用户C直接访问网站A时,网站A利用当前访问产生的cookie_A作为参数生成网站A对应微信公众号的二维码,显示在网站A的首页上。
S430,当用户C通过该唯一标识关注该微信公众号后,网站监测方接收微信服务器返回的包含用户C的openid和cookie_A的公众号关注信息。
如果用户C访问网站A的同时扫描该二维码关注网站A的微信公众号,则网站监测方能够接收微信服务器返回的用户C关注该微信公众号的信息,该信息中包含用户C的openid和cookie_A数据。
S440,网站监测方建立该openid与该cookie_A之间的映射关系。
本实施例提供的网站监测数据获取方法,网站监测方能够建立微信用户在访问网站A,同时,关注网站A的微信公众号的过程中所产生的cookie数据与微信用户的openid之间的映射关系。
相应于上述的网站监测数据获取方法实施例,本发明还提供了网站监测数据获取装置实施例。
请参见图5,示出了本发明实施例一种网站监测数据获取装置的框图,该装置应用于网站监测方,在待监测网站上部署监测软件,网站监测方通过该监测软件获取访客访问该待监测网站的访问行为(例如,访问会话产生的cookie数据)。
如图5所示该装置包括:第一获取模块510和第一映射关系建立模块520。
第一获取模块510,用于获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在该网络社交平台上的唯一身份标识。
待监测网站在网络社交平台上发布包含待监测网站链接的信息,当用户在该网络社交平台上点击该信息中的链接后,从该网络社交平台跳转到待监测网站,网站监测方通过部署在待监测网站上的监测软件获取当前用户访问待监测网站所产生的cookie数据。同时,获取用户在该网络社交平台上的唯一身份标识。
在本发明一种应用场景中,网络社交平台为微博社交平台。
此种应用场景下,如图6所示,第一获取模块510包括:第一发布子模块511、第一获取子模块512和提取子模块513。
第一发布子模块511,用于在微博上发布携带所述待监测网站的统一资源定位符URL的信息。
第一获取子模块512,用于获取用户通过所述待监测网站的URL访问该待监测网站产生的cookie数据及访问来源URL。
提取子模块513,用于从访问来源URL中提取所述用户在网络社交平台上注册的唯一身份标识。
在本发明另一种应用场景,网络社交平台为所述待监测网站的微信公众号,如图7所示,如果微信用户已经关注待监测网站的微信公众号,则所述第一获取模块510包括:第二发布子模块514、第二获取子模块515和第三获取子模块516。
第二发布子模块514,用于在待监测网站的微信公众号上发布携带该待监测网站URL的信息;
第二获取子模块515,用于获取用户通过待监测网站的URL访问该待监测网站产生的cookie数据及访问来源信息;
第三获取子模块516,用于从所述访问来源信息中获取该用户的openid,所述openid用于表征微信帐号针对微信公众号的唯一身份标识。
第一映射关系建立模块520,用于建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
优选地,在获得用户的唯一标识信息后,可以利用该唯一身份标识获取该用户的个人公开信息,例如,利用用户的微博帐号从微博服务器中爬取该用户的个人公开信息,例如,性别、年龄等;或者,利用用户的微信帐号openid从微信服务器中获取个人公开信息。根据该用户对应的cookie数据和个人公开信息完善用户的属性画像。
本实施例提供的网站监测数据获取装置,当用户通过网络社交平台访问待监测网站时,获取此次访问产生的cookie数据,以及该用户在该网络社交平台上的唯一身份标识;然后,建立该cookie数据与该用户的唯一身份标识之间的映射关系。根据该映射关系,能够找到同一个唯一身份标识所对应的cookie数据,从而找到属于同一用户的不同cookie数据。通过不同的cookie数据能够推测用户的兴趣爱好,以及,对哪种类型的内容感兴趣,从而丰富用户的属性画像,为下一步进行精准推送提供数据支持。
在本发明的另一种应用场景下,用户直接访问待监测网站,然后才关注该待监测网站的微信公众号,此种应用场景下,如图8所示,该网站监测数据获取装置还可以包括:第二获取模块810、标识生成模块820、第三获取模块830和第二映射关系建立模块840。
第二获取模块810,用于获取用户访问所述待监测网站产生的当前cookie数据。
标识生成模块820,用于利用所述当前cookie数据生成所述待监测网站对应的微信公众号的唯一标识。
第三获取模块830,用于当检测到所述用户通过所述唯一标识关注所述微信公众号的关注事件时,从所述关注事件中获取所述唯一标识所携带的cookie数据及所述用户的openid。
第二映射关系建立模块840,用于建立所述cookie数据与所述openid之间的映射关系。
本实施例提供的网站监测数据获取装置,网站监测方能够建立微信用户在访问网站A,同时,关注网站A的微信公众号的过程中所产生的cookie数据与微信用户的openid之间的映射关系。
所述网站监测数据获取装置包括处理器和存储器,上述第一获取模块510、第一映射关系建立模块520,以及,第二获取模块810、标识生成模块820、第三获取模块830和第二映射关系建立模块840等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来建立cookie数据与用户的唯一身份标识之间的映射关系,得到同一用户的不同cookie数据。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本实施例提供的网站监测数据获取装置,当用户通过网络社交平台访问待监测网站时,获取此时访问产生的cookie数据,以及该用户在网络社交平台上的唯一身份标识;然后,建立该cookie数据与该用户的唯一身份标识之间的映射关系。根据该映射关系,能够找到同一个唯一身份标识所对应的cookie数据,从而找到属于同一用户的不同cookie数据。通过不同的cookie数据能够推测用户的兴趣爱好,以及,对哪种类型的内容感兴趣,从而丰富用户的属性画像,为下一步进行精准推送提供数据支持。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:
获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在该网络社交平台上的唯一身份标识;
建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种网站监测数据获取方法,其特征在于,包括:
获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识;
建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
2.根据权利要求1所述的方法,其特征在于,若所述网络社交平台为微博,则所述获取用户通过网络社交平台访问待监测网站的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识,包括:
在所述网络社交平台发布携带所述待监测网站的统一资源定位符URL的信息;
获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源URL;
从所述访问来源URL中提取所述用户在所述网络社交平台注册的唯一身份标识。
3.根据权利要求2所述的方法,其特征在于,所述从所述访问来源URL中提取所述用户在所述网络社交平台上的唯一身份标识,包括:
利用正则表达式判断所述访问来源URL中是否包含“/home/”字符;
当所述访问来源URL中包含“/home/”字符时,从所述访问来源URL中提取出唯一身份标识信息,并确定为当前访问所述待监测网站的用户的唯一身份标识信息。
4.根据权利要求1所述的方法,其特征在于,若所述网络社交平台为所述待监测网站的微信公众号,则所述获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识,包括:
在所述待监测网络的微信公众号上发布携带所述待监测网站的URL的信息;
获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源信息;
从所述访问来源信息中获取所述用户的openid,所述openid用于表征微信帐号针对微信公众号的唯一身份标识。
5.根据权利要求1所述的方法,其特征在于,若所述唯一身份标识是微信用户的openid,则所述方法还包括:
获取用户访问所述待监测网站产生的当前cookie数据;
利用所述当前cookie数据生成所述待监测网站对应的微信公众号的唯一标识;
当检测到所述用户通过所述唯一标识关注所述微信公众号的关注事件时,从所述关注事件中获取所述唯一标识所携带的cookie数据及所述用户的openid;
建立所述cookie数据与所述openid之间的映射关系。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
利用所述用户的唯一身份标识,获取所述用户的用户信息;
根据所述用户对应的不同cookie数据及所述用户信息,创建所述用户的属性画像。
7.一种网站监测数据获取装置,其特征在于,包括:
第一获取模块,用于获取用户通过网络社交平台访问待监测网站产生的cookie数据,以及所述用户在所述网络社交平台上的唯一身份标识;
第一映射关系建立模块,用于建立所述cookie数据与所述用户的唯一身份标识之间的映射关系,得到同一用户对应的不同cookie数据。
8.根据权利要求7所述的装置,其特征在于,若所述网络社交平台为微博,则所述第一获取模块,包括:
第一发布子模块,用于在所述网络社交平台发布携带所述待监测网站的统一资源定位符URL的信息;
第一获取子模块,用于获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源URL;
提取子模块,用于从所述访问来源URL中提取所述用户在所述网络社交平台注册的唯一身份标识。
9.根据权利要求7所述的装置,其特征在于,若所述网络社交平台为所述待监测网站的微信公众号,则所述第一获取模块包括:
第二发布子模块,用于在所述网络社交平台上发布携带所述待监测网站的URL的信息;
第二获取子模块,用于获取所述用户通过所述待监测网站的URL访问所述待监测网站产生的cookie数据及访问来源信息;
第三获取子模块,用于从所述访问来源信息中获取所述用户的openid,所述openid用于表征微信帐号针对微信公众号的唯一身份标识。
10.根据权利要求7所述的装置,其特征在于,若所述唯一身份标识是微信用户的openid,则所述装置还包括:
第二获取模块,用于获取用户访问所述待监测网站产生的当前cookie数据;
标识生成模块,用于利用所述当前cookie数据生成所述待监测网站对应的微信公众号的唯一标识;
第二获取模块,用于当检测到所述用户通过所述唯一标识关注所述微信公众号的关注事件时,从所述关注事件中获取所述唯一标识所携带的cookie数据及所述用户的openid;
第二映射关系建立模块,用于建立所述cookie数据与所述openid之间的映射关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611089463.5A CN108134760A (zh) | 2016-11-30 | 2016-11-30 | 网站监测数据获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611089463.5A CN108134760A (zh) | 2016-11-30 | 2016-11-30 | 网站监测数据获取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108134760A true CN108134760A (zh) | 2018-06-08 |
Family
ID=62387496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611089463.5A Pending CN108134760A (zh) | 2016-11-30 | 2016-11-30 | 网站监测数据获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108134760A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357903A (zh) * | 2017-07-14 | 2017-11-17 | 泰康保险集团股份有限公司 | 用户行为数据整合方法、装置及电子设备 |
CN109597948A (zh) * | 2018-10-17 | 2019-04-09 | 深圳壹账通智能科技有限公司 | 访问url链接的方法、系统及存储介质 |
CN110417869A (zh) * | 2019-07-05 | 2019-11-05 | 广州华多网络科技有限公司 | 一种活动推送方法、装置及计算机设备 |
CN110955847A (zh) * | 2018-09-26 | 2020-04-03 | 北京国双科技有限公司 | 一种信息处理方法、装置、存储介质及处理器 |
CN110971644A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 一种页面访问监测方法及装置 |
CN111683146A (zh) * | 2020-06-08 | 2020-09-18 | 北京明略昭辉科技有限公司 | 跳转指令的处理方法、装置和电子设备 |
CN112884505A (zh) * | 2021-02-03 | 2021-06-01 | 北京百家科技集团有限公司 | 用户行为预测方法、装置、计算机设备以及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101242307A (zh) * | 2008-02-01 | 2008-08-13 | 刘峰 | 用嵌入代码代理日志实现网站访问分析系统与方法 |
CN102710755A (zh) * | 2012-05-18 | 2012-10-03 | 华为技术有限公司 | 终端用户社交网的数据挖掘方法、相关方法、装置和系统 |
CN103179188A (zh) * | 2013-01-17 | 2013-06-26 | 北京亿赞普网络技术有限公司 | 用户识别方法和装置 |
CN105391796A (zh) * | 2015-12-01 | 2016-03-09 | 小米科技有限责任公司 | 基于社交平台的信息推送方法、装置和服务器 |
US20160277481A1 (en) * | 2013-12-31 | 2016-09-22 | Tencent Technology (Shenzhen) Company Limited | Data transferring method, device and system thereof |
CN106033579A (zh) * | 2015-03-16 | 2016-10-19 | 北京国双科技有限公司 | 数据处理方法和装置 |
-
2016
- 2016-11-30 CN CN201611089463.5A patent/CN108134760A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101242307A (zh) * | 2008-02-01 | 2008-08-13 | 刘峰 | 用嵌入代码代理日志实现网站访问分析系统与方法 |
CN102710755A (zh) * | 2012-05-18 | 2012-10-03 | 华为技术有限公司 | 终端用户社交网的数据挖掘方法、相关方法、装置和系统 |
CN103179188A (zh) * | 2013-01-17 | 2013-06-26 | 北京亿赞普网络技术有限公司 | 用户识别方法和装置 |
US20160277481A1 (en) * | 2013-12-31 | 2016-09-22 | Tencent Technology (Shenzhen) Company Limited | Data transferring method, device and system thereof |
CN106033579A (zh) * | 2015-03-16 | 2016-10-19 | 北京国双科技有限公司 | 数据处理方法和装置 |
CN105391796A (zh) * | 2015-12-01 | 2016-03-09 | 小米科技有限责任公司 | 基于社交平台的信息推送方法、装置和服务器 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357903A (zh) * | 2017-07-14 | 2017-11-17 | 泰康保险集团股份有限公司 | 用户行为数据整合方法、装置及电子设备 |
CN107357903B (zh) * | 2017-07-14 | 2020-03-17 | 泰康保险集团股份有限公司 | 用户行为数据整合方法、装置及电子设备 |
CN110955847A (zh) * | 2018-09-26 | 2020-04-03 | 北京国双科技有限公司 | 一种信息处理方法、装置、存储介质及处理器 |
CN110955847B (zh) * | 2018-09-26 | 2023-08-25 | 北京国双科技有限公司 | 一种信息处理方法、装置、存储介质及处理器 |
CN110971644A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 一种页面访问监测方法及装置 |
CN109597948A (zh) * | 2018-10-17 | 2019-04-09 | 深圳壹账通智能科技有限公司 | 访问url链接的方法、系统及存储介质 |
CN110417869A (zh) * | 2019-07-05 | 2019-11-05 | 广州华多网络科技有限公司 | 一种活动推送方法、装置及计算机设备 |
CN111683146A (zh) * | 2020-06-08 | 2020-09-18 | 北京明略昭辉科技有限公司 | 跳转指令的处理方法、装置和电子设备 |
CN111683146B (zh) * | 2020-06-08 | 2022-11-11 | 北京明略昭辉科技有限公司 | 跳转指令的处理方法、装置和电子设备 |
CN112884505A (zh) * | 2021-02-03 | 2021-06-01 | 北京百家科技集团有限公司 | 用户行为预测方法、装置、计算机设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108134760A (zh) | 网站监测数据获取方法及装置 | |
TWI515588B (zh) | Machine behavior determination method, web browser and web server | |
US10043199B2 (en) | Method, device and system for publishing merchandise information | |
TW201513019A (zh) | 基於用戶行爲的特徵提取、個性化推薦方法和系統 | |
CN106649316A (zh) | 一种视频推送方法及装置 | |
US9865008B2 (en) | Determining a configuration of a content item display environment | |
CN108256888B (zh) | 落地页的获取方法、网站服务器以及网络广告监测系统 | |
CN109450879A (zh) | 用户访问行为监控方法、电子装置和计算机可读存储介质 | |
US20150302466A1 (en) | Data determination method and device for a thermodynamic chart | |
CN104965863B (zh) | 一种对象聚类方法和装置 | |
CN107103062A (zh) | 一种网页推荐方法及系统 | |
WO2013073377A1 (ja) | 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム | |
CN107562613A (zh) | 程序测试方法、装置及系统 | |
KR20190097879A (ko) | 마케팅 플랫폼 시스템과, 이를 이용한 소셜 네트워크 기반 광고 방법 및 컴퓨터 프로그램 | |
WO2014139057A1 (en) | Method and system for providing personalized content | |
CN109034867A (zh) | 点击流量检测方法、装置及存储介质 | |
CN109598171A (zh) | 一种基于二维码的数据处理方法、装置及系统 | |
CN108280560A (zh) | 一种对象评价防刷方法及装置 | |
CN108268491A (zh) | 热力图生成方法及装置 | |
JP2018156238A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
TWI398821B (zh) | A provider, a provider, a provider, and a computer-readable recording medium that memorizes its program | |
CN109062799A (zh) | 广告场景的回归测试方法、装置及系统 | |
US9311285B2 (en) | Curating chat transcripts into webpages | |
CN108932640A (zh) | 用于处理订单的方法和装置 | |
CN106682931A (zh) | 营销信息的显示方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180608 |
|
RJ01 | Rejection of invention patent application after publication |