CN107357903B - 用户行为数据整合方法、装置及电子设备 - Google Patents

用户行为数据整合方法、装置及电子设备 Download PDF

Info

Publication number
CN107357903B
CN107357903B CN201710575750.5A CN201710575750A CN107357903B CN 107357903 B CN107357903 B CN 107357903B CN 201710575750 A CN201710575750 A CN 201710575750A CN 107357903 B CN107357903 B CN 107357903B
Authority
CN
China
Prior art keywords
user
identity information
behavior data
data
website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710575750.5A
Other languages
English (en)
Other versions
CN107357903A (zh
Inventor
程战战
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Online Property Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201710575750.5A priority Critical patent/CN107357903B/zh
Publication of CN107357903A publication Critical patent/CN107357903A/zh
Application granted granted Critical
Publication of CN107357903B publication Critical patent/CN107357903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及用户行为数据整合方法、装置及电子设备,方法包括:响应于用户访问网站所包含的网页,获取用户所采用的终端设备的身份信息,记录用户访问网页的行为数据,根据终端设备的身份信息对用户访问网页的行为数据进行整合得到第一整合数据;响应于用户登陆网站,根据用户登陆网站时的登陆信息获取用户的身份信息,记录用户登陆网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与用户的身份信息关联,合并与用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;对所述第一整合数据和所述第二整合数据进行合并。本申请的技术方案能够全面整合用户在成为网站注册会员前后、以及成为网站注册会员后登陆网站前后的行为数据。

Description

用户行为数据整合方法、装置及电子设备
技术领域
本申请涉及计算机应用技术领域,具体而言,涉及用户行为数据整合方法、装置及电子设备。
背景技术
随着WEB信息的日益增长,人们不得不花费大量的时间去搜索、浏览自己需要的、感兴趣的信息。一般来说,用户浏览网站时的行为与用户的需要和兴趣点密切相关。根据用户的浏览习惯等行为数据进行个性化的资源推荐,成为个性服务领域的研究热点。
而目前大部分网站不需要用户注册和登陆,对于静态html页面来说,现有的相关技术无法识别用户并记录用户行为。
发明内容
本申请公开了一种用户行为数据整合方法,能够在用户未注册和登陆的情况下获得用户对网站访问时的行为数据。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供一种用户行为数据整合方法,包括:
响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;
响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;
对所述第一整合数据和所述第二整合数据进行合并。
根据本发明的一些实施例,对所述第一整合数据和所述第二整合数据进行合并包括:
根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并。
根据本发明的一些实施例,根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息包括:在所述用户登陆所述网站后,响应于所述用户访问所述网页,获取所述用户所采用的终端设备的身份信息,并将终端设备的身份信息与所述用户的身份信息关联。。
根据本发明的一些实施例,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并包括:将所述用户的身份信息所关联的所述第二整合数据,与根据所整合的终端设备的身份信息所整合得到的所述第一整合数据进行合并。
根据本发明的一些实施例,在根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息之后还包括:根据用户的身份信息,获取用户在多个终端设备上登陆网站后访问网页的行为数据,整合得到第二整合数据。
根据本发明的一些实施例,所述根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据还包括:根据所述终端设备身份信息判断该终端设备为私密设备,将该终端设备上的所述用户登陆前的访问行为数据整合入所述第一整合数据。
根据本发明的一些实施例,所述方法还包括:根据所述终端设备身份信息判断该终端设备为公用终端设备或至少二个以上用户在所述终端设备上进行登陆,将所述终端设备上所述用户登陆前的访问行为数据排除在所述第一整合数据之外。
如通过该终端设备身份信息判断该终端设备为手机、IPAD或个人笔记本等私密设备,则可进一步将该终端设备上的用户未登陆前的访问行为数据整合入该客户第一整合数据中。如判断该终端设备为公用计算机或该终端设备上曾有二个以上用户登陆行为,则该终端设备上用户未登陆前的访问行为数据排除该客户第一整合数据之外。
根据本发明的一些实施例,响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据包括:
在所述网页中分别插入链接地址,其中,所述链接地址指向预定服务器上的文件;
响应于所述用户访问所述网页,所述网页向所述预定服务器发送数据请求从而触发所述预定服务器生成访问日志,所述访问日志中包括所述用户所采用的终端设备的身份信息;
根据所述访问日志获取并记录所述用户的行为数据。
根据本发明的一些实施例,所述链接地址还包括用于记录所述用户在所述网页上的访问轨迹的统一资源定位地址URL插件参数。
根据本发明的一些实施例,所述预定服务器上的文件包括JAVA脚本JS文件,所述JS文件至少包括用于为访问所述网页的用户分配唯一的用户标识的脚本行。
根据本发明的一些实施例,所述预定服务器上的文件包括大小为一个字节像素为0的图片。
根据本发明的一些实施例,所述服务器为Nginx服务器。
根据本发明的一些实施例,所述行为数据包括输入信息、点击信息、访问时间、访问时长、以及浏览路径中的至少一项。
根据本发明的一些实施例,所述用户所采用的终端设备的身份信息包括所述用户所采用的终端设备的IP地址、MAC地址或浏览器cookie给终端设备分配的唯一识别码。
根据本发明的一些实施例,所述方法还包括,根据整合后的行为数据对所述用户的行为进行分析,根据用户的行为分析所述网页的价值,以得到销售线索。
根据本发明的一些实施例,记录所述用户访问所述网页的行为数据包括:记录所述用户在登陆所述网站前访问所述多个网页的行为数据。
根据本发明实施例的第二方面,提供一种用户行为数据整合装置,其包括:
第一整合数据获取单元,用于响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;
第二整合数据获取单元,用于响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;
数据合并单元,用于对所述第一整合数据和所述第二整合数据进行合并。
根据本发明实施例的第三方面,提供一种电子设备,包括:
处理器;存储器,用于存储程序,当所述程序被所述处理器执行时,使得所述处理器实现如上述第一方面任一项所述的方法。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面任一项所述方法的步骤。
本发明的实施例所提供的技术方案可以包括以下有益效果:
本发明的实施例提供的技术方案通过将用户访问网站的行为数据根据终端设备的身份信息进行整合,以及将用户登陆网站后的访问行为数据与其身份信息关联进行整合,再将两者合并,一方面能够实现无论用户是否登陆网站,均可全面整合用户对网站访问时的行为数据,另一方面在用户成为网站的注册会员时能够立即获取到该用户注册前的行为数据,为得到网站新会员的销售线索提供数据基础。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明一实施例的用户行为数据整合方法;
图2示出了根据本发明一实施例的记录用户访问网页的行为数据的方法;
图3示出了根据本发明另一实施例的技术方案示意图;
图4示出了根据本发明一实施例的用户行为数据整合装置的框图;
图5示出了根据本发明一实施例的电子设备。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明一实施例的用户行为数据整合方法,本实施例可适用于网站服务器收集用户访问网页的行为数据的情况,如图1所示,本实施例所述的用户行为数据整合方法包括:
在步骤S110中,响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据。
需要说明的是,所述行为数据为用户访问所述网页时信息,例如可以是输入信息、点击信息、访问时间、访问时长、以及浏览路径等,其具体内容对用户行为数据进行整合的目标确定。
其中,所述用户所采用的终端设备的身份信息用于区识不同的终端设备,只要能标识终端设备的唯一性,并且能在用户访问网站时获取到即可。例如可以是终端设备的IP地址、MAC地址或浏览器cookie给终端设备分配的唯一识别码等。
所述终端设备是指能用于访问网站所包含的网页的计算机,包括但不限于PC机、手机、平板电脑等。
需要说明的是,本步骤中,记录所述用户访问所述网页的行为数据,可以是记录所述用户在登陆所述网站前访问所述多个网页的行为数据,也可以是记录所述用户访问所述多个网页的所有行为数据。
本步骤在于将访问所述网站的用户的行为数据记录下来,并按照终端设备的身份信息(例如IP地址或MAC地址)进行整合分组。
需要说明的是,现实应用场景中存在同一用户拥有多个终端设备,通过多个终端设备访问所述网站的情况,例如存在用户分别用手机和PC机访问所述网站的情况。因此本步骤中,获取所述用户所采用的终端设备的身份信息,可包括一个终端设备的身份信息,也可包括两个或两个以上的终端设备的身份信息。因此,本步骤中,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到的第一整合数据,可以是根据一个或一个以上的终端设备进行整合得到的。
在步骤S120中,响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据。
在步骤S130中,对所述第一整合数据和所述第二整合数据进行合并。
本步骤主要用于将根据用户所采用的终端设备的身份信息整合的行为数据,和根据登陆网站后的访问行为数据进行合并,以达到将同一用户访问所述网站的所有行为数据进行合并。具体地,进行数据合并可采用多种方式,例如可采用以下方式:根据所述用户的身份信息整合所述用户所使用的一个或多个终端设备的身份信息,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并。当同一用户分别使用不同终端设备进行登陆时,本发明提供的方法、装置及电子设备可获取该用户在该多个不同终端设备中的访问行为数据并整合为第二整合数据。如通过该终端设备身份信息判断该终端设备为手机、IPAD或个人笔记本等私密设备,则可进一步将该终端设备上的用户未登陆前的访问行为数据整合入该客户第一整合数据中。如判断该终端设备为公用计算机或该终端设备上曾有二个以上用户登陆行为,则该终端设备上用户未登陆前的访问行为数据排除在该客户第一整合数据之外。
其中根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息,可具体通过在所述用户登陆所述网站后,响应于所述用户访问所述网页,获取所述用户所采用的终端设备的身份信息。
其中,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并,可具体通过将所述用户的身份信息所关联的所述第二整合数据,与根据所整合的终端设备的身份信息所整合得到的所述第一整合数据进行合并。
至此,就能获得用户访问网站的所有行为数据,包括用户注册成网站会员之前的行为数据和注册成网站会员之后的行为数据。需要说明的是,其中注册成网站会员之后的行为数据,包括用户注册成网站会员之后以会员身份登陆网站之后的行为数据和用户注册成网站会员之后不以会员身份访问网站(包括但不限于以匿名身份访问网站和以游客身份访问网站)时对应的行为数据。
本领域普通技术人员需要明确的是,通过步骤S110得到的第一整合数据,以及通过步骤S120得到的第二整合数据都是该用户访问所述网站的行为数据。本实施例并不限定步骤S110和步骤S120的执行顺序,步骤S110和步骤S120并没有严格的执行顺序。
本实施例提供的技术方案通过将用户访问网站的行为数据根据终端设备的身份信息进行整合,以及将用户登陆网站后的访问行为数据与其身份信息关联进行整合,再将两者合并,一方面能够实现无论用户是否登陆网站,均可全方位整合用户对网站访问时的行为数据,另一方面在用户成为网站的注册会员时能够立即获取到该用户注册前的行为数据,为得到网站新会员的销售线索提供数据基础。
进一步地,在对所述第一整合数据和所述第二整合数据进行合并之后,还可根据整合后的行为数据对所述用户的行为进行分析,根据用户的行为分析所述网页的价值,以得到销售线索。
对于上述实施例中,记录用户访问网页的行为数据可通过多种方式实现,图2示出了根据本发明一实施例的记录用户访问网页的行为数据的一种实施方式,如图2所示,本实施例所述的记录用户访问网页的行为数据的方法包括:
在步骤S210中,在所述网页中分别插入链接地址,其中,所述链接地址指向预定服务器上的文件。
需要说明的是,所述预定服务器可以设置成为用户行为数据整合专用服务器,可将所述预定服务器仅用于存储所述网页元素和记录访问日志,以根据日志对用户进行跟踪分析时,避免对日志进行筛选。
例如,可通过将待插入到网页中的网页元素单独存放在一个域下的服务器中,称之为预定服务器。由于所述网页元素的链接地址指向所述预定服务器,因此用户访问所述网页时,会向所述预定服务器发送数据请求,触发所述预定服务器生成访问日志。本领域普通技术人员需要明确的是,实际应用中,可在目标网站的所有网页上均插入指向该预定服务器的链接地址,以对访问该目上标网站的用户进行跟踪分析时,提供专用的日志资源。
鉴于Nginx具有高性能的日志存储,根据本发明的一些实施例,所述预定服务器可采用Nginx服务器。
其中,所述预定服务器上的文件可以为图片文件、JS文件等。需要说明的是,所述文件的链接地址在所述网页中起到探针作为,用于获取用户的访问线索,因此不是网页的天然组成部分,因此尽量是所述网页上不可见的元素。例如将所述预定服务器上的文件设置为大小为一个字节像素为0的图片。
根据本发明的一些实施例,所述链接地址还包括用于记录所述用户在所述网页上的访问轨迹的统一资源定位地址URL插件参数,例如包括栏目标号、统一资源定位符URL、用户名等信息。
具体地,将所述文件在所述预定服务器上的链接地址插入到网页中,可通过第三方工具将所述文件在所述预定服务器上的链接地址插入到网页中。若收集用户行为数据依据多个目标网页,可通过第三方工具批量地将多个不同网址的预设类型文件在所述预定服务器上的链接地址,分别插入到所述多个目标网页中。
在步骤S220中,响应于所述用户访问所述网页,所述网页向所述预定服务器发送数据请求从而触发所述预定服务器生成访问日志,所述访问日志中包括所述用户所采用的终端设备的身份信息。
需要说明的是,所述访问日志中需包括访问所述网页的用户的信息。例如可包括所述用户的IP地址和所述用户访问所述文件的时间。
在步骤S230中,根据所述访问日志获取并记录所述用户的行为数据。
根据本发明的一些实施例,所述预定服务器上的文件包括JAVA脚本JS文件,所述JS文件至少包括用于为访问所述网页的用户分配唯一的用户标识的脚本行。
需要说明的是,所述网页包括但不限于静态网页。根据本发明的一些实施例,所述网页为非静态网页时,还可包含用于与访问所述网页的用户交互的接口元素。这种情况下,根据所述访问日志获取所述用户访问所述网页的行为数据时,可以从所述访问日志获取所述JS文件为所述用户分配的唯一的用户标识,根据所述用户标识获取所述用户与所述接口元素交互时的访问信息,根据所述用户标识对所述用户的访问信息进行关联,将关联后的访问信息作为所述用户访问所述网页的行为数据。
例如,所述访问信息可包括登陆信息、注册信息、输入信息、购买信息、以及浏览路径等其中的至少一项。
根据本发明的一些实施例,在根据所述访问日志获取所述用户访问所述网页的行为数据之后,还可以以所述访问日志作为线索,收集所述用户访问所述网页所在网站的行为数据。
根据本发明的一些实施例,根据所述访问日志获取所述用户访问所述网页的行为数据之后还,还可根据所述行为数据对所述用户的行为进行跟踪和分析。
例如根据用户的行为数据,选择同一个细分市场的受众,根据用户最感兴趣的类别可以很自然地将他们分成不同的群体,例如用户在相关网页上逗留15秒以上。据此分别筛选各细分市场最有价值的潜在用户,分别将各细分市场的潜在用户信息提交给对应的负责销售团队,让他们与潜在用户接触,达成销售目标。
又如还可根据用户的行为数据中生成有价值的销售线索,将所生成的销售线索提供给销售人员,以使销售人员根据该销售线索制定有利于达成销售目标的销售方向和策略,以进行精准销售。例如,分析出客户对某产品的基本的购买周期,根据客户的购买周期制定或调整有针对性的售销策略。
再如,还可根据用户的行为数据建立追踪、评分和提示体系,以分辨哪些潜在客户对销售团队来说是最佳的销售线索。对每个潜在客户都根据其行为数据进行评估,如果评估的分数达到了一定的标准,该潜在客户就会被视为适合开展销售的对象。
图3示出了根据本发明另一实施例的技术方案示意图,图3中所述的网站首页以及产品介绍页面均为静态网页,E站到家和产品列表为动态网页。如图3所示,用户浏览路径如310所示,数据采集与分析如320所示,跟踪分析如330所示。其中,用户行为合并如321所示,页面价值分析如322所示,形成销售线索如323所示。
本实施例的技术方案可概述为通过将用户访问网站的行为数据根据终端设备的身份信息进行整合,以及将用户登陆网站后的访问行为数据与其身份信息关联进行整合,再将两者合并。进一步地,在对所述第一整合数据和所述第二整合数据进行合并之后,再根据整合后的行为数据对所述用户的行为进行分析,根据用户的行为分析所述网页的价值,以得到销售线索。
其中,在将用户访问网站的行为数据根据终端设备的身份信息进行整合时,涉及到记录用户访问网页的行为数据的问题,可通过在网页中插入所述预定服务器上的文件的链接地址,所述预定服务器上的文件的链接地址指向预定服务器(本实施例以预定的Nginx服务器为例)。响应于用户访问所述网页,所述网页向所述Nginx服务器发送数据请求从而触发所述Nginx服务器生成访问日志,根据所述访问日志获取所述用户访问所述网页的行为数据。
需要说明的是,在网页中插入所述预定服务器上的文件的链接地址之后,即可从该链接地址指向的该预定服务器得到日志中用户该问该网页的用户行为数据,从而可探知用户访问该网页的情况。因此,该预定服务器上的文件的链接地址实质上起到了类似探针的作为,本实施例将该技术方案简称为“探针”技术。
本实施例通过上述“探针”技术,跟踪用户在网站的访问页面、广告等详细路径,获得用户的浏览习惯,并根据页面的类型,得到用户潜在的购买意向,然后以线索形式推送网电中心进行后续转化行为。
本实施例的核心包括“探针”的发明和扩展应用。不同的网页,在nginx服务器上放置不同的jpg图片或者js文件,不同的网页插入了有与不同的jpg图片或者js文件一一对应的链接地址。用户访问某个网页时,被访问的网页会根据链接地址向服务器发送数据,由此nginx服务器即产生一条访问日志,访问日志记录了访问者来源IP(即访问者硬件设备所在的IP地址或者MAC地址)、目标IP(即当前访问的网页IP地址)地址,停留时长等信息,通过合并同一源IP地址的日志,从而可以记录用户访问轨迹,从而确定同一源IP地址访问了哪些重要的网页以及广告,进而获得各种线索。上述方案是对同一终端设备上用户的行为进行合并,可以是用户已经登陆或者未登录状态。上述方案与用户登录账号无关。
本实施例中探针实现原理是:基于Nginx的服务器实现采集用户访问网页的行为数据。需要说明的是,Nginx是一种高性能的WEB服务器,一般用Nginx来展示网页内容,本实施例利用了Nginx的另外一特性,就是高性能的日志存储。
根据不同的网站栏目,在网页上放置不同的文件的链接地址,例如图片(例如JPG文件)的链接地址或者JS文件的链接地址,作为该栏目的“探针”,用户访问该网页后,即在Nginx上产生日志,达到了记录用户的访问信息的目的。
例如,www.tk.cn是泰康在线首页,如果采集该页面的用户访问,则在Nginx服务器上,放置一个1字节,像素为0的图片homepage.jpg,链接地址为http://code.tk.cn/homepage.jpg,将该链接地址放入www.tk.cn首页中,用户访问该首页,被访问的网页会向服务器发送数据,由此Nginx服务器即产生一条访问日志,记录了访问者来源IP、时间等信息,从而记录用户访问轨迹,进而获得各种线索。例如跟踪用户在网站的访问页面、广告等详细路径,获得客户的浏览习惯,并根据页面的类型,得到用户潜在的购买意向,然后以线索形式推送网电中心进行后续转化行为。其中访问的网页的详细参数,如网页详情、网页内容、重要参数也会记录在服务器的访问日志中。
又如,还可对探针进行扩展应用,实现匿名用户行为识别。例如在方式一的基础上,当用户登录后,把用户登录后的用户ID与当前的源地址关联起来。同时把来自所有相同的源地址的访问行为进行合并;把相同的用户ID的访问行为合并,再把上述两者全部合并。此方案适用于一个用户在一个相同的硬件设备上网页账号登录前后的访问行为合并。也适用于一个用户在不同的硬件设备上网页账号登录前后的访问行为合并。例如,在Nginx服务器上,放置一个user.js,该JS文件嵌入www.tk.cn首页,user.js一旦有用户访问,则在浏览器产生长效Cookie,Cookie内容是唯一的“识别码”,只要用户不清除Cookie,即使关机,第二天重新开机,浏览到该页面,user.js就可以识别是同一用户访问。如果用户后续做了登陆、测算、服务等行为,可以识别用户信息,后台通过唯一识别码,可以将用户所有的访问行为进行关联,从而达到全面掌握用户行为的目的。其中,Cookie是在HTTP协议下,服务器或脚本可以维护客户工作站上信息的一种方式。Cookie是由Web服务器保存在用户浏览器(客户端)上的小文本文件,它可以包含有关用户的信息。无论何时用户链接到服务器,Web站点都可以访问Cookie信息。
本实施例的技术方案,通过在网页中插入预定服务器上的文件的链接地址,触发预定服务器生成访问日志,获取该用户访问网页的行为数据,以全面掌握用户登陆网站前后的访问行为,有力地扩大了用户行为采集和分析能力。
一方面能够实现无论用户是否登陆网站,均可全方位整合用户对网站访问时的行为数据,另一方面在用户成为网站的注册会员时能够立即获取到该用户注册前的行为数据,为得到网站新会员的销售线索提供数据基础。
图4示出了根据本发明一实施例的用户行为数据整合装置的框图,如图4所示,本实施例所述的用户行为数据整合装置包括第一整合数据获取单元410、第二整合数据获取单元420、以及数据合并单元430。
该第一整合数据获取单元410被配置为,用于响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;
第二整合数据获取单元420被配置为,用于响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;
数据合并单元430被配置为,用于对所述第一整合数据和所述第二整合数据进行合并。
根据一些实施例,所述数据合并单元430用于:根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并。
根据一些实施例,所述数据合并单元430用于:在所述用户登陆所述网站后,响应于所述用户访问所述网页,获取所述用户所采用的终端设备的身份信息。
根据一些实施例,所述数据合并单元430用于:将所述用户的身份信息所关联的所述第二整合数据,与根据所整合的终端设备的身份信息所整合得到的所述第一整合数据进行合并。
根据一些实施例,所述第一整合数据获取单元410包括:
链接地址插入子单元(图4中未示出),用于在所述网页中分别插入链接地址,其中,所述链接地址指向预定服务器上的文件;
日志获取子单元(图4中未示出),用于响应于所述用户访问所述网页,所述网页向所述预定服务器发送数据请求从而触发所述预定服务器生成访问日志,所述访问日志中包括所述用户所采用的终端设备的身份信息;
行为数据获取子单元(图4中未示出),用于根据所述访问日志获取并记录所述用户的行为数据。
根据一些实施例,所述链接地址还包括用于记录所述用户在所述网页上的访问轨迹的统一资源定位地址URL插件参数。
根据一些实施例,所述预定服务器上的文件包括JAVA脚本JS文件,所述JS文件至少包括用于为访问所述网页的用户分配唯一的用户标识的脚本行。
根据一些实施例,所述预定服务器上的文件包括大小为一个字节像素为0的图片。
根据一些实施例,所述服务器为Nginx服务器。
根据一些实施例,所述行为数据包括输入信息、点击信息、访问时间、访问时长、以及浏览路径中的至少一项。
根据一些实施例,所述用户所采用的终端设备的身份信息包括所述用户所采用的终端设备的IP地址或MAC地址。
根据一些实施例,所述装置还包括销售线索获取单元(图4中未示出),用于根据整合后的行为数据对所述用户的行为进行分析,根据用户的行为分析所述网页的价值,以得到销售线索。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本实施例提供的用户行为数据整合装置可执行本发明方法实施例所提供的用户行为数据整合方法,具备执行方法相应的功能模块和有益效果。
图5示出了根据本发明一实施例的电子设备,如图5所示,电子设备500可包括处理器510、存储器520、发射器530及接收器540。
存储器520可存储用于处理器510控制操作处理的指令。存储器520可包括易失性或非易失性存储器,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)等,本发明对此没有限制。
处理器510可调用存储器520中存储的指令控制相关操作。根据一实施例,存储器520存储用于处理器510控制以下操作的指令:响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;对所述第一整合数据和所述第二整合数据进行合并。
易于理解,存储器520还可存储用于处理器510控制根据本发明实施例的其他操作的指令,这里不再赘述。
处理器510还可控制发射器530和接收器540进行信号收发等。
通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的系统和方法具有以下优点中的一个或多个。
根据一些实施例,本发明还提供一种非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由装置的处理器执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。当存储介质中的指令由终端的处理器执行时,使得终端能够执行下述方法:响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;对所述第一整合数据和所述第二整合数据进行合并。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
以上具体地示出和描述了本发明的示例性实施例。应该理解,本发明不限于所公开的实施例,相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效布置。

Claims (18)

1.一种用户行为数据整合方法,其特征在于,包括:
响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;其中,所述终端设备的身份信息包括一个或多个所述终端设备的身份信息;
响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;
根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并。
2.如权利要求1所述的方法,其特征在于,根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息包括:在所述用户登陆所述网站后,响应于所述用户访问所述网页,获取所述用户所采用的终端设备的身份信息,并将终端设备的身份信息与所述用户的身份信息关联。
3.如权利要求1所述的方法,其特征在于,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并包括:将所述用户的身份信息所关联的所述第二整合数据,与根据所整合的终端设备的身份信息所整合得到的所述第一整合数据进行合并。
4.如权利要求1所述的方法,其特征在于,在根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息之后还包括:根据所述用户的身份信息,获取所述用户在多个终端设备上登陆所述网站后访问所述网页的行为数据,整合得到所述第二整合数据。
5.如权利要求4所述的方法,其特征在于,所述根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据还包括:根据所述终端设备身份信息判断该终端设备为私密设备,将该终端设备上的所述用户登陆前的访问行为数据整合入所述第一整合数据。
6.如权利要求4所述的方法,其特征在于,所述方法还包括:根据所述终端设备身份信息判断该终端设备为公用终端设备或至少二个以上用户在所述终端设备上进行登陆,将所述终端设备上所述用户登陆前的访问行为数据排除在所述第一整合数据之外。
7.如权利要求1所述的方法,其特征在于,响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据包括:
在所述网页中分别插入链接地址,其中,所述链接地址指向预定服务器上的文件;
响应于所述用户访问所述网页,所述网页向所述预定服务器发送数据请求从而触发所述预定服务器生成访问日志,所述访问日志中包括所述用户所采用的终端设备的身份信息;
根据所述访问日志获取并记录所述用户的行为数据。
8.如权利要求7所述的方法,其特征在于,所述链接地址还包括用于记录所述用户在所述网页上的访问轨迹的统一资源定位地址URL插件参数。
9.如权利要求7所述的方法,其特征在于,所述预定服务器上的文件包括JAVA脚本JS文件,所述JS文件至少包括用于为访问所述网页的用户分配唯一的用户标识的脚本行。
10.如权利要求7所述的方法,其特征在于,所述预定服务器上的文件包括大小为一个字节像素为0的图片。
11.如权利要求7所述的方法,其特征在于,所述服务器为Nginx服务器。
12.如权利要求1所述的方法,其特征在于,所述行为数据包括输入信息、点击信息、访问时间、访问时长、以及浏览路径中的至少一项。
13.如权利要求1所述的方法,其特征在于,所述用户所采用的终端设备的身份信息包括所述用户所采用的终端设备的IP地址、MAC地址或浏览器cookie给终端设备分配的唯一识别码。
14.如权利要求1所述的方法,其特征在于,所述方法还包括,根据整合后的行为数据对所述用户的行为进行分析,根据用户的行为分析所述网页的价值,以得到销售线索。
15.如权利要求1所述的方法,其特征在于,记录所述用户访问所述网页的行为数据包括:记录所述用户在登陆所述网站前访问所述多个网页的行为数据。
16.一种用户行为数据整合装置,其特征在于,包括:
第一整合数据获取单元,用于响应于用户访问网站所包含的网页,获取所述用户所采用的终端设备的身份信息,记录所述用户访问所述网页的行为数据,根据所述终端设备的身份信息对所述用户访问所述网页的行为数据进行整合得到第一整合数据;
第二整合数据获取单元,用于响应于所述用户登陆所述网站,根据所述用户登陆所述网站时的登陆信息获取所述用户的身份信息,记录所述用户登陆所述网站后对所述网页的访问行为数据,并将登陆后的访问行为数据与所述用户的身份信息关联,合并与所述用户的身份信息相关联的登陆后的访问行为数据得到第二整合数据;
数据合并单元,用于根据所述用户的身份信息整合所述用户所采用的终端设备的身份信息,根据所述用户的身份信息和所整合的终端设备的身份信息对所述第一整合数据和所述第二整合数据进行合并。
17.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储程序,当所述程序被所述处理器执行时,使得所述处理器实现如权利要求1至15中任一项所述的方法。
18.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-15任一项所述方法的步骤。
CN201710575750.5A 2017-07-14 2017-07-14 用户行为数据整合方法、装置及电子设备 Active CN107357903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710575750.5A CN107357903B (zh) 2017-07-14 2017-07-14 用户行为数据整合方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710575750.5A CN107357903B (zh) 2017-07-14 2017-07-14 用户行为数据整合方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN107357903A CN107357903A (zh) 2017-11-17
CN107357903B true CN107357903B (zh) 2020-03-17

Family

ID=60292944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710575750.5A Active CN107357903B (zh) 2017-07-14 2017-07-14 用户行为数据整合方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN107357903B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108335132A (zh) * 2018-01-22 2018-07-27 中国平安人寿保险股份有限公司 应用程序的分析方法、装置、存储介质及终端
CN109274679B (zh) * 2018-10-16 2021-06-29 郑州云海信息技术有限公司 一种访问请求记录方法、装置、设备及可读存储介质
CN110109814B (zh) * 2019-05-15 2023-07-21 恒生电子股份有限公司 用户行为数据修正方法及装置
CN112733096B (zh) * 2019-10-14 2024-02-27 深圳市红砖坊技术有限公司 一种用户注册方法、用户登录方法及对应装置
CN111190889A (zh) * 2019-12-16 2020-05-22 上海淇玥信息技术有限公司 设备前端数据展示的方法及其装置、电子设备和存储介质
CN112184381B (zh) * 2020-10-03 2022-02-08 张文 外卖式购物的代购方法、装置、系统、设备和存储介质
CN112598432A (zh) * 2020-11-17 2021-04-02 深圳市世强元件网络有限公司 一种网站用户积分计算方法、装置及计算机设备
CN114282942B (zh) * 2021-12-22 2023-04-07 钻技(上海)信息科技有限公司 一种电商平台推广方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN103297469A (zh) * 2012-02-25 2013-09-11 阿里巴巴集团控股有限公司 一种网站数据的采集方法及装置
CN108134760A (zh) * 2016-11-30 2018-06-08 北京国双科技有限公司 网站监测数据获取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN103297469A (zh) * 2012-02-25 2013-09-11 阿里巴巴集团控股有限公司 一种网站数据的采集方法及装置
CN108134760A (zh) * 2016-11-30 2018-06-08 北京国双科技有限公司 网站监测数据获取方法及装置

Also Published As

Publication number Publication date
CN107357903A (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN107357903B (zh) 用户行为数据整合方法、装置及电子设备
US11444856B2 (en) Systems and methods for configuring a resource for network traffic analysis
US11514476B2 (en) Cross-browser, cross-machine recoverable user identifiers
US20120331102A1 (en) Targeted Content Delivery for Networks
CN109451333B (zh) 一种弹幕显示方法、装置、终端及系统
CN104410546A (zh) 实时处理系统的测试方法和装置
CN107220848B (zh) 一种广告展示方法和装置
CN103631957A (zh) 访客行为数据统计方法及装置
EP2577584A1 (en) Method of identifying remote users of websites
CN104394041A (zh) 访问日志生成方法及装置
US20170011422A1 (en) Data processing device and data processing method
CN105450460B (zh) 网络操作记录方法及系统
KR20130039179A (ko) 온라인 쇼핑몰 기반의 타겟 광고 제공 시스템, 그의 타겟 광고 제공 장치 및 방법
CN104317884A (zh) 网站来源页面类型的获取方法和装置
CN107465718B (zh) 跨应用的id识别方法及装置、存储介质、终端
US9210222B2 (en) Browser cookie analysis and targeted content delivery
KR20160130724A (ko) 온라인 쇼핑몰 기반의 타겟 광고 제공 시스템, 그의 타겟 광고 제공 장치 및 방법
KR100938814B1 (ko) 온라인상에 노출된 광고의 광고 효과를 측정하는 방법 및 장치
JP2015001795A (ja) 性格分析装置および性格分析用プログラム
CN113918865A (zh) 数据处理方法、装置、存储介质和电子装置
KR20140024542A (ko) 웹페이지의 쿠키정보 및 리퍼러 기록을 이용한 광고 서비스 시스템 및 방법
US20190108554A1 (en) Systems and methods for generating and transmitting content based on association of a common device
KR101593929B1 (ko) 파라미터를 이용한 사용자 맞춤 서비스 제공 시스템 및 방법
US9639817B2 (en) Remote metering for panelist web usage
Musmeci The Risk of Web Tracking and the impact of user consent

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Floor 36, Zheshang Building, No. 718 Jianshe Avenue, Jiang'an District, Wuhan, Hubei 430019

Patentee after: TK.CN INSURANCE Co.,Ltd.

Patentee after: TAIKANG INSURANCE GROUP Co.,Ltd.

Address before: 156 fuxingmennei street, Xicheng District, Beijing 100031

Patentee before: TAIKANG INSURANCE GROUP Co.,Ltd.

Patentee before: TK.CN INSURANCE Co.,Ltd.

CP03 Change of name, title or address