CN110059282A - 一种交互类数据的获取方法及系统 - Google Patents

一种交互类数据的获取方法及系统 Download PDF

Info

Publication number
CN110059282A
CN110059282A CN201910329012.1A CN201910329012A CN110059282A CN 110059282 A CN110059282 A CN 110059282A CN 201910329012 A CN201910329012 A CN 201910329012A CN 110059282 A CN110059282 A CN 110059282A
Authority
CN
China
Prior art keywords
webpage
information element
configuration file
buries
accessed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910329012.1A
Other languages
English (en)
Inventor
周伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910329012.1A priority Critical patent/CN110059282A/zh
Publication of CN110059282A publication Critical patent/CN110059282A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种交互类数据的获取方法及系统,当检测到网页被加载时,将被加载的网页确定为被访问网页,获取被访问网页的埋点配置文件,并对埋点配置文件进行解析,得到被访问网页的各个信息元素的访问路径、统计标识和绑定事件,根据访问路径确定被访问网页的信息元素,基于信息元素的统计标识和绑定事件对各个信息元素进行埋点,从而基于各个信息元素的埋点采集交互类数据。本申请是在网页上线后,根据网页的信息元素统计方案确定埋点配置文件,以便基于埋点配置文件采集交互类数据,因此本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,易维护。

Description

一种交互类数据的获取方法及系统
技术领域
本发明涉及互联网技术领域,更具体的说,涉及一种交互类数据的获取方法及系统。
背景技术
网站上线后,通常需要通过分析用户的行为数据来判断网站功能是否满足用户需求,以及是否达到设计初衷。因此,用户的行为数据是网站功能分析的必备条件。
现有技术中,在对网站功能进行分析时,通常着重用户对网页访问行为数据的分析,网页访问行为数据比如,PV(page view,页面浏览量)、UV(unique visitor,独立访客)、跳出率和网页停留时间等等。但是缺乏对交互类数据(也即用户交互行为数据)的分析,交互类数据比如,点击、滑动、hover(一个模仿悬停事件)等。这是因为在采集交互类数据时,需要编码大量埋点,编码的埋点可以认为是一种“静态埋点”,因此,当用户每次修改对网页的信息元素的统计方案时,都需要重新编码埋点,并上线网页,,不仅效率低,而且维护成本高。因此,传统方案很难实现对网站功能的全面分析。
综上,如何提供一种交互类数据的获取方法,无需编码,效率高且易维护,成为了本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明公开一种交互类数据的获取方法及系统,以实现根据网页的信息元素统计方案确定埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,由于本申请是按需定制埋点方案,从而无需编码,效率高,具有灵活、易维护的特点。
一种交互类数据的获取方法,应用于客户端,包括:
当检测到网页被加载时,将被加载的所述网页确定为被访问网页;
获取所述被访问网页的埋点配置文件,所述埋点配置文件根据网页的信息元素统计方案确定;
解析所述埋点配置文件,得到所述埋点配置文件中包含的所述被访问网页的各个信息元素的访问路径、统计标识和绑定事件;
根据各个所述信息元素的访问路径,确定所述被访问网页的各个所述信息元素;
为所述被访问网页的各个所述信息元素进行埋点,所述埋点包括:设置至少一个所述信息元素的统计标识和绑定事件;
根据各个所述信息元素的所述埋点,采集交互类数据。
可选的,还包括:
将所述交互类数据发送给对端设备,供所述对端设备对网站功能进行分析。
可选的,所述埋点配置文件的生成过程如下:
根据网页访问地址,生成网页的文档对象模型DOM树结构,所述DOM树结构上包括所述网页的所有信息元素的属性和层级结构;
获取所述网页的信息元素统计方案;
从所述DOM树结构中,获取所述信息元素统计方案中至少一个信息元素的访问路径;
确定各个所述信息元素的统计标识和绑定事件;
基于各个所述信息元素的访问路径、统计标识和绑定事件,生成所述埋点配置文件。
可选的,所述埋点配置文件采用对象简谱JSON结构定义。
一种交互类数据的获取系统,应用于客户端,包括:
第一确定单元,用于当检测到网页被加载时,将被加载的所述网页确定为被访问网页;
第一获取单元,用于获取所述被访问网页的埋点配置文件,所述埋点配置文件根据网页的信息元素统计方案确定;
解析单元,用于解析所述埋点配置文件,得到所述埋点配置文件中包含的所述被访问网页的各个信息元素的访问路径、统计标识和绑定事件;
第二确定单元,用于根据各个所述信息元素的访问路径,确定所述被访问网页的各个所述信息元素;
埋点单元,用于为所述被访问网页的各个所述信息元素进行埋点,所述埋点包括:设置至少一个所述信息元素的统计标识和绑定事件;
采集单元,根据各个所述信息元素的所述埋点,采集交互类数据。
可选的,还包括:
发送单元,用于将所述交互类数据发送给对端设备,供所述对端设备对网站功能进行分析。
可选的,还包括:埋点配置文件生成单元,所述埋点配置文件生成单元具体用于:
根据网页访问地址,生成网页的文档对象模型DOM树结构,所述DOM树结构上包括所述网页的所有信息元素的属性和层级结构;
获取所述网页的信息元素统计方案;
从所述DOM树结构中,获取所述信息元素统计方案中至少一个信息元素的访问路径;
确定各个所述信息元素的统计标识和绑定事件;
基于各个所述信息元素的访问路径、统计标识和绑定事件,生成所述埋点配置文件。
可选的,所述埋点配置文件采用对象简谱JSON结构定义。
从上述的技术方案可知,本发明公开了一种交互类数据的获取方法及系统,当检测到网页被加载时,将被加载的网页确定为被访问网页,客户端会获取被访问网页的埋点配置文件,并对该埋点配置文件进行解析,得到被访问网页的各个信息元素的访问路径、统计标识和绑定事件,在根据访问路径确定被访问网页的信息元素后,就可以基于信息元素的统计标识和绑定事件,对各个信息元素进行埋点,从而基于各个信息元素的埋点采集交互类数据。由于本申请是在网页上线后,根据网页的信息元素统计方案确定埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,以便基于各个信息元素的埋点采集交互类数据,因此,本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,具有灵活、易维护的特点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据公开的附图获得其他的附图。
图1为本发明实施例公开的一种交互类数据的获取方法流程图;
图2为本发明实施例公开的一种埋点配置文件的生成方法流程图;
图3为本发明实施例公开的一种交互类数据的获取系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种交互类数据的获取方法及系统,当检测到网页被加载时,将被加载的网页确定为被访问网页,客户端会获取被访问网页的埋点配置文件,并对该埋点配置文件进行解析,得到被访问网页的各个信息元素的访问路径、统计标识和绑定事件,在根据访问路径确定被访问网页的信息元素后,就可以基于信息元素的统计标识和绑定事件,对各个信息元素进行埋点,从而基于各个信息元素的埋点采集交互类数据。由于本申请是在网页上线后,根据网页的信息元素统计方案确定埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,以便基于各个信息元素的埋点采集交互类数据,因此,本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,具有灵活、易维护的特点。
参见图1,本发明一实施例公开的一种交互类数据的获取方法流程图,该方法应用于客户端,包括步骤:
步骤S101、当检测到网页被加载时,将被加载的所述网页确定为被访问网页;
在实际应用中,当网站初次启动时,客户端会加载数据采集SDK,SDK是软件开发工具包的英文缩写,对应的英文全称为:Software Development Kit,SDK一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。
本实施例中,当客户端检测到网页被加载时,客户端会将被加载的网页确定为被访问网页,通过数据采集SDK向服务器请求被访问网页的埋点配置。
埋点:是指数据采集SDK根据用户对网页的信息元素统计方案,向网页中动态的插入统计标识和绑定事件,其中,统计标识在本申请中定义为rseat,rseat在网面内部具有唯一性,代表网面内的某个信息元素,如:跳转链接、按钮等,绑定事件比如,点击、滑动等。
埋点配置:是指根据用户对网页定制的信息元素统计方案,生成的数据采集SDK可识别的配置文件,用于数据采集SDK对网面进行埋点,是数据采集SDK的输入。
其中,网页的信息元素指的是网页上所有可见内容,比如,文本输入框、图片、表格、按钮等。
步骤S102、获取所述被访问网页的埋点配置文件;
其中,所述埋点配置文件根据网页的信息元素统计方案确定,网页的信息元素统计方案由用户预先确定。
具体的,在服务器中预先存储有各个网页的埋点配置文件,因此当用户在客户端访问网页时,也即,当客户端检测到网页被加载时,客户端就可以向服务器请求被访问网页的埋点配置。服务器在接收到客户端发送的请求后,就可以基于被访问网页的标识,从预先存储的各个网页和对应的埋点配置文件中,查找到被访问网页的埋点配置文件,并将查找到的埋点配置反馈给客户端。
需要说明的是,本申请中的埋点配置文件采用JSON结构定义,JSON(JavaScriptObject Notation,JS对象简谱)是一种轻量级的数据交换格式。它基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言,易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。
埋点配置文件采用JSON结构定义,包括:
①网页定义如下:
②信息元素节点定义如下:
步骤S103、解析所述埋点配置文件,得到所述埋点配置文件中包含的所述被访问网页的各个信息元素的访问路径、统计标识和绑定事件;
需要说明的是,每个信息元素都有对应的访问路径、统计标识和绑定事件。
步骤S104、根据各个所述信息元素的访问路径,确定所述被访问网页的各个所述信息元素;
需要说明的是,根据访问路径可以唯一确定与该访问路径对应的信息元素。
步骤S105、为所述被访问网页的各个所述信息元素进行埋点,所述埋点包括:至少一个所述信息元素的统计标识和绑定事件;
在实际应用中,根据业务需求,埋点还可以包括:自定义业务数据。
需要说明的是,本实施例中为被访问网页的各个信息元素进行埋点,实际为为被访问网页的各个信息元素进行动态埋点,动态埋点是指:网页上线后,可以根据用户(统计需求方)定制的埋点配置文件,自动为网页的信息元素进行埋点,并采集用户(网页浏览者)的交互行为数据。
步骤S106、根据各个所述信息元素的所述埋点,采集交互类数据。
具体的,基于上述论述可知,埋点配置文件中定义了网页中信息元素的如下属性:
1.访问路径(xpath):数据采集SDK可根据该路径在网页中找到相对应的信息元素;
2.统计标识:rseat,用于标记信息元素,相当于给信息元素起一个直观的名字;
3.绑定事件:数据采集SDK为网页中的信息元素绑定用户交互行为(如:点击、滑动、hover等)并进行监听,当用户对网页中的信息元素进行操作(如:点击、滑动、hove)时,就会被数据采集SDK监听到并采集交互类数据,发送给服务器,便于后续统计分析。
综上可知,本发明公开的交互类数据的获取方法,当检测到网页被加载时,将被加载的网页确定为被访问网页,客户端会获取被访问网页的埋点配置文件,并对该埋点配置文件进行解析,得到被访问网页的各个信息元素的访问路径、统计标识和绑定事件,在根据访问路径确定被访问网页的信息元素后,就可以基于信息元素的统计标识和绑定事件,对各个信息元素进行埋点,从而基于各个信息元素的埋点采集交互类数据。由于本申请是在网页上线后,根据网页的信息元素统计方案确定埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,以便基于各个信息元素的埋点采集交互类数据,因此,本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,具有灵活、易维护的特点。
上述实施例中,当客户端根据被访问网页的各个信息元素的埋点,采集交互类数据后,就可以将采集的交互类数据发送给服务器,以供服务器可以同时基于用户对网页访问行为数据和交互类数据,对网站功能进行全面分析。
因此,为进一步优化上述实施例,在步骤S106之后,还可以包括步骤:
将所述交互类数据发送给对端设备,供所述对端设备对网站功能进行分析,比如,网页访问PV(Page View,页面浏览量)、UV(Unique Visitor,独立访客)、跳出率、停留时间、区域点击次数等等。
其中,本实施例中的客户端的对端设备可以为服务器。
需要说明的是,当客户端根据各个元素信息的埋点,采集交互类数据后,客户端首先会将采集的交互类数据暂存在本地。当服务器需要对网站的功能进行分析时,客户端将交互类数据发送至服务器,并删除本地存储的交互类数据。
上述实施例中,客户端从服务器获取的网页的埋点配置文件,实际为客户端在设置完埋点配置文件后存储至服务器的。
因此,为进一步优化上述实施例,本发明还公开了客户端设置埋点配置文件的具体过程。
参见图2,本发明一实施例公开的一种埋点配置文件的生成方法流程图,该方法应用于客户端,包括步骤:
步骤S201、根据网页访问地址,生成网页的DOM树结构,所述DOM树结构上包括所述网页的所有信息元素的属性和层级结构;
具体的,DOM(Document Object Model,文档对象模型)树结构上定义了网页上所有信息元素的属性及层级结构,形似一颗树,用户访问网页,其实就是浏览器通过内置的HTML(HyperText Markup Language,超级文本标记语言)解释器将网页解释成DOM树结构,再结合内容和样式进行渲染,呈现给用户。本申请通过W3C(万维网联盟)定义的DOM接口生成网页的DOM树结构。
步骤S202、获取所述网页的信息元素统计方案;
其中,信息元素统计方案中统计有需要统计的网页的各个信息元素,比如展示、点击、滑动等。
步骤S203、从所述DOM树结构中,获取所述信息元素统计方案中至少一个信息元素的访问路径;
需要说明的是,各个信息元素的访问路径,也即各个信息元素的XPath路径,XPath即为XML路径语言(XML Path Language)。
其中,从DOM树结构中,获取信息元素统计方案中各个信息元素的访问路径的过程,可参见现有成熟方案,此处不再赘述。
步骤S204、确定各个所述信息元素的统计标识和绑定事件;
具体的,根据实际需要确定各个信息元素的统计标识和绑定事件,该过程可参见现有成熟方案,此处不再赘述。
步骤S205、基于各个信息元素的访问路径、统计标识和绑定事件,生成所述埋点配置文件。
需要说明的是,当客户端生成埋点配置文件后,客户端会将生成的埋点配置文件发送至服务器进行存储。
综上可知,本发明根据网页访问地址,生成网页的DOM树结构,根据用户输入的网页的信息元素统计方案,从DOM树结构中获取信息元素统计方案中各个信息元素的访问路径,从而基于各个信息元素的访问路径、统计标识和绑定事件,生成埋点配置文件,并存储至服务器。这样,当需要获取交互类数据时,就可以从服务器获取被访问网页的埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,因此,本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,具有灵活、易维护的特点。
与上述方法实施例相对应,本发明还公开了一种交互类数据的获取系统。
参见图3,本发明一实施例公开的一种交互类数据的获取系统的结构示意图,该系统应用于客户端,包括:
第一确定单元301,用于当检测到网页被加载时,将被加载的所述网页确定为被访问网页;
在实际应用中,当网站初次启动时,客户端会加载数据采集SDK,SDK是软件开发工具包的英文缩写,对应的英文全称为:Software Development Kit,SDK一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。
本实施例中,当客户端检测到网页被加载时,客户端会将被加载的网页确定为被访问网页,通过数据采集SDK向服务器请求被访问网页的埋点配置。
埋点:是指数据采集SDK根据用户对网页的信息元素统计方案,向网页中动态的插入统计标识和绑定事件,其中,统计标识在本申请中定义为rseat,rseat在网面内部具有唯一性,代表网面内的某个信息元素,如:跳转链接、按钮等,绑定事件比如,点击、滑动等。
埋点配置:是指根据用户对网页定制的信息元素统计方案,生成的数据采集SDK可识别的配置文件,用于数据采集SDK对网面进行埋点,是数据采集SDK的输入。
其中,网页的信息元素指的是网页上所有可见内容,比如,文本输入框、图片、表格、按钮等。
第一获取单元302,用于获取所述被访问网页的埋点配置文件,所述埋点配置文件根据网页的信息元素统计方案确定;
其中,所述埋点配置文件根据网页的信息元素统计方案确定,网页的信息元素统计方案由用户预先确定。
具体的,在服务器中预先存储有各个网页的埋点配置文件,因此当用户在客户端访问网页时,也即,当客户端检测到网页被加载时,客户端就可以向服务器请求被访问网页的埋点配置。服务器在接收到客户端发送的请求后,就可以基于被访问网页的标识,从预先存储的各个网页和对应的埋点配置文件中,查找到被访问网页的埋点配置文件,并将查找到的埋点配置反馈给客户端。
需要说明的是,本申请中的埋点配置文件采用JSON结构定义,JSON(JavaScriptObject Notation,JS对象简谱)是一种轻量级的数据交换格式。它基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言,易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。
埋点配置文件采用JSON结构定义,包括:
①网页定义如下:
②信息元素节点定义如下:
解析单元303,用于解析所述埋点配置文件,得到所述埋点配置文件中包含的所述被访问网页的各个信息元素的访问路径、统计标识和绑定事件;
需要说明的是,每个信息元素都有对应的访问路径、统计标识和绑定事件。
第二确定单元304,用于根据各个所述信息元素的访问路径,确定所述被访问网页的各个所述信息元素;
需要说明的是,根据访问路径可以唯一确定与该访问路径对应的信息元素。
埋点单元305,用于为所述被访问网页的各个所述信息元素进行埋点,所述埋点包括:设置至少一个所述信息元素的统计标识和绑定事件;
在实际应用中,根据业务需求,埋点还可以包括:自定义业务数据。
需要说明的是,本实施例中为被访问网页的各个信息元素进行埋点,实际为为被访问网页的各个信息元素进行动态埋点,动态埋点是指:网页上线后,可以根据用户(统计需求方)定制的埋点配置文件,自动为网页的信息元素进行埋点,并采集用户(网页浏览者)的交互行为数据。
采集单元306,根据各个所述信息元素的所述埋点,采集交互类数据。
具体的,基于上述论述可知,埋点配置文件中定义了网页中信息元素的如下属性:
1.访问路径(xpath):数据采集SDK可根据该路径在网页中找到相对应的信息元素;
2.统计标识:rseat,用于标记信息元素,相当于给信息元素起一个直观的名字;
3.绑定事件:数据采集SDK为网页中的信息元素绑定用户交互行为(如:点击、滑动、hover等)并进行监听,当用户对网页中的信息元素进行操作(如:点击、滑动、hove)时,就会被数据采集SDK监听到并采集交互类数据,发送给服务器,便于后续统计分析。
综上可知,本发明公开的交互类数据的获取系统,当检测到网页被加载时,将被加载的网页确定为被访问网页,客户端会获取被访问网页的埋点配置文件,并对该埋点配置文件进行解析,得到被访问网页的各个信息元素的访问路径、统计标识和绑定事件,在根据访问路径确定被访问网页的信息元素后,就可以基于信息元素的统计标识和绑定事件,对各个信息元素进行埋点,从而基于各个信息元素的埋点采集交互类数据。由于本申请是在网页上线后,根据网页的信息元素统计方案确定埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,以便基于各个信息元素的埋点采集交互类数据,因此,本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,具有灵活、易维护的特点。
上述实施例中,当客户端根据被访问网页的各个信息元素的埋点,采集交互类数据后,就可以将采集的交互类数据发送给服务器,以供服务器可以同时基于用户对网页访问行为数据和交互类数据,对网站功能进行全面分析。
因此,为进一步优化上述实施例,获取系统还可以包括:
发送单元,用于将所述交互类数据发送给对端设备,供所述对端设备对网站功能进行分析,比如,网页访问PV(Page View,页面浏览量)、UV(Unique Visitor,独立访客)、跳出率、停留时间、区域点击次数等等
其中,本实施例中的客户端的对端设备可以为服务器。
需要说明的是,当客户端根据各个元素信息的埋点,采集交互类数据后,客户端首先会将采集的交互类数据暂存在本地。当服务器需要对网站的功能进行分析时,客户端将交互类数据发送至服务器,并删除本地存储的交互类数据。
需要说明的是,服务器存储的埋点配置文件实际为客户端生成的。
因此,获取系统还可以包括:埋点配置文件生成单元,埋点配置文件生成单元具体用于:
根据网页访问地址,生成网页的文档对象模型DOM树结构,所述DOM树结构上包括所述网页的所有信息元素的属性和层级结构;
获取所述网页的信息元素统计方案;
从所述DOM树结构中,获取所述信息元素统计方案中至少一个信息元素的访问路径;
确定各个所述信息元素的统计标识和绑定事件;
基于各个所述信息元素的访问路径、统计标识和绑定事件,生成所述埋点配置文件。
需要说明的是,埋点配置文件生成单元生成埋点配置文件的过程,请参见方法实施例对应部分,此处不再赘述。
综上可知,本发明根据网页访问地址,生成网页的DOM树结构,根据用户输入的网页的信息元素统计方案,从DOM树结构中获取信息元素统计方案中各个信息元素的访问路径,从而基于各个信息元素的访问路径、统计标识和绑定事件,生成埋点配置文件,并存储至服务器。这样,当需要获取交互类数据时,就可以从服务器获取被访问网页的埋点配置文件,并进而基于埋点配置文件为被访问网页的各个信息元素进行埋点,因此,本申请是按需定制埋点方案,当用户修改对网页的信息元素的统计方案时,只需要修改埋点配置文件即可,无需重新编码埋点并上线网页,从而效率高,具有灵活、易维护的特点。
需要特别说明的是,系统实施例中各组成部分的具体工作原理,请参见方法实施例对应部分。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种交互类数据的获取方法,其特征在于,应用于客户端,包括:
当检测到网页被加载时,将被加载的所述网页确定为被访问网页;
获取所述被访问网页的埋点配置文件,所述埋点配置文件根据网页的信息元素统计方案确定;
解析所述埋点配置文件,得到所述埋点配置文件中包含的所述被访问网页的各个信息元素的访问路径、统计标识和绑定事件;
根据各个所述信息元素的访问路径,确定所述被访问网页的各个所述信息元素;
为所述被访问网页的各个所述信息元素进行埋点,所述埋点包括:设置至少一个所述信息元素的统计标识和绑定事件;
根据各个所述信息元素的所述埋点,采集交互类数据。
2.根据权利要求1所述的获取方法,其特征在于,还包括:
将所述交互类数据发送给对端设备,供所述对端设备对网站功能进行分析。
3.根据权利要求1所述的获取方法,其特征在于,所述埋点配置文件的生成过程如下:
根据网页访问地址,生成网页的文档对象模型DOM树结构,所述DOM树结构上包括所述网页的所有信息元素的属性和层级结构;
获取所述网页的信息元素统计方案;
从所述DOM树结构中,获取所述信息元素统计方案中至少一个信息元素的访问路径;
确定各个所述信息元素的统计标识和绑定事件;
基于各个所述信息元素的访问路径、统计标识和绑定事件,生成所述埋点配置文件。
4.根据权利要求1所述的获取方法,其特征在于,所述埋点配置文件采用对象简谱JSON结构定义。
5.一种交互类数据的获取系统,其特征在于,应用于客户端,包括:
第一确定单元,用于当检测到网页被加载时,将被加载的所述网页确定为被访问网页;
第一获取单元,用于获取所述被访问网页的埋点配置文件,所述埋点配置文件根据网页的信息元素统计方案确定;
解析单元,用于解析所述埋点配置文件,得到所述埋点配置文件中包含的所述被访问网页的各个信息元素的访问路径、统计标识和绑定事件;
第二确定单元,用于根据各个所述信息元素的访问路径,确定所述被访问网页的各个所述信息元素;
埋点单元,用于为所述被访问网页的各个所述信息元素进行埋点,所述埋点包括:设置至少一个所述信息元素的统计标识和绑定事件;
采集单元,根据各个所述信息元素的所述埋点,采集交互类数据。
6.根据权利要求5所述的获取系统,其特征在于,还包括:
发送单元,用于将所述交互类数据发送给对端设备,供所述对端设备对网站功能进行分析。
7.根据权利要求5所述的获取系统,其特征在于,还包括:埋点配置文件生成单元,所述埋点配置文件生成单元具体用于:
根据网页访问地址,生成网页的文档对象模型DOM树结构,所述DOM树结构上包括所述网页的所有信息元素的属性和层级结构;
获取所述网页的信息元素统计方案;
从所述DOM树结构中,获取所述信息元素统计方案中至少一个信息元素的访问路径;
确定各个所述信息元素的统计标识和绑定事件;
基于各个所述信息元素的访问路径、统计标识和绑定事件,生成所述埋点配置文件。
8.根据权利要求5所述的获取方法,其特征在于,所述埋点配置文件采用对象简谱JSON结构定义。
CN201910329012.1A 2019-04-23 2019-04-23 一种交互类数据的获取方法及系统 Pending CN110059282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910329012.1A CN110059282A (zh) 2019-04-23 2019-04-23 一种交互类数据的获取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910329012.1A CN110059282A (zh) 2019-04-23 2019-04-23 一种交互类数据的获取方法及系统

Publications (1)

Publication Number Publication Date
CN110059282A true CN110059282A (zh) 2019-07-26

Family

ID=67320164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910329012.1A Pending CN110059282A (zh) 2019-04-23 2019-04-23 一种交互类数据的获取方法及系统

Country Status (1)

Country Link
CN (1) CN110059282A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502415A (zh) * 2019-08-27 2019-11-26 北京思维造物信息科技股份有限公司 一种埋点设置方法、装置及设备
CN110781064A (zh) * 2019-10-28 2020-02-11 深圳市思迪信息技术股份有限公司 客户端用户行为数据动态埋点采集的方法及装置
CN110908884A (zh) * 2019-11-20 2020-03-24 北京悠易网际科技发展有限公司 统计信息生成方法、装置、系统、电子设备及存储介质
CN111046317A (zh) * 2019-12-27 2020-04-21 北京奇艺世纪科技有限公司 页面数据采集方法、装置、设备和计算机可读存储介质
CN111143184A (zh) * 2019-12-27 2020-05-12 北京达佳互联信息技术有限公司 数据处理方法、装置及系统
CN111241446A (zh) * 2020-01-13 2020-06-05 杭州安恒信息技术股份有限公司 一种web网页的正文内容提取方法、装置、设备及介质
CN111695064A (zh) * 2020-04-29 2020-09-22 北京城市网邻信息技术有限公司 一种埋点加载方法及装置
CN111736919A (zh) * 2020-06-19 2020-10-02 北京字节跳动网络技术有限公司 埋点检查方法、装置及电子设备
CN111736918A (zh) * 2020-06-12 2020-10-02 北京字节跳动网络技术有限公司 埋点配置方法、装置及电子设备
CN112162739A (zh) * 2020-09-25 2021-01-01 北京易观智库网络科技有限公司 基于js-sdk的可视化埋点方法及系统
CN112256701A (zh) * 2020-10-22 2021-01-22 广东万唯计算机服务有限公司 一种动态埋点数据采集系统及其使用方法
CN112559278A (zh) * 2019-09-25 2021-03-26 腾讯科技(深圳)有限公司 操作数据的获取方法和装置
CN112784230A (zh) * 2021-01-21 2021-05-11 北京启明星辰信息安全技术有限公司 网络安全数据共享与管控方法及系统
CN112883250A (zh) * 2019-11-29 2021-06-01 阿里巴巴集团控股有限公司 生成埋点标识的方法、装置和埋点的方法
CN113114734A (zh) * 2021-03-24 2021-07-13 北京沃东天骏信息技术有限公司 信息处理方法、装置、设备及存储介质
CN113343159A (zh) * 2021-08-06 2021-09-03 万商云集(成都)科技股份有限公司 一种从任意渠道快速获取数据并分析与存储的方法及系统
CN113761310A (zh) * 2020-07-07 2021-12-07 北京沃东天骏信息技术有限公司 一种采集点击数据的方法和装置
CN113886200A (zh) * 2021-09-06 2022-01-04 浪潮软件科技有限公司 基于埋点的页面分组识别及统计系统及方法
CN114020589A (zh) * 2020-07-15 2022-02-08 腾讯科技(深圳)有限公司 埋点处理方法、装置、计算机设备和存储介质
CN114020589B (zh) * 2020-07-15 2024-07-02 腾讯科技(深圳)有限公司 埋点处理方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776247A (zh) * 2016-11-23 2017-05-31 腾云天宇科技(北京)有限公司 一种监控应用中控件的方法、服务器及系统
CN106844217A (zh) * 2017-01-26 2017-06-13 网易(杭州)网络有限公司 对应用的控件进行埋点的方法及装置、可读存储介质
CN107562620A (zh) * 2017-08-24 2018-01-09 阿里巴巴集团控股有限公司 一种埋点自动设置方法和装置
CN108038053A (zh) * 2017-11-29 2018-05-15 上海恺英网络科技有限公司 一种动态配置埋点的方法及设备
WO2018121501A1 (zh) * 2016-12-29 2018-07-05 北京国双科技有限公司 网站访客行为监测方法及装置
CN108846116A (zh) * 2018-06-26 2018-11-20 北京京东金融科技控股有限公司 网页曝光数据采集方法、系统、电子设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776247A (zh) * 2016-11-23 2017-05-31 腾云天宇科技(北京)有限公司 一种监控应用中控件的方法、服务器及系统
WO2018121501A1 (zh) * 2016-12-29 2018-07-05 北京国双科技有限公司 网站访客行为监测方法及装置
CN106844217A (zh) * 2017-01-26 2017-06-13 网易(杭州)网络有限公司 对应用的控件进行埋点的方法及装置、可读存储介质
CN107562620A (zh) * 2017-08-24 2018-01-09 阿里巴巴集团控股有限公司 一种埋点自动设置方法和装置
CN108038053A (zh) * 2017-11-29 2018-05-15 上海恺英网络科技有限公司 一种动态配置埋点的方法及设备
CN108846116A (zh) * 2018-06-26 2018-11-20 北京京东金融科技控股有限公司 网页曝光数据采集方法、系统、电子设备和存储介质

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502415B (zh) * 2019-08-27 2023-11-28 北京思维造物信息科技股份有限公司 一种埋点设置方法、装置及设备
CN110502415A (zh) * 2019-08-27 2019-11-26 北京思维造物信息科技股份有限公司 一种埋点设置方法、装置及设备
CN112559278A (zh) * 2019-09-25 2021-03-26 腾讯科技(深圳)有限公司 操作数据的获取方法和装置
CN112559278B (zh) * 2019-09-25 2024-02-09 腾讯科技(深圳)有限公司 操作数据的获取方法和装置
CN110781064B (zh) * 2019-10-28 2023-05-26 深圳市思迪信息技术股份有限公司 客户端用户行为数据动态埋点采集的方法及装置
CN110781064A (zh) * 2019-10-28 2020-02-11 深圳市思迪信息技术股份有限公司 客户端用户行为数据动态埋点采集的方法及装置
CN110908884A (zh) * 2019-11-20 2020-03-24 北京悠易网际科技发展有限公司 统计信息生成方法、装置、系统、电子设备及存储介质
CN112883250A (zh) * 2019-11-29 2021-06-01 阿里巴巴集团控股有限公司 生成埋点标识的方法、装置和埋点的方法
CN111046317A (zh) * 2019-12-27 2020-04-21 北京奇艺世纪科技有限公司 页面数据采集方法、装置、设备和计算机可读存储介质
CN111143184A (zh) * 2019-12-27 2020-05-12 北京达佳互联信息技术有限公司 数据处理方法、装置及系统
CN111143184B (zh) * 2019-12-27 2023-11-07 北京达佳互联信息技术有限公司 数据处理方法、装置及系统
CN111241446A (zh) * 2020-01-13 2020-06-05 杭州安恒信息技术股份有限公司 一种web网页的正文内容提取方法、装置、设备及介质
CN111241446B (zh) * 2020-01-13 2023-10-31 杭州安恒信息技术股份有限公司 一种web网页的正文内容提取方法、装置、设备及介质
CN111695064A (zh) * 2020-04-29 2020-09-22 北京城市网邻信息技术有限公司 一种埋点加载方法及装置
CN111695064B (zh) * 2020-04-29 2023-08-18 北京城市网邻信息技术有限公司 一种埋点加载方法及装置
CN111736918A (zh) * 2020-06-12 2020-10-02 北京字节跳动网络技术有限公司 埋点配置方法、装置及电子设备
CN111736918B (zh) * 2020-06-12 2023-11-28 北京字节跳动网络技术有限公司 埋点配置方法、装置及电子设备
CN111736919A (zh) * 2020-06-19 2020-10-02 北京字节跳动网络技术有限公司 埋点检查方法、装置及电子设备
CN113761310A (zh) * 2020-07-07 2021-12-07 北京沃东天骏信息技术有限公司 一种采集点击数据的方法和装置
CN114020589A (zh) * 2020-07-15 2022-02-08 腾讯科技(深圳)有限公司 埋点处理方法、装置、计算机设备和存储介质
CN114020589B (zh) * 2020-07-15 2024-07-02 腾讯科技(深圳)有限公司 埋点处理方法、装置、计算机设备和存储介质
CN112162739A (zh) * 2020-09-25 2021-01-01 北京易观智库网络科技有限公司 基于js-sdk的可视化埋点方法及系统
CN112256701A (zh) * 2020-10-22 2021-01-22 广东万唯计算机服务有限公司 一种动态埋点数据采集系统及其使用方法
CN112784230A (zh) * 2021-01-21 2021-05-11 北京启明星辰信息安全技术有限公司 网络安全数据共享与管控方法及系统
CN112784230B (zh) * 2021-01-21 2024-02-09 北京启明星辰信息安全技术有限公司 网络安全数据共享与管控方法及系统
CN113114734B (zh) * 2021-03-24 2022-12-27 北京沃东天骏信息技术有限公司 信息处理方法、装置、设备及存储介质
CN113114734A (zh) * 2021-03-24 2021-07-13 北京沃东天骏信息技术有限公司 信息处理方法、装置、设备及存储介质
CN113343159A (zh) * 2021-08-06 2021-09-03 万商云集(成都)科技股份有限公司 一种从任意渠道快速获取数据并分析与存储的方法及系统
CN113886200A (zh) * 2021-09-06 2022-01-04 浪潮软件科技有限公司 基于埋点的页面分组识别及统计系统及方法
CN113886200B (zh) * 2021-09-06 2024-01-30 浪潮软件科技有限公司 基于埋点的页面分组识别及统计系统及方法

Similar Documents

Publication Publication Date Title
CN110059282A (zh) 一种交互类数据的获取方法及系统
US20200151224A1 (en) System and method for deep linking and search engine support for web sites integrating third party application and components
US9529780B2 (en) Displaying content on a mobile device
US10261984B2 (en) Browser and operating system compatibility
US8504913B2 (en) Client-side components
US7954107B2 (en) Method and system for integrating the existing web-based system
EP2057557B1 (en) Joint optimization of wrapper generation and template detection
US20030088643A1 (en) Method and computer system for isolating and interrelating components of an application
US20020059345A1 (en) Method for generating transform rules for web-based markup languages
US20140052778A1 (en) Method and apparatus for mapping a site on a wide area network
CN111045678A (zh) 页面执行动态代码的方法、装置、设备及存储介质
JP2010086517A (ja) コンピュータによって実施される、ウェブページからデータを抽出する方法
CN102314497B (zh) 一种用于识别标记语言文件主体内容的方法和设备
US8239754B1 (en) System and method for annotating data through a document metaphor
CN106874502A (zh) 一种视频搜索的方法、装置及终端
US20090083300A1 (en) Document processing device and document processing method
CN101763432A (zh) 一种轻量级网页动态视图快速构建方法
US20100229083A1 (en) Screen display program generating apparatus, screen display system, computer readable storage medium having stored therein a computer program causing a computer to function as the screen display program generating apparatus, and screen display program generating method
US7814457B2 (en) System and method for revising flow diagrams displaying a process
US20080005662A1 (en) Server Device and Name Space Issuing Method
JP3914081B2 (ja) アクセス権限設定方法および構造化文書管理システム
US20150248500A1 (en) Documentation parser
US20080005085A1 (en) Server Device and Search Method
Siciarek et al. IODA-an interactive open document architecture
Hori et al. Generating transformational annotation for web document adaptation: tool support and empirical evaluation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190726

RJ01 Rejection of invention patent application after publication