CN107491488A - 页面数据采集的方法和装置 - Google Patents
页面数据采集的方法和装置 Download PDFInfo
- Publication number
- CN107491488A CN107491488A CN201710585423.8A CN201710585423A CN107491488A CN 107491488 A CN107491488 A CN 107491488A CN 201710585423 A CN201710585423 A CN 201710585423A CN 107491488 A CN107491488 A CN 107491488A
- Authority
- CN
- China
- Prior art keywords
- control
- page
- monitor
- data acquisition
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供一种页面数据采集的方法和装置,涉及计算机技术领域。本发明实施例的一种页面数据采集的方法,包括:遍历页面中的所有控件,为每个所述控件的点击事件设置监听器;在每个所述监听器中均加入数据采集代码;当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。该实施方式通过遍历页面中的所有控件并对控件的点击事件设置监听器,实现了页面内所有控件的自动化数据采集,解决了现有技术需在前期定义控件的Tag,并需要手动埋点来采集数据的问题。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种页面数据采集的方法和装置。
背景技术
移动应用页面内点击数据的采集,通常方式是,在需要采集数据的页面内的控件的点击事件的监听方法中,加入相应的数据采集代码。这种采集方式,前期需要运营人员定义相应的控件的Tag(标记),手机软件(Application,App)研发人员调用软件开发工具包(Software Development Kit,SDK)中的数据采集方法,来达到数据采集的目的。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
(1)运营人员前期定义的每个控件的Tag需要通过手动记录在Tag表中来维护;而且要查看某个控件是否被统计了,需要从后台日志中进行分析;如果后期想修改某个控件的Tag,需要研发人员主动去修改代码;由于业务的需求经常变化,每次增加新的业务,运营人员需要重新定义新的Tag。
(2)App研发人员事前需要进行手动埋点即需要根据运营人员定义的Tag表,在不同页面的控件的点击事件的监听方法中,加入数据采集代码。当Tag量非常多时,会存在错报,漏报的情况。如果后期需要修改某个控件的Tag,需要在大量的代码中搜寻它。
(3)如果业务模块较多,则需要运营人员维护大量的Tag表,研发人员维护不断新增的代码片段,维护工作量及其繁琐。
发明内容
有鉴于此,本发明实施例提供一种页面数据采集的方法和装置,通过遍历页面中的所有控件并对控件的点击事件设置监听器,实现了页面内所有控件的自动化数据采集,解决了现有技术需在前期定义控件的Tag,并需要手动埋点来采集数据的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种页面数据采集的方法。
本发明实施例的一种页面数据采集的方法,包括:遍历页面中的所有控件,为每个所述控件的点击事件设置监听器;在每个所述监听器中均加入数据采集代码;当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。
可选地,所述遍历页面中的所有控件包括:在页面初始化之后或者当页面中的控件层级关系发生变化时,遍历页面中的所有控件。
可选地,所述为每个所述控件的点击事件设置监听器包括:确定所述控件的类型,根据所述控件的类型对其点击事件设置监听器。
可选地,所述在每个所述监听器中均加入数据采集代码,包括:在每个所述控件的点击事件的所述监听器中均加入点击数据采集代码,所述点击数据采集代码中包括控件ID。
可选地,所述控件ID的生成过程包括:判断所述控件是否有控件ID,如果已有控件ID,则使用所述控件ID来唯一地标识所述控件;如果没有控件ID,则按照预设规则生成控件ID以唯一地标识所述控件。
可选地,按照预设规则生成控件ID以唯一地标识所述控件,包括:将页面源代码文件全路径和所述控件的XPath路径拼接后的哈希值作为控件ID以唯一地标识所述控件。
可选地,所述方法还包括:将采集到的数据上报给服务端。
可选地,所述方法还包括:从所采集的数据中获取所述控件的XPath路径,根据XPath路径计算得到所述控件的点击次数。
为实现上述目的,根据本发明实施例的另一方面,提供了一种页面数据采集的装置。
本发明实施例的一种页面数据采集的装置,包括:控件遍历及监听器设置模块,用于遍历页面中的所有控件,为每个所述控件的点击事件设置监听器;数据采集代码添加模块,用于在每个所述监听器中均加入数据采集代码;数据采集模块,用于当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。
可选地,所述控件遍历及监听器设置模块,还用于:在页面初始化之后或者当页面中的控件层级关系发生变化时,遍历页面中的所有控件。
可选地,所述控件遍历及监听器设置模块,还用于:确定所述控件的类型,根据所述控件的类型对其点击事件设置监听器。
可选地,所述数据采集代码添加模块,还用于:在每个所述控件的点击事件的所述监听器中均加入点击数据采集代码,所述点击数据采集代码中包括控件ID。
可选地,所述数据采集代码添加模块,还用于:判断所述控件是否有控件ID,如果已有控件ID,则使用所述控件ID来唯一地标识所述控件;如果没有控件ID,则按照预设规则生成控件ID以唯一地标识所述控件。
可选地,所述数据采集代码添加模块,还用于:将页面源代码文件全路径和所述控件的XPath路径拼接后的哈希值作为控件ID以唯一地标识所述控件。
可选地,所述装置还包括:数据上报模块,用于将采集到的数据上报给服务端。
可选地,所述装置还包括:获取计算模块,用于从所采集的数据中获取所述控件的XPath路径,根据XPath路径计算得到所述控件的点击次数。
为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种页面数据采集的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种页面数据采集的方法。
上述发明中的一个实施例具有如下优点或有益效果:通过遍历页面中的所有控件并对控件的点击事件设置监听器,实现了页面内所有控件的自动化数据采集,同时无需研发人员事前在数据采集代码中进行手动埋点;通过给每个控件分别设置监听器,不同的监听器对应不同的监听方法,使得不同类型的控件实现不同的监听方法;通过加入数据采集代码并通过页面ID和页面控件ID定位到某一个具体控件,实现了页面内任何控件的点击数据的采集统计。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的页面数据采集方法的主要步骤的示意图;
图2是根据本发明实施例的页面数据采集方法的流程图;
图3是根据本发明实施例的页面数据采集装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适用于来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的页面数据采集方法的主要步骤的示意图。如图1所示,本发明实施例的页面数据采集方法,主要包括如下步骤:
步骤S101:遍历页面中的所有控件,为每个所述控件的点击事件设置监听器。在页面初始化之后或者当页面中的控件层级关系发生变化时,遍历页面中的所有控件。根据控件类型为每个控件设置监听器。比如,为TextView(文本控件)、ImageView(图片控件)、Button(按钮控件)设置点击事件的监听器(OnClickListener);为CheckBox(复选框控件)设置按钮选中状态改变事件的监听器(OnCheckedChangeListener);为SeekBar(进度条控件)设置进度状态变化事件的监听器(OnSeekBarChangeListener)。
步骤S102:在每个所述控件的点击事件的所述监听器中均加入数据采集代码。按照采集的是点击数据、文本数据还是状态数据等,在监听器中对应加入不同的数据采集代码。比如,采集控件的点击数据时,在监听器中加入点击数据采集代码;采集文本控件的文本数据时,在监听器中加入文本数据采集代码;采集控件的状态数据时,在监听器中加入状态数据采集代码。
步骤S103:当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。当某个控件被点击后,系统就会调用它的监听器,进而调用增加的用于埋点采集的数据采集代码,从而采集到控件的数据。
以采集点击数据为例进行说明:在每个所述控件的点击事件的所述监听器中均加入点击数据采集代码,所述点击数据采集代码中包括控件ID(Identification,控件的编号)。所述控件ID的生成过程包括:判断所述控件是否有控件ID,如果已有控件ID,则使用所述控件ID来唯一地标识所述控件;如果没有控件ID,则按照预设规则生成控件ID以唯一地标识所述控件。预设规则为:(页面源代码文件全路径+控件的XPath路径)的哈希值,其中,+的含义是将两个字符串拼接。XPath即XML路径语言,它是一种用来确定XML(ExtensibleMarkup Language,可扩展标记语言,是标准通用标记语言的子集)文档中某部分位置的语言;XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。
本发明实施例的终端设备的操作系统为Android系统,终端设备将采集到的数据上报到服务端。服务端从所采集到的数据中获取所述控件的XPath路径,根据XPath路径计算得到所述控件的点击次数。
通过本发明实施例的页面数据采集的方法可以看出,通过遍历页面中的所有控件并对控件的点击事件设置监听器,实现了页面内所有控件的自动化数据采集,同时无需研发人员事前在数据采集代码中进行手动埋点;通过给每个控件分别设置监听器,不同的监听器对应不同的监听方法,使得不同类型的控件实现不同的监听方法;通过加入数据采集代码并通过页面ID和页面控件ID定位到某一个具体控件,实现了页面内任何控件的点击数据的采集统计。
图2是根据本发明实施例的页面数据采集方法的流程图。
下面以Android(安卓)平台下为例,对页面数据采集方法进行详细的说明。首先对数据采集实现过程中的一些关键词进行说明:Application:是Android平台的SDK中的一个类,是面向对象开发中描述某种抽象逻辑的一段独立代码逻辑,具体表现为一个源代码文件;此类是Android App每次启动时首先会调用的,且在App从启动到退出的整个生命周期中只调用一次。Activity:是Android平台的SDK中的一个类,此类表示App页面中的一个场景。ActivityLifecycleCallbacks:是Android平台中用来表示一个Activity的生命周期的接口类。ViewTree:是Android平台的页面中控件层级关系的描述;在Android系统中,每个页面的控件层级关系是树状,最顶层是根视图,下面有父视图和子视图。
本发明实施例的页面数据采集的方法,包括以下过程:
(1)启动应用,调用应用类。实现代码为:Application onCreate()。
(2)监听App页面中的当前场景(Activity)的生命周期。实现代码为:ApplicationregisterActivityLifecycleCallbacks。
(3)监听页面,当页面中的控件层级关系(ViewTree)发生变化时,遍历页面中当前场景的控件层级关系中的所有控件,为每个所述控件的点击事件设置监听器。
为了全量监听页面控件的点击事件,那么需要在每个页面初始化后,遍历页面中每个控件,并在它们的点击事件的监听方法中加入相应的数据采集代码,用来生成相应的数据,在点击事件触发的时候,进行上报。当控件层级关系发生变化时,重新遍历所有控件并重新设定监听器。
每个控件拥有不同的监听器,目的是针对不同类型的控件来实现不同的监听方法。当某个控件被点击后,系统就会调用它的监听方法,进而调用增加的用于埋点采集的数据采集代码,从而达到采集控件的点击信息的目的。
(4)在每个所述控件的点击事件的所述监听器中均加入数据采集代码。
在数据采集代码中,如果当前控件已经存在控件ID,则使用此控件ID表示此控件的唯一;如果没有控件ID,则生成唯一ID来表示。生成的规则是:(页面源代码文件全路径+控件的XPath路径)的哈希值。
(5)当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集,将采集的数据保存在日志数据中,上报日志数据到服务器端。
以获取控件的点击信息为例进行说明:所采集的数据中包括控件的XPath路径和控件ID,终端将所采集的数据上报到服务端后,服务端从所采集的数据中获取控件的XPath路径,根据日志数据的条数和XPath路径计算出控件的点击次数。例如:在控件的点击事件被触发时,根据控件的层级关系,得到当前控件以及其父控件的XPath路径,代码语句为:DecorView/FrameLayout[1]/RelativeLayout[0]/Button[0],其中,DecorView为界面最顶层的视图,含义是:FrameLayout(帧布局)是DecorView的第2个子视图;RelativeLayout(相对布局)是FrameLayout的第1个子视图;Button(按钮)是RelativeLayout的第1个子视图。通过XPath路径计算某个父控件的点击总量。
除了获取控件的点击信息外,控件的其它的信息,比如文本控件的文本内容、控件的状态信息,也可以通过数据采集代码进行获取并上报给服务端。
图3是根据本发明实施例的页面数据采集装置的主要模块的示意图。如图3所示,本发明实施例的页面数据采集装置300主要包括:
控件遍历及监听器设置模块301,用于遍历页面中的所有控件,为每个所述控件的点击事件设置监听器。在页面初始化之后或者当页面中的控件层级关系发生变化时,遍历页面中的所有控件。根据控件类型为每个控件设置不同的监听器。
数据采集代码添加模块302,用于在每个所述控件的点击事件的所述监听器中均加入数据采集代码。按照采集的是点击数据、文本数据还是状态数据等,在监听器中对应加入不同的数据采集代码。
数据采集模块303,用于当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。当某个控件被点击后,系统就会调用它的监听器,进而调用增加的用于埋点采集的数据采集代码,从而采集到控件的数据。
另外,数据采集代码添加模块302,还用于:在每个所述控件的点击事件的所述监听器中均加入点击数据采集代码,所述点击数据采集代码中包括控件ID(控件的编号)。所述控件ID的生成过程包括:判断所述控件是否有控件ID,如果已有控件ID,则使用所述控件ID来唯一地标识所述控件;如果没有控件ID,则按照预设规则生成控件ID以唯一地标识所述控件。预设规则为:(页面源代码文件全路径+控件的XPath路径)的哈希值。
另外,数据采集代码添加模块302,还用于:将页面源代码文件全路径和所述控件的XPath路径拼接后的哈希值作为控件ID以唯一地标识所述控件。
另外,所述装置还包括:数据上报模块,用于将采集到的数据上报给服务端。获取计算模块,用于从所采集的数据中获取所述控件的XPath路径,根据XPath路径计算得到所述控件的点击次数。这两个模块并未在图上示出,且获取计算模块布设在服务端。
从以上描述可以看出,通过遍历页面中的所有控件并对控件的点击事件设置监听器,实现了页面内所有控件的自动化数据采集,同时无需研发人员事前在数据采集代码中进行手动埋点;通过给每个控件分别设置监听器,不同的监听器对应不同的监听方法,使得不同类型的控件实现不同的监听方法;通过加入数据采集代码并通过页面ID和页面控件ID定位到某一个具体控件,实现了页面内任何控件的点击数据的采集统计。
图4示出了可以应用本发明实施例的页面数据采集方法或页面数据采集装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所产生的点击事件提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的点击数据、文本内容等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本申请实施例所提供的页面数据采集方法一般由终端设备401、402、403执行,相应地,页面数据采集装置一般设置于终端设备401、402、403中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种计算机可读介质。
本发明的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种页面数据采集的方法。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种页面数据采集的方法。
下面参考图5,其示出了适用于来实现本发明实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有计算机系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文主要步骤图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括控件遍历及监听器设置模块、数据采集代码添加模块和数据采集模块。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,控件遍历及监听器设置模块还可以被描述为“遍历页面中的所有控件,为每个所述控件的点击事件设置监听器的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:遍历页面中的所有控件,为每个所述控件的点击事件设置监听器;在每个所述控件的点击事件的所述监听器中均加入数据采集代码;当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。
根据本发明的技术方案,通过遍历页面中的所有控件并对控件的点击事件设置监听器,实现了页面内所有控件的自动化数据采集,同时无需研发人员事前在数据采集代码中进行手动埋点;通过给每个控件分别设置监听器,不同的监听器对应不同的监听方法,使得不同类型的控件实现不同的监听方法;通过加入数据采集代码并通过页面ID和页面控件ID定位到某一个具体控件,实现了页面内任何控件的点击数据的采集统计。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (18)
1.一种页面数据采集的方法,其特征在于,包括:
遍历页面中的所有控件,为每个所述控件的点击事件设置监听器;
在每个所述监听器中均加入数据采集代码;
当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。
2.根据权利要求1所述的方法,其特征在于,所述遍历页面中的所有控件包括:在页面初始化之后或者当页面中的控件层级关系发生变化时,遍历页面中的所有控件。
3.根据权利要求1所述的方法,其特征在于,所述为每个所述控件的点击事件设置监听器包括:确定所述控件的类型,根据所述控件的类型对其点击事件设置监听器。
4.根据权利要求1所述的方法,其特征在于,所述在每个所述监听器中均加入数据采集代码,包括:在每个所述控件的点击事件的所述监听器中均加入点击数据采集代码,所述点击数据采集代码中包括控件ID。
5.根据权利要求4所述的方法,其特征在于,所述控件ID的生成过程包括:判断所述控件是否有控件ID,如果已有控件ID,则使用所述控件ID来唯一地标识所述控件;如果没有控件ID,则按照预设规则生成控件ID以唯一地标识所述控件。
6.根据权利要求5所述的方法,其特征在于,按照预设规则生成控件ID以唯一地标识所述控件,包括:将页面源代码文件全路径和所述控件的XPath路径拼接后的哈希值作为控件ID以唯一地标识所述控件。
7.根据权利要求1-6的任一项所述的方法,其特征在于,所述方法还包括:将采集到的数据上报给服务端。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:从所采集的数据中获取所述控件的XPath路径,根据XPath路径计算得到所述控件的点击次数。
9.一种页面数据采集的装置,其特征在于,包括:
控件遍历及监听器设置模块,用于遍历页面中的所有控件,为每个所述控件的点击事件设置监听器;
数据采集代码添加模块,用于在每个所述监听器中均加入数据采集代码;
数据采集模块,用于当监听到点击事件时,调用所述监听器中的所述数据采集代码以对所述控件进行数据采集。
10.根据权利要求9所述的装置,其特征在于,所述控件遍历及监听器设置模块,还用于:在页面初始化之后或者当页面中的控件层级关系发生变化时,遍历页面中的所有控件。
11.根据权利要求9所述的装置,其特征在于,所述控件遍历及监听器设置模块,还用于:确定所述控件的类型,根据所述控件的类型对其点击事件设置监听器。
12.根据权利要求9所述的装置,其特征在于,所述数据采集代码添加模块,还用于:在每个所述控件的点击事件的所述监听器中均加入点击数据采集代码,所述点击数据采集代码中包括控件ID。
13.根据权利要求12所述的装置,其特征在于,所述数据采集代码添加模块,还用于:判断所述控件是否有控件ID,如果已有控件ID,则使用所述控件ID来唯一地标识所述控件;如果没有控件ID,则按照预设规则生成控件ID以唯一地标识所述控件。
14.根据权利要求13所述的装置,其特征在于,所述数据采集代码添加模块,还用于:将页面源代码文件全路径和所述控件的XPath路径拼接后的哈希值作为控件ID以唯一地标识所述控件。
15.根据权利要求9-14的任一项所述的装置,其特征在于,所述装置还包括:数据上报模块,用于将采集到的数据上报给服务端。
16.根据权利要求14所述的装置,其特征在于,所述装置还包括:获取计算模块,用于从所采集的数据中获取所述控件的XPath路径,根据XPath路径计算得到所述控件的点击次数。
17.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710585423.8A CN107491488B (zh) | 2017-07-18 | 2017-07-18 | 页面数据采集的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710585423.8A CN107491488B (zh) | 2017-07-18 | 2017-07-18 | 页面数据采集的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107491488A true CN107491488A (zh) | 2017-12-19 |
CN107491488B CN107491488B (zh) | 2020-05-01 |
Family
ID=60644522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710585423.8A Active CN107491488B (zh) | 2017-07-18 | 2017-07-18 | 页面数据采集的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107491488B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038045A (zh) * | 2017-12-29 | 2018-05-15 | 上海新炬网络技术有限公司 | 基于无埋点的Android用户行为数据采集方法 |
CN108536589A (zh) * | 2018-03-26 | 2018-09-14 | 广州小鹏汽车科技有限公司 | 一种应用程序埋点方法及系统 |
CN108595168A (zh) * | 2018-03-30 | 2018-09-28 | 武汉斗鱼网络科技有限公司 | 自动打点方法、装置、可读存储介质及设备 |
CN108763016A (zh) * | 2018-05-15 | 2018-11-06 | 广州市千钧网络科技有限公司 | 一种采集用户行为数据的方法及装置 |
CN108829391A (zh) * | 2018-05-04 | 2018-11-16 | 武汉极意网络科技有限公司 | 一种Fragment中控件识别方法及系统 |
CN108845918A (zh) * | 2018-04-28 | 2018-11-20 | 努比亚技术有限公司 | 一种信息采集方法、终端及计算机可读存储介质 |
CN109729410A (zh) * | 2018-12-29 | 2019-05-07 | 北京字节跳动网络技术有限公司 | 一种直播间交互事件处理方法、装置、设备及存储介质 |
CN109739717A (zh) * | 2018-04-12 | 2019-05-10 | 京东方科技集团股份有限公司 | 一种页面数据采集的方法及装置、服务器 |
CN110046090A (zh) * | 2019-03-05 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 页面元素的定位方法及装置 |
CN110209386A (zh) * | 2019-05-17 | 2019-09-06 | 北京奇艺世纪科技有限公司 | 数据埋点的设置方法、埋点数据的获取方法及装置 |
CN110413520A (zh) * | 2019-07-22 | 2019-11-05 | 深圳证券交易所 | 页面测试中获取控件的方法、服务器及可读存储介质 |
WO2019218714A1 (zh) * | 2018-05-16 | 2019-11-21 | 众安信息技术服务有限公司 | 一种终端应用内容的评估方法及装置 |
CN110674017A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 埋点方法、装置及存储介质 |
CN110874307A (zh) * | 2018-08-29 | 2020-03-10 | 北京京东尚科信息技术有限公司 | 事件埋点的收集上报方法和装置 |
CN111158820A (zh) * | 2019-12-25 | 2020-05-15 | 网易传媒科技(北京)有限公司 | 控件点击事件处理方法、装置、电子设备及存储介质 |
CN111176770A (zh) * | 2019-12-19 | 2020-05-19 | 平安国际智慧城市科技股份有限公司 | 防止控件重复点击方法、装置及计算机可读存储介质 |
WO2020187117A1 (zh) * | 2019-03-18 | 2020-09-24 | 智慧芽信息科技(苏州)有限公司 | 附图页面的展示方法和装置、文本页面的展示方法和装置 |
CN112102008A (zh) * | 2020-09-25 | 2020-12-18 | 中国建设银行股份有限公司 | 一种可配置化的用户行为采集方法及装置 |
CN112395470A (zh) * | 2019-08-19 | 2021-02-23 | Tcl集团股份有限公司 | 终端系统中操作事件统计方法、装置、终端及存储介质 |
CN112463519A (zh) * | 2020-11-05 | 2021-03-09 | 广州博恒信息科技有限责任公司 | 基于Flutter的页面使用行为数据无埋点统计方法、设备及存储介质 |
CN113127851A (zh) * | 2020-01-16 | 2021-07-16 | 北京沃东天骏信息技术有限公司 | 数据收集方法和装置 |
CN113761310A (zh) * | 2020-07-07 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种采集点击数据的方法和装置 |
CN113778270A (zh) * | 2020-08-05 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种拖动图标的方法和装置 |
CN115017020A (zh) * | 2022-05-06 | 2022-09-06 | 易保网络技术(上海)有限公司 | 一种小程序页面的录屏方法、介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105589782A (zh) * | 2014-10-22 | 2016-05-18 | 中国银联股份有限公司 | 基于浏览器的用户行为采集方法 |
CN106776247A (zh) * | 2016-11-23 | 2017-05-31 | 腾云天宇科技(北京)有限公司 | 一种监控应用中控件的方法、服务器及系统 |
CN106844217A (zh) * | 2017-01-26 | 2017-06-13 | 网易(杭州)网络有限公司 | 对应用的控件进行埋点的方法及装置、可读存储介质 |
CN106933722A (zh) * | 2017-03-06 | 2017-07-07 | 腾云天宇科技(北京)有限公司 | 一种网页应用监控方法、服务器和系统 |
-
2017
- 2017-07-18 CN CN201710585423.8A patent/CN107491488B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105589782A (zh) * | 2014-10-22 | 2016-05-18 | 中国银联股份有限公司 | 基于浏览器的用户行为采集方法 |
CN106776247A (zh) * | 2016-11-23 | 2017-05-31 | 腾云天宇科技(北京)有限公司 | 一种监控应用中控件的方法、服务器及系统 |
CN106844217A (zh) * | 2017-01-26 | 2017-06-13 | 网易(杭州)网络有限公司 | 对应用的控件进行埋点的方法及装置、可读存储介质 |
CN106933722A (zh) * | 2017-03-06 | 2017-07-07 | 腾云天宇科技(北京)有限公司 | 一种网页应用监控方法、服务器和系统 |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038045B (zh) * | 2017-12-29 | 2020-09-29 | 上海新炬网络技术有限公司 | 基于无埋点的Android用户行为数据采集方法 |
CN108038045A (zh) * | 2017-12-29 | 2018-05-15 | 上海新炬网络技术有限公司 | 基于无埋点的Android用户行为数据采集方法 |
CN108536589A (zh) * | 2018-03-26 | 2018-09-14 | 广州小鹏汽车科技有限公司 | 一种应用程序埋点方法及系统 |
CN108595168A (zh) * | 2018-03-30 | 2018-09-28 | 武汉斗鱼网络科技有限公司 | 自动打点方法、装置、可读存储介质及设备 |
CN109739717B (zh) * | 2018-04-12 | 2021-01-26 | 京东方科技集团股份有限公司 | 一种页面数据采集的方法及装置、服务器 |
CN109739717A (zh) * | 2018-04-12 | 2019-05-10 | 京东方科技集团股份有限公司 | 一种页面数据采集的方法及装置、服务器 |
US11538046B2 (en) | 2018-04-12 | 2022-12-27 | Boe Technology Group Co., Ltd. | Page data acquisition method, apparatus, server, electronic device and computer readable medium |
CN108845918A (zh) * | 2018-04-28 | 2018-11-20 | 努比亚技术有限公司 | 一种信息采集方法、终端及计算机可读存储介质 |
CN108829391A (zh) * | 2018-05-04 | 2018-11-16 | 武汉极意网络科技有限公司 | 一种Fragment中控件识别方法及系统 |
CN108829391B (zh) * | 2018-05-04 | 2021-08-31 | 武汉极意网络科技有限公司 | 一种Fragment中控件识别方法及系统 |
CN108763016A (zh) * | 2018-05-15 | 2018-11-06 | 广州市千钧网络科技有限公司 | 一种采集用户行为数据的方法及装置 |
WO2019218714A1 (zh) * | 2018-05-16 | 2019-11-21 | 众安信息技术服务有限公司 | 一种终端应用内容的评估方法及装置 |
CN110674017A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 埋点方法、装置及存储介质 |
CN110674017B (zh) * | 2018-07-03 | 2023-04-28 | 百度在线网络技术(北京)有限公司 | 埋点方法、装置及存储介质 |
CN110874307A (zh) * | 2018-08-29 | 2020-03-10 | 北京京东尚科信息技术有限公司 | 事件埋点的收集上报方法和装置 |
CN109729410B (zh) * | 2018-12-29 | 2022-03-04 | 北京字节跳动网络技术有限公司 | 一种直播间交互事件处理方法、装置、设备及存储介质 |
CN109729410A (zh) * | 2018-12-29 | 2019-05-07 | 北京字节跳动网络技术有限公司 | 一种直播间交互事件处理方法、装置、设备及存储介质 |
CN110046090B (zh) * | 2019-03-05 | 2023-10-03 | 创新先进技术有限公司 | 页面元素的定位方法及装置 |
CN110046090A (zh) * | 2019-03-05 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 页面元素的定位方法及装置 |
WO2020187117A1 (zh) * | 2019-03-18 | 2020-09-24 | 智慧芽信息科技(苏州)有限公司 | 附图页面的展示方法和装置、文本页面的展示方法和装置 |
CN110209386A (zh) * | 2019-05-17 | 2019-09-06 | 北京奇艺世纪科技有限公司 | 数据埋点的设置方法、埋点数据的获取方法及装置 |
CN110209386B (zh) * | 2019-05-17 | 2023-07-21 | 北京奇艺世纪科技有限公司 | 数据埋点的设置方法、埋点数据的获取方法及装置 |
CN110413520A (zh) * | 2019-07-22 | 2019-11-05 | 深圳证券交易所 | 页面测试中获取控件的方法、服务器及可读存储介质 |
CN112395470A (zh) * | 2019-08-19 | 2021-02-23 | Tcl集团股份有限公司 | 终端系统中操作事件统计方法、装置、终端及存储介质 |
CN111176770B (zh) * | 2019-12-19 | 2023-04-18 | 深圳赛安特技术服务有限公司 | 防止控件重复点击方法、装置及计算机可读存储介质 |
CN111176770A (zh) * | 2019-12-19 | 2020-05-19 | 平安国际智慧城市科技股份有限公司 | 防止控件重复点击方法、装置及计算机可读存储介质 |
CN111158820A (zh) * | 2019-12-25 | 2020-05-15 | 网易传媒科技(北京)有限公司 | 控件点击事件处理方法、装置、电子设备及存储介质 |
CN111158820B (zh) * | 2019-12-25 | 2023-07-21 | 网易传媒科技(北京)有限公司 | 控件点击事件处理方法、装置、电子设备及存储介质 |
CN113127851A (zh) * | 2020-01-16 | 2021-07-16 | 北京沃东天骏信息技术有限公司 | 数据收集方法和装置 |
CN113761310A (zh) * | 2020-07-07 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种采集点击数据的方法和装置 |
CN113778270A (zh) * | 2020-08-05 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种拖动图标的方法和装置 |
CN112102008A (zh) * | 2020-09-25 | 2020-12-18 | 中国建设银行股份有限公司 | 一种可配置化的用户行为采集方法及装置 |
CN112463519A (zh) * | 2020-11-05 | 2021-03-09 | 广州博恒信息科技有限责任公司 | 基于Flutter的页面使用行为数据无埋点统计方法、设备及存储介质 |
CN115017020A (zh) * | 2022-05-06 | 2022-09-06 | 易保网络技术(上海)有限公司 | 一种小程序页面的录屏方法、介质及电子设备 |
CN115017020B (zh) * | 2022-05-06 | 2024-02-09 | 易保网络技术(上海)有限公司 | 一种小程序页面的录屏方法、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107491488B (zh) | 2020-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107491488A (zh) | 页面数据采集的方法和装置 | |
US20180349482A1 (en) | Automatic triage model execution in machine data driven monitoring automation apparatus with visualization | |
CN104572035B (zh) | 网页代码的动态生成方法和动态生成系统 | |
CN109920522A (zh) | 一种居民健康管理医疗大数据平台 | |
CN107729106A (zh) | 一种在应用程序组件间实现快速跳转的方法和装置 | |
CN109857935A (zh) | 一种信息推荐方法及装置 | |
CN108491267A (zh) | 用于生成信息的方法和装置 | |
CN1688979A (zh) | 用于事务流水线分解的方法和系统 | |
CN105653559A (zh) | 用于在数据库中进行搜索的方法和装置 | |
CN108228906B (zh) | 用于生成信息的方法和装置 | |
CN110196790A (zh) | 异常监控的方法和装置 | |
CN109446274A (zh) | 大数据平台bi元数据管理的方法和装置 | |
CN102768664A (zh) | 分布式网页广告拦截的方法及系统 | |
US9607081B2 (en) | Ontology based categorization of users | |
CN107480277A (zh) | 用于网站日志采集的方法及装置 | |
CN107506256A (zh) | 一种崩溃数据监控的方法和装置 | |
CN107679119A (zh) | 生成品牌衍生词的方法和装置 | |
CN107491382A (zh) | 日志输出方法和装置 | |
CN110019503A (zh) | Redis集群的扩容和/或缩容的方法及装置 | |
CN107766509A (zh) | 一种网页静态备份的方法和装置 | |
CN109634833A (zh) | 一种软件缺陷预测方法和装置 | |
CN107819616A (zh) | 自动提取日志的方法、装置及系统 | |
CN107346344A (zh) | 文本匹配的方法和装置 | |
CN105871940A (zh) | 信息推荐方法和系统 | |
CN110069693A (zh) | 用于确定目标页面的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |