CN112989162B - 埋点上报方法、装置、设备及存储介质 - Google Patents

埋点上报方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112989162B
CN112989162B CN202110270340.6A CN202110270340A CN112989162B CN 112989162 B CN112989162 B CN 112989162B CN 202110270340 A CN202110270340 A CN 202110270340A CN 112989162 B CN112989162 B CN 112989162B
Authority
CN
China
Prior art keywords
page
buried
event behavior
point
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110270340.6A
Other languages
English (en)
Other versions
CN112989162A (zh
Inventor
林晓滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202110270340.6A priority Critical patent/CN112989162B/zh
Publication of CN112989162A publication Critical patent/CN112989162A/zh
Application granted granted Critical
Publication of CN112989162B publication Critical patent/CN112989162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据采集技术领域,公开了一种埋点上报方法、装置、设备及存储介质。该方法包括:实时监听网页中曝光埋点对应的事件行为;当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。本发明提高了埋点上报的效率。

Description

埋点上报方法、装置、设备及存储介质
技术领域
本发明涉及数据采集技术领域,尤其涉及一种埋点上报方法、装置、设备及存储介质。
背景技术
埋点是互联网产品中获得用户行为分析数据的一种手段,而曝光埋点则是其中重要的一环。曝光埋点指的是对页面中展现的内容进行记录并上传的过程,不同于点击埋点,曝光埋点的上报更加频繁,消耗流量也更大。
为了获取业务逻辑和产品模块的用户行为数据,对大量流程环节添加埋点必不可少,但是随着业务线拆分和项目不断迭代,使用的埋点越来越多,但是埋点上报的过程通常依赖于产品经理之间的沟通,不仅成本大,而且效率低。
发明内容
本发明的主要目的在于解决目前埋点上报的效率低的技术问题。
本发明第一方面提供了一种埋点上报方法,所述埋点上报方法包括:
实时监听网页中曝光埋点对应的事件行为;
当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
可选的,在本发明第一方面的第一种实现方式中,所述实时监听网页中曝光埋点对应的事件行为包括:
加载网页,并创建所述网页的监听器;
通过所述监听器设置所述网页和预置曝光埋点的相交区域;
对所述相交区域中的所述曝光埋点进行实时监听,以检测所述曝光埋点对应的事件行为。
可选的,在本发明第一方面的第二种实现方式中,所述当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据包括:
当监听到所述事件行为时,获取网页视窗中所述事件行为产生的页面元素数据,得到初始事件行为数据;
对所述初始事件行为数据进行数据清洗,得到标准事件行为数据;
对所述标准事件行为数据进行统计和拼装,得到所述曝光埋点对应的事件行为数据。
可选的,在本发明第一方面的第三种实现方式中,所述根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素包括:
对所述事件行为数据进行特征信息提取,得到上下文特征信息;
对所述上下文特征信息进行元素匹配,得到埋点页面元素;
获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素。
可选的,在本发明第一方面的第四种实现方式中,所述获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素包括:
获取所述埋点页面元素在所述网页上的完整路径,得到初始XPATH路径信息;
获取所述埋点页面元素的属性信息,并根据所述属性信息,对所述初始XPATH路径信息进行调整,得到埋点页面元素路径信息;
对所述埋点页面元素路径信息进行路径匹配,得到与所述路径信息对应的根元素。
可选的,在本发明第一方面的第五种实现方式中,所述计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值包括:
获取所述埋点页面元素距离网页视窗顶部的第一距离和所述埋点页面元素自身的第一高度,以及获取所述根元素距离网页视窗顶部的第二距离和所述根元素自身的第二高度;
根据所述第一距离和所述第一高度,计算所述埋点页面元素出现在网页视窗内的第一百分比,以及根据所述第二距离和所述第二高度,计算所述根元素出现在网页视窗内的第二百分比;
根据所述第一百分比和所述第二百分比,调用预置交叉观察者计算所述埋点页面元素和所述根元素的交叉比,得到页面交叉比值。
可选的,在本发明第一方面的第六种实现方式中,所述基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据包括:
判断所述页面交叉比值是否超过预置回调阈值;
若是,则采用预置回调函数,上报所述曝光埋点对应的事件行为数据。
本发明第二方面提供了一种埋点上报装置,所述埋点上报装置包括:
监听模块,用于实时监听网页中曝光埋点对应的事件行为;
预处理模块,用于当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
元素确定模块,用于根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
比值计算模块,用于计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
埋点上报模块,用于基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
可选的,在本发明第二方面的第一种实现方式中,所述监听模块具体用于:
加载网页,并创建所述网页的监听器;
通过所述监听器设置所述网页和预置曝光埋点的相交区域;
对所述相交区域中的所述曝光埋点进行实时监听,以检测所述曝光埋点对应的事件行为。
可选的,在本发明第二方面的第二种实现方式中,所述预处理模块具体用于:
当监听到所述事件行为时,获取网页视窗中所述事件行为产生的页面元素数据,得到初始事件行为数据;
对所述初始事件行为数据进行数据清洗,得到标准事件行为数据;
对所述标准事件行为数据进行统计和拼装,得到所述曝光埋点对应的事件行为数据。
可选的,在本发明第二方面的第三种实现方式中,所述元素确定模块还包括:
页面元素确定单元,用于对所述事件行为数据进行特征信息提取,得到上下文特征信息;对所述上下文特征信息进行元素匹配,得到埋点页面元素;
根元素确定单元,用于获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素。
可选的,在本发明第二方面的第四种实现方式中,所述根元素确定单元具体用于:
获取所述埋点页面元素在所述网页上的完整路径,得到初始XPATH路径信息;
获取所述埋点页面元素的属性信息,并根据所述属性信息,对所述初始XPATH路径信息进行调整,得到埋点页面元素路径信息;
对所述埋点页面元素路径信息进行路径匹配,得到与所述路径信息对应的根元素。
可选的,在本发明第二方面的第五种实现方式中,所述比值计算模块具体用于:
获取所述埋点页面元素距离网页视窗顶部的第一距离和所述埋点页面元素自身的第一高度,以及获取所述根元素距离网页视窗顶部的第二距离和所述根元素自身的第二高度;
根据所述第一距离和所述第一高度,计算所述埋点页面元素出现在网页视窗内的第一百分比,以及根据所述第二距离和所述第二高度,计算所述根元素出现在网页视窗内的第二百分比;
根据所述第一百分比和所述第二百分比,调用预置交叉观察者计算所述埋点页面元素和所述根元素的交叉比,得到页面交叉比值。
可选的,在本发明第二方面的第六种实现方式中,所述埋点上报模块具体用于:
判断所述页面交叉比值是否超过预置回调阈值;
若是,则采用预置回调函数,上报所述曝光埋点对应的事件行为数据。
本发明第三方面提供了一种埋点上报设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述埋点上报设备执行上述的埋点上报方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的埋点上报方法。
本发明提供的技术方案中,鉴于现有埋点上报效率低,因此,采用滚动方式,监听网页中曝光埋点的事件行为,并对所述事件行为产生的数据进行预处理,得到事件行为数据,滚动监听可以实现对网页中埋点产生的事件行为进行实时监听,对产生的数据进行自动收集;根据所述曝光埋点的事件行为数据,确定所述网页中的埋点页面元素和根元素;计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;若所述页面交叉比值超过预置回调阈值,则将所述曝光埋点上报至预置服务器,页面交叉比值超过阈值时,元素要完全展示在页面上才会进行记录,这样数据会更加真实准确。本发明通过计算元素与页面的相对位置,提高了埋点上报的效率。
附图说明
图1为本发明实施例中埋点上报方法的第一个实施例示意图;
图2为本发明实施例中埋点上报方法的第二个实施例示意图;
图3为本发明实施例中埋点上报方法的第三个实施例示意图;
图4为本发明实施例中埋点上报方法的第四个实施例示意图;
图5为本发明实施例中埋点上报装置的一个实施例示意图;
图6为本发明实施例中埋点上报设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种埋点上报方法、装置、设备及存储介质。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中埋点上报方法的第一个实施例包括:
101、实时监听网页中曝光埋点对应的事件行为;
可以理解的是,本发明的执行主体可以为埋点上报装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
本实施例中,埋点指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。当网页滚动时,顶部通栏的透明度随着页面卷曲的高度增加而变大,当页面滚动距离超过某一个高度时,透明度就固定不变,对网页中埋点产生的事件行为进行监听,对产生的数据进行自动收集。
例如:如果想获取某商品的点击数量,就得在点击事件的中搜集点击的商品数据,发出包含商品名称和点击事件的数据。
例如:在注册按钮,下单按钮等加载了监测代码,便可知道用户是否点击这些按钮,频次如何转化如何。
例如:tab栏的点击,某个icon的点击、基于新闻客户端提供的能力、可以拿到设备信息、已登录用户的个人信息、ua等,自动收集,然后存储起来。
可选的,在一实施例中,所述实时监听网页中曝光埋点对应的事件行为包括:
加载网页,并创建所述网页的监听器;
通过所述监听器设置所述网页和预置曝光埋点的相交区域;
对所述相交区域中的所述曝光埋点进行实时监听,以检测所述曝光埋点对应的事件行为。
本实施例中,要想监听相交区域,需要先创建监听器,设置完相交区域后再开始监听,监听器SDK会把根据每个曝光埋点信息,生成一个ViewVisitor。ViewVisitor的作用就是把path数组里面指向的所有View元素都找到,并且根据event_type,给这个View元素设置相应的行为监听器,当这个View发生指定行为时,监听器就会监听到,并记录事件行为。若出现在指定时间内页面未发生滚动,或者在指定时间内页面中的模块元素的移动距离不超过预设值时,判定发生所述停留事件。例如:添加页面滚动监听事件后,监听页面滚动。实现只有在1s内页面未发生滚动或者相对移动距离不超过150像素(可设定)时,认为此时页面发生一次停留事件,触发观察者对象的发布事件。
102、当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
本实施例中,事件行为产生的数据进行预处理,所述预处理包括:清洗、统计和拼装。
本实施例中,对数据进行清洗是筛查数据,确保这些数据是可以被允许被上传的,再统计这些数据进行统一处理,然后按照数据协议的约定对筛查后的数据进行拼装打包,最后建立与数据接入层的通讯,完成数据的预处理。
103、根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
本实施例中,根据路径信息匹配埋点页面元素对应的根元素,路径信息包括:埋点页面元素(props)到根元素的路径元素的自身特征信息(eleprops)以及每个路径元素对应的索引值(index),其中,路径信息可以为对路径元素的自身特征信息(eleprops)以及索引值(index)进行排列组合的数组。
104、计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
本实施例中,首先分别计算页面元素出现在窗口的百分比,以及计算根元素出现在窗口的百分比,再对两个百分比计算交叉百分比,得到交叉比值。交叉比值是窗口函数计算埋点页面元素百分比和根元素的百分比,并通过埋点页面的pv/总的pv。
105、基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
本实施例中,在创建实例时传入配置,其中回调阈值是比较重要的一项配置,它可以控制触发回调的时机。当交叉比值超过阈值时,元素要完全展示在页面上才会进行记录,这样数据会更加真实准确。
可选的,在一实施例中,所述基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据包括:
判断所述页面交叉比值是否超过预置回调阈值;
若是,则采用预置回调函数,上报所述曝光埋点对应的事件行为数据。
本实施例中,判断元素是否显示于页面上,则执行回调函数,通知元素出现在页面上,当埋点页面元素在目标视口区域内出现的比例达到预设比例时,调用回调函数上报元素的埋点数据。例如:假设回调阀值设为1,当只有交叉比值达到1时才触发回调函数,对曝光埋点对应的事件行为数据进行上报。
本实施例中,上报的事件行为数据,例如:用户在访问页面时点击的页面内容信息,用户在该页面的停留时间的信息,以及该页面曝光的各模块信息,甚至还可以包括用户在访问该页面时点击的子页面的信息。
本发明实施例中,鉴于现有埋点上报效率低,因此,采用滚动方式,监听网页中曝光埋点的事件行为,并对所述事件行为产生的数据进行预处理,得到事件行为数据,滚动监听可以实现对网页中埋点产生的事件行为进行实时监听,对产生的数据进行自动收集;根据所述曝光埋点的事件行为数据,确定所述网页中的埋点页面元素和根元素;计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;若所述页面交叉比值超过预置回调阈值,则将所述曝光埋点上报至预置服务器,页面交叉比值超过阈值时,元素要完全展示在页面上才会进行记录,这样数据会更加真实准确。本发明通过计算元素与页面的相对位置,提高了埋点上报的效率。
请参阅图2,本发明实施例中埋点上报方法的第二个实施例包括:
201、实时监听网页中曝光埋点对应的事件行为;
202、当监听到所述事件行为时,获取网页视窗中所述事件行为产生的页面元素数据,得到初始事件行为数据;
203、对所述初始事件行为数据进行数据清洗,得到标准事件行为数据;
204、对所述标准事件行为数据进行统计和拼装,得到所述曝光埋点对应的事件行为数据;
本实施例中,获取所述事件行为产生的数据,得到初始事件行为数据,例如:访问数(Visits),访客数(Visitor),停留时长(Time On Site),页面浏览数(Page Views)和跳出率(Bounce Rate)。这样的信息收集可以分为两种:页面统计(track this virtual pageview),统计操作行为(track this button by an event)。
本实施例中,对初始事件行为数据进行清洗包括:筛查初始事件行为数据,确保数据是被允许被上传的,再统计这些数据进行统一处理,然后按照数据协议的约定对筛查后的数据进行拼装打包,最后建立与数据接入层的通讯,完成数据的预处理。
205、根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
206、计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
207、基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
本发明实施例中,对事件行为数据进行预处理,是为了确保确保曝光埋点的事件行为数据是可以被允许被上传的,再统计这些数据进行统一处理,然后按照数据协议的约定对筛查后的数据进行拼装打包,对曝光埋点数据按照事件行为进行聚类,最后建立与数据接入层的通讯,处理后的埋点数据可以更加快速的确定页面元素和根元素,实现对曝光埋点的有效监听和发布事件的功能。
请参阅图3,本发明实施例中埋点上报方法的第三个实施例包括:
301、实时监听网页中曝光埋点对应的事件行为;
302、当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
303、对所述事件行为数据进行特征信息提取,得到上下文特征信息;
304、对所述上下文特征信息进行元素匹配,得到埋点页面元素;
305、获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素;
本实施例中,通过上下文特征信息查询埋点的页面元素,使得在源代码被修改、二次构建之后,埋点的页面元素始终拥有埋点信息。上下文特征信息包括:页面元素(props)的自身特征信息(eleprops)、相邻页面元素特征信息(elements)以及页面元素相对于根元素的路径信息。
本实施例中,页面元素包括图标、文字、图片以及按钮等多种。通过鼠标点击操作网页视窗中的页面元素,例如:块级元素:比如h1-h6、p、div、ul、table等具有块的属性,能够独立存在且元素之间以换行分割,属于块级元素(Block-level element)、顶级元素:比如html、body以及框架等,是属于顶级元素,其表现类似块级元素,同样适用于框模型、内联元素:指依附其他块级元素存在,紧接于被联元素之间显示而不换行。根元素就是告诉浏览器,在<html>和</html>之间的内容是HTML类型,浏览器便按HTML进行解析其中的内容,通过页面元素的路径信息确定根元素。
可选的,在一实施例中,上述步骤305包括:
获取所述埋点页面元素在所述网页上的完整路径,得到初始XPATH路径信息;
获取所述埋点页面元素的属性信息,并根据所述属性信息,对所述初始XPATH路径信息进行调整,得到埋点页面元素路径信息;
对所述埋点页面元素路径信息进行路径匹配,得到与所述路径信息对应的根元素。
本实施例中,获取埋点页面元素的父级元素,并获取父级元素的父级元素,直至获得的父级元素为html元素结束,然后,将所获取的所有父级元素依次连接,生成元素的初始XPATH路径。获取埋点页面元素的属性信息,并根据该属性信息,对初始XPATH路径进行调整,其中,属性信息包括属性类型及属性类型对应的属性值,从而根据属性信息和初始XPATH路径匹配到埋点页面元素对应的根元素。
306、计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
307、基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
本发明实施例中,通过上下文特征信息查询埋点的页面元素,使得在源代码被修改、二次构建之后,埋点的页面元素始终拥有埋点信息,页面元素和根元素的确定,因此在进行根元素的查询时,针对页面元素的信息,有效提高了埋点设置的效率以及准确性,埋点上报自主的来埋点操作系统添加埋点信息,把整个页面元素和根元素的信息获取流程化,提高了埋点上报的效率。
请参阅图4,本发明实施例中埋点上报方法的第四个实施例包括:
401、实时监听网页中曝光埋点对应的事件行为;
402、当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
403、根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
404、获取所述埋点页面元素距离网页视窗顶部的第一距离和所述埋点页面元素自身的第一高度,以及获取所述根元素距离网页视窗顶部的第二距离和所述根元素自身的第二高度;
405、根据所述第一距离和所述第一高度,计算所述埋点页面元素出现在网页视窗内的第一百分比,以及根据所述第二距离和所述第二高度,计算所述根元素出现在网页视窗内的第二百分比;
406、根据所述第一百分比和所述第二百分比,调用预置交叉观察者计算所述埋点页面元素和所述根元素的交叉比,得到页面交叉比值;
本实施例中,获取页面元素和根元素距离页面的窗口顶部的距离,实时计算页面元素和根元素出现在窗口内的百分比,不会引发浏览器重新渲染该元素,因此,浏览器的性能不会受影响。另外,在页面开发阶段,不必在业务代码中增加额外的函数逻辑,只需为元素添加上报属性和埋点数据就可对元素进行信息上报。
本实施例中,获取所述埋点页面元素距离网页视窗顶部的第一距离和所述埋点页面元素自身的第一高度,根据所述第一距离和所述第一高度,计算所述埋点页面元素出现在网页视窗内的第一百分比,埋点页面元素距离网页视窗顶部的距离=埋点页面元素距离文档顶端偏移值-网页被卷起来的高度,例如:当埋点页面元素距离文档顶端偏移值为3像素,网页被卷起来的高度为1像素,则埋点页面元素距离网页视窗顶部的距离=3像素-1像素=2像素,埋点页面元素的自身高度为5像素,则埋点页面元素出现在网页视窗内的第一百分比=埋点页面元素距离网页视窗顶部的距离/埋点页面元素自身的高度=2像素/5像素=40%。本实施例根元素出现在网页视窗内的第二百分比计算过程与埋点页面元素出现在网页视窗内的第一百分比的计算过程相同。调用预置交叉观察者计算所述埋点页面元素和所述根元素的交叉比,得到页面交叉比值,所述页面交叉比值用于判断埋点页面元素和根元素的交叉状态,例如:当埋点页面元素出现在网页视窗内的第一百分比为40%,根元素出现在网页视窗内的第二百分比为20%,因此,页面交叉比值=第一百分比/第二百分比=40%/20%=2,调用交叉观察者可监测该埋点页面元素在网页视窗内的展示比例,即页面交叉比值。当确定该埋点页面元素在网页视窗内的页面交叉比值达到预设回调阈值时,上报该埋点页面元素的事件行为数据。
407、基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
本发明实施例中,计算页面元素和根元素的交叉比值是用于判断页面元素和根元素的交叉状态,首先提取所述页面元素距离网页视窗顶部的距离和页面元素自身的高度,以及提取所述根元素距离网页视窗顶部的距离和根元素自身的高度,再分别计算页面元素的百分比和根元素的百分比,就能达到当被观察元素出现在视窗中,便自动进行计算交叉比值,所述交叉比值用于触发回调函数并对埋点数据进行上报。
上面对本发明实施例中埋点上报方法进行了描述,下面对本发明实施例中埋点上报装置进行描述,请参阅图5,本发明实施例中埋点上报装置一个实施例包括:
监听模块501,用于实时监听网页中曝光埋点对应的事件行为;
预处理模块502,用于当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
元素确定模块503,用于根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
比值计算模块504,用于计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
埋点上报模块505,用于基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
可选的,在一实施例中,所述监听模块501具体用于:
加载网页,并创建所述网页的监听器;
通过所述监听器设置所述网页和预置曝光埋点的相交区域;
对所述相交区域中的所述曝光埋点进行实时监听,以检测所述曝光埋点对应的事件行为。
可选的,在一实施例中,所述预处理模块502具体用于:
当监听到所述事件行为时,获取网页视窗中所述事件行为产生的页面元素数据,得到初始事件行为数据;
对所述初始事件行为数据进行数据清洗,得到标准事件行为数据;
对所述标准事件行为数据进行统计和拼装,得到所述曝光埋点对应的事件行为数据。
可选的,在一实施例中,所述元素确定模块503还包括:
页面元素确定单元5031,用于对所述事件行为数据进行特征信息提取,得到上下文特征信息;对所述上下文特征信息进行元素匹配,得到埋点页面元素;
根元素确定单元5032,用于获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素。
可选的,在一实施例中,所述根元素确定单元5032具体用于:
获取所述埋点页面元素在所述网页上的完整路径,得到初始XPATH路径信息;
获取所述埋点页面元素的属性信息,并根据所述属性信息,对所述初始XPATH路径信息进行调整,得到埋点页面元素路径信息;
对所述埋点页面元素路径信息进行路径匹配,得到与所述路径信息对应的根元素。
可选的,在一实施例中,所述比值计算模块504具体用于:
获取所述埋点页面元素距离网页视窗顶部的第一距离和所述埋点页面元素自身的第一高度,以及获取所述根元素距离网页视窗顶部的第二距离和所述根元素自身的第二高度;
根据所述第一距离和所述第一高度,计算所述埋点页面元素出现在网页视窗内的第一百分比,以及根据所述第二距离和所述第二高度,计算所述根元素出现在网页视窗内的第二百分比;
根据所述第一百分比和所述第二百分比,调用预置交叉观察者计算所述埋点页面元素和所述根元素的交叉比,得到页面交叉比值。
可选的,在一实施例中,所述埋点上报模块505具体用于:
判断所述页面交叉比值是否超过预置回调阈值;
若是,则采用预置回调函数,上报所述曝光埋点对应的事件行为数据。
本发明实施例中,鉴于现有埋点上报效率低,因此,采用滚动方式,监听网页中曝光埋点的事件行为,并对所述事件行为产生的数据进行预处理,得到事件行为数据,滚动监听可以实现对网页中埋点产生的事件行为进行实时监听,对产生的数据进行自动收集;根据所述曝光埋点的事件行为数据,确定所述网页中的埋点页面元素和根元素;计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;若所述页面交叉比值超过预置回调阈值,则将所述曝光埋点上报至预置服务器,页面交叉比值超过阈值时,元素要完全展示在页面上才会进行记录,这样数据会更加真实准确。本发明通过计算元素与页面的相对位置,提高了埋点上报的效率。
上面图5从模块化功能实体的角度对本发明实施例中的埋点上报装置进行详细描述,下面从硬件处理的角度对本发明实施例中埋点上报设备进行详细描述。
图6是本发明实施例提供的一种埋点上报设备的结构示意图,该埋点上报设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对埋点上报设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在埋点上报设备600上执行存储介质630中的一系列指令操作。
埋点上报设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的埋点上报设备结构并不构成对埋点上报设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种埋点上报设备,所述埋点上报设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述埋点上报方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述埋点上报方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种埋点上报方法,其特征在于,所述埋点上报方法包括:
实时监听网页中曝光埋点对应的事件行为;
当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据;
所述实时监听网页中曝光埋点对应的事件行为包括:
加载网页,并创建所述网页的监听器;
通过所述监听器设置所述网页和预置曝光埋点的相交区域;
对所述相交区域中的所述曝光埋点进行实时监听,以检测所述曝光埋点对应的事件行为;
所述当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据包括:
当监听到所述事件行为时,获取网页视窗中所述事件行为产生的页面元素数据,得到初始事件行为数据;
对所述初始事件行为数据进行数据清洗,得到标准事件行为数据;
对所述标准事件行为数据进行统计和拼装,得到所述曝光埋点对应的事件行为数据;
所述根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素包括:
对所述事件行为数据进行特征信息提取,得到上下文特征信息;
对所述上下文特征信息进行元素匹配,得到埋点页面元素;
获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素;
所述计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值包括:
获取所述埋点页面元素距离网页视窗顶部的第一距离和所述埋点页面元素自身的第一高度,以及获取所述根元素距离网页视窗顶部的第二距离和所述根元素自身的第二高度;
根据所述第一距离和所述第一高度,计算所述埋点页面元素出现在网页视窗内的第一百分比,以及根据所述第二距离和所述第二高度,计算所述根元素出现在网页视窗内的第二百分比;
根据所述第一百分比和所述第二百分比,调用预置交叉观察者计算所述埋点页面元素和所述根元素的交叉比,得到页面交叉比值。
2.根据权利要求1所述的埋点上报方法,其特征在于,所述获取所述埋点页面元素的路径信息并进行路径匹配,得到与所述路径信息对应的根元素包括:
获取所述埋点页面元素在所述网页上的完整路径,得到初始XPATH路径信息;
获取所述埋点页面元素的属性信息,并根据所述属性信息,对所述初始XPATH路径信息进行调整,得到埋点页面元素路径信息;
对所述埋点页面元素路径信息进行路径匹配,得到与所述路径信息对应的根元素。
3.根据权利要求1所述的埋点上报方法,其特征在于,所述基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据包括:
判断所述页面交叉比值是否超过预置回调阈值;
若是,则采用预置回调函数,上报所述曝光埋点对应的事件行为数据。
4.一种埋点上报装置,其特征在于,所述埋点上报装置用于执行如权利要求1-3中任一项所述的埋点上报方法,所述埋点上报装置包括:
监听模块,用于实时监听网页中曝光埋点对应的事件行为;
预处理模块,用于当监听到所述事件行为时,获取所述事件行为产生的数据并进行预处理,得到所述曝光埋点对应的事件行为数据;
元素确定模块,用于根据所述事件行为数据,确定所述网页中的埋点页面元素,并匹配与所述埋点页面元素对应的根元素;
比值计算模块,用于计算所述埋点页面元素和所述根元素的页面交叉百分比,得到页面交叉比值;
埋点上报模块,用于基于所述页面交叉比值的大小,确定是否上报所述曝光埋点对应的事件行为数据。
5.一种埋点上报设备,其特征在于,所述埋点上报设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述埋点上报设备执行如权利要求1-3中任一项所述的埋点上报方法。
6.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-3中任一项所述的埋点上报方法。
CN202110270340.6A 2021-03-12 2021-03-12 埋点上报方法、装置、设备及存储介质 Active CN112989162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110270340.6A CN112989162B (zh) 2021-03-12 2021-03-12 埋点上报方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110270340.6A CN112989162B (zh) 2021-03-12 2021-03-12 埋点上报方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112989162A CN112989162A (zh) 2021-06-18
CN112989162B true CN112989162B (zh) 2023-09-29

Family

ID=76334757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110270340.6A Active CN112989162B (zh) 2021-03-12 2021-03-12 埋点上报方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112989162B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114385942B (zh) * 2022-01-14 2024-08-27 平安付科技服务有限公司 基于用户行为的页面元素参数优化方法、装置及设备
CN114860600B (zh) * 2022-05-12 2024-05-28 平安科技(深圳)有限公司 可视化数据埋点方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083459A (zh) * 2019-03-16 2019-08-02 平安城市建设科技(深圳)有限公司 跨页面的数据埋点方法、装置、设备及存储介质
CN110795325A (zh) * 2019-10-30 2020-02-14 江苏满运软件科技有限公司 一种可视化埋点方法、装置、设备和存储介质
CN111159600A (zh) * 2019-12-27 2020-05-15 北京达佳互联信息技术有限公司 页面上元素的信息上报方法、装置、电子设备及存储介质
CN111427741A (zh) * 2020-02-26 2020-07-17 中国平安人寿保险股份有限公司 埋点上报方法及相关产品
CN112306487A (zh) * 2019-08-21 2021-02-02 北京字节跳动网络技术有限公司 一种埋点数据上报方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083459A (zh) * 2019-03-16 2019-08-02 平安城市建设科技(深圳)有限公司 跨页面的数据埋点方法、装置、设备及存储介质
CN112306487A (zh) * 2019-08-21 2021-02-02 北京字节跳动网络技术有限公司 一种埋点数据上报方法、装置、设备及存储介质
CN110795325A (zh) * 2019-10-30 2020-02-14 江苏满运软件科技有限公司 一种可视化埋点方法、装置、设备和存储介质
CN111159600A (zh) * 2019-12-27 2020-05-15 北京达佳互联信息技术有限公司 页面上元素的信息上报方法、装置、电子设备及存储介质
CN111427741A (zh) * 2020-02-26 2020-07-17 中国平安人寿保险股份有限公司 埋点上报方法及相关产品

Also Published As

Publication number Publication date
CN112989162A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
US11949750B2 (en) System and method for tracking browsing activity
CN1949259B (zh) 通过在网页中嵌入代码来采集网页的点击信息的方法
CN107463641B (zh) 用于改进对搜索结果的访问的系统和方法
EP1652080B1 (en) System and method for high-performance profiling of application events
CN112989162B (zh) 埋点上报方法、装置、设备及存储介质
US20090006995A1 (en) Associating Website Clicks With Links On A Web Page
CN110263070B (zh) 事件上报方法及装置
WO2006133105A2 (en) Web usage overlays for third-party web plug-in content
CA2518109A1 (en) Associating website clicks with links on a web page
CN110262952B (zh) 一种发送埋点曝光数据的方法及设备
CN104765689A (zh) 一种接口性能数据实时监制方法和装置
CN112380473A (zh) 数据采集与同步方法、装置、设备及存储介质
US20180121309A1 (en) Application Monitoring
CN107025237A (zh) 一种页面点击分布图的生成方法及系统
CN109240664B (zh) 一种采集用户行为信息的方法及终端
CN107451049A (zh) 使用真实用户监测数据进行客户端瓶颈分析
US10140377B2 (en) Data processing, data collection
CN111177623A (zh) 信息处理方法及装置
CN103618773A (zh) 热力图的显示方法、装置及系统
CN114064144A (zh) 一种跨应用数据获取的通信插件以及通信方法
CN113449169B (zh) 一种基于rpa的舆情数据获取方法及系统
CN111435326A (zh) 一种分析崩溃日志的方法和装置
CN105975395A (zh) 网站状态侦察方法及装置
CN100437740C (zh) 站点点击与网页上链接的关联
CN113515715B (zh) 埋点事件编码的生成方法、处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant