CN109582548B - 一种基于无埋点的页面元素圈选方法及装置 - Google Patents
一种基于无埋点的页面元素圈选方法及装置 Download PDFInfo
- Publication number
- CN109582548B CN109582548B CN201710898211.5A CN201710898211A CN109582548B CN 109582548 B CN109582548 B CN 109582548B CN 201710898211 A CN201710898211 A CN 201710898211A CN 109582548 B CN109582548 B CN 109582548B
- Authority
- CN
- China
- Prior art keywords
- page
- path
- page element
- path information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于无埋点的页面元素圈选方法及装置,涉及信息采集与处理技术领域,主要目的在于克服相同页面元素的页面路径中存在的差异,提高页面元素圈选的成功率。本发明主要的技术方案为:获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息;若存在,则将所述第二页面元素确定为与所述第一页面元素相同的圈选对象。本发明主要用于圈选页面元素。
Description
技术领域
本发明涉及信息采集与处理技术领域,尤其涉及一种基于无埋点的页面元素圈选方法及装置。
背景技术
大数据时代的到来意味着数据量的爆炸,也意味着收集数据的难度将大幅增加。为了将海量的数据收集起来,埋点技术应运而生。然而随着大数据的发展和深入,客户的要求越来越高,埋点技术开始变得力不从心,埋点技术通过在代码的关键部位植入统计代码,追踪用户的点击行为;或者植入多段代码,追踪用户的连续行为;并通过建立模型等方法,得出用户操作行为;最终作为建立产品数据系统的一个环节准确的收集数据。然而埋点的前期准备时间过长、埋点过程较慢,并且一旦数据存在问题,想要纠正就需要重新埋点,导致其工作效率低下。
基于上述埋点采集数据存在的弊端,无埋点技术凭借使用门槛极低,简洁的布局操作,一键分析数据等特点成为了当前页面数据采集的新兴技术,所谓无埋点技术,并非完全不用埋点,而是不用在设置代码前先行定义需要采集的事件或功能,不需要工程师不断部署代码,客户加载了一段GrowingIO的JS或SDK代码后,就可以在页面或者是应用程序自动进行埋点,智能抓取关键用户行为,实现快速收集数据。
然而,目前的无埋点技术在圈选多个页面中的相同页面元素时所采用的是使用页面路径进行完全匹配的方式,而不同页面中,即使是相同的页面元素,由于页面布局等的细微差异,其对应的元素路径信息也有可能存在细微差别,这将导致多页面圈选操作的失效,还需要操作人员再次逐一的选择所要采集数据的页面元素,增加了操作人员重复工作量,降低了工作效率。
发明内容
有鉴于此,本发明提供一种基于无埋点的页面元素圈选方法及装置,主要目的在于克服相同页面元素的页面路径中存在的差异,提高页面元素圈选的成功率。
为达到上述目的,本发明主要提供如下技术方案:
一方面,本发明提供了一种基于无埋点的页面元素圈选方法,该方法包括:
获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;
根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;
判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息;
若存在,则将所述第二页面元素确定为与所述第一页面元素相同的圈选对象。
优选的,根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息包括:
基于预置规则,获取需要截取的部分路径信息中含有的层数值;
根据所述层数值,倒序截取所述第一页面元素的页面路径中连续层级的路径信息,得到含有所述第一页面元素的特征信息的所述部分路径信息。
优选的,判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息包括:
根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
判断所述第二页面元素的页面路径中是否存在所述分层路径信息;
若存在,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
若相同,则确定所述第二页面元素的页面路径中存在所述部分路径信息。
优选的,所述方法还包括:
对所述第一页面元素以及确定为与所述第一页面元素是相同的圈选对象的所有所述第二页面元素进行渲染。
优选的,所述方法还包括:
当所述预置页面中的相同圈选对象存在点击数据时,获取所述预置页面的统一资源定位符以及所述圈选对象的页面路径和部分路径信息;
将所述统一资源定位符、页面路径以及部分路径信息对应所述点击数据生成一条所述圈选对象的点击信息。
另一方面,本发明还提供了一种基于无埋点的页面元素圈选装置,该装置包括:
获取单元,用于获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;
截取单元,用于根据预置规则从所述获取单元获取多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;
判断单元,用于判断预置页面中第二页面元素的页面路径中是否存在所述截取单元截取的部分路径信息;
确定单元,用于当所述判断单元确定所述第二页面元素的页面路径中存在所述部分路径信息时,将所述第二页面元素确定为与所述第一页面元素相同的圈选对象。
优选的,所述截取单元包括:
获取模块,用于基于预置规则,获取需要截取的部分路径信息中含有的层数值;
截取模块,用于根据所述获取模块得到的层数值,倒序截取所述第一页面路径中连续层级的路径信息,得到含有所述第一页面元素的特征信息的所述部分路径信息。
优选的,所述判断单元包括:
解析模块,用于根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
第一判断模块,用于判断所述第二页面元素的页面路径中是否存在所述解析模块解析的分层路径信息;
第二判断模块,用于当所述第一判断模块确定存在所述分层路径信息时,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
确定模块,用于当所述第二判断模块确定所述层级关系相同时,确定所述第二页面元素的页面路径中存在所述部分路径信息。
优选的,所述装置还包括:
渲染单元,用于对所述第一页面元素以及确定为与所述第一页面元素是相同的圈选对象的所有所述第二页面元素进行渲染。
优选的,所述装置还包括:
接收单元,用于接收作为圈选对象的页面元素被点击时生成的点击信息,所述点击信息中包括所述被点击的圈选对象的页面路径;
提取单元,用于根据所述预置规则从所述接收单元接收的点击信息中提取出每个所述被点击的圈选对象对应的部分路径信息;
分类统计单元,用于根据提取单元提取的每个所述被点击的圈选对象对应的部分路径信息对所述圈选对象对应的页面元素进行分类,并统计每个分类下所述页面元素的点击量。
为了实现上述目的,根据本发明的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的基于无埋点的页面元素圈选方法。
为了实现上述目的,根据本发明的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的基于无埋点的页面元素圈选方法。
依据上述本发明所提出的基于无埋点的页面元素圈选方法及装置,主要用于解决基于无埋点技术的页面元素圈选的操作中,由于页面元素的页面路径存在差异而无法有效选中的问题。本发明是在确定所要圈选的页面元素时,在当前页面以及预置的多个页面中查找与所选中的第一页面元素具有相同的部分路径信息的第二页面元素,而该部分路径信息则是根据所选中第一页面元素的页面路径进行有规则的截取后得到的路径信息。并且所截取得到的部分路径信息中具有第一页面元素的特征信息,以此来确保所选择的第二页面元素与第一页面元素相同。同时,由于有比较的两个页面元素的部分路径信息,因此,匹配的数据量也会明显降低,从而加快匹配的过程。由此可见,通过截取含有特征信息的部分路径信息不仅提高了页面元素的匹配速度,而且排除了相同页面元素的页面路径存在差异的干扰,提升了圈选操作的准确性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提出的一种基于无埋点的页面元素圈选方法的流程图;
图2示出了本发明实施例提出的另一种基于无埋点的页面元素圈选方法的流程图;
图3A示出了第一页面中显示的页面元素的网站页面截图;
图3B示出了第二页面中显示的页面元素的网站页面截图;
图4示出了本发明实施例提出的一种基于无埋点的页面元素圈选装置的组成框图;
图5示出了本发明实施例提出的另一种基于无埋点的页面元素圈选装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种基于无埋点的页面元素圈选的方法,如图1所示,该方法主要是基于无埋点技术对预置页面中的页面元素进行有效圈选,即对预置页面中的相同页面元素通过选择其中一个页面元素的操作达到复选所有相同页面元素的效果。其中,在本发明实施例中相同的页面元素是指页面元素的展示效果或者是页面元素的显示功能、操作目的相同的多个页面元素。具体步骤包括:
101、获取当前页面中被选中的第一页面元素的页面路径。
其中,第一页面元素的页面路径是指在页面制作时为了对该第一页面元素进行标识所设置的标识信息,其类似于网站中的页面路径信息。该元素的页面路径是由多层的路径信息所构成,且每一层的路径信息都具有位置指向性,例如,假设第一页面元素的页面路径为:A>B>C>D,那么,一般情况下,D为显示在页面中的具体页面元素,A指代网站中的某个页面,B指代D在页面中的具体位置,C指代D在页面中的具体图层样式。通过获取并识别第一页面元素的页面路径,就可以准确地找到该第一页面元素在网站中的位置。
而现有的页面元素的圈选方式中多是基于页面路径的匹配或者是页面元素标识(如页面元素D)的匹配,这些方式的匹配结果都存在无法准确匹配的问题。
102、根据预置规则从多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息。
其中,第一页面元素的特征信息是指能够在网站或页面中标识该元素的信息,例如,页面中按钮的名称、图表的名称等,也可以是如上述例子中的页面元素标识“D”。这是因为要选择相同的页面元素的基础是两个页面元素中需要具有相同的特征信息。
而在本步骤中,截取的预置规则是基于不同的应用场景所确定的,不同的应用场景,其对应的网站页面是不同,不同的页面中具有不同的元素结构,而不同的元素结构将使得页面元素的页面路径结构不同。所以,对于具体如何截取的预置规则不做限定,包括对于截取页面路径的哪些层级,以及截取层级的具体数量,都可以通过不同的预置规则进行限定,再通过对具体的应用场景的识别来确定要采用何种预置规则。比如,可以设置预置规则1与预置规则2,分别用于不同的网站X与Y中,当识别出网站为X时,采用预置规则1,其具体截取的方式为将页面路径:A>B>C>D截取为B>C>D的部分路径信息,而当识别出网站为Y时,采用预置规则2,其具体截取的方式为将页面路径:A>B>C>D截取为C>D的部分路径信息。
103、判断预置页面中第二页面元素的页面路径中是否存在部分路径信息。
本步骤是将上述所截取到的部分路径信息与其他的页面元素(即第二页面元素)的页面路径进行逐一匹配,若第二页面元素的页面路径中也含有相同的部分路径信息,则执行步骤104。否则,认为该第二页面元素与第一页面元素不同,不属于圈选对象。
而预置页面是指选择圈选对象所在页面的具体范围,该预置页面可以是一个,也可以是网站中的多个指定页面,还可以网站中的所有页面。在实际应用中,确定了预置页面的具体数量也就确定了第二页面元素的数量,进而就可以确定需要进行匹配计算的数据量。需要指出的是,预置页面也可以为选择第一页面元素的当前页面。
此外,在进行逐一对比的过程中需要匹配的内容包括路径信息中各个分层中的信息,以及各个分层的层级关系。例如,部分路径信息为A>C>D,那么,若第二页面元素的页面路径为A’>B>C>D时,虽然A’与A为不同页面,但两者若为预置页面,则也可以认为该第二页面元素中所含有相同的部分路径信息,即A’>C>D与A>C>D相同。而如果第二页面元素的页面路径为A>B>C>D’时,由于页面元素本身不同,该第二页面元素就不能作为圈选对象,或者第二页面元素的页面路径为A>C>B>D时,尽管在第二页面元素中同样具有A、C、D三层路径信息,但其各层的层级关系不同也将导致其不能作为圈选对象。在本步骤中,不限定具体的匹配的方式。
104、将第二页面元素确定为与第一页面元素相同的圈选对象。
将步骤103中所确定的存在部分路径信息的第二页面元素保留,构成圈选对象的集合。在该集合中的页面元素是分布在预置页面中的所有与第一页面元素相同的页面元素,即完成了对预置页面中的页面元素的圈选操作。后续基于该集合中的圈选对象采集相关的操作信息,以便于生成相应的统计信息。
结合上述的实现方式可以看出,本发明实施例所采用的基于无埋点的页面元素圈选方法,是在确定所要圈选的页面元素时,在当前页面以及预置的多个页面中查找与所选中的第一页面元素具有相同的部分路径信息的第二页面元素,而该部分路径信息则是根据所选中第一页面元素的页面路径进行有规则的截取后得到的路径信息。并且所截取得到的部分路径信息中具有第一页面元素的特征信息,以此来确保所选择的第二页面元素与第一页面元素相同。同时,由于有比较的两个页面元素的部分路径信息,因此,匹配的数据量也会明显降低,从而加快匹配的过程。由此可见,通过截取含有特征信息的部分路径信息不仅提高了页面元素的匹配速度,而且排除了相同页面元素的页面路径存在差异的干扰,提升了圈选操作的准确性。
以下为了更加详细地说明本发明提出的一种基于无埋点的页面元素圈选方法,本发明实施例将结合具体示例说明所提出了一种基于无埋点的页面元素圈选方法,如图2所示,该方法确定圈选对象的具体步骤如下:
201、获取当前页面中被选中的第一页面元素的页面路径。
本步骤中,通过接收用户点击第一页面元素的操作,确定用于匹配圈选对象的基础页面元素。根据用户的点击操作获取第一页面元素的页面路径。在本发明实施例中,以图3A与图3B为例进行说明,其中,图3A通过黑色框标记处为页面中的一个搜索按钮,当用户以图3A为当前页面进行圈选时,点击的页面元素为该搜索按钮,而在图3B中所示出的页面中,也具有相同的搜索按钮,但是该搜索按钮与图3A中搜索按钮相比,其位置是不同,基于位于“SIGN UP”行的下方。这就导致了两个按钮的页面路径存在不同。具体可表示为:在图3A中的按钮的页面路径:
body>div.top_wrap{1}>ul.top_ad_box{1}>li{3}>a.imgBox{1}>img.searchbox
在图3B中的按钮的页面路径:
body>div.sign_up_top{1}>div.top_wrap{1}>ul.top_ad_box{1}>li{3}>a.imgBox{1}>img.searchbox
可见,“SIGN UP”行在页面路径中体现为“div.sign_up_top{1}”。
基于该示例,本步骤所获取的第一页面元素的页面路径就为图3A中搜索按钮的页面路径。
202、根据指定的层数值倒序截取第一页面元素的页面路径中连续层级的路径信息,得到含有第一页面元素的特征信息的部分路径信息。
其中,指定的层数值是指对于页面路径所具有的多层结构,根据人为设置所获取的数值。该数值就是截取后的部分路径信息的层数,其取值为正整数,且小于第一页面元素的页面路径所具有层数。在图3A中所示出的按钮的页面路径具有的层数为6层,而图3B中所示出的按钮的页面路径具有7层,其多出的就是“div.sign_up_top{1}”。
本步骤中,首先要获取该人为设置的层数值,一般该值会大于2,同时该层数值要小于6。其中,数值越大,能够得到的页面元素的路径信息也就越详细,其匹配的准确度也会更高,但相对的数据量就会更大,需要更多的计算资源完成匹配操作。基于图3A所示的按钮的页面路径,当取该层数值为3时,其倒序截取的部分路径信息为:
li{3}>a.imgBox{1}>img.searchbox
需要说明的是,在截取部分路径信息的过程中,是基于第一页面路径元素的页面路径所倒序截取的,其中,由于层数值小于第一页面元素的页面路径所具有层数,因此,其截取的部分路径信息不会截取到原页面路径的根节点,即不会截取到“body”这一层,如此,可以确保所截取的部分路径信息不会与原页面路径相同。
此外,还需要强调的是在倒序截取时,是对第一页面路径元素的页面路径进行连续层级的截取,而一般在页面路径中的末节点中携带有第一页面元素的特征信息,所以在本实施例的截取过程中就能够确保所截取的部分路径信息中含有第一页面元素的特征信息,以便于在后续步骤中匹配出准确的圈选对象。
203、判断预置页面中第二页面元素的页面路径中是否存在部分路径信息。
首先,根据层数值解析步骤202中得到的部分路径信息,得到多个分层路径信息,也就是将部分路径信息中的各层信息进行提取,根据上述的示例所得到的多个分层路径信息分别为:“li{3}”、“a.imgBox{1}”以及“img.searchbox”。对于解析的方式对于不同的编程语言存在有不同的解析方式,在此步骤中不做具体限定。
其次,判断第二页面元素的页面路径中是否存在分层路径信息,也就是判断图3B中按钮的页面路径中是否含有上述解析得到的三个分层路径信息,根据上述给出的图3B中按钮的页面路径可知,其同样具有“li{3}”、“a.imgBox{1}”以及“img.searchbox”分层路径信息。
第三,在具有相同的分层路径信息时,判断该分层路径信息的层级关系是否与第一页面元素的页面路径中的层级关系相同,即判断在图3B中按钮的页面路径中所含有的部分路径信息的分层路径信息的排布顺序是否与部分路径信息相一致。对比可见,两者的顺序是一致的。
最后,在第二页面元素中的分层路径信息与部分路径信息的顺序一致时,就确定该第二页面元素的页面路径中存在所述部分路径信息。
204、将第二页面元素确定为与第一页面元素相同的圈选对象。
经过上述步骤的对比分析后,虽然图3A与图3B中的搜索按钮的页面路径不同,但通过对页面路径进行截取操作后,还是可以将图3B中的搜索按钮确定为圈选对象的,可见,通过上述的操作可以达到提升圈选准确率的目的。
205、渲染第一页面元素以及所确定的圈选对象。
本步骤是基于用户在进行圈选操作的过程中,为了更好的提示用户哪些页面元素已被选中,增加应用的交互性,在用户选择第一页面元素时,将会对该第一页面元素进行渲染,具体可以采用修改页面元素的在页面中的底色、改变元素的大小,或者是增加标签等方式进行可视化的提示。同时,在经过上述步骤的处理后,每确定一个圈选对象就以上述同样的渲染方式对该页面元素进行渲染,以提示用户该页面元素已被选中。
进一步的,基于上述方法所圈选得到的页面元素在采集用户的操作信息时就可以方便的采集到多个预置页面中的所有相同的页面元素的总操作信息,也可以采集单个页面元素的操作信息。
一般的,用户的操作信息多为点击操作,因此,在接收到用户对所确定的圈选对象进行的点击操作时,将生成对应的点击信息,其中,该点击信息中至少包括有该被点击的圈选对象的页面路径,该页面路径为全路径信息,也就是未执行过截取的路径信息。
再根据预置规则从该点击信息所包含的页面路径中提取出被点击的圈选对象对应的部分路径信息。其中,预置规则包括从点击信息中提取页面路径的方式以及上述的从页面路径中截取部分路径的方式。
由于用户在确定圈选对象时,所指定的第一页面元素一般不只一个,因此,在确定圈选对象时,也需要根据所述指定的第一页面元素对所圈选的对象进行分类,即同一类的圈选对象对应于一个指定的第一页面元素,如此,根据对所选中的页面元素的分类就可以统计出针对该类别页面元素的总点击量,同时,再根据同一类中的每一个页面元素的页面路径还可以统计出针对每一个页面元素单独的点击量。
进一步的,为了对多个预置页面加以有效的区分,并增加后续数据分析的分析维度,还可以在获取点击操作对应的点击数据的同时获取当前页面的统一资源定位符(Uniform Resource Locator,url),并将该url一并记录在所生成的点击信息中。
通过上述的实施例已详细地介绍了对页面元素圈选的具体方式,而为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的基于无埋点的页面元素圈选方法。
此外,为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的基于无埋点的页面元素圈选方法。
进一步的,作为对上述方法的实现,本发明实施例提供了一种基于无埋点的页面元素圈选装置,该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置用于分析或获取文本信息的设备中,如图4所示,该装置包括:
获取单元31,用于获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;
截取单元32,用于根据预置规则从所述获取单元31获取多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;
判断单元33,用于判断预置页面中第二页面元素的页面路径中是否存在所述截取单元32截取的部分路径信息;
确定单元34,用于当所述判断单元33确定所述第二页面元素的页面路径中存在所述部分路径信息时,将所述第二页面元素确定为与所述第一页面元素相同的圈选对象。
进一步的,如图5所示,所述截取单元32包括:
获取模块321,用于获取所述部分路径信息中含有的层数值;
截取模块322,用于根据所述获取模块321得到的层数值倒序截取所述页面路径的路径信息,得到所述部分路径信息。
进一步的,如图5所示,所述判断单元33包括:
解析模块331,用于根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
第一判断模块332,用于判断所述第二页面元素的页面路径中是否存在所述解析模块331解析的分层路径信息;
第二判断模块333,用于当所述第一判断模块332确定存在所述分层路径信息时,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
确定模块334,用于当所述第二判断模块333确定所述层级关系相同时,确定所述第二页面元素的页面路径中存在所述部分路径信息。
进一步的,如图5所示,所述装置还包括:
渲染单元35,用于对所述第一页面元素以及确定为与所述第一页面元素是相同的圈选对象的所有所述第二页面元素进行渲染。
进一步的,如图5所示,所述装置还包括:
接收单元36,用于接收作为圈选对象的页面元素被点击时生成的点击信息,所述点击信息中包括所述被点击的圈选对象的页面路径;
提取单元37,用于根据所述预置规则从所述接收单元36接收的点击信息中提取出每个所述被点击的圈选对象对应的部分路径信息;
分类统计单元38,用于根据提取单元37提取的每个所述被点击的圈选对象对应的部分路径信息对所述圈选对象对应的页面元素进行分类,并统计每个分类下所述页面元素的点击量
综上所述,本发明实施例所采用的基于无埋点的页面元素圈选方法及装置,是在确定所要圈选的页面元素时,在当前页面以及预置的多个页面中查找与所选中的第一页面元素具有相同的部分路径信息的第二页面元素,而该部分路径信息则是根据所选中第一页面元素的页面路径进行有规则的截取后得到的路径信息。并且所截取得到的部分路径信息中具有第一页面元素的特征信息,以此来确保所选择的第二页面元素与第一页面元素相同。同时,由于有比较的两个页面元素的部分路径信息,因此,匹配的数据量也会明显降低,从而加快匹配的过程。由此可见,通过截取含有特征信息的部分路径信息不仅提高了页面元素的匹配速度,而且排除了相同页面元素的页面路径存在差异的干扰,提升了圈选操作的准确性。并且,在圈选出相同的页面元素时,还通过对页面元素进行的渲染来增加用户选中的效果,避免用户的重复操作。而基于本发明实施例的页面元素圈选方法还有利于后期的数据分析与统计,直接根据所记录的点击数据就可以得到总体统计值与个体统计值,降低了后续统计的数据计算量。
所述基于无埋点的页面元素圈选装置包括处理器和存储器,上述获取单元、截取单元、判断单元和确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现准确圈选存在页面路径差异的页面元素,提高页面元素圈选的成功率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述基于无埋点的页面元素圈选方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述基于无埋点的页面元素圈选方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息;若存在,则将所述第二页面元素确定为与所述第一页面元素相同的圈选对象。
进一步的,根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息包括:
获取所述部分路径信息中含有的层数值;
根据所述层数值,倒序截取所述第一页面元素的页面路径中连续层级的路径信息,得到含有所述第一页面元素的特征信息的所述部分路径信息。
进一步的,判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息包括:
根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
判断所述第二页面元素的页面路径中是否存在所述分层路径信息;
若存在,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
若相同,则确定所述第二页面元素的页面路径中存在所述部分路径信息。
进一步的,所述方法还包括:
对所述第一页面元素以及确定为与所述第一页面元素是相同的圈选对象的所有所述第二页面元素进行渲染。
进一步的,所述方法还包括:
当所述预置页面中的相同圈选对象存在点击数据时,获取所述预置页面的统一资源定位符以及所述圈选对象的页面路径和部分路径信息;
将所述统一资源定位符、页面路径以及部分路径信息对应所述点击数据生成一条所述圈选对象的点击信息。
而本文中的设备不限定是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息;若存在,则将所述第二页面元素确定为与所述第一页面元素相同的圈选对象。
进一步的,根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息包括:
获取所述部分路径信息中含有的层数值;
根据所述层数值,倒序截取所述第一页面元素的页面路径中连续层级的路径信息,得到含有所述第一页面元素的特征信息的所述部分路径信息。
进一步的,判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息包括:
根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
判断所述第二页面元素的页面路径中是否存在所述分层路径信息;
若存在,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
若相同,则确定所述第二页面元素的页面路径中存在所述部分路径信息。
进一步的,所述方法还包括:
对所述第一页面元素以及确定为与所述第一页面元素是相同的圈选对象的所有所述第二页面元素进行渲染。
进一步的,所述方法还包括:
当所述预置页面中的相同圈选对象存在点击数据时,获取所述预置页面的统一资源定位符以及所述圈选对象的页面路径和部分路径信息;
将所述统一资源定位符、页面路径以及部分路径信息对应所述点击数据生成一条所述圈选对象的点击信息。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (8)
1.一种基于无埋点的页面元素圈选方法,其特征在于,所述方法包括:
获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;
根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;
判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息;
若存在,则将所述第二页面元素确定为与所述第一页面元素相同的圈选对象;
根据预置规则从所述多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息包括:
基于预置规则,获取需要截取的部分路径信息中含有的层数值,所述层数值小于所述第一页面元素的页面路径的层数;
根据所述层数值,倒序截取所述第一页面元素的页面路径中连续层级的路径信息,得到含有所述第一页面元素的特征信息的所述部分路径信息。
2.根据权利要求1所述的方法,其特征在于,判断预置页面中第二页面元素的页面路径中是否存在所述部分路径信息包括:
根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
判断所述第二页面元素的页面路径中是否存在所述分层路径信息;
若存在,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
若相同,则确定所述第二页面元素的页面路径中存在所述部分路径信息。
3.根据权利要求1-2中任一项所述的方法,其特征在于,所述方法还包括:
对所述第一页面元素以及确定为与所述第一页面元素是相同的圈选对象的所有所述第二页面元素进行渲染。
4.根据权利要求1-2中任一项所述的方法,其特征在于,所述方法还包括:
接收作为圈选对象的页面元素被点击时生成的点击信息,所述点击信息中包括所述被点击的圈选对象的页面路径;
根据所述预置规则从所述点击信息中提取出每个所述被点击的圈选对象对应的部分路径信息;
根据每个所述被点击的圈选对象对应的部分路径信息对所述圈选对象对应的页面元素进行分类,并统计每个分类下所述页面元素的点击量。
5.一种基于无埋点的页面元素圈选装置,其特征在于,所述装置包括:
获取单元,用于获取当前页面中被选中的第一页面元素的页面路径,所述页面路径为在制作页面时设置所述第一页面元素的标识信息,所述标识信息包括具有位置指向的多层的路径信息;
截取单元,用于根据预置规则从所述获取单元获取多层的路径信息中截取含有所述第一页面元素的特征信息的部分路径信息;
判断单元,用于判断预置页面中第二页面元素的页面路径中是否存在所述截取单元截取的部分路径信息;
确定单元,用于当所述判断单元确定所述第二页面元素的页面路径中存在所述部分路径信息时,将所述第二页面元素确定为与所述第一页面元素相同的圈选对象;
所述截取单元包括:
获取模块,用于基于预置规则,获取需要截取的部分路径信息中含有的层数值,所述层数值小于所述第一页面元素的页面路径的层数;
截取模块,用于根据所述获取模块得到的层数值,倒序截取所述第一页面元素的页面路径中连续层级的路径信息,得到含有所述第一页面元素的特征信息的所述部分路径信息。
6.根据权利要求5所述的装置,其特征在于,所述判断单元包括:
解析模块,用于根据所述层数值解析所述部分路径信息,得到多个分层路径信息;
第一判断模块,用于判断所述第二页面元素的页面路径中是否存在所述解析模块解析的分层路径信息;
第二判断模块,用于当所述第一判断模块确定存在所述分层路径信息时,判断所述分层路径信息的层级关系是否与所述第一页面元素的页面路径中的层级关系相同;
确定模块,用于当所述第二判断模块确定所述层级关系相同时,确定所述第二页面元素的页面路径中存在所述部分路径信息。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1-4中任一项所述的基于无埋点的页面元素圈选方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1-4中任一项所述的基于无埋点的页面元素圈选方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710898211.5A CN109582548B (zh) | 2017-09-28 | 2017-09-28 | 一种基于无埋点的页面元素圈选方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710898211.5A CN109582548B (zh) | 2017-09-28 | 2017-09-28 | 一种基于无埋点的页面元素圈选方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109582548A CN109582548A (zh) | 2019-04-05 |
CN109582548B true CN109582548B (zh) | 2022-04-12 |
Family
ID=65912812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710898211.5A Active CN109582548B (zh) | 2017-09-28 | 2017-09-28 | 一种基于无埋点的页面元素圈选方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109582548B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113127771A (zh) * | 2019-05-30 | 2021-07-16 | 北京腾云天下科技有限公司 | 应用埋点方法、装置、计算设备和系统 |
CN112579951A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 页面元素选取方法、装置、存储介质及设备 |
CN111488544B (zh) * | 2020-03-31 | 2023-02-24 | 腾讯科技(深圳)有限公司 | 网页相似子元素的确定方法、装置、设备和存储介质 |
CN113515715B (zh) * | 2020-10-15 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 埋点事件编码的生成方法、处理方法及相关设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104714980A (zh) * | 2013-12-17 | 2015-06-17 | 阿里巴巴集团控股有限公司 | 页面嵌套路径确定方法及装置 |
CN104866509A (zh) * | 2014-02-26 | 2015-08-26 | 阿里巴巴集团控股有限公司 | 页面元素的定位方法及装置 |
CN106776615A (zh) * | 2015-11-20 | 2017-05-31 | 北京国双科技有限公司 | 热力图生成方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294711B (zh) * | 2012-02-28 | 2017-04-12 | 阿里巴巴集团控股有限公司 | 一种确定网页中的页面元素的方法以及装置 |
-
2017
- 2017-09-28 CN CN201710898211.5A patent/CN109582548B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104714980A (zh) * | 2013-12-17 | 2015-06-17 | 阿里巴巴集团控股有限公司 | 页面嵌套路径确定方法及装置 |
CN104866509A (zh) * | 2014-02-26 | 2015-08-26 | 阿里巴巴集团控股有限公司 | 页面元素的定位方法及装置 |
CN106776615A (zh) * | 2015-11-20 | 2017-05-31 | 北京国双科技有限公司 | 热力图生成方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109582548A (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109582548B (zh) | 一种基于无埋点的页面元素圈选方法及装置 | |
CN107102941B (zh) | 一种测试用例的生成方法及装置 | |
CN109002443B (zh) | 一种文本信息的分类方法及装置 | |
US20150032708A1 (en) | Database analysis apparatus and method | |
CN111831629B (zh) | 一种数据处理方法及装置 | |
CN113312361B (zh) | 轨迹查询方法、装置、设备、存储介质及计算机程序产品 | |
US8639559B2 (en) | Brand analysis using interactions with search result items | |
CN104899016A (zh) | 调用堆栈关系获取方法及装置 | |
CN109918296A (zh) | 软件自动化测试方法及装置 | |
CN113688288A (zh) | 数据关联分析方法、装置、计算机设备和存储介质 | |
CN108664471A (zh) | 文字识别纠错方法、装置、设备及计算机可读存储介质 | |
CN109582305B (zh) | 用于移动应用页面元素的编码方法、装置及电子设备 | |
CN106294406B (zh) | 一种用于处理应用访问数据的方法与设备 | |
CN115035347A (zh) | 图片识别方法、装置及电子设备 | |
WO2016093839A1 (en) | Structuring of semi-structured log messages | |
Lin et al. | Integrated circuit board object detection and image augmentation fusion model based on YOLO | |
CN106776654B (zh) | 一种数据搜索方法及装置 | |
CN107430633A (zh) | 与数据存储系统相关联的经相关优化的代表性内容 | |
Mariano et al. | Improve Classification of Commits Maintenance Activities with Quantitative Changes in Source Code. | |
US20170371651A1 (en) | Automatically establishing significance of static analysis results | |
CN113127636B (zh) | 一种文本聚类类簇中心点选取方法及装置 | |
CN105786966A (zh) | 一种文本结构化的方法和装置 | |
CN106776652B (zh) | 数据处理方法及装置 | |
US20190294534A1 (en) | Program usability performance classification | |
CN111553187A (zh) | 识别cad图纸中表格的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |