CN106095946A - 页面的处理方法及装置 - Google Patents

页面的处理方法及装置 Download PDF

Info

Publication number
CN106095946A
CN106095946A CN201610421387.7A CN201610421387A CN106095946A CN 106095946 A CN106095946 A CN 106095946A CN 201610421387 A CN201610421387 A CN 201610421387A CN 106095946 A CN106095946 A CN 106095946A
Authority
CN
China
Prior art keywords
page
communications
tool
network address
triggering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610421387.7A
Other languages
English (en)
Other versions
CN106095946B (zh
Inventor
马宇峰
王晓元
叶峻
吴明丹
余韬
邓鸣捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610421387.7A priority Critical patent/CN106095946B/zh
Publication of CN106095946A publication Critical patent/CN106095946A/zh
Application granted granted Critical
Publication of CN106095946B publication Critical patent/CN106095946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

本发明提供一种页面的处理方法及装置。其中所述方法包括:当用户请求访问页面时,获取沟通配置文件;根据沟通配置文件,检测用户请求访问的页面是否为触发沟通的页面,以根据检测结果统计触发沟通的页面。本发明的页面的处理方法,通过采用上述技术方案,能够根据预先创建的沟通配置文件对用户请求的页面进行检测,以确定该页面是否为触发沟通的页面,与现有技术的设置埋点检测相比,具有更强的适用性,能够对所有网站的页面进行检测,且不会随着沟通工具的一次改版、一次迭代更新重新设置沟通配置文件,从而可以提高触发沟通的页面的统计效率,进而可以根据统计分析的结果,优化页面设计。

Description

页面的处理方法及装置
【技术领域】
本发明涉及互联网技术领域,尤其涉及一种页面的处理方法及装置。
【背景技术】
随着“互联网+”的进一步深入,线上线下的服务资源进一步打通,越来越多的网站开启线上沟通、线下交易的方式提供服务。例如在医疗行业中,医院往往在网站上发布预先咨询、预约的窗口,预先了解用户疾病及需求,从而降低用户在医院中的时间成本,提高医疗资源的利用效率。
现有技术中,网站的线上沟通工具基本由应用商提供,例如沟通工具主要可以包括商务通、乐语、53客服等等,这些应用商往往只能提供该用户在会话过程中的沟通统计数据,而无法提供该用户在其余页面上的浏览信息,这也就使得网站难以了解该用户的历史行为,也难以区分哪些渠道引流的客户更有沟通意愿。为了解决该问题,现有技术的互联网公司开发自己的统计产品,例如具体通过安装在网站上的javascript(简称js)代码来实现。通常需要网站的开发人员进行事件绑定,例如定义某一个元素的点击事件是沟通,这样,当用户点击该元素时,统计该元素所在的页面为触发沟通的页面,或者也可以被称之为吊起页面数据。现有的绑定事件的过程中亦被称为埋点。
现有技术中,通过设置埋点实现对触发沟通的页面的统计,随着沟通工具的一次改版、一次迭代更新,均需要重新设置埋点,导致触发沟通的页面的统计效率非常低。
【发明内容】
本发明提供了一种页面的处理方法及装置,以提高触发沟通的页面的统计效率。
本发明提供一种页面的处理方法,所述方法包括:
当用户请求访问页面时,获取沟通配置文件;
根据所述沟通配置文件,检测所述用户请求访问的所述页面是否为触发沟通的页面。
本发明提供还提供一种页面的处理装置,所述装置包括:
获取模块,用于当用户请求访问页面时,获取沟通配置文件;
检测模块,用于根据所述沟通配置文件,检测所述用户请求访问的所述页面是否为触发沟通的页面。
本发明的页面的处理方法及装置,通过采用上述技术方案,能够根据预先创建的沟通配置文件对用户请求的页面进行检测,以确定该页面是否为触发沟通的页面。本发明通过采用沟通配置文件来实现页面是否为触发沟通的页面的检测,与现有技术的设置埋点检测相比,本发明的方案具有更强的适用性,能够对所有网站的页面进行检测,且不会随着沟通工具的一次改版、一次迭代更新重新设置沟通配置文件,从而可以提高触发沟通的页面的统计效率,进而可以根据统计分析的结果,优化页面设计,增强用户的体验。
【附图说明】
图1为本发明的页面的处理方法实施例一的流程图。
图2为本发明的页面的处理方法实施例二的流程图。
图3为本发明的页面的处理装置实施例一的结构图。
图4为本发明的页面的处理装置实施例二的结构图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
沟通数据一直是一种重要的行为数据,受限于第三方的沟通工具,通常难以获取较为详细的沟通信息如触发沟通的页面(也可以称之为沟通的吊起页面数据)。此外现有技术中设置触发沟通的页面的监控也非常繁琐,需要开发人员在网站页面中设置埋点来实现,且随着沟通工具的一次改版、一次迭代更新,均需要重新设置埋点,使用非常繁琐,导致触发沟通的页面的统计效率非常低。
基于如上所述背景,本发明提供了一种无需依赖于第三方沟通工具以及网站设置的埋点的方式来实现对触发的沟通页面的检测。因为沟通吊起的本质是,网站请求第三方沟通工具的资源,打开新的沟通页面与客户进行沟通,所以可以通过浏览器、或者搜索应用程序(Application;App)客户端的用户浏览统一资源定位符(Uniform Resource Locator;URL)序列作为网站抽样数据,首先从中提取出候选沟通页面,再利用无界面可编程浏览器(如PhantomJS),模拟用户的点击来探测页面上可能触发沟通的元素,提取得到触发沟通的元素,最后利用js进行事件绑定,将沟通事件返回到统计后端,生成沟通配置文件。
本发明提供的方案无需依赖于人工二次开发,且可以处理大规模网站,亦可降低沟通行为监控遗漏的风险,为触发沟通的页面的搜集和统计提供了基础。
图1为本发明的页面的处理方法实施例一的流程图。如图2所示,本实施例的页面的处理方法,具体可以包括如下步骤:
100、当用户请求访问页面时,获取沟通配置文件;
101、根据沟通配置文件,检测用户请求访问的页面是否为触发沟通的页面。
例如,本实施例中的沟通配置文件中可以记录有触发沟通的页面的一些特性,这样,根据沟通配置文件中记录的触发沟通的页面的特性,可以检测用户请求访问的页面的特性是否符合触发沟通的页面的特性,若符合,可以确定该用户请求访问的页面是触发沟通的页面,这样,可以进一步根据检测结果统计触发沟通的页面。本实施例的触发沟通的页面在页面访问的下一步可以触发沟通,因此该触发沟通的页面也可以被称之为沟通的吊起页面数据。
本实施例的页面的处理方法的执行主体为页面的处理装置,该页面的处理装置在使用时,可以设置在网站上,实现对网站的用户请求的所有页面进行检测,以确定用户请求的页面是否为触发沟通的页面,以便于根据检测结果统计触发沟通的页面,进而可以对网站的所有页面进行统计分析,以便于进一步根据统计分析的结果,优化页面设计,增强用户的体验。
本实施例的沟通配置文件可以预先设定的,具体可以存储在网站的服务器一侧,以在用户请求访问页面的时候,对页面进行处理。该沟通配置文件不需要通过安装在网站上的js代码来实现,也不会随着沟通工具的一次改版、一次迭代更新而重新设置。因此,本实施例的沟通配置文件具有更强的适用性,可以适用于检测互联网上用户请求访问的任何网页,使用非常方便,触发沟通的页面的统计效率非常高。
例如,本实施例中的沟通配置文件中可以包括页面参数属性与对应的沟通工具标识之间对应的配置关系,此时对应的,步骤101之前,还可以包括:从沟通配置文件中获取页面参数属性与沟通工具的标识之间对应的配置关系;此时步骤101具体可以包括:根据页面参数属性与沟通工具的标识之间对应的配置关系,检测用户请求访问的页面是否为触发沟通的页面。
进一步可选地,本实施例的页面参数属性与沟通工具的标识之间对应的配置关系包括如下至少一种:超链网址与对应的第一沟通工具的标识之间的第一配置关系、点击事件的标识与对应的第二沟通工具的标识之间的第二配置关系、以及元素的id与对应的第三沟通工具的标识之间的第三配关系。
本实施例中为便于描述将与超链网址对应的沟通工具命名为第一沟通工具,与点击事件的标识对应的沟通工具为沟通工具命名为第二沟通工具,与元素的id对应的沟通工具为第三沟通工具。实际应用中,第一沟通工具、第二沟通工具以及第三沟通工具的数量并不限定为一个;例如第一沟通工具具体可以指的是一类与超链网址对应的沟通工具,第二沟通工具具体可以指的是一类与点击事件的标识对应的沟通工具,第三沟通工具具体可以指的是一类与元素的id对应的沟通工具。反过来,同理,超链网址、点击事件的标识以及元素的id也并不限定为一个,也具体指的是一类页面参数属性。第一沟通工具、第二沟通工具以及第三沟通工具具体可以相同,也可以不相同。且第一配置关系中具体可以包括多对超链网址与对应的第一沟通工具的标识之间的对应关系;同理第二配置关系中具体可以包括多对点击事件的标识与对应的第二沟通工具的标识之间的对应关系;第三配关系中具体可以包括多对元素的id与对应的第三沟通工具的标识之间的对应关系。
本实施例中是以沟通配置文件中包括以上三种配置关系为例描述本发明的技术方案,实际应用中,沟通配置文件中还可以包括其它的页面参数属性与对应的沟通工具标识之间的更多种类的配置关系,在此不再一一举例赘述。
可选地,本实施例中的第一配置关系中的超链网址与对应的第一沟通工具的标识、第二配置关系中的点击事件的标识与对应的第二沟通工具的标识,以及第三配置关联中的元素的id与对应的第三沟通工具的标识,均可以采用key-Value对的形式存储,即第一配置关系按照<超链网址,第一沟通工具的标识>来存储;第二配置关系按照<点击事件的标识,第二沟通工具的标识>来存储;第三配置关系按照<元素的id,第三沟通工具的标识>来存储。
进一步可选地,根据页面参数属性与沟通工具的标识之间对应的配置关系,检测用户请求访问的页面是否为触发沟通的页面,具体可以包括如下步骤:
(a1)分别根据第一配置关系判断用户请求访问的页面是否触发第一沟通工具、根据第二配置关系判断用户请求访问的页面是否触发第二沟通工具、以及根据第三配置关系判断用户请求访问的页面是否触发第三沟通工具;当页面触发第一沟通工具、第二沟通工具以及第三沟通工具中任意一种,执行步骤(a2);否则当页面未触发第一沟通工具、第二沟通工具以及第三沟通工具中任意一种,执行步骤(a3);
本实施例中,用户请求访问的页面能够触发第一沟通工具、第二沟通工具以及第三沟通工具中任意一种,都认为是该页面能够触发沟通工具;只有当用户请求访问的页面未能够触发第一沟通工具、第二沟通工具以及第三沟通工具中任意一种,才确定用户请求访问的该页面不触发沟通工具。
(a2)确定页面为触发沟通的页面;
(a3)确定页面为未触发沟通的页面。
其中步骤(a1)中的根据第一配置关系判断用户请求访问的页面是否触发第一沟通工具,具体可以包括:
根据第一配置关系,判断用户请求访问的页面的所有超链网址中是否存在与第一沟通工具对应的超链网址,若存在,确定页面为触发第一沟通工具的页面;否则确定页面为不触发第一沟通工具的页面;
具体地,用户在请求访问该页面时,通过浏览器打开了该页面,在具体分析时,需要先提取该页面的所有超链网址,然后依次分析该页面的所有超链网址,判断该页面的所有超链网址中是否存在第一配置关系中的第一沟通工具对应的超链网址,若存在,确定页面为触发第一沟通工具的页面;否则确定页面为不触发第一沟通工具的页面。
其中,步骤(a1)中的根据第二配置关系判断用户请求访问的页面是否触发第二沟通工具,具体可以包括:
根据第二配置关系,判断用户访问的页面的所有绑定在各元素上的点击事件中是否存在与第二沟通工具对应的点击事件,若存在,确定页面为触发第二沟通工具的页面;否则确定页面为不触发第二沟通工具的页面;
具体地,用户在请求访问该页面时,通过浏览器打开了该页面,在具体分析时,需要先提取该页面的所有绑定了点击事件的元素,然后获取元素上的点击事件,判断该页面的点击事件中是否存在第二配置关系中的点击事件,若存在,确定页面为触发第二沟通工具的页面;否则确定页面为不触发第二沟通工具的页面。
其中,步骤(a1)中的根据第三配置关系判断用户请求访问的页面是否触发第三沟通工具,具体也可以包括:
根据第三配置关系,判断用户请求访问的页面的各元素的id中是否存在与第三沟通工具对应的元素的id,若存在,确定页面为触发第三沟通工具的页面;否则确定页面为不触发第三沟通工具的页面。
具体地,用户在请求访问该页面时,通过浏览器打开了该页面,在具体分析时,需要先提取该页面的所有元素的id,然后判断该页面的id中是否存在第三配置关系中的元素的id,若存在,确定页面为触发第三沟通工具的页面;否则确定页面为不触发第三沟通工具的页面。
本实施例的页面的处理方法,通过采用上述技术方案,能够根据预先创建的沟通配置文件对用户请求的页面进行检测,以确定该页面是否为触发沟通的页面。本实施例通过采用沟通配置文件来实现页面是否为触发沟通的页面的检测,与现有技术的设置埋点检测相比,本实施例的方案具有更强的适用性,能够对所有网站的页面进行检测,且不会随着沟通工具的一次改版、一次迭代更新重新设置沟通配置文件,从而可以提高触发沟通的页面的统计效率,进而可以根据统计分析的结果,优化页面设计,增强用户的体验。
进一步可选地,在上述实施例的技术方案的基础上,在步骤100之前,还可以包括创建沟通配置文件。本实施例的沟通配置文件可以根据网络上各个用户的URL访问序列来生成,详细如下述实施例所述。
图2为本发明的页面的处理方法实施例二的流程图。如图2所示,本实施例的页面的处理方法,具体用于介绍上述“创建沟通配置文件”的具体实现方式;且本实施例的创建沟通配置文件可以采用离线的方式线下进行创建。如图2所示,本实施例的页面的处理方法,具体可以包括如下步骤:
200、分别获取第一沟通工具的URL的pattern、第二沟通工具的URL的pattern以及第三沟通工具的URL的pattern;
本实施例中的网址具体均采用URL来实现。由于市场上沟通工具的数量有限,可以在大量的统计后,得到每种沟通工具的URL的模式(pattern),如商务通的openZoosUrl函数,可以在不进行精细探测的情况下应用在一个已知沟通工具的网站上,也可以降低页面探测的工作量。另外,使用时,可以在前端js加载沟通工具的URL的pattern时,如果所使用的URL的pattern太长,加载后对页面的访问带来较大负担,可以提取超链地址、元素的身份标识(identify;id)、以及点击事件onclick的公共子串,形成该沟通工具的URL的pattern的形式。
例如,当前主流的网站沟通工具可以包括有商务通、百度商桥、乐语、小能、53客服、QQ等等。这些沟通工具均有相应的站点沟通窗口,也有对应的URL pattern,在网站使用这些工具进行沟通时,也要到对应的地址去请求这些沟通工具的资源。其中沟通工具的URL的pattern具体指的是该沟通工具的URL的对应的模式,对应该沟通工具的URL的共性特征,能够唯一标识该沟通工具的资源的地址。例如,下述网址(1)和(2);可以对应的URL的pattern可以为“stockpage.10jqka.com.cn/***/company/***”;网址(3)和(4)可以对应的URL的pattern可以为“blog.sina.com.cn/s/***”。
(1)http://stockpage.10jqka.com.cn/600429/company/?tj=1
(2)http://stockpage.10jqka.com.cn/600428/company/?tj=3
(3)http://blog.sina.com.cn/s/blog_5e0515b80100klpp.html?tj=1
(4)http://blog.sina.com.cn/s/blog_4ab049de0100ktml.html?tj=2
下面列出几种常用的沟通工具及其对应地址pattern。
沟通工具 对应的URL的pattern
商务通 zoosnet.net/LR/chatpre
百度商桥 qiao.baidu.com或linking.baidu.com/im.php
乐语 looyu.com
53客服 53kf.com
talk99 talk99.cn
快商 kuaishang.cn
美恰 meiqia.com
QQ qq.com/wp*
…… ……
201、从连续被访问的URL序列中,分别识别第一沟通工具的URL的pattern、第二沟通工具的URL的pattern以及第三沟通工具的URL的pattern分别对应的URL;
202、从URL序列中,分别获取第一沟通工具的URL的pattern、第二沟通工具的URL的pattern以及第三沟通工具的URL的pattern、分别对应的URL被访问之前的最近邻访问的URL,作为对应的候选沟通页面的URL;
在每一个用户访问页面的过程中,网站服务器会记录每一个用户连续访问的URL序列。本实施例的页面处理的装置,可以从网站服务器获取各个用户的URL序列;并通过上文中描述的沟通工具的pattern,从各个URL序列中识别第一沟通工具的URL的pattern、第二沟通工具的URL的pattern以及第三沟通工具的URL的pattern分别对应的URL;可以简单认为每一个沟通工具的URL的pattern对应的URL的前一个页面,即为触发沟通的页面,据此便可以得到所有的候选沟通页面的URL。且根据每一个沟通工具的URL的pattern,可以确定该沟通工具的标识;因此可以生成<候选沟通页面的URL,对应沟通工具的标识>的Key-Value对。
203、根据各候选沟通页面的URL,利用无界面浏览器访问对应的候选沟通页面;并从各候选沟通页面中获取候选沟通页面的页面参数属性;
由于本实施例重在分析各个候选沟通页面的URL,不需要各个候选沟通页面真实打开,因此本实施例中利用无界面浏览器访问对应的候选沟通页面,以实现对页面的打开,便于后续对页面的分析。例如,本实施例的无界面浏览器可以为PhantomJS。
204、根据各候选沟通页面的页面参数属性分析对应的候选沟通页面是否为触发沟通的页面,以从各候选沟通页面中获取触发沟通的页面;
由于候选沟通页面仅仅是初步筛选出来的可能会触发沟通的页面,本步骤具体去验证每一个候选沟通页面是否真正的触发沟通。例如,本实施例中具体可以从打开的候选沟通页面中提取页面参数属性,然后根据页面参数属性分析对应的候选沟通页面是否真正的触发沟通。
205、根据各触发沟通的页面的页面参数属性以及触发的沟通工具的标识,生成沟通配置文件。
例如,步骤204和步骤205具体可以包括如下三种情况中至少一种:
第一种情况、步骤204具体可以采用如下方式实现:对于各候选沟通页面,提取对应的候选沟通页面中各超链网址,判断超链网址是否符合各沟通工具的URL的pattern;若符合时,确定候选沟通页面为触发沟通的页面;
对应的步骤205具体可以为:对于各触发沟通的页面,创建超链网址与对应的第一沟通工具的标识之间的第一配置关系。
例如,提取页面中的超链网址url_a,判断该超链url_a是否符合某沟通工具的URL的pattern;若该超链url_a符合沟通工具comm_type_a的URL的pattern,则确定候选沟通页面为触发沟通的页面,根据超链网址url_a和沟通工具的标识comm_type_a,生成第一配置关系<url_a,comm_type_a>,并输出;若该超链不符合任意沟通工具的URL的pattern,也有可能是中间跳转页,新打开窗口访问该超链url_a,看其最终跳转的页面,是否符合某沟通工具的URL的pattern,若是则生成第一配置关系<url_a,comm_type_a>,并正常输出;若还是没有匹配到任意沟通工具,则输出<url_a,False>,确定该超链网址url_a不触发任何沟通工具。
第二种情况、步骤204具体可以采用如下方式实现:对于各候选沟通页面,提取对应的候选沟通页面中各绑定点击事件的元素的属性,根据各元素的属性判断点击事件触发后所请求的页面的URL,是否符合各沟通工具的URL的pattern;若符合时,确定候选沟通页面为触发沟通的页面;
对应的步骤205具体可以为:对于各触发沟通的页面,创建绑定在元素上的点击事件的标识与对应的第二沟通工具的标识之间的第二配置关系;
例如,解析候选沟通页面内容,提取页面中各元素绑定的点击事件onclick_a,并触发该点击事件,判断点击事件触发后所请求的页面的URL是否符合某沟通工具的URL的pattern;若点击事件触发后所请求的页面的URL符合沟通工具comm_type_a的URL的pattern,根据点击事件的标识onclick_a和沟通工具的标识comm_type_a,生成第二配置关系<onclick_a,comm_type_a>,并输出;否则输出<onclick_a,False>,确定该点击事件的标识onclick_a不触发任何沟通工具。
其中点击事件函数可能绑定在元素的“onclick”的属性中,或以“href=“javascript:…””这样的形式展现在其中的冒号“:”之后。例如onclick的属性可能是:openQQ()、jump_other_href("www.baidu.com")。其中openQQ()即为点击事件函数。当该元素被点击时,发生点击事件,根据onclick的属性中的点击事件函数openQQ()请求对应的资源,即打开QQ,以使用该沟通工具进行沟通。
第三种情况、步骤204具体可以采用如下方式实现:对于各候选沟通页面,提取对应的候选沟通页面中各元素的id,判断各元素的id对应的元素触发后所请求的页面的URL,是否符合各沟通工具的URL的pattern;若符合时,确定候选沟通页面为触发沟通的页面。
对应的步骤205具体可以为:对于各触发沟通的页面,创建元素的id与对应的第三沟通工具的标识之间对应的第三配置关系。
例如,解析候选沟通页面内容,解析页面内容,提取页面中各个有id的元素,如提元素标识为id_a的元素,并触发点击事件,判断点击后所请求的页面URL符合某沟通工具的URL的pattern;若点击后所请求的页面URL符合沟通工具comm_type_a的URL的pattern,则根据元素标识为id_a和沟通工具的标识comm_type_a,生成第二配置关系<id_a,comm_type_a>,并输出;否则输出<id_a,False>,确定该元素的标识id_a不触发任何沟通工具。
上述第三种情形为触发id的点击事件的情形下,而上述第二配置关系中触发事件函数的情形下。
例如,如果一个元素是<div id="QQ"onclick="openQQ()">XXXXX</div>,这是触发事件函数的方式,就是在javascript中执行openQQ();含义为执行了一个函数,函数名是openQQ(),对应上述第二种情况。
而触发id的点击事件,则是getElementById("QQ").click(),前面的openQQ()是一个私有函数;后面的这个getElementById是一种通用的函数,它的意思是,找到id为“QQ”的元素,并进行点击。对应上述第三种情况。
本实施例还可以对生成的沟通配置文件,定期维护,定期更新,以使其能够实时、全面地覆盖页面参数属性与沟通工具的标识之间对应的所有配置关系。
本实施例的沟通配置文件可以是通过对一个网站的所有的超链、id元素及事件函数进行分析得到的,也可以是对多个网站的所有的超链、id元素及事件函数进行综合分析得到的。而且,本实施例得到的沟通配置文件具有很强的通用性,可以适用于任何网站上用户请求访问的页面的检测。
上述三种情况可以单独实施,也可以互相组合来使用,通过采用上述实施例的方式,得到的本实施例的沟通配置文件可以包括上述三种配置关系中至少一种,实际应用中,还可以通过其他页面参数属性,得到配置文件中的其他的配置关系,在此不再一一举例赘述。
进一步可选地,本实施例得到沟通配置文件之后,可以按照上述实施例的步骤100和步骤101,获取该沟通配置文件,并根据该沟通配置文件对用户请求访问的页面进行检测,详细可以参考上述实施例的记载,在此不再赘述。
本实施例的页面的处理方法,通过采用上述实施例的技术方案,可以实现沟通配置文件的创建,进而可以根据该沟通配置文件对用户请求访问的页面进行检测;与现有的设置埋点检测相比,本实施例的方案具有更强的适用性,不会随着沟通工具的一次改版、一次迭代更新重新设置沟通配置文件,从而可以提高触发沟通的页面的统计效率,进而可以根据统计分析的结果,优化页面设计,增强用户的体验。而且本实施例的沟通配置文件的创建,不用研发人员消耗大量的时间在线设置埋点,从而可以提高页面的统计效率。
图3为本发明的页面的处理装置实施例一的结构图。如图3所示,本实施例的页面的处理装置,具体可以包括:获取模块10和检测模块11。
其中获取模块10用于当用户请求访问页面时,获取沟通配置文件;检测模块11用于根据获取模块10获取的沟通配置文件,检测用户请求访问的页面是否为触发沟通的页面。
进一步可选地,本实施例的页面的处理装置中,获取模块10还用于从沟通配置文件中获取页面参数属性与沟通工具的标识之间对应的配置关系;检测模块11具体用于根据获取模块10获取的页面参数属性与沟通工具的标识之间对应的配置关系,检测用户请求访问的页面是否为触发沟通的页面。
进一步可选地,本实施例的页面的处理装置中,页面参数属性与沟通工具的标识之间对应的配置关系包括如下至少一种:超链网址与对应的第一沟通工具的标识之间的第一配置关系、点击事件的标识与对应的第二沟通工具的标识之间的第二配置关系、以及元素的id与对应的第三沟通工具的标识之间的第三配关系。
进一步可选地,本实施例的页面的处理装置中,检测模块11具体用于:
分别根据获取模块10获取的第一配置关系判断用户请求访问的页面是否触发第一沟通工具、根据第二配置关系判断用户请求访问的页面是否触发第二沟通工具、以及根据第三配置关系判断用户请求访问的页面是否触发第三沟通工具;
当页面触发第一沟通工具、第二沟通工具以及第三沟通工具中任意一种,确定页面为触发沟通的页面;否则当页面未触发第一沟通工具、第二沟通工具以及第三沟通工具中任意一种,确定页面为未触发沟通的页面。
进一步可选地,本实施例的页面的处理装置中,检测模块11具体用于:
根据获取模块10获取的第一配置关系,判断用户请求访问的页面的所有超链网址中是否存在与第一沟通工具对应的超链网址,若存在,确定页面为触发第一沟通工具的页面;否则确定页面为不触发第一沟通工具的页面;
根据获取模块10获取的第二配置关系,判断用户访问的页面的所有绑定在各元素上的点击事件中是否存在与第二沟通工具对应的点击事件,若存在,确定页面为触发第二沟通工具的页面;否则确定页面为不触发第二沟通工具的页面;以及
根据获取模块10获取的第三配置关系,判断用户请求访问的页面的各元素的id中是否存在与第三沟通工具对应的元素的id,若存在,确定页面为触发第三沟通工具的页面;否则确定页面为不触发第三沟通工具的页面。
本实施例的页面的处理装置,通过采用上述模块实现页面的处理,与上述图1所示的相关方法实施例的实现原理以及技术效果相同,详细可以参考上述图1所示的相关方法实施例的记载,在此不再赘述。
图4为本发明的页面的处理装置实施例二的结构图。如图4所示,本实施例的页面的处理装置还包括:创建模块12用于创建沟通配置文件。
进一步可选地,本实施例的页面的处理装置中创建模块12具体可以包括:获取单元121、识别单元122、访问单元123、分析单元124和生成单元125。
其中获取单元121用于分别获取第一沟通工具的网址的pattern、第二沟通工具的网址的pattern以及第三沟通工具的网址的pattern;识别单元122用于从连续被访问的网址序列中,分别识别获取单元121获取的第一沟通工具的网址的pattern、第二沟通工具的网址的pattern以及第三沟通工具的网址的pattern分别对应的网址;获取单元121还用于根据识别单元122的识别结果,从网址序列中,分别获取第一沟通工具的网址的pattern、第二沟通工具的网址的pattern以及第三沟通工具的网址的pattern、分别对应的网址被访问之前的最近邻访问的网址,作为对应的候选沟通页面的网址;访问单元123用于根据获取单元121获取的各候选沟通页面的网址,利用无界面浏览器访问对应的候选沟通页面;获取单元121还用于从访问单元123打开的各候选沟通页面中获取对应的候选沟通页面的页面参数属性;分析单元124用于根据获取单元121获取的各候选沟通页面的页面参数属性分析对应的候选沟通页面是否为触发沟通的页面,以从各候选沟通页面中获取触发沟通的页面;生成单元125用于根据分析单元124分析的结果,根据各触发沟通的页面的页面参数属性以及触发的沟通工具的标识,生成沟通配置文件。同理,本实施例的网址具体也可以采用URL来实现。
进一步可选地,本实施例的页面的处理装置中,分析单元124具体用于执行如下至少一种操作:
对于各候选沟通页面,提取对应的候选沟通页面中各超链网址,判断超链网址是否符合各沟通工具的网址的pattern;若符合时,确定候选沟通页面为触发沟通的页面;
对于各候选沟通页面,提取对应的候选沟通页面中各绑定点击事件的元素的属性,根据各元素的属性判断点击事件触发后所请求的页面的网址,是否符合各沟通工具的网址的pattern;若符合时,确定候选沟通页面为触发沟通的页面;以及
对于各候选沟通页面,提取对应的候选沟通页面中各元素的id,判断各元素的id对应的元素触发后所请求的页面的网址,是否符合各沟通工具的网址的pattern;若符合时,确定候选沟通页面为触发沟通的页面;
生成单元125具体用于执行如下至少一种操作:
对于各触发沟通的页面,创建超链网址与对应的第一沟通工具的标识之间的第一配置关系;
对于各触发沟通的页面,创建绑定在元素上的点击事件的标识与对应的第二沟通工具的标识之间的第二配置关系;以及
对于各触发沟通的页面,创建元素的id与对应的第三沟通工具的标识之间对应的第三配置关系。
此时,对应的获取模块10可以与生成单元125连接,获取模块10具体用于当用户请求访问页面时,从生成单元125生成的沟通配置文件中获取沟通配置文件。
本实施例的页面的处理装置,通过采用上述模块实现页面的处理,与上述图2所示的相关方法实施例的实现原理以及技术效果相同,详细可以参考上述图2所示的相关方法实施例的记载,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (16)

1.一种页面的处理方法,其特征在于,所述方法包括:
当用户请求访问页面时,获取沟通配置文件;
根据所述沟通配置文件,检测所述用户请求访问的所述页面是否为触发沟通的页面。
2.根据权利要求1所述的方法,其特征在于,根据所述沟通配置文件,检测所述用户请求访问的所述页面是否为触发沟通的页面之前,所述方法还包括:
从所述沟通配置文件中获取页面参数属性与沟通工具的标识之间对应的配置关系;
根据所述沟通配置文件,检测所述用户请求访问的所述页面是否为触发沟通的页面,具体包括:
根据所述页面参数属性与沟通工具的标识之间对应的配置关系,检测所述用户请求访问的所述页面是否为触发沟通的页面。
3.根据权利要求2所述的方法,其特征在于,所述页面参数属性与沟通工具的标识之间对应的配置关系包括如下至少一种:超链网址与对应的第一沟通工具的标识之间的第一配置关系、点击事件的标识与对应的第二沟通工具的标识之间的第二配置关系、以及元素的身份标识与对应的第三沟通工具的标识之间的第三配关系。
4.根据权利要求3所述的方法,其特征在于,根据所述页面参数属性与沟通工具的标识之间对应的配置关系,检测所述用户请求访问的所述页面是否为触发沟通的页面,具体包括:
分别根据所述第一配置关系判断所述用户请求访问的所述页面是否触发所述第一沟通工具、根据所述第二配置关系判断所述用户请求访问的所述页面是否触发所述第二沟通工具、以及根据所述第三配置关系判断所述用户请求访问的所述页面是否触发所述第三沟通工具;
当所述页面触发所述第一沟通工具、所述第二沟通工具以及所述第三沟通工具中任意一种,确定所述页面为触发沟通的页面;否则当所述页面未触发所述第一沟通工具、所述第二沟通工具以及所述第三沟通工具中任意一种,确定所述页面为未触发沟通的页面。
5.根据权利要求4所述的方法,其特征在于,根据所述第一配置关系判断所述用户请求访问的所述页面是否触发所述第一沟通工具,具体包括:
根据所述第一配置关系,判断所述用户请求访问的所述页面的所有超链网址中是否存在与所述第一沟通工具对应的超链网址,若存在,确定所述页面为触发所述第一沟通工具的页面;否则确定所述页面为不触发所述第一沟通工具的页面;
根据所述第二配置关系判断所述用户请求访问的所述页面是否触发所述第二沟通工具,具体包括:
根据所述第二配置关系,判断所述用户访问的所述页面的所有绑定在各元素上的点击事件中是否存在与所述第二沟通工具对应的点击事件,若存在,确定所述页面为触发所述第二沟通工具的页面;否则确定所述页面为不触发所述第二沟通工具的页面;
根据所述第三配置关系判断所述用户请求访问的所述页面是否触发所述第三沟通工具,具体包括:
根据所述第三配置关系,判断所述用户请求访问的所述页面的各元素的身份标识中是否存在与所述第三沟通工具对应的元素的身份标识,若存在,确定所述页面为触发所述第三沟通工具的页面;否则确定所述页面为不触发所述第三沟通工具的页面。
6.根据权利要求3-5任一所述的方法,其特征在于,获取沟通配置文件之前,所述方法还包括:创建所述沟通配置文件。
7.根据权利要求6所述的方法,其特征在于,创建所述沟通配置文件,具体包括:
分别获取所述第一沟通工具的网址的模式、所述第二沟通工具的网址的模式以及所述第三沟通工具的网址的模式;
从连续被访问的网址序列中,分别识别所述第一沟通工具的网址的模式、所述第二沟通工具的网址的模式以及所述第三沟通工具的网址的模式分别对应的网址;
从所述网址序列中,分别获取所述第一沟通工具的网址的模式、所述第二沟通工具的网址的模式以及所述第三沟通工具的网址的模式、分别对应的网址被访问之前的最近邻访问的网址,作为对应的候选沟通页面的网址;
根据各所述候选沟通页面的网址,利用无界面浏览器访问对应的所述候选沟通页面;并从各所述候选沟通页面中获取所述候选沟通页面的页面参数属性;
根据各所述候选沟通页面的页面参数属性分析对应的所述候选沟通页面是否为触发沟通的页面,以从各所述候选沟通页面中获取所述触发沟通的页面;
根据各所述触发沟通的页面的所述页面参数属性以及触发的沟通工具的标识,生成所述沟通配置文件。
8.根据权利要求7所述的方法,其特征在于,根据各所述候选沟通页面的页面参数属性分析各所述候选沟通页面是否为触发沟通的页面,以从各所述候选沟通页面中获取所述触发沟通的页面,具体包括如下至少一种操作:
对于各所述候选沟通页面,提取对应的所述候选沟通页面中各超链网址,判断所述超链网址是否符合各所述沟通工具的网址的模式;若符合时,确定所述候选沟通页面为触发沟通的页面;
对于各所述候选沟通页面,提取对应的所述候选沟通页面中各绑定点击事件的元素的属性,根据各所述元素的属性判断所述点击事件触发后所请求的页面的网址,是否符合各所述沟通工具的网址的模式;若符合时,确定所述候选沟通页面为触发沟通的页面;以及
对于各所述候选沟通页面,提取对应的所述候选沟通页面中各元素的身份标识,判断各所述元素的身份标识对应的所述元素触发后所请求的页面的网址,是否符合各所述沟通工具的网址的模式;若符合时,确定所述候选沟通页面为触发沟通的页面;
根据各所述触发沟通的页面的所述页面参数属性以及触发的沟通工具的标识,生成所述沟通配置文件,具体包括如下至少一种:
对于各所述触发沟通的页面,创建所述超链网址与对应的所述第一沟通工具的标识之间的所述第一配置关系;
对于各所述触发沟通的页面,创建绑定在所述元素上的所述点击事件的标识与对应的所述第二沟通工具的标识之间的所述第二配置关系;以及
对于各所述触发沟通的页面,创建所述元素的身份标识与对应的所述第三沟通工具的标识之间对应的所述第三配置关系。
9.一种页面的处理装置,其特征在于,所述装置包括:
获取模块,用于当用户请求访问页面时,获取沟通配置文件;
检测模块,用于根据所述沟通配置文件,检测所述用户请求访问的所述页面是否为触发沟通的页面。
10.根据权利要求9所述的装置,其特征在于:
所述获取模块,还用于从所述沟通配置文件中获取页面参数属性与沟通工具的标识之间对应的配置关系;
所述检测模块,具体用于根据所述页面参数属性与沟通工具的标识之间对应的配置关系,检测所述用户请求访问的所述页面是否为触发沟通的页面。
11.根据权利要求10所述的装置,其特征在于,所述页面参数属性与沟通工具的标识之间对应的配置关系包括如下至少一种:超链网址与对应的第一沟通工具的标识之间的第一配置关系、点击事件的标识与对应的第二沟通工具的标识之间的第二配置关系、以及元素的身份标识与对应的第三沟通工具的标识之间的第三配关系。
12.根据权利要求11所述的装置,其特征在于,所述检测模块,具体用于:
分别根据所述第一配置关系判断所述用户请求访问的所述页面是否触发所述第一沟通工具、根据所述第二配置关系判断所述用户请求访问的所述页面是否触发所述第二沟通工具、以及根据所述第三配置关系判断所述用户请求访问的所述页面是否触发所述第三沟通工具;
当所述页面触发所述第一沟通工具、所述第二沟通工具以及所述第三沟通工具中任意一种,确定所述页面为触发沟通的页面;否则当所述页面未触发所述第一沟通工具、所述第二沟通工具以及所述第三沟通工具中任意一种,确定所述页面为未触发沟通的页面。
13.根据权利要求12所述的装置,其特征在于,所述检测模块,具体用于:
根据所述第一配置关系,判断所述用户请求访问的所述页面的所有超链网址中是否存在与所述第一沟通工具对应的超链网址,若存在,确定所述页面为触发所述第一沟通工具的页面;否则确定所述页面为不触发所述第一沟通工具的页面;
根据所述第二配置关系,判断所述用户访问的所述页面的所有绑定在各元素上的点击事件中是否存在与所述第二沟通工具对应的点击事件,若存在,确定所述页面为触发所述第二沟通工具的页面;否则确定所述页面为不触发所述第二沟通工具的页面;以及
根据所述第三配置关系,判断所述用户请求访问的所述页面的各元素的身份标识中是否存在与所述第三沟通工具对应的元素的身份标识,若存在,确定所述页面为触发所述第三沟通工具的页面;否则确定所述页面为不触发所述第三沟通工具的页面。
14.根据权利要求11-13任一所述的装置,其特征在于,所述装置还包括:创建模块,用于创建所述沟通配置文件。
15.根据权利要求14所述的装置,其特征在于,所述创建模块,具体包括:
获取单元,用于分别获取所述第一沟通工具的网址的模式、所述第二沟通工具的网址的模式以及所述第三沟通工具的网址的模式;
识别单元,用于从连续被访问的网址序列中,分别识别所述第一沟通工具的网址的模式、所述第二沟通工具的网址的模式以及所述第三沟通工具的网址的模式分别对应的网址;
所述获取单元,还用于根据所述识别单元的识别结果,从所述网址序列中,分别获取所述第一沟通工具的网址的模式、所述第二沟通工具的网址的模式以及所述第三沟通工具的网址的模式、分别对应的网址被访问之前的最近邻访问的网址,作为对应的候选沟通页面的网址;
访问单元,用于根据各所述候选沟通页面的网址,利用无界面浏览器访问对应的所述候选沟通页面;
所述获取单元,还用于从所述访问单元打开的各所述候选沟通页面中获取所述候选沟通页面的页面参数属性;
分析单元,用于根据各所述候选沟通页面的页面参数属性分析对应的所述候选沟通页面是否为触发沟通的页面,以从各所述候选沟通页面中获取所述触发沟通的页面;
生成单元,用于根据各所述触发沟通的页面的所述页面参数属性以及触发的沟通工具的标识,生成所述沟通配置文件。
16.根据权利要求15所述的装置,其特征在于,所述分析单元,具体用于执行如下至少一种操作:
对于各所述候选沟通页面,提取对应的所述候选沟通页面中各超链网址,判断所述超链网址是否符合各所述沟通工具的网址的模式;若符合时,确定所述候选沟通页面为触发沟通的页面;
对于各所述候选沟通页面,提取对应的所述候选沟通页面中各绑定点击事件的元素的属性,根据各所述元素的属性判断所述点击事件触发后所请求的页面的网址,是否符合各所述沟通工具的网址的模式;若符合时,确定所述候选沟通页面为触发沟通的页面;以及
对于各所述候选沟通页面,提取对应的所述候选沟通页面中各元素的身份标识,判断各所述元素的身份标识对应的所述元素触发后所请求的页面的网址,是否符合各所述沟通工具的网址的模式;若符合时,确定所述候选沟通页面为触发沟通的页面;
所述生成单元,具体用于执行如下至少一种操作:
对于各所述触发沟通的页面,创建所述超链网址与对应的所述第一沟通工具的标识之间的所述第一配置关系;
对于各所述触发沟通的页面,创建绑定在所述元素上的所述点击事件的标识与对应的所述第二沟通工具的标识之间的所述第二配置关系;以及
对于各所述触发沟通的页面,创建所述元素的身份标识与对应的所述第三沟通工具的标识之间对应的所述第三配置关系。
CN201610421387.7A 2016-06-14 2016-06-14 页面的处理方法及装置 Active CN106095946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610421387.7A CN106095946B (zh) 2016-06-14 2016-06-14 页面的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610421387.7A CN106095946B (zh) 2016-06-14 2016-06-14 页面的处理方法及装置

Publications (2)

Publication Number Publication Date
CN106095946A true CN106095946A (zh) 2016-11-09
CN106095946B CN106095946B (zh) 2020-03-31

Family

ID=57845650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610421387.7A Active CN106095946B (zh) 2016-06-14 2016-06-14 页面的处理方法及装置

Country Status (1)

Country Link
CN (1) CN106095946B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674017A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 埋点方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090031287A1 (en) * 2007-07-23 2009-01-29 Bin Ni Container-less jsp template
CN101641686A (zh) * 2007-03-15 2010-02-03 宋承俊 与联系的网站相关联的因特网服务系统以及方法
CN102362261A (zh) * 2009-03-25 2012-02-22 微软公司 通过网络浏览器输入内容至应用程序
CN103902534A (zh) * 2012-12-24 2014-07-02 联想(北京)有限公司 一种网页程序触发本地操作的方法和装置
CN104050192A (zh) * 2013-03-15 2014-09-17 腾讯科技(深圳)有限公司 一种运行应用的方法、装置和系统
CN104199701A (zh) * 2014-09-01 2014-12-10 安一恒通(北京)科技有限公司 一种在浏览器中启动应用的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101641686A (zh) * 2007-03-15 2010-02-03 宋承俊 与联系的网站相关联的因特网服务系统以及方法
US20090031287A1 (en) * 2007-07-23 2009-01-29 Bin Ni Container-less jsp template
CN102362261A (zh) * 2009-03-25 2012-02-22 微软公司 通过网络浏览器输入内容至应用程序
CN103902534A (zh) * 2012-12-24 2014-07-02 联想(北京)有限公司 一种网页程序触发本地操作的方法和装置
CN104050192A (zh) * 2013-03-15 2014-09-17 腾讯科技(深圳)有限公司 一种运行应用的方法、装置和系统
CN104199701A (zh) * 2014-09-01 2014-12-10 安一恒通(北京)科技有限公司 一种在浏览器中启动应用的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674017A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 埋点方法、装置及存储介质
CN110674017B (zh) * 2018-07-03 2023-04-28 百度在线网络技术(北京)有限公司 埋点方法、装置及存储介质

Also Published As

Publication number Publication date
CN106095946B (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN108304410A (zh) 一种异常访问页面的检测方法、装置及数据分析方法
CN108763274B (zh) 访问请求的识别方法、装置、电子设备及存储介质
CN108334641B (zh) 采集用户行为数据的方法、系统、电子设备、存储介质
CN102663052B (zh) 一种提供搜索引擎搜索结果的方法及装置
CN111435393B (zh) 对象漏洞的检测方法、装置、介质及电子设备
US20080282233A1 (en) Rapid application innovation utilizing an orthogonal programming component
US8639560B2 (en) Brand analysis using interactions with search result items
CN110858172A (zh) 一种自动化测试代码生成方法和装置
CN105871947A (zh) 跨域请求数据的方法及装置
Eddy et al. Impact of structural weighting on a latent dirichlet allocation–based feature location technique
CN108667770A (zh) 一种网站的漏洞测试方法、服务器及系统
CN109862074B (zh) 一种数据采集方法、装置、可读介质及电子设备
CN1997997A (zh) 改进的用户界面
CN110719344B (zh) 域名获取方法、装置、电子设备及存储介质
CN106095946A (zh) 页面的处理方法及装置
Kapusta et al. Determining the time window threshold to identify user sessions of stakeholders of a commercial bank portal
Barbier et al. Robust speech parameters extraction for word recognition in noise using neural networks
CN110232019A (zh) 页面测试方法及相关产品
Guo et al. A web crawler detection algorithm based on web page member list
CN110263283A (zh) 网站检测方法和装置
Athaiya Inferring page models for web application analysis
CN112988560A (zh) 测试系统健壮性的方法和装置
CN116599877B (zh) 一种基于爬虫技术的IPv6的链接测试方法
US11461588B1 (en) Advanced data collection block identification
Patel et al. Pattern classification based on web usage mining using neural network technique

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant