发明内容
本发明的主要目的在于提供一种网页浏览分析处理方法及装置,以解决用户网页浏览行为分析结果准确性低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种网页浏览分析处理方法。
根据本发明的网页浏览分析处理方法包括:确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页;检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置;检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置;确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域;以及计算浏览区域的浏览时间,其中,浏览区域的浏览时间包括停留在所述第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
进一步地,上述网页浏览分析处理方法通过Javascript脚本检测滚动轴在目标网页上的第一位置;通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,通过滚动轴在第一位置和第二位置的时刻计算浏览区域的浏览时间。
进一步地,在检测滚动轴在目标网页上的第二位置之前,方法还包括:判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
进一步地,判断滚动轴是否滚动包括:检测滚动轴在目标网页上的当前位置;比较当前位置和第一位置是否相同;以及当当前位置和第一位置相同时,则判断滚动轴发生滚动,当当前位置和第一位置不相同时,则判断滚动轴没有发生滚动。
进一步地,在计算浏览区域的浏览时间之后,网页浏览分析处理方法包括:获取预设网页浏览时间;比较浏览区域的浏览时间和预设网页浏览时间;以及当浏览区域的浏览时间大于预设网页浏览时间,则删除浏览区域的浏览时间。
为了实现上述目的,根据本发明的另一方面,提供了一种网页浏览分析处理装置。
网页浏览分析处理装置包括:第一确定模块,用于确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页;第一检测模块,用于检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置;第二检测模块,用于检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置;第二确定模块,用于确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域;以及计算模块,用于计算浏览区域的浏览时间,其中,浏览区域的浏览时间为滚动轴在目标网页上由第一位置滚动到第二位置的时间。
进一步地,第一检测模块通过Javascript脚本检测滚动轴在目标网页上的第一位置;第二检测模块通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及计算模块通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,浏览区域的浏览时间包括停留在第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
进一步地,在检测滚动轴在目标网页上的第二位置之前,装置还包括:判断模块,用于判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
进一步地,判断模块包括:检测单元,用于检测滚动轴在目标网页上的当前位置;第一比较单元,用于比较当前位置和第一位置是否相同;以及判断单元,用于当当前位置和第一位置相同时,判断滚动轴发生滚动,当当前位置和第一位置不相同时,判断滚动轴没有发生滚动。
在计算浏览区域的浏览时间之后,网页浏览分析处理装置还包括:获取模块,用于获取预设网页浏览时间;比较模块,用于比较浏览区域的浏览时间和预设网页浏览时间;以及删除模块,用于当浏览区域的浏览时间大于预设网页浏览时间,删除浏览区域的浏览时间。
通过本发明,采用计算滚动轴的每个位置对应的浏览区域的浏览时间来分析用户的网页浏览行为,解决了没有分析通过滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题,进而达到了提高用户网页浏览行为分析结果准确性的效果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了多个元器件的系统、产品或设备不必限于清楚地列出的那些元器件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它元器件。
根据本发明的实施例,提供了一种网页浏览分析处理方法,图1是根据本发明第一实施例的网页浏览分析处理方法的流程图。
如图1所示,该网页浏览分析处理方法包括如下的步骤S102至步骤S110:
步骤S102:确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页。
当网页内容较多时,在显示终端中无法同时显示出该网页的全部内容,此时通过在网页上设置滚动轴,用户通过上下方向或是左右方向滚动该滚动轴,就可以浏览到网页的全部内容。
步骤S104:检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置。
用户刚进入到被访问的目标网页时,滚动轴位于滚动轴可以滚动区域的边缘位置,并在显示终端上显示出当前目标网页中可被浏览的区域。滚动轴在目标页面的位置与目标网页的浏览区域相互对应,因此通过检测滚动轴的位置可以相应的得到目标页面的浏览区域。
步骤S106:检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置。
当滚动轴发生滚动后滚动轴的位置发生改变,在显示终端上显示的目标网页的浏览区域也相应的改变。通过检测滚动轴发生滚动后的位置也就相应的得到滚动轴发生滚动后目标页面的浏览区域。
步骤S108:确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域。
步骤S110:计算浏览区域的浏览时间,其中,浏览区域的浏览时间包括停留在第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
由于在滚动轴发生滚动之前,在显示终端上显示的目标网页的浏览区域是滚动轴在目标网页上的第一位置时对应的目标网页的浏览区域。因此,滚动轴停留在目标网页上的第一位置的时间即为用户浏览第一位置对应的目标网页的浏览区域的时间。
用户进入到目标网页时,第一次检测滚动轴在目标网页的第一位置,并以该位置作为初始位置,当滚动轴发生滚动后,第二次检测滚动轴在目标网页的第二位置。同时计算滚动轴停留在第一位置的时间,该时间即为用户浏览滚动轴在第一位置时对应的网页浏览区域的浏览时间。当滚动轴再次发生滚动后,第三次检测滚动轴在目标网页的第三位置,此时可以计算滚动轴在第二位置的停留时间,该时间即为用户浏览滚动轴在第二位置时对应的浏览区域的浏览时间。同样的方法计算滚动轴处于目标网页其他位置时对应的浏览区域的浏览时间。
本发明通过检测滚动轴在目标网页的第一位置和滚动轴发生滚动后在目标网页的第二位置,并通过计算滚动轴在目标网页上由第一位置滚动到第二位置的时间得到滚动轴在目标网页的第一位置时目标页面中显示的浏览区域的浏览时间。利用得到的浏览时间分析用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题,进一步提高了用户网页浏览行为分析结果准确性。
可选地,本发明实施例提供的网页浏览分析处理方法通过Javascript脚本检测滚动轴在目标网页上的第一位置;通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,通过滚动轴在第一位置和第二位置的时刻计算浏览区域的浏览时间。
Javascript是一种直译式脚本语言,主要用来向HTML(标准通用标记语言下的一个应用)页面添加交互行为。Javascript脚本即由Javascript语言编写的脚本,Javascript脚本可以直接嵌入HTML页面中,但写成单独的Javascript文件有利于结构和行为的分离。Javascript脚本可以用来检测访客的浏览器信息、对浏览器事件做出响应等。
在进行网站的网页浏览分析处理之前,在网站的每个网页都嵌入一段Javascript脚本,在用户进入到该网站的网页时,在加载网页的同时也加载了嵌入在网页的Javascript脚本。该Javascript脚本同时启动执行,收集该网页的相关信息,包括用户的浏览器类型、当前时间、滚动轴的位置等,并将收集到的网页的相关信息通过http 请求发送给服务器。通过Javascript脚本检测滚动轴在目标页面的位置以及在该位置对应的时刻,并将检测到的滚动轴在目标页面的位置和该位置对应的时刻发送给服务器。 Javascript脚本持续的检测滚动轴的位置,只有当检测到的滚动轴的位置发生变化时才将滚动轴新位置和该新位置对应的时刻发送给服务器。此时服务器根据滚动轴原来位置对应的时刻和滚动轴新位置对应的时刻相减即为滚动轴停留在原来位置的时间,也就是滚动轴在原来位置对应的浏览区域的浏览时间。
优选地,在检测滚动轴在目标网页上的第二位置之前,方法还包括:判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
由于频繁的检测滚动轴的位置会造成资源被占用,例如,在使用Javascript脚本检测滚动轴的位置并发送给服务器时,如果Javascript脚本每检测一次滚动轴的位置和该位置对应的时刻就向服务器发送一次请求,频繁的操作会严重的占用服务器的资源。因此,通过判断滚动轴是否滚动来确定是否需要再次检测滚动轴的位置,只有当滚动轴发生滚动时,才再次检测滚动轴的位置,这样可以避免由于频繁检测滚动轴的位置造成的资源被占用。
可选地,判断滚动轴是否滚动包括:检测滚动轴在目标网页上的当前位置;比较当前位置和第一位置是否相同;以及如果当前位置和第一位置相同,则判断滚动轴发生滚动,如果当前位置和第一位置不相同,则判断滚动轴没有发生滚动。
例如,通过Javascript脚本持续的检测滚动轴的位置,在每次检测完滚动轴的位置后,都与前一次检测的滚动轴的位置进行比较,当前后两次检测的滚动轴位置相同时,则说明滚动轴没有发生滚动,当前后两次检测的滚动轴位置不相同时,则说明滚动轴发生滚动,此时将该次检测得到的滚动轴的位置以及该位置对应的时刻发送给服务器。
以下结合图2对上述网页浏览分析处理方法进行说明。
步骤S202:在被监测网站中嵌入Javascript脚本。
Javascript脚本用于检测滚动轴在目标页面的位置和该位置的时刻。
步骤S204:Javascript脚本监测滚动轴的位置,记录当前滚动轴的第一位置和第一时间。
在刚进入目标网页时,需要将检测得到的滚动轴的初始位置和初始时间发送给服务器,二之后检测得到的滚动轴的位置和时间需要在滚动轴发生滚动后才发送给服务器。
步骤S206:判断是否滚动滚动轴。
Javascript脚本持续的检测滚动轴的位置和时间,并比较当前检测的滚动轴的位置与前一次检测得到的滚动轴第一位置进行比较,当两次检测的滚动轴的位置不同时,说明滚动轴发生滚动。
步骤S208:Javascript脚本监测滚动轴的位置-记录此时滚动轴的第二位置和第二时间。
当判定出滚动轴发生滚动后,记录此时滚动轴的当前位置和当前时间,即为第二位置和第二时间。
步骤S210:向服务器发送request请求(包含此刻滚动轴的第二位置和第二时间)。
将滚动轴的第二位置和第二时间发送给服务器。
步骤S212:服务器此时收到的第二时间减去上次收到的第一时间即为用户在之前网页版面的浏览时间)。
优选地,为了提高得到的目标网页的浏览时间对于分析用户浏览行为的准确性,在计算浏览区域的浏览时间之后,网页浏览分析处理方法包括:获取预设网页浏览时间;比较浏览区域的浏览时间和预设网页浏览时间;以及当浏览区域的浏览时间大于预设网页浏览时间,则删除浏览区域的浏览时间。
实际情况中,用户在浏览网页的过程中会出现中断网页的浏览去干其他事情,但是并没有关闭当前浏览的网页,经过一段时间再次浏览当前网页或是关闭该网页,此时计算得到的网页浏览区域的浏览时间并不是用户实际浏览该网页浏览区域的时间,如若在进行用户网页浏览行为分析时考虑这类浏览时间,会降低分析结果的准确性,因此,需要剔除这类不能真实反映用户实际浏览时间的浏览时。通过预先设置浏览目标网页的最长时间,将当前网页的浏览时间与预设的浏览时间进行比较,如果当前网页的浏览时间大于预设的浏览时间,表示当前网页的浏览时间不真实,则删除该当前网页的浏览时间,例如,设置10分钟为用户浏览该网页的最长时间,当浏览时间大于 10分钟时,表示当前网页的浏览时间不真实,删除该条浏览时间。
从以上的描述中,可以看出,本发明实现了如下技术效果:
根据本发明实施例提供的网页浏览分析处理方法,该方法通过检测滚动轴在目标网页的第一位置和滚动轴发生滚动后在目标网页的第二位置,同时检测滚动轴在目标网页的第一位置和第二位置对应的时刻,通过滚动轴在目标网页的第一位置和第二位置对应的时刻计算滚动轴在目标页面的第一位置的停留时间,该停留时间即是第一位置对应的浏览区域的浏览时间。得到的浏览区域的浏览时间体现了用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题,进一步提高了用户网页浏览行为分析结果准确性。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供了一种网页浏览分析处理装置,图3是根据本发明实施例的网页浏览分析处理装的示意图。
如图3所示,该装置包括:第一确定模块10,第一检测模块20,第二检测模块 30,第二确定模块40和计算模块50。
第一确定模块10,用于确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页。
当网页内容较多时,在显示终端中无法同时显示出该网页的全部内容,此时通过在网页上设置滚动轴,用户通过上下方向或是左右方向滚动该滚动轴,就可以浏览到网页的全部内容。
第一检测模块20,用于检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置。
用户刚进入到被访问的目标网页时,滚动轴位于滚动轴可以滚动区域的边缘位置,并在显示终端上显示出当前目标网页中可被浏览的区域。滚动轴在目标页面的位置与目标网页的浏览区域相互对应,因此通过检测滚动轴的位置可以相应的得到目标页面的浏览区域。
第二检测模块30,用于检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置。
当滚动轴发生滚动后滚动轴的位置发生改变,在显示终端上显示的目标网页的浏览区域也相应的改变。通过检测滚动轴发生滚动后的位置也可以相应的得到滚动轴发生滚动后目标页面的浏览区域。
第二确定模块40,用于确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上由第一位置滚动到第二位置时目标网页的显示区域。
计算模块50,用于计算浏览区域的浏览时间,其中,浏览区域的浏览时间包括停留在第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
由于在滚动轴发生滚动之前,在显示终端上显示的目标网页的浏览区域是滚动轴在目标网页上的第一位置时对应的目标网页的浏览区域。因此,滚动轴停留在目标网页上的第一位置的时间即为用户浏览第一位置对应的目标网页的浏览区域的时间。
用户进入到目标网页时,第一次检测滚动轴在目标网页的第一位置,并以该位置作为初始位置,当滚动轴发生滚动后,第二次检测滚动轴在目标网页的第二位置。同时计算滚动轴停留在第一位置的时间,该时间即为用户浏览滚动轴在第一位置时对应的网页浏览区域的浏览时间。当滚动轴再次发生滚动后,第三次检测滚动轴在目标网页的第三位置,此时可以计算滚动轴在第二位置的停留时间,该时间即为用户浏览滚动轴在第二位置时对应的浏览区域的浏览时间。同样的方法计算滚动轴处于目标网页其他位置时对应的浏览区域的浏览时间。
本发明通过第一检测模块10检测滚动轴在目标网页的第一位置和第二检测模块20检测滚动轴发生滚动后在目标网页的第二位置,并通过计算单元50计算滚动轴在目标网页上由第一位置滚动到第二位置的时间得到滚动轴在目标网页的第一位置时目标页面中显示的浏览区域的浏览时间。利用得到浏览时间分析用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题。
可选地,第一检测模块10通过Javascript脚本检测滚动轴在目标网页上的第一位置;第二检测模块20通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及计算模块50,通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,通过滚动轴在第一位置和第二位置的时刻计算浏览区域的浏览时间。
Javascript是一种直译式脚本语言,主要用来向HTML(标准通用标记语言下的一个应用)页面添加交互行为。Javascript脚本即由Javascript语言编写的脚本,Javascript脚本可以直接嵌入HTML页面中,但写成单独的Javascript文件有利于结构和行为的分离。Javascript脚本可以用来检测访客的浏览器信息、对浏览器事件做出响应等。
在进行网站的网页浏览分析处理之前,在网站的每个网页都嵌入一段Javascript脚本,在用户进入到该网站的网页时,在加载网页的同时也加载了嵌入在网页的Javascript脚本。该Javascript脚本同时启动执行,收集该网页的相关信息,包括用户的浏览器类型、当前时间、滚动轴的位置等,并将收集到的网页的相关信息通过http 请求发送给服务器。通过Javascript脚本检测滚动轴在目标页面的位置以及在该位置对应的时刻,并将检测到的滚动轴在目标页面的位置和该位置对应的时刻发送给服务器。 Javascript脚本持续的检测滚动轴的位置,只有当检测到的滚动轴的位置发生变化时才将滚动轴新位置和该新位置对应的时刻发送给服务器。此时服务器根据滚动轴原来位置对应的时刻和滚动轴新位置对应的时刻相减即为滚动轴停留在原来位置的时间,也就是滚动轴在原来位置对应的浏览区域的浏览时间。
图4是根据本发明第二实施例的网页浏览分析处理装的示意图。如图3所示,该装置包括:第一确定模块10,第一检测模块20,第二检测模块30,第二确定模块40,计算模块50和判断模块60。
在检测滚动轴在目标网页上的第二位置之前,判断模块50用于判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
由于频繁的检测滚动轴的位置会造成资源被占用,例如,在使用Javascript脚本检测滚动轴的位置并发送给服务器时,如果Javascript脚本每检测一次滚动轴的位置和该位置对应的时刻就向服务器发送一次请求,频繁的操作会严重的占用服务器的资源。因此,通过判断滚动轴是否滚动来确定是否需要再次检测滚动轴的位置,只有当滚动轴发生滚动时,才再次检测滚动轴的位置,这样可以避免由于频繁检测滚动轴的位置造成的资源被占用。
第一确定模块10,第一检测模块20,第二检测模块30,第二确定模块40和计算模块50同上,在此不再赘述。
可选地,判断模块包括:检测单元,用于检测滚动轴在目标网页上的当前位置;第一比较单元,用于比较当前位置和第一位置是否相同;以及判断单元,用于当当前位置和第一位置相同时,判断滚动轴发生滚动,当当前位置和第一位置不相同时,判断滚动轴没有发生滚动。
例如,通过Javascript脚本持续的检测滚动轴的位置,在每次检测完滚动轴的位置后,都与前一次检测的滚动轴的位置进行比较,当前后两次检测的滚动轴位置相同时,则说明滚动轴没有发生滚动,当前后两次检测的滚动轴位置不相同时,则说明滚动轴发生滚动,此时将该次检测得到的滚动轴的位置以及该位置对应的时刻发送给服务器。
优选地,在计算浏览区域的浏览时间之后,网页浏览分析处理装置还包括:获取模块,用于获取预设网页浏览时间;比较模块,用于比较浏览区域的浏览时间和预设网页浏览时间;以及删除模块,用于当浏览区域的浏览时间大于预设网页浏览时间,删除浏览区域的浏览时间。
实际情况中,用户在浏览网页的过程中会出现中断网页的浏览去干其他事情,但是并没有关闭当前浏览的网页,经过一段时间再次浏览当前网页或是关闭该网页,此时计算得到的网页浏览区域的浏览时间并不是用户实际浏览该网页浏览区域的时间,如若在进行用户网页浏览行为分析时考虑这类浏览时间,会降低分析结果的准确性,因此,需要剔除这类不能真实反映用户实际浏览时间的浏览时。通过预先设置浏览目标网页的最长时间,将当前网页的浏览时间与预设的浏览时间进行比较,如果当前网页的浏览时间大于预设的浏览时间,表示当前网页的浏览时间不真实,则删除该当前网页的浏览时间,例如,设置10分钟为用户浏览该网页的最长时间,当浏览时间大于 10分钟时,表示当前网页的浏览时间不真实,删除该条浏览时间。
根据本发明实施例提供的网页浏览分析处理装置,该装置通过第一检测模块10检测滚动轴在目标网页的第一位置和第二检测模块20滚动轴发生滚动后在目标网页的第二位置,同时计算模块50检测滚动轴在目标网页的第一位置和第二位置对应的时刻,通过滚动轴在目标网页的第一位置和第二位置对应的时刻计算滚动轴在目标页面的第一位置的停留时间,该停留时间即是第一位置对应的浏览区域的浏览时间。得到的浏览区域的浏览时间体现了用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。