CN104166741B - 网页浏览分析处理方法及装置 - Google Patents

网页浏览分析处理方法及装置 Download PDF

Info

Publication number
CN104166741B
CN104166741B CN201410459079.4A CN201410459079A CN104166741B CN 104166741 B CN104166741 B CN 104166741B CN 201410459079 A CN201410459079 A CN 201410459079A CN 104166741 B CN104166741 B CN 104166741B
Authority
CN
China
Prior art keywords
rolling
axis
browsing
time
target webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410459079.4A
Other languages
English (en)
Other versions
CN104166741A (zh
Inventor
钦滨杰
陈俊宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410459079.4A priority Critical patent/CN104166741B/zh
Publication of CN104166741A publication Critical patent/CN104166741A/zh
Application granted granted Critical
Publication of CN104166741B publication Critical patent/CN104166741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种网页浏览分析处理方法及装置。该网页浏览分析处理方法包括:确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页;检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置;检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置;确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域;计算浏览区域的浏览时间。通过本发明,达到了提高用户网页浏览行为分析结果准确性的效果。

Description

网页浏览分析处理方法及装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页浏览分析处理方法及装置。
背景技术
随着互联网的发展,网民数量激增,越来越多的有形交易和无形交易通过网络来实现,而各种大大小小的网站,又是网络的最基本表现方式。人们浏览网站的时间越来越多,产生的价值也越来越大。各网站管理人员也希望能更好的知道用户在自己网站上的行为,通过分析他们的行为来对网站做出优化,留住更多用户,让网站实现更大价值。因此网站分析在近年来变得愈加火热,现有的网站分析的方法是,通过监测用户在网站页面上的点击行为,返回鼠标点击的坐标数据到服务器,以此来对用户行为进行统计和分析。简而言之就是通过收集用户在页面的点击量来分析用户浏览行为。发明人发现,现有的这种分析方法有一个前提,即假定用户在页面的点击行为就代表了用户的实际浏览行为。除此之外,此种用户浏览行为分析方法会遗漏部分仅通过滚动滚动轴进行网页浏览的用户。因为这部分用户即使在网站上停留阅读了很久,也不会有任何点击的行为,只是简单的滑动鼠标中间的滚球来拖动屏幕。例如很多新闻类页面,用户只为了读取新闻和咨询,通过快速滚动滚动轴就能完成,不需要点击页面。所以现有的方法对用户浏览行为的分析结果不能准确的体现用户的浏览行为。
针对相关技术中用户网页浏览行为分析结果准确性低的问题,目前尚没有提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种网页浏览分析处理方法及装置,以解决用户网页浏览行为分析结果准确性低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种网页浏览分析处理方法。
根据本发明的网页浏览分析处理方法包括:确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页;检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置;检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置;确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域;以及计算浏览区域的浏览时间,其中,浏览区域的浏览时间包括停留在所述第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
进一步地,上述网页浏览分析处理方法通过Javascript脚本检测滚动轴在目标网页上的第一位置;通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,通过滚动轴在第一位置和第二位置的时刻计算浏览区域的浏览时间。
进一步地,在检测滚动轴在目标网页上的第二位置之前,方法还包括:判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
进一步地,判断滚动轴是否滚动包括:检测滚动轴在目标网页上的当前位置;比较当前位置和第一位置是否相同;以及当当前位置和第一位置相同时,则判断滚动轴发生滚动,当当前位置和第一位置不相同时,则判断滚动轴没有发生滚动。
进一步地,在计算浏览区域的浏览时间之后,网页浏览分析处理方法包括:获取预设网页浏览时间;比较浏览区域的浏览时间和预设网页浏览时间;以及当浏览区域的浏览时间大于预设网页浏览时间,则删除浏览区域的浏览时间。
为了实现上述目的,根据本发明的另一方面,提供了一种网页浏览分析处理装置。
网页浏览分析处理装置包括:第一确定模块,用于确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页;第一检测模块,用于检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置;第二检测模块,用于检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置;第二确定模块,用于确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域;以及计算模块,用于计算浏览区域的浏览时间,其中,浏览区域的浏览时间为滚动轴在目标网页上由第一位置滚动到第二位置的时间。
进一步地,第一检测模块通过Javascript脚本检测滚动轴在目标网页上的第一位置;第二检测模块通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及计算模块通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,浏览区域的浏览时间包括停留在第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
进一步地,在检测滚动轴在目标网页上的第二位置之前,装置还包括:判断模块,用于判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
进一步地,判断模块包括:检测单元,用于检测滚动轴在目标网页上的当前位置;第一比较单元,用于比较当前位置和第一位置是否相同;以及判断单元,用于当当前位置和第一位置相同时,判断滚动轴发生滚动,当当前位置和第一位置不相同时,判断滚动轴没有发生滚动。
在计算浏览区域的浏览时间之后,网页浏览分析处理装置还包括:获取模块,用于获取预设网页浏览时间;比较模块,用于比较浏览区域的浏览时间和预设网页浏览时间;以及删除模块,用于当浏览区域的浏览时间大于预设网页浏览时间,删除浏览区域的浏览时间。
通过本发明,采用计算滚动轴的每个位置对应的浏览区域的浏览时间来分析用户的网页浏览行为,解决了没有分析通过滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题,进而达到了提高用户网页浏览行为分析结果准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明第一实施例的网页浏览分析处理方法的流程图;
图2是根据本发明第二实施例的网页浏览分析处理方法的流程图;
图3是根据本发明第一实施例的网页浏览分析处理装置的示意图;以及
图4是根据本发明第二实施例的网页浏览分析处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了多个元器件的系统、产品或设备不必限于清楚地列出的那些元器件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它元器件。
根据本发明的实施例,提供了一种网页浏览分析处理方法,图1是根据本发明第一实施例的网页浏览分析处理方法的流程图。
如图1所示,该网页浏览分析处理方法包括如下的步骤S102至步骤S110:
步骤S102:确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页。
当网页内容较多时,在显示终端中无法同时显示出该网页的全部内容,此时通过在网页上设置滚动轴,用户通过上下方向或是左右方向滚动该滚动轴,就可以浏览到网页的全部内容。
步骤S104:检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置。
用户刚进入到被访问的目标网页时,滚动轴位于滚动轴可以滚动区域的边缘位置,并在显示终端上显示出当前目标网页中可被浏览的区域。滚动轴在目标页面的位置与目标网页的浏览区域相互对应,因此通过检测滚动轴的位置可以相应的得到目标页面的浏览区域。
步骤S106:检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置。
当滚动轴发生滚动后滚动轴的位置发生改变,在显示终端上显示的目标网页的浏览区域也相应的改变。通过检测滚动轴发生滚动后的位置也就相应的得到滚动轴发生滚动后目标页面的浏览区域。
步骤S108:确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上的第一位置时目标网页的显示区域。
步骤S110:计算浏览区域的浏览时间,其中,浏览区域的浏览时间包括停留在第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
由于在滚动轴发生滚动之前,在显示终端上显示的目标网页的浏览区域是滚动轴在目标网页上的第一位置时对应的目标网页的浏览区域。因此,滚动轴停留在目标网页上的第一位置的时间即为用户浏览第一位置对应的目标网页的浏览区域的时间。
用户进入到目标网页时,第一次检测滚动轴在目标网页的第一位置,并以该位置作为初始位置,当滚动轴发生滚动后,第二次检测滚动轴在目标网页的第二位置。同时计算滚动轴停留在第一位置的时间,该时间即为用户浏览滚动轴在第一位置时对应的网页浏览区域的浏览时间。当滚动轴再次发生滚动后,第三次检测滚动轴在目标网页的第三位置,此时可以计算滚动轴在第二位置的停留时间,该时间即为用户浏览滚动轴在第二位置时对应的浏览区域的浏览时间。同样的方法计算滚动轴处于目标网页其他位置时对应的浏览区域的浏览时间。
本发明通过检测滚动轴在目标网页的第一位置和滚动轴发生滚动后在目标网页的第二位置,并通过计算滚动轴在目标网页上由第一位置滚动到第二位置的时间得到滚动轴在目标网页的第一位置时目标页面中显示的浏览区域的浏览时间。利用得到的浏览时间分析用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题,进一步提高了用户网页浏览行为分析结果准确性。
可选地,本发明实施例提供的网页浏览分析处理方法通过Javascript脚本检测滚动轴在目标网页上的第一位置;通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,通过滚动轴在第一位置和第二位置的时刻计算浏览区域的浏览时间。
Javascript是一种直译式脚本语言,主要用来向HTML(标准通用标记语言下的一个应用)页面添加交互行为。Javascript脚本即由Javascript语言编写的脚本,Javascript脚本可以直接嵌入HTML页面中,但写成单独的Javascript文件有利于结构和行为的分离。Javascript脚本可以用来检测访客的浏览器信息、对浏览器事件做出响应等。
在进行网站的网页浏览分析处理之前,在网站的每个网页都嵌入一段Javascript脚本,在用户进入到该网站的网页时,在加载网页的同时也加载了嵌入在网页的Javascript脚本。该Javascript脚本同时启动执行,收集该网页的相关信息,包括用户的浏览器类型、当前时间、滚动轴的位置等,并将收集到的网页的相关信息通过http 请求发送给服务器。通过Javascript脚本检测滚动轴在目标页面的位置以及在该位置对应的时刻,并将检测到的滚动轴在目标页面的位置和该位置对应的时刻发送给服务器。 Javascript脚本持续的检测滚动轴的位置,只有当检测到的滚动轴的位置发生变化时才将滚动轴新位置和该新位置对应的时刻发送给服务器。此时服务器根据滚动轴原来位置对应的时刻和滚动轴新位置对应的时刻相减即为滚动轴停留在原来位置的时间,也就是滚动轴在原来位置对应的浏览区域的浏览时间。
优选地,在检测滚动轴在目标网页上的第二位置之前,方法还包括:判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
由于频繁的检测滚动轴的位置会造成资源被占用,例如,在使用Javascript脚本检测滚动轴的位置并发送给服务器时,如果Javascript脚本每检测一次滚动轴的位置和该位置对应的时刻就向服务器发送一次请求,频繁的操作会严重的占用服务器的资源。因此,通过判断滚动轴是否滚动来确定是否需要再次检测滚动轴的位置,只有当滚动轴发生滚动时,才再次检测滚动轴的位置,这样可以避免由于频繁检测滚动轴的位置造成的资源被占用。
可选地,判断滚动轴是否滚动包括:检测滚动轴在目标网页上的当前位置;比较当前位置和第一位置是否相同;以及如果当前位置和第一位置相同,则判断滚动轴发生滚动,如果当前位置和第一位置不相同,则判断滚动轴没有发生滚动。
例如,通过Javascript脚本持续的检测滚动轴的位置,在每次检测完滚动轴的位置后,都与前一次检测的滚动轴的位置进行比较,当前后两次检测的滚动轴位置相同时,则说明滚动轴没有发生滚动,当前后两次检测的滚动轴位置不相同时,则说明滚动轴发生滚动,此时将该次检测得到的滚动轴的位置以及该位置对应的时刻发送给服务器。
以下结合图2对上述网页浏览分析处理方法进行说明。
步骤S202:在被监测网站中嵌入Javascript脚本。
Javascript脚本用于检测滚动轴在目标页面的位置和该位置的时刻。
步骤S204:Javascript脚本监测滚动轴的位置,记录当前滚动轴的第一位置和第一时间。
在刚进入目标网页时,需要将检测得到的滚动轴的初始位置和初始时间发送给服务器,二之后检测得到的滚动轴的位置和时间需要在滚动轴发生滚动后才发送给服务器。
步骤S206:判断是否滚动滚动轴。
Javascript脚本持续的检测滚动轴的位置和时间,并比较当前检测的滚动轴的位置与前一次检测得到的滚动轴第一位置进行比较,当两次检测的滚动轴的位置不同时,说明滚动轴发生滚动。
步骤S208:Javascript脚本监测滚动轴的位置-记录此时滚动轴的第二位置和第二时间。
当判定出滚动轴发生滚动后,记录此时滚动轴的当前位置和当前时间,即为第二位置和第二时间。
步骤S210:向服务器发送request请求(包含此刻滚动轴的第二位置和第二时间)。
将滚动轴的第二位置和第二时间发送给服务器。
步骤S212:服务器此时收到的第二时间减去上次收到的第一时间即为用户在之前网页版面的浏览时间)。
优选地,为了提高得到的目标网页的浏览时间对于分析用户浏览行为的准确性,在计算浏览区域的浏览时间之后,网页浏览分析处理方法包括:获取预设网页浏览时间;比较浏览区域的浏览时间和预设网页浏览时间;以及当浏览区域的浏览时间大于预设网页浏览时间,则删除浏览区域的浏览时间。
实际情况中,用户在浏览网页的过程中会出现中断网页的浏览去干其他事情,但是并没有关闭当前浏览的网页,经过一段时间再次浏览当前网页或是关闭该网页,此时计算得到的网页浏览区域的浏览时间并不是用户实际浏览该网页浏览区域的时间,如若在进行用户网页浏览行为分析时考虑这类浏览时间,会降低分析结果的准确性,因此,需要剔除这类不能真实反映用户实际浏览时间的浏览时。通过预先设置浏览目标网页的最长时间,将当前网页的浏览时间与预设的浏览时间进行比较,如果当前网页的浏览时间大于预设的浏览时间,表示当前网页的浏览时间不真实,则删除该当前网页的浏览时间,例如,设置10分钟为用户浏览该网页的最长时间,当浏览时间大于 10分钟时,表示当前网页的浏览时间不真实,删除该条浏览时间。
从以上的描述中,可以看出,本发明实现了如下技术效果:
根据本发明实施例提供的网页浏览分析处理方法,该方法通过检测滚动轴在目标网页的第一位置和滚动轴发生滚动后在目标网页的第二位置,同时检测滚动轴在目标网页的第一位置和第二位置对应的时刻,通过滚动轴在目标网页的第一位置和第二位置对应的时刻计算滚动轴在目标页面的第一位置的停留时间,该停留时间即是第一位置对应的浏览区域的浏览时间。得到的浏览区域的浏览时间体现了用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题,进一步提高了用户网页浏览行为分析结果准确性。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供了一种网页浏览分析处理装置,图3是根据本发明实施例的网页浏览分析处理装的示意图。
如图3所示,该装置包括:第一确定模块10,第一检测模块20,第二检测模块 30,第二确定模块40和计算模块50。
第一确定模块10,用于确定目标网页上的滚动轴,其中,目标网页为当前被浏览的网页。
当网页内容较多时,在显示终端中无法同时显示出该网页的全部内容,此时通过在网页上设置滚动轴,用户通过上下方向或是左右方向滚动该滚动轴,就可以浏览到网页的全部内容。
第一检测模块20,用于检测滚动轴在目标网页上的第一位置,其中,第一位置为滚动轴在目标网页上的初始位置。
用户刚进入到被访问的目标网页时,滚动轴位于滚动轴可以滚动区域的边缘位置,并在显示终端上显示出当前目标网页中可被浏览的区域。滚动轴在目标页面的位置与目标网页的浏览区域相互对应,因此通过检测滚动轴的位置可以相应的得到目标页面的浏览区域。
第二检测模块30,用于检测滚动轴在目标网页上的第二位置,其中,第二位置为滚动轴发生滚动后滚动轴在目标网页上的位置。
当滚动轴发生滚动后滚动轴的位置发生改变,在显示终端上显示的目标网页的浏览区域也相应的改变。通过检测滚动轴发生滚动后的位置也可以相应的得到滚动轴发生滚动后目标页面的浏览区域。
第二确定模块40,用于确定目标网页的浏览区域,其中,浏览区域为滚动轴在目标网页上由第一位置滚动到第二位置时目标网页的显示区域。
计算模块50,用于计算浏览区域的浏览时间,其中,浏览区域的浏览时间包括停留在第一位置的时间和滚动轴由目标网页上的第一位置滚动到第二位置的时间。
由于在滚动轴发生滚动之前,在显示终端上显示的目标网页的浏览区域是滚动轴在目标网页上的第一位置时对应的目标网页的浏览区域。因此,滚动轴停留在目标网页上的第一位置的时间即为用户浏览第一位置对应的目标网页的浏览区域的时间。
用户进入到目标网页时,第一次检测滚动轴在目标网页的第一位置,并以该位置作为初始位置,当滚动轴发生滚动后,第二次检测滚动轴在目标网页的第二位置。同时计算滚动轴停留在第一位置的时间,该时间即为用户浏览滚动轴在第一位置时对应的网页浏览区域的浏览时间。当滚动轴再次发生滚动后,第三次检测滚动轴在目标网页的第三位置,此时可以计算滚动轴在第二位置的停留时间,该时间即为用户浏览滚动轴在第二位置时对应的浏览区域的浏览时间。同样的方法计算滚动轴处于目标网页其他位置时对应的浏览区域的浏览时间。
本发明通过第一检测模块10检测滚动轴在目标网页的第一位置和第二检测模块20检测滚动轴发生滚动后在目标网页的第二位置,并通过计算单元50计算滚动轴在目标网页上由第一位置滚动到第二位置的时间得到滚动轴在目标网页的第一位置时目标页面中显示的浏览区域的浏览时间。利用得到浏览时间分析用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题。
可选地,第一检测模块10通过Javascript脚本检测滚动轴在目标网页上的第一位置;第二检测模块20通过Javascript脚本检测滚动轴在目标网页上的第二位置;以及计算模块50,通过Javascript脚本检测滚动轴在第一位置和第二位置的时刻,其中,通过滚动轴在第一位置和第二位置的时刻计算浏览区域的浏览时间。
Javascript是一种直译式脚本语言,主要用来向HTML(标准通用标记语言下的一个应用)页面添加交互行为。Javascript脚本即由Javascript语言编写的脚本,Javascript脚本可以直接嵌入HTML页面中,但写成单独的Javascript文件有利于结构和行为的分离。Javascript脚本可以用来检测访客的浏览器信息、对浏览器事件做出响应等。
在进行网站的网页浏览分析处理之前,在网站的每个网页都嵌入一段Javascript脚本,在用户进入到该网站的网页时,在加载网页的同时也加载了嵌入在网页的Javascript脚本。该Javascript脚本同时启动执行,收集该网页的相关信息,包括用户的浏览器类型、当前时间、滚动轴的位置等,并将收集到的网页的相关信息通过http 请求发送给服务器。通过Javascript脚本检测滚动轴在目标页面的位置以及在该位置对应的时刻,并将检测到的滚动轴在目标页面的位置和该位置对应的时刻发送给服务器。 Javascript脚本持续的检测滚动轴的位置,只有当检测到的滚动轴的位置发生变化时才将滚动轴新位置和该新位置对应的时刻发送给服务器。此时服务器根据滚动轴原来位置对应的时刻和滚动轴新位置对应的时刻相减即为滚动轴停留在原来位置的时间,也就是滚动轴在原来位置对应的浏览区域的浏览时间。
图4是根据本发明第二实施例的网页浏览分析处理装的示意图。如图3所示,该装置包括:第一确定模块10,第一检测模块20,第二检测模块30,第二确定模块40,计算模块50和判断模块60。
在检测滚动轴在目标网页上的第二位置之前,判断模块50用于判断滚动轴是否发生滚动,其中,仅在判断出滚动轴发生滚动的情况下,获取滚动轴在目标网页上的第二位置。
由于频繁的检测滚动轴的位置会造成资源被占用,例如,在使用Javascript脚本检测滚动轴的位置并发送给服务器时,如果Javascript脚本每检测一次滚动轴的位置和该位置对应的时刻就向服务器发送一次请求,频繁的操作会严重的占用服务器的资源。因此,通过判断滚动轴是否滚动来确定是否需要再次检测滚动轴的位置,只有当滚动轴发生滚动时,才再次检测滚动轴的位置,这样可以避免由于频繁检测滚动轴的位置造成的资源被占用。
第一确定模块10,第一检测模块20,第二检测模块30,第二确定模块40和计算模块50同上,在此不再赘述。
可选地,判断模块包括:检测单元,用于检测滚动轴在目标网页上的当前位置;第一比较单元,用于比较当前位置和第一位置是否相同;以及判断单元,用于当当前位置和第一位置相同时,判断滚动轴发生滚动,当当前位置和第一位置不相同时,判断滚动轴没有发生滚动。
例如,通过Javascript脚本持续的检测滚动轴的位置,在每次检测完滚动轴的位置后,都与前一次检测的滚动轴的位置进行比较,当前后两次检测的滚动轴位置相同时,则说明滚动轴没有发生滚动,当前后两次检测的滚动轴位置不相同时,则说明滚动轴发生滚动,此时将该次检测得到的滚动轴的位置以及该位置对应的时刻发送给服务器。
优选地,在计算浏览区域的浏览时间之后,网页浏览分析处理装置还包括:获取模块,用于获取预设网页浏览时间;比较模块,用于比较浏览区域的浏览时间和预设网页浏览时间;以及删除模块,用于当浏览区域的浏览时间大于预设网页浏览时间,删除浏览区域的浏览时间。
实际情况中,用户在浏览网页的过程中会出现中断网页的浏览去干其他事情,但是并没有关闭当前浏览的网页,经过一段时间再次浏览当前网页或是关闭该网页,此时计算得到的网页浏览区域的浏览时间并不是用户实际浏览该网页浏览区域的时间,如若在进行用户网页浏览行为分析时考虑这类浏览时间,会降低分析结果的准确性,因此,需要剔除这类不能真实反映用户实际浏览时间的浏览时。通过预先设置浏览目标网页的最长时间,将当前网页的浏览时间与预设的浏览时间进行比较,如果当前网页的浏览时间大于预设的浏览时间,表示当前网页的浏览时间不真实,则删除该当前网页的浏览时间,例如,设置10分钟为用户浏览该网页的最长时间,当浏览时间大于 10分钟时,表示当前网页的浏览时间不真实,删除该条浏览时间。
根据本发明实施例提供的网页浏览分析处理装置,该装置通过第一检测模块10检测滚动轴在目标网页的第一位置和第二检测模块20滚动轴发生滚动后在目标网页的第二位置,同时计算模块50检测滚动轴在目标网页的第一位置和第二位置对应的时刻,通过滚动轴在目标网页的第一位置和第二位置对应的时刻计算滚动轴在目标页面的第一位置的停留时间,该停留时间即是第一位置对应的浏览区域的浏览时间。得到的浏览区域的浏览时间体现了用户在当前网页的浏览行为,解决了现有技术中没有分析通过滚动滚动轴进行网页浏览的用户的网页浏览行为造成的用户网页浏览行为分析结果准确性低的问题。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种网页浏览分析处理方法,其特征在于,包括:
确定目标网页上的滚动轴,其中,所述目标网页为当前被浏览的网页,所述滚动轴支持上下方向或左右方向的滚动;
检测所述滚动轴在所述目标网页上的第一位置,其中,所述第一位置为所述滚动轴在所述目标网页上的初始位置;
检测所述滚动轴在所述目标网页上的第二位置,其中,所述第二位置为所述滚动轴发生滚动后所述滚动轴在所述目标网页上的位置;
确定所述目标网页的浏览区域,其中,所述浏览区域为所述滚动轴在所述目标网页上的所述第一位置时所述目标网页的显示区域,所述滚动轴在所述目标网页上的位置与所述目标网页的浏览区域相互对应,通过检测所述滚动轴的位置能够得到所述目标网页的浏览区域;以及
计算所述浏览区域的浏览时间,其中,所述浏览区域的浏览时间包括停留在所述第一位置的时间和所述滚动轴由所述目标网页上的所述第一位置滚动到所述第二位置的时间,所述停留在所述第一位置的时间为用户浏览第一位置对应的目标网页的浏览区域的时间,其中,所述浏览时间用于分析用户在当前网页的浏览行为;
在计算所述浏览区域的浏览时间之后,所述网页浏览分析处理方法包括:
获取预设网页浏览时间;
比较所述浏览区域的浏览时间和所述预设网页浏览时间;以及
当所述浏览区域的浏览时间大于所述预设网页浏览时间,则删除所述浏览区域的浏览时间。
2.根据权利要求1所述的网页浏览分析处理方法,其特征在于,
通过Javascript脚本检测所述滚动轴在所述目标网页上的第一位置;
通过所述Javascript脚本检测所述滚动轴在所述目标网页上的第二位置;以及通过所述Javascript脚本检测所述滚动轴在所述第一位置和所述第二位置的时刻,其中,通过所述滚动轴在所述第一位置和所述第二位置的时刻计算所述浏览区域的浏览时间。
3.根据权利要求1所述的网页浏览分析处理方法,其特征在于,在检测所述滚动轴在所述目标网页上的第二位置之前,所述方法还包括:
判断所述滚动轴是否发生滚动,
其中,仅在判断出所述滚动轴发生滚动的情况下,获取所述滚动轴在所述目标网页上的第二位置。
4.根据权利要求3所述的网页浏览分析处理方法,其特征在于,所述判断所述滚动轴是否滚动包括:
检测所述滚动轴在所述目标网页上的当前位置;
比较所述当前位置和所述第一位置是否相同;以及
当所述当前位置和所述第一位置相同时,则判断所述滚动轴没有发生滚动,当所述当前位置和所述第一位置不相同时,则判断所述滚动轴发生滚动。
5.一种网页浏览分析处理装置,其特征在于,包括:
第一确定模块,用于确定目标网页上的滚动轴,其中,所述目标网页为当前被浏览的网页,所述滚动轴支持上下方向或左右方向的滚动;
第一检测模块,用于检测所述滚动轴在所述目标网页上的第一位置,其中,所述第一位置为所述滚动轴在所述目标网页上的初始位置;
第二检测模块,用于检测所述滚动轴在所述目标网页上的第二位置,其中,所述第二位置为所述滚动轴发生滚动后所述滚动轴在所述目标网页上的位置;
第二确定模块,用于确定所述目标网页的浏览区域,其中,所述浏览区域为所述滚动轴在所述目标网页上的所述第一位置时所述目标网页的显示区域,所述滚动轴在所述目标网页上的位置与所述目标网页的浏览区域相互对应,通过检测所述滚动轴的位置能够得到所述目标网页的浏览区域;以及
计算模块,用于计算所述浏览区域的浏览时间,其中,所述浏览区域的浏览时间包括停留在所述第一位置的时间和所述滚动轴由所述目标网页上的所述第一位置滚动到所述第二位置的时间,所述停留在所述第一位置的时间为用户浏览第一位置对应的目标网页的浏览区域的时间。
6.根据权利要求5所述的网页浏览分析处理装置,其特征在于,
所述第一检测模块通过Javascript脚本检测所述滚动轴在所述目标网页上的第一位置;
所述第二检测模块通过所述Javascript脚本检测所述滚动轴在所述目标网页上的第二位置;以及
所述计算模块通过所述Javascript脚本检测所述滚动轴在所述第一位置和所述第二位置的时刻,其中,所述浏览区域的浏览时间包括停留在所述第一位置的时间和所述滚动轴由所述目标网页上的所述第一位置滚动到所述第二位置的时间,其中,所述浏览时间用于分析用户在当前网页的浏览行为;
在计算所述浏览区域的浏览时间之后,所述网页浏览分析处理装置还包括:
获取模块,用于获取预设网页浏览时间;
比较模块,用于比较所述浏览区域的浏览时间和所述预设网页浏览时间;以及
删除模块,用于当所述浏览区域的浏览时间大于所述预设网页浏览时间,删除所述浏览区域的浏览时间。
7.根据权利要求5所述的网页浏览分析处理装置,其特征在于,在检测所述滚动轴在所述目标网页上的第二位置之前,所述装置还包括:
判断模块,用于判断所述滚动轴是否发生滚动,
其中,仅在判断出所述滚动轴发生滚动的情况下,获取所述滚动轴在所述目标网页上的第二位置。
8.根据权利要求7所述的网页浏览分析处理装置,其特征在于,所述判断模块包括:
检测单元,用于检测所述滚动轴在所述目标网页上的当前位置;
第一比较单元,用于比较所述当前位置和所述第一位置是否相同;以及
判断单元,用于当所述当前位置和所述第一位置相同时,判断所述滚动轴没有发生滚动,当所述当前位置和所述第一位置不相同时,判断所述滚动轴发生滚动。
CN201410459079.4A 2014-09-10 2014-09-10 网页浏览分析处理方法及装置 Active CN104166741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410459079.4A CN104166741B (zh) 2014-09-10 2014-09-10 网页浏览分析处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410459079.4A CN104166741B (zh) 2014-09-10 2014-09-10 网页浏览分析处理方法及装置

Publications (2)

Publication Number Publication Date
CN104166741A CN104166741A (zh) 2014-11-26
CN104166741B true CN104166741B (zh) 2018-09-18

Family

ID=51910554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410459079.4A Active CN104166741B (zh) 2014-09-10 2014-09-10 网页浏览分析处理方法及装置

Country Status (1)

Country Link
CN (1) CN104166741B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951961A (zh) * 2015-06-02 2015-09-30 百度在线网络技术(北京)有限公司 用于推送内容的方法、终端、服务器以及系统
CN109299416B (zh) * 2018-10-19 2020-01-14 北京字节跳动网络技术有限公司 一种网页处理方法、装置、电子设备及存储介质
CN109446044A (zh) * 2018-10-19 2019-03-08 北京字节跳动网络技术有限公司 网页操作数据的处理方法、装置、电子设备及存储介质
CN109285059A (zh) * 2018-10-19 2019-01-29 北京字节跳动网络技术有限公司 一种网页处理方法、装置、电子设备及存储介质
CN109977311A (zh) * 2019-03-26 2019-07-05 北京博瑞彤芸文化传播股份有限公司 一种分享信息的智能分析方法
CN113779447A (zh) * 2020-07-21 2021-12-10 北京沃东天骏信息技术有限公司 用户浏览数据的获取方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN102231165A (zh) * 2011-07-11 2011-11-02 浙江大学 一种基于用户停留时间分析的个性化网页搜索排序方法
CN102799998A (zh) * 2012-06-30 2012-11-28 精实万维软件(北京)有限公司 网页中广告信息的计费方法及装置
CN103186565A (zh) * 2011-12-28 2013-07-03 中国移动通信集团浙江有限公司 根据用户网页浏览行为判断用户偏好的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN102231165A (zh) * 2011-07-11 2011-11-02 浙江大学 一种基于用户停留时间分析的个性化网页搜索排序方法
CN103186565A (zh) * 2011-12-28 2013-07-03 中国移动通信集团浙江有限公司 根据用户网页浏览行为判断用户偏好的方法及装置
CN102799998A (zh) * 2012-06-30 2012-11-28 精实万维软件(北京)有限公司 网页中广告信息的计费方法及装置

Also Published As

Publication number Publication date
CN104166741A (zh) 2014-11-26

Similar Documents

Publication Publication Date Title
CN104166741B (zh) 网页浏览分析处理方法及装置
CN106503134B (zh) 浏览器跳转至应用程序的数据同步方法及装置
CN105786352B (zh) 快速定位页面内容的方法、装置及移动终端
US9195372B2 (en) Methods, systems, and computer program products for grouping tabbed portion of a display object based on content relationships and user interaction levels
US9756140B2 (en) Tracking user behavior relative to a network page
CN104572912B (zh) 一种网页页面加载方法及系统
CN104750471A (zh) 一种基于浏览器的web页面性能检测与采集分析插件以及方法
CN109684576A (zh) 网页资源懒加载监控方法、装置、设备及存储介质
CN107463641A (zh) 用于改进对搜索结果的访问的系统和方法
US20150082135A1 (en) Method and system for generating comparable visual maps for browsing activity analysis
CN105868290B (zh) 一种展现搜索结果的方法及装置
CN105339932A (zh) 浏览器驱动的功率节省
US20150254219A1 (en) Method and system for injecting content into existing computerized data
CN106708502B (zh) 网页处理方法和装置
CN110244896A (zh) 网页内截图方法、装置、控制器及存储介质
CN103902436A (zh) 一种对用户访问行为进行还原的方法及装置
US20190385030A1 (en) Page analysis method and apparatus
CN102663052A (zh) 一种提供搜索引擎搜索结果的方法及装置
CN112699295A (zh) 一种网页内容推荐方法、装置和计算机可读存储介质
CN106161133A (zh) 一种网页加载时间的测试方法及装置
CN106873844A (zh) 图片查看方法及装置
CN107526748B (zh) 一种识别用户点击行为的方法和设备
CN105376311A (zh) 一种基于终端访问的页面停留时长确定方法及装置
CN105278977A (zh) 一种网页组件的加载方法和装置
WO2016058460A1 (zh) 浏览切换处理方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Webpage browsing analysis and processing method and device

Effective date of registration: 20190531

Granted publication date: 20180918

Pledgee: Shenzhen Black Horse World Investment Consulting Co., Ltd.

Pledgor: Beijing Guoshuang Technology Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: Beijing Guoshuang Technology Co.,Ltd.